下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

解密波形字母验证码的能力也是人工智能研究的一个关键基准

作者:课课家教育     来源: http://www.kokojia.com点击数:1095发布时间: 2017-11-01 11:58:20

标签: 计算机图像博客

软考,您想通过吗?一次通过才是硬道理

  我们平时在登录某个网站或者是在线购买门票的时候,可能需要手动输入一些变形了的字母或者识别某些图像来通过验证。就像这样:

解密波形字母验证码的能力也是人工智能研究的一个关键基准_博客_课课家

  笔记本电脑上的验证码 

  这种基于文本的可以区分用户是计算机还是人的验证程序叫做CAPTCHA,能生成人类很容易通过但计算机却通不过的测试。简单来说,这个我们每天可能验证几百次的方法能证明访问网站的是真人而非机器人。

  这类字符形状各异,有的自带波纹线和其他混乱的背景,人类虽然很容易识别,但是对计算机来说就不是那么容易的事儿了。因此,解密波形字母验证码的能力也是人工智能研究的一个关键基准。

  波形字母验证码 

  当然,许多人也尝试破解过这个的验证码(大概是觉得操作起来既麻烦又费时间)。十年前,Ticketmaster曾把一家科技公司告上了法庭,原因是该公司能够绕过CAPTCHA系统大量购买演唱会的门票。

  但是之前的破解方式只是利用了特定类型的CAPTCHA的漏洞,只要稍微修改一下程序就能轻易抵御这类破解行为。

  人工智能公司Vicarious的联合创始人Dileep George说,“今天发表在权威学术期刊Science上的这项研究介绍的是一个全新的算法模型,它能从根本上打破CAPTCHA的防御,解析文本更加有效。”

  之前的那些试图让机器像人类一样学习的算法模型很大程度上依赖于一种叫做深度学习的AI技术,这种技术要对不同层次的神经元进行重复训练,让神经元根据我们的设定做出反应。比如,我们可以通过显示数百万个示例图像来训练机器识别字母A和B。

  但即便是这样,机器也很难识别与字母B重叠的字母A,除非我们已经用这类重叠图像对它进行了明确的训练。George说:“它只能复制人类大脑工作的一些方面。”

  而一个小孩子不需要进行大量的字母图像训练就可以识别出字母A。不管这个字母是变大了还是倾斜了,是上下颠倒还是被部分遮挡,我们的大脑都可以不费力地认出来。人类的这种基于以往经验而可以在任何给定的情境下对普通情况做出预测和推论的能力就是所谓的“常识”。

  “有用的常识能够适应一系列的假设,我们通常也把这种能力叫做想象力,”研究人员在他们发表的博客中写道。

  常识作为我们认知世界的内部模型,大多存储在视觉和运动皮质中。因此,为了模拟人这种能力,研究人员建立了一个称为递归皮层网络(RCN)的计算机视觉模型。

  Dileep George向美国国家公共电台(NPR)解释说,RCN通过构建自己的神经网络来学习识别角色,而且无需像常规算法那样进行很多次的识别训练。它的工作原理是:

  “你把A、B和其他不同的变形字母输入进去,RCN将建立内部模型来识别和还原这些字母原来的样子。所以它会告诉我们,这是字母本身,这是字母的外部轮廓,这是字母的背景等等。”

  关于字母,模型解析时会形成一些层次化的“树”

  而当一个新的图像进入时...它会尝试用之前看过的字母图像去解释这个新图像的所有像素,然后得出结论:字母 A缺少的这部分是因为被字母B挡住了。

  当然,CAPTCHA验证码也有很多种类型。根据研究测试结果,该模型“能够以66.6%的准确率通过reCAPTAs验证,64.4%通过BotDetect, 57.4%通过雅虎,57.1%通过PayPal。”

  RCN模型使我们更加深入地了解了大脑的运作过程以及计算程序是如何复制或者模拟这一过程的。纽约大学的Brenden Lake说,“这不是一个人人都需要的应用程序,但物体识别是我们每个人每分每秒都在做的事情。”

  但是能够识别CATCHPA并不是这项研究的重点,研究团队的目标是如何使机器人具备像人类一样的视觉理性。

  “长远目标是拥有和人脑一样的智慧。CAPTCHAs只是对RCN模型的一次考验,用来检查这个模型能否像大脑一样工作。”

  George补充说,机器人需要了解周围的世界,并拥有解析和操纵对象的能力。人类的“常识”就是一个不需要太多培训的例子,所以我们能够进行快速推理,能以非常灵活的方式来应对世界。而我们希望AI也可以拥有这些能力。

  当被问及“他会对那些担心机器人越来越人性化的人们说些什么”时?George 简单地回答: “这将是技术的进步,我们必须相信,计算机未来可以像人脑那样工作。”

  那么既然现在AI都可以通过曾经难以识别的CAPTCHA验证了,那么以后将如何证明访问网站的是人类而非AI呢?NPR说目前还不清楚这项研究对信息安全有多大的影响。

  而在测试方法的改进方面,大公司谷歌已经走在了前面。Google去年年底宣布即将推出一个隐形的 ReCAPTCHA验证方法,称它可以过滤掉访问网站的机器人,而且也不需要我们进行额外的点击或输入,不过目前还没有正式上线。