首页 智能硬件 AI人工智能

利用人工智能进行图像鉴别 1万个唐马儒都无法做到

 

“懂”这个字非常关键,日常我们会遇到的验证码就是个很好的例子。对于最简单的文字验证码,计算机能够通过分析图片中的像素点的颜色数值,然后形成一定的笔画结果,最终转化为文字。

tupu5

所以人们就开始对验证码进行不断的升级,从更换、抽象字体到给验证码加上其他干扰元素等等,12306 的图片勾选就属于验证码中比较强力的一种。

8 张小小的图片,里面展现了不同的物体,然后根据提示勾选其中一个或几个才能通过验证。刚推出的时候瞬间所有抢票软件都哑火了,后来他们想出一个办法:通过数据请求获得所有的图片验证码,然后仍然是通过人工进行归类,最终刷票需要验证的时候通过图片原始数据就知道应该勾选哪几个了。

这种方式并没有真正看“懂”图片,只是利用人工完成了必须的鉴别环节,如果这个验证码的数据库足够大并且一直保持更新,破解就将变得非常困难。

只分析图片原始数据这种方法在应对复杂颜色图片的时候非常无力,比如之前通过鉴定图片中肉色的比例(根据像素点信息来判断)来排除黄色图片的某软件。结果是各种黄牛的图片也变成了色情图片,还有将两根火腿肠看成大腿的结果。

人工在鉴别的准确度上肯定有优势,但人不同于机器,总是会疲劳的,而且错误几乎不可避免,还需要付出大量的成本和时间进行管理。

既然给不出规则,就让计算机自己整理出规则

既然没有办法直接将人脑识别图像的流程代码化,那么只好从头跟人类学习了:通过识别大量的图片来形成电脑的自我认知。在上周的分享中 CEO 李明强是这样概括的:

最核心的原理与生物训练的比较类似——应激反应,一种是奖励一种是惩罚。做对了就强化他然后奖励,让他不断强化重复自己对的行为;做错的就去惩罚它,然后削弱他。

将上面一段换成技术名词就是:有监督的深度学习技术。

当然首先需要给计算机装备一个能够不断学习、自我成长的平台:多重神经网络。这个技术详细解释起来相当复杂,概括起来就是计算机会将原来单个、零散的分辨率数据结合起来,从不同的维度进行分析,比如颜色、相似度、局部特征等,同时与之前积累的数据进行对比,最终捕获其中的规律,将图像中的信息提取出来。

3

这是一个不断成长的过程,与我们婴儿时期父母亲自教我们辨认图像如出一辙。当然计算机的效率要高的多,同时还能够获得很多已经预先经过筛选的数据,让“学习”过程具备了先天优势。

4

所以在图普科技提出的解决方案中存在这样一个流程:如果计算机对于自己的判断自信度达不到 99.5%,图像数据就会返回给用户本身,由人工进行二次判断,不仅最大程度地保证了效果,同时还能从人给出的判断结果对规则进行修正。李明强还给出了自己的看法:

人工复审这个方式是我们的首创。因为人工智能存在一个陷阱:你可以用人工智能很快的完成事情的 50%——比如很多 Demo 都能够获得很好的效果,但实用的时候又很不靠谱。

所以我们需要告诉用户我们负责的 50% 确定能做好,我们不确定的 50%,你自己人工看一下。这样问题就可以完美解决,当然未来完全不用人工也是我们的努力方向,这个准确率会像曲线一样无限逼近,只要能够越来越节省人力,我觉得我们的目的就达到了。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多