首页 智能硬件 AI人工智能

看了数千小时电视节目后 谷歌AI软件拥有最强读唇术

近日,谷歌 AI 部门 DeepMind 和牛津大学的研究人员使用人工智能创建了迄今为止最准确的一款读唇软件。

利用 BBC 数千小时的电视节目,研究人员将 AI 软件对电视节目嘉宾唇语解读的准确率提升到了 46.8%。这一数字乍看上去十分不起眼,尤其在与 AI 软件语音识别准确率进行比较后更是如此,但要指出的是,即便是专业的唇语专家在接受同样的测试时,准确率仅为 12.4%。

值得一提的是,牛津大学的另一独立小组也于不久前开发了一款类似的 AI 读唇软件。这个名叫 LipNet 的读唇软件,在测试中达到了 93.4% 的准确性,而人类的准确性则为 52.3%。但该测试所用的材料均为志愿者事先录制好的固定句子,没有任何复杂的事件背景可言。

而此次谷歌 DeepMind 部门研发的“Watch, Listen, Attend, and Spell”AI 软件所进行的测试则更具挑战性,在没有任何背景介绍的情况下直接对 BBC 节目嘉宾唇语进行解读。

该软件用于读唇术训练的电视节目视频时长累计超过了 5000 小时,包括近 12 万个不同的句子和约 1.7 万个独特的单词,相比之下 LipNet 软件的测试视频仅有 51 个独特的单词。

至于 AI 读唇软件的应用,很多人第一时间想到的便是监控视频的唇语解读。研究人员表示,监控视频的分辨率将对 AI 软件的读唇准确度有很大影响,但人工智能会将这一差距慢慢缩小。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多