首页 智能硬件 AI人工智能

阿里云初敏博士:AI技术发展与商业化之路

 

4 月 27 日,GMIC 2017(全球移动互联网大会)北京站开幕,主题是「天·工·开·悟」。今天上午,阿里云 iDST 总监初敏博士做了题为「AI 技术发展与商业化之路」的分享,雷锋网对速记做了不改动原意的编辑和整理。

阿里云 iDST 总监初敏博士:AI技术发展与商业化之路 | GMIC 2017

初敏博士 2009 年加入阿里巴巴,目前在阿里集团 iDST(Institute of Data Science and Technologies)负责语音识别,语音合成,自然语言理解,知识问答,对话管理等人机交互相关技术研发以及产品研发。

非常高兴有机会跟大家分享我们最近做的事情的感悟。最主要的是分享感悟。刚刚简先生(雷锋网按:竹间智能科技创始人 & CEO 简仁贤,他在 GMIC 2017 上做了题为“AI 时代的人机情感共鸣”的分享)讲 AI 是不是有泡沫,其实大家已经开始担心了。最近的 AI 跟过去相比已经开始商业应用了,技术的商业化正在开启,但这个过程没有想象的那么容易。我认为在未来几年里,只在说的人会越来越少,大家会看到某一些泡沫似乎在降下去,但我觉得会有更多实际干的人出来,真正的把这个技术用到每个行业中,让我们真正体验到用,而不仅仅是在媒体上看到的宣传。

我今天想跟大家分享的,一个是技术的发展,一个是真正的商业化之路是会非常艰难的。

人工智能的进步带来了哪些变化?

人工智能这一波的热度是数据驱动的智能时代的到来。虽然大家表面上关注的最主要的是算法,是从深度学习开始的。现在还有强化学习、无监督、半监督等等各种各样的学习方法。事实上这些学习方法真正能起到作用、能带来改变,是因为现在有很强大的计算能力,以及有各种各样的数据贯穿在一起。

我们做机器学习的人,这么多年下来,有非常强大的经验。你在算法上的改变,往往不如数据种类的丰富性,以及规模增大带来的好处更大。

这两年能看到很大的进步,归根到底的原因是计算能力。计算能力包括原来在单台机器上,后来是在一大组 CPU 集群上,包括 TPU 等等各种探索,都是在解决计算能力的问题。因为联网把数据联接起来了,数据从不同的源到一个结点上进行统一学习,增强了学习效果。这一轮所谓的 AI 真正是大数据驱动的,云计算+大数据+算法的进步来推动的。

从另外一个应用的角度,大家体会最强的是互联网上的改变。这一轮算法技术,推荐、搜索、推送,我们已经能体验到一部分。今天我们感受到的变化更垂直化、个性化、智能化,在很多地方的细微改变都是因为数据的聚汇,以及学习对人、对各种细节学习能力的增强,使我们感受到细微的变化。

另外就是每个个体感受不那么深的,给传统工业带来了很多变化。比如,我们用在工厂的数据里,监测工厂的故障率、提高产品的良品率。可以预测城市生活中未来 N 个小时的交通情况,哪里会堵、哪里会出现风险,通过信号灯的调节能不能更好的疏通交通的通畅性。这些技术的确在方方面面,有一些是我们能够感受到的,有一些是在日常生活中不能直接感受到的,但都在发生着变化。智能化的过程已经开启,而且正在飞快的进步。

这件事情不是一个企业、一个人、一个机构能独立完成的。如果真把所有的技术从头到尾打通,有非常多的工作要做。从底层的计算能力,到垂直的语音、图像技术,即便是个 Bot,也要把这些东西集成起来。最终这些技术能不能是放之四海而皆准的,往往都是需要根据场景、根据垂直行业的需求来进行改变。一个系统不可能十年都不变,它要跟着外界的情况发生改变。一个系统第一天上线,我觉得它的效果很好,不是它一定要好一辈子的。你要把数据灌进去,要让这个系统 24 小时不停地转,这个转的过程也是学习的过程。只有这样的系统才真正的能用起来。很多时候我们看到上线一个东西,3 个月的效果很好,过一段时间就用不起来了。

这个技术不应该是在象牙塔里了,而是应该在很多地方推,这个推的过程是很多环节的衔接。在某些媒体上传播的时候,我们只看到了美妙的想象的部分,没有重视到实施过程中的各个环节。只有这些东西都做好,我们想象中的那个美妙的结果才能得到。商业化的过程中最大的困难,每个企业、每个环节想引入这些技术,想在你的场景中用通的时候,实际是要有思想准备的。不是闭着眼睛从哪里接根管子就用得非常好了,而是要有决心,要扎下去,打透了,才能得到非常好的结果。

人工智能真的需要分工协作,我们大家的定位在什么地方,我需要谁来帮助我。另外就是人才的储备。AI 很热,这个领域的人才非常热。我自己观察到的还有一种人才也非常缺失,其实是怎么用的人。比如,一个机器人在我们的环境中提供客服,应该怎么交互、怎么用、怎么设计、入口在哪里,这样的人才是更缺失的。我自己在公司里跟很多部门合作的时候都碰到这个困难,最终反而是技术人员好像更理解一点。其实这是不对的。

我觉得真正懂得 AI 技术在某一个场景中真正该怎么用的人才也是非常稀缺的。要打通的是各处的,只不过大家立足点不一样,你侧重的人才会不一样。

阿里云的两大语音交互研究方向

阿里云 iDST 总监初敏博士:AI技术发展与商业化之路 | GMIC 2017

阿里云做的更多是底层,是以平台来提供的,底下会有集群、云计算的平台、大数据的平台,以及人工智能的各种专项技术。做这些专项的技术,语音识别本身都是投资非常大的,不是每个企业都值得自己去投资。因为做这些事情,既要很多人,又要很多钱,又要很多数据和很多计算能力,平台形式的提供是更为合理的。这也是为什么我们作为云计算公司会做很多这样的工作。各个层面的行业的打通,是各个领域的专家更懂的,后面就应该是各种解决方案。我们会提供各种基础能力,而真正的解决方案是跟合作伙伴一起打通,真正把这个垂直行业落地,工作量是非常大的。

因为我自己带的是语音交互的团队,我给大家举一个例子。底层也是一样,有识别。语音识别合成是大家传统讲的语音技术。现在有两个方向,一个是所谓的人机对话。各种应用 APP 里可以嵌入这种交互。但是,在你做 APP 交互的时候,因为你知道的事情比较少,能做的会比较窄。你从操作系统开始做,系统底层知道的更多,能通过这个交互实现和打通的信息就会更多。在我们自己内部做的时候也是这样,更重要的是以操作系统为依托,走到各种端,它可能是手机,也可能是车,也可能是电视,或者其他设备。当然,也可以提供一个简单的接入,让各种 APP 接入进去。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多