查看原文
其他

没有谷歌翻译,AI的历史将被重写  | AI成长营课程笔记

2016-08-24 李志飞 混沌研习社


▲图为“出门问问”创始人李志飞在混沌AI成长营课堂上分享自己对AI应用普及的一些思考。


李志飞说,在我看来,2006年谷歌翻译的普及,是AI 真正从学术研究走向大众应用的起点。如果没有谷歌翻译团队在底层工程架构中的成功,也许今天所有的人工智能故事都要改写。


(本文根据李志飞在混沌AI成长营的课程内容整理而成,有删节)


演讲者| 李志飞(“出门问问”创始人)


我原来在美国约翰霍布金斯大学读博士,研究方向是自然语言处理。博士毕业后去了硅谷的谷歌研究院Google Translate部门工作了两年多,主要是研发新的机器翻译算法,来提升自动翻译的质量。2012年底回国创业,做了“出门问问”。

 

在过去差不多11年的时间里,我都是做和AI相关的工作。 在这个过程中,特别重要的一个体会就是,AI这种新技术不像硬盘或CPU,放在那里,它就一定能用。很多AI的东西,不管论证多么严谨可靠,最后不一定能实现。

 

所以在我们公司,我一直强调,一定要有阶段性的成果。很多时候我们没有那么吸引眼球的噱头,但是由于能够搜集用户数据,实现迭代,就能支撑我们去做更长远的东西。

1945-2005是AI1.0时代

建立了整个AI学科的理论体系

用于服务政府和维护企业形象

 

AI的应用在过去几十年发生了什么? 接下来我想根据我个人对AI行业的认知,给AI历史发展做个分区。

 

2005年之前是AI应用的1.0时代,过去十年是2.0时代,今年开始,我认为AI应用会走向一个新的时代。


我把AI 1.0时代划分到2005年之前。这个阶段AI的发展和计算机学科相辅相成。计算机出来以后,大家就开始思考AI这个问题了:人类能不能够造出一台机器,能够和人一样,有很强的思考能力,可以解决人类能够解决的问题。

 

经过几十年的发展,AI行业最重要的成就是:我们建立了整个AI学科的理论体系,包括自然语言理解、语音识别、计算机视觉、深度神经网络、机器学习和深度学习。

 

学术上的研究,政府和军方是最主要的赞助方,也都基本为政府服务,不涉及大众普及。

 

工业界的AI应用是什么样子呢?形象工程。比如IBM的深蓝计算机打败人类象棋冠军,其实就是一个PR项目,证明自己的技术很强大。

 

但是我绝不是贬低工业界做这个形象工程的意义,正是有为了打败国际象棋冠军这个目标,使得IBM开发出深蓝计算机,这对整个产业发展非常有利。


2006-2015是AI 2.0时代

谷歌翻译是AI走向大众的起点

趟出一条大规模工程化的路


为什么我把2006作为AI 2.0时代的开端?在我看来,2006年谷歌翻译的普及,是AI 应用从2B走向2C,面向大众的起点。

 

谷歌翻译出现之前,历史上从没有一个以AI为核心算法的应用,可以得到几亿人的大规模使用。但是谷歌翻译有90多种语言,每天2亿人使用,处理十亿句翻译。

 

除了应用层面的成功,谷歌翻译还有一个巨大的作用是什么呢?为后来很多的AI应用(如语音,图像,视觉)趟出了一条怎么大规模工程化的路。

 

在2005年之前,或者说当谷歌翻译出来之前,我们做AI的时候,我们更多的时候关注的是算法。谷歌翻译为了达到大规模应用的要求,做了哪些事情呢?在算法之外,添加了大数据训练,首创了大数据,云计算,和人工智能完美相结合的先河。


Jeff Dean是硅谷的工程师之神,也是谷歌的大牛。Jeff Dean当时在谷歌翻译团队待了半年,专门为这个团队解决大规模存储和计算的问题。他有三篇论文,奠定了今天谷歌整个云计算的基础。

 

云计算为什么重要?

 

比如,以前oracle怎么做计算?一台机器存储所有的东西。但是谷歌的数据太庞大了,没有办法存在一台机器上,所以促使谷歌去设计分布式的云存储计算机系统,让几亿人同时使用的情况下,系统不崩溃。

 

为什么说谷歌翻译成为AI 2.0 的实际起点?

 

如果没有谷歌翻译团队做的这些事情,也许今天所有的人工智能故事都要改写。因为工程上都做不到今天的大规模。

 

谷歌里有很多做AI的团队,当谷歌翻译这个产品大规模成功了以后,语音识别、计算机视觉、图像识别的人都开始思考了:是不是可以用类似的架构和思路(大数据+云计算),去解决我们各自的问题。

 

因为其实大家做各自的领域算法都已经想了二三十年了,但是从来没有一个公司、一个团队能够真正地把这个地方打通。Jeff Dean做的事情就是把底层工程架构这个东西真正地打通。


谷歌翻译其实是帮助大家解决了这个基础的问题,而且真正可以应用的时候,语音识别可能花了半年的时间就快速跟进了。大数据算法扩展到了语音识别和计算机视觉,才会有今天的深度学习。

 

深度学习,它就是一个特别复杂的参数模型。当这个模型的复杂度增长的时候,你需要特别多的数据,特别强大的计算结构才能够做这种深度学习的计算。今天所有人都知道这个应该怎么做,但其实是从谷歌翻译把基础架构打好了。

 

所以从1.0到2.0,2B到2C,是AI在应用层面上一个很大的转变,就是AI真正对老百姓有一些用处。 


2016年开始,AI迈入3.0

但机器的智商不会超过人类

人类理解世界的方式跟机器不同

 

接下来会怎么样?我们每天都听到各种关于AI应用的新产品,包括无人机、VR、机器人等。所有的泡沫已经炒作得差不多了,从理论突破或者是工程架构的突破,已经走到了一个巅峰。

 

未来的,所谓的AI3.0会是什么样子呢?

 

美国未来学家Ray提出了一个奇点理论:到2045年,机器的智商会超越人类的智商,AI可能是人类的最后一个发明。因为AI出来以后,人类就会灭亡。但是我认为,按今天的人工智能的执行路径和算法能力,人工智能是很难去超越人类的。

 

今天任何一个人工智能的应用,都是通过数据训练模型来探索这个世界。这个模型很重要的一点是用大数据来训练机器的学习能力。但是,人类理解这个世界的方式,机器理解世界的路径是不太一样的。

 

首先是人类对物理世界的感受。我们通过眼睛看、耳朵听、对物理材质世界的触摸形成对世界的感受,感受完了以后我们就会产生经验。

 

第二个是思考。人类会根据自己过去的经验,理解我说的这些东西,然后思考我哪些内容是在胡说八道,哪些有一定的道理。

 

最后一个是与世界的互动。你有什么想法,可以表达赞同或者反驳,后面还会产生情感、协作和创造。我觉得这是人类认识世界很重要的方式。

 

如果机器人要想具有和人一样的思考能力、创造能力或者情感交流能力的话,我们首先得知道人类大脑的思维活动大概是一个什么模式,根据这个模式先建模,建模之后我们需要采集大量的数据。


但是我们可能把一堆传感器放在大脑里时刻数字化我们的思维活动吗?目前看来是不可能的。

 

另外,就算你真的能够建模成功,并且收集到数据,人脑每天的数据量是极其庞大的。我们想象一下,我们拍了一张照片,发到朋友圈,这是一个我们把生活数字化存储并且传输的一个过程。但是你想想你每天看到的场景有多少,换算成图片有多少?我们无时无刻都是在看视频,互联网的存储或者传输能力够吗?

 

所以当你要模拟人的行为,模拟人类和物理世界交互的时候,你又会发现你根本没有办法存储和传输这么大的数据量。


*本文根据李志飞在混沌AI成长营的课程内容整理而成,有删节,欢迎转发分享,转载请直接在本公众号留言获得授权,我们会及时回复。



R

  eading

推荐阅读 (点击文章标题,直接阅读) 


★  上期必读罗振宇:这个时代没有孤胆英雄

★  深度科大讯飞胡郁:如果机器人能有6岁儿童的逻辑水平,将出现爆发式增长

★  笔记《混沌研习课全部课程实录&PPT合集》


混沌研习社第三季度课程表重磅发布

600元入社,即可报名听课

点此下载混沌官方APP海量课程视频随时看!



点击下方“阅读原文”,查看混沌研习社超级课程表,入社听课!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存