《语言战略研究》∣ “语言与智能技术”多人谈（二）

Original 连谊慧语言战略研究 2023-03-12

《语言战略研究》2016年第6期

编者的话：

人工智能近年来的飞速发展离不开自然语言处理技术，即让机器理解人类的语言。自然语言处理技术的发展和应用正在改变着人类的生存方式。它既是语言生活的重要组成部分，也是推动语言发挥社会功能的重要动力。8 月28 日，中国中文信息学会和中国计算机学会联合主办的“首届语言与智能高峰论坛”在北京召开。在论坛的讨论环节中，八位专家就“语言与智能技术的未来发展”发表看法，分别探讨了类人语言理解系统的特点、深度学习的原理及应用、AlphaGo成功的启示、未来五年语言理解领域关键技术和研究方向等问题。本期我们整理了这部分发言，以飨读者。

如何构建一个类人的语言理解系统

王海峰（百度公司）

构建类人的语言理解系统, 首先要确定“类”的内涵。比如，我问一个人他专业领域之外的问题，他能听清楚我说的每一个字却无法回答我的问题。如果我去问这个领域的专家，专家一定可以回答。然而，若一个90 后的小朋友用网络语言的表达方式来问他，他则不一定能听懂，从而也无法回答。反过来，如果他听懂了问题并用一种专业的表述来回答，这个小朋友也听不懂。

这里涉及一系列的问题。以问答系统为例，一是要有对人类语言的理解，二是要有对知识的掌握和运用，三是要有语言的生成，这样一个问答系统才能够形成。这是计算机模拟人的问答交流的过程，而模拟人的翻译过程又是另一套方法。因此到目前为止，我们还无法去建立一个完全通用的“类人”系统，“类人”和目标设定密切相关。

对语言的理解，对知识的掌握和运用，其背后是什么？我认为是基于大规模数据的深入挖掘。不管是挖掘语言规律，还是挖掘知识，或是运用这些知识去推理，都需要从海量数据中做数据挖掘。目前，从完成任务的角度来说，在某些方面，计算机的水平甚至比人的水平还要高，比如“百度翻译”，可以翻译几十种语言，很多场景下翻译结果基本是可靠的，从某种程度上来说这超出了一个人的能力。

人和机器的不同在于，人可以去举一反三，或采用这样一种学习模式，而机器不是“看到一个反三个”，而是可以直接看到一百个、一千个，甚至更多，进而去学习、整理。比如，一个翻译系统，我们可以用数以亿计的人翻译过的、从互联网中挖掘出来的双语数据去训练它。再比如，AlphaGo 之所以可以战胜李世石，正是因为它能够利用计算机的优势看到更多的棋谱，从而进行学习。因此，机器和人的学习机理不一样，这也正是计算机进行语言理解的优势，是我们构建“类人”的语言理解系统的基础。

◆ ◆ ◆ ◆ ◆

从技术向原理回归

邢波（美国卡耐基梅隆大学）

这几年在机器学习以及NLP（Natural Language Processing, 自然语言处理）领域，刷比分的文章层出不穷，我对此比较担忧。我认为，学者们应有自觉的冲动和热情去关注技术的原创性和原理的突破。

从我个人的观察以及与很多同行的交流来看，很多谈论都集中在对于问题的描述或者宏观性的展望，少有对于技术性或者原理性的执着。很多知名学者和研发领袖的大量言论、频繁演说都集中在这个层面。近几年，这种情况在机器学习领域中非常突出。甚至还有一些近乎轻浮的观点，诸如建议初学者不要从理论开始入手，不要在算法上花费太多时间，甚至无需懂线性代数这样的误导性极强的、来自个别新潮明星应用工程师们的论调在公共论坛中大行其道，被奉为圭臬。

特别是当有一个“大锤子”，像深度学习这样的方法出现之后，就更加速了大家去“摘果子”的热情，对原创性、原理性的热情便减弱了。原创性研究和对原理的探索非常枯燥，回报周期长，但却是任何一个学科发展的必要环节。此外，这样的工作不是某个人、某部分人或者某个团体能够独立完成的，它需要学术界和工业界共同合作完成。

一个好的研究环境不存在学校和企业、工程和理科的区别，一个好的学者必须拥有融会贯通的能力，能够在对实际问题进行深入理解的同时充分地掌握原理。而这往往是我们在现代科学环境里缺乏的一种学术品位。

举个例子，如果在原理不明的情况下去推动一个产品，你是否敢用，如何介绍给别人用呢？原理不清，就表示你对其结果没有十分的把握，在这种情况下售卖产品有极大的风险性。就最近的特斯拉自动驾驶车事故来说，一个机器视觉或者机器人专家绝不会在自动车上把手离开方向盘去睡觉，因为他知道这个系统其实没有那么可靠。但是由于过度的宣传以及社会对人工智能的依赖和期待，人们往往忽视了它的局限和缺陷。这就需要学者和工程师对产品的原理和透明度有执着的追求，也需要媒体、政府对人工智能应用开发的理性和冷静，对基础研究的理解和重视。

在常规的人工智能开发中去做任何一个突破性的判断，都值得研发者充分思考。希望大家更冷静一些，去关注数学原理，重视枯燥的基础性的工作，在实现的形式和算法的保障方面多下功夫。

◆ ◆ ◆ ◆ ◆

语言理解的数据、方法和应用

周明（微软亚洲研究院）

关于语言理解领域，我特别关注三方面的问题：

一是数据。过去几年无论是做搜索还是做语音，方法在一定水平情况下动不了的时候，谁有大数据谁就最厉害，比如搜索，学术界玩儿了半天IR（Information Retrieval，信息检索），没有大规模的用户搜索的日志和反馈数据，水平根本上不去。语音也一样，像Siri，把海量用户的每天使用的语音数据拿过来重新训练系统，Siri 的语音就提高了很多。似乎数据工作包括获得数据、整理数据，从数据中做出一些归类、聚类，发现知识和规律，似乎是很烦琐的工作，但却是我们这个学科的根本。在今年的ACL（Annual Meeting of the Association for Computational Linguistics，计算语言学年会）上，少有学者谈数据的问题。我认为数据是值得大家好好讨论的问题，尤其是对中国学者而言，如果狠抓各类有用数据，包括无标注、有标注的数据，就很有希望实现赶超。

二是方法。将“迁移学习”演绎一下，就是将在A 领域好用的方法，放到B 领域去研究、继承和发展。通过应用可以发现有什么更好的方法，会遇到哪些挑战，遇到挑战后如何调整？这样又会产生新的方法。迁移的概念，推而广之，其实就是跨学科合作或跨领域合作的问题。目前神经网络机器翻译很热，可是我们从中发现了很多问题，比如丢词特别厉害，或者翻出了多余的片段。现在大家都在把统计机器翻译的方法一点点放到神经网络中去。现在神经网络机器翻译中的Attention 模型，它是概率分布式的，对每个词的翻译，要利用所对应的源语句子的词汇，按照不同的概率发生作用。统计机器翻译中的成分，比如翻译概率和词汇对齐，通过这种方式融入到神经网络中，我认为就是一种有效的方法的迁移和融合，只不过上升到了一个新的概念。目前，多数文章都从自己的角度阐述了应用神经网络改进某些NLP（自然语言处理）任务，但是少有将领域有关的知识、规则和深度学习相融合的研究。我认为这两者融合未来非常重要。

三是应用。自然语言处理是一个应用学科，要由应用来牵动科研的发展，如果没有应用驱动，可以天天谈脑科学的问题，谈50 年、500 年也还是这些问题。通过应用将研究的长远目标和短期目标结合起来，是学科发展的关键。

最后谈谈NLP 未来的研究重点，我比较关注如下两个方面。一是上下文建模和多轮对话。我们做机器翻译，做问答系统，做聊天系统，目前面临的最大问题就是对上下文建模的能力不足，而且多轮对话能力不足。随着手机的应用越来越普及，NLP 工作者渴望解决口语现象和多轮对话问题。也许深度学习和强化学习会有很好的用武之地。二是神经网络机器翻译。目前已有很好的进展，但是方兴未艾。其中探讨神经网络机器翻译和统计翻译各种形式（模型、特征）的结合，将会有很大的发展前途。

◆ ◆ ◆ ◆ ◆

AlphaGo 的成功对语言理解有何启发

马少平（清华大学）

AlphaGo( 一款围棋人工智能程序, 由Google 旗下的DeepMind 公司研发) 到底成功在哪里？从原理上说，其核心是深度学习、左右手互搏以及强化学习，但如果从方法策略上来说，它与以前的成果，比如深蓝（IBM 公司生产的一台超级国际象棋电脑)，存在很大的不同。

两者之不同和围棋本身的特点有关。围棋感性的东西多，模样怎么样，是厚还是薄，这些东西很难描述，过去之所以认为计算机下围棋存在困难，正是因为这一点。深蓝采用α-β 剪枝的办法，有一套评价体系，评价完全是靠知识。IBM 在研发时请了很多下棋高手、国际大师帮他们总结各种知识，最后再结合搜索来实现。而多年来围棋的评价一直没有得到解决。AlphaGo 靠深度学习来解决了评价的问题。它有四个网络，包括快速网络、两个策略网络和估值网络。其中，快速网络严格来说不是深度的，是很浅的，甚至就是一个回归，是根据人的知识在几万个模式的基础上构成的。它在AlphaGo 中起了很大的作用，然而单靠它可能打不过李世石。它的网络速度非常快，比第二、第三个网络快一千倍左右，在蒙特卡罗树搜索（Monte Carlo Tree Search）时用于模拟，可以在同等时间内快一千倍。这对最终胜负起到了关键作用。

因此，AlphaGo既有人的知识，又有深度学习感性的东西，同时又借助了蒙特卡罗树搜索。知识和搜索都是传统的基于符号主义人工智能的精髓，而深度学习是所谓的连接主义。这样，AlphaGo 把符号主义的方法跟连接主义的方法很好地融合在一起。这是他成功的地方。

现在大家都运用深度学习，靠数据驱动，把知识完全拆解掉了。然而，我们应该深入思考如何把规则和知识，即传统的符号主义思想和深度学习的连接主义思想结合到自然语言处理中，这样才能够解决问题。两者通常是互补的。举个例子，AlphaGo 跟李世石比赛第四盘下输了，源于一步错着，至少到7 月份距离比赛已经过去了4 个月的时候，AlphaGo 也未能解决这个问题，即便经过长时间训练，仍然没有解决。基于深度学习大量数据的训练方法，想把一个错误改掉是很难的，而且改正以后其他问题不一定不出现。而基于知识和规则，就很容易避免。

将知识、规则与深度学习相结合，AlphaGo给予我们很深的启示。这也应该是自然语言处理领域今后努力的方向。

◆ ◆ ◆ ◆ ◆

《语言战略研究》2016年第6期目录

◆ ◆ ◆ ◆ ◆

《语言战略研究》2017年征订工作已经开始，欢迎各界人士及单位订阅。全年6期114元（微店另收12元快递费）。

订阅方式：

1.全国各地邮局订阅，邮发代号：82-104

2.微信订阅：商务印书馆（微信号：shangwu1897）官方微店（长按识别下方商务印书馆官方微信二维码或点击左下方“阅读原文”）

商务印书馆官方微信

◆ ◆ ◆ ◆ ◆

《语言战略研究》官方微信

微信号：yyzlyj

电话：010-65523102 65523107
传真：010-65523101
电子邮箱：yyzlyj@cp.com.cn
投稿地址：http://yyzlyj.cp.com.cn
地址：北京朝外大街吉庆里14号佳汇国际中心1509室
邮编：100020

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

《语言战略研究》∣ “语言与智能技术”多人谈（二）

您可能也对以下帖子感兴趣

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

生成图片，分享到微信朋友圈

《语言战略研究》∣ “语言与智能技术”多人谈（二）

您可能也对以下帖子感兴趣