查看原文
其他

转译器|“机器翻译”早期发展

爱德华·凡浩特 零壹Lab 2022-10-08


附录文章:“机器翻译”早期发展(节选自“The Gates of Hell: History and Definition of Digital Humanities Computing“,by 爱德华·凡浩特,Defining Digital Humanities, Ashgate, 2013)


机器翻译是“使用计算机将一种自然语言的文本翻译为另一种自然语言”(Hutchins, 1986, p. 15)。支持开展“机器翻译”研究的理由众多,比如实用和交际的目的(人们必须阅读的文件可能是用他们不了解的语言撰写,还必须用他们不了解的语言进行交流)、学术和政治的理由(通过消除语言障碍开展国际合作和全球化,以促进和平,增进发展中国家的知识),军事的理由(弄清敌人掌握的信息)、学术的理由(研究语言和思想的基本机理,开发计算的可能性和制约性)和经济的(出售成功的产品)。

 

20世纪50年代初期,理查德·H. 瑞奇思(Richard H. Richens, 1918—1984) 和安德鲁·D. 布斯(Andrew D. Booth, 1918—2009) 使用穿孔卡片(Richens, Booth, 1952)对科学摘要进行了逐词翻译的实验。直到那时,翻译自动化的问题仅仅从机械的角度来考虑:开发一套词典查找系统,以帮助人工译员。伦敦大学伯克贝克学院(Birkbeck College)的晶体学家安德鲁·布斯很可能是第一个提出电子计算机也许可以用于“机器翻译”的人。在1948年2月12日写给洛克菲勒基金会的报告中,他写道:

 

在电子计算机的可能应用上,一个结论性例子就是将其应用于两种语言之间的翻译。我们细致地思考过这个问题,现在已经清楚:机器可以实现这一功能而不需要对其进行任何修改(引自Weaver, 1965 [1949], p. 19)。

 


在普林斯顿高级研究院做洛克菲勒研究员时,布斯对沃伦·韦弗负责。早在1946年,后者已经与布斯就使用自动数字计算机实施两种语言间的机械翻译进行过数次谈话(Booth and Locke, 1965 [1955], p. 2;Booth, 1980, p. 553;Hutchins, 1986, p. 24)。在做研究员期间,布斯和后来成为他妻子的助手凯瑟琳·布里顿(Kathleen Britten, b. 1922)开发了一套详细的编码体系,用于在计算机的存储器中存储词典,而后通过标准电传输入可以在词典中进行检索。这个构思可以追溯至1946年,它在自动计算机上实现了词典翻译(Booth, 1958, pp. 92—9)。


韦弗的报告《翻译》于1949年7月15日出版。布斯的研究以及他在战时作为密码分析员的经历为这份报告奠定了基础(Weaver, 1965 [1949])。《韦弗报告》(Weaver Memorandum)在20或30名“语言学学生、逻辑学者和数学家”(Weaver, 1970, p. 107),以及多达200名不同领域的学者(Locke, Booth, 1965 [1955], p. 15)中间传播。正是由于这份报告,多所高校启动了科研项目,产生了关于“机器翻译”所涉问题的一些早期著作。这些问题包括词语的模糊性、句法的语义功能,以及如何解决不同语言中的词序问题。

 

Weaver


1952年,18名学者聚首在MIT举办的第一届机器翻译“国际”会议,布斯是唯一的非美国籍代表。随后,大约40名语言学者参加了同年在伦敦召开的国际语言学大会(International Linguistics Congress)。一年后,“机器翻译”首次出现在由布斯伉俪编写的学术教材——《自动数字计算器》(Booth and Booth, Automatic Digital Calculators, 1953)中。该书的目标读者是计算机科学家,其中的一章——《计算机器的一些应用》详细地讨论了“机器翻译”。  1954年,一场大力宣传的展示会在IBM总部举办。展示会精选49句俄语样句、由250个选自不同领域的俄语单词及其对应英语所组成的词汇表,以及6条句法规则。IBM的新闻稿上写到:“一个完全不懂苏联人语言的小女孩在IBM的卡片上打出了俄语信息。机器的‘大脑’飞速运作,以每秒两行半的速度在一台自动打印机上给出了对应的英文翻译”。同年,哈佛大学的安东尼·奥廷格(Anthony Oettinger, b. 1929)发表了世界上第一篇有关“机器翻译”的博士论文(Oettinger, 1954),杂志《机器翻译》(Mechanical Translation)也首次登台亮相。

 


1955—1966年期间,领域内部以小组为单位进行划分,例如划分为主攻字典、词典和语义问题的小组和主攻句法问题的小组;采用实践研究法的小组(主要在英国)和采用理论研究法的小组(主要在美国);以及研究短期操作系统的小组和研究高质量长期操作系统的小组。这几年中,针对“机器翻译”开展了十几次重要的大会、聚会和研讨会,“机器翻译与计算语言学协会”(Association of Machine Translation and Computational Linguistics, AMTCL)也于1962年的6月13日成立。除美国和英国外,保加利亚、加拿大、前捷克斯洛伐克、法国、以色列、日本、前苏联及后来成立的独立国家等都开展了相关研究。 

 

虽然在1960年6月份美国众议院科学和航天委员会(Committee on Science and Astronautics of the US House of Representatives)编制的报告中,美国的资助机构已经对“机器翻译”对“我国情报和科学领域的总体发展”的重要性表示了认可(哈钦斯(Hutchins), 1986, p. 159),但6年后一家在资助机构的要求下成立的独立咨询委员会所给出的结论,给美国对“机器翻译”的研究资助画上了句号。声名狼藉的ALPAC 报告《语言和机器:翻译和语言学中的计算机》(Language and Machines: Computers in Translation and Linguistics, ALPAC, 1966)对自动翻译的需求、成本和表现进行了批判,甚至提议说:既然英语是科学领域中的优势语言,那么与提供翻译服务相比,让俄语文章的重度使用者学会俄语的成本效率更高。报告在最终建议中列出,应该将资金用于开发人工翻译的机器辅助和“计算语言学”来提高翻译质量,而这已经超出了“机器翻译”的范畴。ALPAC的报告终结了对完美翻译的研究,并且将自己理想归于乌托邦的范围。对宏观意义上的语言学,尤其是“计算语言学和人文计算”来说,这份报告改变了人们对未来的语言研究项目的思考角度,或者用维克托·英韦(Victor Yngve)的话来说就是:

 

哲学是语言学的发源地,但不是它的未来;语言学的未来在标准科学中,现在它可以自信地朝这个方向发展。这要求语言学要最终意识到,一位科学语言学家真正的研究对象是以其他方式说话、理解和交流的人群以及真实世界中的其他相关方面(Yngve, 2000, p. 69)。



主编 / 陈静

责编 / 傅春妍

美编 / 傅春妍

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存