查看原文
其他

对撞机|我们凭什么看不起机翻?

零壹Lab 2022-10-08
· 编者按

零壹Lab选择了一种集体写作的方式来记录对某个议题的讨论。在第一轮的讨论中,翻译问题成为了大家关注的焦点。这不仅仅因为翻译在当前“英语通吃”的情况下已经变得越来越“多余”,也因为机器(尤其是人工智能)参与到翻译过程中的时候,翻译作为一种人类智力劳动的定位受到了挑战。文本中每位写作者从各自关注的角度对这个问题进行了探讨,我们用不同的背景色块表示区别,并用加粗的方式对一些核心观点进行了标注。本文由于是对不同文章的剪辑和拼贴,其中或许有一些冲突矛盾之处,但也因此保留了集体写作的活力所在:没有固定的观点,只有不断的冲突。


家伟:AI翻译作品如何才能具备“译者性”?

随着计算机科学和语言学的不断发展,以及大量的人工标注和语料库建立,越来越多的机器翻译工具已经成为了许多人跨语言交流和学习的一个重要辅助工具。但是另一方面,机器翻译却一直为译界和读者所诟病,部分翻译者甚至把“机翻痕迹”的评价当作是对译者的一种“人身攻击”。在翻译界对于AI翻译的剧烈排斥态度背后,如何能够摆脱翻译界对于AI翻译作品的“污名化”,以及如何让AI的翻译作品具备“译者性”无疑是我们需要回答的对于机器学习发展的实操问题。

 

要回答如何让AI翻译的作品如何具备“译者性”,我们首先要回答,何为“译者性”。作品翻译不同于文学创作,其工作的开端来自于已有的文本。与文学创作的自发性和原生性不同,翻译往往是派生的,观念化的。正如对于翻译的讨论常常围绕的两个问题:译作是否忠于原著,以及译作本身是否有自己独特的风格。

 

一篇译作能否传达原著,需要的不是“机械的字对字的直译”,绝对忠实于原文的字句绝不能完整表达出原文的内核,需要的是一种“流动的转换”,是在“译入语中书对原作的回声”。这种回声,除了是结构的,文本的,更是一种意向性的,所指的。这种对于原作的忠实性,对当前机器学习翻译工具提出的一个首先要求便是,如何让机器/使用数学逻辑,去抽象理解文本,让机器能够提炼出文字之下的,作者的意图。在当前以神经机器翻译(Neural machine translation)为代表的模型训练中,所关注和优化的模型策略还是以字面文本的对照和流畅性为主,并没有去深刻理解文本所提出的想法或含义。在关注文本表述之外,能否通过建立更深层的意义网络,让机器理解文本内涵,或许能够成为机器翻译对于文本转译的忠实性的突破。

 

世界上永远没有两片一模一样的树叶,同样,对于译作,即使无限接近原著,但永远同原著存在距离。译者永远是在原著之林之外,远远观山。而这种远观,便是译作本身的独特风格,强调的是译者在翻译时的自由性。正如赖明珠和林少华对于村上春树的作品翻译截然不同,但又各有推崇一般,这种自由性是往往是超越纯语言的。它既有译者对于两种语言亲缘性的理解和重建,又有着译者对于译入语深刻的理解,让原作在转译中源源不断的注入新的生命和活力,是一种对于巴别塔重建的尝试。而当前的机器翻译,虽然确实能够通过对于不同语料库的置换,使得翻译的结果稍显出这种“自由性”的差异。但是这种有限的自由,仅仅来源于机器操作者对于不同语料库的理解。但是,对于译入语本身和两种语言的亲缘性的理解,却被抛掷到限制性极大似然估计和离散空间的黑箱之中(虽然人脑如何理解这种语言的相似性本身也是一种黑箱)。而要让AI更具有这种自由性,其强调的是机器对于两种语言模式更深入的理解,以及对于两种亲缘关系的理解,这一方面要求更加多样化的文本训练,另一方面也要求这种跨文化足迹的数字转化。在网络文本逐渐泛滥化,数字人文数字库项目不断兴起的当今,或者是一个机遇,也是一个挑战。




TRANSLATE雨萌:批评机翻到底在批评什么?


尽管AI的创作常常被认为是前景最光明,但同时人们也认为威胁性最大的,具备创造力的人工智能,可能会给这个世界带来革命性的变革,可能会摧毁最后一份原本唯有人类才有能力去做的工作,可以增进新发明的出现,加深我们对宇宙的理解,为那些长期困扰我们的世界性难题找到解决之道,而且提供无数的故事,电影和音乐供我们欣赏之用。然而,假如人工智能可以发挥其潜能,则有可能对我们造成威胁,取代人类发明家、天体物理学家、科学家、作家、演员与音乐家、画家,正如工业机器人在20世纪取代工人一样,威胁着我们。在翻译领域,此威胁亦存在。我们的知识产权体系,在设立之初,仅仅面向的是人类发明家和创作者,并没有虑及非人类创作者,如果一台机器创造出一个新的故事文学,新的音乐,新的电影和视觉艺术,它会被承认为其作者,并享有著作权吗?如果一台机器,创造出一个新的工序,或新的技术,新的引擎,它对这些发明享有专利权吗?所以有能力创作的机器人会催生出这样一个问题:当机器人创作出智慧产品时,是机器人有权拥有,还是创造这台机器的人类有权拥有,目前,全球的政策和法律都没有提及这个问题。人工智能创作的知识产权究竟属于谁。


春妍机翻与人翻,界线何在?

随着机器学习的发展和机翻的不断改进,人工翻译与机翻之间的差距在缩小。好的机器翻译,在文本量不大的情况下,可以做到像人工翻译一样准确、流畅和通顺,而一份人工翻译的稿子,完全有可能“看起来像机翻”。很多时候,人工翻译和机翻的成果,未必是可以明确区分出来的。那么,是否可以问:人类在何种程度上是机器的,机器又在何种程度上是人类的

 

在普遍大众的印象里,人工翻译更灵活,这种“灵活”通常体现为语法、句式更多变,更贴近日常用语习惯,或者更“高级”或优美;而机翻则往往是机械、死板、不知变通的,只是根据固定的程序去进行输入和输出。但实际操作中完全可能出现与这种印象恰好相反的情况。把同样一段文字在不同时间(比如昨天和今天)输入翻译器中,输出的翻译往往是有区别的。词语、句式,都可能发生改变。翻译器可能学习过同一个词语,或同一种句式的不同翻译版本,并会根据语境进行调整,输出随机组合的方案,所以并不是每一次相同的输入都能导出相同的结果。但一个有经验的译者很可能在长期的翻译中积累了自己遣词造句的习惯,所以很多时候这种经验的结果往往是相同的——就好比一个作者有自己特定的“文风”一样,译者也会有自己相对稳定的风格,有经验的读者可以通过文字风格判断出作者或译者。在这种情况下,机翻甚至比人工翻译具有更大的灵活性和不确定性,因为人工会固定在经验、习惯、风格和知识背景中,而机器由于其对多种翻译版本的学习,反而更具不可预测性。

 

扩展而言,人的意识是否也是依据某种编码而形成的机器,是一个稳定运行的系统?当我们的思维习惯被结构起来以后,人也很容易被框定在某种程式化的思维中,那些处于我们知识范围之外的概念、词语,从来不会出现在我们的语言使用里。机器以何种方式模仿和学习人,在何种程度上接近甚至超越人,甚至比人更像“人”?使人工和机器区别开来的,究竟是那些可以预测的东西,还是不可预测的东西?也许是一系列值得思考的话题。



READING力恒:翻译能让人快乐?

说到关于机翻的反思,我最关注的是译者的感受。当人工翻译的工序改变,做译者的感受是不是也因而大幅转变?我和朋友集体翻译、校译过两本书,翻过一些专业论文,也处理过一些网页文章的翻译。用英文写中国史题目,翻译史料也是经常要做的事。做翻译做得比较多的那些年,机翻算法还很有限,所以都是百分之百的人工翻译,顶多是利用搜索引擎查核一下不确定的术语。

 

做这些时,深深觉得译事不易——尤其遇到不易表达、不好翻译之处,译者也是绕不过去的,需要硬着头皮找到最佳对策。何况翻译是有点吃力不好的,翻得不好,挨骂的是译者;翻得好,大多读者都会得鱼忘筌,忘掉译者的功劳。不过这种艰难也能带来莫名的满足感,所以还是吸引人继续做下去。一旦抓住了那些巧妙的语际对应,或写出了非常通顺的译句,总是有如把结解开的舒畅。更不要说做到让人理解明瞭,甚至让人有灵光乍现的效用了!

 

机翻大行其道的时候,类似感受是不是也消退了呢?那么译者的收获会不会也不如以前了?毕竟翻译不只是技术活,也是一种创造和再创造。甚至,我想起我系里一个博士生借用过伽达默尔的游戏理论来看待翻译——翻译不也是一种游戏么,译者在颇大的不确定性中寻求自我实现。这种实现也确实要有观赏者,意义的实现才算淋漓尽致。翻译,就如同伽达默尔说的 “play” (Spiel) 。当玩翻译游戏的不再是人,而是机器,那还会好玩吗?





梅溪:人-机共翻,撼动的是什么?


"在我们的文明里,需要有作者归属的也并不都是同样类型的文本。有一个时期我们今天称之为"文学"的文本(叙事文学,故事,史诗,悲剧,喜剧)是在丝毫不对其作者身份进行认定的情况下被接受、传播和欣赏的。它们的匿名性并没有造成任何问题,因为它们的古老性——不论这是真实的还是想象的——足以充分保证其地位。""逆转发生于17世纪或者18世纪。科学话语开始在现有的或经反复论证的真理统统匿名的情况下,因其自身价值而为人接受了……与此同时,文学话语却开始在有作者功能的情况下才会被接受。我们现在问每一篇诗歌文本或者小说文本:它是在何处写的,是谁写的,在什么时间什么情况之下,或者是以怎样的构思开始的——这个文本的意义以及它的地位和价值,都要取决于我们回答这些问题的方式。一旦一个文本被发现处于匿名状态——不论是由于意外还是作者有意为之——最后我们都会陷入找寻作者的游戏。"上面两段文字均摘自福柯的一篇文章《什么是“作者”?》。的确,我们只需要简单回想荷马史诗,格萨尔王,阿里斯托芬,乃至塔西佗,就能确认:确实存在那样一个时期,人们只是单纯地接受和欣赏文本本身,而并不在意文本“作者”,因为有些文本显然来自“口述”的传统,其文本并不固定,其“作者”也并不单一,甚至不可考。同时,我们看到,逆转发生于17或18世纪,那么一个近乎于直接反应的问题就会是:为什么逆转发生在17或18世纪?在福柯那里,这肯定是跟“文本所有权体系”的形成密切相关的。如果我们把“文本所有权体系”当作一个初步的答案,那么对应到当下的状况:人们之所以不接受AI翻译的小说,不接受AI写出来的小说乃至音乐,绘画,是否就恰恰是因为AI还不足以成为能承载“所有权”的主体?或者说,AI的所有权很难被追溯和确认,它更接近于一个天然匿名的状态——在直感上,我们可以毫无阻碍地承认AI的作者是某个技术开发团队,但对于被开发出来用于“艺术创作”的AI而言,其背后的技术团队却并不会被天然地认定为AI作品的“作者”。因为技术团队通过代码和算法能给到的仅仅是创作素材和创作空间,将这种素材作品的化的,依然是AI程序这个虚拟的“主体”。换句话说,面对AI所创造的文本,我们很容易从一开始就陷入福柯所谓“寻找作者”的游戏——我们无法确定作者,就无法接受“作品”。此外,由于AI常以程序和算法的形态出现,因而是可复制的,以及是会被不同的主体用于创作的。而这将带来更进一步的挑战:不同主体用同一AI输出得到的作品,其作者或文本所有权又该如何来界定?不管我们当下的社会最终会如何来定义有AI创作产生的文本所有权,在福柯那边,他却是十分笃定:“我认为,随着社会的变化,在变化进程中的某一特定时刻,作者功能将会消失,在这一情形下小说和它的多义文本将依据另一种模式进行运作,但这一运作仍要在一个制约系统之下进行——这一制约系统将不再是作者,而是另外一种需要被确定或经验的东西。”显然,我们正处于“经验”之中。福柯关于“作者”的讨论拆解,在很大程度上也关乎于主体性(的建构)。一个福柯或许难以想象的现象却是:当下的我们已经太过习惯于寻找作者的游戏,过于习惯将自己的主体性与作者进行关联和绑定。这一点尤其体现在移动互联时代的各类“粉丝”身上,他们中的相当一部分人不仅仅是通过自己所认同的作者/创作者来区分彼此(圈层),更愿意将自身的主体性让渡给某个作者,同时该作者成为其建立自我认同的养料。换句话说,当下的粉丝文化恰恰是最在意“作者”是谁的那一群人。于是越来越少有人去问:“究竟是谁在说话?真的是他而不是其他什么人吗?具有什么样的真实性和原创性?”反而代之以“究竟是谁在说话有什么分别?”。(引文中的问题亦来自福柯原文)



维忆人翻机翻都是一种劳动

零壹Lab组会针对机器翻译的讨论,使我联想到Sol Lewitt的观念艺术,以及更普遍意义上的当代艺术的去技能化现象(deskilling)。Lewitt的很多墙画(例如Wall Drawing系列),在布展时完全是由一个团队(基本上就是一个施工队)来完成的——他们会将他的设计稿巨细靡遗地绘制到场馆的墙壁上。如果你曾看过Lewitt作品展就会知道,这是一个相当费时费力费眼的过程。那么,艺术家Lewitt对这些作品仍然握有authorship的合理性、合法性何在?

 

当然,艺术(创意、设计)与工艺(技法、制作)的分离是一个漫长的过程,也并非如主流艺术史所宣称的,是文艺复兴的产物。对这个问题的溯源和剖析要另起一篇论文甚至专著才能讲得明白。但仅就当代艺术的去技能化而言,为艺术(家)辩护的常见方式之一是:艺术作品的创制过程——比如Lewitt的墙画——因为“普通人”的参与而得以去神秘化甚至祛魅了。然而,这些“普通人”分享到作品拍卖或艺术家名气的红利了吗?看展的“普通人”了解这群参与作品制作的“普通人”的存在吗?若知道又如何看待后者的贡献?对照名人效应下的巨额收益,对原本就以自我差异化和价值区隔为基础的“艺术殿堂”来这么一招“民主化”,实在很难洗脱诡辩甚至虚伪的嫌疑。与Lewitt相比等而下之的Jeff Koons,Damien Hirst等诸多大腕儿(此处并没有特别蔑视波普艺术的意思)或者私下让助理代工,或者公开流水线生产/外包,更加做实了某些艺术家已经资本家化的猜疑。同样,这在艺术史上也并不是新鲜事。所以,当前最该被质疑的还不是这群“通透”的艺术家,而是身在艺术圈外的我们所持有的一系列刻板观念:艺术与市场应该截然分离,艺术家就应该专注于创作,如此等等。毕竟,创作,是一种怎样的劳动呢?

 

到这里,机器翻译的劳动问题也就一并带出来了。Lewitt说他所从事的观念艺术“不是理论化的,也不是对理论的说明。而是直觉性的。其中包含了大脑的各种思维运动,并且是无目的性的。它常常不依赖于艺术家作为手工艺人的技艺。”Lewitt对脱离手工技艺的纯粹的精神生产的认同,其实反映了视觉艺术家长期以来对“liberal arts”这顶桂冠的向往——所有的艺术家都想成为诗人和/或同理的作曲家,成为或自由的、或决绝的,总之心不再为形役的那个人;所以这个liberal是在语言媒介的意义上讲,更是在与mechanical arts相对立的意义上讲。匮乏—觊觎的闭环因围城而形成,又反过来巩固着围城。所以,事实上,在抽象符号(非物质)的园地中耕耘,是一种怎样的劳动?是否仍要涉及Lewitt想要剥离的那种手工技艺呢?将这个问题收窄到到翻译这个子论域,可以不必卷入所谓纯文学的形而上论争;而进一步聚焦“人工—机器翻译”之辨,又能使讨论远离作者主体(author subject)这具僵尸,引入一点新鲜的火药味。

 

首先,翻译当然是一种体力、脑力皆费的劳动;其中也存在技艺的高下之分。所以,在作为“技术活”的范畴内讨论人翻和机翻的区别,应该只是一个程度和量的比较。但这仍然会留下本质主义人文主义的藏身之地:仿佛借助的省力/省心手段越少(电子词典、机翻软件等),翻译的技艺就越纯粹,而这种纯粹性就意味着人工翻译的某种绝对价值。要反驳这一点是比较简单的:机制和组织,同样是外在与人的一种手段。而早在唐朝,佛经翻译就已经是有组织的大团队行为;如果对照机器学习的逻辑原则,以及自动化尚依赖大量人工标记、检查的现状,佛经翻译的流水线运作不是同样可以反过来被视为一种前机械时代的“智能翻译”?

 

第二,在作为(二次)创作的翻译这个相对混沌不明的范畴里,要比较人翻和机翻是更为困难的。在此我不想在巴特、福柯一脉的作者论的语境下讨论翻译算是一种怎样的写作,进而检查机翻是否可以或可能被准入到这个“境界”。我想强调的是,目前我们在面对机翻时的迷惑、不决,哪怕是排斥、否定,都是一个重新界定精神生产的契机,因为机翻所带来的种种具体的和本质的问题,将我们带回到了当代艺术兜了一个大圈又回到的起点,也是其非常抗拒去面对的起点——精神生产的劳动本质。在我看来,“人工—机器翻译”之辨,关键不是人机对立或边界界定的问题,而是在人工智能和数字复制的现实之下,如何重启精神生产的政治经济学的问题。




主编 / 陈静

责编 / 傅春妍

美编 / 傅春妍

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存