查看原文
其他

专访 | 曹首光:如何打造一款受欢迎的机器翻译产品?

黄丹彤 翻译技术教育与研究
2024-09-09


如今,人工智能的时代大势引发了深刻的技术革命、教育变革和数据革命,同时翻译技术也成为了翻译教学和实践中不可分割的部分,进一步推动了语言服务行业和高校教育的创新变革,促进了技术与人的和谐共生。为提升语言服务行业各方对翻译技术的认识和应用能力,加强语言服务人才的技术素养,加速语言技术成果的高效转化,整合当前优质和有效的翻译技术资源,推动翻译技术与翻译教学的融合发展,促进政、产、学、研的协同创新,WITTA翻译技术教育研究会(TTES)特别策划了【大咖专栏】,本期专栏将聚焦“机器翻译和译后编辑”,对话业界和学界的专家教授,聆听业内名家的精彩观点,洞见未来翻译技术发展趋势。


本期专访嘉宾是机译应用GT4T开发者、资深译者曹首光老师,让我们来听听他对机器翻译的看法。


GT4T在业界应用非常广泛,取得了非常大的成功,请谈谈您是如何把 GT4T这个产品做的如此受欢迎的?

我是译者出身,对译者使用机译时的需求和痛点比较了解。另外GT4T是我和用户之间良性互动,经多年打磨的结果。我和用户之间的正负反馈都比较顺畅,用户有问题有建议都可得到及时的修正和回应。我的想法是把每个用户都当唯一的用户一样认真对待,当然目前用户数量不多。即使日后用户多到我忙不过来了,我也想把这个当成我运营GT4T这个产品的第一原则。

就GT4T本身来讲,译者翻译时所用工具多样,首先译者需要一个可以方便在任何窗口下调用机译的工具。GT4T可同时提供多个机译结果供参考,且可在任何窗口内使用。很多人在谈人机结合,GT4T就是人机结合的一个简单易用的实现。

其次GT4T也是个深耕人工翻译行业的MTPE工具。各机器翻译公司提供的文件翻译器往往是面对终端用户的,仅可处理常见的如Office格式的文档,GT4T则还支持Trados Studio 等大多数新老CAT格式的预翻译。大家可能不知道,很多如苹果等大型公司,内部仍然在使用一些非常老的CAT工具,如Idiom WorldServer等。有些老译者发现GT4T居然支持 Idiom WorldServer格式的预翻译时,感到大为惊讶。

另外GT4T还是个机译外挂。解决了一些机译让译者抓狂的小毛病。例如一些翻译公司对译文格式有一定要求,要求使用空格隔开中英文或数字。机译的结果通常是无法满足这些需求的。GT4T增加了相应的选项,用户可以选择是否使用空格开隔开中英文。还有机器翻译日语译文输出经常一会是敬语,一会是简语。通过GT4T使用机译,用户则可选择译文全部使用简语。

最后,GT4T积极与所有机器翻译供应商洽谈,集成了几乎全球所有主流机器翻译引擎,目的是保证任何语言对及任何行业都能得到当前最好的机器翻译。


GT4T集成了多种机器翻译引擎,提供了便利的同时,也给译者选择带来了一定的影响,您是如何看待这个问题的?

我做译者时,随着我越来越多地使用机译,翻译工作也变得越来越索然无味了。机译的使用让我翻译时少了很多创作的快乐,思维上越来越懒惰。翻译工作越来越像校对了,想的不再是我该怎么表达,而是不断地去判断机译所呈现的表达哪个更好。

目前机译大都是以句为单位来单独计算的,句子与句子之间缺乏整体性。一篇文章用机器翻译,译文往往就是看着没错,读着则像嚼蜡。即使没有硬伤,读起来也缺乏些韵味,缺少些灵魂。

理想状态下,机译可以像词典一样,仅供译者参考,但现实中译者最终生产的译文实际很可能受了机译结果的影响。由此可见机译就是个参考工具这个说法,不足以描述译员使用机译时的实际情况。

如何克服这两个问题我也很困惑,没什么好的想法。但对于职业译者,不用机器翻译,效率确实会大大低于同行,我的朋友老翻译Michael Zhang甚至认为:到现在还不用机译的译者,无异于行为艺术了。


从职业译者来看,您如何看待机器翻译译后编辑这种模式的利弊关系?

这个问题我首先想到的是目前翻译公司和译者之间似乎尚未在译后编辑服务上达成价格协议。翻译公司想采用译后编辑,驱动力当然是想省钱。但许多译者因为译后编辑价格过低而拒绝接译后编辑。译后编辑难以定价,我想原因主要是机器翻译质量不稳定,有时候甚至难以预料。不同语种,不同行业以及不同的材料机器翻译质量差距较大。对每个项目都需要分别评估译后编辑工作量,无疑又给翻译公司增加了流程上的复杂性。

译者在使用机器翻译时,一般采用两种方式:交互式使用和译后编辑。无论使用哪种方式,译者都需要增强品控意识,对机器翻译给译文品质可能产生的影响有足够的认识。

当前机器翻译应用平台不断出现,机器翻译厂商竞争也日益激烈,您如何看待这种现状?

像Trados Studio这样的现代辅助翻译平台一般集成了三种辅助翻译技术:

1) 统一的翻译及项目管理环境。有了翻译平台,译者则仅需把要翻译的各种格式的文档导入至辅助翻译平台, 即可获得统一的,通常是原文译文两列对照的翻译环境。
2) 翻译记忆。翻译记忆是CAT平台的核心功能,即将译者译过的内容记录,用于按相似度匹配和预翻译后的译文。
3) 机器翻译。在神经机器系统出现之后,翻译平台也大都接入了机器翻译。

翻译记忆技术的出现,正是因为早期机器翻译水平较差,不具备实用价值而退而求其次的产物。如今随着AI及大数据技术的出现,机器翻译实现了质的突破。我认为翻译记忆技术终将落幕,被更好,更智能的机器翻译所取代。也就是说CAT的技术革新的重任可能在机器翻译身上。

不过到底该如何将机器翻译应用于辅助翻译中,目前还没有一种被业界普遍接受的方式。但CAT行业已有一种风雨欲来的感觉。去年年底,Translated收购了专注于机译辅助人工的机器翻译引擎ModernMT,不知这个收购会给CAT工具行业带来何样的变革。腾讯的TranSmart团队也在着力开发交互式机译辅助翻译系统,据TranSmart负责人黄国平说,2022年将是TranSmart开花结果的一年,产品将会密集发布,我们拭目以待。


现代机器翻译基于开源的AI框架,架设一套机器翻译系统的门槛并不高,有一台高性能的服务器,安装上开源的程序,给系统喂一定量的语料,一个机器翻译系统就可以上线了。虽然运营一套为公众服务的机器翻译系统成本并不低,但因为不存在技术难题,再加上未来无穷的潜力,各大互联网公司都有了自己的机器翻译团队,仅腾讯就有4个独立的机器翻译团队。


但是各个机译同质化严重,变现能力差。因为门槛较低,一些需要机器翻译的大客户,往往更倾向于建立自己的机译团队而不是购买现有的机译服务。同花顺公司就是个典型的例子。同花顺有机器翻译需求,但并没有购买现有服务,而是通过挖人的手段建立了自己的机器翻译团队。


由此我认为未来能够生存下来的机器翻译团队有以下几种:

1) 所属公司的产品对机译需求较大,例如微信机器翻译团队。

2) 专注于某个或几个垂直领域,产品质量过硬,且被行业大客户所接受的翻译团队。如专注于医疗的Atman公司,专注于主要垂直领域的深圳云译。

3) 实现了技术突破,产品质量明显高于同行的机器翻译团队。


您认为未来机器翻译技术有哪些更加广阔的应用场景和前景?

即使是现在,机器翻译的目标应用对象也不是人工翻译行业。对于机器翻译来讲,传统人工翻译行业规模还是太小了。机器翻译的目标应用是那些人工翻译做不到的翻译场景:机器翻译与人工翻译相比,不光是价格更便宜,现代基于互联网的应用需要大量即时性翻译,这是人工翻译无论如何也做不到的。机器翻译现已广泛应用于人工智能产品、多语种文字或语音同传、国际贸易平台、需要即时翻译的手机应用等场景。据小牛翻译的朱靖波所讲,仅阿里巴巴的跨境平台,每天接受用户请求的自动翻译量就超过1000亿字符,据朱靖波老师估算,就是全国所有译者都为阿里巴巴服务,也无法满足阿里巴巴一家的需求。可见自动翻译需求量是远远大于人工翻译需求的。


未来对大量、实时和低价的翻译需求只会越来越多,这些需求本来就不是人工翻译所能做到的。如果说机器翻译挤压了人工翻译需求,也纯属误伤。


您认为职业译者如何借助技术提升翻译生产率?

如上所述,我觉得机译目前有两种用法,一种时交互式的,译者翻译过程中实时获取机译结果,用来参考、获得灵感、减少打字工作。另一种则是现在较流行的MTPE译后编辑。显然MTPE更加高效。据译者娄东来所讲,使用MTPE,他一天可翻译2到3万字。这在以前是不可想象的。


做好MTPE,也是需要练习的,其中有很多需要学习体会的东西。不过我在MTPE流行之前就不再做译者了,对MTPE并没有太多的心得。


随着机器翻译与翻译流程不断深度融合,您认为翻译企业未来何去何从?

随着机译越来越好,大众对机译越来越接受,一些原来使用人工翻译服务的大客户可能会部分或全部转向使用自动翻译。翻译行业应会受到一定的挤压。与很多人的观点相反,我认为越专业的领域反而越容易被机器翻译侵蚀,医疗行业就是个明显的例子。慢慢地医疗行业会发现,由于专业性强,找到专业的高水平人工译者并不容易,而经过专门训练的机器翻译则准确率更高。同样道理,处于翻译行业塔尖的同声传译,很快也会感受到来自机器翻译的压力。

较不容易被机器翻译侵蚀的有创意性翻译、文学翻译、对质量要求较高、时间要求较宽裕的书籍翻译、本地化改写、游戏翻译等。小型翻译企业应看清形式,早做打算,及时转型。

对于拥有高质量大客户的大型翻译企业,我认为与机译公司深度合作或并购是一个重要方向。积极拥抱科技,探索机译的使用方式,降低成本,提高效率,加快回稿时间,提供新型服务,从而获得更高的利润。


面对机器翻译冲击,您认为学生译者应从哪些方面提高自身的竞争力?

实际上无论是否有机器翻译的冲击,无论做哪个行业,提高竞争力的最重要的方法是都是自主学习的能力和习惯。查理·芒格说,自我完善是你的道德责任,如能做到每天睡觉时都要比醒来时更智慧,日积越累,你最终能获得超常的竞争力。

作为一个90年代的老英专生,就我自己的经历来看,我深以为然。这些话听起来虽然有点务虚,有点鸡汤,但确实非常重要。

具体来讲,学生译者首先要把英语学好。回头看自己的受教育经历,我一生受益最大的学科是英语。我37岁才开始写代码,100%全靠自学,而英语就是我自学的最重要的工具。

作为学生,不要因为日后翻译行业可能会被自动翻译所替代而整日忧心忡忡。我们每个人对自己未来的想象都不会有多准确,况且相当部分的翻译专业的学生日后并不会去做翻译。未来总是一件事导致另一件事的连锁反应,是逐渐打开的。对于尚未发生的事情担心发愁不光毫无用处,还会消磨你的精神。作为学生,时刻专注于个人成长,养成终身学习进步的习惯,才是重要的。


访谈人介绍


曹首光

自由译员,广受欢迎的机译应用GT4T开发者,ProZ.com 第四届翻译大赛英汉对冠军获得者。自2009年起开始从事机器翻译辅助机译应用的开发,2020年创建海口吉第福第科技有限公司,继续专注于走完机器翻译的最后一公里,使机器翻译更加易用。



编辑:黄丹彤

排版:黄丹彤

审校:李斯然



往期精彩回顾



MTI翻译硕士复试常见翻译技术问题汇总(附参考思路)翻译必备术语库和语料库合集(附网址)!翻译必备的计算机翻译辅助软件(附网址)!
翻译人员必备的机器翻译(网址大全)翻译人必须知道的图书版权问题2021年语言服务行业回顾与展望
2022年翻译行业将迎来哪些新变化
语言服务企业机器翻译译后编辑应用调查报告冯志伟:我老了,机器翻译依然年轻
冯志伟:关于机器翻译行业发展的三点建议宗成庆:机器翻译的梦想与现实
黄友义:改进中国国际传播,机器翻译大有可为肖桐:机器翻译研究前沿与应用趋势AI时代高校翻译专业必然会走向消亡吗?
机器翻译质量评估:人工评估 vs 自动评估AAAI2021 | 机器翻译技术最新研究进展再不了解当今四大翻译技术你就OUT了
高校翻译教学是否需要计算机辅助翻译实验室?
你的多数困惑在《翻译技术100问》中都能找到答案
翻译技术教学概况 | 北京外国语大学
用导图读论文 | 王华树 刘世界:人工智能时代翻译技术转向研究用导图读论文 | 王华树 李智:口译技术研究现状、问题与展望术语抽取软件测评框架研究技术与工具 | 国内外常见CAT工具一览技术与工具 | 常见翻译质量保证工具一览专访 | 李俊:生命科学也需要机器翻译吗?
专访 | 赵杰:神经机器翻译 VS 神化机器翻译?
专访 | 崔启亮:机器翻译对语言服务企业有多大作用?专访 | 黄书剑:如何评价机器翻译质量的好坏?专访 | 韩林涛:文科生如何学习机器翻译?专访 | 周兴华:机器翻译译后编辑会让译者越来越懒惰吗?专访|江伟:机器翻译译后编辑模式对译员能力有何影响?专访 | 王华树:机器翻译将要取代人工翻译吗?专访 | 朱靖波:下一代机器翻译技术是什么样子?专访|陈中强:MTPE模式下如何平衡译者与翻译公司之间的矛盾?专访|魏勇鹏:机器翻译质量评估为什么重要?专访 | 徐彬:熟练掌握翻译技术,就能做出漂亮的活儿收藏 | 国内外常见术语管理工具收藏 | 国内外术语研究重要著作收藏 | 国内外主要术语工作标准译学文献 | 王华树、刘世界:大数据时代翻译数据伦理研究:概念、问题与建议

继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存