查看原文
其他

机器翻译译后编辑 | 《译前编辑和机器翻译研究综述 (1990-2023)》文献推介

刘昱呈 翻译技术教育与研究
2024-09-09
译前编辑和机器翻译研究综述
(1990-2023)
作者:徐 红 黄协安(上海外国语大学)

摘要:译前编辑和译后编辑是机器翻译活动中的重要组成部分,但是目前并没有针对译前编辑和机器翻译研究的梳理和总结。鉴于此,文章梳理了 1990-2023 年 Web of Science 的核心数据库、Semantic Scholar、Scopus 和 BITRA 四个数据库中关于译前编辑和机器翻译的研究,并首次区分了译前编辑和控制语言。结果显示,译前编辑和机器翻译研究的焦点为文本类型、译后编辑效率、机器翻译系统和翻译质量评估。基于此,本文提出了未来可能的四个研究方向

关键词:译前编辑 机器翻译 统计机器翻译 神经机器翻译

Part.1

引言


译前编辑是否能提升机器翻译的质量?译前编辑是否有助于提升译后编辑效率?译前编辑对不同机器翻译系统的效果有何差异?

本文利用多个数据处理工具筛选并处理了译前编辑相关文献,根据文献关键词制作了共现网络图,直观地展示了译前编辑的研究焦点,并总结了目前译前编辑的研究成果。
/////    

Part.2

研究设计


1. 数据来源

时间范围:由于译前编辑的研究与机器翻译发展密切相关,本文根据机器翻译的发展历程界定译前编辑起始点,选取文献的范围为1990-2023年。

数据库范围:本文选取了Web of Science 的核心数据库、Semantic Scholar、Scopus 和 BITRA (Bibliography of Translation and Interpreting)作为数据来源,前三个数据库为在线多学科数据库,而BITRA为专门翻译的文献数据库。

2. 研究工具

- 从计量文献分析的角度描述译前编辑和机器翻译的研究现状,统计发刊趋势、开展关键词共现分析。

- 采用关键词提取工具Yake解决部分有关译前编辑和机器翻译的文献缺失关键词的问题。

- 采用Gephi软件根据关键词生成的矩阵来进一步构建网络(见下文图2)。

3. 数据收集

本文划定时间跨度为1990-2023年,以“pre-edit”和“machine translation”为检索词,在四个数据库中共检索到1087篇文章,按照系统综述和元分析的首选报告项目指南(PRISMA)进行筛选整理后最终得到51篇文章
/////    

Part.3

结果与讨论


1.译前编辑和机器翻译总体研究趋势

- 总体来看,1990-2023 年间译前编辑和机器翻译的研究呈现一定程度的波动,但总体呈上升态势。


- 从内容上看,译前编辑和机器翻译的研究主要分为三个时间段:

(1)2012年以前,主要聚焦自动译前编辑工具的研发。

(2)2013-2018 年,主要探索译前编辑对统计机器翻译或基于规则的机器翻译的影响。

(3)2019-2023 年,主要聚焦译前编辑对NMT的影响。


图1 译前编辑和机器翻译研究文献分布(1990-2023)

2. 关键词共现分析

- 本文在51篇文章的关键词基础上构建共现矩阵,将其转化为成共现网络绘图工具Gephi可识别的图表,最终生成了译前编辑和机器翻译研究的关键词共现网络图(图2)。


- 由图可知,1990-2023 年间译前编辑和机器翻译研究所聚焦的热点为控制语言、译后编辑、机器翻译类型、译前编辑规则和翻译质量评估等。


图2 译前编辑和机器翻译研究关键词共现网络图

3. 译前编辑和控制语言

- 译前编辑和控制语言(controlled language)存在部分重合,其定义均提及在用机器翻译系统翻译原文之前,对原文进行编辑,从而提高机器翻译质量。二者在多个方面存在重要差异(见表1)。

表1 译前编辑和控制语言在概念上的差异

4. 对译后编辑的影响

- 译前编辑有助于缩短译后编辑时间,但目前并无证据表明译前编辑能降低译后编辑的纠错量。采用不同的文本材料、语对、机器翻译系统和译前编辑规则,有时反而会导致译后编辑出现的错误增多。


5. 机器翻译系统

- 在采用了基于规则的机器翻译的研究中,译前编辑显著提高了机器翻译的质量,并降低了译后编辑的时间成本及技术投入。


- 在采用了基于短语的统计机器翻译系统的研究中,大部分经过译前编辑的原文内容能够被机器准确地翻译。


- 在采用了神经机器翻译(NMT)的研究中,译前编辑对NMT的影响较为不稳定。在部分文本中,译前编辑的确能提升NMT的质量,但另一些文本中则对NMT无影响甚至导致负影响。部分研究还发现译前编辑降低了NMT错误的数量,但术语的错误并未减少。


6. 翻译质量评估

- 译前编辑的评估方式包括自动评测、人工评测和时间技术投入测量的手段。


- 自动评测指标的主要目的是对比机器翻译的文本和专业译员提供的参考译本。译前编辑和机器翻译研究中常用的自动评测指标为BLEU和TER,二者均为基于词汇相似度的机器翻译质量评估。BLEU的评分基于机器翻译和专业译员给出的译本之间的相似度,相似度越高则分值越高。TER则是指为确保机器翻译文本在语义上同正确文本一致所需要对机器翻译文本进行调整的次数。


- 除自动评测指标外,译前编辑和机器翻译的研究大多都采用了人工评测,多数评测基于李克特5级量表进行(李克特5级量表是一种常见的心理问卷,每一组陈述有“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意”五种回答)。


- 除此之外,机器翻译的错误率和时间技术负荷也被用来评测译前编辑规则的有效性,还有研究则通过测量译后编辑中所投入的时间和技术来间接评估译前编辑的效果。


7. 小结

(1)目前,译前编辑的相关研究主要聚焦于主要聚焦译前编辑对NMT的影响。


(2)译前编辑的应用范围已从技术和新闻文本扩展至对话和视听材料。


(3)译前编辑在大多数情况下能提升各类机器翻译的质量和译后编辑的效率,尽管某些编辑类型可能对 NMT 无效或产生负面影响。


(4)评估译前编辑效率时,研究者采用了包括自动或人工的机器翻译评测手段在内的多种方法。

/////

Part.4

结语和反思


译前编辑对提升机器翻译效果意义重大,该研究通过统计分析手段总结了译前编辑的发展历程及研究结果,向读者展示了译前编辑如何影响机器翻译及译后编辑。不过,本文主要聚焦于译前编辑对不同机器翻译系统的效果,对于译前编辑的方法提及较少,并未关注不同译前编辑方法是否会也对翻译效果产生影响。


目前的译前编辑研究均以基于规则的机器翻译、基于统计的机器翻译以及NMT三种机器翻译系统为主。但近年来,由OpenAI公司开发的ChatGPT也在翻译方面展现出巨大潜能,针对ChatGPT的译前编辑研究却还有所欠缺。在本文中,作者认为译前编辑的未来研究方向包括关注单个译前编辑规则的有效性、运用眼动或脑电设备进行译前编辑评估、开发自动译前编辑软件或工具等。而小编认为,关注ChatGPT的译前编辑方法及效果同样也应成为研究重点。与此同时,正因为目前机器翻译系统的迅速发展,在未来的翻译技术教育中,根据不同的机器翻译系统进行译前编辑能力培养应成为一大重点。


参考文献略,欢迎点击“阅读原文”进入知网查阅该文章。
特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。


- END -



翻译技术教育与研究——机器翻译译后编辑专题组致力于普及机器翻译译后编辑(MTPE)相关知识,追踪国内外机器翻译译后编辑教学与研究动态!

原文作者:刘昱呈

推文编辑:赵恩婷

指导/审核:肖志清  王雪红

项目统筹:李鸣晨

资讯推荐


现代人应有何种信息素养

▶ MTPE专题推文机器翻译译后编辑 | 《基于神经机器翻译的科技文本译后编辑模式研究》文献推介机器翻译译后编辑 | 人工智能时代的译后编辑能力研究机器翻译译后编辑 | 《译后编辑及其研究简史》文献推介机器翻译译后编辑 | Lynne Bowker机器翻译素养机器翻译译后编辑 | 《ChatGPT时代机器翻译译后编辑能力培养模式研究》文献推介机器翻译译后编辑 | 《国际机器翻译译后编辑认知研究路线图(2011—2021)》文献推介机器翻译译后编辑 | 《译后编辑的能力结构与课程设置——基于国外译后编辑课程的前沿分析》文献推介机器翻译译后编辑 | 《翻译修改与译后编辑》书籍推介2机器翻译译后编辑 | 《翻译修改与译后编辑:行业实践和认知过程》书籍推介机器翻译译后编辑 | A short guide to post-editing 书籍推介 9机器翻译译后编辑 | 《机器翻译译后编辑》文献推介 (上)机器翻译译后编辑 | A short guide to post-editing 书籍推介 8机器翻译译后编辑 | A short guide to post-editing 书籍推介 7机器翻译译后编辑 | A short guide to post-editing 书籍推介 6机器翻译译后编辑 | A short guide to post-editing 书籍推介 5 机器翻译译后编辑 | 《人工智能辅助译后编辑新方向——基于ChatGPT的翻译实例研究》文献分享机器翻译译后编辑 | A short guide to post-editing 书籍推介 4机器翻译译后编辑 | A short guide to post-editing 书籍推介 3机器翻译译后编辑 | 《机器翻译视角下的翻译本质》文献分享机器翻译译后编辑 | A short guide to post-editing 书籍推介 2机器翻译译后编辑 | A short guide to post-editing 书籍推介 1

继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存