查看原文
其他

技术应用 | ChatGPT 和 Gemini 达到专八水平了吗?

苏雨 翻译技术教育与研究
2024-09-09


大语言模型翻译质量评测


01

评测模型简介



1. ChatGPT 4.0

     ChatGPT 4.0是OpenAI开发的一种先进的人工智能聊天机器人。它是基于GPT-4语言模型的升级版本,具有强大的语言理解和生成能力。

2. Gemini-Pro

     Gemini-Pro是Google 发布的Gemini 1.0——大模型系列的其中一个版本,因为里面包含了 3 个不同量级的优化版本:Ultra、Pro 和 Nano,分别对应不同的使用场景和需求。Gemini Pro 是性能最佳的模型,广泛适用于各种任务。


02评测方式



     本文旨在利用ChatGPT4.0和Gemini-Pro两款大语言模型,对指定的中文文本进行翻译,以评测两种模型的文字翻译能力。本人将依据英语专业八级翻译评分标准对模型的翻译结果进行综合评估。另外,为了提高评价的客观性,本文还将提供模型间的互评结果。

03大语言模型译文对比

1. ChatGPT 4.0译文





图1 ChatGPT4.0生成译文


2. Gemini-Pro译文





图2 Gemini-Pro生成译文


04评价


1. 笔者评价——参照英语专业八级翻译汉译英评分标准


评价ChatGPT4.0译文:

      该译文已将原文信息全部传达,语气和文体风格与原文一致,句式结构优美,选词基本妥帖,英语表达地道。但在本文翻译中部分用词不当,需要注意:比如“中药”,英文可以表达为Traditional Chinese Medicine,而ChatGPT4.0使用的herbal remedies经Google查证(附图)只表示“草药”,不能全部覆盖“中药”的意思,在这一点上ChatGPT4.0的结果有待查证,而Gemini-Pro给出的答案更符合语境。以100分作为标准,笔者建议给到ChatGPT4.0的打分是95分,ChatGPT4.0在理解语境意方面可以继续提升,以保证其在选词方面更加妥帖。

评价Gemini-Pro译文:

      该译文已将原文信息全部传达,语气和文体风格与原文基本一致,句式合理,选词基本妥帖,英语比较地道。Gemini-Pro的译文没有明显的问题,但整体表达较为平实朴素,需要继续打磨语言,提升英语句式结构的使用能力,在遣词造句方面深入训练,以100分作为标准,笔者建议给到Gemini-Pro的打分是90分。

      综上,两种大语言模型的翻译结果都符合专八翻译评分的“优秀”标准,相较而言,ChatGPT4.0语言形式更多样,语言更地道。然而,在此篇翻译中,ChatGPT4.0出现语义理解不准确的现象,而Gemini-Pro的译文没有明显的问题。







图3 英语专业八级翻译评分标准





图4 查证TCM与Herbal Remedies的区别


2. ChatGPT4.0对Gemini-Pro译文的评价及建议






图5 ChatGPT4.0对Gemini-Pro译文的评价





图6 ChatGPT4.0对Gemini-Pro译文的建议


3. Gemini-Pro对ChatGPT4.0译文的评价及建议






图7 Gemini-Pro对ChatGPT4.0译文的评价





图8 Gemini-Pro对ChatGPT4.0译文的建议

05总结



     根据以上ChatGPT4.0与Gemini-Pro的译文、互评及建议可以看出尽管前者在给定文本的翻译中出现有待查证之处,但其在遣词造句以及文本理解方面略胜一筹,并且ChatGPT4.0在提建议方面更加细致、可参考性相对更高;而Gemini-Pro尽管译文语言基本符合原文,但译文表达平实朴素,可提升空间较大;并且在给出“是一篇高质量译文”的评价后,对于“提供建议”的要求给出了在笔者看来为了提建议而提建议的回答,当然以上均为笔者基于给定文本的个人观点。

     综上,笔者认为ChatGPT4.0与 Gemini-Pro两种大语言模型在任务完成度方面都是值得肯定的,包括译文的流利度、语法词汇的准确性等。通过以上的简单测评,我们应该思考,面对两版不同的译文,应该如何发挥译者的主观能动性。笔者认为应当不断查证、不断求索,力求去粗取精、去伪存真,不断完善、丰富模型的知识体系,从而提升译者的工作效率,实现“人机合作,共同进步”的目标。



特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

- END -



原创来源:北外CAT课程展示-苏雨

推文编辑:苏雨

审核:宁静  王贇  

资讯推荐


AI时代口译员信息素养构成

▶ 技术与工具

口译系统

国外主流翻译APP

国内主流翻译APP工具

平行语料库在口译实践中的应用

国内外常见术语管理工具

翻译必备术语库和语料库合集(附网址)

翻译必备的计算机翻译辅助软件(附网址)

AntConc:实用的本地语料库检索工具

TREX:有海量例句、丰富语料的在线词典

Netspeak:一款免费的单词搭配检索工具

WantWords反向词典,内含开发团队公开文档

Cymo Booth:同声传译员的专属虚拟同传间

MateCat:一款免费的在线CAT工具

Visuwords:可视化在线词典,帮你一键构造记忆宫殿

Linggle:语料+搭配检索工具(实操演示)

Ludwig: 地道英文写作辅助神器,告别中式英语

Reverso:辅助写作与翻译神器


▶ 国际语言服务动态

| 翻译公司篇 | TransPerfect简介

| 翻译公司篇 | 全球第2名 RWS如文思

| 翻译公司篇 | “收购狂魔”Keywords Studios

| 咨询机构篇 | Nimdzi Insights简介

| 咨询机构篇 | Slator 简介

| 咨询机构篇 | CSA Research 简介

| 行业机构篇 | 国际翻译家联盟FIT

| 行业机构篇 | 美国翻译协会ATA

| 行业机构篇 | 加拿大联邦翻译局 Canada's Translation Bureau

| 翻译院校篇 | 明德大学蒙特雷国际研究学院(MIIS)

| 翻译院校篇 | 格拉斯哥大学

| 翻译院校篇 | 埃塞克斯大学

| 翻译院校篇 | 利兹大学

| 热点追踪 | ChatGPT的伦理问题(上)

热点追踪 | ChatGPT的伦理问题(下)

| 热点追踪 | GPT-4面世——AI引领语言行业革新


专访

李长栓:ChatGPT在翻译中的崭新角色

袁煜:挑战自我,迈出舒适区

王均松:人工智能时代的翻译:技术驱动的变革与未来展望

王树槐:GPT与小说翻译批评:GPT与文学翻译之二

王树槐:GPT与诗歌翻译批评:GPT与文学翻译之一

苏秋军:AIGC背景下的MTI学科建设

王华树:译者数字素养研究亟需加强,打造翻译人才新优势

沈澍:AIGC是敌是友?翻译领域的机遇与挑战

宁静:长缨在手,敢缚苍龙

崔启亮:机器翻译对语言服务企业有多大作用?

韩林涛:文科生如何学习机器翻译?

魏勇鹏:机器翻译质量评估为什么重要?

徐彬:熟练掌握翻译技术,就能做出漂亮的活儿

曹首光:如何打造一款受欢迎的机器翻译产品? 

李梅:机器翻译对未来翻译教育有何影响?

周兴华:高校翻译教师如何学习翻译技术?

丁丽:译后编辑人员与译者身份是否对等?

卢家辉、陈晨:口译员在远程口译中面临的主要问题


▶ 行业洞察

2021年语言服务行业回顾与展望

2022年全球百强语言服务商榜单

2022年翻译行业将迎来哪些新变化

后疫情时代,语言服务行业如何发展转型?

何钦:中国电影对外译介的现状与思考

冯志伟:关于机器翻译行业发展的三点建议

张霄军:伦理视角下,机器翻译的能与不能

黄友义:如何突破中外文化差异,让世界更了解中国?

韩林涛:与ChatGPT共舞


▶ 教育创新

李长栓:MTI论文千篇一律,如何破局?

王华树 刘世界:数字人文视域下译者数字素养研究:内涵、问题与建议

王华树 刘世界:人工智能时代翻译技术转向研究

王华树 刘世界:智慧翻译教育研究: 理念、路径与趋势

曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究

李梅:如何给“技术小白” 开设计算机辅助翻译课程?

实践导向的MTI人才培养模式——以对外经济贸易大学为例

数字化口译教学资源建设:欧洲经验与启示

如何将翻译项目管理模式应用到CAT教学课堂中?


继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存