查看原文
其他

刘世界:案例驱动的大语言模型赋能语言数据挖掘



2024年7月27日下午14点,2024年暑期大语言模型应用实战研修班第四讲课程正式开始,本期课程由上海海事大学刘世界博士主讲,题为《案例驱动的大语言模型赋能语言数据挖掘》

刘世界老师的分享围绕大语言模型赋能语言数据采集清洗、多维标注、机器建模、统计分析四个方面依次展开,详细介绍了大语言模型发展概况、语料库建设、数据加工流程等内容。刘老师依托个人丰富的实战经验,通过案例驱动的方式,深入剖析了大语言模型和语言数据是理论验证和应用开发的重要资源。在分析这些前沿技术对高校语言学、翻译学教育以及就业市场影响的同时,提出自身关于语言理论建设、翻译研究、语言教学和自然语言处理等领域实证支持的思考。

此外,刘老师还带领学员实操如何应用大语言模型和语言数据,与学员分享Python入门基础知识、中文自然语言处理工具LTP4.0、常用标注工具BRAT、LDA主题建模、语言数据采集技术等技术资源。刘老师的分享提升了学员对大语言模型和语言数据的理解与实操能力,加深了学员对于语言结构、使用规律、变异特征以及跨语言现象的认识。这不仅是一次对数据系统分析的指导,更是对语言数据挖掘富有深度思考模式的突破探索!

特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。


转载来源:语言服务行业

转载编辑:许思哲

审核:王贇 宁静



文章推荐:


收藏|翻译专业学生翻译技术学习推荐书目

【01】听说Perplexity改变外语教育?你会用吗?

【02】Microsoft Office和WPS中大语言模型插件初探

【03】国内大语言模型对比——基于翻译问题或翻译案

【04】教你如何使用 Copilot 

【05】ChatGPT 和 Gemini 达到专八水平了吗?

【06】国外主流翻译APP

【07】国内主流翻译APP工具

【08】在Trados中利用TM做预翻译

【09】平行语料库在口译实践中的应用

【10】语料库探索之语料对齐及分词赋码

【11】语料处理之语料采集与清洗 

【12】如何创建应用于Trados的术语库?

【13】如何使用Trados建立翻译记忆库?

【14】国内外常见语料工具一览

【15】翻译人员不容错过的5个权威术语库

【16】国内外常见CAT工具一览

【17】AntConc简介及索引工具介绍(一)

【18】Quicker使用技巧

【19】Everything:一款“秒”搜文件的神器

【20】Sketch Engine探索第一弹来袭!

【21】LancsBox:语料库研究者的必备工具

【22】TermWiki:术语检索利器

【23】ABBYY FineReader PDF:文档识别小帮手

【24】ChatGPT + Word = 高效办公

【25】如何利用聊天机器人制作双语术语表

【26】 ChatGPT在译前准备中的应用——术语准备

【27】投喂语料,提升译文质量

【28】(一)结合ChatGPT的译前编辑初探

【29】ChatGPT最新接入word方法(完美debug)

【30】AI外语写作助手,助力高效写作

【31】探索ChatGPT在翻译过程中的应用

【32】中科院学术优化本地部署


如您喜欢我们的内容,欢迎您点赞、在看、转发,更多问题可后台留言小编哦



资讯推荐


AIGC时代的翻译技术沙龙

点个关注再走吧

继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存