查看原文
其他

浙大东方论坛|刘海涛:大数据时代的语言研究——距离与方向

刘益光 应用语言学研习 2022-06-09

欢迎点击上方关注我们,欢迎转发此文

本文来源:浙大东方论坛微信公众号,2016-12-30  



点击上方可以订阅哦


2016年12月29日下午,浙江大学东方论坛“大数据+人文社科”系列讲座第一讲在紫金港校区图书馆三楼国立浙江大学厅举行。国际世界语学院院士、浙江大学求是特聘教授、爱思唯尔2014、2015年“中国高被引学者”刘海涛教授为大家带来了一场名为“大数据时代的语言研究:距离与方向”的精彩讲座。在为时两个小时的讲座中,刘海涛教授介绍了如何采用经过句法标注的真实语料(大数据)作为资源,以依存距离和依存方向为手段探究语言的普遍性和独特性,内容引人入胜,讲解风趣幽默,堪称一场学术盛宴。浙江大学社会科学研究院副院长胡铭教授主持了本次讲座。

讲座伊始,刘海涛教授指出大数据正在深刻改变我们的生活以及理解世界的方式,与此同时,语言学研究也在经历着重大的转向,即从传统的艺术与人文学科转向现代的认知与生命科学,其研究方法也正在经历从内省法向实验方法的转变。因此,语言学研究需要以真实的自然语料为材料,利用大数据的方法,探究语言的结构及演化规律。基于此,刘教授认为中国语言学研究者应该将中国语言学的国际化以及语言学研究的科学化作为奋斗的目标。

随后,刘海涛教授从依存距离与人类认知、依存方向与语言类型学、复杂网络与语言形态学三个方面介绍了其团队在追求语言学研究国际化、科学化过程中进行的尝试和取得的成果,充分展现了数据驱动语言研究的魅力。

依存句法是一种以句子支配词与从属词关系作为句子分析基础的语法。为了进行基于(大)数据的句法研究,首先需要对句子进行句法标注,形成句子的“树形结构图”,而大量的“树图”就组成了“树库”。所谓依存距离即支配词与附属词之间的距离,依存距离均值可以在一定程度上反映分析句子的难易程度,即依存距离越大,句子分析就越难。基于此前提,刘海涛教授与其团队成员收集建立了包含全世界20种语言真实文本的依存树库,同时随机生成了两种不符合语法的文本,通过对比自然语言与随机语言的平均依存距离探究语言内在的规律。在世界上首次通过多语言的真实语言数据发现,依存距离最小化可能是人类语言的一个普遍规律,而语法和人类认知机制在限制语言依存距离过程中发挥了重要作用。这是一个振奋人心的研究成果,不仅发现了人类语言的普遍规律,而且在语言与人类认知之间建立了联系。 

值得一提的是,该研究成果用英文发表于2008年,当时处于世界领先地位,是中国语言学研究国际化的一次成功尝试。直到2015年,美国麻省理工研究团队才出现了类似的研究。随后,刘海涛教授团队并未停下脚步,他们相继探究了句长、语体、标注体系、文本内容等对依存距离的影响,完善了该领域的研究,使其成为一个完整的体系。

在现代语言类型学中,语序是对语言进行分类的重要依据,但相关研究大多采用举例论证的方法,缺乏大量真实语料数据的支持,而且结论太过绝对化。刘海涛教授指出依存距离正负能够显示出句子的依存方向,从而表明句子究竟是支配词前置还是后置。基于此,刘海涛教授利用20种语言的大规模真实语料,统计不同语言支配词前置和支配词后置的比例,在世界上,首次发现语序类型是一个连续统,开辟了用大数据进行语言类型学研究的新路子。

20种自然语言依存方向比例图

维基百科对此研究评价极高,称其“为现代语言分类学提供了崭新而先进的方法”(This study provides us a novel and advanced approach for modern language typology)。

在语言学研究科学化过程中,刘海涛教授指出大数据同样发挥了重要作用。复杂网络是一种新兴的研究方法,在众多科学领域应用广泛,同样可以应用于语言学研究。由于斯拉夫语族中的语言大多语序灵活,因此难以通过语序对其进行分类(类型)研究。而借助复杂适应性网络模型,可以借助大数据对斯拉夫语进行形态层面的研究,弥补语序类型学指标的不足。

讲座最后,刘海涛教授为大家讲述了学科分类的历史,并认为“大数据时代”可能会再一次模糊学科的分界,给我们提供了学科融合的良好契机。因此,他鼓励各位语言学研究者能够把握机遇,充分利用大数据开展人文社科类研究,只要掌握正确的方法,中国的语言学研究也能走在世界的前沿。

胡铭教授对刘海涛教授的报告做了简短总结,指出这是一场有关方法论的讲座,对人文社科的每个学科都有很大的启发,也有助于打通各个学科,实现融合发展。胡铭教授也十分赞同科学化、国际化的研究目标,鼓励大家使用实实在在的数据夯实研究,并且积极与世界接轨。

至此,两个小时的讲座圆满结束,大数据与语言学研究的深度融合让参加讲座的专家、学者、老师和同学们印象深刻,相信也会对他们日后的研究提供崭新的思路。

相关文献延伸阅读(爱书人指南)

敬告:本公号友情提供相关书讯或书目索引链接,

以便爱书人前往第三方平台自行选购




语言学图书精选推荐


推荐阅读:
汉语国际教育怎么办?大咖云集出谋划策(李宇明、刘利、王甬、吴应辉、王辉……)
图说孔子学院新机制 新模式 | 2020孔子学院合作论坛主旨发言
推荐 | 第二语言教学法主要流派全收录(值得收藏)
聚焦 | 第八届高等学校科学研究优秀成果奖(人文社会科学)评选结果揭晓(附部分英语类获奖名单)
重磅 | 2020中国学术期刊影响力指数及影响因子排行榜(语言文字)
教育部人文社科研究项目语言学立项趋势及申报建议 ( 2009-2019)
“当代认知科学之父”乔姆斯基教授(转载五道口站特辑)
重磅 | 全国高校拟新增语言类专业硕博学位点名单(语言服务最新整理版)
新书 | 王军:《衔接的认知语用研究》 商务印书馆
【高端笔谈】外国语言文学学科高质量发展的路径
邢向东:论语言研究中的问题导向
郑艳群:国际外语教育技术研究动态及热点分析
国内生态学视角外语教学的特征和趋势 ——基于CiteSpace的可视化分析
以深度教学促进外语课程思政 |《中国外语》2020(5)
干货 | 国家标准:公共服务领域英文译写规范(附电子版下载)
教育部高教司司长吴岩:新文科学科没做好,高等教育不能说好
冯志伟:当前计算语言学发展的几个特点 | 中国社会科学网
冯志伟:我的2020年总结
重磅 | 2020中国学术期刊影响力指数及影响因子排行榜(语言文字)
聚焦 | 第八届高等学校科学研究优秀成果奖(人文社会科学)评选结果揭晓(附部分英语类获奖名单)
圣杯就在眼前:“现代语言学之父”乔姆斯基的批判与期望
世界语言谱系及语种概览 | 语言学微课堂
陈平 | 理论语言学、语言交叉学科与应用研究:观察与思考
马会娟:中国翻译理论研究回顾与展望
会讯 | 第12届国际语料库语言学会议征稿
会讯 | 国际中国语言学学会第28届年会第一号征文通知
讲座回放 | “中国外语战略研究中心讲坛”10月学术讲座
徐锦芬 曹忠凯:国内外外语 /二语课堂互动研究
韩晔 高雪松 | 国内外近年线上外语教学研究述评:理论基础、核心概念及研究方法
2021 年同济大学外国语学院博士研究生招生专业目录
近十年国际语言政策与规划研究热点与趋势——基于Scopus数据库的可视化分析
中国英语教育四十年反思及其对新文科背景下英语专业建设的启示
会讯 | 首届构式语法研究高层论坛(1号通知)
会讯 | 第四届“全国学科英语研究学术讨论会”通知
会讯 | 第六届“全国话语研究高层论坛”征文通知
报告全文 | 教育部高教司司长吴岩:积势蓄势谋势 识变应变求变 全面推进新文科建设
王学典:何谓“新文科”?
新文科建设|新文科建设宣言。
海外中国学研究机构名录一览表(2020年版)
干货 | 3000个常见公共场所英语标示!(国家英文译写规范)
李宇明 郭熙 周洪波 | 中国语言生活研究十五年
中山大学外国语学院常年招聘海内外英才
招聘 | 上海外国语大学招聘教学科研人员及师资博士后
讲座视频 | 沈骑:后疫情时代的国家话语能力规划
张伟年 段宛云等:战略传播学视阈下特朗普涉华新冠肺炎污名化推特分析
拜登胜选演讲全文 (英文+中文+西班牙语 三语对照)
语言专业师生必看的10部电影(附观看链接)
蔡基刚:应急语言服务与应急语言教学探索
孔子学院:践行《世界文化多样性宣言》的东方典范
王春辉:孔子学院三思 |《国际教育交流》2020年10月(总第126期)
大汇总 | 第1 - 10批推荐使用的外语词规范中文译名(附Word版下载方式)
中国外语院校本科教学质量报告(2019)
《大学英语教学指南》(2020版)发布会隆重举行(含视频回放)
何莲珍:新时代大学英语教学的新要求——《大学英语教学指南》修订依据与要点
向明友:顺应新形势,推动大学英语课程体系建设—《大学英语教学指南》课程设置评注
文秋芳教授:中国外语教学70年,未来道路究竟向何方?
博后招聘|北京航空航天大学外国语学院招收博士后
南开大学外国语学院教职工招聘与人才引进公告(2021版)
重磅 | 2020软科中国最好学科排名出炉(中国语言文学 & 外国语言文学)
书讯 | 利奇《语用学原则》中译本出版
Fodor《心理语义学》:在心灵与语言之间
文秋芳教授早年专访:学习是一辈子的事 | 21世纪英文报
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点
束定芳:大学英语教学与国际化人才培养 |《外国语》2020年第5期
会议征稿 | 面向教育应用的自然语言处理研讨会
陈力:西方现代教学理论真的反对语法教学吗?
接触理论:生成语法研究的新进展 | 中国社会科学报
荐书 | 徐烈炯著《生成语法理论:标准理论到最简方案》
合辑 | 双语版《美丽中国》( Amazing China ):1-58集(全)
文科生可以学会的Python——雷蕾《基于Python的语料库数据处理》
对外汉语专业常用资料库大全
收藏!76种学术研究必备科研工具
梁茂成 | 语料库语言学研究的两种范式:渊源、分歧及前景
麦蒂森论翻译 | 系统功能语言学与翻译研究
冯志伟教授谈计算语言学 | 中国社会科学网访谈
荐书 | 北京大学出版社语言学图书书单
视频 | 听胡壮麟教授讲《语言学教程》那些事儿
中国访谈丨北京外国语大学校长杨丹:培养跨文化交流引领者
戴炜栋 胡壮麟 王初明等:新文科背景下的语言学跨学科发展
戴炜华  吴国玢:论语言学的跨学科研究
大师课程 | 乔姆斯基等:语言,思维和大脑
王缉思:浅谈区域与国别研究的学科基础
21世纪以来中国的太平洋岛国研究:历史、现实与未来
程琪龙:语言研究的超学科意识 |《外国语》2020(2)
语用翻译学——中国文化走出去的出路
申丹 | 西方文论关键词:隐性进程 |《外国文学》2019(1)
视频 | TED Ed:语言进化编年史
吴应辉:汉语国际教育面临的若干理论与实践问题
李建波 李霄垅 | 外国文学和国别与区域的交叉研究:国情研究专家的视角
陈坚林:试论人工智能技术在外语教学上的体现与应用
荐书 | 德古意特认知语言学研究丛书+应用丛书(13种)
外语教学类高被引论文排行榜 TOP 10
语言学类高被引论文排行榜 TOP 10
“国家形象研究”高被引论文排行榜 TOP 10
郭英剑:对英语专业的不当批评,可以休矣
蔡基刚:学术英语? 通用英语? 对学术英语再认识
高雪松 : "人文 vs. 工具" 也许是过去四十年外语教育大辩论中的伪命题
中英文学科、专业名称对照
多位著名专家学者分享英语学习方法
乔姆斯基:三个讲座,国内少见
视频 | Metaphors We Live By 内容导读 (我们赖以生存的隐喻)
多模态话语分析:以“疫情防控外语通”为例
《牛津英语》语法大讲堂(视频全集)
所以,什么是语言学?| 语言学微课堂

扫码关注,即可获取最新入群二维码

目前已有2.04万语言文学、国别区域

研习者关注↑↑↑本公众号,

欢迎加入我们,交流分享,共同学习!

一个,点亮在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存