查看原文
其他

学科交叉是发现语言规律的利器

刘海涛 计量语言学
2024-09-04

小编按:学科交叉融合是当前学术发展的重要趋势,不仅有利于培养创新型、复合型人才,更有利于推动社会经济的高质量持续发展。习近平总书记在全国科技创新大会和两院院士大会上,曾多次强调培育交叉学科的重要性和紧迫性。最近,我国在交叉学科研究的制度方面又有新的重大举措,教育部设置了“交叉学科”门类(门类代码为“14”),国家自然科学基金委也适时成立“交叉科学部”。另外,党的十九届四中全会明确将数据看作一种新型的生产要素。对于任何与时俱进的学科而言,如何基于数据开展交叉学科研究成为当务之急,语言学作为一门“领先学科”自然也不例外。从即日起,本号开始推送浙江大学刘海涛教授团队的一组科普短文,以期充分体现语言研究的数据驱动本质和语言学内在的交叉学科性质。这组短文原刊发于20151113日《浙江大学报》第576期第3版,今天推送的是刘海涛教授的文章“学科交叉是发现语言规律的利器”。

 



语言是人类交际的工具,也是知识的容器与文化的载体,更是洞察人类天性之窗。正因为如此,自古以来,人们对于语言结构模式与演化规律的探求就没有停止过。

 

语言研究天生就具有交叉学科的特质


现代语言学认为语言是一个复杂适应系统。如果语言是一个系统,那么我们就需要采用研究系统的一般方法来研究语言;相对应的,如果语言是一个复杂适应系统,那么我们就需要采用研究复杂适应系统的方法来研究语言。

  理论语言学家喜欢说语言是一个符号系统,但却常常忽视了一点,即语言实际上是一个由人驱动的系统,即:语言的结构与演化,会受到人的认知与人所处社会的影响。所有这些,使得语言研究从本质上就具有多学科的性质与交叉学科的特质

  遗憾的是,当前,我们很难发现从系统科学角度研究语言规律的成果。这对于全面理解语言系统的运作机理、通过语言之窗来洞察人之天性是极为不利的。我们认为,科学方法与理论的缺失,可能是导致语言学家在此方面研究成果不多的主要原因。

  近年来,随着其他学科对于系统研究的深入,出现了不少通用的研究工具和方法,这使得语言学家采用实证的方法研究语言复杂系统成为可能

从系统的角度研究语言,可从以下两方面展开:一是将语言视为一个含有多个子系统的大系统,研究子系统内部各个组成要素之间的关系以及子系统之间的协同关系,二是研究语言系统的整体或涌现特征。前者是现代计量语言学,特别是协同语言学的主要目标,而采用复杂网络方法可以更好地对语言系统的整体特性进行研究。由此可以看出,如何借鉴其他学科的方法来解决语言学中的问题,发现我们用语言进行交流过程中的各种规律,是交叉学科语言研究首先需要面对的问题。


 

探究语言的运作与演化规律


为了鼓励从学科交叉来探究语言的运作与演化规律,国家社科规划办在2011年首次设立了跨学科类的重大招标项目,我们有幸在当年获得了其中的《汉语计量语言学研究》课题。

  这一课题旨在挖掘人类语言的结构与演化规律,探究汉语和汉字系统在人类语言与文字系统中的特点与共性,研究语言规律与认知结构的关系。我们也希望通过这个项目的开展对中国语言学的国际化与语言研究的科学化有一个实质的推进。

  经过课题组数十位研究者的努力,我们在以下几个方面取得了一些进展。

  一是从真实语料中探寻人类语言的普遍规律。

  语言被视为洞察人类天性之窗。这是因为语言是人类认知机制的产物,语言规律在很大程度上受到人类认知规律的约束。因此,探索语言的普遍性可能有助于发现人类认知的普遍规律。这也是语言学能够成为认知科学核心元素的重要原因。

  然而,长久以来,由于方法与资源的限制,传统的语言学研究在这一方面很少有经得起检验的成果。很多所谓的普遍性研究大多是存活在语言学家大脑中的构拟与假设,很难得到基于实证的科学验证。

2008年,我们采用20种语言的真实语料在世界上首次发现依存距离最小化可能是人类语言的普遍特征。这一成果发表在当年的国际认知科学协会的会刊《认知科学学报》上。近年来,我们又进一步研究了影响依存距离最小化的各种因素,这些研究对于我们理解语言与认知的关系有极大的帮助,推动了相关领域的发展。

  词是构成语言系统的基本单位之一,也是体现“语言是有限手段的无限运用”理念的重要单位。词有许多属性,如长度、使用频度、多义的程度、与其他词结合的能力等。词的这些可计量的属性以及它们之间的关系构成了语言系统的词汇子系统。就词汇系统而言,对词汇各种属性之间的动态协同关系的探究尤为重要。

  根据对人类语言的考察,一个长词如果其使用频率突然增加,则会很快变短。在现代汉语中,所谓的限值一般大约为3个汉字。这一点,我们很容易从“卫生与计划生育委员会”变为“卫计委”等例子看出。除此之外,短词也更可能多义,与其它词结合的能力也会更强等。

  这些从大规模人类语言材料得出的统计规律,不仅可以解释人类语言词汇子系统的运作机理,也可以对词汇的演化做出科学的预测。而可否对所研究现象进行解释与预测是衡量一个研究领域是否科学的重要指标。我们在这方面的研究成果大多发表在了国际知名的语言学刊物上,丰富了人类对于语言系统的认识,加深了人类对于与自身密切相关的语言规律的理解,切实推动了中国语言学的国际化水平。

  二是通过语言网络推动语言分类研究的科学化。

  对事物进行分类,也是科学研究的目标之一。对语言的分类以及语言类型的研究,更是语言学家一直以来孜孜不倦努力的方向。然而,由于技术手段的限制,目前的语言类型研究大多用的不是我们日常使用的语言,很多时候,语言学家的结论只是建立在为数不多的几个例句之上。

  为了提高语言类型研究的科学化程度,我们在世界上首次提出了从人类语言真实语料中提取语言类型指标的方法,用句子中两个具有语法关系的词之间的相对位置解决了语序相对固定语言的分类问题,用复杂网络方法解决了语序相对自由语言的分类问题,推动了语言分类(类型)研究的科学化。

  我们用自己提出的基于语言大数据的方法,解决了罗曼语族以及斯拉夫语族语言类型研究中的一些基本问题。这说明,在研究汉语过程中所发现的方法与理论也可以用来研究其他人类语言,充分显示了我们所提出的方法与指标的科学性与普适性。

  语言复杂网络是我们的另一个研究重点。通过语言网络,我们可以更好地对语言系统的整体与涌现特征进行观察与研究,弥补一般系统方法的不足。

  采用复杂网络手段,我们不仅解决了用语序指标难以对斯拉夫语族等语言进行分类的难题,而且也在世界上首次研究了语言系统中的词汇、句法、语义等子系统的整体特征与各个子系统之间的交互关系,加深了我们对于人类语言系统的整体认识。

  这篇文章于2014年初发表在国际知名语言学刊物Journal of Chinese Linguistics上,现为ESI社会科学类高被引论文。我们受邀为自然科学高水平期刊Physics of Life Reviews2014年影响因子为9.478)撰写的有关语言复杂网络的长篇评论也被列入2015ESI高被引论文榜单(生物学与生物化学类)。国际著名复杂网络学者Ferrer-i-Cancho认为,我们的这篇评论,“基于网络方法,定义了未来的语言学,正重构并统一理论语言学”。

  我们的理论与实践说明,从交叉学科角度来做语言学研究不但有助于我们更好地理解语言的结构模式与演化规律,有益于认识语言与认知的关系,也有助于推进语言学研究的科学化与国际化。毫无疑问,作为一种正在兴起的、涉及多种学科的语言学研究范式,还有许多问题需要解决,但可以肯定的是,这是一条有着光明未来的求索之路。


继续滑动看下一个
计量语言学
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存