学术前沿||理论语言学的实验研究

杨洋郑礼珊语言科学 2022-04-24

提要：本文综述了用实验来探究理论语言学议题的研究现状和趋势。文章首先举例说明了理论语言学和实验研究之间的常见误区，以及将理论应用于变量可控、现实可操作的实验范式所面临的挑战。接着，以两个自控步速阅读实验和一个声学实验的具体研究为例，评析了实验研究对理论语言学的两种贡献类型，一种是先理论后验证型，即当理论相对完善或者有明确预测的时候，实验研究主要充当一个验证的手段提供证据，往往是支持其中一种理论而驳斥另一种；另一种类型中理论建构与实验研究类似于鸡生蛋，蛋生鸡的关系，实验的结果可以反过来对理论进行修正，实验的数据也可以作为语言事实成为理论的一个新的起点。最后，本文展望了理论语言学的实验研究的发展前景。

关键词：理论语言学；实验；科学；界面

1.前言

语言学作为一门科学，语言事实与理论建构的关系与其他学科并无本质区别 (徐列炯 1997)。传统理论语言学更强调基于语言事实的演绎推理，采用的研究方法多为内省法，后来逐步通过问卷调查，或者语料库检索来扩大语言事实，从而使得基于语言事实建构的理论更加殷实、系统。理论的科学性体现在其对语言事实的解释力和可验证性上，因此，很早就有学者通过实验的方法来阐释和验证语言学理论、探究语言学议题。以音韵学为例，早在1949年，罗常培就在其《中国音韵学导论》中阐释了语音实验的价值：“解决积疑，可资实验以补听官之缺；举凡声韵现象，皆可据生理物理讲明”；实验语音学和后来的实验音系学也逐渐成为语言学的重要分支。以句法学为例，从上世纪60年代末开始，陆续有学者将句法学理论(如Chomsky 1965的很多开创性理论)通过实验来验证，抑或是探究grammar-parser之间的关系，即语法与句子加工之间的关系(Fodor et al. 1974等)。总之，这半个多世纪以来，随着语言学研究方法的进步和跨学科研究的发展，通过各种实验手段来探究理论语言学议题逐步发展为一个新兴的语言学领域，被称为实验语言学。

在本文当中，笔者着重探讨如何用实验的研究手段来探究语言学议题。实验的手段有很多种，例如，声学实验主要从物理角度进行分析，行为实验主要通过正确率和反应时来采集数据、反映语言事实，脑神经科学实验相对复杂，更加依赖先进的设备和技术，如事件相关电位(ERP)、脑磁图(MEG)、功能性磁共振成像(fMRI)等。谈到脑神经科学实验，笔者先限定一下讨论范围，因为语言结合脑神经科学实验有两种可能的研究方向，一种是通过研究大脑的心理过程来反映语言知识和规律，另一种是通过研究语言来反映大脑认知的机制(Poeppel & Embick 2005)，这两种研究方向虽然紧密相关但研究目的和途径不同，我们这里讨论的实验研究属于前者，即研究目标是语言，都在语言学框架之下。

本文的论述安排如下。第二节讨论理论语言学和实验研究之间的常见误区以及将理论语言学议题应用于变量可控、现实可操作的实验范式中面临的挑战。第三节讨论实验研究对理论语言学的两类贡献，一类是先理论后验证型，另一类中理论建构与实验研究类似于鸡生蛋，蛋生鸡的关系，实验的结果可以反过来对理论进行修正甚至重构，成为理论的一个新起点；笔者会通过几个具体研究来阐述这两种类型，以及如何设计可控、可操作的实验。第四节笔者总结全文，对未来理论语言学的实验研究的发展前景进行展望和评述。

2.理论语言学与实验研究之间的误区及挑战2. 1理论语言学与实验研究之间的常见误区

理论语言学旨在研究语言的规律和本质，建构语言知识模型，发展语言学理论，侧重于Chomsky (1986)二分范畴中的能力；而实验的相关研究，无论是词、句子还是篇章的理解抑或是产出，均要建立在具体的言语动态操作上，属于Chomsky (1986)二分范畴中的运用。尽管尚有不同声音，如Lewis & Phillips (2015)就质疑实验反映出来的语言加工心理表征是否与现存语言学理论模型有直接对应关系，但通常来说，学者在用实验的方法来探究语言学议题时，还是会有这样的共识：语言能力和语言运用是有对应关系的，即实验中被试的表现是被试语言能力和语言知识的具体运用，语言能力和语言运用有共同的认知系统(Pablos et al. 2018)。

尽管有这样的共识，理论语言学和实验语言学之间还存在不少误区。理论语言学家在建构理论上倾向于一种基于部分语言事实的演绎推理，观点比较丰富，形成一个面，而在一些注重实证研究的学者眼里常觉得用来建构理论的语言事实不足以支撑这么多理论观点。而实验语言学严格控制变量，一次实验通常只关注一到两个研究点，运用统计学等方法尽量保证证据的充足性、可信性和有效性，但在一些理论语言学家的眼中，这种研究浅显而片面，并无实质的价值。事实上，这些误区都是由于不了解对方学科性质造成的。任何人都无法做到对语言事实的穷尽性归纳，理论研究离不开演绎；而实验研究的科学性就体现在严格控制变量，用数据说话，于微处见真谛，无法做到面面俱到。

对实验研究的另一个常见误区是，认为方法论或者说实验设备越高级越好。选择合适的研究方法，是实验研究很关键的一步。实验设备的选择与想要回答的问题息息相关，绝不是越贵越好、越高级越好。以否定极项(NPI)的研究为例。理论研究表明，NPI(例如英文中的any)的出现需要句中有合适的算子或者允准项，例如否定(He did not buy any books.)、条件(If you buy any book, …)、疑问句(Did he buy any books?)等，具体的允准环境可参见Ladusaw(1983)关于downward-entailing environments的讨论、Giannakidou(2011)关于non-veridical contexts的讨论等。而当NPI没有出现在算子或者允准项的管辖域之内时，句子通常就不成立，例如*He bought any books. 围绕NPI需要哪些允准环境才能成立的问题，简单易行的在线判断行为实验就可以通过反应时和正确率提供答案(Lin 2017等)。在线的判断实验与离线的问卷调查相比，优势在于可以获取在线瞬时的数据、避免离线状态下被试对句子的过分解读。既然行为实验已经可以做出解答，为什么很多学者还会采用ERP、MEG等更复杂的实验手段来研究NPI呢?这是因为，要回答的问题不一样。行为实验可以确定的是NPI的允准受到特定句子条件的限制，但这种允准或者限制究竟是句法层面的还是语义层面的，还是都有呢?甚至有学者认为NPI的操作应该是句法、语义、语用三者的相互作用(Chierchia 2004)。这样的研究问题是行为实验无法回答的，可以通过ERP、MEG等实验的相关语义、句法表征成分来进一步探索NPI的允准和限制条件(Tesan et al. 2012; Xiang et al. 2016)。总之，实验设备并非越高级越好，而要根据研究问题，选择最合适的研究方法，遵循由简到繁的原则。

2.2以理论为导向的实验研究面临的挑战

实验研究的操作范式要尽可能变量可控、现实可操作，要在理论假设和实际的实验操作之间找寻一个平衡点，或者说是一个妥协(Pablos et al. 2018)。而这样一个妥协的过程，是实验研究最大的难点和挑战，究竟要控制什么?又要牺牲什么?我们还是以NPI的研究为例来讨论。

实验研究要遵循一个原则，即只根据研究问题来操纵想要验证或者观察的条件，其他因素尽可能控制住。例如，想通过一个在线句子判断实验来验证否定、条件和疑问句是不是都可以允准NPI，而没有这些允准条件的NPI句就不成立。通常来说，不同条件的语料设计要尽量做到最小对比，而最小对比的几个条件因为内容相似尽量不要被同一被试看到，即需要Latin Square Design (Hindmarch 2010)；每一个条件都要有足够的项目，要有足够的被试来做实验，保证统计结果的信度和效度；除了实验句/目标句，要设计数量大于或者等于实验句的填充句，即与实验目标不相关的句子，以防止被试觉察出实验规律、采取相应策略；实验的引导语究竟想让被试判断句子是否通顺(语义导向)还是合法(句法导向)，都要慎之又慎。

那么实验中面临的妥协或者牺牲又是什么呢?这又回到实验研究的实际操作上了。实验的设计是围绕研究问题展开的，但很多现实的因素也制约着实验，例如实验技术是否成熟，实验成本是否可接受，实验的时间长度是否合适，被试的年龄、体验感等都是要考虑的因素。在这些现实问题面前，有时要牺牲一些原本想要兼顾的东西，把目标放低一点。我们再以NPI的允准研究为例，来谈谈实验长度的问题。通读下来，NPI的ERP实验通常不会一次研究很多个允准条件(Xiang et al. 2016等)。我们知道，ERP的实验范式不同于行为实验，以视觉呈现为例，它需要被试全程佩戴一个采集数据的电极帽来阅读句子，并要求被试在实验过程中尽量保持不动以免影响头皮上微弱生物电的采集；ERP实验范式中句子通常逐词呈现，实验本身时间也会更长；为了保证数据的信度和效度，每一个条件的项目数和对应的填充句都有数量要求；再加上佩戴电极帽的时间和中间休息等，一个实验的总时长通常要1-2小时。这种情况下，如果再增加实验内容，无论从实验时间上还是从被试体验感上都是很难实现的。

除此之外，不少理论研究者认为实验研究只能滞后于理论发展，只能起到验证观点的作用，事实上，这也是一种常见的误区，我们会在第三节具体阐述，理论的发展和实验的研究也可以是相互生发的关系。

3. 实验研究对理论语言学的贡献

理论建构对科学实验和数据调查有非常重要的指导意义，一般来说，先理论思考后事实验证是建构科学理论的一般程序(司富珍2006)。那么实验研究对理论语言学的贡献只是亦步亦趋的验证或者驳斥吗?我们认为，实验研究对理论语言学的贡献大致分为两类，一种是常见的先理论后验证型，尤其是当理论研究已经发展了多年，对于实验的结果已经形成非常清晰的预测。这种情况下，实验主要提供一个证据，如果理论内部有分歧，会起到验证一种理论观点驳斥另一种的作用。换句话说，实验验证即是终点。在3.1小节中，笔者会以两个研究汉语特殊疑问句非局部依存关系的研究来阐述先理论后验证型的实验。

除此之外，实验研究与理论语言学还可以是一种相互生发的关系，实验验证是理论建构中的重要环节。实验的结果可以反过来对理论进行修正，或者提供新的思路，成为理论的新起点，形成理论—实验—理论的良性循环。在3.2小节中，笔者会通过一个声学实验来阐述这种理论与实验相互生发的关系。

3.1 汉语特殊疑问句的非局部依存关系：来自自控步速阅读实验的证据

本小节笔者回顾两个旨在探索汉语疑问句是否存在非局部依存关系(non-local dependency)的实验(Yang et al. in preparation)，来具体阐释如何围绕研究问题设计实验，实验结果又是如何对理论进行验证的。我们知道，英语特殊疑问句的疑问词通常放在句首，是疑问词移位的语言，而汉语是疑问词不移位的语言，疑问句的语序与陈述句一致。

从句法结构上讲，英语这种移位语言的疑问词从宾语位置移到了Spec-CP的位置，与宾语位置留下的trace形成了非局部依存。很多句子加工实验都验证了这种依存关系，即被试看到或者听到疑问词后会寻求trace的位置，以更好地理解句子，这个过程因为需要建构句法依存，增加了记忆负担，反应在ERP实验上通常为LAN效应或者P600效应，具体的研究参见Kaan et al.(2000)、Phillips et al.(2005)等。

那么作为疑问词不移位的语言，汉语有没有这种非局部依存的建构呢?理论语言学家认为有，但与英语这样的移位语言的显性依存不同，汉语疑问句的依存关系是隐性的。理论语言学界对汉语疑问句的依存有大致两种观点，一种观点认为汉语也有疑问词的移位，但只在逻辑层面(LF)移位到左缘结构Spec-CP位置(Huang 1982)；另一种观点认为汉语的疑问词是不定指(wh-indeterminate)，是一个变量，在疑问句中，疑问词虽不移位，但是与左缘结构的疑问算子(+Q)建立了一种operator-binding的隐性依存，疑问词的疑问义从而得到确立(Cheng 1991; Tsai 1994等)。

无论是LF移位，还是operator-binding，理论语言学界都支持汉语疑问词和左缘结构存在隐性依存的说法。那我们如何用实验验证这种依存关系呢?上文有提到，ERP实验可以被用来研究疑问词移位的显性依存及其神经信号。但是这里的研究问题主要围绕汉语疑问句中是否有依存关系，并没有试图探究神经信号，因此，本着第2节中提到的实验方法要以研究问题为出发点、遵循由简到繁的原则，应该首选简便易行的行为实验，比方说自控步速阅读，即通过比较汉语的疑问句和没有非局部依存的陈述句的加工时间，来检测汉语疑问句是不是有非局部依存关系建构造成的加工差异。

前人研究表明，疑问词按照是否存在语篇连接(Discourse-linking)可以分为两类， D-linked wh-phrase(例如“哪些”)和Non-D-linked wh-phrase (例如“谁”)，D-linking本身会建立与语篇相关的预设，例如，“哪些官员”的预设是说话者和听话者都知道有一个官员的集合，问的是其中一些官员(Pesetsky 1987; Avrutin 2000)，本身就有较高的加工成本，这种预设性与定指的名词短语类似。而没有语篇连接的疑问词(例如“谁”)的本质是不定指，因此设计实验时要充分考虑这些因素，与疑问句做对比的陈述句基线一定要分别控制好。因此，站在前人肩膀上，我们设计了两个自控步速阅读实验，如(1)、(2)所示，一个采用D-linked wh-question (“哪个XX”)对比包含定指(“那个XX”)的陈述句，一个采用Non-D-linked wh-question(“谁”)对比包含不定指(“人”)的陈述句，两个斜线之间的部分是被试每次通过按键阅读到的部分。

(1)a. 那个/ 男生/ 想要/ 求/ 哪个/ 同学/ 解决/ 问题? (D-linking) b. 那个/ 男生/ 想要/求/ 那个/ 同学/ 解决/ 问题。 (2)a. 那个/ 男生/ 想要/求/ 谁/ 解决/ 问题? (Non-D-linking) b. 那个/ 男生/ 想要/求/人/ 解决/ 问题。

自控步速实验结果表明(Yang et al. in preparation)，无论是D-linking还是Non-D-linking实验，疑问句在疑问词出现后都比对应陈述句的阅读时间更长，反映了疑问句更高的加工成本。鉴于陈述句中没有非局部依存关系，这种在线加工的差异可以理解为疑问句中建构了依存关系、增加了加工成本，支持了理论语言家关于汉语疑问句非局部依存关系的理论。同时，实验也发现，D-linking实验中，疑问句和陈述句的阅读时间差异出现得比Non-D-linking实验更早，这也反映了D-linking疑问词本身的加工成本更高，支持了前人的理论。

3.2 念力转移(force shift)中的动词上移：从纯句法分析到句法-韵律界面分析

本小节笔者回顾一个通过声学实验来探究句法问题的研究(杨洋、蔡维天 2019)，阐述理论与实验相互生发的关系。汉语中有一种念力移转现象，发生在句子和语境的交界处，句子配合言语行为而来的念力(illocutionary force)产生了质变，例如，疑问句“你看什么?”转成抱怨、禁止意味的念力转移句“你看什么(看)?！”。

通过句法分析，蔡维天(2011)指出以上念力转移句的动词重复可分析为后面动词上移至隐性轻动词所致：如果中心语移位后留下的动词拷贝在PF上删除，就得出“你看什么?！”；如果拷贝“看”留着未删，就是“你看什么看?！”。

但这里仍有问题，为什么动词上移至轻动词以后，下面的动词可删可不删，动词上移及动词的重复与删略机制，仅从句法一个维度上就可以解答吗?当今的句法研究已不再局限于句法内部的讨论，亦可以通过句法－语义界面、句法－音系界面，句法－语用界面等多个维度来解答。以句法－韵律界面为例，作者在前人研究(汪昌松 2017)的基础上大胆推测，韵律机制对轻动词上移和动词的删略可能起到作用。而轻动词上移的动因和韵律的规律，绝不能只诉诸于语感，应通过声学实验来表征和核实。因此，这里的声学实验可能起到定乾坤的作用。

这里要回答的界面问题是“韵律在念力转移句中的动词上移及动词重复与删略”中的作用。但在设计实验的时候要有更具体的问题，例如，要先了解疑问句和念力转移句究竟有怎样的韵律区别，念力转移句中轻动词V1和后面动词V2的重音分配是怎样的。围绕这些研究问题，杨洋、蔡维天 (2019)设计了如下的录音实验，通过比较(3)a和(3)b这样的同形句，来探索疑问句和念力转移句的韵律区别，通过(4)a和(4)b这种动词重复的念力转移句，来分析V1和V2的韵律区别。

(3)a. 你看什么? (疑问)b. 你看什么?!(抱怨)(4)a. 你看₁什么看₂?! (抱怨)b. 你客气₁什么客气₂?!(抱怨)

声学分析的结果主要体现在音长、音高、音域和音强差值上。统计结果表明，疑问和抱怨用法语调升降曲线明显不同((3)a为疑问句升调，而(3)b则为平调)；结合重音的声学表现(林焘、王理嘉 1992)，两类句子的重音位置也不同，在疑问用法中，句子的重音在疑问词上，而抱怨用法中，句子的重音在动词上。换言之，当句子的念力发生转移时，韵律结构也发生了转换。

接下来要回答的问题是，“念力转移句中轻动词V1和后面动词V2的重音分配是怎样的”。声学实验的结果显示，不管动词是单音节如(4)a，还是双音节如(4)b，均是V1承载重音。换言之，V2的删除与否，不会撼动句子在V1的重音情况。由此分析，隐性轻动词吸引后面动词复制上移，很有可能是为了承载重音，维持韵律机制的平衡，从而有了抱怨用法中的动词重复(“你看什么看?！”)；而因为重音在轻动词上，后面的动词拷贝在PF上无足轻重，因此可做删除(“你看什么?！”)。这个研究结果肯定了句法-韵律界面这个研究大方向，为分析念力转移句及其他类似句子提供了新的研究思路。实验不再是亦步亦趋地验证某个理论或观点，而是另辟蹊径，开疆扩土，为理论研究指明方向。接下来，可以将韵律研究的范围扩大，并进一步抽象化、形式化，形成理论—实验—理论的良性循环。

4. 总结和展望

本文讨论了近年来语言学界新兴的实验语言学。文章首先指明了理论语言学和实验研究之间的常见误区，因为学科性质不同，理论研究和实验研究常常会有只见森林和只见树木的误解；实验手段也并非越高级越好，而是应该以研究问题为导向。具体操作中，将语言学议题应用于变量可控、现实可操作的实验范式，并在理论假设和实际操作之间找寻一个平衡点，是目前面临的最大挑战。随后，我们通过两个自控步速阅读实验和一个声学实验，探讨了实验研究对理论语言学的两种贡献，一种是先理论后验证型，即当理论比较完善或者有明确指向的时候，实验研究主要充当一个验证的手段；另一种类型中理论建构与实验研究类似于鸡生蛋，蛋生鸡的关系，实验的结果可以反过来对理论进行修正，成为理论的一个新的起点，走向理论—实验—理论的良性循环。

本文的局限性在于，所讨论的实验研究主要在语言学框架下，对以神经科学、心理学为导向的跨学科研究并没有做讨论。事实上，神经科学和心理学做了很多语言相关的研究，可以帮助我们更好地探索大脑的语言机制，探究语言功能的大脑定位与可塑性，以及语言功能与认知的关系等。

展望未来，语言学研究发展到今天越来越多元化，注重界面研究，研究手段也越来越丰富。顺应这一潮流，理论语言学的实验研究，作为跨领域、跨学科、定量结合定性的研究，也必将在语言学领域打下坚实的科学基础，成为语言学发展的一条未来之路(石锋等 2017)。虽然时至今日，Poeppel & Embick (2005)对于语言研究的对象和概念与脑神经科学研究的对象和概念能否直接对应的问题依然存在(Granularity Mismatch Problem)，但在可预见的未来，实验手段必然会随着科技的进步而更加精细化和人性化，相关的问题可以得到更好地解决，语言的计算过程究竟如何在大脑中表征，也会越来越清晰。谈及理论语言学和实验研究的关系，我们知道，物理学界的理论、实验、应用等不同方向相辅相成又各自发光发热，理论物理学和实验物理学缺一不可。我们相信，理论语言学和实验研究也会走上物理学界的良性循环，持续为语言学的前沿研究开疆拓土。

作者简介杨洋：语言学博士，广东外语外贸大学副教授，研究方向为心理语言学、句法-韵律界面、儿童语言障碍等郑礼珊：语言学博士，荷兰莱顿大学讲席教授，欧洲科学院院士，研究方向为句法学、句法-音系界面、句法-语义界面等

本文来源：《现代外语》，感谢杨洋博士的支持，更多期刊内容，欢迎点击阅读原文查看。

延伸阅读

我国理论语言学研究与海外论文发表

国内外近年线上外语教学研究述评:理论基础、核心概念及研究方法

教育语言学研究在中国: 领域与方法

我国语言学界面研究：现状与前瞻

语言学教授解析：文献综述撰写的原则和方法

语言科学教师群

邀您入同学群

欢迎入群共享学术资讯