查看原文
其他

不同水平的学习者二语句法习得规律一样吗?

姜茜茜 计量语言学 2022-06-09

英国诗人亚历山大·蒲柏(Alexander Pope)有句名言“To err is human, to forgive, divine.” 在二语研究中,提起“错误”,我们肯定绕不过Corder在1967年发表的The significance of learners’ errors 这篇开山之作。尽管错误分析早已是老生常谈的问题了,但基本上还是沿用Corder所提出的理论框架(大神永远是大神,大家都是站在巨人的肩膀上向远处望一望)。学习者有自己的语言系统,是在语言学习过程中逐步向目标语系统靠近的一个“中介语连续体”。这样一来,“错误”的作用就显得格外重要。我们通过分析学习者的错误就可以间接地了解学习者的二语学习过程啦,真是聪明又省力。顺着这一思路,出现了许多二语错误分析研究,通过“花式”对比学习者的中介语、本族语和目的语,逐渐将学习者错误的原因总结为三大类:语际迁移、语内迁移和学习者因素。

而刚刚发表在《语言文字应用》上的一篇文章则“另辟蹊径”。这篇文章的主要内容是,基于中国英语学习者的真实语料,以依存距离量化句法关系难易程度,考察学习者写作中的错误、依存距离与二语水平三者之间的关系。可是为啥要研究学习者的错误和依存距离这两个看似八竿子打不着的东东呢?嘿嘿,就让小编先带大家一探究竟。


工作记忆在我们语言处理的过程中占据妥妥的 “C位”。1956年,著名认知心理学家 George Miller 发表了The Magical Number Seven, Plus or Minus Two 一文。他认为,尽管大脑可以用数以亿计的神经连接来储存人一生的知识,但能在意识中短期储存的事物数量是很有限的,大概只有7个单位。其他一些研究者认为工作记忆的容量可能还不到7,而是更接近4。一旦处理语言的认知负荷超过工作记忆的限度,语言就会乱作一团。就像下图中的小对话,边说边忘,最后只记得“点心”(吃货实锤)。当然,这个例子是夸张的,但是在高认知负荷下,我们的大脑对语言信息的处理确实会变得非常不靠谱。由此,我们可以推出这样的假设,认知难度大的句法结构与学习者的语言错误存在一定的关系。

要验证这个假设,我们需要找到可靠的衡量句法结构认知难度的指标。计量语言学中存在这样一个神奇的概念——依存距离,它可以定义为两个具有句法联系的词的线性位置之间的差值。依存距离与人的工作记忆密切相关。许多研究表明,依存距离最小化是人类语言的普遍特征(指路:Dependency distance: A new perspective on syntactic patterns in natural languages)。所以,依存距离可以提供一种测量和计算语言处理时所需记忆负荷的方法。这一指标帮助我们在句法结构难度和错误之间架起了一座“桥”,我们可以直接量化所谓的“难度”(是不是比靠直觉进行估计的方法更靠谱哇)。一听要量化还要计算,像小编这样的数学渣渣差点儿要被劝退了。好在依存距离的计算方法上手很快,一学就会,大家走过路过千万不要错过哈!

根据依存语法,句子的结构由词与词之间的依存关系构成,可以转换为依存树。在上图的句子中,我们给句中的每个词按词序从1开始标号。用弧线把有句法关系的两个词连接起业。弧线带箭头,弧的起点为支配词,箭头指向的是从属词,弧上为具体的依存关系标记。例如:支配词“look”和从属词“man”之间的关系为“nsubj”(主语)。那么这两个词之间的依存距离为它们的词序标号之差(一般都取绝对值),所以是6-2=4。在这句话中,“look”存在错误,应该使用第三人称单数,错误标记为“SVD”(主谓不一致)。这样一来,错误结构的依存距离也就可以计算了。

絮絮叨叨了一堆,咱们还要回到最初的地方。如果认知难度大的句法关系对学习者来说存在困难,那么依存距离越长,学习者可能越容易出现错误。此外,随着英语水平的提高,学习者的不同距离依存关系的错误发展趋势也可能会变化。为了搞清楚这些问题,咱们还必须界定什么是长依存距离和短依存距离。刘海涛老师2008年的文章(Dependency distance as a metric of language comprehension difficulty)对20种语言的平均依存距离进行了分析,发现依存距离有最小化的趋势,平均依存距离的阈值一般不超过3个单词。因此,作者“站在巨人的肩膀上”按照依存距离的绝对值以3为界,将依存关系分为短距离依存关系和长距离依存关系。然后自建了横跨八个连续年级的中国英语学习者写作依存树库,并分为低、中、高三个水平。根据下图中的公式,计算出每位学习者在长、短依存距离下的错误率,然后进行3ⅹ2的混合方差分析。



上图呈现了不同水平学习者在长、短依存距离下的错误率。我们可以看到,随着英语水平的提高,学习者的错误率呈现下降趋势,长距离依存和短距离依存的错误率之间的差距也是逐渐缩小的。数据表明,依存距离和英语水平对中国学习者英文写作的错误率有显著的交互作用,而且两个因素各自的主效应也都显著。非常有趣的是,数据显示,只有中、低水平学习者在长距离依存和短距离依存的错误率上有显著差异,高水平学习者的不同依存距离的错误率差异却并不显著(是不是有些出乎意料)。作者认为,依存距离对错误率的影响受到学习者英语水平的调节,中、低水平的学习者更容易受到长依存距离的认知约束,从而在英语写作中出现错误。然而,高水平学习者则通过组块等记忆策略,增强了句法构建自动化的能力,所以对长依存距离的认知约束并不敏感。

上图是学习者在英语作文中出现的词汇错误和句法错误数量在长、短距离依存关系总数中的占比情况。总体上说,学习者句法和词汇错误率是随着语言水平的提高而下降的。在短距离依存关系下,各水平学习者的词汇和句法错误率都非常接近。但是,在长距离依存关系下,词汇和句法错误率都要高于它们在短距离依存关系下的错误率,并且句法错误率明显高于词汇错误率。关于错误类型的进一步分析表明,长距离依存关系下学习者最容易出现的错误类型是成分缺失、动词错误、成分冗余以及搭配错误。作者认为,中国学习者出现这些错误不仅仅是因为受到长距离依存关系的认知约束,也与此类依存关系输入不足及母语负迁移有关。

这项研究以依存距离作为衡量句法关系难度的指标,一方面,通过分析不同水平学习者错误的特点和变化,为揭示语言的认知加工机制对二语学习的影响提供了数据支撑;另一方面,将语言输入、理解、加工和二语产出进一步联系起来,进而从认知角度更加深入地探究学习者错误的特点和成因,弥补了传统错误分析的不足,也为二语习得相关研究提供了新的思路和方法。

更多细节小编在这里就不多说了。论文已上线,欢迎感兴趣的朋友们通过“阅读原文”下载!明天将为大家介绍与语言规划相关的论文《汉字简化中的字形复杂度统计特征稳定性研究》,欢迎关注。





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存