查看原文
其他

Ilab-具身语言研究推荐【54】方法篇

Connie 语言学习科学 2021-12-26

点击蓝字



关注我们

具身语言学研究方法篇之三: 计算研究方法

作者 |  Connie

Embodiedlinguistics.com



1. 计算模型(Computational Modeling)

1.1 定义

计算模型不仅为心理语言学提供了重要的研究工具,也在其理论研究中起到举足轻重的作用。计算模型在处理变量之间的复杂交互方面具有特别的优势,解决了自然语言情景中难以处理的问题。本节概述了心理语言学中的两种计算建模方法:概率法(probabilistic approach)和联结法(the connectionist approach)。 

1.2 研究假设和理论基础

自20世纪50年代认知革命以来,计算机科学的进步促进了认知科学对人类语言行为的理解(参见Gardner,1987)。大多数语言处理的计算模型旨在得出陈述性(declarative)和符号性的算法,以计算分析句子的句法结构(切分(parsing))或在自然语言处理中构建符合计算和心理需要的应用模型,如,切分模型(the parsing model)(Vosse & Kempen,2000)。

目前,语言的计算建模沿着以下两个方向发展。(1)概率法建模方向。研究表明:语言的统计特征在语言处理和语言学习的许多方面起着至关重要的作用。儿童和成人都可以检测和利用环境中语言输入的统计信息(Saffran,Aslin,& Newport,1996)或是语言输入和周围环境之间的规律(Smith&Yu,2008)。(2)联结法建模方向。20世纪80年代以来,传统的观点认为,心智是连续的符号计算系统,这一思想受到联结主义(Connectionism)或并行分布模型(Parallel Distributed Processing,PDP)(也称,人工神经网络)的挑战。从联结主义角度对语言的研究一直是早期PDP模型的主要关注点,联结主义认为人类认知的出现源于同时参与处理的互动单元所构成的大型网络,类似于人类大脑中大量神经元网络的处理。

概率法:近年来,利用贝叶斯统计学(Bayesian statistics)理解认知过程非常流行(参见Lake,Salakhutdinov,& Tenenbaum,2015),目前它已成为研究语言的重要方法。该方法根据贝叶斯定理(Bayes’s theorem)对基于先验知识对假设做出推断。概率模型的一个重要假设是人类学习者能够跟踪语言系统内以及语言输入与其周围物理环境之间的统计关系,并基于此建立计算模型,以模拟人类语言统计学习的模式。模拟科学的统计规律,融合语言能力和数理能力,借助间接的具身规律和统计规律破解和提升认知规律,语言习得是可能实现高度预测和经验决定的。

联结法:现代联结主义理论强调“大脑式的计算”,即使是以简化的形式呈现,我们也仍然应该建立一种类似于真实大脑信息处理方式的连接主义网络。人类大脑大约由1000亿个神经元和数万亿个神经元之间的联结组成。神经元的树突接收来自其他神经元和轴突的信号,并将信号发送到其他神经元,神经元的信息传递通过突触完成。根据大脑的这些特征,联结建模者可以构建具有两种基本成分的人工神经网络:简单处理元件(单元、节点或人造神经元),以及这些处理元件之间的联结。与真实神经元一样,节点接收输入来自其他节点的信息并将信息发送到另外的节点。输入信号通过线性阈值或更常见的非线性数学函数累积并进一步变换,来确定节点的激活值(activation value)。

1.3 研究工具和手段

具体的研究工具和手段依赖于模拟目标和任务,用于计算语言建模的设备可以只是一台具有编程能力的计算机,选择高性能计算机可以帮助研究人员显著提高计算速度,选择合适的算法来实现可以完成符合研究目标的基本概念和原则的建模。

1.4 刺激特征和数据分析(呈现和分析

现代数字计算机程序使用数字代码,显然不同于我们每天使用的自然语言。因此,研究者必须确定如何在模型中确切地表征语言输入刺激。“输入典型性(input representativeness)”对于语言的计算建模至关重要(Christiansen& Chater,2001)。表示词条(lexical item)的一种粗略的方式是“本地表征”(localist),这种表征方式是由建模者(modeler)随机选择系统中的单个单一处理单元,进行赋值表示语言项目(linguistic item)(例如,单词的含义、声音或其他语言特征)。这样,处理单元的激活可以明确地与该单元应该表示的特定语言项目相关联,激活的强度代表了语言实体(linguistic entity)完好表征的程度。通过这种类型的一对一映射,显示了本地表征(localist)的简单性和高效性,它在模拟计算模型的语言处理方面取得了巨大成功。连接模型所接受的另一种方法是将词汇条目表示为分布式表征,该方法将给定的词条(lexical item)用多个节点及其联结的权重表示,以此作为相关微特征激活的分布模式。重要的是,研究人员需要在仔细评估其模拟目标的基础上,选择适当的方法来表示语言特征(语音、词汇-语义、形态句法等)。如前所述,本地表征简单而有效,但可能无法准确表示输入,而分布式表征可能更难以执行,但如果目标是捕获声音或概念之间的相似性(例如,用于模拟基于相似性的语音或语义启动效应),分布式表征则是更好的选择。

根据不同的研究目的,可以在不同层面分析计算心理语言学模型的结果。根据不同心理语言变量评估模型的输出模式,研究者可以进一步将这些输出模式与真实的语言现象联系起来,并使用实证研究中常用的方法对其进行分析。计算建模的一个显著优点是可以在轻松分析输出的同时,轻松分析模型的内部表征。内部表征分析可以使研究人员更好地理解人类语言习得和处理的基本机制(例如,Elman,1990)。 

1.5 评价

计算建模需要模型来执行,因此需要研究人员对假设、预测、材料、变量和参数以及测试程序非常明确,这对于研究者而言将面临如下挑战:(1)基于建模的“显性”性质要求,如何对所有输入和输出在模型中都以指定的算法表示;(2)如何在模型中处理“自由参数”(“free prameters”)以及如何对它们进行参数调整;(3)如何在计算建模结果和各种行为以及神经心理学和神经影像学发现之间建立联系,这显然需要提高模型基于来自不同模态和背景的广泛数据进行预测的能力(Schloss&Li,2017)。

主要参考文献:

Aertsen, A., Gerstein, G., Habib, M., & Palm, G. (1989). Dynamics of neuronal firing correlation: Modulation of “effective connectivity.”. Journal of Neurophysiology, 61, 900-917.

Allopenna, P., Magnuson, J. S., & Tanenhaus, M. K. (1998). Tracking the time course of spoken word recognition using eye movements: Evidence for continuous mapping models. Journal of Memory and Language, 38, 419-439.

Anderson, A.,& Gore, J.(1997).The physical basis of neuroimaging techniques. In M. Lewis & B. Peterson (Eds.), Child and adolescent psychiatric clinics of North America (Vol. 6, pp. 213–264). Philadelphia, PA: W.B. Saunders.

Asimov, I. (1951). Foundation. New York: Doubleday.

Baum, L. F. (1958). The wizard of oz. New York: Scholastic.

Baccino, T., & Manunta, Y. (2005). Eye‐fixation‐related potentials: Insight into parafoveal processing. Journal of Psychophysiology, 19, 204-215.

Baayen, R. H., Davidson, D. J., & Bates, D. M. (2008). Mixed-effects modeling with crossed random effects for subjects and items. Journal of Memory and Language, 59: 390-412.

Bates, E., Dale, P. S., & Thal, D. J. (1995). Individual differences and their implications for theories of language development. In P. Fletcher & B. MacWhinney (Eds.), Handbook of Child Language (pp. 96-151). Oxford, UK: Basil Blackwell.

Bates, E., Marchman, V. A., Thal, D. J., Fenson, L., Dale, P. S., Reznick, J. S., … Hartung, J. (1994). Developmental and stylistic variation in the composition of early vocabulary. Journal of Child Language, 21, 85-123.

Beckmann, C., & Smith, S. (2004). Probabilistic independent component analysis for functional magnetic resonance imaging. IEEE Transactions on Medical Imaging, 23, 137-152.

Berko Gleason, J., Perlmann, R., & Grief, E. (1984). What’s the magic word: Learning language through politeness routines. Discourse Processes, 7, 493-502.

 

致谢

感谢您的关注,感觉不错请点右下方“在看”,爱心支持请转发哦






往期推荐

Ilab-具身语言研究推荐【53】方法篇具身语言学研究方法篇之二:神经研究方法


Ilab-具身语言研究推荐【52】方法篇具身语言学研究方法篇之一:行为研究方法


Ilab-具身语言研究推荐【51】现状篇之三:国内具身语言研究综述


Ilab-具身语言研究推荐【50】现状篇之二:具身语言研究 近十五年综述(2002-2017)



扫二维码|关注我们


团队微信平台:语言学习科学
智慧语言具身认知实验室
具身语言教育联盟


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存