查看原文
其他

好文荐读|周启红、王海峰:学术汉语中自我提及语的学科分布考察

周启红、王海峰 语言学心得 2024-02-19


好文荐读(第三十六期)学术汉语中自我提及语的学科分布考察。

好文荐读不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~




学术汉语中自我提及语的学科分布考察
周启红1、2,王海峰2

1. 四川外国语大学中国语言文化学院,重庆 400031

2. 北京大学对外汉语教育学院,北京 100871

   

文章简介

文章来源:周启红, 王海峰.学术汉语中自我提及语的学科分布考察[J]. 当代修辞学, 2023(2): 83-93. 


摘要:本文通过自建现代汉语学术论文语料库,考察自我提及语如“我们”“我”“笔者”“本文”等的学科分布。研究发现,“我们”在软学科和硬学科论文中均有使用,而“我”仅出现在文学、历史和哲学论文中,其使用受学者身份等因素制约; 作者自称名词“笔者”在软学科论文中有不同程度的使用,在硬学科中仅生物学论文有少量使用; 抽象主体名词“本文”在软硬学科论文中使用较为普遍。总体上,不同自我提及语在软硬学科论文中的使用受主观性影响,呈现一个连续统。通过对应分析的多元统计发现,与自我提及语共现的动词呈现出多样性。其中,语言学论文自我 提及语的使用表现介于软学科和硬学科之间。

 

关键词:学术汉语;自我提及语;软学科;硬学科;学科分布

感谢作者周启红老师授权推广,全文下载请点击文末“阅读原文”。


一. 引言

在学术语言中,自我提及语指作者在论述过程中用于指称自我的人称代词或名词。它们表示作者在论文写作过程中鲜明的立场,承担着权威性的责任( Hyland 2005: 53) ,如英语中的“I、 we”以及汉语中的“我、我们、笔者、本文”等。自我提及语属于立场表达的主体( 主语/施事/动作发出者) 部分,反映作者如何处理与读者、命题和客观世界的关系,是学术论文中重要的部分。

本研究通过对自建语料库进行标注和分析,回答以下问题:

1) 自我提及语的表现形式及语篇功能有哪些?

2) 自我提及语在各学科中的总体分布及其差异是什么?


二. 研究语料和研究方法


本研究收集硬学科和软学科语料,硬学科语料包括数学、物理、生物、计算机,软学科语料包括文学、历史、哲学和语言学。
各学科语料均为 CSSCI 和 CSCD 期刊来源,各学科期刊的选择我们请 教了相关专业的教授,得到领域专家的推荐。自建语料共 320 篇,每个学科各 40 篇,总字数为 4134709 个,总词数为 2389235 个。
本研究采用定量与定性结合的分析方法。首先对原始语料进行分词、词性标注和抽取,由研究团队开发的“SYNLP 助手 1.0” “SY 立场标记语抽取与统计 1.0”两个工具完成以上任务, 前者对语料进行分词和词性标注,后者抽取自我提及语的语料。然后,由两位语言学及应用语言学专业的博士生进行统一标注。标注中需要结合语境区分作者与非作者用法/指称,根据语义特征判别是否属于自我提及语用法,属于自我提及语用法就标注为“1”,不属于自我提及语用法就标注为“0 ”,标注完成后进行分类、统计和研究。遇到标注不一致的情况,即经过讨论后重新标注,以保证肯德尔和谐系数( Kendall`s Tau) 达到 0.8 以上。


三. 自我提及语的形式与语篇功能


根据实际语料,本文将自我提及语表现形式分为三类,具体成员如下: 

1) 人称代词:我、我们、本人 2) 作者自称名词:笔者 3) 抽象主体名词:本文、拙文、拙著、文章、本实验、本研究、本项目


3.1 人称代词

“我”在软学科中有所使用,“我们”在软硬学科中均有使用,“本人”仅偶现于软学科中。

3.1.1 “我”

汉语学术语篇中第一人称代词“我”是作者自称,代表行文作者表达立场。

觉得这与其说是一种理论,还不如说是看待诗歌文本的一个视角。(文学)

自我提及语“我”的具体语篇功能主要可以概括为两种:个人观点构建和文章向导。 个人观点构建旨在营造表达主体对认知对象的看法,突出作者个人见解。诸如此类的表达还有“我的评析” “提出我的解释” “就我所见”等。例如:的理解是,意见和人的个性或者说自我意识联系在一起。(哲学)文章向导是指表达主体引导读者理解文章,提示论述视角,指示述及范围或相关问题等。例如:这里,我从一名史学工作者的角度,......谈谈自己的看法。(历史)考察结果显示,“我”的用例仅在文学、历史、哲学语料中发现,使用者多为学界权威专家,旨在强调个人看法。3.1.2 “我们”在学术语篇中,“我们”的语篇功能主要有三种: 个人观点构建、集体观点构建和文章向导。第一,个人观点构建。虽然“我们”是集体指代,不同于“我”的个人指代,但仍可表达个人观点建构。在文学、历史、哲学和语言学语料中,独作在表达个人观点时常使用“我们”。例如:我们认为:......,“唐乐”歌辞代表了其中一条途径。(文学)上文作者署名为一人,属于个人观点的构建。我们发现,“我们”作为个人观点的构建功能常体现在软学科中,在硬学科中极少使用。第二,集体观点构建。硬学科团队合作较多,一篇文章中多位作者属于普遍现象,所以 “我们”指称多位共同作者,属于集体观点的构建。例如:我们发现坡向与萌生能力也有一定的关系......(生物) 上文作者数量为两人,“我们”表达的是集体观点的构建。第三,文章向导。即提示操作过程等(Tang & John 1999) 。我们进一步简化了它的输入结构和学习过程。(计算机)
3.2 作者自称名词作者自称名词成员主要是“笔者”。“笔者”字面意思为“执笔的人” “写这篇文章的人” (田松 2018) 。在学术论文中“笔者”的使用频率常高于“我”,介于第一人称“我”与隐身第三 人称(“执笔者”) 之间(王鸿博 2018) 。从语用层面看,“笔者”比“我”更适当、更委婉(王殿雷 2012) 。在观点构建和文章向导等语篇功能上,“笔者”比“我”具有客观性。“笔者”在文学、历史、哲学和语言学等软学科中均有用例。例如: 根据笔者数年来的考证及掌握的一手资料来看......(文学)硬学科中仅在生物学语料中发现 6 例,其他硬学科未发现用例。笔者实验室前期对......根系内生真菌进行了初步调查。(生物)
3.3 抽象主体名词抽象主体名词用于指称作者所写的文章。不同于前两类的是,抽象主体名词目的是隐藏作者,更具客观性。主要包括“本文”“拙文”“拙著”“文章”“本研究”“本实验”“本项目”。在学术语篇中,“本文”是指作者、研究团队所写的这篇“文章”。例如: 本文旨在介绍这一文本设计思想和结果。(语言学)“本”有“自己方面”的意思,“本文”相当于“这篇文章”。在学术语篇中,“本文”表达立场主体,功能主要是引出客体。“客体”与所做研究相关,包括研究对象、研究结论、研究问题等。 本文采用应用最广泛的Lee模型......(物理)在学术论文中,常用指称客体的还有“本研究”“本节”,用于提示研究的客体内容。通过对语料分析,我们发现“本文”与“我们”的功能有重叠。表达立场主体时,“本文”可 以替换成“我们”。例如:a 本文尝试从汉语语言特性出发,对......进行讨论。(语言学) b 我们尝试从汉语语言特性出发,对......进行讨论。a 句的“本文”可以替换成“我们”。不过,使用“本文”“本研究”是为了凸显客观性,使用“我们”是为了增强与读者的互动性。但是使用“我们”的有些例句难以用“本文”替换。例如:a 我们以下面两例句进行测试......(语言学)b? 本文以下面两例句进行测试......b 句用“本文”替换显得不自然,因为“测试”是只有“人”才能发出的动作,抽象名词 “本文”与“测试”搭配可接受度低。此外,类似的动词还有“演示”“概括”“阅读”“看出”等。综上,“本文”主要指“作者所写的文章”,即指示对象而非指示自己,因此隐藏了作者,具有客观性。作者使用“本文”,而不用“我 / 我们”,有“去主观化”的作用,降低了文章或研究内容的主观性,它是作者故意将自己放到偏离话语中心位置的一种话语组织策略。但是我们也发现“本文”的功能也在漂移,具有了指人特征,例如“本文尝试”“本文讨论”“本文发现”等。

四. 自我提及语的分布及其相关对应关系

4.1 自我提及语的学科分布

为了发现不同自我提及语的特点,我们对其在不同学科的分布情况进行了考察,总体结果如表 1 和表 2。


第一,总体上使用自我提及语频率最高的是语言学(29.55/每万词) 和计算机(28.93/每万词) ,使用频率最低的是物理(14.67/每万词) 和历史(7.43/每万词) 第二,文学、历史、哲学、语言学和数学高频使用的自我提及语为“我们”,物理和计算机高频使用的自我提及语为“本文”,而生物高频使用的自我提及语是“本研究”同时表 1 显示, 各科语料均使用了“我们”和“本文”。第三,学术语言讲求“客观性”,硬学科均未发现第一人称代词“我”的用例。这与硬学科多以实验数据为基准,更强调客观性(impersonality) ( 吴忠华、旁继贤 2009) 相关,因此不使用主观性极强的第一人称单数形式; 而在软学科中使用自我提及语的第一人称代词“我”,主要是凸显个人主观意志第四,语言学、数学、生物、物理以及计算机科学不使用“我”“本人”,数学、物理和计算机不使用“本人”,生物和物理“我们”使用的频率远远低于其他学科。可以看出,为了凸显客观性,作者有意隐藏立场主体。而软学科中的文学、历史和哲学均有所使用,是作者为了凸显立场主体。从软学科硬学科两个大类来看,自我提及语各小类数据对比见表2:


四类自我提及语在软学科和硬学科两个大类之间的差异性均达到了显著水平。第一人称单数(我) 、第一人称复数(我们) 、作者指向名词(笔者) 、抽象主体名词(本文、文章、本实验、本研究、本项目) 均呈现显著差异。这说明,软硬学科在自我提及语使用方面存在显著差异,学科对学术语言词语存在选择倾向。从使用频率来看,硬学科使用抽象名词(14.92/万词) 高于软学科(3.84/ 万词) ,软硬学科均使用第一人称复数,硬学科几乎不使用第一人称单数和作者自称名词。


4.2 自我提及语共现动词的多样性自我提及语共现动词呈现多样性特征。词语的多样性,即类符与型符之比( type-token ratio,简称 TTR) ,也就是文本中词语种类数与词语总个数的比值。本小节的多样性是借用词语多样性的计算方法来计算节点词(自我提及语) 与共现动词的多样性。本文提出一种相对合理的,可以根据实际情况动态调整高频项目个数的方案。根据 “齐普夫定律”(Zipf’s law) : 词出现的绝对频率 f 与按绝对频率从大到小编号的序号 r 的乘积大体上稳定于一个常数( Zipf 1949: 24) :r 表示词频排序序号,f 表示序号为 r 对应的词频,C 表示一个常数。齐普夫定律呈现幂律分布,语料库中词频和词语位序信息成反比,词频越高,词语的位序数越小(越靠前) 。高频词语会集中出现在按词频从高到低排序的“头部”,而低频词会呈现一个长尾效应。例如,图1是生物学语料中的词频与位次关系图,词频从高到低前三位分别是“的”(9733 次) ,“和” (3309 次) ,“生态”(3104 次) 。图1显示,横轴为位次信息,从左向右为高频前100词的位次信息,纵轴为词语对应的频次信息。从横轴来看,越靠近左边位次靠前,词频越高; 第一位词语“的” 频次最高为 9733 次,第二位词语“和”的频次为3309次,从第一位到第二位呈“断崖式”下降,从第二位“和”到第三位的“生态” 下降趋势远远小于从第一位到第二位。

受齐普夫定律和数学思想“梯度” (gradient) (图 2) 的启发,可以在“断崖” 处做一个分界线确定高频的位次信息。引进梯度下降概念来确定高频词语的位次信息,梯度绝对值最大处代表变化最快的地方,这当然并不是严格意义上的数学意义的梯度求解过程; 我们引进梯度是为了找 到下降最大的位置,即依据共现词的频次信息做一个从高到低的排序,找到梯度绝对值 最大值即高频词的分界线,具体思路如下:


经过测验,词语频次信息差距最大值是处于前几位的词语。根据高频词的词频排序信息,可以找到梯度下降最大值。根据公式(1) ,使用 Python 编写程序进行计算,结果见表 3:

“本文”在各学科期刊论文共现的动词呈现出几个特点: 第一,与“本文”共现动词 ( 右一) 类符数最高的是语言学,共有 39 个,最低的为文学和历史,只有 8 个。文学语料、历史 学语料类符数未超过 10 个,而生物、物理、哲学语料、语言学语料、数学语料的类符数量均超过了10个。第二,从多样性的角度来看,哲学论文语料中与“本文”共现动词更具多样性。

自我提及语与共现动词的多样性结果见表4。总的来看,“我们”在生物学科中更具多样性,“本文”在哲学中更具多样性,“我”“笔者”在文学中更具有多样性,“本研究”本实验在语言学中更具有多样性,“本人”在历史和哲学中更具有多样性。需要注意的是,只有“我们”“本 文”在各学科中均有使用,而“拙文”“拙著”“本项目”仅各出现 1 例,不具多样性。


4.3 自我提及语与学科的对应关系

表 1 显示学科论文中的数据分布,对应分析的数据类型为行列表形式,其中行代表的是具体的语言项目,列代表的是学科,数值采用了标准化处理,即每万词的标准频率,使用R语言作图,结果见图 3:

自我提及语与学科语言使用之间存在对应关系。“本研究”靠近物理和生物学,“本人” “文章”“笔者”“我”靠近文学和历史,“我们”靠近语言学,“本文”“本实验”与数学和计算机最近。从维度 1(dimension1) 来看,生物、物理和计算机位于维度 1 纵轴右边( 第一象限和第四象限) , 语言和数学接近右向,而文学、历史和哲学位于纵轴左边( 第二象限) 。该维度基本区分了软学科和 硬学科,可以看出,语言学介于软学科和硬学科的中间,其解释力为 57%,具有较高的解释力。从维度 2(dimension2) 来看,生物、物理、文学和历史位于横轴上方( 第一象限和第二象限) ,而哲学位于临界点,语言、数学和计算机位于横轴下方(第三象限和第四象限) ,其解释力只有 31.1%。究其原因,学科有交叉,语言形式选择有交叠。比如,一般认为,在纯硬学科中,应避免主观性,但是在数学学科中也使用了“我们”,以增强言者和读者的互动性。软学科表达主观性较强,也使用了客观性较高的自我提及语“本研究”。

从图 3 可以看出,语言学有别于软学科的文学和历史,更靠近数学。从自我提及语的使用 也侧面印证了“语言学是介于软硬学科之间的学科”( 陈明远 1983: 16) ,从本文的研究结果来 看,在自我提及语的使用方面,语言学更靠近数学。

上述对应分析结果显示,自我提及语在一定程度上可以看出软硬学科的语言差异


五. 影响自我提及语分布的主观性与客观性

自我提及语的使用在主观性上存在一个连续统,见图 4:


越靠左主观性越强,越靠右客观性越强。“我们”居于中间位置,使独立观点成为群体观点,以构建学术同盟。从语用上来看,越靠左,作者个人身份建构越强。作者提出一种新理论或观点,可能是对前人结论的印证、补充、说明,也可能是推翻前人的观点,意味着对前人看法的某种修正、否定,或多或少产生一定的“面子”威胁。选择使用中间的成分( 如“我们”) ,维护了读者和作者的积极面子,拉近了作者与读者的距离,使其观点更容易被接受。隐性的非人称抽象名词作为作 者构建身份的方式能够在一定程度上减弱这种威胁( Myers 1989) ,因此越靠右,作者身份建构能力越弱,则面子威胁越小。从学术文化上看,学术有“道”,在汉语学术语篇中不太使用“我”而选择使用“我们”,首先,这是作者自谦的表达,儒家思想主张“和”与“同”,学术论文中不使用“我”表达观点是一种淡化自我( 张雪凤、王滨 2010) 、礼貌的策略( Chen2020) ; 第二,与读者互动,拉近与读者的距离,使观点更容易被接受; 第三,作者提供了学术共同体,让作者观点变成一种“集体化的声 音”( 张钰钗 2019) ,维护其积极面子; 第四,一篇文章从初稿到发表,吸收了同行、编辑、审稿人等多人的观点,是集体智慧成果的展现,作者使用“我们”更具周全性。总之,“我”多用于建构作者个人身份; “我们”增强互动,以拉近与读者的心理距离; “本 文 / 本研究”等抽象名词意在拉开与读者的心理距离,增强客观性。我们对汉语二语学习者的 建议是,在学术写作中不提倡使用“我”; 在强调客观性时,可使用抽象名词“本文 / 本研究”; 在 强调与读者互动性时,可使用“我们”。

六. 结语

本文从宏观上呈现自我提及语的总体分布及其特征,从微观上细致描写“我”“我们”“笔者”“本文 ”的 功 能。语言学、数学、生物、物理以及计算机科学多使用“我们”“本文 ”,未发现使用“我”“本人”情况; 数学、物理和计算机不使用“笔者”,生物和物理使用“我们”的频率远远低于其他学科。自我提及语共现动词呈现多样性,自我提及语的使用在主观性上存在一个连续统。通过对应分析的多元统计,本文印证了语言学表达方式介于软学科和硬学科之间

作者简介







周启红

    个人简介:周启红,中国语言文化学院教师。北京大学对外汉语教育学院在读博士,讲师。主要从事汉语词汇与语法、学术汉语、计算语言学、二语习得等领域的研究。参与国家级课题4项,发表论文10余篇。2019年获中国语言学书院奖学金。指导本科生优秀毕业论文3篇


王海峰
    个人简介:王海峰,语言学与应用语言学专业博士。北京大学对外汉语教育学院教授,博士研究生导师,北京国际汉字研究会副会长,河北师范大学兼职教授,国际中国语言学会会员、中国语言学会会员。要侧重于现代汉语语法研究以及对外汉语教学研究。1988年毕业于河北师大中文系,获文学学士学位。1999年毕业于中国人民大学中文系,获文学硕士学位。2008年毕业于北京语言大学,获文学博士学位。邮箱:chinapku@163.com。

本文来源:《当代修辞学》

点击文末“阅读原文”可跳转下载

课程推荐




重  磅|2023年度教育部人文社科项目评审结果(语言学)

2023-09-16

好文荐读|张谊生:试论汉语副词再演化的模式、动因与功用

2023-09-19

好文荐读|杨德峰:程度副词的叠用初探

2023-09-16

语言学人|赵世举:语言观与语言研究方法论漫谈

2023-09-15

好文荐读|邵明明、王春辉:中国服贸会语言服务调查

2023-09-15

好文荐读|张智义:浮现句法+浮现隐/转喻:句法生成的新路径

2023-09-13

好文荐读|徐晶凝:如何在流水句中划定句子的边界

2023-09-10

语境如何影响二语词汇学习?基于分布语义理论的证据

2023-09-09

好文荐读|关越、方梅:汉语自然对话中句法合作共建的多模态协同

2023-09-05

好文荐读|梁宇、李诺恩:中文数字学习资源使用意愿及其影响因素研究

2023-09-04

好文荐读|彭小川:也说“必须”的词性

2023-09-02

好文荐读|王丽娟:汉语韵律形态的事实、理论及探索空间

2023-08-31

欢迎加入

“语言学心得交流分享群”“语言学考博/考研/保研交流群”


请添加“心得君”入群请备注“学校/单位+专业/研究方向”

今日小编:young

审     核:心得小蔓

转载&合作请联系

"心得君"

微信:xindejun_yyxxd

点击“阅读原文”可跳转下载

继续滑动看下一个

好文荐读|周启红、王海峰:学术汉语中自我提及语的学科分布考察

周启红、王海峰 语言学心得
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存