查看原文
其他

对撞机|“共现”词频分析及其运用 ——以“华人”观念起源为例(下)

金观涛 等 零壹Lab 2022-10-08


作者简介

金观涛,国立政治大学讲座教授。

邱伟云,国立政治大学中国文学系博士研究生。

刘昭麟,国立政治大学资讯科学系教授。


四、从数据到关键词意义结构

提到“华工”一词,很多人会联想到晚清所谓的“卖猪仔”,认为所有华工都是被卖到国外的奴隶,这个说法目前已有学者提出反驳,认为“猪仔”与自由移民美国的华工不能混为一谈(蔡石山,1971 : 198-199)。[1]而本文所谈到的“华工”内涵,则跨越了从被卖到古巴、秘鲁的“猪仔”到自由移民往美国的“华人”。而从“猪仔”到“华人”的过程,隐含着是中国对于海外子民的认同心态转移,因此从清廷对于华工事件的处理态度,亦可看出中国对外的心态转变史。


从历史文献中可知,中国对于海外子民的态度,从明清以来即是以坐视不管、放任自生的态度去面对:“‘逃民’、‘罪民’和‘潜在的汉奸’这些形象,与对商贾的传统偏见一起,构成了明代对海外华人敌视政策的基础。凡返回中国的海外华人,都受到拘捕和惩处。在明代晚期,当海禁最终解除时,朝廷对海外华人的敌视只不过是降到漠不关心的程度而已,对于他们身处海外,并不予以保护。”(颜清湟著,粟明鲜、贺跃夫译,1990 : 14)从这里可以看出华工为何被视为天朝弃民的传统记忆。


自明清以来被视为天朝弃民的华工,是如何成为晚清极力保护的对象?即是一个必须要梳理的脉络,且若是要理解晚清清廷政府的外交心态转移,也必定要从清廷对于华工事件态度的转变来着手。如蔡石山在《华工与中美外交》一文中提到: “崔国因在光绪十九年九月初四奏折中云:‘……美日秘三国交涉之事以美国为繁, 美国交涉之事以保护华民为要。’我们可以说,一部早期中国对美外交史绝对脱离不了移民与护侨的问题。”(蔡石山,1971 : 197)从上述中,可以了解,中国对外关系之态度改变,可以从对待华工事件的处理方式来观察。即沿袭以往对于明清以来忽视华工之态度,转而成为保护华工之态度。在这转变之间,看似从一“不保护”到“保护”之简单过程,但其中牵涉了整个中国的“自我认同”,以及在国际上的“自我定位”。换言之,以往中国强盛为“天下中心”时,华人并不会受到欺压,但随着中国在“他者”心中形象渐渐的呈现败象,各国也就开始欺压华人,这时面临从“天下观”转变到“万国观”之清廷,为了护住天朝上国的尊严,自然会对任何可以强化自我认同之机会加以把握,而在以“华工”受虐为核心的事件中,正是一个清廷不断对外进行谈判、协商、退让的自我宣示,也是一个自我认同的转换过程。透过整个华工事件长达三十年的处理过程,中国在这段期间也逐步从“天下观”转变到“万国观”,而华工事件真正得到解决,也是等到中国真正的接受万国观念,舍弃天朝心态并引《万国公法》自我保护下,才真正的透过国际公法完成了保护华工之工作。(金观涛、刘青峰,2008 : 231)而其实华工事件只是引子,清廷真正要保护的乃是大批的“华人”,而这批华人背后所象征与隐喻的,是中国的“尊严”、“破败”与“不堪”。“尊严”指的是维持那“名存实亡”的天朝上国“薄面”;“破败”是指保护华工目的在于不让华工归国,以避免残不堪的中国经济更加危殆;“不堪”是指不仅不让华工回国,甚至还要希望他们能在国外赚取外汇,补助中国。因此从“华工事件”出发,形成“保护华工”与“保护华人”的两个面向,基本上就是在上述三个考量之下所形构而成。


而目前研究华工问题者,多聚焦于美国如何迫害华工、清廷对华工所持的态度来进行说明研究。说明了清廷从不保护华工到保护华工的心态改变、保护华工的理由、保护华工的协商过程、保护华工的结果。上述这些论述前人多已说明,但基本上乃是建立于少数文献的引证,而本文即试图通过数位人文学的方法,以可重复验证之数据,来建立前人研究结果的正当性,或是补充其不足。更希望透过这样的尝试,能够提供人文研究者一种新的研究方法与工具,是为本文之期盼,因而以下即以透过数位人文方法所得出之结果,来与前人研究对话,观察数位人文研究引入文史研究中的辅助性与可行性所在。


五、保护对象的改变

前人对于华工研究中,皆将重点关注于保护的行动与过程,透过这样的论述,读者可以拟构出一条清廷对于华工的保护心态发展谱系,但这条谱系虽然道出保护华工的发展过程,却未观察到“保护华工”背后的“不在场讯息”,即“保护”对象的转移。


本文从数据中观察出来,华工事件确实引发了清廷保护海外华人的心态,但这样的保护观念,却有一条从保护“华工”向保护“华人”移动的过程,即透过“华工事件”引发“华人意识”的发展趋势。这样的趋势,极难从人文研究者以传统阅读综理分析中梳理出来,由于时间跨幅长,且文献量多,除非浸淫日久,才有办法产生这样论述的构图,而如今透过数位协助,可以使人文研究者快速的绘出观念发展图形,并且从图形中很快的观察出一些殊异现象,而从这些殊异现象中客观的去阅读史料与进行历史解释。故由上可知,数位人文学并非以取代人文学研究为宗旨,而是以辅助人文研究者快速观察出历史殊异点,协助研究者快速进入研究焦点核心为依归,这是数位人文学发展的殷切期盼。


以下我们即从透过“共现词汇分析法”所得出之分析表中,撷取出以“保护”为主轴,搭配“华工”、“华民”、“华人”、“华商”等词汇之共现词组比例,进行历时性的排列,观察在《清季外交史料》中“保护”观念与“华工”、“华民”、“华人”、“华商”等观念共现密切度之历时性展演,并借此得出“保护”观念对象的演变过程。


如上所言,清廷对于海外华工之态度,基本上延续明清的政策,而不加以重视,之所以会在晚清有所转变,乃是由于会伤及中国之颜面,如颜清湟提到:“海外华人数量的增长,无论是通过契约劳工还是自由移民,都给清政府带来了一些问题。许多人在异乡受到虐待或被杀死,到19世纪70年代,他们的遭遇已成为国际丑闻。清政府对华工本来并无什么感情,然而,这些丑闻不仅损害了它的尊严,也有损于它的国际地位。这个新的现实迫使清政府采取一些保护措施,以保护海外华人。”(颜清湟着,粟明鲜、贺跃夫译,1990 : 12)而清廷保护对象也是有转移与扩大过程的:“总理衙门的照会与新的章程,也许是清政府对有关移民问题所曾颁布的文件中最重要的文件。这自然是清政府按照自己的主张来管理招工,并用它认为合适的方式来保护移民的第一次尝试。这也是政府首次视保护海外移民为对其臣民的应尽之责。这种责任感后来被扩大对所有海外华人的保护。”(颜清湟著,粟明鲜、贺跃夫译,1990 : 110)既然前人已看出保护伞扩大现象,但还可以追问的是这个扩大程序是如何发动?又这扩大的主要发动者为谁?即可从数位人文图示中看出。


图4《清季外交史料》华工文献中1875-1911年“保护”观念共现词频年度比例分布图


从图4中可以看到,保护观念的扩大阶段,从1875-1885年“华工”与“保护”观念共现频度有增强趋势;而1886年“华商”与“保护”观念共现频度也突显出来;而1888年“华人”与“保护”观念共现频度也有明显的高点;1893年“华民”与“保护”观念共现频度则为最高峰;而1894年“华工”与“保护”共现频度产生最高峰,而同时也伴随着“保护华民”与“保护华人”共现频度的最高峰。而这显示1894年“华工”、“华人”、“华民”三个观念在该年都有高度使用。而1896 年“华商”与“保护”观念继1886年后又再次出现高峰;而在1902年后可以看见,“保护”与“华工”的共现现象已经大幅降低,而“保护”与“华民”、“华商”、“华人”观念共现频度则增高。由上可以看出的是清廷官方的保护对象,具有一条保护意识的扩张变化,即“保护华工”的共现观念从1895年后就未出现高峰,而“保护华民”、“保护华商”、“保护华人”则从早期零星出现到1895年后皆各自呈现高峰,从这可以看出“甲午战败”后,中国自信心大受打击,而西人更加轻蔑,故不仅只压迫华工,于1895年后西人更扩大压迫对象至华人、华民与华商,故这里即可看出清廷与西方的竞逐焦点,有从早期针对“华工”至晚期针对“华人”、”华民”、”华商”的趋势。[2]


而这里可以看出华工事件所引发的一个重要观念转移,即对于华商的重视,更进一步的说,是由华商主导了整个中国对于海外华人的重视,这个关键即在于中国对于商人意识的改变。这个改变可以从郭嵩涛对于海外华商贸易之重要性强调中看出来,郭嵩涛认为:“由于贸易为一国之本,西方政府要求开放口岸,并派驻领事,以保护商人和他们的商业活动。与此相反,中国对贸易却不感兴趣,它既不想博得商人的支持,也不想去保护他们。为了补救以往的失误,中国应效法西方,保护它的那些散居海外并已数代定居于当地的商人。”从这个观点出发,郭嵩焘便要中国外交官在保护华工之外,还要发挥另一种重要作用,即保护海外华商,以求获得他们对中国经济近代化的支持。(颜清湟着,粟明鲜、贺跃夫译,1990 : 152)


由此可知,清廷对于华商观念的改变,也成了华人意识兴起的一个重点。而从“保护”与“华商”观念的结合图来看,这个结合是从1886年才开始在清廷官方史料中形成论述,故由此可知,即使郭嵩涛在1877年即已看到华商对于中国经济的重要性,但整个中国内部却要在十年之后才真正开始重视商民,而1886年这时间点,即是洛士丙冷案发生的时间,故可说“保护”观念与“华商”、“华民”、“华人” 观念之合流,乃是由于洛士丙冷惨案这事件所引起的观念内涵转移现象,如颜清湟所言:“洛士丙冷大惨案是中国改变它对保护美国侨民态度的一个重要里程碑。此案引起总理衙门和一些高级官员的很大注意,迫使他们在这一问题上采取更强硬的立场。其结果是中国获得一次小小的外交胜利——美国答应赔偿大屠杀中的受害者。这次小胜利主要应归功于中国驻华盛顿公使郑藻如和两广总督张之洞的努力。”(颜清湟著,粟明鲜、贺跃夫译,1990 : 238-239)而从上述的图示与历时性叙述中可知,清廷对于海外华人的保护具有一扩大的趋势,也很清楚可以看见发动的过程。[3]在这保护对象的转移之中,可以看见的是“华人意识”乃是从清廷处理“华工事件”中,不断的发展所产生,此即是事件引发观念形成的一条发展谱系。


六、限禁对象的改变

美国从1878年开始在加利福尼亚州提出排华法案,法案内容包括禁止华人拥有财产,禁止华人经营贸易,不准华人加入美籍,不准华人携带武器,不准华人在涉及白人的案件中到法庭作证等。并且添加这些违反美国联邦宪法的法条进入该州新宪法,提供合法性的依据,更禁止移入华人担任公共工程之工人,否则该公司会受罚。由此可以看见,美国人在当时已将所有移入美国的“华人”都视为“华工”,故而美国的“排华”并非限禁“华工”,而是扩大到整个“华人”圈,因此美国对于“排华”所排对象的扩大,也影响了中国将保护的对象从华工扩大到所有华人之上,这是美国对于限禁对象的扩大造成中国保护对象扩大的一个脉络所在。故从图 5可以看见这个限禁状况的发展。


图5《清季外交史料》华工文献中1875-1911年”限禁”观念共现词频年度比例分布图


从图5中,可以看出1878年之后,限禁的共现词频就有明显的起伏,与“限禁” 观念共现者有“华工”与“华人”,而此时“限禁”与“华工”共现呈现高频度现象,可知这组观念在当时被加以重视。“华人”与“限禁”共现频度在当时也呈现高频度现象,可见当时,美国也已经有“限禁”、“华人”与“华工”之观念是并起的。这样的现象直到1886年仍然相同,两组共现词频都维持差不多的频度,图示中可看见,“限禁”、“华人”之共现频度与“限禁”、“华工”共同出现,但这样的共同出现仍是在萌芽阶段,可以说仍未达到大量运用的自觉阶段,仅于文章中零星出现,见表12。

 

表12《清季外交史料》华工文献中1886年”限禁”共现词组重要篇章分布表


而在1889年限禁“华工”与“华人”这两组共现观念篇章散于三文,这表示限禁“华工”与“华人”的共现观念,已经在各个讨论中都被作为一个组合议题处理,唯有该共现观念开始被自觉后,才会开始呈现普遍讨论之分布,见表13。


而在1889年后相关的观念讨论又消失,直到1894年才真正大量出现限禁观念频度的跃升。故由上可知1886-1889年是华工与华人观念开始混合阶段,故而限禁华工与限禁华人的观念开始被置放在一起讨论。然而这一个现象直到1894年即有了突破,而这个突破则是由于“华工”与“华民”观念已被混一认同。

 

表13《清季外交史料》华工文献中1889年”限禁”共现词组重要篇章分布表


此时清廷已经了解到美国不仅是要针对华工进行排挤,而是对整个海外华人都有意图的进行排挤动作。当美国只是排斥华工之时,基本上中国仍会认为只是单一个案予以订法条与进行领事馆设置予以保护即可,但当意识到美国是针对整个华人圈都予以排挤之时,中国所欲保护的除了华人之外,就是中国在国际上的地位与尊严了,更包含了要维护国内财政稳定与保持外汇收入等经济因素,在这状况下,中国内部即自觉应当更积极的与美国进行谈判与交涉,在这排华问题之上。因此可以看到1894年之时,整个讨论串产生了高峰,这一年的“限禁”、“华民”与“华工” 共现高峰讨论,如表14。

 

表14《清季外交史料》华工文献中1894年”限禁”共现词组重要篇章分布表


杨儒《使美杨儒奏与美外部重订限禁华工保护华民约款折》中提到:“出使美日秘国大臣杨儒奏:为遵旨与美国外部重订限禁华工保护华民约款事。窃奴才于上年七月接任之始,时值美国迫行华工,注册新例,美西各邦纷纷拘人,方拟遣送回华,当经援引条约,严词驳诘,美外部始商允议院展限半年,被拘工人一律释放,而于注册之例坚不改移。窃念衔命远使,务在尊国体而奠民生,若前例不除,工商交病,既无以尽保卫之心,而使职所重尤在结两国之欢,亦当开诚布公,庶彼此无不达之隐。 ”(《清季外交史料1894年》)从这可以看出,当时杨儒面对的问题不仅是华工问题,而还包括着海外华工与华商,并且有关于中国国家体面,故而才与美国进行协商。可见在1894年清廷已有将“华工”与“华民”混一之观念产生,故而方派杨儒签订限禁华工与保护华民的条约。故而从上述由数位人文技术所协助制作出来的图表,有助于人文研究者可以快速的掌握关键讯息进行分析,减少了以往研究者可能得用人工耗时费工的进行大量资料之阅读后摘要、写卡片等工作,直接进入重要文本分析,且透过数位人文技术的协助,可以指出历史中的某些关键时刻以及重要观念词组,使研究者可以快速的在大量文献资料中掌握关键议题而进行处理,又以一种可验证之数据来加以佐证,可以说是大大的加速与便利了人文研究者,是为数位人文技术方法的优点所在。


诚如上述所言,中国“保护”的对象,是从“华工”到“华商”到“华人”与“华民”之过程。而从“华工”到“华人”的发展过程,其对象他者之共现,亦为可以观察之发展图像。如图6所示。


图6《清季外交史料》华工文献中1875-1911年“美国”一词共现词频年度比例分布图


而这个历时性的观念转变过程,与中国相对最为重要的他者乃是美国,故而此处我们即要透过数位技术方法来观察与“美国”这一关键词共现的关键词词频,来说明当时与美国他者共现之观念为何。从图6可以看见,与美国他者共现之自我 指涉具有一个从“华工”―“华商”—“华民”之过程。如1897年时期:“伍延芳集中抨击限制应受豁免一类的人员入境问题和在美华商受到虐待问题。根据条约权利,中国学生和商人可以自由进入美国。但是这种权利并未得到鲍得利及其支持者的尊重,他们有意识地、积极地策画完全排斥华人。伍廷芳迅即揭露他们的目的, 维护中国学生和商人的权利。”(颜清湟着,粟明鲜、贺跃夫译,1990 : 318)


在这过程中,本文观察出来,华工事件之所以作为促进华人意识的关键事件,乃是由于美国以排斥华工为由,一并的想要完全排除华人圏,而这样的态度,也使一直以来受到保护之既得利益华商权益受损,美国这样的排挤华商政策,比排挤华工对于中国的影响更大,因为排挤“华商”不仅损害到国家颜面,也会实际损害到国内经济稳定。(颜清湟著,粟明鲜、贺跃夫译,1990 : 160)故而在此关键时刻之下,由于华商对于中国内部经济的稳定具有一定的重要性,故而中国之外交策略不能仅保护华工,而因应美国对于整体中国人民的排挤,自然从保护华工扩大到保护华人,而扩大之原因,即是由于美国对于华商的排挤所导致。


从上述由数位人文技术所分析与分析出的历时性观念共现词频图的协助,研究者可以很快的掌握观念的个别与共现发展,并且可以透过可验证的数据资料,去加以佐证相关的历史论述,并且以一可验证性资料去重新架构历史观念发展的系谱,有别于传统利用少数文献加以论述之片面,透过大量资料的分析,当更可强化人文研究者将来进行历史研究中的科学性与可验证性,并且可透过这样的方法去重新检证前人之历史研究论述,加以重新确认、肯定或是重新商榷与讨论有关的历史论述,赋予历史新的讨论空间,也是数位人文学发展的一个方向所在。


七、结语

“华人”观念起源于“华工”,但其本质却是中华帝国被纳入全球化民族国家组成的世界体系的结果。无论清廷对海外保护对象的变化,还是西方对中国抵制对象的扩大,都显示出华人观念取代华工的必然性。


本文的结论是用数位方法对关键词意义结构统计分析得到的结果。它一方面表 明数据库和统计方法的运用比如Reinhart Koselleck的概念史更进一步;另一方面亦显示了数位方法对人文研究的意义。也就是说,这两者之结合并不会改变人文研究的本质,但显示了数位方法的巨大力量。


首先,整个分析离不开关键词意义分析和文本解读,其核心是纯粹的人文研究。但是,《清季外交史料》共有四百万字,以传统人文学研究法,欲研究华工事件,必得先行通读四百万字文献,进行挑选出有华工事件曾经出现之文献奏折,这个工作量虽人力可完成,但恐耗时费工,而且旁岔极多。华人观念起源过程极可能被淹没。而这时透过数位方法,可以快速的撷取出四百万字中有华工相关讨论之篇章,省去研究者通读其他较不相关文献之时间,直接可针对主题进行分析与研读。


在研读资料过程中,数位方法的运用使我们可以用关键词丛来抓住蕴含在庞大的资料中的主要观念之关联。如究竟华工议题中,又以哪些观念最为重要?而又是与哪些国家对话?又与哪些议题相关?这些疑问,传统人文研究就必须在所收集来的华工史料中,再进行第二步的阅读、摘要与写笔记。在这个过程之后,才可能提出上述问题意识的初步观察,且这个观察仍然是“印象式的观察”而非“可验证式的观察”。因此很清楚的从传统人文研究方法切入,着实非常耗费研究者之心力在初步的资料整理上,若如今因为数位方法的协肋,能够减少资料检索与整理笔记的心力,而直接投入于分析与研究步骤,想必人文研究将会有事半功倍的效益产生。


正是基于这样的理念,我们可以从人文角度出发,思考数位方法能提供什么样的数位协助,这也是数位人文研究的真正价值所在


注释

[1] 参见蔡石山:“一八五〇年代至一八七〇年代之间,一种惨无人道的贩卖人口的勾当猖獗于我国的东南沿海。这一种人口贩卖当时的人称之为‘猪仔’贩运,洋人称之为coolie trade(苦力贸易)。因为‘猪仔’贩运盛行时恰好华工大量地涌入美国,以致很多人误会移往美国的华工即是类似奴隶般的‘猪仔’,这是大错特错的误解!美国西部工人在十九世纪末叶排华暴动时,动辄宣传华工都是‘猪仔’,他们跪称所有华工都是受役于六大会馆(美国人称The Six Companies)的奴隶,所以华工都是不自由的,受人宰割的。为了解放华工,使他们重获自由,美国工人才会有排华的运动。这些冠冕堂皇的‘理由’是美国反华份子造出来辩护他们犯罪行为的护身符。 ”(蔡石山,1971,“华工与中美外交‘,《美国研究》,3,页198-199。)


[2]共现观念词组间重要性的比较,应当以单一共现观念的重要性论述为主,如说明“保护”与“华工”共现词组有一个从高到低的观念发展过程,而“保护”与“华人”共现词组有一个从低到高的观念发展过程'但不可将两个共现词组进行比较,认为这即是一种保护华人共现观念取代了保护华工的共现观念,因为比例高可能其背后数据的共现词频低,而比例低也可能实为高共现词频,若骤然进行不同共现词组比例之间的比较,恐会有所歧出,故应谨慎观察文本,观察不同共现词组升降起伏的交叉点,以交叉点的文本阅读作为根据,观察其中是否确实有共现词组之间的取代关系,如此论述将更为可靠与确证。换言之,即是在数位人文方法的协助下,再次经过人文研究者的判读与检证,即可免除误读之可能。如1896年保护华工虽然次数多,但从文本中可以看见当年华工次数多乃是因为排华法案将商人与学生纳入排斥身分中,故而当时是以华商为讨论核心,而华工的使用出现乃是出现于被当作附录之条约中,仅是一种附录引用,并非真正关注的核心。换言之,词频次数多,有可能是被作为一种次要的语汇,无任何深意的引用,然而真正关心的词汇正因开始萌芽故而次数虽少,但却可见比例跃升的过程。从此看来,词汇次数不是关键,因为可能是一种“无目的性词汇”,但却不能忽略,如“我的”一词词频必然高,但却不是一个重要且有目的性的关键词汇,而是从比例中去进一步观察观念间的起伏升降才是关键。因此本文认为所谓词汇,应有一个从“焦点性关键词汇”转向一个“非焦点性关键词汇”的过程。如华工一词虽然次数到了1896年仍多,但已非焦点性词汇,仅是讨论华商被美国列入排挤行列问题时带到的词汇,故而即使次数多,也不能将其视为比华商观念于当时更为重要。反而是在1896年甫现之“华商”一词,虽然刚出现次数很少,却每次都是“焦点性关键词汇” 的展演,故我们得知其重要性。我们日后也许观察所谓观念之间的取代过程,或许不能只以词频,而应以比例,因为比例中可以看出所谓从“焦点性关键词汇”转向“非焦点性关键词汇”之过程,此点有待讨论。


[3]如颜清湟所言:“在与西班牙和秘鲁就有关华工保护问题的整个漫长谈判中,清政府都试图为其受压迫的子民获得尽可能好的条款,但他的尝试却因西方列强公使的干涉而受到限制。尽管如此,1876年中国—秘鲁条约与1878年中国—西班牙条约的缔结,都充分表明了清政府保护华工的决心。这种保护精神后来扩大到了对世界上其他地方华侨的保护。”(颜清湟着,粟明鲜、贺跃夫译.《出国华工与清朝官员:晚清时期中国对海外华人的保护1851-1911年》,页130。)


参考文献:

王曰芬、宋爽、熊铭辉,2007,“基于共现分析的文本知识挖掘方法研究”,《图书情报工作(北京)》,51(4),页66-70。

李军莲、李丹亚、黄利辉、孙海霞、冀玉静、王钤,2010,“基于词共现的中文医学概念空间研究”,《现代图书情报技术》,26(11),页59-63。

村田忠禧,2002,“爱国主义と国际主义について『人民日报』社説を素材にした分析,《日中相互理解とデいアの役割》,日本侨报社、日中コミユニウーシヨン研究会编,页74-76。

林颂坚,2010,“以词语共现网络分析探勘资讯传播学领域的研究主题与关系”,《图书资讯学研究》,4(2),页123-148。

邱伟云,2011,“关键词丛与文本意义挖掘的尝试:以《清季外交史料》为例”,项洁等主编,《数位人文在历史学研究的应用》,页159-188,台北:台大出版中心。

金观涛、姚育松、刘昭麟, 2011,“社会行动的数位人文研究:以清末预备立宪为例”,《第三届数位典藏与数位人文国际研讨会论文集》,台北:国立台湾大学。

金观涛、刘青峰,2008,“从‘天下’、‘万国’到‘世界——兼谈中国民族主义的起源”,《观念史研究:中国现代重要政治术语的形成》,香港:香港中文大学。

曹恬、周丽、张国煊,2007,“一种基于词共现的文本相似度计算”,《电脑工程与科学》,29(3),页52-53、73。

郭廷以编,1987,《近代中国史事日志》,北京:中华书局。

郭锋、李绍滋、周昌乐、林颖、李胜睿,2004,“基于辞汇吸引与排斥模型的共现词提取”,《中文信息学报》,18(6),页16-22。

陈良驹、傅振华、杨志玮,2010,“词汇共现分析在中国大陆信息作战领域发展之实证研究”,《中国大陆研究》,53(2),页111-145。

陈钟、彭波,2005,“一种辞汇共现演算法及共现词对检索系统排序的影响”,《清华大学学报(自然科学版)》,45(51),页1857-1860 。

曾元显、林瑜一,2011,“内容探勘技术在教育评鉴研究发展趋势分析之应用”,《教育科学研究期刊》,56(1),页129-166。

杨立英,2006,“‘共现’现象研究”,《科学观察》,1(5),页10。

刘昭麟、金观涛、刘青峰、邱伟云、姚育松,2011,“自然语言处理技术于中文史学文献分析之初步应用”,《第三届数位典藏与数位人文国际研讨会论文集》,台北:国立台湾大学。

蔡石山,1971,“华工与中美外交”,《美国研究》,3,页198-199。

蔡明月,1999,“齐夫(Zipf)定律”,《教育资料与图书馆学》,37 (2),页165- 183。

颜清湟著,粟明鲜、贺跃夫译,1990,《出国华工与清朝官员:晚清时期中国对海外华人的保护1851-1911年》,北京:中国友谊出版公司。


相关推送

观念/概念史与数据库

对撞机|“数字人文研究推介”:思想史/概念史研究法的数位转向(Digital Turn)

刘青峰|为什么及怎么样建立“中国近现代思想史研究专业数据库(1830-1930)”

刘青峰|以含關鍵詞例句為中心的觀念史研究

刘青峰|引入數據庫方法對人文研究的意義


END


主编 / 陈静

责编 / 顾佳蕙

美编 / 傅春妍

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存