查看原文
其他

对撞机丨霍伊特·朗、苏真:​信任计算文学研究

霍伊特·朗、苏真 零壹Lab 2022-10-08

《批评探索》杂志在2019年春季期刊出了笪章难的《以计算的方法反对计算文学研究》一文,这篇文章对计算文学研究领域提出了若干挑战。文中第一句话评论道:“本文意在从实证层面找出一个日益流行的文学研究分支的一系列技术问题、逻辑谬误和概念缺陷,该分支有各种名称:文化分析学、文学数据挖掘、定量形式主义、文学文本挖掘、计算文本分析、计算批评、算法文学研究、文学研究的社会计算、计算文学研究等。”文章刊出后,在数字人文计算文学研究领域引发了广泛的讨论。为了继续这一对话,《批评探索》邀请了几位数字人文和比较文学研究从业者和批评家对此作出回应。讨论围绕笪章难的计算方法和理论预设展开,并就数字人文文学研究对人文学发展的意义展开积极的回应。这是一次难得的既有统计技术方法,又有历史和理论意义的关于数字人文文学研究及其与人文学关系未来发展方向的学术讨论,会继续推动数字人文文学研究的朝着有利于人文学研究的方向发展。


本期讨论文章由汪蘅翻译,姜文涛审校。

霍伊特·朗(Hoyt Long),芝加哥大学东亚语言与文化系副教授,研究领域包括日语文学研究、媒体史和文化分析学。

苏真(Richard Jean So),麦吉尔大学英语和文化分析学助理教授,研究包括用计算方法研究文学和文化、当代美国写作和种族问题。

笪章难的《以计算的方法反对计算文学研究》在过去反对文学计算方法的论战中很醒目,因为它自称要严肃对待计算。它承认,严肃从事此类研究意味着要发展统计及涉及其他概念的素养。她的论文许诺要让争论超越对数字的断然拒绝、转向关于研究可否科学重复的对话,这是这种辩论朝前迈出的对于批评有益的一步。


但其效用终结于此。“不要相信数字,” 笪章难警告说。或者,“不要相信他们的数字,相信我的。”但你应该这么做吗?如果你相信他们的数字,她暗示道,那么计算方法的整个立场就分崩离析了。相信她的数字,你会发现这一点。但她的数字无法信任。笪章难对文化分析学领域14篇文章的批判充满技术和事实错误。这不只是关于细节的争吵。这些错误反映出基本统计概念理解的缺乏,类似于文学研究的外人把乔治·艾略特称为“著名男作家”。[1]更让人担心的是笪章难没能将统计方法理解为与语境相关的、历史的和阐释的项目。坦率地说,论文最大的错误是人文主义错误。


 这里我们关注的是笪章难和预测模型有关的错误。这是她在批判的我们的两篇文章中使用的核心方法。在《湍流》中,我们用13个语言学特征建立了一个意识流(SOC)叙事模型,发现其中10个合起来能可靠地区分我们确定为SOC(和现实主义小说语料库中的篇章相对比)的篇章。类符—型符比(TTR)是词汇多样性的测量,是其中最有区分力的,尽管它本身并不提供信息。我们在论文里仔细解释过了,这个预测模型的目标在于理解多种特征如何协同辨认风格模式,而不是单独辨认。笪章难批判中没有什么内容表明她意识到了这个基本原则。


其实,笪章难只质询了我们模型中的一个特征(TTR),并认为修改它就会让我们的建模失效。具体来说,她检验了TTR和SOC之间的强关联在移除她的“标准终止词列表”中的词语后是否依然成立,而不是移除我们使用的终止词列表的词语。她发现它不成立。这里有两个问题。首先,TTR和“TTR减去终止词”是两个分开的特征。我们在模型里确实纳入了这两种,而且发现后者有最低的独特程度。第二,尽管检验特征鲁棒性的本能是恰当的,但断言存在一个应该普世使用的“标准”终止词列表就是拆台了。我们的列表是特为用于19世纪和20世纪早期小说而创建的。就算有正当理由采纳她的“标准”列表,也必须重新跑模型、检验重新测量的“TTR减去终止词”特征是否改变了整体的预测精度。笪章难没有这么做。这就像随意拨弄钢琴的一只琴键,还没弹另一个音符就宣布整个乐器走调了。


但是错误还不止于此。批判《文学模式识别》时,她试图让我们的模型分类英语俳句诗和非俳句诗的鲁棒性失效。她的办法是创造一个新的“中文对联英译文”语料库,在这个语料库上检验我们的模型。为什么这么做?她表示这是因为它们充满了和英语俳句“类似的意象”,也很“亚洲”。这个误入歧途的抉择有东方主义的气味。它完全抹去了语境和历史,提出一个实际不存在的本体论关系。这就是为什么我们花了超过12页篇幅从批评和历史的角度叙述英语俳句形式。


这些错误代表了一种始终如一的拒绝:拒绝将某人的阐释实践置于语境和历史中考虑(确实去“好好解读”),不管是统计上还是人文上。我们不相信存在“客观上”好的文学阐释或者存在一种“正确的”做统计分析的方法:笪章难的立场是多数科学史家和多数统计学家本人都会拒绝的。文学和科学的惯例都是持续争论和重新阐释的,而非从高处传下来。和文学研究一样,统计学这种知识体系形成于乱糟糟的学科史和不同的实践群体。笪章难的论文坚持一种非常固执的、“客观的”、黑白分明的知识版本,这种倾向同统计学和文学研究全都完全相反。这种版本的故事不怎么让人信任。


[1] 乔治·艾略特(George Eliot),英国19世纪著名女作家玛丽·安·伊文思(Mary Ann Evans, 1819—1880)的笔名——译者注。

END

主编 / 陈静、徐力恒

责编 / 刘双双

美编 / 刘双双

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存