数字人文研究中的方法论误区及研究规范

2021-11-29 08:54张志庆张正午

现代传播-中国传媒大学学报 2021年10期

■ 张志庆张正午

21世纪,数字技术的普及为量化研究插上了翅膀,大数据、云计算等精深的名词,不再仅被供于庙堂之上,也已“飞入寻常百姓家”。在数字技术的加持下,人文学科研究突破旧有的范式,在与多学科的交合中创建了“数字人文”这一新型研究领域。数字人文研究领域一出现就展现出了强大的学术潜力,甚至有学者认为数字人文具有推动学术体系变革的力量。但是,也有一部分学者对此领域持全盘否定的态度,认为无论是其本体论、认识论还是方法论上均存在明显缺陷。二元对立之势日盛。本文将关注重点放在已有研究中的方法论误区上,并且试图通过对错误研究实践的评析建立几个数字人文研究中的研究规范。数字人文的魅力在于其无限的可能性,故而研究规范的建立不宜从上至下宽泛地做出限定,每一条规范的加入都有可能堵死研究的一种可能性。数字人文研究规范应该是建立在对错误实践的否思(unthink)上的,即通过不断界定“数字人文不是什么”来建立一套不断完善的学术规范。对其研究实践抱有最宽容之态度,对其错误及时纠偏,方才有益于数字人文研究的发展。

一、数字人文的起源及发展

数字人文是一个日益流行的人文学科研究分支,该分支有各种名称,其中包括文化分析学、文学数据挖掘、文学文本挖掘、计算文本分析、计算批评、算法文学研究、文学研究的社会计算、计算文学研究以及被用到最多的人文计算(humanities computing)、计算文学研究(computational literary studies)以及数字人文(digital humanities)等。学界对数字人文尚没有一个明确且统一的定义,大多数学者和研究者都认为,要为这一概念下个确切的定义是困难的。①因为其方法论基础还不稳定,应用领域尚未形成成熟的范式,学术共同体内部也未形成共识。②当前,对数字人文主要有四种理解方式:一是把它视为一种研究方法,通过引入计算机工具来处理传统人文研究中长期存在的问题；二是把它视为一个文理交叉的新兴研究领域；三是认为它已经成为一个学科；四是把它理解为一种实践,是充分运用计算机技术开展的合作性的、跨学科的研究、教学与出版的新型学术模式和组织形式,是一组相互交织的实践活动。③大体来看,数字人文是计算机或数字技术与人文学科交叉的学术活动领域,它包括对人文学科数字资源的系统利用,以及对数字资源应用的反思。④

数字人文这个概念在2004年才被提出,但是首次围绕计算机技术和统计方法进行人文学科研究实践,可以追溯到1949年,意大利耶稣会罗伯特·布萨(Roberto Busa,1914—2011)神父与IBM合作,以将文本转化为数据的方法,为欧洲中世纪著名的经院派哲学家和神学家托马斯·阿奎那(St.Thomas Aquinas,约1225—1274)的著作《神学大全》建立一个可被索引的数据库。布萨建立了一个团队,团队最多的时候达到60人,从1949年开始,用了将近30年的时间,在1980年才完成了56卷的托马斯·阿奎那词汇索引。他的这一创举无意中使人文学科和数字技术正式牵手,成为现今数字人文研究的始祖。随着数字技术的不断普及,可被索引的电子语料库如雨后春笋般涌现出来,到20世纪60年代,基于语料库建立的电子索引表适用于高效的量化文本分析成为可能。在这时期,数字人文主要的研究对象,是通过对词出现的频率或者词的计数,去分类作者文本,从而进行“作者身份研究”的研究。⑤其中的代表性成果是对《联邦党人文集》(1787—1788)作者身份的确定。⑥20世纪80年代,我国学者陈大康、李贤平等,试图运用此方法对《红楼梦》的著作权进行判定。⑦另外,2000年,斯坦福大学英文系教授弗朗科·莫瑞蒂(F.Moretti)在《新左派评论》发表的《世界文学的猜想》一文中提出,在“细读”的传统上,发展出一种新的“远读”的模式,即借助一些手段来忽略细节信息,从更为宏观的层面来把握文学作品的结构和意义,并且预言了以计算机和“大数据”来考察文化体系的做法。⑧2016年,派珀·安德鲁(Piper Andrew)在《要有数字》(There Will Be Numbers)中提出,数字人文的核心在于解决传统人文学科中“客观性”“全面性”的不足,以及“证据缺口”的问题。⑨自此,在数字技术的加持下,数字人文的研究在语言学、史学、图书情报学、文学、艺术学等各个领域全面铺开。⑩

二、数字与人文之争

数字人文研究源于人文学界对于研究的客观性、全面性的追求,试图基于大量数据,对充满主观性的人文学科进行量化分析,并在此基础上获得结论。具体而言,数字人文研究的核心特征有三:其一,将浩如烟海的经验材料数据化,建立数据库从而奠定分析的基础；其二,引入统计学方法论,进行数据挖掘,比较量化指标间的显著性特征,或是发现某种模式、趋势以及规律性现象；其三,研究结果的多样化、动态化呈现,可以具体表现为呈现渠道的多样化、研究内容的可视化、研究结果的动态化呈现。这就使得数字人文的研究具有跨学科甚至是反学科特征,因为要将上述三点结合起来,依照现有学科划分体系来看,需要多学科背景的研究人员协同合作,这也就导致了数字人文研究以团队制为研究主体、以项目制为基本单位的特点。但是,在多学科合作的过程中,各学科所本持的研究范式具有相当大的差别,这种差别可能体现在本体论、认识论上,但更多的是体现在方法论的差异与隔阂上。如不试图弥合这种差异,对方法论各自为政、信手拈来,则无法获得令人信服的研究结论。

目前,学界对数字人文的态度分歧极大。支持学者认为,数字人文是一场彻底的学术生产方式变革,随着学术生产资料的数字化重构,可能会打破过去自然科学、社会科学和人文学科三分的对立、割裂局面,其影响不亚于印刷媒介革命。更有甚者,认为倡导数字人文的最终愿景是进一步发展文化,进而创造文化,其影响并不亚于第二次文艺复兴。而反对学者则认为,其一,数字人文研究的影响被过分夸大了,自存在之日起,就是“只听雷声大,不见雨点来”,虽然在数量上有一些论文成果,可真正令人满意的、有价值的成果极其稀少。就连“远距离阅读”提出者弗朗科·莫瑞蒂也在采访中表示不满:“数字人文目前为自己造就了一种永久的婴儿期,总是在寄希望于未来；数字人文自己号称是了不起的新事物……但取得的成绩并不令人满意……到目前为止远低于预期……”其二,数字技术和人文主义向来分属两个不同阵营,数字人文玷污了传统的批判性态度和方法论,主观的、带有人性的、批判性的研究才是人文学科的精华。过分强调“数字”,可能对“人文”产生不利影响,甚至有学者疾呼“抛弃人性的历史学没有存在价值”。其三,数字人文是“科学拜物教”的再现,体现的是唯科学主义的“技术决定论”论调。数字人文混淆了信息和知识这两个截然不同的概念,数字人文仅仅能获取信息,却无法使信息成为知识,因为技术的功能是获取信息,人文学科才能生成知识。词频统计结果并不等同于有意义的研究结果,数字人文批评的方法论和理论前提并不适用于分析文学、文学史和语言学的复杂,其最大的问题在于本体论的缺失。

本文无意陷入二元对立的争论当中,也无意从本体论、认识论方面展开讨论,仅做方法论层面的探索。本文将从几个负面案例出发,探讨数字人文背景下的人文学科研究方法论规范,避免方法论谬误。

三、“大数据”的边界——数字人文不是数量大小

数字人文研究的首要特征就是研究实践是建立在数据库基础上的,基于大数据资料库对文本进行挖掘,以追求获得客观性、全面性。而数据及由此得出的研究结果是否具有客观性和全面性,涉及获取样本的方法、部分与整体的关系等。绝对“量”的大小不能说明问题。

以文章《多即不同:作为大数据的微影评及其远读》为例,该文声称运用了“大数据”进行“远读”,在互联网平台“豆瓣”上抓取了1500条评论进行分析,得出了电影《流浪地球》在网络舆论场中存在评论极化现象等结论。但是,首先,这个研究的所有数据皆来自“豆瓣”这一个平台,而其他不同媒介场域下的数据都没有被纳入考量范畴。特别是考虑到互联网媒介环境中的社群化倾向,导致任何平台都有其特定的“用户群”,而这一特定的“用户群”拥有相对稳定的身份特征和行为偏好,所以在单一的互联网媒介平台中收集到再多的数据都只能说明本社群的情况,而不能用以说明整体。其次,乍一看该文收集到了1500条评论，绝对数量不小,但是原文中也提到了,《流浪地球》在豆瓣上共有654914条短评,而其选取的研究对象只是“豆瓣”平台筛选后所展示的1500条。简而言之,“豆瓣”平台作为“守门人”已经将数据筛选过一遍,而研究者看到的只是平台让你看到的那一部分数据,也就是说,这1500份数据能否代表“豆瓣”用户社群都要存疑。

以上这篇文章暴露出来的就是方法论上的谬误。在统计学方法论中,存在一个核心的概念——样本。样本是总体中抽取的所要考察的元素总称,通过“概率抽样”或“理论抽样”等科学的抽样方法,从总体中抽出样本。获得样本数据之后还需要通过各种检验手段,用以证明样本具有说明整体的能力。在数字人文语境下、数字技术加持下,研究者们拥有了处理海量数据的能力,但有的研究者对样本及其抽样方法却不够重视,似乎未来的研究可以告别样本、拥抱总体。并且为区别于统计学范式,有的数字人文的研究者更是放弃了“样本”这一称谓,使用“数据”作为称呼方式和基本分析单元。但是,我们在“大数据”的乐观中必须清醒地认识到研究的范围和边界,即使一个研究分析了海量数据,也不等于分析了全部数据,研究者需要在研究中对数据的来源和范围做详细的汇报,即使数据的绝对值再大也要说明整体与部分的关系。

四、量化指标的构建——数字人文不是数据的简单使用

量化研究的本质在于对现实世界的测量,而使测量能够达成必须对所要测量的事物概念化,通过指定一个或多个指标,赋予概念一个明确的意义。通过区分概念的不同维度和确定概念的每一个指标,达成完全的概念化,通过名义定义和操作定义,使指涉的事物绝对具体、不会模棱两可。例如,在社会科学常用的量化研究方法——内容分析法中,就必须对所测对象进行极其细致的操作化定义,汇报每个概念的内涵和外延并且举例说明,使其清晰明确,这是开展相关研究的基础。同时,量化指标的形成需要一套完整的科学检验方法作为支撑。以问卷调查法为例,一份严谨的社会科学调查问卷中,每一个问题指标的构建都需要进行严谨的、反复的测量验证,以保证问卷的效度。一份具有效度的问卷需要通过测量表面效度实证测量的结果与我们的共识或我们头脑中的印象的吻合程度；通过测量内容效度检验指标体系是否详尽；通过对结构效度——包括聚合效度和离散效度——的测量,检验不同方法或相同方法测量相同或不同变量的结果是否相同或是不同。

相较于社会科学量化研究方法构建、汇报指标的严谨性,有的数字人文研究者在研究实践中的指标构建则体现出较大的随意性。以《文艺报》上发表的文章《传播学视野下的中国当代文学70年世界影响》为例,这篇研究声称,以定量方式收集数据为基础,以传播学效果研究的理论框架,评估中国文学70年的世界影响。文章将中国文学70年的世界影响划分为传播范围的大小,专业研究、评价的有无,读者反馈的多寡三个指标维度,随后分别罗列了传播范围大小的一些数据、评价的一些数据、读者反馈的情况,得出了《白毛女》至《三体》一至十名的影响力排序。该文除了存在上文所述数据库使用单一、只注重绝对值和未能说明所用数据和整体数据的关系外,还存在未对使用的概念进行清晰的定义、三个指标维度的建构极其随意等问题。具体而言,其一,传播范围的大小只是数量的关系,量大的未必效果好,量小的未必影响差,传播数量的大小本身说明不了传播效果。其二,该文所述专业研究、评论的多少和有无依旧只注意了数量多少,而专业评论的长短、褒贬,在这个研究中并没有进行区分。其三,在读者反馈的多少这一部分中,文章并没有区分作品生产的时间和读者反馈的时间,读者反馈的内容也被排除在外,依旧只关注反馈数量多少问题。读者反馈的长短、喜欢的原因及其程度以及如何区分等,我们都看不到。其四,该文还存在关键指标维度的缺失。以传播学效果研究的理论,评价中国文学70年的世界影响,仅用以上三个指标维度是显然不够的,有一些关键指标维度未被纳入考量范畴。比如,作品的典范性、美誉度和传阅度三个维度,每一个维度相应的指标及其主观赋权和客观赋权的权重。这个研究应该但是没有说明的是:第一,资料库的范围是什么、总量是多少；第二,用什么软件分析的样本；第三,如何将评价分类的。另外,基于量化研究方法的效果研究一般采用问卷调查法或实验法,这个研究都没有采用。比如,通过问卷调查法,才可能从认知、情感、行动三个层次列出读者反馈的强度、价值取向等指标,获得量化数据并分析之。

基于以上分析,这篇文章的结论也许没有错,最后提出的两条启示也很振奋人心,但是,这些都不是来自本次研究活动本身。因此,本次研究活动是不成功的,结论和启示是没有学术价值的。这里并不是说该研究完全没有意义,从而对其全盘否定,而是强调指标构建中的科学性问题以及学术生产、汇报流程的严谨性问题。

指标维度构建的随意性会使测量工具或手段不能准确测出所测事物,从而导致研究失去效度。主要检验研究有效性的效度有四种:表面效度(face validity)、标准关联效度(criterion-related validity)、建构效度(construct validity)和内容效度(content validity)。其中,在数字人文研究中内容效度最值得被关注,为保证内容效度,数字人文研究可以参考量化研究方法对于测量指标维度构建的流程。首先,发展阶段,研究者通过对所测事物概念化和维度分析确定该概念应包括哪几个维度,然后,根据概念的性质确定每个维度包括哪些条目,形成条目池。其次,评判阶段,邀请相关领域专家,组成五人以上十人以下的专家组共同评判,通过内容评定问卷填写各条目评价表。最后,效度计算,测算评定者间的一致性,随后进行内容效度指数(CVI)测算,达到相应数值标准,建构完成。

五、结语:从休谟问题谈起

现代人文学科的根源可以追溯到文艺复兴时期,在人文主义思想的指引下,中世纪教会统治下的神权世界观在以人为中心的世界观面前受到巨大冲击。早期的人文主义经历近七个世纪的发展形成了今日璀璨的人类学术文明。在此过程中,人们学会了划分“实然”和“应然”,并将讨论“实然”的部分划出了“人文”的范畴。这种趋势在17到18世纪初见端倪,最终在19世纪末,细分的人文学科从自然科学和社会科学中脱离出来,形成了今天的学术体系。人文学科探讨人的本质,社会发展历程,社会价值体系、管理体制,人的精神世界,创造能力,心理机制等等,其伟岸之处在于批判性地思考人及其社会,指引人类文明朝“应然”的方向前进。

18世纪英国哲学家大卫·休谟(David Hume,1711—1776)指出,对于道德问题,科学是无能为力的,科学只能回答“是什么”的问题,而不能告诉我们“应该怎样”,“事实”命题不能推导出“价值”命题。这一论断对于数字人文的研究极具启发。数字技术赋予了人类前所未有地把握整体世界的能力,但是,这种把握即使能够了解世界的全貌也只是“实然”层面上的,而不是“应然”层面。然而“实然”不能等于“应然”,更不能推断出“应然”,尤其是在涉及价值判断的研究中,此二者的界限必须明确。自2008年始,中国的数字人文研究实践发展出文学“排行榜”这种研究实践,这种研究实践本质上是一种建立在客观数据基础之上的主观评价模式,具有典型的中国特色。这类研究应该特别注意上述三个问题:所用数据库是否得当,能否用以说明整体情况；指标建立是否科学,是否遵循严格的学术流程,每个流程是否进行了详尽的汇报；“事实”和“价值”的界限是否清晰,是否有用“事实”推断“价值”的情况存在。

总体上看,数字人文作为一种方法论创新是有价值的,创新并不意味着放弃原有的人文学科的研究方法,而是对原有人文科学研究方法的必要补充,使研究的论据更加充分。本文所指,只是数字人文研究中方法论上几个显见的谬误,随着数字人文研究的不断发展,更多潜在的问题将会浮现。学术成果的动态化呈现——随时补充、修正研究成果——是数字人文研究的最大特色之一,数字人文的研究方法规范也应该符合这条特征,故而本研究是一份“永远未完成”的研究,仅做抛砖引玉之效。但是数字人文的创新意义远不止于方法论层面,数字人文更深远的意义在于学术生产方式和学术呈现方式的创新。学术呈现方式的创新意义在于,打破了将书籍、论文等传统印刷媒介作为单一学术呈现方式的现状,使网页、视频、VR等多元媒介渠道作为学术呈现方式成为可能。跨学科、项目制的学术生产模式打破了19世纪以来泾渭分明的学科体系划分,在数字人文的带动下,跨学科融合的学术生产模式变革呼之欲出。但在融合的过程中我们必须警惕,几个世纪壁垒森严的独立学科发展,使每个学科都形成了一套独特的学术范式,融合的过程也必然导致范式间的杂糅、扬弃和创新,尤其是在使用新的方法开展研究的时候,每一个步骤都应该仔细考量,检查是否符合相应的学术规范,从而避免一些主观臆断的、情绪化的推论和判断。

注释:

① 张墨研:《数字人文的本体论反思——以意识形态批判的批判为起点》,《理论月刊》,2020年第8期,第120页；郭英剑:《数字人文:概念、历史、现状及其在文学研究中的应用》,《江海学刊》,2018年第3期,第190页。

② 刘炜、叶鹰:《数字人文的技术体系与理论结构探讨》,《中国图书馆学报》,2017年第5期,第34页。

③ [美]安妮·伯迪克等:《数字人文:改变知识创新与分享的游戏规则》,马林青、韩若画译,中国人民大学出版社2018年版,第2页。

④ Caldeira,S.P.DigitalHumanities:KnowledgeandCritiqueinaDigitalAge.Communications-European Journal of Communication Research,vol.45,no.2,2017.pp.267-269.

⑤ 戴安德、姜文涛、赵薇:《数字人文作为一种方法:西方研究现状及展望》,《山东社会科学》,2016年第11期,第29页。

⑥ Mosteller Frederick,David L.Wallace.InferenceinanAuthorshipProblem:AComparativeStudyofDiscriminationMethodsAppliedtotheAuthorshipoftheDisputedFederalistPapers.Journal of the American Statistical Association,vol.58,no.302,1963.pp.275-309.

⑧ Moretti,F.ConjecturesonWorldLiterature.New Left Review,vol.l,no.1,2000.p.54.

⑨ Piper Andrew.ThereWillBeNumbers.Journal of Cultural Analytics,vol.1,2016.pp.1-10.

⑩ 陈海玉、向前、万小玥:《数字人文视域下抗战档案资源的开发策略与路径研究》,《山西档案》,2021年第3期,第71-72页。