在“ 远读”与细读之间
——“数字人文”与数字时代的文学、历史研究

2023-12-18 14:11:30
南通大学学报(社会科学版) 2023年6期
关键词:人文学术数字

王 贺

(上海师范大学 人文学院,上海 200234)

关于“数字人文”的定义和起源,历来多有学者讨论,可谓聚讼纷纭、言人人殊。除了成文的论文、著作,大量的研讨会,在每年4 月的最后一个星期四,亦即“数字人文日”(Day of DH)前后,不同的学者在Twitter、Instagram 等社交媒体上,用一两句话、几句话或一篇博客文章的篇幅,热烈地发表着自己最新的理解、认识和定义,也将世界各地、各个领域不同的数字人文理论、方法、实践与研究案例、项目等,集中呈现在我们面前,蔚为一时之盛。而对此一问题,笔者亦曾有过如此的扼要论述:

如果非要给“数字人文”(Digital Humanities,简称DH)下一个最简明的定义,那也许就是用数字的方法研究人文学术。但究竟什么样的方法才算是数字的方法?尽管众说纷纭,一个确定无疑的前提则是大量文本、文献的数字化。也就是说,是数字文献的诞生,才促成了数字人文研究诞生的可能。

与传统的文本、文献的载体及存在状态不同,随着媒介与通信技术的革新,特别是互联网和个人电脑的普及,以二进制数字代码形式记录于磁带、磁盘、光盘等载体,过计算机系统存取并可在通信网络上传输的文本、图像、音频、视频等数字文献(digital document,也被称作“电子文献”,其中一部分还被称作“网络文献”),已逐渐成为当代文本、文献的主流形式,且在不断挤压传统的文献载体及其存在状态,这势必给学术界带来新的机遇与挑战,甚至也被称作新的“学术革命”发动的契机。[1]

但数年之后重新来看,这样的理解还需要作出一定的修订和补充。此即我们应该在数字化的发展之外,考虑到数字技术、方法,尤其是非人文社科领域的计算、运算技术和方法的发展给人文社科领域带来的巨大启发(这让我们联想到在“数字人文”这一术语流行之前,一度通行的另一术语“人文计算”)。但是,无论其受何种影响而生,作为一种新的学术视野和研究方法(当然我们也可以将其理解为一个学术领域、一种学术生态……),“数字人文”究竟能否为数字时代的知识生产与人文学术创新提供新的可能?其又将通过何种方式提供哪些新的可能?数字人文研究的价值意义究竟何在?对于这些基础的、核心的问题,近年来中国大陆兴起的数字人文研究热潮中,虽不免有所聚焦、分析,但多出自信息管理学科(含图书馆学、情报学、档案学)研究者之手,较少从人文学术的本位出发而进行深入讨论,亦有不少可以丰富的论述空间。

而从人文学术的立场来看,笔者以为,“数字人文”已经且将在以下四个方面,为数字时代新的知识生产作出自己可能的贡献。为了说明这一观点,我将分别举出五个研究案例来逐一进行解读,它们也许不仅可以说明“数字人文”在这些案例所在的领域已经取得的成就,同时一旦被我们联系起来、作为一个整体看时,也似乎能够帮我们绘制一幅“数字人文”对于人文学术(以及相邻的社会科学、自然科学领域)知识贡献的全景图。这五个有一定代表性的案例,分别来自文学历史、新闻传播学、语言学和认知科学(cognitive science)领域,如所周知,它们大多是既有各自的独立性、又有一定关联的传统人文社科学术领域,当然也不乏旨在探究人脑或心智工作机制的文理交叉领域,如语言学和认知科学的跨学科研究项目。但是,无论是在上述哪一个领域、项目当中,“数字人文”取向的研究,几乎都已有相当出色的运用和发挥,为我们呈现出传统的人文学术研究之外一大片新的、无边的胜景,孕育着种种新的希望和生机。

一、对既有研究成果的验证

在中国人文学术传统中,除讲求证据、偏重文献的文献学和考证学,及文字学、音韵学、训诂学、语言学等少数领域外,其他许多研究领域,无论是基于何种视角、方法、问题意识及学术背景、训练,一般均缺少“可重复性研究”(reproducible research)。其研究无须实验(相反这是科学研究中,自培根时代以来最为深刻、不可缺少的活动[2]117),研究结论也不能证实或证伪,具有强烈的先验色彩和相当的主观性,不同学者的理解时常不同,以致陷入“此亦一是非、彼亦一是非”的尴尬境地。但自然科学和社会科学的研究与之不同,多强调悬置研究者的主体性和价值判断,甚至将其视为进入一项研究的前提和基本规则,追求研究的科学性和客观性,尽量保证研究的“可重复性”。事实上,关于学术研究应强调和支持“可重复性”的论述,从20 世纪的心理学研究领域开始,而今已弥漫到几乎各个学科、专业,重视和坚持“可重复性”,已成为诸多学术领域的铁律和基石之一(reproducibility,rigour,transparency and independent verification are corner stones of the scientific method)。[3]而研究论文的“可重复性”,是其中最重要的基础。

所谓的“可重复性”,也就是他人能够用作者提供的同样的研究方案、模型和材料、数据,将研究结果重现出来,能够证明其研究设计是否合理,结论是否能够成立、是否准确可靠等。论文的“可重复性”,需要作者对研究使用的资料和数据、研究过程和统计分析方法等,提供清晰、严谨、详细(有时是简明扼要)的描述和说明[4],否则将给其他学者重复实验、研究带来很大困难。但正如《自然》(Nature)杂志的一篇社论所言:“当然,仅仅因为结果的可重复并不能使研究正确,仅仅因为结果不可重复也不能说明研究本身一定是错误的,……透明和严格的方法几乎总是能揭示可重复性问题。这种观点确保了科学通过独立的验证、修正和对结果数据的客观检查,不断向前发展。”[3]目前虽已有一些专业期刊在这方面进行探索(如在发表论文的同时,还发表评审意见、论文修改说明、修改后所产生的不同版本的论文,公开其研究资料和数据等),但仍不能避免一些研究“可重复性”差的问题,尤其是“随着新的技术、方法的复杂性的不断增加,研究设备的日趋专门化,‘可重复性’研究发现正面临着越来越多的挑战”[5]。2015 年8 月,“开放科学合作”组织(The Open Science Collaboration,简称OSC)在《科学》杂志发表的一项研究便指出,在该组织重复了98 篇刊登在《心理科学》(Psychological Science)、《人格与社会心理学》(Journal of Personality and Social Psychology)和《实验心理学杂志:学习、记忆与认知》(Journal of Experimental Psychology:Learning,Memory,and Cognition)三大心理学领域顶级期刊的研究论文之后,竟发现只有36%的实验结果能被重现,不少论文的研究结果不仅“可重复性”差,且重复后的结果与原论文的研究结论相反,为心理学及整个社会科学界敲响了“可重复性危机”(replication crisis)的警钟(不可否认的是,也有学者认为OSC 的这一实验结果同样疑点重重,而且与其他领域相比,心理学领域的36%的“可重复性”并不低。2016年3 月,哈佛大学Daniel Gilbert 团队即在《科学》发表评论,指出该研究未能严格遵循科学尤其统计学研究规则,存在着样本误差、统计功效低、偏见等问题,因而不免低估了心理学实验的可重复性。此后,双方再次展开论辩。但关于“可重复性危机”的讨论,自此亦从心理学领域蔓延至整个社会科学界)。

但即便如此,无论是中国人文学术界,还是西方人文学者,大多对此仍无动于衷。当然这首先与人文学术研究的特性有关。作为人文学者,我们深知,其中有不少核心议题(如什么是人性?什么是真?什么是善?什么是美?)无须也可能根本无法进行实证性的研究,而更多地是一种反实证、非历史、非科学的研究(尤其是文学批评、哲学研究、艺术研究)。数千年来如此,中西亦然,因其旨趣亦并非理解自然世界,为人类创造更多的物质财富,而是精神财富,是为提高人们的人文修养和对审美能力,理解人类自身[6]37。不过,也不尽然,“数字人文”研究的兴起,就启发我们对上述议题尝试作出新的、探索性的、实证性的研究,如将“什么是人性”这一问题,转换为大规模文本语料库中关于“人性”这一术语的使用情况的数据挖掘、分析与可视化,从而在传统的、分别阅读哲学经典并对其进行文本细读之外,另辟蹊径,从数据角度发现“人性”话语、论述被建构的历史和特点,从而为提出新的理解、观念奠定坚实基础;同时,另外一些偏重于历史和事实层面的议题,则可以进行实证分析,并取径“数字人文”,作出量化统计分析和新的解释。本文在此要提出讨论的是,“数字人文”的研究,实可为我们验证既有的某些研究结论(无论这些研究是传统方法还是量化分析、实证研究的结果),帮助我们部分地实现人文学术领域的“可重复性研究”这一目标。

例如,对什么是“文学经典”或是一部“杰作”的标准,长期以来,只有理论的说明和阐释,缺乏基于数据的、量化的统计与分析。但一项对20 世纪欧美文学史上公认的伟大作家的167 部作品的计量文体学(stylometry)研究表明,“那些佳作,也就是伟大作家的伟大作品,确实较少使用以ly 结尾的副词”[7]12。这一研究结果(图1)不仅证明了海明威、斯蒂夫·金等诸多作家关于创作应该尽量精炼、节制的观点,也为定义“文学经典”提供了一个可重复验证的标准,亦即“从另一方面说,过多使用副词的作品难以进入伟大之列”[7]12。当然,我们必须承认,这只是评判一部作品究否为“文学经典”或“杰作”的诸多标准之一。作为一项经由定量研究得出的判断标准,它不必也无法替代我们熟悉的那些乍看有些主观、其实具有相当的客观性的标准,如这部书是否能够激发不同时代、世代的读者的阅读兴趣,或是这一作品被权威批评家、文学史家反复解读、论述的情况等。

图1 每10000 词中的副词数量

二、对老问题的重新诠释

对既有文本、文献和问题的重新解释、诠释,既构成了人文学术“常规学术”(请允许笔者在此借用托马斯·库恩的这一术语)的特色,也成为我们至今仍在吸收、转化的重要思想遗产。以对“文学经典”的批评、诠释而言,不仅每一“经典”文本本身至今仍在诱发我们不断重新作出诠释,而且,历代学者、读者关于这一“经典”文本的解释、诠释(诠释的诠释)同样也成为叠加在这一文本之上,影响我们作出新的诠释的重要依据。由此,无论是新历史主义、后殖民理论批评者,还是包括哈罗德·布鲁姆、宇文所安等人在内的诸多批评家、文学史家,均提出了重视文学经典、文学史的建构性这一洞见。但这也同样适用于学术史、思想史的研究,亦即对于“学术经典”的研究。

为了更好地理解文学经典、学术经典,传统的人文学术领域发展出了以文本解读、细读为核心的一整套研究方法、技艺(如原型批评、符号主义和叙事学、话语批评和谱系学等等)。习得并娴熟地运用这些方法、技艺,对老问题(如上文提及的、古今中外的人文学者都在追问的“什么是人性”)作出重新诠释,成了人文学术的一大主流。虽然有时候,一些方法(如以古典文献为研究对象而建立的文献学研究方法)可能显得有些陈旧、不甚时髦,但这也并不妨碍学者们将其移用于其他的领域(如现代文献学),并将这一方法进行改良,推陈出新,努力发展成为一种新方法(如将校勘学方法发展为校读批评,一种文学批评、研究方法[8])。不过,总的来说,传统的人文学术研究者,在试图探求文学经典、学术经典的建构性,展开文学史、学术史、思想史的研究时,仍多采用的是非量化研究的方法,有些时候甚至是感想、体会,是对某种意识形态、某项政策的包装和论证,一如“中国社会科学研究没有规范、不用数据、不用方法”“研究者可以随心所欲,想怎样做就怎样做,论文想怎样写就怎样写,话想怎样说就怎样说”[6]41。这样的现状,自然难令新一代研究者(尤其是接受过严格、完整的现代学术训练者)满意,同时也给了“数字人文”研究以腾挪趋避的空间。

以对法兰克福学派的起源和发展过程的研究为例,一项关于该学派主要哲学文本的“文化制图学”(cultural cartographies)分析[9],就挑战了我们关于该学派甚至中外任一学术流派传承有序、前后有别。其中前辈学者的学术思想,自然地随着历史和时间的推移,而不断地被后之来者予以吸收、承继、强化等固有认识。该研究发现,一般所认为的第二代法兰克福学派代表人物哈贝马斯从叔本华那里汲取思想资源、重建其新康德式理性与伦理理论的观点,是完全站不住脚的。实际上,在哈贝马斯《沟通行动理论》一书的关键一章里,叔本华连提都没有提到,但这并不是这一研究的重点,尽管它向我们说明了叔本华与第二代法兰克福学派之间可能的微弱的建构性。

更重要的是,通过这一研究,我们至少可以发现三个有趣的现象。首先,三代法兰克福学派的确共享了许多重要的学术观念,其中system,social,action,life world 是最为重要的,它们连接起了其他14 个重要的概念(图2)。继而可以发现,尽管阿多诺、霍克海默(第一代)讨论的主题、概念,也会在哈贝马斯(第二代)和霍耐特(第三代)身上体现,但世代不同,发展也有所不同。也因此,不仅不同世代的法兰克福学派的学术旨趣和研究重心的差异,可以非常直观、明显地呈现出来,而且它们之间的彼此联系(不同节点之间的连接的强度,有强有弱)、特别是第一代和第二代、第二代和第三代、第一代和第三代这三组不同世代之间的思想渊源,同样可以一目了然地看出(图3)。[10]这种研究取径,在社会学领域,也被称为“文化社会学”的形式主义分析、量化分析。但无论我们对其如何界定,它的核心方法是社会网络分析(social network analysis),是将这一方法运用于学术史、思想史研究领域的结果,而这正是“数字人文”研究目前发展较为活跃的一个方面。显然,对于理解法兰克福学派这一当代西方马克思主义学术共同体(学术流派)的承传、变化而言,在传统的文本解读方法之外,“数字人文”的研究取向,为我们给出了另外一种诠释,一种不同于既有的文本诠释之外的新诠释。这样的诠释虽然仍有大量的文字论述,但往往也是由数据、图表所表征的,是量化的、可视化的,是以图为主的,而非是古代读者所青睐的左图右史(文)、图文(史)互证式的,或纯粹是以往我们所理解的“图像转向”在学术研究领域所产生的影响。似乎可以说,在某种程度上,这些数据、图表等可视化结果,连同研究者对它们的解释一起,为我们创造了一种新的、由图像叙事和数据叙事结合的诠释模式。尽管这一模式并未被人文学术界广泛接纳,其科学性、有效性还有待发展、检验,能否用以完成复杂话语的建构还有待实践,但从很多方面来看,已与传统的诠释模式(即以纯文字叙事和将图像视作可有可无的插图作为其叙述、论证模式的补充)大异其趣。

图2 三代法兰克福学派的核心概念网络

图3 三代法兰克福学派概念的共享网络

三、帮助学者提出新问题

无论人文学术和科学研究之间的距离有多远,也无论中国社会科学距离真正的社会科学乃至科学研究本身还有多远[6]2-3,科学家和人文学者之间,至少都拥有一个共识,那就是:在学术研究中,提出一个新问题、好问题、真问题、正确的问题(这四者当然并不是相等的、同样重要的,但本文在这里强调的主要是第一、四方面),远比分析、解决来得更为重要(当然,对于科学家来说,提出一个正确的问题还不够,这仅仅让他们在做出重大贡献的道路上走了一段路,而非全程。他们还必须能够抓住正确的答案[11]178)。无数第一流的学术成果,都缘于对一个新的问题的提出。与传统的人文学术研究相比,“数字人文”在这方面也提供了一些新的可能。

以中国现代文学研究中的鲁迅研究为例,今天已经完全是一个国际性的学术研究领域,来自不同国家和地区、不同母语背景的学者,发表了大量的研究成果。但这些汗牛充栋的论著,和传统的现代文学研究一样,绝大多数都是以文本解读、历史考察和文献考辨(如下文所述,后二者也是在前者的基础上建立的,核心仍为文本解读,以及归纳、演绎,而非实验的、统计的方法)为方法而建构的,其研究成果的呈现形式也很难称得上是可视化的。但这一情况最近发生了改变[12],例如,“澎湃新闻”数据新闻部门的从业人员,就对鲁迅《呐喊》《彷徨》《故事新编》三部小说集的33 篇小说,作出了初步的文本挖掘、数据分析及可视化,完成了一篇数据新闻报道(图4)。该报道中提出的一个问题是:在鲁迅小说中,哪种颜色提到最多?(图5)他们发现,鲁迅“使用的颜色词达76 种,共使用721 次,不仅涵盖了黑、白、红、黄、蓝、绿这六大类与人类生活密切相关的基本颜色词,还以基本色为焦点运用到花白、青白、土黄、橙黄、桃红、肉红、灰绿、石绿等具体的色彩层次上。……鲁迅小说语言中使用最多的颜色为白、黑、红,分别占31.90%、19.56%、17.34%”[13]。循此,作者也进一步对这一结果作出了一定的解释,虽然我们未必同意其具体的解释和分析(如认为其白色意象或隐喻缺乏生命的活力或者死亡,或隐喻凶残恐怖,或隐喻腐朽、愚昧、落后;黑色隐喻着社会环境气氛,渲染阴森、罪恶、邪恶、死亡、恐怖的氛围;红色则隐喻着精神病态和精神创伤,也就是在封建礼教制度的束缚和压抑下;广泛运用白、黑、红三种颜色为主的色彩意象,与鲁迅家乡浙江绍兴的地方戏中角色的装扮色彩密切相关),但就通过这一方法而提出的鲁迅创作的色彩感这一问题本身而言,仍不失为一个新的问题。管见所及,至今尚未见有中外学者对此进行深入研究,一些初步的、从传统的文学批评出发的研究,不必说其具体结论的可靠与否。即便是对鲁迅文学中不同色彩的分类统计(这是此一研究——无论是定量研究,还是文本解读——的基础和前提),有时候都未免有些主观、任意。

图4 数据新闻报道封面

图5 鲁迅小说中颜色使用情况统计

如果说这个来自数据新闻领域的案例,可能还显得不那么“人文”“学术”的话,一项基于新数据而进行的关于印刷术与科学革命之间关系的最新研究,也许能够更加充分地说明“数字人文”可以帮助我们提出新问题这一观点。2019 年,长期致力于这一研究领域的学者杰里迈耶·迪特马尔(Jeremiah Dittmar),利用三类新数据,对这一重要议题进行了新的、系统分析[14]。例如,在其自书商、藏书家和大学图书馆留存的记录中所搜集到的14-17 世纪近1500 种书籍价格(被换算成统一的价格,每一书籍均按Universal Short Title Catalogue 数据库分类标准进行分类,将其归入三十七类之中,并匹配开本、材质、出版时间、是否彩印、有无插图等信息)的统计分析中,我们可以明显地看到,1460 年之后印刷术在欧洲的传播与14—17 世纪书价的下降有关(图6)。换句话说,究竟是书籍价格普遍下降才促成了印刷术的广泛传播,还是说印刷术的重要贡献在于大幅降低传统书籍的成本、价格,这一问题在此被“再问题化”。

在此基础上,作者又统计了欧洲多国科学书籍的出版情况变化情况,并利用其他两类数据(一类是意大利7775 名教授的生平,包含薪金、书籍发表和任教学科等信息;一类是14 世纪末至16 世纪中期德国17 所大学逾20000 名学生的个人信息)进行了统计分析。其研究发现,1460 年之后印刷术在欧洲的传播,除了与14—17 世纪书价的下降有关,还受到以下因素的影响:科学著作出版的兴盛;大学教授,尤其是科学教授薪金的提升;选择科学职业学生比例的上升。[15]从这些更加多元的角度出发而作出的分析中,作者发现:“早期推动印刷术迅速散播的动力是当时欧洲城邦经济的发展,贸易往来的繁荣,促成了人们对掌握商业技能与规则的旺盛需求,因而各种与商业有关的手册以及与利润计算相关的教科书颇有市场,它也在很大程度上刺激了底层阶级的识字教育需求,推动了面向底层的城市学校的发展。学校教育的扩展,反过来又一定程度上刺激了印刷产业的扩张,从而形成了一种互为因果相互影响的放大效应。”[16]

事实上,无论我们是否同意这些经过量化研究所得出的具体结论,这一研究都向我们提出了理解印刷术与科学革命之间关系的新的分析角度,以及诸多可以进一步思考的问题。如书籍价格的下降,与印刷术的传播,究竟是一种相关关系,还是因果关系?迪特马尔的研究挑战了学界此前所拥有的共识——二者为因果关系,是印刷术的传播促成了书籍价格的下降——这一假设在中国近现代印刷史、出版史领域也广泛存在。但事实是否如此?在由较高的抄本价格向印刷书的价格下跌的过程中,是否还有其他的影响因素诸如熟练的印刷工人的薪水(其上升趋势并不明显),抑或是当时欧洲各地的社会主流观念还相当赞赏抄本书而非印刷书参与其中?大学教授、学生和书商的借阅、购买记录是否能够用于充分地论证和说明城邦、城市的识字率、读写能力?……诸如此类的问题,我们还可以提出很多很多,但这恐怕是研究者在单纯人工阅读相关著作、文献史料时难以提出的,倒是借助于“数字人文”研究成果的刺激、启迪,将其再次“问题化”。当然,如果人文学者只一味地满足于对数字资源的信息检索,而不能往前一步,走向语义分析,走向文本数据分析、挖掘,或许也同样难以提出类似的、新的观察。

四、藉此探索新的研究方法/范式

如上所述,在传统人文学术研究领域,主要的研究方法为文本解读,所有的文学批评方法、哲学和历史研究方法、语文学和文献学的方法、文化研究方法,几乎都是在此基础上得以发展而来。无论是对于《诗经》《论语》《理想国》《伯罗奔尼撒战争史》,还是最新的一部长篇网络小说、一则电视广告、一张街头海报,大多数时候我们采用的研究方法几乎都是文本解读(基于其思想观念、主题、意象、修辞、写作方式等)。但从统计学、数据科学、社会科学的量化研究、自然科学等不同学科、专业的融通基础之上应运而生的“数字人文”,则可以为我们贡献文本挖掘(text data mining)、数据分析(data analysis)、社会网络分析(social network analysis)、情感分析(sentiment analysis)等不同的研究方法,为我们更好地理解文本,书写和重构文本的历史,提供不少新的认识。

以阅读史的研究为例,无论是罗杰·夏蒂埃、罗伯特·达恩顿等人关于西方(特别是现代早期)阅读史的代表性研究,还是中外学者对中国阅读史的重要研究,其研究重心几乎都落在分析、解决“6W”式的问题上,即着力于讨论谁在读、读什么、什么时间、什么地点、如何读、为什么读等一系列问题。在这些研究中,中西方(特别是近现代以来的中西方世界)的阅读史之间,似乎缺少一些共通的、可以对话、连接的环节(conjunction),也较少对复杂多变的当代阅读史的“深描”(thick description),但2021年9 月发表的《阅读严肃文学小说对脸部情绪识别的影响——ERP 证据》一文[17],则对于我们建立中西阅读史的连接、深入理解当代阅读实践,提供了某些新的思考方向。该文以清华大学19—26 岁之间的在校学生的颞枕部的N170 这一脑电负波成分为主要观测对象,通过对事件相关电位技术(Event Related Potentials,简称ERPs)的运用,组织了两次实验,研究了阅读严肃文学小说是否会对大脑颞枕部表征脸部情绪识别的N170 产生影响,以及其影响的程度是否会在积极、中性和消极的不同脸部情绪上有显著差异这一重要问题。

其研究发现,阅读对他人脸部情绪的识别确有影响(图7),据此该文作者还推测道:阅读可能抑制大脑中的脸部情绪特异性(主要抑制的可能是积极和中性脸部情绪引发的N170),有助于使大脑对不同情绪的反应趋同,进而可能提高我们对他人脸部情绪的感知力(有些近似于我们通常所谓的文学可以提供给我们的丰富的“感性”或“共情”的能力、“同理心”等)。但对于这种感知力的认识和研究,其实已经超出了文学、人文学术的阅读如何影响我们这一固有的讨论范畴,也不单是对人文学术反复叩问的“人何以为人”此一问题的间接、曲折的回答。在这一研究的完成者的眼中,其对于提高人工智能、机器人的心智解读能力的方式方法(或可通过输入和加工文学小说文本的方式实现)提供了可能的理论和实践层面的启发。

图7 两次测试之间N170 的幅度变化与情绪的积极程度

不过,从人文学术的本位(在此即为阅读史研究)出发,上述研究也为我们理解、找寻中西方阅读史(尤其是当代阅读实践)的共通之处和连接点,提出了一种新的、可能的思考方向,而这也是目前所有基于文本解读的阅读史研究无法做到的。这种方向,也许还包括本文所举出的其他研究案例所开启的思考方向,固然依赖于大量的研究资料、数据和特定的研究方案、设备和技术等,但也并非像传统的人文学者所想象的那样,是纯技术的、可操作的。让我们别忘了,当人文学者使用“技术”“操作”这些词汇时,不仅是在指涉“技术”“操作”本身,同时也是在“以言行事”,即在有意无意之间,表达一种对“技术”“操作”的敌意或贬损的态度。在人文学者的“技术”“操作”话语之中,往往隐含着这样一种价值判断,即与其追逐的高深思想、艰涩理论、智性的光芒、内心的火焰相比,“技术”“操作”代表着一种低级的、劣等的、粗鄙的、不值一提的、未经省思的、人人皆可为之的……凡庸之事,是需要警惕、约束、限制的“工具理性”的象征。易言之,“纯技术的、可操作的”一点儿都不“纯粹”。著名动物学家、“器官移植之父”梅多沃也早就发现,他在牛津大学的研究人文学术的同事,将“纯粹”一词只用于限定那种来自纯粹的直觉或启示、而非来自观察或实验的科学公理,“他们自恃高于那些用解剖动物尸体、煅烧金属或混合各种化学物质的方法来探寻自然事件的各种未必存在着联系的人。所有这些活动似乎都过于低贱,有失学者的身份,而且总的来说带有过多的艺人和工匠色彩”[2]78。这种方向毋宁说是代表了一种运用科学研究的技术、方法,将人文学术与科学研究努力结合起来的实践,一种跨学科的、协作式的、带有一定程度的工业色彩(实验室色彩?艺人和工匠色彩?)的研究模式(而非传统人文学者所熟悉的独处一室、单打独斗、只有纸和笔就可以进行的研究模式),一种追求严谨、精准、可重复性和科学性的研究旨趣(而非传统人文学术极为推崇的浪漫个性和高傲才具、天马行空的想象力、自由地对任何一个文本进行“思想”阐发,以一种高度的主体性抑或是不可避免的主观性投入研究工作)……

更重要的是,上述研究也为阅读史研究中采用类似的技术、手段,改良其研究设计、路线等,发展新的研究方法,提供了一定的借鉴。虽然将文本挖掘、数据分析、社会网络分析、情感分析等不同的研究方法,统整为一套方法,或是构建成一种具有普适性(当然这并非无所不包、放之四海而皆准的意思,这种普适性仍然是相对而言的)、逻辑性、思辨性和实践性的方法论,即真正的“数字人文”方法论,且能在此基础之上,发展出一种新的研究范式,或是建立一个新的专门、研究领域,还有很长的路要走,但这难道不是包括“数字人文”在内的一切学术研究的使命吗?

五、余论

按照科学史家托马斯·库恩的看法,学术研究的革命,并非缓慢、连续、稳定和积累的变化(如量变引发质变,无数局部、细节研究导向新的总体性理解,某一新理论的提出等),而恰恰来自危机和学术界对危机的反应所导致的某种急剧的变化、革命性的转变,虽然“它不必是一个大的转变,对于某个单一的、孤立的学术共同体之外的人而言,也未必颇具革命性(这种共同体或许只有不到25人)”[18]162,亦即研究范式的转换。此外,不同的研究方式之间的异质性,也要远超其延续性、通约性。由此出发,我们可以说,“数字人文”的出现、发展,固然未必可以同物理学领域中杠杆和滑轮的发现[19],万有引力、地心引力说,天文学领域中的日心说、大爆炸说,爱因斯坦的相对论与量子力学,霍金的黑洞理论等等人类知识生产历史上的这些奠基性、革命性的变化相提并论,但正如上文所力图展示的那样,在人文学术可以逐渐被数字化、数据化,并被进行数据挖掘与分析的今天,在“数字化生存”作为我们这些高级智人(数字人类?后人类?)的日常的当下,在“数字化转型”被确立为一个国家、社会的重要发展战略的此刻,“数字人文”俨然已经成为我们必须面对、思考的一种视野、方法,一个新的学术领域,乃至于一种新的学术生态、境遇。它已经且将为今天(乃至可以预期的未来)的人文学术生产与知识创新,带来一些全新的、此前我们完全意想不到的可能。至于我们把这种可能,是否叫作“范式”,也许并不重要。

不过,即便如上所述,在新的时代和社会背景下,在新的技术、方法、媒介的驱动下,“数字人文”为人文社会科学领域的研究,带来了一系列“内爆”“增殖”的可能。但正如笔者在他处所言,我们对数字人文并不应该持有天真的、激进的乐观态度,相反,应以尽可能审慎、合理的态度予以看待[20]74-77。因为尽管数字技术、方法的广泛应用,在不断丰富着今天的学者尤其人文学者、跨学科研究者的研究实践,可以帮助我们验证既有研究,对老问题提出新的诠释,提出新的问题,乃至发展出一整套新的研究方法/范式,但并不是所有的议题、问题,都应该而且能够被“数字学术“所解决,数字技术、方法的使用,同样应该遵循因地制宜、量体裁衣的原则,而被限制在一定的、合理的范围之内。此外,学者(尤其是人文学者、数字人文研究者)也有责任和义务,让学生、公众能够区分“数字学术”与传统研究的异同,了解各种方法的优劣,从而使之在不同方法之间,作出适合自己的、合理的选择。在我看来,一切研究方法,其实无所谓新旧优劣,只有运用是否高妙、是否能够用于分析和解决问题之别。传统的人文学术研究方法,同样富有勃勃生机,也同样孕育着新的知识生产的可能,如若不然,今天我们的人文学训练、研究,又有何必要从阅读经典、习得文本解读技艺开始?

就此而言,“数字人文”既像是一架望远镜,或有望让我们更好地理解伟大的人文传统,理解人性,理解我们自身,理解我们与时代、社会之间的复杂关系,帮助我们想象一个更加美好的“后人类纪”。同时,它也像是一台显微镜,可以让我们更加清晰地窥见人文学术的底色,及其与科学研究之间的张力,乃至可能的和谐、交融状态(反而使我们坚定了对传统人文学术及其方法的信念?)。也正是在这样一种张力与和谐的摆荡中,在“远读”(distant reading)和细读(close reading)的往复间,数字时代的人文学术,抑或“数字人文”,开始蹒跚着脚步,踏上自己新的、未知的、充满诱惑与挑战的知识生产之旅。

猜你喜欢
人文学术数字
人文
北京纪事(2024年1期)2024-01-03 03:16:55
如何理解“Curator”:一个由翻译引发的学术思考
中国博物馆(2019年2期)2019-12-07 05:40:44
对学术造假重拳出击
商周刊(2019年2期)2019-02-20 01:14:22
答数字
人文绍兴
中国三峡(2017年3期)2017-06-09 08:14:59
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12
人文社科
全国新书目(2016年5期)2016-06-08 08:54:10
让人文光辉照耀未来
成双成对
学术