韩豫哲
(北京大学信息管理系 北京 100871)
作为跨领域学科融合,数字技术和人文研究结合的新学科领域,数字人文已经引起人文学、图书馆学、计算机等多个领域研究者的关注,欧美学术机构也较早在人文研究中应用数字技术,并进行系列的数字人文研究和实践。我国数字人文研究方兴未艾,高校图书馆作为高校的文献信息资源中心与为教学科研服务的学术型机构,在数字人文领域应发挥重要作用。
目前图情领域对于数字人文的研究,主要包括数字人文实践的介绍和经验总结、数字人文中技术方法的应用和理论探讨等。国内学者对国外优秀项目进行了分析和介绍,以指导国内的数字人文实践。朱华顺(2016)[1]介绍了布朗大学数字学术中心的“加里波第与意大利统一运动档案”和纽约公共图书馆数字画廊的“地图整经机”项目;吴方枝(2017)[2]介绍并分析了民国文献数字化中的综合性全文数据库和专题特色数据库项目。夏翠娟(2017)[3]介绍了面向数字人文的“中国历史地理知识库”建设方案;邓要然(2017)[4]概述了美国图书馆领域的数字人文项目。
本文旨在通过较大样本的国外优秀数字人文实践项目分析其发展特点,为国内数字人文项目实践提供参考。本文在国际数字人文联盟成员中挑选了80 家数字人文机构,访问其官网,对其官网所展示的数字人文实践项目的研究领域、参与机构等方面进行汇总分析,并挑选有代表性的项目,对其项目特点进行归纳总结。
首先从国家来看,在80 家机构当中,美国的数字人文机构有41 所,占50%左右,加拿大和英国各有10 所和9所,德国、法国、瑞士等欧洲国家总计有22 所,占27.5%。此外,中国的香港、台湾地区和新西兰、澳大利亚也有分布。Shun Han Rebekah Wong(2015)[5]统计了五家数字人文相关期刊共740 篇文章,1 467 名作者。作者的国别居前四位的分别是美国(33.45%)、英国(14.2%)、加拿大(7.48%)、德国(6.10%)。从地域上看目前数字人文研究以欧美地区为主。
从数字人文机构的所属性质来看,大部分机构隶属于大学,尤以大学的人文学院为主,比如麻省理工学院人文艺术社会科学学院、加州大学人文研究所、哈佛大学艺术与科学学院支持成立的地理分析中心、谢菲尔德大学人文研究学院下属的数字人文学院等。由此可见欧美人文学科较为重视数字人文的发展,积极主动思考和实践数字技术与人文研究的结合,这反映了人文学科对于学科发展趋势的探索。高校图书馆也对数字人文机构的设立发挥了重要作用,比如普林斯顿大学图书馆的人文数字研究中心,布朗大学图书馆数字学术中心、弗吉尼亚大学图书馆学者实验室等。我们通过对上述80 家机构开展的数字人文项目涉及领域的汇总,能非常明显地看出数字人文跨学科合作的特点。根据项目官网提供的信息,平均每家机构进行3个以上学科领域的相关研究,学科交叉融合性质较强,其中又以历史、文学、语言等领域居多。下文将选取具有代表性的项目进行介绍。
信息技术的飞速发展给信息获取、存储和传播方式都带来了巨大变革,人文学者对于人文资料的处理方式也发生了极大改变。图书、典籍、期刊等研究资料都以数字化的形式进行存储、展现和二次开发,极大地减轻了研究者的记忆成本和基础工作量。首先,随着信息资源的数字化发展,大量的文献资料被发掘出来,文献资料的数据量更加庞大。其次,随着研究的进展,研究资料的范围也在拓展。在传统的文献和考古资料外,保留信息资料的图像、文字、口述资料等都可能进入学者的视线,学者将其作为研究的基础资料,发掘出新问题。
历史学目前是数字人文领域实践最多的领域之一,大量的史料发掘也是数字人文的基础工作,图书馆、档案馆、博物馆都广泛参与进来。比如伊利诺伊大学香槟分校人文、艺术和社会科学计算所在2009 年美国第十六任总统亚伯拉罕·林肯诞辰200 周年之际,与亚伯拉罕·林肯图书馆博物馆合作,将林肯的著作、文件、信件和笔记数字化,开发了在线的数据库对公众开放[6]。该数据库结合了地理信息系统,可以展现历史事件的时空轨迹,在增强互动性的同时又能将历史文献与历史事件进行关联。
哈佛大学费正清东亚研究中心的中国历代人物传记资料库项目(CBDB)是中外合作建立史学传记资料库的优秀案例[7]。CBDB 项目致力于系统性地收集中国历史上重要的传记资料,形成线上的关系型资料库。CBDB 项目建立了结构化的关系数据库,对于历史人物的官职、任职地区等主要信息进行了结构化描述,并通过亲属关系、生卒年份等建立了人物之间的关系网络。它不仅方便了学者提炼关键性信息,也可以用于进行群体性、历史性的宏观层面分析。此外,CBDB 还提供了GIS、SNS 等分析工具,以帮助分析大规模的人物数据。
在基础研究资料收集整理的基础上,数字人文为人文学科的研究提供了一系列工具,以减轻学者的基础工作量,使其将更多的精力放在创新性研究上。哈佛大学的CHGIS项目[8],旨在建立一个中国公元前221 年至公元1911 年的人口聚居地和历史行政单位数据库。该项目为研究人员提供了一个GIS 平台,可以用于空间分析、时间统计建模以及对所选历史单元的数字地图进行展示。麻省理工学院人文艺术社会科学学院Hyper Studio 机构推出的Chronos Timeline 时间线工具[9],可以展示基于时间序列的数据,以帮助学者和学生在线动态呈现历史数据。研究人员可以将时间轴在垂直和水平方向之间轻松切换,快速浏览大量历史事件,根据主题或标签突出显示和过滤事件,并将历史数据语境化。
在学科融合发展的背景下,数字人文提倡人文学科与社会科学、自然科学等领域的合作与融合,促进人文学科研究方法的变革。除了改变传统的检索、分析手段,数字人文还可以为人文研究带来更多研究方法的创新,如关联分析、预测分析、非线性分析、量化比较、历史地图等。
弗吉尼亚大学图书馆学者实验室利用地理空间技术,帮助古典文学教授珍妮·施特劳斯·克莱验证她关于古代地理学的记忆手段和诗歌形式之间关系的理论[10]。其利用GIS(地理信息系统)中的路径分析和荷马的《船舶目录》中提到的近190 个地名的文学分析,有助于确定考古遗址。弗吉尼亚大学的虚拟世界遗产实验室则开展了3D 数字技术呈现雕塑等文物、建构世界遗产地点和古迹的3D 模型等[11]。
国外优秀的数字人文项目一个突出的特点就是展开校内外的广泛合作,这也是数字人文的跨学科属性所要求的。这些项目一方面在校内整合多学科资源,人文、社科、理工等多学科参与;另一方面,在校外与其他学术机构、图书馆、档案馆、博物馆以及企业、基金会等建立广泛的联系,由图书馆、档案馆提供资料,企业、基金会提供资金等。比如耶鲁大学数字人文实验室由Goizueta 基金会资助,致力于推动耶鲁的科学、技术、工程、艺术和数学的教学和研究[12]。马里兰人文科技学院由马里兰大学艺术与人文学院和马里兰大学图书馆共同支持成立,其美国黑人历史文化和数字人文项目得到了安德鲁梅隆基金会125 万美元的资助,用于非裔美国人的交叉学科研究、教育和培训[13]。
Shun Han Rebekah Wong(2015)[5]统计得出数字人文领域的文章作者平均是3.2 人,仅次于生物医学领域(平均3.75 人),而生物医学领域往往需要较大的团队工作,可见数字人文领域合作广泛。其中26.28%的文章是跨国合作完成的,数字人文的发展也为跨国、跨文化的交流和研究提供了更多的机会。比如范德堡大学数字人文中心的中国传统建筑数字研究工具项目[14],该项目建立了一个中国传统建筑数据库,开发了由开放数据库网站、建筑群、个体结构和结构元素四个相互关联部分组成的数字研究工具。剑桥大学艺术、社会科学与人文科学研究中心开展了基于1855 年在中国西南爆发的第三次鼠疫大流行的视觉文档而进行的鼠疫视觉表现在现代科学认识和大规模传染病流行的公众感知中形成的作用研究[15]。佛罗里达大学文化遗产联盟(CHA)、俄勒冈大学的社区艺术与文化政策中心和山东工艺美术学院以及北京师范大学合作开展了ChinaVine 项目[16],在研究中国民俗的同时,推动西方国家了解中国的文化遗产。数字人文的发展与合作,不仅推动了学科融合实践,也促进了跨国文化交流和研究,有助于开展国别和区域研究,进而影响外交和文化研究。
数字人文项目具有较强的实践性,注重学术新观点、新发现或者新技术等实际产出。M. E. J. Newman 认为合作能够反映学科研究是怎么进行的,一般来说,理论文章合作率会较低,而实验性的文章合作率会更高[17]。数字人文领域内的文章平均作者3.2 人,说明数字人文项目重视通过学术实践合作获得研究成果。
伦敦大学数字人文中心利用数字技术在考古方面取得了一定的进展[18],如通过使用数字技术对3D 边缘轮廓、颜色等线索进行自动匹配,帮助考古学家尽快完成锡拉岛阿克罗蒂里遗址的壁画重建;使用无损数字成像技术使古埃及莎草纸图像可见,帮助解决研究古代遗迹时存在的侵入性和破坏性的问题。普林斯顿大学图书馆数字人文研究中心[19]利用社会网络分析中国唐诗的交换情况,发现当前学者所划分的诗人流派与诗歌创作的实际关系不大,不同群体也有定期交流的情况。
数字人文拥有跨学科的研究方法和技术,跳出了传统人文学科的研究范式,在发现新问题上有独特优势。数字人文受到国外人文学科的支持,也说明了数字人文对人文学科的发展有着实际可见的推动作用。
数字人文项目不仅有助于学术新发现,也关心实际社会问题。比如马里兰大学的DocNow 项目[13],建立了收集公众使用Twitter 等社交媒体记录重大历史事件的档案,这也为研究人员提供了数据和新的视角去分析和看待重大历史事件的影响与人们对此的态度之间的相互关系。于默奥大学人文实验室关注数字化中的性别问题[20],讨论数字技术对将人类从社会的性别束缚中解放出来的影响和数字技术在塑造性别中的作用。国外大学开展的项目较多地涉及种族平等、政治民主、社交媒体等领域,对于社会问题较为关切,这也体现了数字人文项目服务于实践,服务于解决实际问题的特点。
国外数字人文项目现实性的另一特点是其注重成果的呈现、宣传和展示,比如历史资料的开放数据库网站建设,GIS、数据可视化的使用等。埃默里大学数字学术中心的Atlanta Explorer 项目[21],通过地理空间数据库构建、三维建模等呈现美国内战后的亚特兰大交互式虚拟城市;Battle of Atlanta Tour App 项目,则可以使用户在内战最后一年的时间节点到特定地点的界面查看战场遗迹。里士满大学的数字学术实验室绘制了自1905 年到2016 年美国总统的出访地图,直观呈现美国国际关系的历史发展[22]。数字人文使人文研究能够更加便捷地向社会进行宣传和教育,这不仅有助于人文研究的推广,提升人文学科的影响力,也惠及了社会,促进了社会文化教育的发展。
数字人文项目在实践层面启动时,健全的基础设施是项目成功开展的基础和保障。刘炜[23]认为数字人文基础设施可以分为三个层次,“其核心是文献资源及服务机构,中间层由基金会、资源库、机构仓储、计算设施、系统平台、工具软件、领域专家和数据科学家组成,是数字人文研究活动的主体;外围是数字人文成果发布、与社会交互、产生社会影响界面层,以门户或平台形式呈现”。
高校院系关注数字人文更多的是出于学术研究和学科发展的需要,图书馆在数字人文发展中侧重文献信息资源的管理和服务,这是其本职所在与优势。但这也要求高校图书馆为支持数字人文研究提供文献信息资源挖掘、研究工具的开发和研究方法的引入,深化到知识层面。
文献资料是学术研究的基础,高校图书馆是高校的文献信息资源中心。数字人文的第一步要从数据收集和数据库建设入手,这是目前各界已达成共识,且有了较好发展基础的部分。由于文献类型的多元化和文献资料数据量的快速增长,文献信息资源建设是一项长期的任务,但作为数字人文开展的基础,需要高校图书馆在文献信息资源建设中投入精力。
高校图书馆除发挥文献信息资源保障作用,还可以发挥在基础设施建设中间层和外围层的作用,成立数字人文研究中心,整合资源,提供各类图书馆科研服务、技术人力资源等,参与具体的数字人文项目。此外,高校图书馆可以利用开放存取等形式进行科研成果运营、宣传、发布和出版,承担起促进科研知识传播交流的职责。
高校图书馆还可以发挥在数字人文技术标准和学术规则规范建设上的作用,在数据采集、存储和使用等方面建起行业遵循的技术标准规范和协议;在学术规范上,比如电子文献的复制和引用,电子文献如何最大程度地保留原始文献承载信息等问题都需要探讨和出台相应的规则、规范。
高校图书馆承担用户教育职责,开展数字人文教育有馆员、资料、技术和服务等方面的优势和条件,数字人文教育既可以依托图书馆的用户教育体系,又可以发挥图书馆员在技术、资源利用等方面上的原有优势。吴加琪等[24]提出以图书情报学科为主体开展数字人文教育、丰富数字人文专业教育形式、加强数字人文课程整合、发挥数字人文研究中心作用。杨晓雯[25]通过对美国耶鲁大学、麻省理工大学等20 所高校图书馆的调研提出开展数字人文短期培训课程等建议。
国外数字人文教育方面已经有了较成熟的教育体系,有系列的课程和数字人文学位培养。比如英国伦敦大学学院设有数字文化本科专业,数字人文中心招收数字人文领域的学术型硕士研究生、专业学位硕士研究生、博士研究生。而在国内,由于数字人文的跨学科属性,其对于多领域的学科基础要求较高,且相关专业创办难度较大,所以国内数字人文教育可以先从高校图书馆开设选修课程,提供日常培训入手,融合信息素养教育。
支持科研是高校图书馆的重要职能之一,“学科馆员”“嵌入式学科服务”也是高校图书馆探索学术支持服务的重点话题。在大数据环境下,人文学者需要数字技术来发掘文献资料,简化工作,减少体力劳动。王涛《数字人文框架下〈德意志人物志〉的群像描绘与类型分析》一文使用了Python 编写代码, 对文本化的数据进行了结构转换,使用了“社会网络分析”的概念,用QGIS 软件制图等[26]。这篇文章是国内人文学者利用数字人文方法与技术进行研究的典范之作。但是对于大多数人文学者而言,掌握数字技术需要耗费较多精力,可由图书馆员提供相关的资料整理、分析技术等支持,协助人文学者进行科研。当然,这也对图书馆员提出了更高的要求,图书馆员不仅要掌握相关的技术、方法,更重要的是需要对相关学科有一定的了解。提供数字人文服务对图书馆员来说是机遇也是挑战。
2011 年,美国研究图书馆协会(ARL)发布的数字学术支持调查报告《SPEC Kit 326:Digital Humanities》显示:近一半的受访者所在的图书馆提供人文学科服务,24%的受访者所在的图书馆建立了数字学术中心,为包括人文学科在内的一系列学科提供服务。2016 年发布的《SPEC Kit:Supporting Digital Scholarship》显示:ARL 成员馆已开展模拟材料的数字化/成像、数字保存、制作数字收藏、元数据创建、数字展览、数据策展与管理、GIS 和数字映射、数字出版、项目规划等多种数字学术活动[27]。
目前国内数字人文实践成果还不太丰富,图书馆参与的程度和范围也有限,数字人文在国内需要优秀实践项目不断涌现,才能打消业界疑虑,彰显数字人文的价值。笔者认为高校图书馆数字人文服务可以从以下几个方面着手推进。
数字人文实践在国内尚属发端,但数字人文服务并不是孤立的,它与高校图书馆服务创新、用户教育和科研服务等密切相关。第一,数字人文是高校图书馆服务创新的重要实践方向,数字人文包含原始资料的保存、开发、利用和展示的过程,又需综合利用新媒体、VR、GIS 等新技术以及计算机、历史、艺术、传播学、图书情报、档案学等多学科的参与,是对图书馆服务的变革和提升。数字人文服务和教育的开展还能加强学生对于数字化环境的理解和认知。第二,开展数字人文服务和教育是对用户教育的发展和创新。数字人文的合作性与实践性特点是对学生合作能力的锻炼。数字人文服务和教育的开展在帮助学生学习数字技术、了解数字时代的同时,可以通过鼓励学生参与具体的数字人文项目,开展实践研究,提高其合作学习和研究能力,有利于其思维方式的拓展和实践能力、创新能力的培养。第三,高校图书馆是为教学和科研服务的学术型机构,为教学和科研服务是其基本的特征,也是其价值所在。数字人文是对人文研究的支持和服务,通过数字技术减少人文研究中大量繁琐的低端劳动,数字化开发以保存和发掘更多珍贵资料,大数据等技术的应用以发掘有价值的研究信息等,都是对科研活动的支持服务。在信息时代,人文学科需要数字人文促进其资料的发掘利用和研究方法的变革,高校图书馆作为高校的文献信息资料中心,理应积极响应这一趋势,满足其相应的需求。
在开展数字人文服务时,图书馆应该首先对自身的部门、人员、服务以及学科的支持需求进行评估,进行资源的整合或补充,针对性地开展适合现状的数字人文服务。比如,在人员配置上,抽调或补充有相关领域背景的图书馆员组成服务团队;在用户教育上,根据现有的用户教育体系进行补充调整,将数字人文作为信息素养教育的扩充和创新;在项目实践上,结合本馆资源、专业等方面的实际情况,选择启动项目;利用学科馆员加强与各院校师生之间的联系,做好宣传、对接和服务工作。
数字人文服务的开展需要专业团队的支撑,有条件的高校图书馆可以争取建立跨学科领域的数字人文研究和实践中心,或者与相关学科合作设立,以形成数字人文研究阵营,整合学术机构资源开展可持续性的数字人文实践项目。从上述对国外数字人文项目的分析来看,注重合作是其重要的特点之一。《SPEC Kit: Supporting Digital Scholarship》调查列出了图书馆数字人文学术支持的8 类合作伙伴,分别是:信息技术部、其他图书馆、档案馆、大学出版社、机构库、本校的所属机构、历史学会、本校的其他数字学术中心[27]。可见高校图书馆需要积极寻求开展多方面的合作,比如可以利用学科馆员调查人文学科研究中的实际需求,探讨可达成合作的项目,协调校内其他部门进行配合。高校图书馆有着服务和学术的二重属性,通过数字人文研究机构平台的搭建,高校图书馆一方面能够发挥自身的研究能力,另一方面也能够更好地提供科研服务和支持。
人文学科日益重视数字人文,诸如中国历代传记人物资料库(CBDB)等项目让我们在看到数字人文发展的同时,也开始反思高校图书馆的缺位。高校图书馆应当加强与学者的联系,了解学者需求,服务高校和学科建设。项目选择可以从馆内特色馆藏的开发与服务学科建设入手。
(1)开发馆内特色馆藏
我国自20 世纪90 年代中期以后古籍数字化迅速发展,古籍书目数据库和全文数据库建设成果显著,大部分图书馆建立了古籍馆藏书目数据库,提供单库检索或合库检索。但随着文献资源的不断发掘和数字技术的进步,图书馆一方面需要对原有的数据库进行迭代升级,补充新的工具和展示方式等;另一方面也需要对馆内特色馆藏进行进一步开发,比如上海图书馆的家谱、盛宣怀档案的开发等等。特色馆藏的数字人文项目可以提升当地或当地人物的影响力,容易获得相关机构的支持。图书馆在馆藏资源开发时应该注重资源整合,集中精力,避免重复建设;同时,不断地对数据库进行相应的升级迭代,以适应需求;最后,加强资源建设的特色化,对本地、本校、本馆的特色馆藏进行特色化建设,形成品牌。
(2)主动对接学者需求,服务学科建设
数字人文在学科前沿建设中有很大的发展空间,比如美国的马里兰人文科技学院、麻省理工学院、密歇根州立大学、范德堡大学和西北大学等高校都开展了关于非洲和非裔群体历史文化方面的数字人文项目。北京大学图书馆为推动“双一流”建设中“区域和国别研究”的前沿、交叉学科领域的发展,于2018 年初购买了Gale Scholar 系列学术数据库,为研究区域的历史、文化、社会等问题提供支持[28]。该数据库平台提供文本挖掘工具和可视化工具等,在一定程度上为学科建设提供了数字人文支持。高校图书馆应当积极参与学科研究项目,主动了解学者需求,为其提供个性化服务,帮助学者利用数字人文方法和技术进行相关研究。美国图书馆协会2018 年报告显示,过去五年,58%以上的学术图书馆将人员配置转变为随叫随到式(On-call Staffing),开展上门服务,其中向数字学术实验室提供的支持占11%[29]。
本文通过对国外数字人文项目特点进行分析,总结了其合作性、实践性和现实性的特点,并提出高校图书馆开展数字人文服务的重点是基础设施建设、数字人文教育和提供学术支持,在路径上可以通过资源整合、建立数字人文中心、选取合适项目等方式开展,这对于高校图书馆开展数字人文服务有一定的参考作用。但同时,国内数字人文方兴未艾,高校图书馆开展数字人文服务还有赖于业界更多的实践探索。