石志松
(深圳大学城图书馆,广东深圳 518055)
当今时代是数字化时代,是“互联网+”时代,各种学科的研究环境、研究方法都因数字资源和互联网络而改变,人文学科和人文研究受到的影响尤其明显。自上世纪60年代以来,在计算机技术支撑下,人文资料的获取、保存、分析和展示方式都发生了变化,大量的图书报纸、艺术作品、视听资料等被数字化。数字化的学术资源逐渐成为人文研究的基础平台,在部分人文领域,人文计算(Humanities Computing)的概念开始出现。随着数字技术对人文研究、教学与传播各环节的渗透,数字人文(Digital Humanities)的概念逐渐取代人文计算,成为一个新兴的跨学科研究领域的代名词[1]。
利用数字技术辅助来促进人文研究,在欧美已经是一种趋势。目前,全球范围内有超过185个直接以“Digital Humanities”命名的中心、研究机构、学术圈子或团体,其中有超过80%都分布在北美和欧洲[2]。我国数字人文研究起步较晚,除了2011年成立的武汉大学数字人文中心外,直到2016年后才陆续有新的数字人文机构或团队建设动向,例如:2016年成立的北京大学数字人文小组,2017年9月挂牌的南京大学数字人文研究中心。从CNKI“数字人文”文献发表年度趋势(图1)也可以看出,我国数字人文领域发表文献量从2016年开始迅速增长,与数字人文研究机构的增长基本同步,表明我国近两年来数字人文的研究热度快速提升。但是,CNKI“数字人文”文献发表的绝对量还很低,说明我们在该领域的研究还很薄弱,需要加大研究力度和资源投入,奋起追赶国际学术潮流和研究前沿。
图1 CNKI“数字人文”文献发表年度趋势(截至2018年5月25日数据)
综合国内外数字人文发展现状和趋势,我们有必要研究和学习国外数字人文发展的先进经验,推动我国数字人文研究取得跨越式发展。纵观世界各国数字人文发展历程,笔者认为荷兰数字人文发展的全方位合作模式和经验值得我们现阶段借鉴和推广。荷兰数字人文研究的起步也不算早,但是近年来发展迅猛,一个重要因素就是多种层级和模式的合作。荷兰通过人文技术中心(CHAT)的国际跨界合作模式、“数字人文诊所”的馆际互助合作模式以及马斯特里赫特大学数字人文项目的馆院合作模式等全方位的合作,推动数字人文研究取得了长足进展。
2011年,荷兰皇家文理学院(KNAW)、阿姆斯特丹自由大学、阿姆斯特丹大学、荷兰数字科学研究中心以及国际商业机器公司(IBM)合作,共同成立并运作“人文技术中心”(CHAT:Center for Humanities and Technology),建立起长期的战略合作伙伴关系。CHAT的研究人员认为,我们需要一种多数学者都能便捷使用的方式来获取、表达以及存储人文学科数据。同样重要的还有对强大检索工具的需求,使学者能够从“多重视角”(multiple perspectives)挖掘人文研究数据。CHAT成员和合作伙伴将创建新的分析方法(包括实例、数据和工具等),以大幅提高人文研究的效率。CHAT的研究目标包括:①人文研究和理解的转型以应对社会挑战;②异构、复杂社会数据的算法和计算工具的重大改进;③通过对语言、文化和历史的全新理解取得社会效益。
自二十世纪后半叶以来,计算机与计算方法已经改变了人们的工作、交流、娱乐甚至思考的方式。人文科学研究对人类精神的发展和批判性反思作出了重大贡献,对包括媒体、教育和旅游在内的许多经济和文化生活部门产生了积极影响。人文科学研究也为计算机技术的创新做出了贡献,例如现在可在移动设备上使用的预测文本。CHAT的人文学者和计算机科研人员之间的合作将会在这两个领域取得重大突破,并将使社会、技术和文化活动的许多其他领域受益。
CHAT通过一系列研讨会促进了宽领域对话,大量对话都聚焦于当前正在推进的利用最先进的工具开展人文研究,以及该领域有可能实现或极度需要的创新举措。通过研讨,CHAT将重要的人文学科挑战及核心技术进行了总结,如表1所示。
表1 人文学科面临的挑战及核心技术
2.3.1 人文学科面临的挑战
(1)观点
各类观点之间的界限模糊不清、摇摆不定,这是既存在于文本也存在于视频图像中的巨大挑战。不同个人、群体以及民族的观点之间往往也存在冲突。呈现多元观点并追溯其发展演变,能够有效缓解外交与商业领域的冲突状况。
(2)语境
得益于文化遗产及日常生活的数字化发展,如今我们能够获取话语及其观点的纵向发展路径。此处面临的挑战有:①如何判断相关语境(地点、时间、任务、角色)以及如何判定出正确的数据粒度;②如何串联相关语境,以便自动识别复杂活动(例如“买房”“成立项目团队”“创业”)并据此推荐回答与内容。认知计算机将会发掘并呈现出数据之间以往未知的关联以及这些关联的重要性。
(3)结构
对语义结构和统计结构的发掘,是为内容自动分配相应含义与价值的关键所在。我们的愿望是推动大规模知识图谱的自动生成,这些知识图谱是由激增的复杂语义单元(实体对象、关系、活动、事件)构成的。
(4)叙述
对相关文件的简单排序将复杂问题的解答任务留给了人类。我们的愿望是利用混杂数据中提取出的观点,创立丰富的数据表示法,构建有效的文本及视觉叙述结构。
2.3.2 核心技术
(1)认知计算
认知计算系统利用会话式自然语言及视觉、触觉与其他情感化界面,与人类就人类术语开展协作。认知系统将会自主学习与推理,与人类自然互动,利用专业知识完成研究与决策。
(2)网络分析法
现代网络理论与技术通过延展当前工作的规模程度以及提供分析框架的方式,具备了向人文学科转型的发展潜力。
(3)可视化
大型多模态数据库的接入,为人文学科的研究人员既带来了机遇也带来了挑战。我们需要新型的可视化工具,实现对相关含义的跨时间互动式发掘,以及对多种模态的整合。我们还需要新的方法来传达这些可视化分析所揭示的内容。
(4)文本及社会分析法
目前,CHAT在文本的语言学与词汇分析、主题提取与总结、以及文本含义与内部关联的自然语言处理(NLP)方面已经取得了巨大进展。但这些计算技术往往脆弱且不完整,对各个语料库也提出了重要的定制化需求,因此还存在很多需要解决的问题。开发细微化的语言理解力(例如欺骗、幽默、隐喻、元话语等)仍是一大重要挑战。
(5)检索与数据表示法
现代信息检索领域的一大关键性挑战是,从文件检索转变为含义更加丰富的单元检索,比如回答、实体对象、事件、讨论与观点。该领域的进步将会为人文学者在重要的“研究”(exploration)与“语境化”(contextualization)任务中提供协助。
荷兰图书馆界有志于提高图书馆员的数字人文知识和技能。为此,荷兰国家图书馆、阿姆斯特丹自由大学图书馆、莱顿大学图书馆和根特大学图书馆共同创立了名为“数字人文诊所(Digital Humanities Clinics)”的平台,为提升图书馆员的数字人文素养提供培训活动。该平台是2015-2016年间发起并逐渐成立起来的,这些“诊所”旨在为众多有不同需求的图书馆员(包括已掌握基本技能的学科馆员和技术馆员)提供DH(数字人文)基本方法和技能的培训。
3.2.1 为图书馆员提供DH的基本方法和技能
“诊所”的目标是传授图书馆员数字人文的基础知识,课程内容能为研究人员和学生提供服务;发现馆员的知识和技术缺口,通过培训使之提升;通过“诊所”传授的技术,帮助馆员实现日常图书馆工作的自动化。培训目标不是要把馆员变成程序员或数据处理专员,而是希望帮助他们提升DH综合素养以适应DH项目需求。
3.2.2 加强图书馆与学术界的合作与联系
通过邀请高校和研究机构的研究人员在“诊所”授课,为图书馆员和研究人员之间的沟通和交流提供机会。研究人员对专业领域的热情,也能引起图书管理员对相关问题的兴趣。
3.2.3 建立荷兰图书馆员的DH培训和交流网络
这个计划能为图书馆员提供线下培训和线上交流的知识网络。培训活动后会有持续跟进,可以继续参与DH社区的学习,还可以一起合作开发图书馆相关的DH项目。
为了使培训课程具有代表性,能覆盖图书馆员参与DH项目所需的基础知识和技能,“数字人文诊所”的组织者参考了美国和英国的相关调研成果。美国研究图书馆协会的里克·穆利根(Rikk Mulligan)在其撰写的报告“数字学术支持”中指出,图书馆员在数字人文素养方面最大的缺口及人员占比为:可视化(65%)、计算机文本分析和支持(64%)、统计分析支持(60%)和开发软件(54%)。英国研究图书馆(RLUK)的克里斯蒂娜·坎普托里(Christina Kamposiori)在27个图书馆中进行了类似的调查,发现那些接受调查的图书馆员希望学习的DH知识和技能包括:编程(77.8%)、DH知识(77.8%)、谈判和沟通技巧(66.7%)、领导技能(55.6%)和研究技巧(59.3%)。
“数字人文诊所”的组织者确定的培训课程如表2所示,课程设置上兼顾讲座课程和动手操作的工作坊,参与的学员们还可以灵活选择意向参与的项目。
2016年6月在赫尔辛基举行的欧洲研究图书馆协会(LIBER)会议,是马斯特里赫特大学图书馆数字人文发展的重要转折点。在本次以“图书馆知识开放之路”为主题的会议中,马斯特里赫特大学图书馆馆长Ingrid Wijk受到启发,开始寻求图书馆与各院系之间可能存在的合作渠道,以推进数字人文的研究。
马斯特里赫特大学的数字人文专家目前正在开展一系列数字人文研究。例如,数字文化开发教授莎莉·怀亚特(Sally Wyatt)关注的问题是“技术和社会变革之间的关系(尤其是社会排斥和不平等问题)”,突出了数字人文的政治潜力和重要性;艺术与社会科学学院的利奥尼·科尼普斯(Leonie Cornips)教授研究的是儿童对荷兰语的双语习得,以及在多语言环境下调查林堡地区的身份认同建设;语言研究中心的尼尔·怀里(Neill Wylie)和迪耐斯·麦克阿利斯特(Denise McAllister),使用语料库语言学工具为该校学生提供培训课程;艺术与社会科学学院的妮可·兰德拉德(Nico Randeraad)和克里斯·里奥纳德茨(Chris Leonards),与图书馆合作进行历史社会网络关系的可视化研究。Ingrid Wijk馆长强调,图书馆员在这些项目的合作中,不仅仅是为研究人员提供资源和信息服务,更重要的是要以合作者的身份参与项目研究。
表2 “数字人文诊所”培训课程
4.2.1 短期规划
首先,马斯特里赫特大学图书馆需要确定数字人文项目的目标,为此可以组织一个“专家小组”,邀请该校数字人文领域的优秀学者,还包括该校图书馆对数字人文感兴趣的馆员、艺术与社会科学学院和人文科学学院的教员、其他院系对此领域感兴趣的工作人员和学生以及来自其他数字人文组织的代表参与研讨。这个“专家小组”的目的是清楚地了解研究人员对图书馆的期望,图书馆对研究人员的期望,双方分别采用和掌握了哪些技能,以及如何将这些技能最有成效地结合起来。
4.2.2 中期规划
马斯特里赫特大学要在数字人文发展方面取得领先,就应该考虑如何更加具体地促进该大学数字人文项目的基础设施建设以及确定该大学的图书馆该扮演什么样的角色。可以聘请一到两名博士生或博士后或其他经验丰富的研究人员,来探究马斯特里赫特大学的图书馆和该领域的研究者之间的合作应该如何更好地建立起来。这些研究人员也可以加入“数字人文诊所”项目,以获得进一步的启发和支持。此外,还可以尝试多方面的合作:调查与荷兰其他数字人文研究机构合作的可能性,例如阿姆斯特丹数字人文中心、荷兰电子科学中心、人文科技中心等;借鉴马里兰大学图书馆的“数字人文孵化器”项目经验,为员工提供素质培训项目。保存图书馆的数字人文项目成果并提供可访问的途径,是马斯特里赫特大学图书馆在马斯特里赫特地区推广数字人文的重要方式。
4.2.3 长期建议
在马斯特里赫特大学图书馆建立数字人文中心、实验室、工作组,这是该图书馆长期数字人文研究的重要一步。马斯特里赫特大学图书馆可以尝试成为数字人文的“枢纽”并刺激马斯特里赫特地区的数字人文研究和交流。促进马斯特里赫特大学的图书馆和其他的院系的研究人员之间的交换,增强他们之间的联系,帮助他们更好地了解目前正在进行的工作以及这些工作如何最好地与图书馆和各院系的优势相结合。此外,马斯特里赫特大学图书馆要更多地参与数字人文教学,由图书馆提供数字人文的研究模块,甚至可以提供研究实习的机会,使得马斯特里赫特大学的数字人文课程变得有趣。
根据马斯特里赫特大学数字人文发展规划,该校数字人文项目各阶段任务分解如表3所示。该任务分解是该校数字任务项目实践的经验总结和固化,是高校图书馆与校内各院系进行数字人文研究合作的宝贵经验,值得学习和借鉴。
表3 马斯特里赫特大学数字人文项目各阶段任务
数字人文是典型的交叉学科,“数字”代表的是数字技术、网络技术、文献计量、统计分析、图形图像等技术领域,而“人文”代表的是历史、地理、社科、艺术、心理等人文领域,多学科交叉应用研究是数字人文研究的显著特征。正如伦敦国王学院数字人文教授西蒙·坦纳(Simon Tanner)所言,“创新”“开放”“合作”“跨界”的理念在数字人文研究中尤其重要[6]。人文技术中心(CHAT)的成立与运行正是这一理念的体现。人文技术中心汇集了荷兰的人文研究机构、技术研究机构、高校和国际著名计算机公司IBM的优势资源,是典型的国际跨界合作模式。人文技术中心以创建新的分析方法、提高人文研究的效率为目标,为人文研究搭建了工具性基础设施。“工欲善其事,必先利其器”,对于数字人文研究的后发国家和地区来说,成立人文技术研究合作机构,统筹优势资源,推进研究基础设施建设,是精耕深作、利在千秋的良策。
图书馆现已在数字人文研究中逐渐承担起重要的角色,起到中枢和纽带作用,促进了各种数字人文资源的融合与分享。图书馆的文献资源是图书馆参与数字人文的核心竞争力,尤其是数字化时代,图书馆对馆藏资源的收集整理以及数字化、网络化平台构建,是数字人文研究的重要基础。荷兰马斯特里赫特大学图书馆正是利用了图书馆的资源优势,把该馆打造成校内数字人文研究馆院合作模式的枢纽,并主持起草了该校的数字人文发展规划,占据了数字人文项目合作的核心地位。此外,未来图书馆应该更加广泛地发挥工具及平台提供、课题咨询和信息分享的作用,甚至介入到数字资源出版等领域。同时,图书馆还要利用自身的资源优势、人才优势和环境优势在数字人文教育和推广方面发挥更大的作用。
图书馆员在数字人文研究项目中有多重作用:与人文学者合作,为研究人员提供数字人文研究工具;将数字人文研究项目与所需的馆藏资源匹配、对接;肩负项目IT专家的责任,搭建信息共享平台;发挥自身专业优势,与项目各参与方沟通,实现跨学科合作[7]。马斯特里赫特大学图书馆馆长Ingrid Wijk认为,图书馆员应该成为数字人文项目的合作者,而不仅仅是服务提供者。所以,图书馆要大力发展数字人文首先需要着力提升图书馆员的数字人文素养。荷兰的“数字人文诊所”培训模式,协调图书馆界的优势资源,调动学术界力量参与,课程设置上兼顾理论课程与实践工作坊,同时注重知识硬技能和沟通软技能的结合,为图书馆员培训提供了绝佳样例。我们可以在此基础上,针对我国的实际情况,完善我们自己的培训计划,充分调动各级图书馆学会的资源,集中力量打造图书馆界数字人文培训的“黄埔军校”。
在当今数字化和“互联网+”的大时代背景下,数字人文的发展方兴未艾。纵观世界数字人文的研究现状和发展趋势,数字人文将是图书馆发展的新方向,图书馆在数字人文领域的发展将大有可为。我们要以“创新”“开放”“合作”“跨界”的理念,努力将图书馆建设成为数字技能和服务的枢纽、创新性学术交流的平台,打破各学科间的壁垒,助力数字化时代知识和文化的可持续发展。