苏芳荔
(郑州航空工业管理学院,郑州 450015)
数字人文起源于人文计算,代表了一套新颖的跨学科方法,涉及数字技术在人文研究和调查中的应用[1]。《数字人文宣言2.0》指出数字人文不是一个单一的领域,而是一系列探索世界的聚合实践[2]。Klein等[3]认为,数字人文学科作为一个扩展领域已经到来。研究型图书馆和学术研究密不可分,任何数字形式的学术研究,特别是数字人文,都以某种方式与研究型图书馆的使命联系在一起,支持学术研究是研究型图书馆的重要使命。数字人文学者和图书馆馆员是天生的合作伙伴,图书馆馆员经常在数字人文项目中扮演支持或协作的角色,许多图书馆馆员本身就是数字人文学者[4-5]。
研究图书馆究竟应该如何支持其机构的数字学术,具有重要的研究意义。Vinopal等[6]指出,学者们越来越希望在他们的研究中使用数字工具,并提出随着学术研究方式的变化,研究图书馆的实践也将进行调整,以便最有效地与学者合作,对学术研究提供参考和支持。图书馆需要在几乎所有层面上与数字学术合作,服务数字学术的方法同时需要有可扩展性和可持续性。Lewis等[7]指出,提供“有意义的访问”应该是资源建设的首要关注点,并建议使用交互式Web 2.0元素,包括博客、社交媒体和其他用户生成内容,以及指向上下文信息的链接作为提供此类访问的手段。Zhang等[8]提出了图书馆馆员在支持数字人文工作中可能扮演的11个角色。
研究型图书馆的资源建设满足了数字人文学者进行数字学术的基本需求。本文通过调研加拿大研究型图书馆网站上数字人文资源的建设现状,了解目前研究型图书馆提供的数字人文相关的内容,并确定未来可能的方向。这项工作能够给我国图书馆的数字人文资源建设带来启发,以方便数字人文学者进行数字人文研究,更好地发挥图书馆和图书馆馆员在数字人文研究中的作用。
本研究将范围限定在加拿大研究图书馆协会(Canadian Association of Research Libraries,CARL)包含的29家大学图书馆成员。这29家大学图书馆具有如下特征:拥有广泛的馆藏和服务,是加拿大分布式国家研究馆藏的重要组成部分;致力于研究生培养和研究,通常在艺术、社会科学和自然科学领域设立了博士项目;成员图书馆每年从研究资助中获得的年度赞助通常大于或等于该大学一般运营预算的15%;成员图书馆有明确和持续的机构承诺与支持。
数据搜集的时间范围为2022年1—3月。对29家研究型图书馆网站进行调研,寻找以数字人文领域为特色的资源。最终选取10家CARL的学术研究型图书馆进行调查,分别是阿尔伯塔大学图书馆(University of Alberta Library)[9]、英属哥伦比亚大学图书馆(University of British Columbia Library)[10]、西蒙弗雷泽大学图书馆(Simon Fraser University Library)[11]、卡尔顿大学图书馆(Carleton University Library)[12]、渥太华大学图书馆(University of Ottawa Library)[13]、滑铁卢大学图书馆(University of Waterloo Library)[14]、约克大学图书馆(York University Library)[15]、麦吉尔大学图书馆(McGill University Library)[16]、达尔豪斯大学图书馆(Dalhousie University Library)[17]、纽芬兰纪念大学图书馆(Memorial University of Newfoundland Library)[18]。
笔者详细分析了每个图书馆的数字人文资源建设情况,最终的分析主要从7个方面进行。①阅读材料:指向数字人文领域的书籍、期刊、博客、数据库以及其他讨论数字人文的相关出版物的链接。②工具:研究人员可以用来分析语料库或数据的工具和程序,主要包含文本分析、地理信息系统、数据可视化等方面的工具介绍。③语料库/数据:帮助研究人员发现、创建语料库或数据的资源。④项目和实验室:链接到机构内外的示例数字人文项目或数字人文实验室。⑤协会和社区:链接到相关专业协会、实践社区的网站。⑥培训:链接到线下培训或会议的信息或者在线教育资源机会。⑦咨询和帮助:数字人文学科馆员的邮箱、个人社交网络信息。
本文选取的10家研究型图书馆都提供了内容丰富的数字人文资源,包含数字人文介绍、数字人文阅读材料、数字人文工具、语料库、数字人文项目、数字人文协会、数字人文培训以及相关的咨询和帮助信息等。
数字人文简介帮助用户理解数字人文概念并辅助开展科学研究。调研的10家学术研究型大学图书馆中有7家给出了数字人文简介,内容包含数字人文的概念和人文学科使用数字工具的原因。
数字人文定义一直在不断演变,7家研究型大学图书馆给出的数字人文定义都强调了其跨学科的交叉性,将数字人文视为人文学科和计算机学科的交叉点,旨在为传统人文学科的教学、研究和创造性工作带来新的技术、工具和方法,并指出数字人文常用技术包括文本挖掘、社交网络分析、数字出版、数据可视化和地理空间映射等。其中滑铁卢大学图书馆和英属哥伦比亚大学图书馆都采用了《图书馆与信息科学百科全书(第3版)》(Encyclopedia of Library and Information Sciences,3rd ed.)的定义:数字人文既可以被理解为一个独立的领域,也可以被理解为识别特定人文领域的数字研究和项目开发工作的一种方式;更广泛地说,它还指任何促进人文学科研究或协助其参与者的学术活动的数字活动。
达尔豪斯大学图书馆从3个方面分析了人文学科使用数字工具的原因:①远读,通过数字工具进行的文本分析和主题分析,可以从大量文献、文本和主要来源中发现趋势、主题、流派、网络、模式等;②可视化,使用地理空间、网络和文本可视化能够帮助理解原始文本中的位置和空间,了解历史社交网络的变化方式,并显示文本发现的定量趋势;③获取数据来源,获取数字化和原生数字资源是在人文学科中使用计算机及数字网络重要的原因之一。
研究型图书馆推荐的数字人文阅读材料包含数字人文领域的经典图书、专业期刊、代表性文章,以及数字人文相关的网站、博客和社交媒体。通过阅读这些推荐材料,能够对数字人文领域有一个基本了解。
70%的图书馆介绍了数字人文领域的经典图书,覆盖了数字人文和数字学术实践的领域概述、数字人文从业者宣言、数字人文发展历史、数字人文类教科书、相关的编程指南等。10所大学的数字人文资源列表共列出了58种经典图书,其中被推荐至少2次的图书有9种;被推荐次数最多的图书是2016年出版的A NewCompanion to Digital Humanities,该书汇集了一个全球作者团队,调查了数字人文领域的过去、现在和未来,为有兴趣更好地理解数字人文的理论、方法和应用的任何人提供必要的知识;被推荐次数排名第二位的是2012年出版的Debates in the Digital Humanities,该书汇集了数字人文领域的领军人物的观点,从定义数字人文参与者和确定该领域是否具有理论基础,到将编码作为学术和数据驱动研究的趋势进行讨论,这本著作描绘了数字人文学科的现状并展望了其未来潜力和挑战。
数字人文和数字学术工作几乎出现在每个学科,但也有许多期刊专门致力于与“数字”联系的理论和方法。70%的图书馆包含了对主要学术期刊的介绍,共推荐了38种学术期刊,其中被提及至少4次的期刊有6种,被提及至少2次的期刊有14种,如图1所示。
图1 数字人文领域主要期刊列表
40%的图书馆介绍了数字人文研究中涉及的相关标准和手册。阿尔伯塔大学图书馆提供了数字人文数据策展标准,包含人文数据规约,规划数字人文项目时需要考虑的版权、协议和隐私等法律政策和标准,信息在数字人文领域的表示格式等。渥太华大学图书馆介绍了文本编码倡议,该倡议是一个共同开发和维护数字形式文本表示标准的联盟,其主要成果是一套指导方针,规定了机器可读文本的编码方法,主要是在人文、社会科学和语言学领域。TEI指南已被图书馆、博物馆、出版商和个人学者广泛用于在线研究、教学和保存文本。
数字人文相关的网站、博客和社交媒体等网络资源是阅读材料中非常重要的部分,有6家图书馆列出了网络资源列表。其中达尔豪斯大学图书馆按照数字人文代表性博客空间、数字人文社区和协会网站、数字人文Twitter空间等进行了详细介绍。麦吉尔大学图书馆介绍了相关的博客、网站和数字人文Zotero群组。推荐最多的网络资源和社交媒体列表如图2所示。
图2 数字人文领域核心网站、博客、社交媒体列表
被推荐次数最多的Digital Humanities Now是一种实验性的、经过编辑的出版物,重点介绍并分发非正式出版的数字人文学术资源和来自开放网络的资源,鼓励学者以开放的方式分享他们的研究和专业知识。Digital Humanities Now通过RSS从订阅源聚合数百个来源的内容,用户可以订阅RSS提要,方便地接收精选的数字人文信息,包括招聘广告、会议及其他新闻。Dan Choen’s Digital Humanities Blog侧重于数字媒体和技术,涵盖知识和学习的各个方面,从图书馆的性质及其不断发展的资源,到21世纪的研究技术和软件工具,再到不断变化的传播和出版领域。dh+lib是一个公共空间,图书馆馆员、档案管理员、图书情报学研究生和各行各业的信息专家可以在这里就数字人文学科和图书馆展开对话。Digital Humanities Q&A是一个基于社区的问答板,用于回答数字人文问题,问题类别主要包含软件工具使用建议、数据库和数据结构、界面设计、数字人文为主题的教学和技术的结合、标记和元数据、考古和文化遗产、新媒体和游戏、标称、项目管理等。
工具是资源中最普遍的内容类别,有9家图书馆列出了特定的工具或工具目录。推荐最多的工具目录是TAPoR文本分析研究门户和DiRT数字研究工具。TAPoR是阿尔伯塔大学组织的复杂文本分析和检索中使用的工具门户,为数字学者和人文学者提供了从一般分析和注释到网络开发的各种工具,类别包括分析、注释、协作、内容分析、创建、发现、传播、收集、解释、建模、自然语言处理、组织、编程、发布、RDF、搜索、存储、可视化和网络开发。DiRT汇集了用于学术用途的数字研究工具的集合,让数字人文学者和其他从事数字研究的人很容易找到和比较各种资源,从内容管理系统到音乐OCR、从统计分析软件包到思维导图软件。
在研究型图书馆提供的资源中,共提到了71个不同的工具,类别包含数据可视化工具、文本分析工具、数字地图和地理信息系统工具、数字出版工具、在线展览工具、质性分析软件等。Voyant是最受欢迎的,作为数字人文领域流行的文本分析套件之一,它允许用户上传文本,查看字数、共现、关键词频次、关联关系等,还允许用户创建各种强大的可视化效果,可以分析单个文本或完整的语料库,并有一个内置的帮助系统来指导对其输出和可视化的理解。
Omeka创建数字收藏的平台、Gephi可视化工具、ArcGIS地理空间和地图软件都被推荐了5次。Omeka是一个网络发布平台,主要用于创建数字展览、图书馆、档案和收藏。数字人文学者使用Omeka发布他们的数字收藏和项目。Gephi是一个开源软件,用于大型网络可视化分析,在数字人文中很受欢迎,是一个很好的网络分析入门工具。ArcGIS是一个流行的地理空间分析和地图软件。
研究型图书馆根据数字人文空间功能不同,在计算机中安装不同工具程序以方便用户使用,专业馆员实时提供技术帮助。如英属哥伦比亚大学图书馆研究共享空间拥有18个增强型PC工作站,提供现场使用、短期远程访问和长期远程访问,以支持需要增强计算的数据、GIS以及其他数字学术和研究项目需求。这些机器为从事数字学术项目的研究人员、研究生或博士后提供了在其他地方无法获得的工具,大致包含地理信息系统(Autodesk AutoCad 2017 SP1 QGIS、ArcGIS、
ArcGIS Pro、CityEngine、Grass GIS、Google Earth Pro)、深度学习(MathWorks、MatLab、Maple)、数据分析软件(NVivo、SPSS、SAS、R、R Studio)等。
4家图书馆提供的资源中包含语料库或者可以处理的数据介绍。相关的语料库和数据包含可以进行挖掘的数据库、电子文本中心资料、用于文本和数据挖掘的开放存取数据库、相应的文本集合、数字图书馆、档案馆馆藏、博物馆馆藏、地图集合以及报纸集合等。
阿尔伯塔大学图书馆和达尔豪斯大学图书馆对数字人文研究中可能用到的语料库做了非常详细的介绍。达尔豪斯大学图书馆推荐了收藏古代文献的“珀尔修斯数字图书馆”,早期现代女性作品的存储库“女作家计划”,源自Google图书的美式英语、英式英语和西班牙语语料库组成的“谷歌图书语料库”,数百个TEI标记文本和一个用于语言研究的英语语料库组成的“牛津大学文本档案馆”,考古领域的空间数据和资源“圣地数字考古地图集”,来自全球的包括网页、缩微胶卷等数字化内容的“互联网档案馆”。阿尔伯塔大学图书馆提供了对“早期英语在线图书”“十八世纪在线收藏”等数据库,“编年史:美国历史报纸”“古腾堡计划”等免费开放存取资源,“第一次世界大战诗歌数字档案馆”“国际英语语料库”等文本集合,“伯克利数字图像和文本”“弗吉尼亚大学电子文本图书馆”等数字图书馆的详细推荐和介绍。
基于用于文本和数据挖掘的开放存取数据库和存储库的资源、文本集合等语料库,研究人员可以使用专门的工具来提取数据、识别趋势、寻找模式并更好地理解文档内部和文档之间的术语关系。分析通常基于词频、关键词的上下文信息、常用短语及其他模式。
数字人文项目是指借助计算机技术或数字技术,开发出用于解决人文学科领域面临的技术性难题的数据库或资源平台等。数字人文项目介绍在加拿大研究型图书馆数字人文资源建设中占据重要位置。笔者调查的10家研究型图书馆其中有4家提供了机构内外的示例数字人文项目、数字人文中心和数字人文实验室的链接。英属哥伦比亚大学提供了加拿大、美国和世界范围内知名的数字人文中心的链接,共列出了加拿大的数字人文中心14个,包含布鲁克大学数字人文中心(Centre for Digital Humanities,Brock University)、维多利亚大学人文计算和媒体中心(Humanities Computing and Media Centre,University of Victoria)、阿卡迪亚大学人文超媒体中心(Humanities HyperMedia Centre,Acadia University)等;列出了美国的数字人文中心20个,包克利夫兰州立大学公共历史与数字人文中心(Center for Public History & Digital Humanities at Cleveland State University)、哥伦比亚大学数字研究和学术中心(Center for Digital Research and Scholarship,Columbia University)、麻省理工学院 Hyperstudio 数字人文中心(Hyperstudio Digital Humanities at MIT)、芝加哥文本实验室(Chicago Text Lab)、斯坦福文学实验室(Stanford Literary Lab)等。
西蒙弗雷泽大学提供了有代表性的示例数字人文项目的链接,示例项目主要介绍了威廉布莱克档案(the William Blake Archive)、美国早期通信网络地图(Mapping the Republic of Letters)、奴隶社会数字档案(Slave Societies Digital Archive)等。滑铁卢大学介绍了档案释放(Archives Unleashed)等数字人文示例项目,档案释放项目旨在使PB级的历史互联网内容可供学者访问。通过网络档案搜索和数据分析工具,使学者、图书馆馆员和档案管理员能够访问、共享和调查自万维网早期以来的历史。达尔豪斯大学图书馆从数字馆藏、数字地图、文本和主题分析、网络分析4个类别分别介绍了示例数字人文项目。
40%的图书馆提供了相关专业协会或实践社区的链接。列出的社区主要包括CenterNet、dh+lib、Digital Humanities Now、Digital Humanities Q&A、Humanities Commons。
列出的数字人文协会链接主要包括两部分:一是国际知名的数字人文相关协会,如计算机人文协会(Association for Computers in the Humanities),欧洲数字人文协会(European Association for Digital Humanities),数字人文组织联盟(Alliance of Digital Humanities Organizations),人文、艺术、科学和技术联盟和合作组织(Humanities,Arts,Science,and Technology Alliance and Collaboratory)等;二是加拿大本国的相关协会,如加拿大数字人文学会(Canadian Society for Digital Humanities)、加拿大艺术研究计算协会(Canadian Institute for Reseach Computing in the Arts)等。
数字人文研讨会和在线教育资源是加拿大研究型图书馆开展数字人文教学与科研服务的重要组成部分。在被调查的10家研究型图书馆中,英属哥伦比亚大学、西蒙弗雷泽大学、滑铁卢大学、约克大学、麦吉尔大学这5所大学的图书馆提供了数字人文相关线下培训,培训内容包括数据发现、数据可视化、Python或R程序设计、Excel数据分析、人工智能、研究数据管理等。英属哥伦比亚大学、西蒙弗雷泽大学、渥太华大学、滑铁卢大学、约克大学、麦吉尔大学、达尔豪斯大学这7所大学的图书馆提供了数字人文在线培训资源。数字人文相关的培训和在线资源具体如表1所示。
表1 加拿大研究型图书馆数字人文教育和培训
加拿大研究型图书馆积极开展研讨会或者培训服务,并提供内容丰富的在线教育资源。相关的培训和资源内容可以按照研究活动类型划分为7类:①以社交媒体分析、文本分析、定性分析为代表的分析活动;②以命令行基础、Python编程、Javascript编程、网页设计、可访问性和以用户为中心的设计、数字写作、数字叙事、数字媒体创作为代表的创作活动;③数字化活动;④数字出版与展示;⑤网页、PDF文件、图像、地图、音频、视频等媒体进行注释;⑥项目管理;⑦存储管理工具与技术。可以按照技术类型划分为6类:①数据可视化平台、信息图表、时间线、网络可视化和数据清理等数据可视化技术;②通用映射、故事地图、地理编码、地理参考等地理信息系统工具;③社交媒体分析技术;④文本分析技术;⑤定性分析技术;⑥网络爬取、网络抓取与归档工具。
10家图书馆全部给出了相应领域学科馆员的联系方式,包含学科馆员的邮箱、电话、个人社交网络信息、办公地址等。卡尔顿大学和阿尔伯塔大学的图书馆还给出了咨询学科馆员的预约流程。英属哥伦比亚大学图书馆每周四的12:00~14:00,举办名为“Pixelating:A Digital Humanities Mixer”的讨论会,为校园内的数字人文学者提供了一个与同事会面、交流工具使用、集思广益、使用数字工具探索和可视化研究成果交流的机会。英属哥伦比亚大学、西蒙弗雷泽大学、约克大学等通过其数字学术中心以及数字人文创新实验室为教师和研究生提供咨询、指导、研究软件开发和技术支持,协助研究人员开展数字学术研究。西蒙弗雷泽大学数字人文创新实验室接受预约咨询,通过填写咨询申请表,可以为研究人员提供与其数字研究、技术问题相关的咨询会议(1~1.5小时);可以帮助研究人员规划数字项目,并提供持续的项目支持;可以为研究人员提供小规模探索性研究的机会(每位研究人员每学期最多10小时),内容涉及为研究人员的数字研究确定最佳工具或方法、使用API、协助数据可视化、数据收集方法和标记、使用新的数字工具或发布平台等;可以为研究人员提供研究综合培训(每位研究人员每学期最多10小时),培训内容包含提供特定数字工具的指导、网络技术培训、小型研究项目团队的指导、数据收集方法和标记等;还可以为讲师提供课程综合培训(每位讲师每学期最多10小时),涉及与讲师合作,在课堂上共同教授数字工具或平台,就数字作业提供意见等。
总体而言,加拿大研究型图书馆在线数字人文资源丰富,不仅提供了工具链接,还提供了有关查找语料库、外部培训机会、建议阅读材料和网络渠道的资源。工具和培训资料是普遍的资源类别,这一结果意味着图书馆馆员将数字人文学科的工具使用视为他们可以提供指导或支持的关键领域。
数字人文资源可以帮助和引导研究人员完成整个研究过程,从选择语料库和工具到成果出版和建立社交网络。未来的研究可以侧重于调查学生、教师、研究人员的需求,以便更好地了解用户希望从图书馆得到什么,从而提供更好的服务。加拿大研究型图书馆数字人文资源建设可以给我国图书馆带来以下启示。
分析结果显示,加拿大研究型图书馆提供的数字人文工具具有多样性,几乎涵盖数字人文研究的整个流程。对文本处理领域的文本分析工具、网络分析工具、远读工具、数据清理工具,数据可视化领域的图表和图形工具、时间线工具、网络可视化工具,空间人文领域的地理信息系统工具、通用地图工具、故事地图、地理编码工具、地理参考工具,以及数字出版工具都进行了详细的介绍。通过线下讲座和在线视频资源的方式,结合相关案例进行了深入浅出的分析。
目前我国大学图书馆提供的专门数字人文工具和利用教程相对有限。清华大学图书馆提供了工具软件的资源介绍,但大多是关于文献管理、统计分析、科研评价和产出分析等工具的介绍,开设过“CBDB与元引数字人文系列工具的使用”“Gale Scholar与数字人文专题讲座”等,但整体资源不够系统。因此可以借鉴西蒙弗雷泽大学图书馆,根据数字人文研究涉及的不同领域提供相应的工具。同时也需不断完善在线教学资源,提供相关教程,为用户学习相关知识和技能提供更便捷的渠道。
加拿大研究型图书馆提供的数字人文学习资料非常丰富,内容包含数字人文领域的经典图书、核心期刊、代表性的文章介绍,数字人文相关的网站、博客和社交媒体平台的推荐,数字人文相关的手册和标准的分享,代表性数字人文项目、数字人文中心和实验室、数字人文协会等。通过阅读领域的经典图书、代表性文章,能够对数字人文形成基本的了解,快速入门。通过网站和社交媒体资料的学习,能够了解数字人文的研究前沿。
我国图书馆也进行了一些相关学习资料的介绍,如闽江学院图书馆介绍了国内外代表性的数字人文研究中心和数字人文项目,上海图书馆提供了家谱知识服务平台、盛宣怀档案知识库、中文古籍联合目录及循证平台、历史文献众包平台、数字人文开放数据平台的链接。但是整体上资料不够系统,可以借鉴英属哥伦比亚大学、卡尔顿大学进行多角度、多领域的数字人文学习材料的收集和建设。
调研的加拿大研究型图书馆中,只有40%的图书馆进行了语料库的收集和介绍,很多图书馆并没有包括语料库或研究数据的链接。但是图书馆作为资源的存储和提供者,促进对内容的访问才是最符合大学图书馆使命的功能。可以借鉴阿尔伯特大学图书馆,提供可以进行挖掘的数据库的链接,进行文本集合的建设、收集可以进行文本和数据挖掘的开放获取资源,从多个角度促进语料库的建设,构建具有中国特色的数字人文语料库。大学图书馆加强特藏资源开发,建设数字资源库及资源长期保存,为人文研究提供大规模高质量数据源。
调研的10家加拿大研究型图书馆全部配备了数字人文学科馆员,提供多样化的、深度的咨询服务。服务方式包含电话、邮箱、面对面服务、社交媒体咨询等。
我国多数大学图书馆都开展了形式多样的咨询服务。如北京大学图书馆提供电话、QQ问答、BBS发帖、邮件、微博/微信等咨询方式。但咨询内容多限于数据采集、整理分类和归档等,并未涉及数字人文相关的技术、工具与方法。因此,需要整合多种资源,组建数字人文学科馆员团队。在团队建设的基础上,进一步深化服务,开展文本挖掘、数据挖掘以及数据可视化等咨询服务。可在数字人文物理空间设置固定的数字人文咨询服务台,在办公时间为用户提供及时的帮助;同时通过多种多样的线上交流方式有效解决用户在数字人文研究中存在的问题。
大学图书馆要根据数字人文研究者需求,找准角色定位,对数字人文领域持续跟踪,提供数字人文服务与实践的物力、人力、资源保障、方法和工具支持。在数字技术和用户需求驱动下,营造数字人文服务的硬环境和软环境。硬环境包含物理空间、配套设备、技术设施等,软环境包含人文环境、虚拟空间、资源库、软件工具、数字人文服务指南平台等。通过完善基础设施,合理规划改造空间,增加数字人文物理空间,配备相应的系列硬件设施、先进技术设备,打造现实与虚拟融合的学术社区。把图书馆打造为数字人文用户、团队和专家的人文空间、数字人文成果的孵化器,营造跨学科、跨领域的人文、协同、泛在化全息生态环境。