杨新涯 文佩丹
(1. 重庆大学图书馆,重庆 400044;2. 重庆大学人文社会科学高等研究院,重庆 400044)
“数字人文”(Digital Humanities)就是利用计算机及其相关技术,以更加直观和可视化的形式来创新传统纸质文献、音视频等研究内容和方法[1-2]。近年来,随着人工智能、大数据等技术的不断发展,数字人文越来越凸显出其在人文研究、新文科发展方面的优势,进而成为新的研究热点,鉴于此,图档博领域也开始关注数字人文及其与数字人文的关系,并逐渐开展相关研究和实践。图书馆特别是高校图书馆作为支持科学研究的重要机构,在数字人文时代如何更好地帮助学者高效、深入地开展人文研究,体现其在支撑学科发展中的担当和作为,是当前值得探讨和研究的重要内容。笔者认为,图书馆在数字人文中发挥作用,首先就要明确图书馆在其中的角色定位,进而才能以角色为核心,看到问题和差距,并展开相关服务。
对于数字人文的研究,目前图书馆和图书馆人的视角重点聚焦在以下方面。
(1)国内外图书馆数字人文发展现状及趋势研究。吴丽萍[3]以《我国图书馆数字人文研究现状及展望》为题,总结了我国图书馆数字人文的研究主题,并在研究展望中指出关注图书馆数字人文的角色和功能研究。尚晓倩[4]以《欧洲研究型图书馆数字人文发展现状及启示》为题进行研究,通过组建工作组对欧洲研究型图书馆协会(Association of European Research Libraries)开展有关图书馆数字人文发展状况的问卷调查,基于调查结果总结出欧洲研究型图书馆数字人文发展特点及对我国图书馆开展数字人文工作的启示,在启示中指出找准定位,促进数字人文活动价值最大化的观点。胡静等[5]对国内外数字人文研究进行对比分析,总结国内图书情报领域数字人文研究的特征和不足,提出我国研究的努力方向。
(2)国外高校数字人文项目分析。其中,比较典型的包括对加拿大[6]、美国[7-9]等高校数字人文项目的研究。通过分析,普遍认为我国数字人文实践还处于起步阶段,与国外数字人文研究存在较大差距,国外的数字人文项目可为我国数字人文实践提供参考和借鉴。
(3)数字人文平台等基础设施的构建研究。主要包括对图像库[10]、手稿特色资源库[11]、语义支撑平台[12]等的构建研究。通过对数字人文技术体系和研究工具的构建,部分图书馆也逐渐有了一些数字人文的实践案例,如上海图书馆的“上海年华”等。
也有少量关于图书馆在数字人文中角色定位或发展策略的研究。其中具有代表性的如李如鹏[13]对数字人文下图书馆的角色进行探讨,认为在数字人文项目中,图书馆可为学者和技术专家搭建沟通平台,在数字人文参与者中间具有协调的独特作用;朱娜[14]对数字人文的兴起及图书馆的角色进行研究,提出图书馆在数字人文研究和实践中可扮演资源提供者、内容策展人、学科联络员、课程辅导员、咨询顾问与研究空间提供者等角色;汪莉[15]指出数字人文需要的不是支持者和服务者,而是合作者,图书馆需要在新的学术环境中重新定位图书馆学术角色。
从以上文献调研可以看出,数字人文的确已经得到国内图书馆界的广泛关注,但是相关研究和实践均处于初始状态,图书馆人正积极对数字人文特别是国外数字人文的发展趋势和项目管理进行分析和探索,以从中找到图书馆在数字人文中的定位和发展路径。
对于图书馆学科来讲,数字人文其实并不陌生。笔者认为,数字人文的核心是计算科学,即对海量的文献进行数据化后,采用人文学科的方法论进行数据处理和研究。从这一点上讲,图书馆其实早已开展类似的工作,如利用文献开展深度的情报挖掘,Web of Science、Scopus、Scival、ESI、InCites、DLL等平台和工具,利用引文、核心期刊评价体系等进行数据计算与数据分析,都可视为图书馆学科的数字人文基础。
以近两年备受推崇的Elsevier公司的SciVal分析平台为例,利用主题词方法,将全球科研内容聚类为10万个主题,并以这10万个主题为基础,将某一研究领域或学科的文献增长和衰减趋势绘制成一个气泡图。如笔者利用该平台对材料学科进行分析,近5年材料科学的主题共计13 686个,从气泡图中进一步分析可知,中国材料科学的研究偏向于与化学化工相关的方向,而美国除化工之外,更偏向于与生物学方向的交叉。
同时,进一步对重庆大学材料学科的研究主题进行分析,全球材料学主要研究领域的主题词共计3 779个,其中重庆大学参与的共计407个(不含仅有1~2篇研究成果的主题)。根据重庆大学的参与程度和主题的前沿性,将407个主题进行划分和组合,如图1所示,可以清晰地看出重庆大学材料学科研究主题与前沿主题的对应关系,从而帮助学校和学科找到自身在研究热点和冷点中的地位,为学校和学科发展提供可靠的数据依据。
图1 重庆大学材料科学研究情况
笔者认为,图书馆在数字人文的发展中主要扮演着两个角色,这两个角色是基于图书馆和人文学者之间的分工产生的。第一个角色叫“我负责食材,你负责灶台”,第二个角色叫“我负责数据,你负责模型”。
图书馆一定要尽可能地收集学者所需要的文献资源,并且把资源进行数据化,这是数字人文研究最核心的问题。对于图书馆来说,最艰难也最重要的事情是数字文献资源的整理,即将所有纸质文献和电子文献以元数据的形式录入,并且在元数据的基础上进行必要的资源组织,以便应用于人文学者的研究。
资源是图书馆开展科研服务的基础和根本,在数字人文时代,仅拥有资源显然不够,将资源进行数据化才是关键,这也是图书馆应该做的最基础的工作。可以形象地把图书馆的文献资源比喻为沙漠,文献中的每一个知识点或关键词就是辽阔沙漠中的一粒沙子。图书馆应该思考如何将细小的知识点抽取出来,并进行数据化;而怎么治沙,怎么对知识点进行分割和组合以及怎么应用知识点做更深层次的研究,都是学者的任务。
基于以上两个基本角色,在数字人文背景下,图书馆还需要实现一个角色的转变,即一定要从资源服务体系变为数据服务体系,而且要构建图书馆的“数据生产体系”。如图2所示,数据生产体系主要包括学术数据(含文献资源数据)、事实数据、用户数据、用户行为数据、业务数据,另外还可包括来自互联网的数据等。
图2 图书馆的数据生产体系
在明确图书馆数字人文角色的基础上,梳理重庆大学图书馆已经开展的相关工作和实践,一方面,了解目前图书馆在数字人文发展中的大致进展;另一方面,也希望能为未来图书馆深化数字人文研究和服务提供更多思路和方向。
重庆大学图书馆于2016年9月开始自主研发“全流程电子资源管理系统”,系统采用图书馆学的思想和方法,具有完整的分类和著录等流程,将采购流程、元数据管理、网络服务、利用服务全部纳入规范管理。以该系统为依托,重庆大学图书馆分批分次将所购买的全部文献资源书目数据进行数据化,目前“纸本+电子”文献元数据已达2.2亿条,其中期刊文献共计165 614 527条,占比78.7%;图书共计8 117 789条,占比3.9%;其他如专利、会议、学位论文等共计36 517 740条,占比17.4%。
情报与智库服务也是研究的重点。重庆大学图书馆在这方面已经构建了一整套服务体系,包括以资源库的角色服务读者,以情报员的角色服务院系和团队,以及以智库的角色服务学校决策者和管理者。
针对不同类型的读者,开展精准推送。如对于研究型读者,推送科技查新、查收查引、科研动态和基于AI的学术头条等;对于学习型读者,开展基于用户画像的文献资源情报推送;对于非读者,则进行文献服务动态推送。对院系和研究团队,图书馆扮演积极参与的情报员。针对院系决策者,图书馆开展机构科研产出报告、研究团队发展态势与影响力以及竞争对标等各类情报服务;针对学科与团队负责人,图书馆提供学术热点和冷点分析报告、学科前沿报告、重大(重点)项目定题以及知识产权(培训、专利导航)等服务。对于学校决策者,图书馆又扮演智库的角色。针对职能部门,图书馆提供各学科和团队的科研产出报告、人才评估报告等;针对学校领导,图书馆提供全球研究态势情报、国际对标情报、学科贡献度分析报告以及学术影响力分析报告等。
在实践过程中,图书馆还存在两个较大的问题,一是忽视数字特藏建设,二是严重缺乏图像、音视频等多媒体资源。这两个问题,重庆大学图书馆都计划在“十四五”期间解决。
(1)忽视数字特藏建设。数字特藏,笔者认为既可以是独有的数字馆藏,如拍一张独一无二的照片并进入馆藏;也可以是独有馆藏的数字化,如将中山大学的徽州文书、上海图书馆的家谱进行数字化等。身处数字时代,我们正在错过很多资源,如曾经流行的软盘、胶卷、随身听、传真机、Mp3等,都是从我们经常使用到现在逐步消失。笔者于2018年参观国立维多利亚与亚伯特博物馆(Victoria & Albert Museum),发现2011年推出的微信表情包已经进入博物馆。而反思图书馆过去的资源体系,大多采用商业采购的方式获取,却一直在忽略我们身边的数字环境及其产物的收藏和整理。这些独特的资源随着时间的推移,都可能会成为人文学者研究当时社会变迁或时代发展的重要素材。因此,作为保留社会记忆、人类记忆的图书馆,亟需重新审视数字特藏建设的重要性。
(2)多媒体文献资源缺失。如华为技术有限公司创始人任正非,1963年就读于重庆建筑工程学院(已并入重庆大学),于1968年毕业离校,整理历史资料,发现留存的关于他当年在学校的学习生活的多媒体资源非常少。又如,城中村、地方文化的消失和城市历史的变迁,导致传承地域文化的声音或影像逐步消失。这些正在消失的资源都是开展数字人文研究的重要基础。对于图书馆来讲,声音文献如何保存?珍贵电子文件私密存储却无处典藏?学者人类学、社会学研究的第一手资料从哪里获取?这些问题都值得思考和探讨。
上述这些问题,虽然仅是作为一个学术的假设提出,但事实上,如果图书馆继续忽略数字特藏建设,不能构建起完整的资源体系,可能真的难以支撑数字人文的研究。
(1)持续开展数据收割。重庆大学图书馆用了3年时间积累了接近3亿条数据(含运行数据),并且在“十四五”期间还会持续致力于知识基础设施体系的建设。包括数据标准、基础知识库、人名库、机构库、学术关键词库的建设,以及基于数据标准和数据库建立关联数据和知识图谱等。同时,也将尝试进行文献的全文数据化。这些都是图书馆未来努力的方向,将有助于支撑数字人文的研究。
(2)加强数字特藏建设。重庆大学图书馆已经启动重庆大学数字记忆项目,在“十四五”期间,将全面收集重庆大学自1929年建校以来的所有文献、图片、声音和各类档案,并进行深度标引和展示,从而构建起一个完整的采购、收藏和服务生态体系。
(3)进一步深化学科支持。在学科支持方面,主题方法是图书馆行业长期使用的,但目前的学科分析平台和工具,其数据分析普遍基于外文核心期刊,图书馆可以构建一个基于所有文献的全文主题词抽取模型,优化分析策略。同时,还可基于数据构建场景化的科研和决策支持体系,如提供学科科研动态、博硕士选题、投稿引导、精准人才引进、学者绩效全方位评价、学科评估、竞争情报、学科趋势等全方位的数字化服务,只有这样才能真正实现图书馆“望远镜+显微镜”的功能。
通过以上3个方面的努力,图书馆将会构建起更完整的资源体系,提供更丰富的数据化文献,学者将可运用资源的元数据去开展更多科学研究,并且免去传统手工、烦琐的资料收集和整理工作,提升科研效率和准确性。数字人文研究和实践,是智慧图书馆建设的重要内容,甚至是其中一个全新的篇章。图书馆将通过不断探索和实践,逐渐认清自身的角色、找到合适的发展路径、顺应数字人文发展潮流,落实和践行“文献支撑”的宗旨,最大程度助力科学研究和学科创新发展。