平 硕 黄永勤 杨安莲/国防大学政治学院军事信息与网络舆论系
数字人文起源于“人文计算”,是近年来人文社会科学与计算机技术、数字技术相互融合的新型跨学科研究领域。学者们对于数字人文的定义莫衷一是,没有确切的统一定论,其中2004年John Unsworth等专家编写的《数字人文指南》成为最早系统研究数字人文的著作[1]。2009年现代语言协会年会(the Modern Language Association)上,“数字人文”作为一个新的研究领域获得北美人文学界的关注;同年,武汉大学王晓光教授发表《“数字人文”的产生、发展与前沿》[2],最早将数字人文概念引入国内。数字人文被提出之后,国内外学者发现通过信息技术手段重塑和改造人文知识,可以使深奥的人文学术领域被更为广泛的民众所理解和利用,进而提升学术领域的影响力[3]。
档案是传统人文研究的重要对象和资源,蕴含丰富的国家、社会和民族记忆,数字人文以一种新型学术模式和组织形式为档案学研究和档案工作提供了新思路。数字人文连续4年(2018年[4]、2019年[5]、2020年[6]、2021年[7])入选图情档学界研究热点问题,冯惠玲教授[8]等权威专家也将“档案与数字人文”研究作为“十四五”期间档案学重点研究领域展望之一。经过数年发展,档案领域的数字人文研究已经积累了一定数量的成果,但目前尚未发现有相关论文对其进行总结。本文尝试梳理国内外的相关研究进展,以期为后续研究提供参考。
笔者选择图书馆和信息科学文摘数据库(LISA)作为国外文献来源数据库,中国知网CNKI(含中国学术期刊〔网络版〕、中国博士学位论文全文数据库、中国优秀硕士学位论文全文数据库、中国重要会议论文全文数据库和国际会议论文全文数据库)为国内文献来源数据库,检索范围从2004年1月至2021年9月,分别构建检索式“(SU digital humanity OR SU digital humanities OR SU humanities computing) AND (SU archive* OR SU records)”和“SU=(数字人文+人文计算+数字记忆)*(档案+档案馆+档案研究+档案工作+档案管理)”,经过数据去重和补全,获得国外文献239篇、国内文献222篇(注:检索并下载数据时间为2021年9月10日—14日)。
对文献初步统计分析发现:第一,从发表时间看,国内外学者十分关注档案领域的数字人文研究。整体而言,国外开展研究的时间比国内早,而国内有87%的论文发表在最近3年,研究迅速势头迅猛,已成为当下的研究热点。第二,从文献来源看,国内研究论文多发表在档案领域专门期刊上,国外研究论文多发表在图书馆和信息科学领域的期刊上。第三,从发文作者看,国内外学者大多采取合作的方式进行研究,但国内学者多在本研究领域内合作,而国外学者多是跨领域、跨学科合作。第四,从研究机构看,国内外研究学者多集中于高校、图书馆和数字人文研究中心,表明数字人文在档案领域的研究还需要逐步发展和完善。
笔者利用VOSviewer,分析国内外研究成果的关键词。分析发现,国内外研究热点可以分为4个方面,且相互之间联系密切。一是基本理论研究,涉及的关键词包括数字人文、数字档案、档案、数字记忆、知识组织、Digital Humanities、Archives And Records、Digital Archives、Digitization、Metadata等。二是学科建设研究,涉及的关键词包括档案学、档案工作、档案馆、数字转型、人才培养、Humanities、Library and Archives、Digital Libraries、Research、Interdisciplinary、Cooperation等。三是应用技术研究,涉及的关键词包括关联数据、可视化、数据挖掘、Social Networks、Data Mining、Semantic Web、Geographic Information Systems(GIS)、Visualization等。四是实践拓展研究,涉及的关键词包括社会记忆、城市记忆、数字人文中心、非物质文化遗产、Museums、Semantics、Library And Information Sciences、Digital Preservation等。
综合上述文献分析结果可以发现,目前数字人文在国内档案学领域的研究思路主要是对数字化的档案资源进行组织,建立档案资源数据库,运用信息技术手段进行数据挖掘和知识加工,向用户提供可视化展示和利用服务。具体研究主题可以归纳为以下4个方面。
一是基础理论研究。数字人文作为一种理念和方法,在融入档案学领域的过程中应批判性地加以应用。很多学者对数字人文与档案工作之间的关系进行探讨,认为数字人文有助于档案学科创新发展。加小双[9]对档案领域与数字人文领域的档案概念进行分析和界定;张卫东[10]认为档案学科在实施数字人文的过程中,应运用辩证思维,既要积极利用,也不盲目追捧;左娜[11]提出保持对数字人文理念的持续批判,实现由“作为档案研究重构策略的数字人文”向“作为数字人文重构策略的档案理念”的转变。
二是档案资源建设和开发利用。数字人文背景下,档案资源建设是开发利用的基础,档案资源开发利用是开展项目和服务的重要环节。越来越多的研究借鉴国内外的研究成果,以自建或复用本体、构建知识图谱和专题数据库的方式进行档案资源的开发利用,实现档案资源知识组织和关联推理,进而提供查询和利用服务。同时,还有学者以档案学科话语体系为标准,提出以“发现”“重构”“故事化”三原语为主线的档案研究路径基本模式,形成数字人文视角下档案研究的方法论体系[12]。
三是数字人文技术。数字人文技术是实现档案资源服务、保证数字人文项目开展的重要手段。数字人文的技术与理念从档案组织、著录、管理、服务等层面给档案业务活动带来了巨大变革[13]。数字人文技术的应用取决于档案资源的特点和类型,整体而言,对档案内容挖掘与知识发现是数字人文研究的重要组成部分[14]。地理信息系统(GIS)、数字地图等可视化技术可以直观展示档案数据形象;人机交互、虚拟现实(VR/AR)等技术可以提供更好的用户体验,实现多媒体档案的价值;文本分析、内容挖掘等数据分析技术可以在语义层面提供更为广泛的档案信息检索和利用服务。
四是数字人文项目。我国档案领域的数字人文项目虽起步较晚但成果颇丰。从空间维度看,研究者以美国、日本、欧美等国家具有代表性的数字人文项目为研究对象,为我国数字人文项目提供参考和借鉴。从时间维度看,档案机构和研究者开展以文化遗产档案、历史档案、红色档案、机构档案等为主体的数字人文项目,以实现档案资源的价值。此外,研究者对我国具有代表性的历史建筑、山川河流、文化名人等档案资源进行整合,形成特色资源知识库、知识图谱、知识地图等产品,为用户提供档案查询和利用服务。
目前数字人文在国外档案学领域的研究多由研究机构推动,从具体领域项目实践出发,实现档案资源的保护与利用。其研究主题可以归纳为以下3个方面。
第一,机构主导特点明显。国外档案机构主动服务和接受新思维的理念与意识要强于国内档案机构,因此国外的数字人文项目实践大多由档案机构和数字人文中心合作组织开展。Lavinia Ciuffa[15]阐述了数字人文中心(DHC)对于数字化档案描述的作用,认为其可以为研究档案资源提供帮助;Megan E. Macken[16]探讨了数字人文学科与GLAM(Galleries、Libraries、Archives、Museums)之间的合作优势及可行性;Tanya Clement[17]等人采用访谈的方式,讨论了数字人文背景下档案馆未来的动态发展特点;Bernhard Fetz[18]阐述了奥地利国家档案馆在开发和利用档案馆藏资源和数字人文发展方面所做出的努力。
第二,数字人文技术和方法。国外学者对于信息技术在人文学科的应用非常重视,自然语言处理、语义关联、虚拟现实、空间重建、文本分析等信息技术在实证研究方面得到了很好的应用和拓展。以“威尼斯时光机”(Venice Time Machine)项目为例,科研人员运用了扫描、图形设计、3D建模等数字化技术,文本搜索、语义搜索等数据管理技术,文本分析、内容挖掘等数据分技术,视觉搜索、地理信息系统(GIS)等可视化技术,为档案资源的保存管理、信息搜索、内容分析和可视化呈现等开辟了新的途径。此外,A. Miller[19]等人认为交互式数据可视化可以用于深入探索数字馆藏并激发用户驱动;Sheila Bair[20]等人认为以规范化名称标题和主题的形式添加元数据,可以极大增强关键词搜索体验、有效满足用户需求。
第三,档案资源保存与保护。国外研究学者对于档案文化遗产的保存与保护十分重视。相比于传统的档案文化遗产保存与保护,开展数字人文项目能够有效修复、组织、管理和保存数字化的档案文化遗产,为档案文化遗产的数字长久保存提供解决方案。如,Marjan Balkestein[21]等人讨论了使用ADA(数字学术遗产存档)方法对旧的数据文件进行追溯归档,并发现其在档案保管中具有现实作用;Cait Coker[22]等人建立关系型数据库中的树形结构,用以保存和恢复原始文本和数字化知识。
结合国内外研究现状,笔者认为国外数字人文与档案学领域的研究虽然没有发展成完整的研究体系,但从理论研究和实践研究看,其相比国内更加成熟。因此,国内档案领域数字人文研究需要在理论体系建设、技术开发与应用、项目成果与产品服务、跨学科交流合作中进一步发展。
第一,数字人文理念在档案领域生根发芽。综合国内外的研究问题和项目实践来看,一是数字人文与档案学科领域的融合,革新了档案领域的研究方法,拓展了档案学科研究的边界;二是数字人文理念为档案资源整合提供了思路和方法、优化了资源配置,有利于档案资源建设;三是数字人文一定程度上改变了传统的档案资源的开发利用模式,有利于实现档案资源的内在价值;四是数字人文为档案学研究提供了先进的技术工具,为开展知识服务和组织聚合提供了有力的保障;五是项目实践为数字人文与档案学研究融合奠定了基础,进而在档案管理、教育、科研等工作中发挥作用。2018年以来国内数字人文研究经历了追捧热议和辩证思考,正处于系统深入研究的阶段,需要档案学者们共同努力,为档案学领域的数字人文研究积累经验。
第二,数字人文技术不可或缺。技术的支撑作用主要体现在以下方面。在信息组织过程中,自动标引技术、数据管理技术等数字化技术可以将非结构化或半结构化的档案资源结构化,使结构化的档案资源有序化,让资源更加有效地被计算机识别从而进行挖掘和展示。在内容分析过程中,文本分析技术、内容挖掘技术等数据分析技术在发现、提取知识,以及数据描述、数据挖掘等方面有不可或缺的作用。在可视化展示过程中,虚拟现实技术、VR/AR技术等数字人文技术的应用,可以使计算机中的数字资源转化为直观的展览形式,提供可视化的动态展示。但由于汉语具有特殊性,在古汉语识别和自然语言处理方面,我国数字人文技术相对国外还需要进一步发展和完善,这也是国内档案领域开展数字人文项目需要重点解决的问题。
第三,数字人文项目成果丰硕。国外的数字人文项目主要依托高校和数字人文中心进行,主题大多是历史记忆和档案管理,如“影谷(The Valley of The Shadow)”“9·11电子档案(The September 11 Digital Archive)”“欧洲时光机”“莎士比亚手稿”等项目。国内主要以高校数字人文研究中心和图书馆为主体,相继开展了“中国家谱知识服务平台”“北京记忆”“盛宣怀档案知识库”等一系列数字人文项目。国内外在这方面也有合作,如,敦煌研究院和美国梅隆基金会合作的“数字敦煌”项目、北京大学和哈佛大学合作的“中国历代人物传记资料库(CBDB)”等,都是典型代表。从形成的产品和服务来看,国内的数字人文项目多以某个主题为主,成果相对分散;国外数字人文成果更加丰满,更能满足大多数用户需求,相比国内其产品服务和应用范围更广。
第四,学科和行业间合作交流是必经之路。从国内外研究论文看,数字人文研究涉及计算机学、文学、地理学、考古学、历史学、经济学等研究领域,学者们试图从新的技术角度构建当代知识系统和认知方式,在数字时代重构人文知识的脉络和内容,这使得数字人文有了普遍的跨学科意义。国外数字人文研究论文的关键词中,涉及的学科领域非常丰富,不仅需要多个学科的学者共同合作完成,研究成果也往往会根据具体的研究内容设置多个学科关键词,这些关键词体现了不同学科之间的交流合作。国内档案领域数字人文研究多集中在图情档学科内部,虽然部分高校开始培养不同学科背景学生的数字人文素养,但还需要以项目为牵引,进行跨领域的开放合作。
第五,数字人文在档案学领域研究持续深入。截止到2021年5月,通过centerNet网站认证登记的国际数字人文建设实体共计168个。截止到2021年9月,我国有11所高校(清华大学、北京大学、武汉大学、南京大学、中国人民大学、上海大学、上海师范大学、南京师范大学、南京农业大学、曲阜师范大学、台湾大学)先后成立了数字人文研究中心,这说明数字人文的研究实体逐渐获得学术界认可。从文献来源看,国内外有DHCommons、DHQ:Digital Humanities Quarterly、DSH:Digital Scholarship in the Humanities,以及《数字人文》《数字人文研究》《数位典藏与数位人文》等专业期刊,国内于2019、2020、2021年连续召开的3届数字人文年会,推动了数字人文研究的迅猛发展,为数字人文在档案领域研究的持续深入提供了学术交流平台。
下一步,笔者将尝试在数字人文背景下对军队档案资源的开发和利用进行研究,针对军队档案资源的特点和内容,采取信息组织与整合的方法,构建军队档案领域本体,进而构建军队档案资源专题数据库和知识图谱,实现军队档案资源的检索查询与关联利用服务,满足军队备战打仗和指挥决策的需求。