数字人文变革对档案馆业务活动的影响⋆

2019-12-16 11:20施玥馨王玉珏李子林
山西档案 2019年5期
关键词:档案馆人文数字

施玥馨 王玉珏 李子林

(1.武汉大学信息管理学院 武汉 430072;2.中国人民大学信息资源管理学院北京 100872)

0 引言

数字人文作为一个新兴的跨学科研究领域,滥觞于1949年意大利神父罗伯特·布萨(Roberto Busa)的阿奎那项目中所引申出的“人文计算(Humanities Computing)”。此后,计算技术开始大量应用于语言学、历史学、文学、图书情报科学等领域,计算思维影响到整个人文学科研究。20世纪90年代后,随着第三次技术革命浪潮的推进和互联网的广泛应用,数字技术的日渐成熟应用也对人文研究进行全面渗透,仅为人文研究提供技术支持的“人文计算”已经不能全面反映其内涵,从而逐渐被“数字人文”的概念所取代。当前,“数字人文”的定义目前在学界尚不统一。《数字人文:改变知识创新与分享的游戏规则》一书认为,数字人文指的是充分运用计算机技术开展的合作性、跨学科的研究、教学与出版的新型学术模式和组织形式[1]。南京大学信息管理学院教授朱学芳参照J.Unsworth 教授文章《什么是人文计算,什么不是》中的观点提出,数字人文是指围绕人文社会科学领域特定研究对象知识本体的数字化保存和应用所进行的相关信息资源采集、 加工、组织、服务、研究、教育等活动总称[2]。虽然不同学者的定义有所差别,但可以达成的共识是:数字人文并不仅仅是单纯地将计算技术应用于人文领域,而是更多关注于数字技术与人文研究之间的互动、交流和反馈。

在人文社会科学研究中掀起热潮的数字人文对档案工作也产生了不容小觑的影响。截止2019年8月16日,以“数字人文”+“档案馆”“档案工作”“档案管理”作为关键词在CNKI数据库检索得到有效文献56篇,经分析总结可得,研究主题主要集中于档案馆数字资源融合[3][4],数字人文下的档案资源开发利用[5],数字人文与档案工作关系探讨[6][7],数字人文下的档案工作参与机制[8]等方面。档案作为一种丰富的信息资源,是数字人文研究的重要对象之一。数字人文项目中的主要内容,如原始数据的收集管理、数字仓储的构建、虚拟现实情景构造等,与档案馆业务活动也有诸多重合之处。诸多数字人文技术在档案工作中付诸实践,促进档案馆加强馆藏资源的保存管理和开发利用。在这种背景下,本文希望通过探讨数字人文变革对档案馆各项业务活动的影响,准确把握数字人文研究与档案馆业务理论与实践的关系,为未来档案馆如何应对数字人文变革、优化业务形式提供思路和参考。

1 数字人文与档案馆业务活动的关系

数字人文与档案馆业务活动之间存在着双向性关系,二者相互影响、相互交融。一方面,档案馆业务活动与数字人文项目活动存在交叉,丰富的档案馆藏资源为数字人文项目提供了信息数据基础,信息描述、档案数字资源库构建等档案馆业务活动是数字人文项目研究的子课题。另一方面,数字人文理与技术念为档案馆业务活动提供指引,是档案馆业务活动创新发展的新方向。

1.1 档案馆业务活动与数字人文项目活动存在交叉

数字环境下,大量档案信息资源以数字化的形式存在,加之数字技术本身的便捷,使得档案馆更加重视现代信息技术在档案业务活动中的应用。除传统档案馆外,数字档案馆在世界范围内兴起,并逐渐成为当下档案馆新的发展趋势。数字人文项目活动的主要内容包括:海量图像集可视化、历史文物3D建模、原生数字论文的管理、主题标签应用与分析、虚拟现实游戏等。而纸质文件数字化、信息资源的描述、元数据方案设计、关联数据、信息可视化、档案数字资源库建设等应用数字技术的档案工作环节与其存在诸多交叉重合之处[9]。

以数字人文项目在档案服务利用中的应用为例,2013年,荷兰国家档案馆开设“记忆宫殿”展厅,将馆藏档案设计为虚拟的世界地图,地图上的大陆板块代表不同的馆藏数据库,城市代表档案集群。浏览者可以通过可视化技术读取该地图,从而了解馆藏。此外档案馆还利用虚拟现实技术对各种地图进行3D转化,并使用数字叠加技术再现不同历史时期的景观。这种形式将虚拟现实技术与档案文化遗产紧密结合,使利用者对馆藏历史档案“触手可及”[10]。

1.2 数字人文理念为档案馆业务活动的创新提供指导

数字人文理念强调将“数字”与“人文”有机结合,利用数字技术整合、组织与开发各类信息资源,辅助人文学科的学术研究。同时关注研发用于合作性学术工作的可迁移工具、环境和平台,强调管理在学术实践中的重要地位[11]。将数字人文理念应用于档案馆业务活动之中,能够通过技术交流与知识互补,实现对档案工作的宏观指导。使档案馆明确自身在数字人文研究中的重要作用,重点关注档案资源开发和服务利用,主动对档案资源进行深度加工,开发各类数字人文工具和资源包,为研究者提供便利。

长久以来,我国档案馆工作的核心都是档案物理实体和档案信息的保存,为公众等社会主体提供档案利用服务只是档案馆业务活动的环节之一,是在利用者需要时才进行提供的被动过程。在大多数公众心目中,档案馆并非“亲民”机构,因此到馆人数与档案利用率通常不高。但随着社会需求的变化和国家政策的要求,档案馆必须化被动为主动,转变服务理念,打破与普通公众间的隔阂,明确其公共文化机构的职能定位。目前我国多数档案馆提供档案服务的主要方式为利用者到馆查档,难以引起公众兴趣。而数字人文理念为档案工作注入新鲜血液,带来更多创新思路,使档案馆业务活动趋于多样性,能够在一定程度上改变档案服务形式单一的现状。如 “威尼斯时光机项目(the Venice Time Machine)”将威尼斯国家档案馆的地图、手稿、乐谱等档案数字化,以动态数字形式捕捉超过1000年的记录,使用机器学习的形式识别、读取档案文本,并应用3D技术还原不同时空的建筑景象,使公众能够通过“时光机”看到过去,实现“穿梭时空”[12]。

1.3 数字人文技术为档案馆业务活动的优化提供支持

信息化时代,各类信息、文件、资料呈指数爆炸式增长,电子档案成为档案馆管理对象的重要组成部分,民众等社会主体对档案信息资源利用需求增加……这无疑为档案馆业务活动提出了新的要求。传统以人工为主的档案管理方式效率低、成本高,能够提供的档案服务十分匮乏,已经逐渐落后于时代发展潮流。而数字人文技术的出现和应用在一定程度上有效弥补了这一问题,关联数据技术、文本挖掘技术、可视化技术、虚拟现实技术等等为档案馆业务活动提供多样化的形式、注入新的活力。

其中,关联数据技术促进文化数据链接,扩展数据应用范围,对档案信息组织标引和优化档案检索服务具有重要价值。文本挖掘技术通过计算机语言对文本内容进行聚合、分类、关联、预测,快速精准提取所需信息,提高信息检索效率[13],加快档案馆馆藏资源整合,为档案编研和用户检索利用提供便利。可视化技术和虚拟现实技术能够创新档案资源利用服务,改变传统单一的“档案原件(或复制件)+文字解释”档案资源展陈方式、优化展览效果,使利用者更直观立体地感受档案的魅力。从而加强档案馆宣传,树立公众档案意识,培养公众档案兴趣。如日本的“虚拟京都(Virtual Kyoto)”项目在引入4DGIS(四维地理信息系统)的基础上,应用GIS、VR等先进技术,对8世纪晚期平安时代至今的历代京都进行3D城市建模,动态展示不同历史时期城市的土地利用和景观变化[14]。

2 数字人文变革影响档案馆业务活动的内容

数字人文思维方式的引领、数字人文核心理念的渗入、数字人文先进技术的应用都推动着传统档案工作的转型与创新。具体而言,数字人文变革对档案馆业务活动的影响主要有以下几个方面:

2.1 档案组织工作的升级

2.1.1 档案数字化

作为档案组织工作的重要内容,档案数字化是信息化社会发展的必然要求。基础性档案数字化工作将各种传统载体的馆藏档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式传输,并利用计算机系统进行管理[15]。主要内容包括通过扫描对纸质档案全文进行数字化转化,对多媒体档案进行数字化转化,以及档案目录数据库建设。数字化只是简单地录入档案目录与全文,录入后以图像的形式存储于计算机内,而无法对其内容进行检索。对于以大量原生数字资源为研究对象的数字人文项目而言,这种数字化远远不够。“拥有大量的数据本身并不会增加任何价值,数据的核心是价值,而驾驭数据的核心是分析[16]。”档案数字化存储已经成为档案业务活动的基本内容,但数字化的档案却无法内容检索与分析。如若数据分析与挖掘技术在仅仅实现数字化的档案面前没有用武之地,档案的大部分价值就这样流失了。因此,在大数据时代,必须要将档案从“数字化”拓展到“数据化”,通过对文本和图像中的数字内容进行识别、分类、著录和标引[17],将档案文本转化为结构化的档案大数据,才能提高检索精度和效率,深度挖掘数据的内容与联系,最大限度发挥档案价值。对于档案馆业务活动而言,立足数字人文背景推动档案数字化工作的升级,加强档案著录工作、建立档案全文数据库和档案大数据平台刻不容缓。

2.1.2 档案著录

档案著录是实现档案数据化的重要环节之一,档案著录工作的创新和进步对数字人文项目发展起着至关重要的作用。与传统人文研究相比,数字人文研究的主体得到了拓展。除学者、教授外,普通公众也可以参与到数字人文研究中来,这就催生出数字环境下的档案众包模式。这一模式使仅凭档案馆工作人员难以在短时间内完成的任务在群众的力量下迅速高效实现,显著提升著录效率。此外,参与众包的公众通常都对项目主题感兴趣,也满足了公众的兴趣取向。例如盛宣怀档案抄录项目招募公众作为志愿者协助档案手稿识别,志愿者通过基于在线众包模式的抄录平台对盛宣怀档案进行数字化抄录和标注,从而充分地探索、传播和利用这件珍贵的历史材料[18]。元数据描述了信息资源的特征和属性,不仅利于构建检索系统,还能保证信息真实可用[19],是档案管理的重要组成部分和档案著录关注的重点要素。数字人文研究以原生数字信息资源为对象,需要依靠元数据以保证这些数字资源的真实性、完整性、可靠性。档案机构在制定档案文件元数据管理方案与标准时,应考虑数字人文研究需求,便于研究者方便地获取格式统一、真实可靠的研究资料。

2.1.3 关联数据

数字人文通过关联数据技术应用于档案组织工作。关联数据技术可以为多种类型的档案资源赋予相应的URI定位,保证资源数据的一致性,能够有效解决档案资源孤立、封闭的问题,减少数据冗余。同时挖掘档案资源间的隐形关联关系,实现同一主题资源的高度融合,形成关联访问,提供利用[20]。该技术的应用极大地提高了档案信息间的关联性、拓展了档案资源被发现的可能性,使档案信息检索更加准确、高效、便捷。以美国普瑞特信息与图书馆科学学院主持的“关联爵士项目”为例,该项目从爵士档案中抽取访谈脚本,构建爵士名称目录,再与名称规范文档进行映射,对脚本中所提及的名称进行标注,然后让用户利用众包工具分析、标注艺术家之间的关系,最后将艺术家的关系网络用可视化工具表达出来,从而通过档案资料揭示爵士音乐家之间的语义关联,也为现有人文档案的解读提供了新途径[21]。

2.2 档案开放鉴定的重新思考

数字人文的出现给传统人文研究范式带来挑战,研究者不再自己“单打独斗”,而是更多倾向于以项目为单位跨学科、跨领域进行研究。这就对各类信息资源的自由获取提出了更高的要求。档案因其真实可靠性,成为数字人文研究的重要来源,是研究者求之不得的优质资料。但大多数国家都具有档案封闭期制度,档案必须在档案馆内封存几十年才能够公开。封闭期制度原本是为维护国家、个人权利所设置的档案保护制度,却使研究者难以获取所需资料,学术研究受到极大阻碍。可见,数字人文视野下,档案的开放问题成为了档案馆业务活动首先面临的掣肘。《数字人文:改变知识创新与分享的游戏规则》一书中提到,“人文学术的未来发展及社会影响力在很大程度上需要依靠对文化历史机构馆藏的自由获取利用。因此,限制程度最低的共享与授权模式应该成为主流[22]。”如何调整档案开放范围与时间,以保证既不侵犯国家和公民权利,同时又最大限度提供档案资源的自由利用,成为了档案机构必须重新思考的重要问题。

技术爆炸带来的不仅是生产力进步,还有海量原生数字信息资源的涌现。这些资源是否具有永久保存价值,需要通过档案鉴定这一业务环节完成。传统档案鉴定工作通常仅由档案工作者对档案来源等要素进行判断。但在数字人文环境下,从浩如烟海的数字信息资源中筛选需归档管理的部分显然超出了档案工作者当前的能力范围,仅凭档案工作者完成鉴定工作是不现实的,还需要计算机技术专家提供专业技术支持。档案鉴定工作的变革成为档案馆亟需重点关注业务活动之一。此外,现存档案鉴定理论在实践中对原生数字信息资源鉴定的应用程度与适用性尚不可知,在应用对象发生变化的前提下,鉴定理论也必须立足数字技术环境向前深入发展,为档案鉴定的实践工作作出指引。

2.3 档案保管工作的创新

传统人文研究以原始档案文本为重点研究对象,计算技术的进步与数字人文的发展改变了这一现状,数字化档案信息资源成为数字人文项目的主要关注目标。为与之相适应,档案保管活动的重点也逐渐由纸质档案物理实体向数字档案转移。然而,存入光盘或硬盘的传统保管形式难以承载海量涌入的数字档案,物理载体也具有一定的损坏风险。在这种情况下,云存储容量大、无需物理载体的优势显现出来,在保证信息安全的情况下,将其运用于数字档案保管工作已经成为必然趋势。此外,新兴的区块链技术作为保障数据安全和可信的重要技术手段,能够确保电子文件真实、完整、可靠,在档案保管领域也具有广阔的发展前景[23]。

数字人文变革还丰富了传统档案存储的内容。仅将档案物理实体和数字档案进行归档保存无法满足深度挖掘档案价值、开发档案资源的需要,搭建服务于人文研究特定主题的数字人文仓储成为档案机构的必然选择。作为数字人文项目的信息资源基础,数字人文仓储的搭建需要基于研究对象知识本体进行相关数字对象的采集、加工、组织和保存,并为对应用户群体提供集成化、专业化、精确化、智能化、互动性数字信息服务[24]。从而实现提高档案服务质量,满足研究者的深层次利用需求。数字人文项目通常都具有单一而明确的研究主题。在主题覆盖广泛的档案馆藏中,各种特色档案、专题档案如果不进行专门的搜选和整理,很难为特定研究者所用。为集中特色馆藏、满足研究者特定需求,许多档案馆立足馆藏资源,划分研究主题,整合汇编特色档案数据资源库。例如我国云南省档案局(馆)就完成了13个云南特有少数民族历史档案数据库的建设,数据库内包括大量原始文字资料和图书,以及各种民族服饰、乐器等[25]。

2.4 档案利用服务的优化

2.4.1 推动档案在线界面更新升级

在网络信息技术飞速发展的今天,大多数公民已经习惯于使用手机、电脑等移动端设备获取信息,以提供到馆服务为主的传统档案利用方式因受时空限制已经逐渐失去主流地位。这也意味着档案馆必须向公众提供可通过移动设备访问的在线数字界面,从而满足用户随时随地获取档案信息的需求。许多档案馆已经开设了以“两微一端”为代表的档案新媒体平台,通过互联网向用户推送信息。但档案馆向用户单向推送的方式忽略了用户本身的主动性。在数字人文环境下,用户对资源的需求各异,更加人性化的用户界面设计与具有个性化的精准推荐才是用户在线界面更新升级的未来方向。此外,还应为用户间的交互留出专门空间,实现用户的多向沟通,打造良好的交流氛围。开发者也能在用户的反馈中发现问题,进一步提升质量。例如“泽农公司(Zenon)档案项目”设计出了一个供平板电脑使用的应用模型,使用户可以通过多路径导航系统进行线上线下访问,并在平台上获取泽农公司的档案内容,方便使用者获取信息、交流知识、体验数据。开发者将从社交媒体排名、在线商店排名、下载数量和用户评价得到直接反馈[26]。

2.4.2 以用户为中心,打造“活态档案馆”

人们对档案的传统印象是封存于档案馆中的原始历史资料,具有极强的利用限制。但数字人文为档案机构提出了新的可能性:档案活化。与死气沉沉的传统档案概念不同,“档案活化”意味着以用户为中心的档案建构方法,通过在档案架构中搭建大量的应用场景,打破档案藏品与实体机构之间的界限[27]。与此同时,档案馆的现代角色发生变化,逐渐由档案保管机构向公共文化机构转型,以用户为中心的服务理念树立起来。在数字环境下,计算机技术使档案馆的服务对象从本地区扩展到全世界,机构线上虚拟建设显得尤为重要。档案工作者无需再仅仅关注到馆人数,而是借助AR,VR技术导览、线上展览等形式打造“活态档案馆”,让用户能够通过多种形式自由灵活地使用档案资源。例如朗诺等学者将档案研究与数字人文技术相结合,利用原始档案重建缺失的电影序列,并创建动画作为研究的有效可视化,创造性地描绘档案研究的过程,实现档案活化[28]。

2.4.3 开发数字人文工具包

数字时代需要进一步强化人文研究与档案馆之间的关联。传统档案馆档案服务多数是为历史研究提供参考与咨询,而史学研究仅是人文研究的一小部分,对档案馆档案服务的需求有限[29]。传统的参考咨询也无法满足数字人文研究对大量高质量数据信息资源的获取需求。数字人文研究主题涉及领域广泛,所需数据庞杂,研究者在利用档案资源时需要一定的工具予以协助,因此立足档案馆藏和人文研究需求,开发数字人文研究者与档案工作者可使用的数字人文工具包十分必要。

数字人文工具包开发的经典案例是基于台湾历史数位图书馆馆藏建立的“台湾历史数位图书馆工具集”。其中包含多种参考工具、检索分析工具和关系勘探工具,如中西历转换对照查询、清代台湾文官官职表查询系統、度量衡单位换算系统、THDL(台湾历史数位图书馆)前后缀词分析工具、THDL契约文书买卖角色分析等。该工具集为台湾史研究者提供了丰富的查询比较功能,大大提高了研究效率[30]。

3 结语

数字人文的技术与理念从档案组织、著录、管理、服务等层面对档案馆业务活动产生了深刻影响,全方位推动档案馆职能转型和业务升级。档案馆应紧跟数字人文的时代潮流适时转变工作思路、改变工作模式。首先,要树立数字人文内核的档案工作观念档案馆必须认识到,当前工作重心已经发生转移,要在做好档案实体保存的基础上,更加重视用户的利用需求。档案馆要树立以用户为中心的服务观念,立足不同社会群体的需要,不断创新档案服务方式。其次,强化基础建设,探索数字人文模式的档案业务工作。面对数字人文潮流,档案馆需要加强信息化基础设施建设,为档案馆业务活动向数字人文方向发展提供底层保障。在加大档案数字化力度的同时,推进档案数据化,并将关联数据、数字人文仓储等数字人文技术应用于各项档案工作环节。第三,升级服务,开辟数字人文研究的档案特殊服务。档案馆应着力建设线上档案服务平台,为用户提供“一站式”服务和个性化精准推荐。应用虚拟现实技术、地理信息系统技术等数字人文技术结合原始档案资料搭建虚拟交互环境,增强用户在展览中的沉浸感。同时开发供档案工作者与人文研究者使用的数字人文工具包,为人文研究获取档案资源、深入探索档案关联提供便利。第四,融合共生,孵化跨界合作的档案业务工作团队。档案馆可以招聘具有数字人文知识背景的复合型档案人才,培养数字人文人才队伍。同时聘请数字人文专家从数字人文视角对档案工作进行指导,并在馆内开展数字人文培训和讲座,以提升馆员的数字人文素养,从而在未来更好地适应数字人文变革。

猜你喜欢
档案馆人文数字
美在山水,魂在人文
最朴素的人文
太原市档案馆牵手百年胡氏荣茶共寻文化脉络
云南省档案馆馆藏《东巴经》
答数字
数字看G20
人文社科
when与while档案馆
成双成对
数字变变变