数字人文视域下南侨机工档案文献遗产开发路径研究

2021-11-26 12:27黄天娇邱志鹏于雯青云南大学历史与档案学院
浙江档案 2021年10期
关键词:机工编研遗产

黄天娇 邱志鹏 于雯青/云南大学历史与档案学院

近年来,对抗战档案资源的抢救性发掘成为我国档案工作的重点之一。随着抗战档案资源的发掘,南侨机工档案作为抗战档案的重要组成部分备受学界关注。2018年5月,云南省档案局推荐的“南侨机工档案”被列入《世界记忆亚太地区名录》[1]。因此,对南侨机工档案资源的深度开发也成为南侨机工档案资源开发工作的重点。数字人文技术作为近几年新兴的档案资源开发手段,将其引入南侨机工档案文献遗产的开发,不仅能丰富南侨机工档案文献遗产的开发手段和开发路径,也为南侨机工档案文献遗产的宣传提供更为便捷的途径。因此,基于数字人文视域,开展南侨机工档案开发理论研究、路径研究,对民众重温历史、感受抗战赤子功勋与不屈不挠的抗战精神具有深远意义。

1 数字人文与南侨机工档案文献遗产开发

随着南侨机工档案文献遗产发掘工作的展开,南侨机工档案文献遗产呈现出内容丰富、载体多样的特征。基于此,需要从多个角度、多个层次对其进行创新性建构和深度化开发,而“数字人文蓬勃发展和广泛延展,将提供重构知识的技能和机遇”[2],恰好可以为南侨机工档案文献遗产的开发提供技术支持。

1.1 数字人文拓展南侨机工档案文献遗产开发思维

数字人文技术源自计算机领域,强调在多媒体技术和互联网技术的联合支持下,对档案资源进行数据处理和数据标引,以在线形式展现南侨机工档案文献遗产全貌,为档案资源开发利用提供深度融合思维。数字人文的计算机技术属性,使得数字人文在档案资源的开发过程中强调档案资源内容的深度融合,数字人文项目践行融合理念,可以实现档案资源开发利用的理念革新[3]。针对南侨机工档案文献遗产开发而言,要融合多种技术,汇聚多元化理念进行开发。如,以3D、VR/AR/MR、沉浸式体验等取代海报、展播等传统展览方式,可提升用户的体验感与参与度[4]。

1.2 数字人文提升南侨机工档案文献遗产开发效率

南侨机工档案文献遗产数量巨大、类别多样、内容丰富,涉及纸质档案、照片档案、实物、口述资料等。如,云南省档案馆保管有南侨机工档案850卷;瑞丽市畹町南洋华侨机工回国抗日纪念馆展出有2000余张南侨机工照片和4000余件实物。此外,其他机构也保存有南侨机工档案文献遗产。数量丰富、保存分散的南侨机工档案文献遗产资源需要借助新技术手段跨时空的便利来开展深度挖掘。数字人文技术的跨时空效应可以满足南侨机工档案文献遗产集中整理发掘的要求,数字人文技术的跨时空工作也为南侨机工档案文献的高效开发提供了技术支持。

1.3 数字人文增强南侨机工档案文献遗产开发效果

数字人文技术与南侨机工档案文献遗产的结合,除了能丰富档案资源开发形式以及提升档案资源开发效率以外,数字人文技术将文档、图片、视频资源一体化开发体现管理的优势,也在提升南侨机工档案文献遗产的开发效果方面有突出表现。具体来看,南侨机工档案文献遗产与数字人文技术的结合在资源开发效果上有以下表现:一是资源整合与共享,利用一定的技术手段,加强档案馆与博物馆间的机构协同合作,促进馆藏资源的整合与共享,盘活馆藏资源,为目标群体提供便捷、精准服务,提高馆藏资源利用价值。如利用数据库技术构建网络平台,整合云南省档案馆馆藏南侨机工档案与其他地区南侨机工档案文献遗产资源,以“资源赋能”思维,为社会提供便捷服务。二是体验改进与优化,利用虚拟现实技术、增强现实技术等,改变传统陈展、海报等宣传方式,打造沉浸式场景,增强南侨机工档案文献遗产开发效果。

2 南侨机工档案文献遗产开发存在问题

2.1 开发资源分散

目前南侨机工档案文献遗产分散保存在多个机构当中,没有实现集中统一管理。这些档案文献遗产包括如下四大类:其一,纸质类档案文献。主要是南侨机工回国工作后形成的手稿、文告、登记册、证书、文电、奖状、公函、书信等。其二,实物类档案文献。云南畹町南侨机工回国抗日纪念馆保存有南侨机工使用过的马灯、勋章、手表、扳子、头盔、摩托车等4000余件实物;华侨博物院、陈嘉庚纪念馆分别展示了与南侨机工相关的158件和310余件实物;广西壮族自治区博物馆陈列有南侨机工登记证[5]、行李箱、驾驶证、手表、纪念章等40余件实物。其三,口述类档案文献。1987年9月,学者林少川奔赴桂、云、琼、粤、黔、蜀、闽等地展开调查研究,实地采访百余位南侨机工及其子孙后代,采集了大量原始口述资料。之后,南侨机工后代汤璐聪与《海南日报》记者走访滇缅公路,收集了丰富的口述资料。其四,声像类档案文献。华侨博物院、陈嘉庚纪念馆分别陈列290幅、350余幅图片;2015年9月1日,《赤子功勋——华侨抗战纪实》纪录片在深圳卫视首次播出,该纪录片展示了多地保存的南侨机工史料,宣传了南侨机工抗战事迹。由此来看,南侨机工档案文献资源分散保存在多个机构,档案内在联系遭到破坏,不利于资源体系构建和档案资源共享开发。

2.2 传播受到限制

其一,地域限制。2014年9月,我国建立南侨机工博物馆,馆中陈列了2000余份文献材料、4000余件南侨机工遗物及珍贵的历史照片。2015年9月,由厦门市委宣传部和统战部联合举办的“南洋华侨机工回国抗战”纪念展在厦门华侨博物院开展,共展出了15件珍贵文物、290幅历史图片等。但由于地域空间限制,外地民众在观看这些珍贵档案展览会产生不便,从一定程度上降低观看人数,进而限制这段峥嵘事迹的宣传。

其二,时效限制。2009年8月14日到16日,新加坡国家档案馆、国家档案局和云南省档案局等机构联合举办“华之魂侨之光——南侨机工回国抗战档案史料”图片展。该展虽然在昆明、新加坡、北京等多个城市开展,但受场地和展出时间的限制,多数民众无法随时随地浏览南侨机工档案文献遗产。除了在图像档案方面进行挖掘外,部分地方对南侨机工档案文献的影视化发掘也在进行。如2015年7月20日,电视剧《南侨机工英雄传》在上海新闻综合频道首次播出;2017年6月,纪录片《大揭秘之南侨机工之浴血重生》在湖北卫视播出。但受播放时效限制,播放时段有限,民众易错过观看时间,南侨机工抗战事迹宣传成效仍有不足。

2.3 编研方式创新性不足

传统档案编研主要分为两种模式:一是档案文献收藏机构编研工作,编研主要是以本单位档案编研部门为核心力量,以现有馆藏为基础,与图书馆、方志办和档案馆等部门协作为辅展开工作;二是档案文献收藏者完成编研工作,如夏玉清所著《南洋华侨机工:1939—1946》、林少川所著《陈嘉庚与南侨机工》等。传统档案编研方式无论是在网络上还是以出版物的形式传播,过程均繁琐复杂,都需要消耗大量时间与人力。就南侨机工档案文献编研工作来说,不仅需要整合分散的实体档案,或从海量网络数据信息中挖掘、捕捉、筛选出有价值的档案信息,还需要对其进行提炼、总结,不利于提高工作效率。而数字人文中的文本挖掘技术有助于编研人员及时得到所需信息,实现快速编研,提高编研质量和效率,为社会公众提供优质的南侨机工档案文献编研成果。因此,档案编研方式亟待创新。

2.4 开发技术薄弱

目前,南侨机工档案文献遗产资源的数字化开发仍处于纸质档案数字化加工阶段,主要借助现代计算机设备对档案资源数据进行数字化,但是对数字化的原始数据的标引加工没有开展。这虽然从一定程度上减轻了数字人文工作者的负担,但发现并分析问题的过程仍旧是依靠档案编研人员手工进行检索和内容编排,并没有发挥出数字化技术统计分析海量和规范的数字化信息和数据的优势,没有真正走进“数据化”阶段。传统档案资源开发深度不足,不能将档案信息的粒度从文件级转变为数据级,从信息单元变为知识节点[6],机器不能对南侨机工档案资源进行分类、名称识别、跨媒体检索、组织和图像语音识别等。因此,创新档案资源开发技术是必要之举。

3 数字人文视域下南侨机工档案资源保护平台的构建

数字人文视域下,南侨机工档案文献遗产应突破不同保管主体、空间等各方面限制,解决各保管主体资源不足、整合难度大、资源分散的问题,从而实现基于抗战记忆完整性构建南侨机工档案文献遗产资源体系,构建完整性档案资源体系是档案开发工作的前提。目前,南侨机工档案文献遗产主要分散保存在云南省档案馆、广西壮族自治区档案馆和不同博物馆、纪念馆、报社、研究会和南侨机工后人手中,导致南侨机工档案文献所承载的记忆是碎片化的,不利于南侨机工抗战事迹的传播[7]。构建完整的南侨机工档案资源保护平台,可以将不同载体形式的南侨机工档案文献资源进行统一。

3.1 南侨机工档案文献遗产数据库平台框架

在搭建南侨机工档案文献遗产数据库平台之初,需要采用数字化、标准化和规范化的形式对南侨机工档案数据资料进行数据标引,利用数字技术对南侨机工档案文献资源的元数据进行统一编码,在元数据编码的基础上,将数据导入南侨机工档案文献遗产数据开源系统,建立南侨机工档案文献的数字化开发机制,最终形成数字化南侨机工档案文献资源平台。南侨机工档案文献遗产资源保护平台体系框架,由南侨机工档案数据中心和南侨机工档案资源用户服务平台组成。南侨机工档案数据中心包括文本目录、主题索引库、图谱索引库以及影像索引库;南侨机工档案资源用户服务平台由搜索引擎、检索结果关联以及数据可视化三部分组成,其中搜索引擎又分目录导引和主题词检索。

3.2 南侨机工档案文献遗产数据资源体系

南侨机工档案资源内容丰富、载体形式多样。因此,在搭建南侨机工档案文献遗产资源数据库平台模型之后,需要在文献资源梳理的基础上,对不同类型的南侨机工档案文献遗产资源进行分类收集和整理。根据南侨机工档案文献资源类型的不同,可将南侨机工档案文献遗产划分为原始资料和二次加工资料两类。原始资料主要是抗战过程中形成的对南侨机工抗战活动的直接记录、图片、影像、实物等资料;而二次加工资料则是南侨机工档案的编研成果。南侨机工档案文献遗产的原始资料与二次编研成果是构成南侨机工档案文献遗产数据平台的基础,也是进行可视化加工的资源基础,因此需要对南侨机工档案文献资源的资源体系进行建构。

3.3 南侨机工档案文献遗产数据资源采集

在明确南侨机工档案文献资源的资源体系后,需要针对分散各地的南侨机工档案文献遗产开展数据采集活动,为南侨机工档案文献遗产的数字人文开发提供原始数据。为了兼顾数据采集的采全率和采准率,文章将南侨机工档案文献遗产数据资源的采集原则总结归纳为三个方面。一是跨区域采集,即在南侨机工档案文献资源数据的采集过程中要兼顾中外,不仅需要重视本国相关档案文献资源的采集,还需要对新加坡、马来西亚等海外南侨机工活动区域的相关数据资源进行采集;二是跨类型采集,在数据采集中不仅需集中对文献资源进行采集,对于未公开的音频、视频、图像、实物等资源均需要进行采集;三是跨方法采集,在南侨机工档案文献遗产的数据采集过程中不仅要采用传统的文献调研法,还需要结合文献类型采取田野调查法、访谈法等方式,尽可能全面、准确地采集南侨机工档案文献资料数据。

此外,在南侨机工档案文献遗产资源的数据化采集过程中,需要对档案资源的数字化采集标准进行固定,借鉴《录音录像类电子档案元数据方案》,在南侨机工档案资源采集过程中划分基本元数据,包括题名、编号、日期、责任者、载体形式、语种、来源、关键词、载体、内容、来源、技术参数、格式等,每个元数据包括若干子元数据,如题名元数据包括标题、系列等子元数据。

3.4 南侨机工档案文献遗产数据加工

南侨机工档案文献遗产资源的数字人文开发是在数字化档案资源的基础上进行的资源整合。因而,对南侨机工档案文献资源的数字化加工是数字人文技术应用的前提基础,只有对内容丰富、载体各异的南侨机工档案文献遗产加以数字化并进行统一存储,才能为基于数字人文技术的南侨机工档案文献遗产资源平台的搭建提供元数据。对南侨机工档案文献资源的数据化加工主要包括三个方面:(1)南侨机工档案纸质资源的数字化扫描;(2)南侨机工档案资源内容的元数据分类标引;(3)南侨机工档案文献资源的元数据描述与分类存储。通过对南侨机工档案文献遗产的数据加工,将采集来的南侨机工档案数据转换成数字化设备可以读取的数据,并加入不同层次的检索逻辑,为南侨机工档案文献资源的可视化展现奠定数据基础。

3.5 基于数字人文的南侨机工档案文献遗产资源服务

南侨机工档案文献遗产数字化挖掘的主要目的是借助数字人文技术为南侨机工档案文献遗产资源的开发利用服务。主要包含检索服务、关联服务和可视化服务三个层次。当用户处于随意浏览状态,利用聚类算法、推荐算法、分类算法实现关联服务;当用户处于主动检索状态,利用主题词检索、关键词检索、责任者检索、载体检索实现检索服务。最后将关联服务、检索服务形成的结果可视化展现给用户。

4 数字人文视域下南侨机工档案文献遗产资源的开发路径

南侨机工档案文献遗产资源的数字化资源建设并非数字化的主要目的,只有对南侨机工档案文献遗产的开发利用,才是数字人文技术应用于南侨机工档案文献遗产开发工作的根本目的。借助数字人文技术对南侨机工档案文献遗产的开发主要路径有以下三种。

首先,应用文本挖掘技术助力南侨机工档案信息提取。传统档案编研主要以图书、报纸、举办展览为主,这些开发方式耗时耗力、推广难度大,可借用文本挖掘技术从海量信息中发现内在联系,科学分析结果并挖掘内在价值。采用关联规则采掘算法找到访问率高的项目,将访问记录相似的项目进行匹配与个性化推荐,减少传输渠道,提高用户信息获取效率。

其次,应用关联数据技术优化南侨机工档案检索服务。通过关联数据技术梳理南侨机工人物故事、个人情况和其他关系,由面到点、由宏观到微观、由大体到具体,厘清内容单元间的潜在联系,将这关系网络进行整理与重组,把有联系的部分利用起来。比如,可检测出南侨机工出生地、年龄、职业、个人经历等因素是否相同,利用UI可视化界面帮助用户智能筛选,达到信息的互联互通。

最后,应用VR技术创新南侨机工档案开发形式。VR技术是人文数字领域常用的一种技术,具有开放时间久、传播范围广、传播多元化等优点,其主要是通过计算机仿真系统构建一个虚拟环境,使用户享受身临其境的感觉。当用户想体验南侨机工的艰辛时,便可利用VR技术还原当时场景,有助于社会公众走进历史,增强中华民族身份认同。

猜你喜欢
机工编研遗产
遗产怎么分
对传统档案编研与数字档案编研融合的思考
科研档案编研工作的新认识
信息时代档案编研工作开展思考
千万遗产
深化企业档案编研工作,提高档案服务能力
道阻且长:二战后“南侨机工”的复员与南返
遗产之谜
遗产