基于数字人文项目的历史档案资源开发理论基础和效能分析

2022-11-22 11:11靳文君中国人民大学信息资源管理学院
浙江档案 2022年3期
关键词:可视化人文数字

靳文君/中国人民大学信息资源管理学院

基于资源开发视角,数字人文项目实质上是利用数字人文方法论进行主题数字资源的开发和展示。数字人文项目在主题聚焦、本体描述、数字仓储构建、跨学科整合、多机构协同、持续性开发等方面特征鲜明[1]。虽然数字人文项目不仅局限于档案资源,还包括图书资源、博物馆资源、社交媒体资源、实地场景信息资源等,但因档案独有的原始记录属性,档案资源在数字人文研究和项目实践中具有不可比拟的优势,逐渐构成数字人文项目的基础资源。从数字人文项目管理和知识开发视角重新审视主题历史档案资源开发,既可以拓展我国档案资源开发利用研究视角,也可以丰富主题档案资源开发利用和服务理论内容。

目前关于数字人文项目的专门研究,国内主要包括数字人文项目概念探讨、实践介绍[2][3]、特征分析[4]、图书馆数字人文项目建设[5][6]、数字人文项目的可持续性[7]等。刘炜提出“数字人文项目是通过搜罗某一主题海量、完整信息,经过结构化之后,从各种角度进行提问、探究和透视,最终形成一定的结论,并进行可视化呈现,兼顾专业性和大众化”[8]。牛力认为“数字记忆的项目机制是当前环境下档案创新开发利用最好的运作方式”[9]。国外主要关注具体的档案数字人文项目应用技术、作用特点及档案工作者在其中的职能角色等。Thomas提出数字人文项目可以提供动态互动体验,通过概念模型利用知识标识和图层绘制知识地图[10]。Mihram和Fletcher认为数字人文项目可以提供数字编辑、进行馆藏数字化,在数字出版迭代和扩展过程中档案管理员至关重要[11]。Clement提出档案数字人文项目实践是档案管理员、图书馆员和人文主义者的合作之所,在这一过程中,档案工作者的角色会不断转变[12]。Ortega提出数字环境将改进档案资源开发机制,数字人文项目具有可扩展性[13]。

国内外关于数字人文项目的研究对笔者具有启发意义。数字人文项目与主题历史档案资源开发有何关系,是否可以基于数字人文项目开发主题历史档案资源?本文旨在探讨这一问题,以期丰富我国历史档案资源开发和利用服务理论。

1 数字人文项目的内涵和特点

数字人文项目是数字人文发展最新阶段的表征。美国学者安妮·伯迪克等在《数字人文:改变知识创新与分享的游戏规则》中认为,源于人文计算的数字人文大致经过了三个阶段[14]。第一阶段是20世纪40年代计算机辅助文学研究阶段,主要利用计算机进行语词检索、作者界定、文本编码标准探索等。第二阶段是20世纪80年代末期的数字人文项目建设阶段,主要进行人文语料库建设、文本分析和编目、结构化数据分析及数字人文项目探索等。第三阶段是21世纪初至今的数字人文项目发展推进阶段,重点关注主题数字资源本体,主要融合计算机网络技术实现资源的可视化、地理空间展示及智慧型服务[15]。由此可见,数字人文逐渐以“项目制”形式落地,数字人文项目注重融合新技术以挖掘主题数字资源的内在肌理,最终实现主题数字资源的创新开发、展示与服务。

1.1 数字人文项目的内涵

关于数字人文项目的概念,笔者认同学者刘炜的界定,因其明确指出了数字人文项目的主体、手段、目的及特点。即数字人文项目团队这一主体,通过搜集某一主题或特定领域信息资源的手段,实现主题资源的数字化保存、知识化开发、可视化呈现,且其可视化呈现兼顾专业性和大众化的特征[16]。由数字人文项目的概念可知,数字人文项目与数字图书馆、档案馆和博物馆为社会公众提供的传统综合性服务不同,其围绕特定领域主题资源的深度挖掘和多维度可视化呈现,在技术应用和方法实现方面有其固有的两个体系,在目标方面也具有专业研究和大众服务两种指向。数字人文项目追求“小而深”,具有明确的资源开发主题、目标、路径,可提高开发主体的积极性及资源开发的效益。

有学者根据档案资源或档案工作者在数字人文中的参与度,将档案数字人文项目分为三大类:档案资源驱动型数字人文项目、档案机构主导型数字人文项目和档案相关型数字人文项目[17]。据笔者调研,从20世纪末开始,我国便有依托高校和专业研究所开展的人文语料库研究项目,这些项目是数字人文项目发展的初始阶段。2011年,武汉大学数字人文研究中心的成立推动了我国数字人文的发展进程,随后涌现出了大批档案资源驱动型的数字人文项目研究和实践。笔者主要关注档案资源驱动型数字人文项目对历史档案资源开发的影响。

1.2 数字人文项目的特点

数字人文项目实践具有主题性与专业性、完整性与全面性、数据化与模型化、探索性与互动性、可视化与展示性的特点[18]。主题性与专业性由数字人文的问题导向性决定,“问题导向”使数字人文从宏观资源整合展示转向精深的领域知识多维度挖掘和呈现,专业性体现在数字人文中心团队人才构成和项目管理方面;完整性体现为数字人文项目从前期规划、中期资源集成分析到后期工具和平台的展示及维护是一个完整的过程,全面性体现为主题领域资源全面完整,整个数字人文项目实践有始有终;数据化体现为数字人文项目关注资源本体,“是在数字化基础上进一步将文本信息转化为机器可理解的形式,以便机器可以进一步进行文本挖掘、语义分析、数据关联及多维可视化展示”[19],模型化指利用主题资源的环境、人物、文化等文本元数据,构建逻辑概念模型和语义关联数据存储库[20];探索性体现为项目推进过程亦是数字人文研究工具和平台的构建过程,该构建过程可以根据项目目标和实际开展情况动态调整,互动性体现为数字人文项目实践鼓励社会公众参与和互动;可视化与展示性体现为主题数字资源场景构建,指对主题资源中人物、地点、时间、事件等数据进行语义关联,实现社会关系维度、地理空间维度、时间序列维度和文本特征维度等多维度视觉表征[21]。

由数字人文项目内涵及特点可知,档案资源驱动型数字人文项目同样具有主题性与专业性、完整性与全面性、数据化与模型化、探索性与互动性、可视化与展示性的特点,这与主题历史档案资源开发诉求关联紧密。

2 基于数字人文项目的主题历史档案资源开发理论基础

档案历史联系与历史的同构性理论最早由刘新安等提出,这一理论对基于历史主义的档案资源概念建模具有支撑作用。档案历史联系是指档案的内在关系,而反映档案内在关系的“来源”“事由”“年代”恰好与历史的“主体”“客体”“时间”一一对应,形成了“来源—主体”“事由—客体”“年代—时间”的对应结构,表明“档案历史联系与历史具有同构性”[22]。档案历史联系与历史的同构性理论为面向本体进行专题历史档案资源开发奠定了理论基础。

历史主义的方法从一开始就是档案管理的基本方法,要求通过维护档案的原始性来守护社会历史的真实面貌。就档案资源整理和开发而言,历史主义要求尊重档案来源及其形成背景,“以来源特征整理和历时性横向整合为主”[23]。档案历史联系与历史的同构性理论为档案资源开发的概念模型构建和场景建设提供了理论基础,“来源”“事由”“年代”为档案资源开发实体化和对象化提供了结构化数据单元,构成了包含人物、地点、时间和事件的多维度、强关联的基础数据单元。对概念模型进行可视化分析和呈现,既可以实现基于档案历史联系的历史场景再现,也能重新组织档案信息,构建新的知识网络,创新档案利用服务的发展。可见,档案历史联系与历史的同构性理论可构成基于数字人文项目的历史档案资源开发理论基础。

3 基于数字人文项目的历史档案资源开发效能分析

影响主题历史档案资源开发效能的因素较多,数字人文项目则从资源开发主体、技术应用、资源开发深度、开发过程及展示服务方式层面助力提升主题历史档案资源开发效能。虽然具体的效能转化暂时难以量化衡量,但过程优化无疑对效能提升大有裨益。

3.1 丰富主题历史档案资源开发主体

基于数字人文项目的历史档案资源开发既从方法论层面倡导多元主体融合,还在数字人文中心建立中产生了一种协同合作模式。在档案数字人文中心建立方面,现有的档案数字人文中心基本是由高校相关学科专家学者、档案工作者、图书馆博物馆相关人员、技术支持人员及社会公众组成的,团队规模主要由开发项目的目标和功能决定,且可以灵活调整人员构成。因此,基于数字人文项目的历史档案资源开发利用在主体方面最大的成效是:其不仅是一种合作模式的倡导和理念,也构建了协同开发实体档案数字人文中心。其中档案工作者是核心主体,负责提出问题及资源开发深度把控;图书馆、博物馆等文化部门人员负责提供同主题领域资源,使主题领域资源更加完整全面;技术人员负责数据存储、挖掘、开发、展示及后期的项目维护;公众负责提出问题、主题资源标引、上传更新、互动评论等。

3.2 优化主题历史档案资源开发利用技术

数字人文项目对主题资源开发过程中的技术应用具有一定的选择和优化作用。特定主题领域档案资源、特定的开发利用目的和方式、基于本体的资源开发本质决定了技术选用的特定性,可以缓解盲目利用技术开发利用档案资源的状况。“获取、编码、处理和表示构成了信息资源开发的工作流程,这种流程明确了资源开发的技术取向”[24],使基于数字人文的档案资源开发利用从资源保存到开发利用形成一套技术体系。换言之,基于数字人文项目开发主题档案资源将促使资源开发的关键技术“从分布离散应用向融合协同创新转型”[25]。

基于数字人文项目的历史档案资源开发大体分三个阶段,即数字化保存—知识化开发—可视化展示,主要采用“数字化技术、数据管理技术、数据分析技术、可视化技术、VR/AR技术”[26]等。数字化保存阶段主要使用数字化技术和数据管理技术,数字化主要是利用扫描技术对同一主题不同载体类型档案资源进行数字化,形成数字档案资源库,数据管理技术是对大量非结构化、半结构化的数字档案资源进行结构化处理,提取计算机可识别的时间、地点、人物、机构、事件等本体要素,在此基础上构建概念模型。知识化开发阶段主要利用数据分析和挖掘技术,数据分析是按照资源开发目的重新组织档案信息资源,用社会网络分析、空间分析、时序分析和文本分析等方法分析挖掘隐性档案知识,为可视化展示做好资源准备。可视化开发主要是利用CAD制图技术、3D展示、GIS历史空间展示技术及VR技术等进行场景构建,其中CAD制图技术可以对场景和物件进行虚拟表征,且可为CAD模型添加照片,形成虚拟仿真;3D展示技术可以使主题场景更逼真;GIS历史地理可视化技术是将细粒度化的档案数据资源嵌入历史地理系统中,以时间、人物、建筑、地点等维度瀑布式展示,形成时光穿梭的感觉。VR是指借助计算机系统、传感器技术、档案资源生成一个三维环境,再现或者创造出一种虚拟的人机交互状态,给用户营造一种“沉浸”和“在场”的体验[27]。

3.3 深化主题历史档案资源开发利用程度

传统的档案资源开发利用多停留在图文介绍和检索层面,忽视了档案资源中隐藏的知识。数字人文项目深化历史档案资源开发利用程度体现在:第一,主题领域档案资源库全面完整。其可以在主题资源开发过程中随时调整资源,构建和持续更新主题领域档案资源库,为全面开发和可视化展示奠定资源基础。第二,注重历史档案数据资源开发。将分散异构的主题档案资源数据化,形成计算机可识别和操作的结构化数据,挖掘资源要素,实现资源开发“从表征向深度复杂计算转型”。第三,根据历史档案资源内在联系建立模型。利用信息技术合理挖掘历史档案资源中蕴含的事、时、地、人等要素,构建符合多维展示利用需求的概念模型。第四,在可视化展示过程中还原历史档案情境。将文本、音频、视频、实物等历史档案信息进行挖掘影射,重组档案知识单元,复原及活化档案情境。

3.4 规范主题历史档案资源开发利用过程

传统的档案资源开发利用过程往往比较分散,主要是对档案资源进行标引著录、形成目录或全文检索、档案汇编或专题展览,未形成从主题资源搜集到资源挖掘可视化以及持续维护这一闭环开发流程。数字人文项目实践从项目设计到成果展现都体现了极强的管理性,可以规范历史档案资源开发利用过程。基于数字人文项目的历史档案资源开发利用,按照资源搜集控制—主题资源数据整合—结构化处理和语义标引—概念模型构建—数据的分析整合—可视化视觉表征开展,形成了一套资源开发方法体系[28-30]。首先收集主题领域历史档案资源,形成联合目录;接着对主题领域历史档案资源进行整合,形成主题领域历史档案资源仓储、档案本体资源库或档案关联数据资源库;然后将非结构化、半结构化历史档案资源结构化,提取知识单元并对其进行标引,实现主题资源的统一语义检索;之后根据本体知识库和档案与历史的同构性,基于人、地、时、事构建概念或场景模型;接着利用时序分析、空间分析、文本分析、社会关系分析等方法形成档案资源知识网络地图,其中时序分析反映资源时间线,空间分析揭示档案资源地理分布的绝对位置和相对位置,文本分析主要挖掘馆藏资源的文本特征,社会关系分析揭示馆藏资源中的多维社会关系;最后根据开发目的进行多维可视化展示。

3.5 拓展主题历史档案资源开发成果的展示方式

系统的、有深度的、精准的、可互动的历史档案资源开发展示方式更能引起社会公众的关注。传统的历史档案资源开发主要以文献汇编、网站图文检索、实地主题档案展览等方式呈现,具有一定的局限性。就文献汇编等档案编研资料而言,其专业性比较强,适合史学研究者等科研人员利用,社会受众面比较狭小,而且档案汇编资料的文本形式比较单一,难以激发社会公众的利用兴趣;网站图文检索一方面只是数字化档案资料的题录展示,另一方面更新时间缓慢,且同一主题档案资源聚合程度不高,资源展示比较分散,影响用户利用体验;实地主题档案展览虽然感官效果比较好,也具有极强的档案文化渲染力,但往往受场地和展览时间限制,不能满足多人随时随地共享利用同一主题档案资源的需求。此外,文献汇编、网站图文目录及实地主题档案展览等资源展示方式也比较分散,难以实现多种资源展示方式的互相关联。

“数字人文使特定主题领域档案资源管理突破了物理空间、存在形式等多方面的限制,从而使得主题领域数字档案资源整合与服务的方式可以是多种多样的,允许多种叙事方式在同一空间存在”[31]。基于数字人文项目的历史档案资源开发主要采用数据资源库、人文研究平台和工具、专题网站、移动App等方式进行成果展示,是一种将主题历史档案资源横向开发和纵向挖掘结合的资源展示方式。这种资源展示方式是“基于语义的跨媒体多维呈现服务、基于用户需求的个性化服务、基于主题馆藏内容的知识服务、基于移动互联的泛在服务模式的结合”[32],是一种集可视化、专业化、知识化、互动化于一体的资源展示方式。此外,这种资源展示方式往往受时间、地点等因素的影响较小,允许用户在资源展示过程中与开发者和资源同时、多向互动,并且可以在多种数字媒体中兼容存在,拓展了历史档案资源开发成果的展示方式。

“十四五”全国档案事业发展规划要求,统筹组织地方各级综合档案馆开展国家重点档案文件级目录向全国革命历史、民国、明清档案资料目录中心整合汇集,逐步实现目录分类集中保管,为档案资源整合共享和开发利用提供必要基础条件。基于上述分析,笔者认为数字人文项目可以成为整合共享之后主题历史档案资源开发的突破口,在遵循档案历史联系与历史的同构性理论基础上为主题历史档案资源的精细化、多维度、可视化开发提供有效方式。

猜你喜欢
可视化人文数字
自然资源可视化决策系统
美在山水,魂在人文
最朴素的人文
思维可视化
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
答数字
数字看G20