数字人文视域下的特藏档案智慧化开发研究

2024-01-06 08:17周昊王君仪熊燕
兰台内外 2023年36期
关键词:数字人文智慧化

周昊 王君仪 熊燕

摘 要:特藏档案作为珍贵的历史文化档案资源,具有重要的文化、教育与经济价值,随着数字人文领域的研究不断深入和国家文化大数据体系建设工作的开展,特藏档案的开发工作逐渐引起广泛关注。本文梳理分析数字人文的相关理念与技术环境为特藏档案智慧化开发带来的契机以及数字人文视域下特藏档案智慧化开发的可行性,探讨包含数据关联、统一平台与产业驱动的特藏档案智慧化开发机理。

关键词:数字人文;特藏档案;智慧化;档案开发

项目基金:本文系国家档案局档案科技项目“数字化转型背景下产品数据档案化研究”(项目编号:2022-R-026)、中国航空工业集团公司“十四五”档案科技项目“企业档案数据场景化应用研究”的研究成果。

引言

随着知识经济、文化经济时代的到来,档案对社会政治、经济、文化等方面的影响越来越大。人们更重视特藏档案资源的建设、开发和利用。使特藏档案充分体现其历史、文化与教育意义,尽可能地满足公众的现实需求,进一步为其提供丰富、优质的特藏资源,从而形成特藏档案衍生产品,是特藏档案实现档案资源价值保值与增值的重要方式之一,也是档案事业做出转型的充分体现。有必要在特藏档案已有的相关研究基础上融合数字人文的理念与技术,针对特藏档案资源开发工作开展进一步探究。

1 数字人文视域下的特藏档案智慧化开发可行性研究

1.1 政策环境

国家档案局前局长毛福民在全国档案局馆长工作会议上提出,可以尝试建立“档案特藏室”,将特别珍贵、重要档案集中保管,采用先进的设施、设备,对重点档案实施特殊保管和提供利用。加强特藏档案的管理与开发是助力全国重点档案抢救工作,改善重点档案保管条件的必行之路,也是新时期保护我国特藏档案的重要举措。

数字人文领域的研究不断深入对档案学理论与实践、档案学学科发展及档案馆职能定位产生较大的影响,2021年,冯惠玲[1]等权威专家将“档案与数字人文”作为展望“十四五”期间档案学重点研究领域之一。

1.2 自身价值

特藏档案是具有文物性质和特殊价值的档案,属于国家珍贵的历史文化遗产,在史学研究、文物考证、艺术鉴赏等方面都具有不可估量的价值。特藏档案所体现与反映的内容,能够较为真实全面地展现国家的发展历程,反映中国人民思想观念、生活方式的变迁,具有弥足珍贵、难以取代的史料研究价值。

1.3 技术支撑

数字人文作为一个交叉学科,主张资源开发的深度、广度以及各方面之间的关联性,不仅推动着计算机科学的发展与完善,同时也为社会人文学科的研究提供更多的研究方法与技术。数字人文包括文本挖掘、数据分析、可视化、VR/AR等技术,这些技术能够充分发挥数据工具的特长,深入挖掘特藏档案资源的潜在价值,将大量特藏档案资源转化为可量化的具有数据特征的产物,为特藏档案智慧化开发提供技术保障,有利于全面呈现特藏档案所反映的历史事件。利用文本挖掘技术能够深入开发特藏档案资源,对特藏档案内容进行主题分析、时序分析、社会关系分析;利用数据管理技术搭建特藏档案资源数据库,为用户的检索、浏览提供服务;可视化技术能够将数量庞大的特藏档案数据资源直观、形象地呈现,给用户带来视觉冲击;利用可视化分析工具如Citespace能直观地梳理出特藏档案所记载与反映的历史发展脉络、人物关系等内容,并通过可视化图谱展现变化,为问题的解决与研究的开展提供直观的数据;VR/AR技术能够实现场景重现,可再现特藏档案所记载与反映的真实历史原貌,用户借助穿戴设备即可进行“穿越”[2],仿佛身临其境。

2 数字人文技术在特藏档案智慧化开发中的应用

2.1 基于文本挖掘技术的特藏档案深度开发

档案粒度是指在不同角度与层次对档案资源细化后产生的数据元素基本构成单元。文本挖掘技术是近年来新兴的一种数据挖掘技术,可以通过数据挖掘、机器学习、深度学习等方式针对文本进行自动分析,能够迅速洞察文本数据中隐藏的细粒化关系,对文本的数据资源进行预处理,实现档案的知识单元离散化、档案数据的细粒度知识组织与揭示服务的精准化、语义关系的丰富化等。将文本挖掘技术应用于特藏档案资源智慧化开发工作中,可以在细化特藏档案资源数据颗粒度、厘清特藏档案资源关系、深化特藏档案资源开发程度等方面发挥巨大的作用。通过文本挖掘技术及其理念与特藏档案智慧化开发工作的发展与契合,有利于创新更加合适的特藏档案数据分化理念,推进特藏档案資源数据颗粒度的进一步细化,形成结构相对独立的、具有完备知识表达的、最细粒度化的特藏档案资源数据主题模型,提高特藏档案资源数据知识主体构建工作的效率与精确率。另外,利用文本挖掘技术对特藏档案资源进行聚类处理,对用户所使用的检索信息进行实时分析,对分析结果加以分组,并分别进行标注,不仅使提供的检索内容更加精准,也可以有效地改善特藏档案资源的检索效果,从而优化特藏档案用户的使用体验。

2.2 基于VR/AR技术的特藏档案立体编研

VR/AR技术是指以计算机为媒介,对参与者直接施加视觉、听觉和触觉感受,并允许参与者更具交互体验地观察与参与虚拟世界的一种新兴科技手段。特藏档案具有原始记录性,其中蕴含系统性、关联性较弱的知识片段,以传统的档案开发方式针对特藏档案资源进行编研,难以引起用户兴趣。VR/AR技术的应用可改善特藏档案编研成果静态内容多、动态内容少的缺陷,弥补编研成果单向输出多、用户交互少的不足以及转变特藏档案故事讲述形式线性化、平面化的局面,创造更加虚拟化、立体化、叙事化的特藏档案开发与利用场景。

利用VR/AR技术针对特藏档案资源进行画面虚拟复原、色彩真实还原等处理,实现用户与特藏档案之间的零距离、深层次接触,并通过模拟重现特藏档案所记载与反映的历史场景与事件人物,使用户能够以“亲历者”的身份感受曾经特藏档案所反映的各类历史事件[3],通过在虚拟世界中各类人体感官的真实性体验,直观地感受保存至今的各种用途、各种载体和各种文本形式的特藏档案,全面了解特藏档案中蕴含的深层次精神文明价值,优化用户对特藏档案的利用体验,增强用户与特藏档案编研成果的互动性,增强用户对中华传统文化与民族精神的认同感和自豪感。另外,随着档案用户年轻化群体的增加,特藏档案智慧化开发也应做出相应创新,针对爱好游戏的用户,可与相关第三方机构与组织合作设计、推出特藏档案类型的游戏,实现特藏档案的创新性、立体化编研。

2.3 基于GIS技术的特藏档案脉络展示

GIS技术是借助于计算机硬件、软件系统的支持,以目标空间区域内的有关地理分布的各类数据为基础,对其进行采集、储存、管理、运算、分析、显示和描述等一系列操作的技术系统。特藏档案中包含有大量的历史地理信息,真实记录了古代的重要历史方位,在GIS技术的支持下,特藏档案中的大量历史地理数据都将转换为地理图形显示,形成完整且清晰的特藏档案历史方位脉络,给予用户身临真实“历史情境”之感,使用户能在脉络清晰的历史环境下解读特藏档案资料,并对显示结果进行浏览,操作和分析。特藏档案智慧化开发的相关研究在GIS技术的加持下,出现全新的研究逻辑视角,成为相关学者与专家探索空间经济发展、文化变迁规律的重要工具,同时也为研究者提供了创新性的服务形式,使多样化的服务类型成为可能。

可利用GIS技术将特藏档案中所蕴含的空间数据和属性数据结合起来,并从时空、内容与场景三个维度设计特藏档案叙事可视框架。首先,创建时空维度的特藏档案记忆地图,利用GIS技术对具体描述某一空间方位的大量特藏档案资源,通过瀑布流和时间轴两种展示方式呈现[4];其次,主要通过图文结合的方式,设计内容维度的故事图集、记忆专题等展示框架,创新特藏档案展示形式,拓宽特藏档案展示渠道,梳理特藏档案故事脉络;最后设计古今对比、历史变迁等展示形式,在场景维度提升特藏档案叙事表达的能力,将特藏档案所承载的历史信息以形象且直观的方式展示出来,强化特藏档案叙事可视化的效果。

3 数字人文视域下的特藏档案智慧化开发机理剖析

3.1 数据关联

2014年9月18日,郑州市档案局科教处副处长石华在全国档案工作者年会上说,“关联数据是档案行业的新机遇,档案的出路在于关联。”[5]关联和融合是档案数据资源的发展趋势,也是特藏档案资源开发能够从数据中获得巨大洞察力的要求[6]。为实现特藏档案资源深入挖掘、关联互通与重构创新,寻求特藏档案工作的进一步突破,推进特藏档案资源智慧化开发工作进展,针对特藏档案资源数据进行标注,将数据与实物、数据与数据等关联起来,借助人工智能技术、云计算技术、虚拟现实技术等,使得特藏档案数据资源结构化存储于智慧数据底层集成关联系统,构建特藏档案数据资源内关联。

特藏档案智慧数据资源具有自描述机制与可解释性,通过底层关联系统实现关联后,可以查看到每件档案已关联的资源,也可以通过新增关联,解除关联等进行批量的资源信息编辑并导出资源,还可以按照年月日等不同维度查看特藏档案数据资源总数与互联情况。

3.2 统一平台

2021年6月,中共中央办公厅、国务院办公厅印发《“十四五”全国档案事业发展规划》[7]中提到:“加大档案资源开发力度,加强档案文化创意产品开发,探索产业化路径。推进国家重点档案保护与开发工程。”基于此,档案部门有必要构建特藏档案资源数据一体化平台,打通各级各类档案部门特藏档案资源共享渠道,建立统一的特藏档案数据资源聚合机制,实现特藏档案数据间互联互通,推动特藏档案资源数据平台一体化发展,为特藏档案智慧化开发工作奠定资源基础。

国家文化专网作为数据承载网络,承担着为文化大数据产业各环节中相关设备和系统互联互通提供数据传输通道的专用通信网络,在国家文化大数据体系中特指由有线电视网络提供的传输通道组成的网络。特藏档案资源开发与共享平台可基于国家文化专网连接省域级、区域级和全国级三级文化大数据中心,形成特藏档案资源数据关联网络,经由底层关联系统结构化的特藏档案资源数据,其在文化专网里的创作、生产、传播和消费的一系列流程都会被跟踪,从而以ISLI编码为纽带实现特藏档案数据或产品的确权、关联、跟踪、管控、支付和分账。

随着数字人文领域的不断发展与演进,文化产品升级为文化数字内容,产品形态、文化业态都有所变化,理论上,对版权的保护较之以往更加便利有效。尤其在特藏档案资源底层关联系统支撑下,特藏档案资源被赋予唯一的标识符,作为确权、交易、清算、支付等方面的通行证,并凭借有效且严密的版权保护相关制度与手段,确保对特藏档案数据产权(版权)的保护得到技术性实现。一旦接入国家文化专网,进入文化数据服务平台这一“数据超市”,档案部门只需要“开店”即可,不仅节省了投资,降低侵权事件发生的概率,也规避了对平台运营相对陌生的“短板”,将精力于特藏档案的收集与智慧化建设与开发工作[8]。

3.3 产业驱动

特藏档案智慧化开发工作是促进特藏档案利用、推进档案文化产业发展的一项重要举措。较之传统的特藏档案资源开发与利用,数字人文视域下的特藏档案智慧化开发程度更加深入,可以更加高效地打造特藏档案相关文化产品。

档案文化产业的形态与模式众多,但在文化行政分业的情况下,往往处于彼此分割的状态。随着智慧时代的来临,文化应当更加注重其体验性,文化体验的方式与种类也随之更加丰富多彩,跨界与融合必将成为常态,贯通产业形态的基本途径就是数据关联,关联文化数据与特藏档案,关联文字、声音、色彩等文化元素,关联实物、图像、视频等档案形态,以关联为核心要义的特藏档案智慧化开发也驱动特藏档案虚拟文化体验的进一步发展。

同时,特藏档案资源的关联数据被检索、匹配、交易,其被分配的唯一标识符,也是结算支付的凭证,在文化大数据建设工作如火如荼开展的当下,以国家文化专网为媒介,连接各级文化大數据中心,为各级各类文化单位提供数据交易渠道,交易完成后由文化数据服务平台负责清算。不论是公益性文化事业单位,还是经营性文化企业,不管是博物馆、美术馆、图书馆等公共文化机构,还是文化科研机构、院校等,都可以自由进入特藏档案“数据超市”,进行特藏档案资源数据交易,各取所需,特藏档案资源数据实现变现收入,将成为文化产业的新收入增长点。

参考文献

[1]冯惠玲,连志英,曲春梅,周文泓,潘未梅,徐辛酉,李孟秋,王宁.“十四五”档案学重点研究领域展望[J].中国档案,2021(4):74.

[2]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017,43(5):32-41.

[3]张蓓.数字人文视野下徽州文书档案开发利用研究[J].档案管理,2022(2):68-70.DOI:10.15950/j.cnki.1005-9458.2022.02.016.

[4]曾静怡,顾伟,刘力超,张莹.照片档案创新编研思路探析[J].档案学通讯,2021(4):71-76.DOI:10.16113/j.cnki.daxtx.2021.04.010.

[5]石华.关联数据:档案行业的新机遇[A].国家档案局.创新:档案与文化强国建设——2014年全国档案工作者年会优秀论文集[C].国家档案局,2014:8.

[6]李宗俊,范炜.面向智慧数据的语义丰富化方法及应用评述[J].情报科学,2021,39(7):186-192.

[7]“十四五”全国档案事业发展规划[EB/OL][2022-08-25].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml

[8]腾讯网.高书生:文化大数据也有“天猫店”[EB/OL][2022-08-25].https://new.qq.com/rain/a/20210823A09EKH00

作者简介:周昊(1993— ),研究生学历,中国航空工业集团公司雷华电子技术研究所助理馆员,主要研究方向:档案管理理论与应用、档案信息化;王君仪、熊燕,任职于中国航空工业集团公司雷华电子技术研究所。

猜你喜欢
数字人文智慧化
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究
转型发展背景下地方本科高校智慧校园建设研究
数字学术与公众科学:数字图书馆新生态
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
智慧型小学语文课堂分析
大规模古籍文本在中国史定量研究中的应用探索
经济转型升级阶段我国流通企业商业模式探索
智慧学习服务内涵、特征及体系框架研究