习近平总书记高度重视档案工作,多次对档案工作作出重要论述。他强调指出,档案工作存史资政育人,是一项利国利民、惠及千秋万代的崇高事业。经验得以总结,规律得以认识,历史得以延续,各项事业得以发展,都离不开档案。因此,充分运用现代信息技术对档案资源进行管理、整合,是用活用好档案、推动档案工作科学化与实效化的关键所在,也是学深悟透做实习近平总书记对新时代档案工作重要论述的具体实践。当前,信息化浪潮正席卷全球,以物联网、大数据、人工智能等技术为代表的第四次工业革命正如火如荼地开展。毋庸置疑,“科技革命”推动着世界各国的档案工作朝着数字化、网络化、智能化方向纵深发展,档案资源建设的内涵与外延也相应发生深刻变化。诚然,方法的革新、路径的升级并不意味着理念原则、目标导向的根本性变化。虽然数智化方法论的兴起对档案工作理念、方法、模式的数字转型和智能升级提出了迫切要求,但实现档案资源整合、挖掘档案深层信息、提高档案信息服务竞争力的目标导向并未发生根本性偏移。
正是在上述背景下,“档案信息”与“用户需求”二者间发生了前所未有的深度融合。也就是说,档案信息与用户需求之间的“桥梁”发生了新的变化,理解这一变化的意涵便是探讨大数据时代档案资源建设实践与探索的关键所在。大数据时代的信息“扁平化”特征推动着档案的“大众化”变革,而社交媒体正是促成这一转变的重要载体。具体而言,可以把档案资源和社交媒体的融合称为“档案社会化媒体”。这一概念在《档案社会化媒体信息资源整合研究》一书中被定义为:“围绕档案领域的学科建设、人才培养、学术研究和工作实践,学界和业界在互联网上开展内容创作和交流所利用的社会化媒体。”可见,档案社会化媒体作为大数据时代档案的信息交流和知识传播的重要平台,既从学理层面丰富了档案的内涵,又从实践层面拓展了档案资源建设的外延。总之,本书为大数据时代档案资源建设的实践与探索提供了理论上的参考,也对激活数字档案资源的信息价值与社会功能,让更多档案在利用中“活起来”具有现实启发意义。纵览该书九章内容,可将其概括为“一个理论”“一条路径”“一个亮点”。
“一个理论”:档案社会化媒体信息资源的整合机制。档案资源的整合是对各种形态的档案信息进行整理、汇集与重组,以完成档案资源优化配置,最终实现利用和共享的全过程。其作为一项重要的基础性工作,旨在实现知识集成和共享服务,重点是架构统一的信息资源整合平台,以汇聚和存储全部原始数据,实现集成管理;核心是协调多方资源,打破部门和行业壁垒,实现学界与业界、科研与实践、理论与应用的衔接。其整合机制具体表现在三个方面。一是通过顶层模块设计,统筹要素配置,对各类信息资源进行整合。为顺应大数据时代的信息化建设需求和社会经济发展需要,构建起多层次、多样性、动态性需求模块,满足网络用户的分析需求、知识关联需求、检索需求、数据需求和便捷易用需求。二是在控制模块中打破档案之间原有的类别、载体之间的界限,实现多门类档案信息相应知识点之间的链接,再利用元数据仓储、知识挖掘和聚类分析法,提供可视化知识关联图谱,拓展知识型智能型服务。三是构建起便捷高效、交互性强、功能性强的服务模块。其主要包括知识服务、数据建设服务和网络信息归档服务三大模块,将提高档案利用质量、实现档案信息增值服务视为主要目标,并推动信息的有序传递和有效利用。需强调的是,档案信息标准化体系建设是保障有序建设和实现有效整合的前提,必须兼顾国家档案信息资源建设的标准要求和信息产业界通用规范,制定科学、规范、适用、配套的标准体系,确保其通用性与共享性,还要从管理、业务和技术层面对信息收集范围、归档制度、存储格式、技术规范等作出统一规定。
“一条路径”:档案社会化媒体信息资源的整合路径。档案社会化媒体是以用户为中心的网络交互技术、平台工具和应用系统的总称,对其信息资源的开发利用是我国档案资源有效建设与利用的必然趋势。大数据条件下,档案资源结构和档案工作重点发生了较大变化,尤其是新媒体档案资源的记录、存储与表现形式由单一的文字、音频、视频等类型,向多维立体、高度整合、迅速传播的方向转变。因此,对档案大数据资源的开发不能局限于传统模式,而是应该通过顶层设计与整体性架构的模块设计,实现新媒体档案信息的关联与汇集,促进多源异构档案信息资源的整合、挖掘、开发与共享,最终建立起大数据分析背景下,全面参与、互动、协作、共享的档案新媒体数据平台。
其整合路径需从信息组织、信息开发、信息利用三个方面着力。一是统一元数据标准,以保障主要功能模块的运行。通过元数据信息抽取准确描述数字资源,并通过数据映射促进存储与交互功能,最终通过数据信息整合利用系统开发档案新媒体研究平台。二是通过相关技术对社会化媒体数据进行分析、处理与重组,以挖掘其档案价值,实现信息资源的创新与利用。尤其是,应立足数据集成、数据挖掘的基础,构建集档案资源系统、技术应用系统、评价反馈系统与管理保障系统为一体的档案知识服务系统。三是通过网络归档、关联数据和语义网等信息聚合理念与方法,对档案社会化的信息内容进行关联和融合,以突出个性化服务方式、拓展智能化服务手段、延伸公共性服务范围为重点。本书以档案社会化媒体资源为案例,引入社会网络分析方法和可视化技术对档案微博的相关数据进行搜索、关联与图谱分析,以期将档案馆微博、档案信息网、政务网及微信公众号等数据资源纳入整合范畴,拓展新型档案信息整合的辐射面。
“一个亮点”:档案社会化媒体信息资源的技术支撑。进入大数据时代以来,数字形态的档案信息成为档案机构信息资源的重要组成部分。相较于此,传统的档案信息资源系统却面临着数据量增长迅速、信息特征多元、数据关系复杂、传统算法性能较差、语义关联性不强等问题。因而,亟需通过数据集成技术、数据存储技术,使庞杂的档案资源以统一标准的数字形式集成并实现结构化存储。在此基础上,可以应用数据分析技术、语义处理技术等,按照一定的内在逻辑关系,形成各“要素”之间的有机关联,建构不同类型、不同来源的数据集合。同时,采用聚类、关联、序列等方法进行深层次分析与系统整理,通过复合语义处理技术提高知识挖掘的深度与性能。此外,还可以通过可视化技术的综合应用,提炼档案核心价值,增强人机交互功能,构建能够满足不同知识需求的档案大数据信息整合服务平台,实现档案资源由操作型需求向信息型或分析型需求的发展。
随着信息技术的不断发展,各类新兴技术如云计算、人工智能和区块链等应运而生,为档案资源的整合利用提供了坚实的技术支撑。比如,云计算能够增强档案存储、备份、信息共享、服务应用等能力,档案云平台是能够承载档案服务应用的关键基础设施,能够有效解决传统档案数据中心的“数据孤岛”问题,节约和优化管理成本,提高档案信息的利用率。又如,人工智能技术为档案智慧化发展创造了更多可能。通过认知、决策、预测、综合集成四个方面的应用实现知识融合、语义检索、大数据分析与决策等功能,使工作效率得到极大提高,并优化档案工作的全部流程。再如,区块链技术的引入在档案数据保护与共享领域进行了探索与实践,在保障电子档案存储安全性、真实性、数据交互可信度等方面赋能增效,为变革档案业务模式、协作机制、服务方式创造条件。当然,全新的技术方法与平台建设在确保可操作性、集成性、安全性之外还应考虑可持续性,关注技术的升级、软件工具的更新和资源平台的补充完善等。
总之,关于大数据时代档案社会化媒体信息资源的整合,应深入研究新型档案信息资源及其整合的新理论、新方法、新技术和新应用,宜重点探讨以档案社会化媒体信息集成为目标对档案信息组织、信息开发和信息利用。正如作者在第九章中强调的:“大数据时代档案信息的获取、传播和利用方式,以及档案利用者的信息需求倾向、信息利用行为习惯都发生了变化,为了达到为利用者提供更具时效性、准确性和便捷性的档案信息服务目的,更好地在信息环境变化的大潮中发挥档案信息服务的作用,档案信息资源开发需要突出自身的提供利用服务特色,利用新技术来拓展档案利用服务手段,延伸档案信息资源开发利用的服务范围。”也正如《“十四五”全国档案事业发展规划》所指出的:“新一代信息技术广泛应用,档案工作环境、对象、内容发生巨大变化,迫切要求创新档案工作理念、方法、模式,加快全面数字转型和智能升级。”有鉴于此,应加快推进档案信息资源和社会化媒体的深度融合,是大数据时代档案资源建设实践与探索的必由之路;其不仅有助于强化档案工作对党和国家各项事业的基础性、支撑性作用,还有助于抢抓档案事业发展的重要战略机遇期并提高应对严峻挑战的能力,更有助于彰显档案作为重要信息资源和记忆遗产的时代价值。
(作者单位 云南大学历史与档案学院)
【编辑:李栋】