摘 要:本文围绕国家数字化战略转型背景,对国内外档案信息化相关研究进行梳理和比较分析,在档案数据价值发现与数据管理策略、档案信息安全策略、档案信息服务智能化三个重点方向归纳国内外研究进展,明晰国内外相关研究的侧重点和差异。根据研究比较分析的结论,提出我国数字化战略转型中档案信息化建设的推进路向,重点分析了档案数据治理、多元数据获取存档和档案信息化发展机制创新等方面的问题,为以档案信息化为核心动力的档案事业现代化建设提供参考建议。
关键词:档案信息化;数字化;数字档案;智慧档案;数据价值;信息安全;智能服务
Abstract: With the national digital strategy transformation as the background, this article reviews and compares theresearch on archival informatization at home and abroad. It summarizes the research progress in three key directions:archival data value and data management, archival information security and archival information services, andclarifies the focus and differences of the relevant researches at home and abroad. Based on the conclusions of thiscomparative research and analysis, the direction for promoting the construction of archival informatization in China'sdigital strategic transformation is proposed, with a focus on analyzing issues such as archival data governance, dataacquisition and archiving, and innovation in the development mechanism of archival informatization. This providesreference suggestions for the modernization construction of archival undertakings with the archival informatization asthe core driving force.
Keywords: Archival informatization; Digitization; Digital archives; Smart archives; Data value; Information security;Intelligent Services
以数字化、网络化、智能化、可视化为基础,建立在计算机体系和通信网络基础上的数字化时代已经到来。2021年6月8日,中共中央办公厅和国务院办公厅联合印发《“十四五”全国档案事业发展规划》,提出了“档案管理数字化、智能化”的战略要求。2023年2月16日,中央档案馆馆长、国家档案局局长陆国强在《全面贯彻落实党的二十大精神 奋力书写档案事业现代化和高质量发展新篇章——在全国档案局长馆长会议上的报告》中再次提出了“在加快档案工作数字化转型上下功夫”“推进档案信息化建设和数字化转型”的要求。数字化是一个不断演进的过程,在这个背景下,档案的数据要素活力不断增强,对档案管理模式的影响也愈来愈大,为此受到国内外学者的密切关注并推动了多方面的研究。
1 档案数据价值发现与数据管理策略
围绕移动终端、大数据、云计算、物联网等新一代信息技术对档案数据生成与管理的影响,国内外学者广泛探讨了技术革命和数字化演进中的档案工作问题和应对策略。
1.1 数据交换问题和生命周期管理。国外学者注重档案数据交换问题和生命周期管理问题。如Strohbach等认为从智能手机、智能穿戴上传有关位置数据,到智能电网上传有关能源消耗和分配的数据,物联网设备每时每刻都会产生大量数据,这些数据具备无限潜能[1]和较高的新价值和新作用[2],但因其同时具有异构性、非结构化、价值密度低等特点,也增加了管理的难度。
面向来自异构对象的实时数据流,为实现不同区域、不同系统之间的数据交换,Hefnawy等提出将生命周期管理应用于数据管理的策略。[3]Scholz等考察了从元数据目录到平台和服务的分布式数据处理,首次尝试通過原型设计和组件评估实现开放数据管理平台OSDBMS(The Open SourceDatabase Management System)和分布式文件系统HDFS(Hadoop Distribute File System)之间的协作和交互。[4]Scriney认为每一种基础设施在其提供服务时都会生成档案数据,为解决传统的决策支持系统不能处理连续数据流的问题,设计开发了提取转换加载流程,以快速处理和集成在线数据源,提供近乎实时使用的信息。[5]
对于生命周期管理,我国学者关注的重点是前端控制和电子文件生命周期管理问题,如电子文件前端控制[6,7]、后端反馈调节原理[8]、档案数字化前端控制[9]、电子文件全生命周期管理[10]、项目生命周期管理[11 ]等。同时,提出了档案信息化标准规范建设和档案信息资源共享体系建设[12,13],包括业务标准、技术标准、管理标准、评估标准等,以及管理机制的完善和标准的实施。[14]
1.2 數据采集处理与存档。国外关注的重点在于信息技术对数据的采集、分析集成、归档保存等技术环节。
鉴于档案数据来自多元化的数据源,Patti等指出来自不同数据源的信息必须集成到一个通用的数字档案集合中,将异构数据与用户行为模式及相关反馈关联起来。[15]在数字档案存在云基础设施依赖情形下,Neuhaus等提出了一种为加密档案数据提供关键字搜索的方案。[16]
我国学者对数据采集处理与存档问题也进行了研究,如网络数据收集[17,18]、口述档案采集[19-22]、个人存档和网络存档[23,24]等,但数量相对较少。
2 档案信息安全策略
海量物联网设备造成档案数据异构的同时,也带来了质量问题、安全问题和隐私问题。Tragos等针对普通公民对先进技术设备不熟悉而产生的个人数据安全威胁,提出了用户数据隐私保护方案[25],包括增强档案管理人员的监管责任[26]和技术应用层面的管理框架等[27,28]。
我国学者对档案信息化安全侧重整体解决方案的设计,如综合制度、机制、策略、评估、管理、目标控制和访问与传输控制等方面加强档案信息化过程中的安全管理;[29]安全等级保护策略;[30]从网络安全、数据安全、计算机安全、病毒防护、管理制度等方面建立安全防范体系。[31]研究涉及完善管理法规、建立预警机制、加强信息系统建设、加强对涉密信息介质的管理、应用信息安全技术、尽量使用国产化的装备、加强对档案人员的管理等各个方面。[32]
3 档案信息服务智能化
3.1 数字档案平台服务。面对数字档案管理问题,各类数字档案应用、系统、平台等不断涌现。国内外学者围绕数字档案平台开展了大量研究。
综合知识档案网络(Comprehensive Knowledge ArchiveNetwork,CKAN)是一个具有代表性的开放源码数据管理系统,用于为数据中心和数据门户提供服务,可用于开放政府数据。[33]我国学者在平台建设方面也进行了卓有成效的研究,包括网站平台[34]、共享平台和一体化平台[35-37]、分布式应用平台[38]等。
3.2 数据集成和语义化服务。Lopez等介绍了一个用于访问海量数据的数据加载库(Data Loading Library, DALI),该系统可将数据提升到一个具有明确语义的、有意义的链接结构中,并通过跨模型和数据源识别相关实体,以支持新的检索任务。[39]还有学者提出了“智慧档案”的概念,运用智能技术将档案管理涉及的收集、整理、数字化和利用服务等环节进行全自动化设计,形成智慧档案管理服务体系。[40]
我国学者更注重档案知识服务,如提出门户的概念并给出了档案知识门户体系的架构和各项功能描述。[41,42]同时,强调档案信息服务的对象是用户,要制定面向用户的服务策略,面向用户的信息提供方式应该是主动的、现代化的、大众化与个性化结合的服务方式,同时档案信息服务应该更加开放且更加注重信息安全等。[43]
3.3 数字档案可视化服务。Martini等从移民数字档案的本体论描述入手,探讨了虚拟展厅的创建,提出了基于国际文献编辑中心概念参考模型本体的虚拟展厅语义网络架构。[44]我国学者在档案可视化管理与服务方面研究较为深入,取得了丰硕成果,包括档案馆可视化管理[45]、档案资源的数据可视化系统[46-48]、可视化叙事服务[49]等。
4 数字化转型背景下我国档案信息化推进路向
从国内外档案信息化研究比较分析中可以看出,数字化演进中的档案新价值和新作用得到普遍认同,相继提出了生命周期管理和智能技术应用的相关策略和系统;档案数据安全和档案信息智能服务得到重视并取得有效的研究进展。从国内外研究的差异上看,在现有成果拓展研究基础上,我国还需在数据治理、数据存档、机制创新等方面加强研究。
4.1 推进网络档案数据治理研究。数字化背景下,数字档案具有多源性、海量性和异构性,应加速推进数字化转型,加强档案数据治理研究。其中,运用云基础设施的数据治理是重点,实现云用户共享和保护并举。[50]
4.2 推进多元数据获取存档策略研究。加强网络数据生态体系建设研究力度,弥补档案数据采集获取存档研究方面的短板。目前,各类平台之间的数据壁垒现象还没有消除,网络数据生态体系还不健全,数字档案平台与各类业务平台对接具有很大难度,需要用跨界融合理念,加强生态体系建设。
4.3 数字化环境中的档案信息化发展机制创新研究。引入协同创新理念,推进档案信息化建设。其中,重点是通过协同创新云服务平台和新型智库服务平台建设,充分利用现代信息技术,推进档案管理机制创新、数据治理机制创新、档案服务机制创新,形成良性的档案信息化协同发展机制。
5 结论
面对数字化发展和信息技术革命的巨大影响,国内外学者对档案信息化涉及的价值增强、数据存档、信息安全、技术应用和智慧服务等方面均给予充分重视和开展大量研究。比较而言,国外主要集中于特定对象的档案信息化策略方面,我国则在系统性和宏观性研究方面较多,研究的侧重点也存在一定差异。对此,我国档案信息化研究应以系统范式研究为基础,兼顾特定领域的档案信息化建设,并在数据治理、数据存档和机制创新三方面重点推进。
*本文系国家档案局科技项目“面向治理体系现代化和应急处置决策需求的档案数据能力建设研究”(批准编号:2020-R-5)和2023年度河南省档案科技项目计划“数字化战略转型背景下纪检监察档案信息化提质赋能研究”(项目编号:2023-X-036)阶段性成果。
参考文献:
[1]STROHBACH M, ZIEKOW H, GAZIS V, et al.Towardsa big data analytics framework for IoT and smartcity applications[M]//Modeling and processing fornext-generation big-data technologies.Springer,Cham, 2015: 257-282.
[2]TIURMENKO I, BOZHUK L, STRUK I, SYEROV Y.(2022).Digital Documentary Collections of NationalCultural Heritage on the Ukrainian Regional StateArchives Websites.In: Kryvinska, N., Greguš,M.(eds) Developments in Information & KnowledgeManagement for Business Applications.Studies inSystems, Decision and Control, vol 421.Springer,Cham.https: //doi.org/10.1007/978-3-030-97008-6_20.
[3]HEFNAWY A, ELHARIRI T, BOURAS A, et al.Lifecyclemanagement in the smart city context: Smartparking use-case[C]//IFIP International Conferenceon Product Lifecycle Management.Springer, Cham,2016: 631-641.
[4]SCHOLZ R, TCHOLTCHEV N, LÄMMEL P, et al.FromMetadata Catalogs to Distributed Data Processingfor Smart City Platforms and Services: A Study onthe Interplay of CKAN and Hadoop[C]//InternationalConference on Cloud Computing and Services Science.Springer, Cham, 2017: 11 5-136.
[5]SCRINEY M, O’CONNOR M F, ROANTREE M.IntegratingOnline Data for Smart City Data Marts[C]//BritishInternational Conference on Databases.Springer,Cham, 2017: 23-35.
[6]王昱,胡安娜.电子文件的可信性与前端控制策略研究[J].兰台内外,2023, 390(09): 27-29.
[7]付冉,尹青剑,严开.科研单位电子文件前端控制战略探析[J].科技视界,2020, 308(14): 158-160.
[8]丁海斌.档案工作中的“后端反馈调节原理”:兼谈对“前端控制”理论的修正与完善[J].档案管理, 2022,258(05): 5-13.
[9]李颖.纸质档案数字化中前端控制研究[J].黑龙江档案, 2021(04): 308-309.
[10]李泽锋,于红焱, 顾周东.全生命周期管理中电子文件捕获工作实现研究[J].北京档案, 2017(05): 10-13.
[11 ]石婷婷,周艳, 田艳红.浅析项目生命周期管理在规划信息化中的应用[C]//中国测绘学会科技信息网分会.全国测绘科技信息网中南分网第三十次学术信息交流会论文集.广西人民出版社, 2016: 5.
[12]张正强.论中国电子档案著录标准化的发展方向[J].图书情报知识,2004(05): 35-38.
[13]黄建峰.档案信息化中的标准建设:以福建为例[J].中国档案, 2005(02): 23-24.
[14]杨安莲.关于数字档案馆标准体系的思考[J].档案学通讯, 2006(06):58-62.
[15]PATTI E,RONZINO A,OSELLO A,et al.Districtinformation modeling and energy management[J].ITProfessional,2015,17(6): 28-34.
[16]NEUHAUS C,FEINBUBE F, JANUSZ D, et al.APractical Evaluation of Searchable Encryptionfor Data Archives in the Cloud[C]//InternationalConference on Cloud Computing and Services Science.Springer, Cham, 2015: 171-192.
[17]周慧,刘宁.云计算平台下建设项目档案收集系统的实践路径研究[J].兰台内外,2022,377(32): 16-18.
[18]曾智.信息化环境下企业档案收集归档工作的思考与实践[J].办公室业务, 2022, 396(19): 96-98.
[19]王扬扬.记忆观视阈下口述档案采集建设研究[D].苏州大学, 2022.
[20]韩萌萌.多元互构视角下口述档案采集工作研究[D].安徽大学, 2022.DOI: 10.26917/d.cnki.ganhu.2022.001462.
[21]种金成,张菱菱.数字环境下高校口述档案采集及传播策略[J].兰台世界, 2020, 572(06): 67-69.
[22]张志东.云南少数民族口述档案采集方法研究[D].云南大学, 2020.
[23]程赵天一.大数据背景下个人存档实现研究[D].黑龙江大學, 2021.
[24]李宗富,黄新平.基于5W2H视角的政府网站信息存档研究[J].档案学通讯,2016,228(02): 68-72.
[25]TRAGOS E, FRAGKIADAKIS A, ANGELAKIS V, etal.Designing secure iot architectures for smartcity applications[M]//Designing, Developing, andFacilitating Smart Cities.Springer, Cham, 2017:63-87.
[26]LOSAVIO M, ROGERS C, ELMAGHRABY A.Digitalheritage from the Smart City and the Internetof Things: History or stasis?[C]//2015 DigitalHeritage.IEEE, 2015, 2: 431-434.
[27]LIU X, HELLER A, NIELSEN P S.Cities Data: asmart city data management framework[J].Knowledgeand Information Systems, 2017, 53(3): 699-722.
[28]ABBASI M A, MEMON Z A, MEMON J, etal.Addressing the future data managementchallenges in iot: A proposed framework[J].International Journal of Advanced Computer Scienceand Applications, 2017, 8(5): 197-207.
[29]戴翠萍.应重视档案信息化过程中的网络安全管理[J].档案, 2005(03): 10-11 .
[30]胡明浩.在档案信息化中实施信息安全等级保护[J].湖北档案,2005(07):15-16.
[31]刘建平.档案信息化安全防范体系建设思路[J].兰台世界,2007(06):13-14.
[32]陈茜月.数字时代档案数据安全管理问题分析与对策研究[J].档案天地,2023,351(07):16-20.
[33]CKAN.About CKAN[EB/OL].[2019-08-05].https://ckan.org/about
[34]李晓,蒋冠.国内省级档案网站数字档案资源服务现状分析:基于对6省市档案网站的重点调查[J].档案学通讯,2013(06):70-74.
[35]崔洪利.数字档案信息资源共享平台建设方案[J].兰台世界,2023, 604(02): 73-74+78.
[36]金芝娣,汤鑫钢.数字档案管理服务一体化平台建设的实践与思考[J].浙江档案,2023,502(02):18-20.
[37]范雨欣.Hadoop云平台MapReduce下数字档案信息资源共享平台的优化[J].兰台世界, 2022, 595(05):107-11 0.
[38]云健,王振,王春霞.基于联盟区块链及IPFS技术的数字档案分布式应用平台设计研究[J].网络安全与数据治理, 2022, 41(12): 90-101.
[39]LOPEZ V, STEPHENSON M, KOTOULAS S, et al.Dataaccess linking and integration with DALI: Buildinga safety net for an ocean of city data[C]//International Semantic Web Conference.Springer,Cham, 2015: 186-202.
[40]BARAT, A., ABDULLAYEV, A.(2021).Analysis ofthe Main Trends and Directions of Automation inthe Formation of the“Smart Archives”System.In:Aliev,R.A.,Yusupbekov, N.R., Kacprzyk,J.,Pedrycz,W.,Sadikoglu,F.M.(eds) 11 th World Conference“Intelligent System for Industrial Automation”(WCIS-2020).WCIS 2020.Advances in IntelligentSystems and Computing, vol 1323.Springer, Cham.https: //doi.org/10.1007/978-3-030-68004-6_53.
[41]王萍,趙丹阳.档案知识门户的构建:我国档案信息化服务突破方向[J].图书情报工作,2009,53(24):129-132+147.
[42]胡叶霞.职业学校档案服务现状调研及思考[J].山西档案,2013(02):59-61.
[43]潘稚巧.论档案信息化建设中的档案信息服务[J].档案学通讯,2008(01):41-43.
[44]MARTIAI R G,GUIMARÃS M, LIBRELOTTO G R,et al.Creating virtual exhibition rooms fromemigration digital archives[J].Universal Access inthe Information Society,2017,16(4):823-833.
[45]王启佑.档案馆可视化管理与应用研究[J].机电兵船档案, 2023,226(03): 61-62.
[46]李亚东.基于档案资源的数据可视化系统设计与实现[D].西北民族大学,2022.
[47]尚守攀.基于知识服务下的档案资源聚合与可视化分析[J].城建档案,2021,263(08):11 5-11 6.
[48]陈海玉,向前,何剑锋.面向知识服务的抗战档案资源聚合与可视化展现探究[J].档案学研究,2021,179(02):111 -11 8.
[49]谢玉雪.数字档案资源的可视化叙事服务研究[J].档案学研究,2020,174(03): 122-128.
[50]WANG W Q, ANH D T T,LIM H B,et al.Cloud andthe city: Facilitating flexible access controlover data-streams[C]//Workshop on Secure DataManagement.Springer, Berlin, Heidelberg, 2012:58-74.
(作者单位:孝感市第一人民医院 黄萌,馆员,人力资源科副主任 来稿日期:2023-06-20)