大数据时代档案数据开放共享机制探析

2023-07-06 13:07:21周林兴黄星
档案与建设 2023年3期
关键词:开放共享档案服务大数据

周林兴 黄星

摘 要:推动档案数据开放共享是发挥档案数据价值、赋能社会治理的关键。文章梳理相关文献,阐释大数据时代档案数据开放共享的现实价值,探究大数据环境下档案数据开放共享现状,发现存在政策法规缺失、部门联动不足、数据风险加剧等问题。对此,基于大数据视角,应从政策保障、协同共治、技术赋能等层面构建档案数据开放共享机制,以期优化档案数据开放共享,提升档案数据服务效果。

关键词:档案数据;大数据;开放共享;档案服务

分类号:G273.5

Analysis of Archival Data Open Sharing Mechanism in the Era of Big Data

Zhou Linxing, Huang Xing

( School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444 )

Abstract: Promoting the open sharing of archival data is the key of bringing the value of archival data into play and empowering social governance. This paper systematically sorts out relevant literature to explain the realistic value of archival data opening and sharing in the era of big data, and explores the current situation of archival data opening and sharing in the big data environment, finding that there are problems such as a lack of policies and regulations, insufficient departmental linkage, and increased data risks. In this regard, based on the perspective of big data, the open sharing mechanism of archival data should be developed from the levels of policy guarantee, collaborative governance, and technical empowerment, in order to optimize the open sharing of archival data and improve the effect of archival data services.

Keywords: Archival Data; Big Data; Open Sharing; Archival Services

档案数据作为大数据环境中的重要数据资源,是“数据化的档案信息及具备档案性质的数据记录”[1],既包括档案部门已掌握的各类数字化档案资源、电子档案等,也包括档案部门在档案管理业务活动中产生的各类数据。[2]档案数据开放共享,即档案部门根据相关法律法规及标准规范,采用一定的手段和方式将其所收集保存的各类档案数据[3]向公众开放共享,使檔案数据价值全面释放,最终实现档案数据善治的全过程。2015年,“档案数据资源开放共享”被作为档案信息化“十三五”发展方向研讨会的主要论题进行专门研讨。2016年发布的《全国档案事业发展“十三五”规划纲要》(下文简称《“十三五”规划》)提出,要“制定档案数据开放计划,落实数据开放与维护的责任”[4]。2021年出台的《“十四五”全国档案事业发展规划》(下文简称《“十四五”规划》)进一步提出,要“推动档案全面纳入国家大数据战略……稳步推进开放档案全文在线查阅”[5]。档案数据开放共享已日趋成为大数据时代国家政策的重要关切和档案学领域研究的前沿课题。

当前,学界关于档案数据开放共享的研究主要集中于三个方面:一是档案数据开放共享的认知理解。档案数据开放共享是政府数据开放共享的重要组成部分[6],是大数据时代档案治理的关键聚焦[7],能够不断拓展档案数据价值实现的深度与广度[8]。二是档案数据开放共享的政策研究。我国既要构建统筹档案数据开放共享的宏观政策体系[9],也要注重个性化需求的档案数据开放共享标准的研制[10],还要积极借鉴国外先进经验,科学制定并完善我国档案数据开放共享政策法规。[11]三是档案数据开放共享的策略探究。我国可通过设置档案数据开放专责机构和部门[12]、运用数字技术搭建档案数据统一交换平台[13]、制定档案数据开放共享管理规范[14]等举措,优化档案数据开放共享方式[15]。总体来看,现有研究对档案数据开放共享的研究主要从认知、政策、策略等微观层面展开,缺乏系统探讨,对于档案数据开放共享机制的研究还较为鲜见。鉴于此,本文基于大数据时代背景,系统阐述档案数据开放共享的现实价值,深入缕析当前的待解困境,并针对性构建档案数据开放共享机制,以期助力档案数据服务转型升级。

1 大数据时代档案数据开放共享的现实价值

1.1 开放档案数据,深化档案资源开发

进入大数据时代,档案数据迅猛增长,显示出极高的开发利用价值。作为“大数据+档案”新业态的显著标签,推进档案数据开放共享有助于贯彻落实档案大数据战略,倒逼档案数据标准的规范,统一数据口径,推动数据在不同部门、层级之间的整合与共享,从而建立跨地域、跨部门、跨系统的档案数据库(全文数据库、目录数据库等),助力档案数据资源利用体系的建设[16],为推动档案资源语义开发、关联应用提供充足的数据体量,促进档案资源系统开发、精准开发和场景开发,提升档案资源社会共享利用水平。

1.2 释放价值潜能,创新档案公共服务

档案数据是大数据时代档案信息资源的主体,是数字档案馆、智慧档案馆、档案知识库的核心基因。其经由加工组织、挖掘利用能够演示社会、经济、文化等发展过程并预测发展规律,提供知识服务、决策支持[17],具有巨大的价值和潜能。积极推动档案数据开放共享,不仅能激活档案数据价值,释放档案数据内在潜能,发挥实际功效,实现海量数据向智慧化转化、静态数据向动态化转化、隐性数据向显性数据转化,更能够提供高质量档案数据利用服务,促进档案公共服务精准化、知识化和社会化,将“资源库”变成“知识库”“思想库”“智库”,实现档案公共服务效能的全面提升。[18]

1.3 满足多元需求,打造档案共享环境

大数据时代,用户档案利用需求不断增长,日趋多样化、专业化、个性化。推进档案数据开放共享,一方面,可以直接满足智慧社会环境下用户日益增长的多元档案利用需求,形成以公众需求为核心、体验为导向的档案开放共享场域,实现社会档案资源共享利用的数据化转型。另一方面,能够使档案数据利用突破时空局限,保障任何用户在任何时间、任何地点皆能通过泛在网络在档案数据开放平台上共享档案数据知识、利用档案数据资源,进而改变馆藏档案数据“养在深闺人未识”的尴尬局面,推动形成档案数据共享共建的社会环境。

2 大数据时代档案数据开放共享的待解之困

2.1 政策法规制度缺失,缺乏有效指导

一是国家层面专门立法缺位。我国还未出台专门关于档案数据开放共享的法律规范,针对档案数据开放共享的管理制度也尚未成型。现有政策法规制度中虽有《“十三五”规划》《中华人民共和国档案法》《“十四五”规划》《国家档案馆档案开放办法》等涉及档案数据开放共享的内容,也表明了国家对档案数据开放共享的重视,但并未明确提出大数据背景下档案数据开放共享的行动指南。[19]

二是地方层面政策文件缺失。当前,仅有浙江、上海等少数省市在已公布的相关政策文件中涉及“档案数据开放共享”。如2016年颁布的《浙江省促进大数据发展实施计划》提出“完善档案数据共享开放标准,促进档案数据通过浙江政务服务网向社会开放共享。”[20]但此类政策文件较为缺乏对档案数据开放共享的全面整体阐述,微观层面的指导作用有限,且法律效力相对一般。其他省份,既没有将档案数据开放共享融入大数据发展战略谋划和政府数据开放政策规范,也没有提出档案数据开放共享的具体标准规划。[21]

2.2 档案部门联动不足,数据意识淡薄

一是档案部门业务协作不足。2018年机构改革后,档案局馆两大档案机构之间的业务联系逐渐淡化的可能性持续加大,并在某种程度上“加剧档案业务数据共享联通、档案数据应用情况反馈的难度”[22],致使档案数据难以发挥开放和应用价值。如浙江省瑞安市档案馆在实施“最多跑一次”改革中,由于档案部门与业务部门在业务档案管理问题上各自为政,以致出现档案收集不全面、档案归档不规范等问题,导致在实际中难以将档案数据向社会充分开放与共享。[23]

二是档案数据意识有待提升。一方面,档案工作人员数据开放意识不强。截至2021年底,在全国各级档案主管部门和综合档案馆共有专职人员中,具有研究生学历(包括博士、硕士、研究生班)的有3896人(仅占比9.5%),本科学历(含双学士)的有27890人(占比高达67.4%),大专及以下学历的有9607人(占比23.2%),而在各学历层次中,具有档案学专业程度的仅有6684人(仅占比16.15%)。[24]可见,人员文化程度和专业程度总体较为低下,这使得其自身档案数据管理能力和工作积极性难以保障,影响档案数据开放共享的落实效果。另一方面,公众整体档案数据意识尚且不足。虽然档案大数据战略已然在社会层面广泛实施,但公众对档案数据的认知还较为模糊,缺乏基本的数据素养能力,档案数据获取和利用意识仍然不强,[25]這也间接降低了档案部门开放档案数据的意愿和动力,从而制约档案数据开放共享程度。

2.3 档案数据繁多庞杂,数据风险凸显

一是档案数据日益繁杂量多。据统计,截至2021年底,全国全国各级国家综合档案馆馆藏电子档案1629.9 TB,其中数码照片423.9 TB,数字录音、数字录像690.6 TB,馆藏档案数字化成果已达24179.4 TB。[26]如上海市档案馆馆藏档案信息资源库拥有各种门类目录信息近3000万条,各类电子档案数据总量近40 TB。[27]当前档案数据数量激增,而档案数据管理工作主要依靠人工完成,效率相对低下且大大增加了档案数据整合、共享难度,进而影响大数据时代档案数据开放共享的实效性。

二是档案数据风险问题日趋显现。一方面,档案数据质量参差不齐。档案部门提供开放共享的档案数据包含大量的非结构化、半结构化、甚至异构数据,且存在数据标准不一、数据格式单一等数据质量问题,档案数据无法得以有效共享利用。调研发现,在31个省级档案馆中有24个档案馆提供开放共享的档案数据未能实现标准统一,档案数据格式较为单一,仅为文本或图片形式,且更新不及时,不便于利用者对档案数据进行多样化开发利用。另一方面,档案数据安全隐患突出。在开放共享过程中,档案数据极易面临隐私侵犯、黑客病毒侵袭、系统平台泄露、知识产权纠纷等各种安全隐患,造成档案数据“不可控、不可联、不可用”,从而破坏档案数据开放共享格局。[28]

3 大数据时代档案数据开放共享机制构建

档案大数据战略进程中必须保证档案数据高效开放、实时共享,最大程度释放档案数据价值要素,真正实现档案数据价值提升。为此,需从政策保障、协同共治、技术赋能等三方面来构建互相配合运行的档案数据开放共享机制(见图1)。

3.1 政策保障机制:完善政策法规制度,保障档案数据开放共享

一是出台国家层面专门立法。法律法规对档案数据开放共享具有纲领性约束和引导作用。因此,必须立足我国基本国情和环境背景,积极借鉴国外政策法规和经典案例,制定专门规范大数据环境下档案数据开放共享的法律法规,使档案数据开放共享有法可依,从而确保档案数据能够依法开放共享。如,美国关于档案数据开放共享的政策法规《开放数据政策:管理作为一种资产的信息》《开放政府计划4.0 2016—2018》《美国国家档案管理局2014—2018财政年度战略计划》,俄罗斯的《2018年前俄罗斯联邦档案署贯彻和实施开放机制计划》《2017—2022年俄罗斯联邦档案署工作计划》及英国的《2015—2019年度业务发展规划》等都具有一定的参考借鉴价值。

二是完善地方配套政策法规。以国家层面关于档案数据开放共享的法律规范为纲领,积极融入大数据战略和政府数据开放规划,因地制宜制定地方层面配套的战略规划、计划方案与实施办法等微观性政策文件,形成自上而下的档案数据开放共享法制体系,确保将档案数据开放共享落到实处。如,福建省根据国家有关法律法规、结合本省实际,制定并发布了《福建省数字档案共享管理办法》,明确了档案数据开放共享目标、原则、范围及方法等事项,对贯彻档案数据开放共享具有较好的针对性指导作用。

3.2 协同共治机制:倡导多元主体协作,构建档案数据开放生态

首先,推进档案部门联动协作。通过建立战略合作机制、部署项目、布局联合实验室、打造专家人才库等方式,加强档案局馆、馆际和馆室之间的联动、协作及配合,互鉴先进经验,形成相互支持、共同发展的区域联合体,实现档案数据资源的有机整合和共享利用。再如浙江省绍兴市档案局与档案馆紧密合作,合力开展民生档案数据共建共享试点项目,通过选派骨干力量组建工作专班、建立业务交流机制等方式,促进了全市民生档案数据更大规模、更广范围的开放共享。[29]

其次,提升档案工作人员数据素养。一方面,深化人才引进工程。可通过吸纳计算机科学、数据科学、大数据及人工智能等专业人才,优化档案部门专业性人才结构,提高档案工作人员数据开放意识与能力。如,广西壮族自治区来宾市档案馆为落实档案数字化转型,将计算机科學与技术类专业人才纳入招聘范围内。另一方面,强化继续教育培训。可邀请学界专家和业界权威对档案工作人员进行专题培训,并采取“导师制”“项目制”“合作制”等方式,开展档案数据开放管理主题研修,培育档案工作人员数据思维、计算能力及实操技能。如,陕西省宝鸡市档案局(馆)为提高政务档案数据共享利用工作成效,定期邀请信息化工程师开展电子档案数据管理培训。此外,实施人才储备计划。档案部门可与高校档案院系合作办学,通过人员互聘互派、共建大数据和数据科学等课程、建设档案数据应用研究中心等方式联合培养集档案知识和数据技能于一体的档案专业人才,增强后备人才储蓄。如上海市档案局(馆)和上海大学文化遗产与信息管理学院合作办学,共建档案学产学研人才培养基地。

最后,鼓励公众驱动数据开放共享。一方面,拓宽互动交流渠道。可搭建线上互动社区、线下调研团队,通过定期发放问卷、开展访谈的形式,收集公众对档案数据的需求及其对档案数据开放共享的建议,并在该过程中加强档案知识普及宣传,以此提升社会档案数据意识。如,湖北省荆州市档案馆按期对用户开展电话回访和普法教育,以及时了解用户档案数据需求和档案数据开放利用实际效果,帮助用户提高档案数据意识。另一方面,建设参与激励机制。可通过开展档案数据应用创新赛、公益挑战赛等激发公众和社会机构参与大数据环境下档案数据开放共享的热情和积极性。如,广东省深圳市光明区档案局(馆)面向社会开展科研档案数据管理知识竞赛,通过以赛促学、发放奖励的形式,鼓励公众为科研档案数据管理建言献策,进而优化全区科研档案数据开放共享的形式和策略。

3.3 技术赋能机制:强化数据技术应用,维护档案数据开放稳定

首先,打造档案数据服务平台。采用云计算、5G、3D、VR、AR等大数据治理技术,构建档案数据开放共享系统,对多领域离散档案数据进行计算、集成、整合、存储与可视化处理,并借助语义关联、聚类分析等手段进行有序化、可视化处理,最大化释放档案数据资源价值。如浙江省利用各地数字档案馆建设成果,搭建涵盖档案目录、开放档案全文、档案业务工作的全省档案数据总库和应用平台,实现档案数据共享利用智能化、可视化和实时化,促进档案数据互联互通共享,从而提升档案数据对外开放共享能力和便民服务水平。[30]

其次,构筑档案数据质量堡垒。应用人工智能、元数据管理等技术方法,通过对档案数据开放共享全过程进行循环监控和评估,实时清洗和审查档案数据内容,解决重复创建、数据冗余、数据异常等问题,并提供多样化、兼容性强的数据开放格式,维护档案数据开放共享阶段的质量效果。如江苏省昆山市档案馆研发出基于机器学习算法的AI智能校对系统,该系统能够将符合开放共享要求的档案数据与机器学习与人工智能服务平台的文字服务、自然语言分析服务进行对接,通过语义分析预处理、对比分析等模块对档案数据的格式、内容进行质检,实现对开放共享档案数据质量的全流程管控。[31]

最后,筑牢档案数据安全屏障。可利用防入侵检测、防火墙等技术手段,在准确监测开放共享档案数据属性的基础上,精细划分档案数据的操作访问权限,打造“可用不可见”的开放共享档案数据安全交互空间,提升档案数据开放共享的安全防护能力。如温州市龙湾区档案馆借助堡垒机、入侵检测、防火墙、日志审计等技术设备,搭建起一套档案数据安全防护的软硬件体系,实现政务数据公开网与局域网的物理隔离,确保了档案数据开放共享全流程的安全。

4 结 语

大数据时代,推进档案数据开放共享有助于充分释放档案数据价值,满足社会发展需要,从政策保障、协同共治、技术赋能等方面构建大数据时代档案数据开放共享机制,才能推动档案数据开放共享规范发展,不断提升档案公共服务质量和水平,最终实现档案工作走向依法管理、走向开放、走向现代化。

*本文系国家社科基金一般项目“国家大数据战略背景下档案数据质量优化控制研究”(项目编号:21BTQ016)阶段性研究成果。

注释与参考文献

[1][2]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.

[3]本文所讨论的档案数据不涉及国家安全、商业机密及个人隐私等相关档案数据。

[4]国家档案局印发《全国档案事业发展“十三五”规划纲要》[eB/Ol].[2022-09-26].https://www.saac.gov.cn/daj/xx gk/201604/4596bddd364641129d7c878a80d0f800.shtml.

[5]中办国办印发《“十四五”全国档案事业发展规划》[eB/Ol].[2022-09-26].https://www.saac.gov.cn/daj/ toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.

[6]张东华,尹泷杰.数据伦理视域下档案数据开放规范发展探析[J].档案与建设,2022(3):21-24.

[7]高晨翔,牛力.国内“档案数据”研究述评[J].档案学研究,2020(5):11-18.

[8]杨智勇,谢雨欣.面向善治的档案数据治理能力体系构建[J].档案与建设,2022(2):9-13.

[9]马海群.档案数据开放的发展路径及政策框架构建研究[J].档案学通讯,2017(3):50-56.

[10]王协舟,尹鑫.英美法系国家档案数据开放法律与政策调研及经验借鉴——基于文献、文本和案例的省思[J].档案学通讯,2019(4):48-57.

[11]zhu?X.The?failure?of?an?early?episode?in?the?open? government?data?movement:A?historical?case?study[J]. Government?information?Quarterly,2017(2):256-269.

[12][21]唐长乐,王明明.我国档案数据开放研究——基于政府数据开放平台的调查[J].浙江档案,2022(1):44-47.

[13]易涛.“最多跑一次”改革背景下档案数据壁垒的生成与消解[J].浙江档案,2018(12):14-17.

[14]陈展.档案数据开放推进路径探略[J].浙江档案,2019(1):20-22.

[15]宣炳宇.我国科研档案数据开放问题与优化策略研究[D].上海:上海师范大学,2022:47.

[16][17][22]周林兴,崔云萍.大数据视域下档案数据质量控制实现路径探析[J].档案学通讯,2022(3):39-47.

[18][25]金波,杨鹏.大数据时代档案数据治理研究[J].档案学研究,2020(4):29-37.

[19]赵跃.大数据时代档案数据化的前景展望:意义与困境[J].档案学研究,2019(5):52-60.

[20]浙江省人民政府关于印发浙江省促进大数据发展实施计划的通知[eB/Ol].[2022-09-28].https://www.zj.gov. cn/art/2016/3/1/art_1229019364_55102.html.

[23]潘高志.提升档案治理能力?服务县乡权责重构[J].浙江档案,2020(7):41.

[24]国家档案局政策法规司.2021年度全国档案主管部门和档案馆基本情况摘要(一)[eB/Ol].[2022-09-29]. https://www.saac.gov.cn/daj/zhdt/202208/fedf617068af49b7a92b8 0f54723746b.shtml.

[26]国家档案局政策法规司.2021年度全国档案主管部门和档案馆基本情况摘要(二)[eB/Ol].[2023-01-12]. https://www.saac.gov.cn/daj/zhdt/202208/b9e2f459b5b1452d8ae8 3d7f78f51769.shtml.

[27]杨锋,张新.主动融入服务大局?实现更高质量发展——“十三五”上海档案事业发展回望[J].中国档案,2020(8):36-37.

[28]金波,杨鹏.大数据时代档案数据安全治理策略探析[J].情报科学,2020(9):30-35.

[29]浙江绍兴局馆协同推进档案事业高质量发展[eB/ Ol].[2023-01-13].http://www.zgdazxw.com.cn/news/2022-08/26/content_336194.htm.

[30]浙江省档案馆启动省档案數据中心建设[eB/Ol].[2022-10-07].https://www.saac.gov.cn/daj/c100206/202007/7d cd942d610c40a78a2ebe7d2c7e82bc.shtml.

[31]江苏昆山市档案馆数据资源人工智能校对系统上线应用[eB/Ol].[2023-03-07].https://www.saac.gov.cn/daj/ c100202/202203/176b674a17ef48dd869fb6252148d621.shtml.

猜你喜欢
开放共享档案服务大数据
高校实验教学资源整合与开放共享
浅析信息化背景下高校档案服务策略
大数据时代建立高校档案服务新模式探索
基于培养应用型人才的大型仪器开放共享及绩效考核模式研究
档案管理和档案服务
基于大数据背景下的智慧城市建设研究
科技视界(2016年20期)2016-09-29 10:53:22
加强高等职业院校科研公共实验室建设探析
如何做好事业单位的档案管理与服务工作
高校实验室仪器设备管理方案探讨
青春岁月(2015年24期)2016-01-05 12:15:01