大数据时代档案数据开放共享监管:价值、机制与推进理路

2023-11-12 19:31周林兴黄星
档案与建设 2023年8期
关键词:开放共享监管机制大数据

周林兴 黄星

摘 要:大数据时代,加强档案数据开放共享监管是推动档案数据治理体系和治理能力现代化的必然要求,有利于助推档案事业高质量发展。文章在阐释档案数据开放共享监管价值的基础上,基于前端控制与全程管理理念,围绕档案数据开放共享的准备、进行与维护阶段,构建事前防控、事中监控与事后管控三者协调运行的监管机制,并从监管环境、监管主体、监管技术等层面提出档案数据开放共享监管的实现路径,以期助益档案数据开放共享长期可持续发展。

关键词:大数据;档案数据;开放共享;监管机制;多元协同

分类号:G273.5

Regulation of Open Sharing of Archival Data in the Era of Big Data: Value, Mechanism and Promotion Rationale

Zhou Linxing, Huang Xing

( School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444 )

Abstract: In the era of big data, strengthening the supervision and regulation of open sharing of archival data is an inevitable requirement to promote the modernization of archival data governance system and governance capacity, which is conducive to the highquality development of archival undertakings. Based on the concept of front-end control and full-process management, this article explains the value of regulating the open sharing of archival data, builds a regulatory mechanism based on the preparation, implementation and maintenance stages of open sharing of archival data, and proposes the realization path of regulating the open sharing of archival data from the levels of regulatory environment, regulatory body and regulatory technology, with the hope of benefiting the long-term sustainable development of archival data sharing.

Keywords: Big Data; Archival Data; Open Sharing; Supervision & Regulation Mechanism; Multivariate Collaboration

檔案数据是指“数据化的档案信息及具备档案性质的数据记录”[1],不仅包括档案部门已掌握的各类数字化档案资源、电子档案等,还包括具有长久保存价值但尚未纳入档案部门保管范围的数据,以及档案部门在档案管理业务活动中产生的各类数据。[2]大数据时代,数据技术与档案工作深度融合,档案数据开放共享日益受到重视。然而,反观现实,我国档案数据开放共享整体上仍处于起步阶段,存在档案数据开放共享总量偏低、程度有限、质量不佳、伦理问题凸显、民众参与缺乏等问题,无法满足档案数据开放共享纵深推进的发展要求。[3]究其原因,主要是档案数据开放共享缺乏有效监管,阻碍了其健康发展进程。2021年,中共中央办公厅、国务院办公厅印发《“十四五”全国档案事业发展规划》(以下简称“《规划》”),明确提出要“健全‘互联网+监管’手段……推动档案全面纳入国家大数据战略”[4],并且11次提及要加强对档案和档案工作的监管,这为档案数据开放共享监管提供了政策支持,具有深刻的指引意义。

当前,学界主要围绕政府数据开放共享监管[5]展开探讨,未能关照档案数据开放共享监管这一研究题域。档案数据作为政府数据不可或缺的组成部分,对其开放共享监管展开研究也理应引起学界关注和思考。因此,本文立足大数据时代背景,全面阐释档案数据开放共享监管的价值,系统构建档案数据开放共享监管的机制,并针对性提出档案数据开放共享监管的实践路径,以期优化档案数据开放共享格局,推动其平稳健康发展。

1 大数据时代档案数据开放共享监管的价值阐释

1.1 保障数据安全,规范档案数据开放共享秩序

大数据时代,档案数据虽类型丰富、价值巨大,但由于档案数据治理体系尚未成型,档案数据安全问题日益凸显。在对档案数据开放共享的过程中,必然也会产生数据泄露、数据篡改、数据丢失等安全问题。加强对档案数据开放共享的监管,恰好能够有效应对此类问题。借助传统脱敏、文本分类、内容识别及数据可视化等技术对开放档案数据进行敏感脱密[6],实现对档案数据开放共享的全过程监督,保证核心数据不被泄露、隐私数据不受侵犯、机密数据不被非法获取利用,进而保障档案数据安全可靠,全流程规范档案数据开放共享秩序,确保档案数据开放共享合规安全。

1.2 优化数据质量,提升档案数据开发利用水平

大数据时代,档案数据开放共享逐步迭代升级,正以一种更高级、更新颖的形态呈现,即档案数据开发利用。[7]其中,档案数据质量是贯穿档案数据开放共享及开发利用全过程的生命线。这无疑表明档案数据质量是档案数据开发利用的关键所在。据此,对档案数据开放共享进行管理和监控,可提升开放档案数据的元数据、数据标准、数据格式、数据值域的质量层级,保证档案数据开放共享的完整性、准确性和有效性,为档案数据开放共享保驾护航,实现个性化、知识化、智慧化的档案数据资源开发利用。[8]

1.3 促进公众参与,提高档案数据开放共享效率

公众作为档案数据开放共享的主要用户,其参与的广泛程度是档案数据开放共享能否从“低效”向“高效”转變的重要因素。通过对档案数据开放共享进行监管,一方面,可以引导公众加强对档案数据开放相关政策的认识,保障其合法利用开放档案数据的权利,激发其参与档案数据开放共享的积极性,间接促进档案数据开放共享效果与水平的提升;另一方面,可及时预知、规避或解决档案数据开放共享过程中出现的问题,方便档案部门精准洞察公众对档案数据开放共享的参与度和需求度,倒逼档案部门改进档案数据开放共享方式,提升档案数据开放共享效能。[9]

2 大数据时代档案数据开放共享监管的机制构建

为通过全过程、全环节的监管,促进档案数据有序开放、高效共享,形成档案数据开放共享新格局。文章以档案数据开放共享的现实价值为导向,基于前端控制与全程管理理念,按照“事前—事中—事后”的脉络,构建了事前防控、事中监控与事后管控三者互动运行的监管机制(见图1)。

2.1 事前防控机制

事前防控机制即对档案数据开放共享前的准备阶段进行监管,旨在从源头把控档案数据开放共享,保障档案数据开放共享工作有序规范。

其一,制定标准准入机制。一是确立档案数据分级分类标准。在精准划分档案数据机密级别基础上,按照主题、行业、服务等维度,秉承科学合法、需求导向原则,对开放档案数据进行精细分类,便于对开放档案数据开展针对性监测,保证档案数据开放共享的合理性、科学性。二是建立档案元数据标准。参考《政务信息资源目录体系》和《政务信息资源目录编制指南(试行)》,制定档案元数据标准,规范档案元数据的语义、语法、著录格式以及API描述规范,增强档案元数据的机器可读性,确保其能够在不同系统平台进行交换和转换,实现有序化整合共享。三是明确档案数据开放共享格式标准。对标国家和地方有关数据开放共享格式标准规范,研制档案数据开放共享格式标准规范,着重突出对档案数据开放共享格式通用性、可靠性、兼容性和可机读性等方面的要求,尽可能提供多样化的档案数据格式,以实现档案数据关联融合,助推档案数据开放共享走向标准化、规范化。

其二,搭建整合优化机制。一是实施档案数据清洗制度。在摸清可供开放档案数据总体情况的基础上,综合实际情况制定档案数据清洗规则与流程,借助数据清洗相关技术手段进行全方位清洗修正,使其符合开放共享要求和标准。如冗余重复的档案数据可直接删除,残缺的档案数据可采用剔除样本或截取均值等方式填补,错误或异常(偏离期望值)的档案数据可依靠人机同步或手动辅助等方式修正。二是规范档案数据脱敏处理。在遵循保留数据价值、引用完整性、关联匿名等通用原则的前提下,制定统一的档案数据脱敏处理规范,使用脱敏集算器,利用隐藏、替换、截断、加密、掩码等处理办法[10],强化档案数据安全体态,提升档案数据开放共享的安全等级,有效预防档案数据开放共享中各类风险的发生。如南昌大学档案馆运用数据库管控技术对档案数据中的敏感词进行标记,在共享利用中做到提前预警提示,确保敏感档案数据不泄露。[11]

2.2 事中监控机制

事中监控机制即对档案数据开放共享中的进行阶段进行监管,及时发现其中的异常情况,并实时整治,最大程度改善档案数据开放共享质量。

其一,建树流程规范机制。一是制定档案数据发布计划。根据国家相关规定和本地区经济社会发展情况,编制档案数据发布实施方案和细则,依托档案网站、微信公众号、微博等多样化渠道,重点和优先发布与公共卫生、社会治理、民生保障等领域密切相关的档案数据,促进档案数据开放共享合乎规范。二是规定档案数据开放共享许可协议。立足国家标准、参照国际通用规范,结合档案数据资源自身特点和开放利用权限,从开放许可原则、对象及用户权利和义务等维度出发,扩展制定档案数据开放共享许可协议,并对其中的通用许可、定向许可、署名许可、免费许可等进行详细说明,满足不同档案数据开放共享平台的发布使用需求,进而形成权责明确、边界清晰、有据可循的档案数据开放共享监督体系,保障档案数据合理开放、合规共享。

其二,构筑安全控制机制。一是强化档案数据传输安全保障能力。引入第三方平台对档案数据传输安全状态、性能等要素进行综合测评,运用入侵检测、主动防御、虚拟补丁等技术手段构建档案数据“防火墙”,及时对档案数据传输、运转和共享过程中的违规访问、非法攻击和肆意污染等行为进行排查和监控,以避免档案数据在共享传输过程中被第三方截取、篡改、污染,保障档案数据开放获取的真实性、机密性和完整性。如河南省新密市档案馆运用入侵防御、人工智能、数据可视化等多种技术,打造档案数据共享利用屏障,确保档案数据开放共享整个过程安全可控。二是建立用户隐私风险预警和评估模型。运用机器学习、深度学习等算法,以量化指标的形式建立贯穿档案数据获取全流程的用户隐私风险预警和评估模型,提前分析预测用户隐私泄露概率,精准识别和控制用户隐私泄露的风险,有效规避匿名,以及效果丢失、个人身份标识和电话号码等隐私泄露问题,切实保护用户获取档案数据的隐私安全。

2.3 事后管控机制

事后管控机制是对档案数据开放共享的维护阶段进行监管,实现档案数据开放共享“闭环式”管理,促进档案数据开放共享行稳致远。

其一,构建优化调控机制。一是注重档案用户需求反馈。通过搭建实时互动社区、建设数据反馈专栏、设立档案数据论坛等方式,建立即时有效、安全畅通的用户沟通反馈渠道[13],同时配备专业人员及时回应和解答用户的咨询、求助及反馈意见,并结合意见反馈进一步严控和优化档案数据开放共享。如湖北省荆州市档案馆定期对用户进行电话回访,及时了解用户档案数据利用需求与体验效果,以改进档案数据开放共享形式。[14]二是深化档案数据创新应用。联合政府部门、高等院校、数据管理相关企业等单位,共同举办数创沙龙、数创大赛、数据企业走访等档案数据开放共享创新利用活动,并通过此类创新应用活动为档案数据开放共享监管所存在的疑难问题提供创新型解决方案。如广东省深圳市光明区档案局(馆)与本市相关企事业单位、科研机构等开展科研档案数据知识竞赛,通过以赛促学的形式,鼓励社会为科研档案数据开放管理和共享监督建言献策,优化全区科研档案数据开放共享生态。[15]

其二,建立考核问责机制。一是落实档案数据开放共享责任。基于理论、法理与实践等层面,制定档案数据开放共享责任标准的制度规范,同时通过加大组织、资金、技術及设备等资源支持,辅之以在线学习、专题商讨、集中培训、辅导讲座等多种形式,不断落实和强化档案部门推动档案数据开放共享的主体责任,切实提升相关工作人员在档案数据开放共享中的履职能力。此外,按照“谁主管、谁开放、谁负责”的基本原则,依法依规对档案数据开放共享的尚存问题进行审查和监管,视情况追究相应责任,倒逼档案数据开放共享规范发展。二是建构档案数据开放共享评估体系。邀请专业的督察评估机构对档案数据开放共享整体情况进行全方位、立体化监察和评价,如制度规范、流程设计、内容质量、安全程度等项目,同时兼顾社会公众的满意度评估,确保最终评估结果的科学性、客观性和公平性,根据评估结果、专业意见和公众反馈加以整改,力求维系档案数据开放共享平稳合规。

3 大数据时代档案数据开放共享监管的推进理路

大数据时代,档案数据开放共享监管是一个复杂的生态系统,涉及顶层设计、技术应用、实施主体等诸多要素。文章立足档案数据开放共享监管价值与机制,围绕监管环境、监管主体、监管技术等方面探索档案数据开放共享监管的实现路径。

3.1 加强顶层设计,优化档案数据开放共享监管环境

一是推进档案数据开放共享监管走进法律视野。加紧制定并出台专门关于档案数据开放共享监管的法律法规,明确档案数据开放共享监管的责任和权力,以强约束力使档案数据开放共享监管有法可依、有章可循,保障大数据时代档案数据开放共享合法合规。如俄罗斯联邦档案署颁布的《2018年前俄罗斯联邦档案署贯彻和实施开放机制计划》对档案数据开放共享监管的专职机构、处理办法、激励机制等进行了明确规定,为落实档案数据开放共享监管工作提供了坚实的顶层立法保障。[16]

二是完善档案数据开放共享监管配套战略规划。遵照国家有关法律法规,结合区域实际情况,形成指导本地区档案数据开放共享监管工作的规划办法,并明晰档案数据开放共享监管的责任主体和职责权限,确保将档案数据开放共享监管工作落到实处。同时,基于档案数据开放共享的全流程,充分考虑不同类型档案数据的特点,重点聚焦开放档案数据质量、安全、应用等方面制定监管细则,实现对档案数据开放共享的全链条管控。如福建省发布的《福建省数字档案共享管理办法》,对档案数据资源开放共享监管的法律责任、流程规范及保障措施等作出了明文规定,为档案数据开放共享监管提供了具体行动指南。[17]

3.2 推进多元协同,拓宽档案数据开放共享监管主体

一是档案主管部门主导监管。各级档案主管部门要落实主体监管责任,制定档案数据开放共享监管的工作计划方案,构建全局性监管网络,将档案数据开放共享监管纳入重点工作内容,确保档案数据开放共享有序推进。如江苏省无锡市档案局在《无锡市档案局2021年工作要点》中,将档案数据开放监管列为工作重点。[18]

二是加强内部自我监管。一方面,建立绩效考核制度。将开放档案数据的完整性、准确性、可用性等作为具体指标并赋予权重,以此对相关工作人员进行考评,运用激励惩戒方式加以鼓励和约束。如浙江省嘉兴市档案馆制订绩效考核办法,统筹推进档案数据开放共享监管工作。[19]另一方面,夯实档案数据人才队伍建设,通过聘用或设置档案数据馆员负责协调档案数据开放共享监管工作,助推档案数据开放共享专业化、规范化。[20]

三是社会力量参与监管。通过搭建参与平台、拓宽监督渠道等方式,激发社会公众参与档案数据开放共享监管的动力,形成全社会协同监管档案数据开放共享的繁荣局面。如上海市城建档案馆在微信公众号中开通档案利用咨询服务,实时为公众解决疑难困惑,鼓励公众参与到城建档案数据开放监督和监管环节中来,以促进城建档案数据开放共享的科学化、合法化。[21]

3.3 强化数字赋能,创新档案数据开放共享监管技术

一是融合多元数字技术应用。依托大数据可视化、云计算深度分析等技术,对档案数据开放共享的准备阶段进行预警防控,有效防范各类风险;借助人工智能、物联网等技术,运用智能识别、射频传感、电子监察等设备,对档案数据开放共享全流程进行定位、跟踪和监督,实现全方位动态化监管;利用区块链技术的数据溯源、共识算法、去中心化和非对称加密等特征,实现档案数据开放共享全程可回溯和穿透式监管,持续优化档案数据开放共享工作。

二是加快智能监管系统建设。一方面,融入政府“互联网+监管”系统。档案部门应加强同数据管理、市场监管等部门的沟通协作,推动档案监管融入政府“互联网+监管”系统建设,为档案数据开放共享监管提供有力支撑。[22]另一方面,构建档案数据智慧监管平台。档案部门可适当加大资金投入,组织技术力量开发档案数据智慧监管平台,将其与政府“互联网+监管”平台精准对接,并在运行过程中引入“监管沙盒”模式,精确评估风险、调整技术规则,推动档案数据监管由硬性向柔性蝶变,提升档案数据开放共享监管的智能化、精细化水平。如浙江省档案局贯彻“互联网+监管”要求,依托省行政执法监管平台,率先开通档案监管手机端平台,实现对档案数据流通、开放及共享活动的即时性、系统性监管。[23]

4 结 语

档案数据开放共享监管是推进档案数据治理体系和治理能力现代化的重要内容。大数据时代,对档案数据开放共享进行监管,能够改善档案数据质量、保护档案数据安全、促进社会参与档案数据治理,进而提升档案数据开放共享效能和水平。为有效合规监管档案数据开放共享,需要聚焦档案数据开放共享的全过程,在事前防控机制、事中监控机制与事后管控机制三者互动配合下,通过不断加强顶层设计、推进多元协同、强化数字赋能等举措,推动档案数据持续开放共享,为新时代档案事业高质量发展增添新动能。

*本文系国家社科基金一般项目“国家大数据战略背景下档案数据质量优化控制研究”(项目编号:21BTQ016)阶段性研究成果。

注释与参考文献

[1][2]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.

[3]周林兴,黄星.大数据时代档案数据开放共享机制探析[J].档案与建设,2023(3):8-12.

[4]中办国办印发《“十四五”全国档案事业发展规划》[EB/OL].[2022-11-16].https://www.saac.gov.cn/daj/ toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.

[5]陈朝兵,程申.政府数据开放监管的国际经验与中国路径[J].图书情报工作,2020(12):49-57.

[6]袁绍晚.开放共享环境下城建档案数据脱敏系统研究与设计[J].档案与建设,2021(6):52-54,63.

[7]楊冬权.以十九大精神推进新时代档案开放开发——在“学习贯彻党的十九大精神 推进档案开放利用服务高峰论坛”上的演讲[J].中国档案,2017(12):14-21.

[8]周林兴,崔云萍.大数据视域下档案数据质量控制实现路径探析[J].档案学通讯,2022(3):39-47.

[9]BOrGErud C , BOrGLund E . Correction to:Open research data, an archival challenge [J]. Archival Science,2020(3):279-302.

[10]邢宇恒,张冰,毛一凡.数据脱敏在海量数据系统中的应用[J].电信科学,2017(S1):8-14.

[11]聂云霞,陈烟然.新《档案法》背景下档案开放的优化路径[J].档案与建设,2022(5):16-19.

[12]新密市档案馆.新密市档案馆确保档案数据的完整和安全[EB/OL].[2023-05-27].https://da.zhengzhou.gov.cn/ xqjl/2685909.jhtml.

[13]周林兴,徐承来,宋大成.智慧城市视域下政府数据质量优化反馈机制研究[J].情报杂志,2021(7):146-156.

[14]查档无壁垒,服务不打烊:荆州市档案馆档案利用服务坚持从“心”开始[EB/OL].[2023-05-27].http://daj.jingzhou. gov.cn/z/zhengwuxinxi/zixunkuaidi/2022-08-31/5361.html.

[15]何颖莎.广东深圳举办档案知识和技能比赛[EB/ OL].[2023-05-27].http://www.zgdazxw.com.cn/ news/2022-09/01/content_336400.htm.

[16]肖秋会.俄罗斯联邦档案署的开放机制建设与开放数据方案[J].档案与建设,2017(4):21-23,35.

[17]福建省数字档案共享管理办法[EB/OL].[2022-11-26].http://www.fj.gov.cn/zwgk/zfxxgk/zfxxgkzc/ fjsgzk/202112/t20211216_5794874.htm.

[18]无锡市档案局.无锡市档案局明确2021年全市档案监管工作重点[EB/OL].[2023-05-28].https://mp.weixin. qq.com/s/nuTBPqn7CI1QxLlYrQlfVQ.

[19]金培中.浙江嘉兴市档案馆:构建“智控中枢” 推进共建共享[EB/OL].[2023-05-28].http://www.zgdazxw.com. cn/news/2022-11/17/content_338207.htm.

[20]王蕾,吴加琪.数据治理背景下档案数据馆员能力建设研究[J].浙江档案,2022(5):49-51.

[21]魏楠,张笑涵.治理理论视域下城建档案开放中的公众参与:理论认识与模式特征[J].档案管理,2022(3):53-56.

[22]徐拥军,张臻,牟建闽.治理现代化视域下我国档案行政监管的问题与对策[J].中国档案,2022(8):20-21.

[23]王凌.浙江探索推进档案“掌上执法”监管新模式[EB/OL].[2023-05-27].https://www.zjda.gov.cn/ art/2019/6/10/art_1378485_34553497.html.

猜你喜欢
开放共享监管机制大数据
高校实验教学资源整合与开放共享
大数据时代涪陵政府采购监管机制研究
我国互联网金融发展探讨
基于培养应用型人才的大型仪器开放共享及绩效考核模式研究
基于大数据背景下的智慧城市建设研究