论档案数智库的构建机理和实现路径

2024-05-03 09:06王强
档案管理 2024年1期
关键词:智囊信息平台档案

关键词:档案;数智库;纪检监察;档案管理;数字化;智囊;信息平台

2023年2月发布的《数字中国建设整体布局规划》指明了我国中长期数字化建设方向,确立了数字中国“2522”整体建设框架,明确了我国经济活动、社会活动、公共事业的发展方向是数字化、智慧化[1],为档案工作的數智化转型提供了机遇。面对数字化和智慧化的强烈需求,如何在保障档案资源安全的前提下更深入、更全面、更可行、更系统化地做好档案事业数智管理和服务,是当下档案事业发展应该思考的问题之一。

信息时代档案事业发展正处于数字化转型的重要时期,诸多学者针对相关核心问题开展了研究工作,如数智背景下档案工作发展[2-4]、档案数字化转型工作治理服务和创新[5-7]、智慧档案馆建设[8-10]、档案知识库构建[11 ]、档案知识服务[12]等近年有关档案数字化转型和信息化建设的重点方向。但基于安全可信前提开展档案管理全流程的数智化研究较为罕见,更未见到对底层逻辑和构建路径的阐述和案例。本文在数字中国建设大背景下,探索档案事业数字化、智慧化发展的理论基石和实践路径,提出档案数智库概念和构建机理,并以纪检监察档案工作为例探讨如何开展档案数智库建设,做到纪检监察档案信息化建设为纪检监察工作提质赋能。

1 档案数智库的概念提出

1.1 概念辨析。档案数智库研究和上述档案数字化转型和信息化建设的相关研究一样,都是在信息时代背景下开展档案研究工作。故在提出档案数智库概念前,应对相关理论、概念、框架展开辨析,明晰各研究方向的重点。

档案知识库和档案知识服务的概念提出较早,起初孟歆[13]从知识管理角度提出了开发和分类检索的档案知识库的概念,后随着信息技术的发展此概念略有调整,当前认为档案知识库是一个档案资料的知识系统,档案资料按照一定规则排列并以知识单元的形式展现,能够提供查找的功能[14];而档案知识服务认为是基于高新技术手段对多介质档案资源进行深度整合和信息挖掘,从档案服务的角度出发提供档案信息的服务手段。档案数字化转型的概念是随着2015年发布的《国务院关于积极推进“互联网+”行动的指导意见》将数字化转型作为七个重点任务之一后开始提出,现普遍观点认为数字化转型是利用高新数字技术对传统档案管理进行改进升级。同时,作为近年档案数字化转型的重要抓手,智慧档案馆建设研究也备受关注[15]。不同于上述已有研究,档案数智库不仅从实体档案库房的智慧化建设出发,更立足档案管理全流程,重点关注档案信息资源智慧重组下安全可靠智慧化服务的档案管理模式。

1.2 概念界定。档案数智库是基于数字中国建设的时代背景提出的,在安全可信的前提下开展档案数字化和智慧化的体系性建设,目的是从管理、硬件、技术、服务层面做好档案管理的数字化、智慧化转型,在档案管理全流程中体系化地做到数智化服务。本文认为档案数智库是以档案数据安全为基础保障,以全类型档案资源智慧重组为支柱,以档案管理全流程为抓手,贯穿数字化和智慧化的建设理念,以智慧服务为目的,构建可信、可靠、可用的智慧档案综合管理模式。构建档案数智库应首要保障整体数智建设的安全可靠,做好档案信息资源的数字化管理和智慧化服务,同时使用相关硬件设备为智慧服务提供保障,将智慧化理念贯穿整个档案管理流程中。

2 档案数智库的构建机理

实现档案资源的智慧化管理是档案数智库主要作用对象和建设目的之一,因此档案数智库的构建内核是档案管理流程。本节基于传统档案管理流程阐述档案数智库的构建机理。

传统的档案管理工作包含档案收集、档案整理、档案鉴定、档案保管、档案检索、档案利用、档案编研、档案统计等八个环节。在档案数智库构建中,根据文本处理方式的不同将此八个档案管理节点进行二次分类,抽象为四个动作节点:收集—整理—重组—服务,形成档案数智资源链。其中整理节点包含传统档案管理流程中的整理和鉴定两个环节;重组节点是新增节点,在传统档案管理整理环节之后开展,能处理档案文本、提取关联信息为后续智慧服务提供支持;服务节点包含传统档案管理流程中的检索、利用、编研、统计四个环节。因此,档案数智库理论的逻辑理路可以用公式“档案管理八环节+数智赋能理念+突出服务能力=档案数智库构建机理”来表达。

2.1 收集节点。此节点以“广收集、多介质、跨区域、重共享”为原则开展工作。在硬件设备层面,提供高速扫描仪、高拍仪、书刊扫描仪、手持设备、眼动仪、可穿戴设备、实物立体扫描仪等;为远程电子文件归档提供网络支持的设备,包括专用网络线路、支持千兆网卡等。在技术保障层面,重点处理在网络完好支持的前提下全类型电子档案的远程移交问题,由于数字档案馆(室)的资源类型和数量日益丰富,在数据类型方面包括文档数据、图形数据、音频数据、视频数据、结构化数据、半结构化数据、日志数据等在内的数据类型呈多样化态势,应针对每种数据特点对其传输、移交、存储选择不同方案进行优化。

2.2 整理节点。此节点主要任务是将纸质档案、音视频档案、图片档案、实物档案等非电子文本类档案资源进行数字化转换、加工处理后,统一形成电子档案文本,通过自然语言处理技术进行分词、统计、词库对比等操作,完成对无关词汇、无意义噪音数据的剔除,然后形成档案信息资源大池,以供重组阶段开展关键词的学习、关联度计算、图谱构建等工作。此节点是基于文本挖掘技术获取档案卷宗内文本信息,即将扫描、识别等数字化手段处理后的卷宗内自然语言提取出来,并通过归一化、数据清洗等预处理手段得到特征词的过程。在建立基于语义分析和智能决策的档案数智库过程中,档案数据前后需历经文本挖掘、语义分析、智能决策三个阶段,分别是整理、重组、服务节点。

2.3 重组节点。重组是对档案资源在知识和数据层面的再组织,是将电子档案资源转换为带有数智属性的档案资源的关键阶段。根据知识工程的研究体系理论可知[16],该过程至少包含表示和推理两个步骤。从数据处理到关键词抽取,从文本表示到本体构建,从关联识别到逻辑推理,最终得到档案数智粒子,做好数智库资源链末端的服务节点的智囊团。

随着档案服务需求提高,档案利用对档案资源依赖程度也在日益加剧,迫切需要在档案查询、人工编研、档案统计等常规服务之上,提供颗粒度更细、层次更深的档案信息分析服务以及范围更广、智能手段更强的基于档案数智粒子级别的档案智能决策服务。例如蕴含在人物、时间、事件中的由不同部门归档的档案信息间的网络关系的发现以及与人物档案相关的人、事、物关系分析、背景描述和智能决策辅助。这类智能服务能否实现的关键,在于底层档案数据库中有无含义和关系都定义明确的高质量机读数据。语义分析技术是人工智能与计算语言学的融合学科,基于文本挖掘和信息检索之上的消息传输分析问题,同时也是后续服务节点知识推理和智能决策的前期工作。语义分析需将上一阶段得到的特征词库经NLP技术处理后发展到理解文本含义的阶段。

2.4 服务节点。传统意义上的档案服务至少包含检索、利用、编研、统计四个方面。作为档案数智库的主要目的之一,此节点是数智手段的重要体现。本节点向前需获取利用者的档案服务申请并转变为档案数智库可理解的服务需求,向内需从重组节点得到的智囊团中匹配到利用者的服务需求,向后需将匹配的档案资源以合适的档案服务方式呈现给利用者。

2.4.1 服务需求的申请和结果呈现。档案数智库中的服务申请并非全部提供于利用者,更应根据利用者的基本信息、历史需求进行分析和预测,通过信息分析和大数据分析来构建包括检索行为、信息偏好、研究内容等在内的利用者画像。同样地,档案数智服务的呈现也应利用好传感设备,变传统被动式服务为主动推送、个性化推荐等服务方式,为利用者提供精准、高效、主动的数智服务。

在档案数智库中考虑使用扩展现实技术打造服务节点的沉浸式交互体验,结合虚拟现实、增强现实、混合现实等多种手段将实体档案服务进行虚拟化展示,同时增加互动功能,让利用者更有“话语权”。根据扩展现实技术可为利用者提供AR、VR、XR、MR相关四种交互方式:以眼球追踪为主的眼控交互、以自然语言为主的语音交互、以肢体为主的手势交互和以神经元为主的脑机接口交互,以此打造一个人机交互的沉浸式体验。

2.4.2 智囊团匹配。档案数智库中的服务节点需从重组节点的智囊团寻找和利用者需求匹配的档案资源,这个过程称为智囊团匹配。前述重组节点内已完成文本挖掘、语义分析、智能决策三步骤的前两步。智能决策是在理解档案文本信息的基础上进行知识推理,使用AI技术来解决复杂决策问题的方法,集信息聚合、知识管理、态势感知及协同决策功能于一体的决策工具,为高水平智慧服务文本和关联度提供支持。

3 档案数智库建构路径实证分析

在阐述档案数智库构建机理的基础上,本节结合纪检监察档案管理案例进一步给出档案数智库的实现路径。

3.1 纪检监察档案信息化建设背景。作为数字时代科技反腐、科学党风廉政建设重要途径之一,纪检监察工作的数智化建设可为纪检监察开拓工作思路,为纪检监察工作“精准化”提供重要支撑。精准是新时代纪检监察工作高质量发展的鲜明特征。习近平总书记在二十届中央纪委二次全会上指出:要精准运用“四种形态”,让党员、干部切身感受到党的严管和厚爱。纪检监察监督、执纪、问责和监督、调查、处置六项职能,最根本的要求就是精准,精准要求贯穿纪检监察工作的全过程、全周期。其中线索处置是纪检监察工作的基础,档案利用则是线索处置的基础,起到了把脉定调的作用。由于行业特殊性,纪检监察档案在档案信息安全方面具有极高要求,这是纪检监察档案工作行业特殊性的重要体现。因此,如何在保证安全可信的前提下,通过纪检监察档案数字化、数智化建设来解决业务数据“孤岛化”、信息资源“沉默化”、数据链条“碎片化”问题,将信息手段深度融入纪检监察档案管理全流程,利用精准高效的数字手段赋能纪检监察工作,借助档案事业的高质量发展助推纪检监察事业提质增效是本节研究的主要内容。

纪检监察档案数智化赋能研究旨在安全可靠前提下提高纪检监察档案纵深利用水平,优化纪检监察档案管理手段,将高新技术手段全方位、全流程、全覆盖地嵌入纪检监察档案管理流程中,积极探索知识管理、人工智能、数字人文等技术在纪检监察档案利用中的应用,打造信息技术下的纪检监察数智库,为深入推进反腐败斗争,在一体推进不敢腐、不能腐、不想腐上持续发力,在助推纪检监察工作高质量发展上发挥档案作用、贡献档案力量、展示档案智慧。

3.2 紀检监察档案数智建设现状。自《中央纪委国家监委信息化工作规划(2018—2022年)》实施以来,全国各级纪检监察机关在数字化转型战略背景下,主动适应新时代科技反腐、科学党风廉政建设要求,能够充分运用大数据、人工智能等信息科技手段,积极探索“数字化信息化”与纪检监察工作的深度融合。但纵观已有理论研究与工作实践,当前各领域的纪检监察档案工作研究仍存在如下几点问题和亟待弥补的“空白”地带,需要进一步补充和完善。

一是从研究内容分析看。第一,当前各领域的纪检监察档案工作研究点主要在于问题分析及解决措施讨论,基本集中在意识提升、规章制度建设、人员队伍建设、信息化建设等几个方面。第二,已有研究存在研究数量少、研究内容不深入、重理论轻实践、缺乏高新技术助力等诸多问题,尤其缺乏针对纪检监察工作特点研究以及解决纪检监察档案管理难点问题的研究。第三,现阶段档案管理系统安全性防护整体水平参差不齐,且传统网络安全架构默认赋予了内网用户是“可信”的,这就使得内部纪检监察工作人员非法进行档案数据访问或攻击行为从内网链路发起时,无法及时被发现,进而造成数据泄露或系统攻击产生。

二是从数字档案馆(室)实践发展现状来看。第一,从“网络化”向“智能化”跃迁的过程中,档案信息服务实践主要是基于资源、手段和过程等信息技术来实现局域网或互联网的档案信息查询、检索和利用。第二,当前数字中国大背景下,数字档案馆(室)用户需求的特点也从先前做好基础性档案信息服务开始升级和转型,对智慧服务和数据安全的要求愈来愈高,而纪检监察工作更甚。但针对数字档案馆(室)数据安全保障以及智慧服务研究并不多见,更无见到纪检监察数字档案馆(室)数据安全和智慧服务方面的研究工作。因此,有必要立足纪检监察档案流程,使用零信任机制下的档案数据防护策略开展可信环境下的纪检监察档案数字化、智慧化研究工作。

三是从数字化信息化与纪检监察档案契合度研究来看。第一,缺乏数字化转型推动区域纪检监察档案管理的实践性研究。两者融合的内部机理、融合规律等需要在实践中进一步验证和展示。第二,研究缺乏整体性和系统性,研究不够系统宏观,多为零碎化、小型化。

3.3 纪检监察档案数智库的实现路径。纪检监察档案数智库是档案数智库管理模式在纪检监察档案工作中的具体应用。立足于纪检监察档案管理全流程,贯彻数智管理理念,以智慧化纪检监察档案资源为支柱,以精准高效智慧服务为目的,以为纪检监察工作提质赋能为目标,在夯实数智安全的基础上从数智硬件、数智资源、信息平台三个层面开展建设,做到安全、硬件、软件、资源、管理、服务融为一体的可信、可靠、可用的智慧档案综合管理体系。

纪检监察档案数智库在纪检监察处理各种违法违纪案件中担任“数字大脑”的角色,为纪检监察工作提供数据支持和决策提醒,从档案资源出发助推纪检监察工作高质量发展。本节从基础设施、资源建设、信息系统三方面阐述纪检监察档案数智库的实现路径。

3.3.1 数智安全层建设。数据安全防护策略中的“零信任”机制的核心思想是“永不信任,始终验证”,这与纪检监察档案在数据安全性要求上高度契合。纪检监察档案数智库在数据安全防护上力求构建零信任机制的纪检监察档案数据安全防御层级,选择使用零信任架构,从数据访问主体到客体进行全面纵深防御。数智安全层主要包括零信任访问控制模型、安全纵深防御策略执行点及零信任安全管理中心建设三个方面。

(1)纪检监察档案数据零信任访问控制模型建设。零信任解决的主要问题是消释、排斥对数据和服务的非授权访问,本节立足已有纪检监察档案系统管理实践与经验,为消除精准访问中存在的不确定性提供判定法则和依据。由“主体区域”“访问控制区域”“客体区域”三模块组成的纪检监察档案数据零信任访问控制模型,主体区域包括访问用户、系统设备、应用软件及网络环境;访问控制区域包括访问申请、访问评估、访问代理及传输加密等功能;客体区域包括纪检监察档案数据资源、应用资源及服务资源等,有关资源按照资源属性细粒度划分。

(2)纪检监察档案安全纵深防御策略执行点建设。安全防护架构的关键在于保证策略下发和执行的安全,对物理环境、计算环境、区域边界、通信网络等方面有效控制访问,对所有对象进行验证并授予其最小访问权限,同时对所有访问纪检监察档案数据的行为进行持续、动态的评估决策,优化数据安全纵深防御体系“数据分级、数据流转、风险评估、数据库加密”等防御策略执行点布局,做到纪检监察档案数据安全的全方位态势感知与动态防护,极大地保护纪检监察档案数据的真实性、完整性、可用性、安全性,多角度、全流程树立纪检监察档案工作的安全意识,确保纪检监察档案信息数据安全。建立完善的纪检监察档案数据安全防护手段,为纪检监察档案数智库的建设做好底层安全盾牌,助力纪检监察工作有序、安全、智慧化发展。

(3)纪检监察档案数据零信任安全管理中心建设。零信任安全管理的中心是基于纪检监察档案行业特殊性、服务精准化、发展数智化的要求,在网络安全等级保护中需关注两方面:一是对纪检监察档案管理主体、权限管控等加强管理,对纪检监察档案访问主体进行身份识别、身份验证,并对有关“命令”进行审计鉴别,纪检监察档案平台系统管理员做好资源配置管理、审计管理员加强审计记录分析、安全管理员执行安全策略配置;二是对纪检监察档案的审计数据进行汇总和集中分析,并对纪检监察档案管理全流程各类安全风险点进行识别、报警和研判。

3.3.2 数智硬件层建设。纪检监察档案数智库是在纪检监察数字档案室基础上展开建设,主要搭建有高速扫描仪、高拍仪、书刊扫描仪、实物立体扫描仪等数字化转换设备;RFID标签及手持盘点机、感知库房基础设施等物联网设备;基础网络设施(包含无线传感网络、政务网、档案内网、互联网等专用网络线路)、千兆网卡等支持远程电子文件归档和更快速、更高载荷、更包容的需求输入的网络设备;追踪眼球信息的眼动仪、以自然语言为主的语音交互设备、以肢体为主的手势交互和以神经元为主的脑机等可穿戴设备,主要利用全息显示、数据可视化技术3D显示有关档案资源,并且根据脑机接口、可穿戴设备、8K超高清视频等方式利用智能化硬件设备传输给利用者。

3.3.3 数智资源层建设。“数智信息资源”是纪检监察在技术层面实现创新突破的核心支撑,亦是建立纪检监察决策的“档案数智库”的基础。纪检监察档案信息资源的收集和整理是实现档案数字化转型和信息化提质赋能的基础和核心;档案信息的再组织和开发是档案数智化建设取得成功的关键;纪检监察档案信息资源服务是实现纪检监察档案赋能、助力纪检监察工作高质量发展的重要途径。

纪检监察档案数智信息资源的建设是立足于前文提出的四个节点开展建设。在数智信息资源收集节点以“广收集、多介质、跨区域、重共享”为原则,主要对象包括纪检监察纸质档案和实物档案等数字化加工后电子文件(其任务是将纸质档案、音视频档案、图片档案、实物档案等非电子文本类档案资源进行数字化转换)的采集和接收,纪检监察电子档案的采集、鉴定和接收,其中对于电子档案应严格按照四性要求进行鉴定。整理节点是后续开展资源建设的重要基础,首先完成档案信息提取文本,然后剔除無关数据和无意义的噪声数据,形成档案文本大池。重组节点是对档案文本大池中的文本数据构建本体、知识图谱、文本挖掘、语义分析、智能决策,此节点中的档案资源已从文本大池转变为基于档案数智粒子级数据。服务节点是档案文本到智能决策、信息查询、档案编研的最后一道桥梁,先将提交的利用需求转换为机器可识别的数据格式,再从档案数智库智囊团中找到匹配的数据。

3.3.4 信息平台建设。“数据”是实现预警分析的重要根基,而“数智”是实现精准决策的有力手段。在完成纪检监察档案数智库建设的部分工作后,需要完成现有档案业务管理系统的智慧升级,稳扎数智提质赋能纪检监察最后一步。纪检监察机关应履行“监督、执纪、问责”“监督、调查、处置”六种职能,其中监督处于基础性地位,并且监督职能的充分发挥与纪检监察档案卷宗的利用程度具有很强关联性。因此,纪检监察档案数智库管理系统不同于传统的档案管理系统,后者以实现档案资源管理为主要目的,而数智库管理系统是对档案数智库中硬件设备、软件系统、档案资源统一安全可靠开展数字化和智慧化管理的综合平台,兼具硬件管理、资源组织、信息查询、库房管理、信息安全预警等功能。

一是目标层面。通过“大数据+风险监测”实现智能预警,实现风险点的预见性、全面性,充分发挥纪检监察档案的服务功能,通过档案数据的读取、分析和运用,实现廉政风险点动态监督和实时预警,为监督监察工作赋能。为纪检监察档案数据化开发和知识化决策提供支撑,进而建立辅助纪检监察决策的“档案数智库”。二是操作层面。通过高性能分布式数据采集、高可靠式的集群计算、高智能的数据比对,把日常行为、工作动态纳入监督范畴,运用数字化手段分析预警各类风险点,如异常的行为作风、工作动态等信息,最终形成横向分布、纵向统计、深度预警的动态监督预警体系,为纪检监察工作提供精准的廉政风险判断依据。运用人工智能方法实现档案智能利用,做好纪检监察档案的信息提取和数据挖掘工作,利用语义关联、大数据分析技术对纪检监察档案信息进行语义级、细粒度、深层次地组织、关联、分析、反馈。

(作者单位:1.郑州大学档案与校史馆 陈茜月,博士,馆员;2.郑州航空工业管理学院党委学工部 王强,硕士,讲师 来稿日期:2023-08-27)

猜你喜欢
智囊信息平台档案
高校实验室综合管理信息平台的构建分析
MVC框架技术搭建技能培训信息平台实例
浅谈包头市人影指挥综合信息平台的建设
黄守宏:总理的“首席智囊”
档案的开发利用在供电公司全面管理中的作用
浅谈北京卫视《档案》的叙述方式
新常态下高校档案工作发展研究
试论快递行业自律评价信息平台的设计
我们误判了中国——西方政要智囊重构对华认知
近期中