大数据时代档案管理信息化建设路径

2023-07-11 10:00牛丽
兰台内外 2023年18期
关键词:档案信息化大数据

摘 要:档案信息化建设已经进入了数据化时代,大数据背景下档案管理逐步实现模式精细化、服务精准化、档案资源共享化、档案价值数智化。目前,加快档案数据化转型的过程中,还面临着存量档案数字化识别开发水平低、增量档案重复性保存资源浪费大、档案网络综合性利用水平待提高的问题,需要在加强顶层规划,建立数字赋能档案管理体制机制,加强档案资源整合、档案共享平台建设、数字人文赋能,搭建反馈机制等方面加以改进。

关键词:大数据;档案信息化;数字赋能

基于大数据时代带来的深刻变化,传统的档案管理模式已经无法满足实际的工作需要,各种信息、数据的作用越来越大,为信息化建设指引了发展的方向。随着信息化进程的加快,管理的安全性问题、系统体系和制度不够健全的问题等也越来越突出。为了有效处理相关问题,最大限度地降低或者消除这些问题带来的不良影响,要在加强顶层规划等方面下功夫。

1 大数据背景下档案信息化的新特征

1.1 管理模式精细化

随着云计算、区块链等新技术的广泛应用,以纸质档案管理的传统模式已经落后于时代发展,档案管理逐步进入了“单套制”管理阶段。目前,档案信息化的建设仍然处于初级阶段,计算机工具主义的作用凸显,档案信息处于孤立状态,没有形成固定单元,档案信息的挖掘未达到更高层次。档案数据的井喷式增长是档案信息化的必然结果,也是需要提升的关键点。让档案管理工作在大数据技术的帮助下进行,不仅可以让海量的数据信息集成有效,也可以更好地服务于大众。在收集档案时,“大数据”技术也可以按照筛选要求,过滤掉无用的数据信息,不仅可以对大量档案资源进行收纳和聚集,也对其进行分类化、秩序化管理;在存储档案时,“大数据”技术可以存储海量结构化数据、半结构化数据、非结构化数据,形成数据持久层;在使用数据时,“大数据”技术对于档案的信息挖掘可以使档案的储存与查找更有效率。

1.2 服务模式精准化

信息化打破传统档案管理的孤岛模式,实现跨馆查询、远程访问、即时利用,档案服务进入全新模式。大数据技术能够基于用户需要和习惯识别,打造个性化的档案服务。搭建技术赋能管理模式从用户需求出发,改变以往的阅览、展示、咨询等被动工作模式。新型的数字体验服务管理模式,了解用户的习惯和想法,构建档案智慧平台,利用数据挖掘、新媒体服务、精准推送等方式切实高效、有针对性地解决用户问题,提高用户认可度。由此可见,“大数据”优势在于提高对数据的优化和整合能力,通过优化和整合实现数据的增值。“大数据”从可视化分析、数据挖掘、预测性分析、语义分析、数据质量管理等方面,对看似无关联的各门类档案数据进行关联、萃取和分析,实现档案资源与用户需求的双向控制达到最优化,使档案服务模式走向精细化。

1.3 档案资源共享化

大数据时代,云计算为数字档案信息的跨行业、跨地域、跨时间提供了新的选择模式[1]。云计算和大数据是相辅相成的,办公自动化和信息化的迅速发展,使亟待处理的电子档案数据与日俱增[2],云计算为海量数据资源提供了大量的存储空间,而大数据的目的是对海量数据进行较好的分析、计算和处理。云计算技术的广泛应用,也使数字档案资源的储存进入新模式,突破了空间限制。通过搭建档案资源系统“云平台”,可以将搜集的档案数字信息存储在该平台,相关信息数据通过安全保护网络和身份认证实现异地查询使用,使得查询利用不再受存储能力等限制,随时随地都可以查询,极大节约了人力物力,提升了档案利用的满意度。依托云计算构建不同级别的共享空间或平台可以提供在线式服务和交互式信息,从而可使档案知识服务的功能得到加强[3]。

1.4 档案价值数智化

大数据技术对档案资料数据进行识别、规范、整合和再造,构架基于数据库模式的大数据分析模型,以相关查询、趋势分析、可视化图片等形式展现和分析。依托档案管理大数据平台,根据资料类型和用户需求,系统能够自动聚焦于数据挖掘和价值分析,实现分析、描述、指导、预测、开发等功能,为用户提供更有效的参考决策,使档案管理从被动走向了主动,一定程度上实现智能化自动决策。如某个部门可通过数据分析技术进行用户市场预测,同时构建用户画像和用户关系图,实现精准服务。此外,以智慧化的服务增强用户体验,可以提高用户决策的精准度,发挥档案资源辅助能力,提升用户的参与度和幸福感。

2 档案数字化转型的问题及原因分析

“加强数字社会、数字政府建设,提升公共服务、社会治理等数字化智能化水平”是新时代做好档案工作的要求。加快档案数字化转型是信息化技术突飞猛进的必然要求,也是档案工作更好资政育人、展现档案价值的必由之路,将推动档案治理体系和治理能力现代化。近年来,我国在档案数字化转型取得长足进步,但仍存在如下诸多问题。

2.1 档案数字化整体水平不高

国家档案局有关统计数据显示,2021年全国馆藏档案数字化成果1.9万TB。但是由于各馆藏数量体积庞大[4],而且主要以文本、图片的形式存储,占用了较大的信息存储单元,数字化识别开发难度较大。从现状来看,档案内容识别的准确率不高,存储单元不够,影响着档案资源的查询、开发和利用。主要包括:一是数据重复复制率高。个别缺乏责任感的外包服务商或岗位工作人员将数据复制充数,这种追求数量而不顾及质量的做法,在目前普遍采用人工抽检的模式下,给业主方及外包服务商在数据质量方面埋下了诸多隐患。二是影像倾斜合格率和影像裁剪合格率不高。中标服务企业在数字化过程中,作业的设备在所难免发生颠簸,质量检查岗位人员也无法张张页页检查到位,裁剪岗位人员对裁剪值和分辨數值难以统一把握,完全凭个人主观判断,致使后期验收过程中不达标和返工,来回地办理领取搬运原始数据核对、修正等工作,也相应增加了相关方的管理投入和成本支出。

2.2 纸质档案重复数字化浪费严重

目前,“单套制”的管理和推广已经积累了一定的经验,但是电子文件“单套制”模式对信息化软硬件的要求较高,同时也面临着系统安全、身份识别等问题,经验推广需要一定的周期。同时,大部分党政机关单位还依然延续过去的办公习惯,公文流转中使用纸质文件,导致了既有电子文件的存储,后期还会对纸质文件再数字化,造成了资源的浪费。主要原因是管理理念未能向现代管理方式转变,没有根据档案管理实际和技术变革改变管理方式。档案资料形成过程中,也存在收集重复的问题,比如在某些档案的审批过程中,会涉及审批前的论证、审批中的批复、审批后的监管等资料,为了全面准确反映事实,需要对这些资料进行系统的整理,但是资料又是分散不系统的,在形成档案后,既有整理后归档的部分,也有零散部分,存在重复性管理的格局。

2.3 档案资源开发利用水平有待提升

档案数字化转型要着眼于为全社会提供高效的信息服务,虽然目前单就档案工作服务方式而言已经基本实现网络化,但由于对档案资源的开发利用不足、协同性和共享性不够、被动式服务本质并未明显改善等,导致基于网络等信息化共享平台的档案资源综合性利用水平不高,难以满足新时期用户高效化、知识化和个性化需求[5]。有的部门共享推进缓慢,造成了专业档案就无法下沉一线,无法让数据“跑路”代替群众“跑腿”,影响了档案利用的时效。专业档案馆、民生档案跨馆查询程度不够,还未形成高效的服务。对档案开放主体来说,开放鉴定工作滞后,对档案的开放内容未树立严谨的工作理念,无法最大限度满足单位和个人不断扩大的查档需求。

3 大数据时代档案管理信息化的路径选择

在当前5G技术和大数据信息技术的驱动下,档案信息和用户需求总量明显上升,充分利用数字技术,能够减少烦琐流程和工作环节,实现档案管理的转型升级。

3.1 加强顶层规划,建立数字赋能档案管理体制机制

3.1.1积极融入国家数字战略。要因地制宜、实事求是,根据信息化进程,争取上级和主管部门数字战略的政策支持。加强组织领导,出台指导性的文件和政策标准,助推信息化建设数字化转型。比如浙江省档案管理部门就主动融入省战略,档案工作数字转型纳入政府数字型转型的方案。

3.1.2摸清底数,有序推进。评估档案数字化程度,主要看是否达到《“十四五”全国档案事业发展规划》的要求和电子文件归档要求,要评估现有设备的承载程度是否能适应云计算、区块链、人工智能的发展。比如,数字化转型中,高性能服务器、大容量存储和备份设备,以及操作系统、高可靠性的信息安全系统、数据库管理系统等都是不可缺少的必备条件。

3.1.3健全保障体系建设。完善档案信数字化建设体系和规范,对数字化操作流程、技术规范、保密要求等各方面出台指导标准;加强对数据库、数字人文、多媒体技术的综合运用,推广建设集约高效的档案数字化平台,为档案数字化转型提供科技基础条件。

3.2 加强档案资源整合,打通数据孤岛

档案馆馆藏资源数字化是将档案资源原有的文本、影像、图表的固态形式,经过数字技术加工处理转换成电子档案和数据。常用的技术形式是人工智能的通用层技术:机器人、图谱识别、语音识别、自然语言处理、语义关联、专家系统等。通过这些技术手段助力档案资源整合,可以极大提高工作效率,还可以将档案资源融入各类数据库的资源系统。如影视影像数据库、专业档案数据库、自然科学数据库、社会科学数据库等。

开放资源整合是指收集政府机关、社会团体、个人(包括社交媒体、新闻媒介、文化系统)的数据服务平台的档案资源,打造能够满足不同用户兴趣偏好、个性需求的多领域数据资源库,打破“信息孤岛”,形成“数据湖”。这些数据资源的整合极大地增加了档案体量,提升了档案服务质效果,使档案服务更加有精准性,提升档案用户服务体验,但整合数据资源需要面对与多部门合作的困难,因此要同步强化安全技术管控,确保档案信息安全。

3.3 加强档案共享平台建设,推进信息互联互通

档案平台技术化以数字技术为支撑,依赖于信息软件、人工智能、大数据等信息技术。要实现档案科学化管理,搭建技术化平台是档案数据化管理工作的前提,建立档案部门与数据管理部门系统发展机制,依托地域大数据平台,制定统一的数据模式、接口标准、查询规则,打造协同化、区域化、安全化的数据对接和共享模式。技术赋能应用到各项档案工作中,从而提升档案服务的精准性和便利性。打造档案信息区域共享体系,建设数据互联、共享开发、综合利用的公共档案资源数据服务平台,构建全方位、全覆盖的服务体系。比如,通过云计算、大数据技术建立档案精准服务云平台,减少人工成本,实现跨行业、跨地域的查询利用。尤其在智慧检索、模糊查询等方面,能够提供既快速、又准确的档案服务。

3.4 数字人文赋能,提升档案利用实效

虚拟智慧引导,通过人工智能、3D扫描、虚拟/增强现实等优势,深度分析馆内档案资源及用户服务数据,构建虚拟时空的画面,打破空间限制,充分满足用户的需求。可将地理信息科学、历史史料与文献内容相匹配整合,使档案中所载的历史事件生动“再现”和被“体验”。将经度、纬度等地理方位信息嵌入某一档案事件发生地的地名和年代中,并对其进行系统编码和模拟,实现地名与历史事件及背景的关联。交互式推送是坚持遵循用户需求的原则,构建基于用户喜好的对应服务模式,为用户提供后台信息服务,实现多元双向的信息交互。精准把握用户需求是建立在完善可靠的数字化深度算法基础上的,利用数字人工智能技术,提升服务的质量和针对性,满足不同知识水平、偏好、习惯的用户个性化需要,持续性提高档案智慧服务提供了坚实基础。

3.5 搭建反馈机制,优化系统服务

反馈与评价是指数字赋能档案管理模式需要通过服务后评价,实现平台系统自动更新,根据用户反馈内容不断提升各项档案服务水平。服务反馈与评价主要是面向档案服务对象,对档案智慧服务的资源内容、个性化的体验感等方面及时做出反馈,运用数字化算法进行总结。改进与优化是数字化技术在嵌入档案管理工作中发挥系统自动更新优化的过程,自动收集用户的反馈与评价内容,在总结分析后进行智能优化升级,通过实现档案管理服务的良性循环,吸引更多的用户。自动优化过程能够筛选用户感兴趣的资源内容、区分资源类别、过滤吸引力较差的资源,不断提升档案用户服务的精准度和满意度。

结语

数字赋能档案管理模式为档案管理工作带来变革性影响,将数字技术嵌入档案管理工作,构建数字赋能档案管理模式,能够智慧性地满足用户对档案的需求,实现档案工作的升级转型。在保证档案信息安全性的前提下,改变传统档案工作中技术落后、效率低下等问题,在档案管理工作中发挥重要影响力。

参考文献

[1]冯占江,郭妙英.大数据时代的数字档案管理思维[J].办公室业务,2019(02):05.

[2]秦美峰.云计算服务在数字档案馆中应用途径探析[J].網友世界,2013(04):30.

[3]关于进一步推进我国档案数字化转型及综合利用的提案[J].中国档案,2022(03):30.

作者简介:牛丽(1973— ),山东省德州生态环境监测中心综合室主任副研究馆员,研究方向:档案管理。

猜你喜欢
档案信息化大数据
信息时代高校档案信息化建设研究
中职院校档案管理工作存在的问题及措施
医院档案信息化管理存在的问题与对策
档案信息化的思考
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
对档案信息化管理的理性思考