大数据背景下档案工作的思考

2018-07-07 09:22周玉敏
档案管理 2018年3期
关键词:数据挖掘档案馆档案管理

周玉敏

近年来,随着科学技术的迅猛发展,网络和信息技术迅速渗透到各行各业,并成为改变人们工作方式、思维方式的重要手段。在新的工作和生活方式的改变进程中,产生了大量的行为痕迹,这些痕迹以数据的方式存放于服务器中。这就是人们常说的“大数据”。国家档案局局长李明华2017年12月27日在北京召开的全国档案局长馆长会议上表示,我国档案工作要应势而动、乘势而为,加快转型升级,逐步实现以信息化为核心的档案管理现代化。

1 大数据为档案工作带来新的挑战

1.1 档案数量呈爆发式增长。随着无纸化办公的发展,一些地区和部门实行双套制归档,档案不仅以纸质形式存储,更以电子文件的形式运转和留存。各级档案馆接收进馆的档案亦增幅可观。据统计,2008年,全国各级国家综合档案馆馆藏1.93亿卷,较上年增加1769万卷,增幅达10%;2011年,各级国家档案馆馆藏已达3.3亿卷;据预测,到2020年,各级国家档案馆馆藏将达到6亿多卷。而我国档案数据不仅局限于档案馆馆藏,还广泛存在于政府、企业、金融、教育等各行业的档案室中。可以预见,档案数量将呈爆发式增长。

1.2 档案种类纷繁多样。由于档案广泛存在于各行各业中,政府机关、金融、通信、建筑、教育、法院等行业产生的档案种类各不相同,如文档、图纸、照片、音频、视频、GIS信息、水文气象信息等。档案种类从以文书档案为主向表格、网页、音视频、图像等类型的数据倾斜。如何收集、管理、保存这些种类的档案,是我们急需解决的问题。

1.3 档案利用需求多元化。为群众提供利用服务是档案馆的一项日常工作,也是档案为各项事业服务和百姓服务的直接手段。随着档案资源的不断丰富,档案利用的主体已由各级行政机关扩展到全社会,并且社会普通民众的利用比率逐年上升。普通民众利用的档案内容呈现出多元化的特点,涉及房产、婚姻、兵役、招工等各种民生档案和专业档案。如何更好地提供利用服务是我们面对的问题。

2 大数据为档案工作带来新的机遇

2.1 大数据为档案数据挖掘带来新的机遇。数据挖掘又称为资料探勘、数据采矿,它是数据库知识发现中的一个步骤,一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。这些数据可以是结构化的,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。通过数据挖掘,可以做出预测性的、基于知识的决策。档案馆以及各行业的档案室拥有大量的数据资源,在大数据时代,这些数据资源可以从孤立的信息变为具有相关性的网状数据关系,在医疗卫生、社会事件、政府决策等方面做出预测和参考,从而发挥档案服务中心工作的作用。

2.2 大数据为档案利用服务带来新的机遇。传统的利用服务是群众到档案馆或其他档案保存机构现场查阅档案,既费时费力又难以达到满意的效果。而大数据时代的到来,利用互联网和信息技术,群众可以在线查阅电子档案,既省时省力,又减少了对档案的损害。同时,可以对档案查阅信息进行二次数据挖掘,对利用档案的种类、人群分布、查阅时段等进行分析,有针对性地开展档案鉴定、开放和编研工作,以扩大档案在社会上的影响。

3 大数据促进档案行业加快转型升级

3.1 大数据促进档案工作模式改进。传统的档案工作模式由收集、管理、利用三个主要环节构成。其中,收集由各档案产生部門分别收集,整理后移交至档案保管部门;管理以人工手动管理为主,建立纸质的管理流程;利用是以人工手动查询档案实体的被动利用方式为主。而在大数据时代,档案的收集是自动形式的实时收集过程,其目标数据不仅是结果,而是档案产生的整个过程;档案管理是智能化的机器管理过程,管理对象不仅是档案实体或电子文件,也包括对档案进行诸多操作的痕迹管理;档案利用则是依靠数据挖掘、云计算等信息技术对数据的分析和预测。

3.2 大数据促进各类型档案管理标准规范。由于大数据时代的到来,档案产生来源更为广泛,各种类型的档案如何管理迫在眉睫。尤其是利用率较高的民生档案和专门档案,由于划分细致,各具特色,急需更具操作性的档案管理标准来规范管理。

3.3 大数据促进档案法规逐步健全。由于档案具有保密性和安全性的属性,在利用过程中要注重安全性问题。特别是以互联网为运作环境的大数据时代,网络环境的开放性对档案的安全保密会形成一定的冲击。如何在安全的前提下,保存档案资源的真实可靠性是必须解决的问题。因此,要提高安全防范意识,建立健全和不断完善相关档案法规。比如在安全管理制度、配备安全管理设备、系统的安全防护和保密管理条件等方面做出具体规定,查处违法行为。

(作者单位:新密市尖山风景区管理委员会 来稿日期:2018-01-26)

猜你喜欢
数据挖掘档案馆档案管理
探讨人工智能与数据挖掘发展趋势
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
基于并行计算的大数据挖掘在电网中的应用
全省部分档案馆新馆掠影
一种基于Hadoop的大数据挖掘云服务及应用
太仓市数字档案馆成为“全国示范数字档案馆”
健康档案管理的“云”前景
基于GPGPU的离散数据挖掘研究
加强工程项目档案管理的有效途径