试论大数据时代背景下的档案管理工作

2015-07-03 09:15张译之中国石油安全环保技术研究院北京102200
中国科技纵横 2015年12期
关键词:海量挑战档案管理

张译之(中国石油安全环保技术研究院,北京 102200)

试论大数据时代背景下的档案管理工作

张译之
(中国石油安全环保技术研究院,北京 102200)

本文主要结合笔者多年的工作经验,首先分析对比了大数据时代与档案大数据特征,接着阐述了大数据技术在档案工作中应用的必要性,从档案管理理论、档案信息资源管理、数据安全问题这三个方面阐述了新时代档案管理工作面临的挑战,并且从档案数据挖掘和档案管理系统的可扩展性这两个方面提出了新时代档案管理工作的机遇,最后,指出了档案工作者未来的工作重心与方向,给广大同仁今后的工作提供借鉴意义和参考价值。

大数据 档案管理 挑战 机遇

古往今来,纵观历史,每一项新技术的产生都预示着一个新时代的来临。随着云计算、移动互联网等新技术的不断涌现,不同角色间所输入与输出的海量信息衍生出了巨大的数据量。据预计,2020年全球以电子形式存储的数据量将达到35ZB,是2009年全球存储量的40倍。而在2010年年底,根据IDC的统计,全球数据量已经达到了120 万PB。数据的爆炸式增长大大超乎了人们的想象,整个世界迎来了大数据时代。

1 信息爆炸的大数据时代

数据信息的新时代,被称之为“大数据时代”。所谓大数据,简单来讲,指的就是规模巨大的海量资料,其具有四“V”特征,即Volume(体量)、Variety(种类)、Value(价值)、Velocity(速度)。一是数据体量巨大;二是数据种类繁多,包括结构化数据、半结构化数据和非结构化数据等;三是商业价值高,但价值密度低;四是处理速度快,要实时获取所需要的信息,这是区别于传统数据最显著的特征。

大数据的精髓在于分析信息过程的转变:第一,不再依赖于随机采样,而是更多的分析整体数据;第二,不再热衷于高精确度,而是更倾向于混杂性;第三,不再单纯探求因果关系,而是更为关注事物间的关联。这三大转变体现了大数据的核心——预测。

2 大数据技术——新时代下档案管理工作的必然选择

2.1档案信息资源的充分开发利用需要大数据技术

档案馆作为保存档案并为国家、社会、企业提供档案利用服务的事业机构,储存有海量的信息资源。由于管理方式的落后,人才力量的不足、档案意识的欠缺等原因,这些信息资源宝藏并没有得到有效的开发和利用。盘活海量的档案信息,挖掘出其中蕴藏的宝贵知识和财富,光靠人是无法完成的,必须借助技术,而大数据技术则是不二的选择。

2.2新时期档案数据的存储与备份需要大数据技术

档案数据库的使用极大地提高了档案管理利用效率,但近年来,常常会碰到无法向数据库中增加新的档案数据的情况。随着档案信息化不断接近完成及大数据时代的到来,档案数据库面临的存储空间问题相当严峻。我们必须优化存储、提高效率和节约成本,这就需要借助大数据技术来得以有效的实现。

2.3档案工作从实体管理上升到知识管理需要大数据技术

仅限于数据或文件的借阅利用已经无法满足现今档案用户的需求,目前,获得数据背后的信息及其所蕴含的知识成为了档案利用更为重要的目的。因此档案利用服务也应向知识提供方面转化。技术引擎是档案馆知识服务的技术核心,新型知识服务引擎包括资源及学术搜索引擎、资源及服务推荐引擎、知识服务社区实体(包括用户及资源)行为智能分析引擎、用户知识需求预测引擎及多维度信息资源获取、组织、分析及决策引擎等。运用大数据技术可以构建档案馆的信息新型知识服务引擎。

3 大数据时代档案工作面临的挑战与机遇

3.1大数据时代给档案工作带来的挑战

3.1.1档案管理理论的挑战

正如信息化时代挑战了纸质时期的来源原则、文件生命周期理论、档案价值鉴定理论,催生了基础理论的新变革,产生了新来源观、文件连续体理论、宏观鉴定理论等革新的理论。在大数据时代,新来源观、文件连续体理论、宏观鉴定理论等都将受到不同程度的挑战,档案学基础理论将迎来进一步的发展。

3.1.2档案信息资源管理的挑战

从纸质档案到档案信息化再到档案大数据时代,档案信息资源呈指数型增长,用现有的档案信息化手段和工具难以满足大数据时代档案信息资源管理的需求。在大数据时代,档案信息不再匮乏,而是泛滥。如何实现档案数据长期可读性、可靠性,并在海量数据中实现对档案信息的挖掘分析,从而提供有价值的信息,是档案信息资源管理面临的新挑战。

3.1.3数据安全问题的挑战

档案数据的高共享不等于全共享,在大量涉密档案数据的保密过程及敏感数据的分析过程中,如何实现信息安全,避免数据被恶意使用,更好地防止因秘密泄露给国家、社会、企业带来政治、经济上的损失,是新时期档案安全工作面临的一大挑战。

3.2大数据时代,档案工作迎来的新机遇

3.2.1大数据的应用给档案数据挖掘带来了机遇

传统的档案管理以文档管理为主,没有利用技术工具进行挖掘、分析,档案基本处于被动利用。大数据时代,档案系统中除大量的文档外,还有海量结构化数据。档案部门收集大数据后,通过主动调查利用者的需求,对海量数据进行聚类、分类、相关性分析,建立各种数据模型,找到数据之间的关系,提高档案价值,更好地实现预测功能,为高层决策提供参考。

3.2.2大数据技术给档案管理系统的可扩展性带来了机遇

随着档案数据的不断增多,传统的档案管理系统由于无法动态扩展,会出现“小马拉大车”的情况。大数据技术可以对计算资源、存储资源进行动态扩展、按需分配,满足服务器的快速扩容及数据量的快速增长,同时大幅降低系统投资及维护成本。

4 结语

大数据时代已然是信息社会发展的必然结果,而这一新的时代也必将加快社会的进一步发展。作为档案工作者,要努力抓住新时代的机遇,严肃对待挑战,不断学习和创新,围绕企业的经营工作对档案管理方式和手段进行深入思考、重新认识。充分运用新技术,在时代浪潮地推动下,更好地开发和利用档案信息资源中蕴藏的巨大知识宝藏,使档案工作创造出更大的价值。

[1]张欣.解读大数据时代下档案管理的价值提升[J].理论观察,2014 (1):108-109.

[2]高茂科.对档案大数据关键环节的认识[J].中国档案,2013(10):72-73.

[3]冯海超.大数据创业样本[J].互联网周刊,2012(23):45.

猜你喜欢
海量挑战档案管理
一种傅里叶域海量数据高速谱聚类方法
海量快递垃圾正在“围城”——“绿色快递”势在必行
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
健康档案管理的“云”前景
第52Q 迈向新挑战
基于文件系统的分布式海量空间数据高效存储与组织研究
加强工程项目档案管理的有效途径