文/长治市经济发展研究院 杜晓林
每一次科技革命都会对档案工作产生巨大的影响。工业时代的高效率让档案数量激增,迫使档案管理更为系统化、科学化;信息时代计算机的普遍应用使电子文件的概念成为档案管理工作必须面对的问题;而无论如何,2015年国务院下发的《国务院关于印发促进大数据发展行动纲要的通知》表明大数据时代已经到来,在大数据浪潮席卷下的档案概念有了全新的变化。
全球知名咨询公司麦肯锡(Mc Kinsey)是最早提出“大数据时代”已经到来的权威机构,该公司在2011年6月份的研究报告中明确指出大数据已经开始渗透到各行各业,逐渐成为各职能领域不可缺少的生产因素。不可否认的是,大数据时代的到来也对档案学理论研究及档案工作产生了很大的影响。就目前来说,我们一般所说的档案,其通用的定义为:档案是社会组织或个人在以往的实践活动中直接形成的具有清晰、确定的原始记录作用的固化信息。传统的档案管理方式采用了去粗取精的方法,将有用的、有价值的部分提取出来,而对于那些看似“无关紧要”的内容被排除在外,这样的方式在一定程度上节约了人力物力,提高了管理效率,但也造成了一部分档案数据的损失。
在大数据时代,档案具有来源的丰富性、数据的冗余性、载体的多样性和内容的混杂性等新的特征,数据与档案间的概念区分越来越小,甚至可以宽泛地说:数据即档案,可能单个数据没有价值,但当它成为集合数据的一分子时,它的作用才能显现出来,在此基础上提取出的大量有价值的异构数据,成为我们所需的资源。因此,在大数据时代的引领下,档案工作者亟须转变思维,树立起“数据即档案”的大档案观,保证各类档案数据的完整性与丰富性。
(一)第一维——“点”。档案数据四维结构的第一维是结构中的“点”,其基本的构成要素是档案数据。这里面的数据并非元数据,一般是指一个数字、一个名词或是一张图片等等。这是档案数据的第一维,也是档案数据的基础,以下各维的构成都由档案数据为基础进行的。将档案数据作为基本单位进行理解更具有灵活性,每个档案数据都兼具两种特点:一是作为信息主体,另一个则是信息背景。档案数据的不断累积,这些数据根据来源组合可以成为档案信息。
(二)第二维——“面”。档案数据四维结构的第二维是档案中的“面”,其基本构成要素是档案信息。这里的档案信息是由档案数据与档案背景组成的,数据转化为信息被接受者接收的必要条件就是对背景的解读。同一来源的档案数据中必然存在可以互为背景的档案数据,通过对于背景的解读,档案数据就能成为具有利用价值的档案信息。
(三)第三维——“空间”。档案数据四维结构的第三维是档案中的“空间”,其基本构成要素是档案知识。档案知识是人类在实践中认识客观世界的成果。它包括事实、信息的描述或在教育和实践中获得的技能。它可以是关于理论的,也可以是关于实践的。档案知识是档案信息在空间上的延展,统一来源具有一定相似性的档案信息整合在一起。知识的传输过程是传输者将其知识转换为数据,数据通过一定的方式被利用者接受,然后对接收到的数据和背景重新整合成为信息,接受者根据自己的理解与推理能力重新加工成知识的过程。从这个传输过程中能看出接受者的能力在知识的接受过程中起决定性作用,经过人的提炼推理信息才有可能成为知识,所以档案知识是档案信息加上利用者的个人经验组合而成的。
(四)第四维——“时空”。档案数据四维结构的第四维是档案中的“时空”,其基本构成要素是数据化的档案馆。档案数据的第四维已经是档案数据在时间与空间上的汇集了,此时的档案数据已经在时间与空间上进行延伸,是对于四方上下与古往今来分布的档案信息进行整合推理的过程。而档案数据在经过四维结构中的第四维整合后,为直接面向公众服务提供了支持工具,服务方式也更为多样化,使档案工作向精品化、个性化、智能化的服务方向发展。
在大数据时代,档案管理工作被赋予了新的形式与内容,档案数据的量化进程将大大加快,档案数据四维结构间的各个维度,即“点”“面”“空间”“时空”间的联系将更加紧密与灵活,并且各个维度间的转换速度得到有效提升,档案信息流通程度变强,档案利用效率变高,对档案存储系统也提出了更高的要求。但与此同时,档案数据源的真实可靠性遭受质疑,档案数据的安全性、保密性受到严峻挑战,这也成为我们必须面对的问题。不过,毋庸置疑的是,大数据时代的发展必将引领档案工作实现跨越式发展,更好地为需求者提供服务。