浅析大数据时代的档案信息化建设

2014-10-02 20:01黑龙江省大庆市天然气分公司宋晨
办公室业务 2014年15期

文/黑龙江省大庆市天然气分公司 宋晨

一、大数据

半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。大数据——正在以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。人们不再以为数据是静止和陈旧的。大数据的掌握程度一方面可以转化为经济价值的来源,另一方面大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他方面。同样大数据时代的到来,也将影响到档案管理,如何在这种形势下,更好的利用大数据和发挥其在档案管理工作中的作用,也是我们现在面临的挑战。

(一)何谓大数据

大数据并非一个确切的概念。最初这个概念是指已经超出了一般电脑所能处理的信息量,因此工程师们必须改进处理数据的工具。这导致了新的处理技术的诞生,这些技术使得人们处理的数据量大大增加。今天,大数据可以认为是人们在大规模的基础上可以做到的事情,而这些事情在小规模的数据基础上是无法完成的。

(二)大数据的核心

大数据的核心就是预测。大数据不是要机器人像人一样的思考,相反,它是把数学算法运用到海量的数据上来预测事情的可能性。2009年 H1N1甲型流感爆发,而在爆发前几周,互联网巨头谷歌公司已经预测到了流感的爆发,并且可以具体到特定的地区和州,这让公共卫生官员和计算机科学家们感到震惊。原来谷歌公司保存了多年以来所有的搜索记录,他们设立了一个系统唯一关注的是特定搜索词条的使用频率与流感在时间和空间上的传播之间的关系。经过一系列处理计算,他们预测的准确度高达97%,而且非常及时,而疾控中心却要在流感爆发后一两周后才会有结果。由此可见,通过特定的系统对大量数据的分析,是可以完成曾经用传统思维无法预料到的事情。大数据引发的革命并不在于分析数据的机器,而在与数据本身和我们如何使用数据。

(三)大数据的引发的转变

在大数据时代,我们要利用的是所有数据,而不再仅仅依靠一小部分数据。我们现在要对“样本=总体”来进行深刻探索。

数据长期以来一直是有价值的,但通常只是被视为附属于企业经营核心业务的一部分,但在大数据时代,所有数据都是有价值的。数据的价值从它最基本的用途转变为未来的潜在价值,它促使企业改变它们的商业模式,因此创新型企业能够提取其潜在的价值并获得潜在的巨大收益。

二、大数据下的档案管理发展趋势

(一)发展大数据的必要性

就油田档案馆来说,其最大的优势在于所拥有庞大的数据资源,这就相当于一个大的数据库。目前,由于油田档案数字化还没有全面完成,许多档案资源都散落在互不连接的数据库中,形成很多碎片。如何将这些数据库打通,实现信息资源共享,研究成果共享,同时利用档案资源发掘对企业生产有价值的信息,发掘档案部门在生产中的潜力,将会对油田发展建设。

(二)发挥油田企业核心档案优势

就油田档案馆而言,油田档案馆有别于其他地方档案馆,因为大部分记录的是与企业生产有关的档案。其中石油勘探开发类档案是油田的核心档案资源,同时也是在国家巨大投入下几代石油人智慧的结晶,很多新的发现都是基于老资料的二次研究上取得的成果。就企业而言,如天然气分公司来说,建设项目是我们企业的核心档案。把核心档案做为我们企业档案管理今后工作中的重点,发挥核心档案在企业的生产、科研、决策方面的重要作用,将会使档案的重要性得到进一步的体现。档案工作应该由传统的重藏轻用转化为深度挖掘,通过对资源数据的分析来解决企业所需要解决的问题。

(三)档案人员观念的转变要迎合企业的发展

大数据时代的到来,档案管理人员要用发展的眼光去重新认识档案,用创新的思路去开展档案工作,用变革的理念去适应档案未来的发展。档案管理人员的理念应该发生根本性的转变:把传统的以文书档案为主转变为以企业核心业务为主。我们档案人员也要去关心企业所需要解决的问题,企业所需要的资源,要把企业的生产当成是自己的工作,然后把有价值的资源信息进行整合、分析、挖掘,形成档案的智慧分析库,为企业提供更加方便快捷的服务甚至是发现问题。我们也可以主动调查业务部门的需求,建立各种数据模型,对海量数据进行聚类、分类、相关性分析,找到数据之间的关系,进而提高企业决策水平,帮助其生产经营管理。档案管理人员只有把这些“死”的数据变成“活”的信息,才能更好地体现档案工作的价值。如果我们还不抓住这个契机,发挥自身的优势,那么档案部门在生产企业中将会越来越无足轻重。

三、注重档案在生产企业的资源管理

(一)什么是资源管理

档案资源管理是档案工作的一种新机制,即把档案作为一种资源,对各种档案信息进行综合管理,应用信息技术开发档案信息资源,开发档案信息创造的技术和经济效益。提高档案科学管理的工作效益。

(二)如何进行资源管理

随着油田的生产开发不断扩大,油田勘探开发类的档案资料在不断的增加。石油地质档案资料是石油企业在勘探开发过程中产生的一系列记录、数据、分析结果以及科研成果等,是石油企业在地震、钻井、测井、录井、试油、油井开发等油气田勘探开发过程中产生的数据。地质档案汇集了油气勘探开发过程的成果,其中油井资料更是地质档案的重要部分。如何利用好已有的油井资料来解决生产中的难题,为稳产4000万吨提供更好的帮助,将是档案资源管理中的重要内容。如果我们还继续传统的借阅模式,那就会存在因借阅频繁而引起档案的损毁、丢失现象的增多,给井史资料造成无法弥补的损失,同时也是油田资源的损失。

油井信息管理的基础是油井的资料共享,因此,档案管理系统需要建立油井管理的基础信息数据库,然后对这些资料中的油田、区块和井进行在分析、整理,这才是油井档案信息管理的核心。采油厂档案管理系统以油井资料管理为核心内容,为科研部门、生产管理部门,在科研攻关和革新改造、指导生产方面提供档案服务,是将科技信息资源转化为生产力,把“死资料”变成活信息的有力的佐证。

(三)生产决策的辅助分析

1.建立企业档案系统全文检索,通过用户访问记录的Web使用挖掘,提出合理化建议大数据的核心就是预测,如何把大数据这一核心价值在油田档案管理中体现出来,让大数据服务于油田生产企业,将会是我们档案工作的又一突破点。

在基于对企业所有档案进行数字化建立全文检索系统后,通过对网页关键字、下载记录、检索词、用户对网页利用时间和频度等方式进行整理分析,如果发现某一基建项目的访问量激增,或者同一设备的访问量增多,档案人员就可以把相关资料找出来,反馈给生产运行部门。比如在整理中发现某一型号的仪器仪表的查找率增多,档案人员就可以把这一型号在不同单位的仪器仪表找出来,向查找单位部门询问造成这一现象的原因,进而可以上报企业的生产运行部,使他们可以分析和预测,同样问题也将会出现在其他不同的单位。

2.为生产提供高效、快捷的服务。在建立大庆油田档案系统的全文检索系统后,各个采油厂的勘探开发类档案都会集中,同样油气勘探开发的各项科研成果也将汇集于此。比如,当某一采油厂的勘探开发工作遇到难题和瓶颈的时候,就可以通过勘探开发档案系统来借鉴其他采油厂的勘探开发经验和技术。这样就可以在技术攻关上节约时间,节约成本,避免了同一问题的重复研究。

同时,随着油气勘探难度的不断加深,许多工作需要在已有的资料上进行重复研究和利用。档案在生产资源管理系统的建立可以提高档案资料的利用率,提供高效、快捷的信息服务。

[1]维克托·迈尔—舍恩伯格.大数据时代[M].浙江人民出版社,2013.