大数据背景下地勘单位如何做好档案管理的工作思路分析

2021-04-14 20:51苗晓慧
卷宗 2021年12期
关键词:数据量时代背景结构化

苗晓慧 施 娜

(1.包头市速拓地质勘查技术服务有限公司,内蒙古 包头 014000;2.内蒙古鑫昊有色金属矿业开发有限责任公司,内蒙古 呼和浩特 010010)

1 大数据与大数据特性

“大数据时代”最早被麦肯锡公司提出的,自2012年开始,“大数据”一词被越来越多的人提起与应用,人们用它来描述信息爆炸时代的海量数据,近年来已经在商界、科技界广泛应用。但是理论界尚未对“大数据”形成统一的定义,但是一致认为大数据不是简单的对数据量大小的描述,而是在数据量巨大,数据种类庞杂的信息中通过数据处理、数据分析来获取有效信息的一种观念、技术和方法的统称。

与“大数据”定义不同,大数据的特征普遍得到业界共识,即大数据一般归纳为4V:数据量巨大,从TB级跃升到PB级甚至ZB级,而且在不断增大;处理速度快主要表现在数据流和大数据移动性,此特性要求必须在第一时间处理数据;数据种类繁多,数据种类不仅包括文档、图片等传统类型,还包括视频、音频、网页、电子邮件等;数据价值高,此特性是大数据运用的真实意义所在,其价值具有稀缺性。

2 大数据时代下地勘单位档案工作的新特性

大数据时代的来临,使人们对信息资源的认识更进一步,同时也提出了新的需求,在大数据时代的大环境下,各个业务部门均上线各自业务系统,作为这些业务数据的终点数据,档案数据也有了新的变化,同时对档案管理工作也有了新的发展特征。

1)档案数据量巨大。地勘单位档案记录着地勘单位在科研等各种活动中直接形成的、清晰的原始信息。在大数据时代背景下,各业务系统每时每刻都在产生着数据量,这些业务系统产生一切的具有保存价值的文件、音频、视频、图片均属于档案收集范围。因此,档案数据量将大的惊人。同时,科技的进步直接导致各种数码设备的普遍使用,形成各部门各种活动的照片视频等,也构成很大一部分数据量。

2)档案数据多源异构。地勘单位档案涉及地勘单位内的众多业务,包括生产、科研、活动等,这些业务部门的不同业务和不同业务系统直接导致产生的档案数据是各不相同的,形成了档案数据多源异构的态势。如文档、图片、照片、音频、视频等,形成非结构化数据、半结构化数据、结构化数据共同存在的现象,而这些数据之间也并非毫无关联,存在一定的内在联系。

3)利用档案需求多样化。大数据时代,地勘单位各业务系统既是档案数据的产生者也是档案数据的利用者。首先,行业政策、规定等信息的需求正在不断增加;其次,作为不断发展的地勘单位,地勘单位的宣传活动必不可少,而宣传活动中用到的历史档案、名人档案和特色档案也在不断增多。由此可见,大数据时代不同使用者对各种类型档案的需求产生了多样化的态势。

4)地勘单位档案价值更加高精尖。大数据真正价值在于对海量数据的分析、挖掘,得出真实可靠的信息。地勘单位档案是记录地勘单位从事生产、科研、管理等活动直接形成具有保存价值的各种文字、图表、声像等不同形式、载体的历史记录,是最真实、最可靠、最权威的信息。并且在大数据时代背景下,各业务产生的各种中间数据、重点数据均是利用者可利用数据,因此,在对这些数据进行分析、挖掘之后产生的档案数据变成了高精尖的档案数据。

3 大数据时代地勘单位档案面临的挑战

大数据时代的到来,使得档案数据变得数量巨大、多源异构、需求增多、数据高精尖化,给档案发展带来了机遇,同时也给档案工作带来了新的挑战。

1)大量数据存储挑战。档案大数据化,使得地勘单位档案的数据必须具备大容量的存储。对如此海量的档案数据首先要将其保存下来,同时考虑到数据多源异构的特性,应该将档案数据存储在不同类型的数据中,另外存储的数据并不是简单的存放,应该彼此有关联有机的进行融合,因此不同存储空间应该有合理“连接器”。

2)档案服务内容、方式需革新。大数据时代下的档案利用,走向了结论化、知识化和智能化,应该改变以往简单查阅、复制等利用方式,档案利用者也不仅仅是对档案信息本身的需求,更希望从大量数据中经过挖掘,得到自己想要的档案信息。

3)档案信息安全受到威胁。大数据时代背景下,档案数据的安全受到了很大的威胁。各个业务系统的上线,并未遵循统一标准,但是均需要与档案系统进行对接;同时,档案数据价值变得越来越高,越容易受到各种不法分子的共计;另外,在对结构型数据和非结构型数据进行融合时,可能会对传统档案信息安全体系带来较大冲击。

4)对档案从业人员提出较高要求。在大数据时代背景下,档案的收、管、用方面均有了新的时代特征,新的档案管理业务对档案从业人员提出了更高的要求,不仅要通晓档案业务,更要具备计算机相关知识,并且具备较高的学习能力,才能不断跟随时代发展,做好档案工作。

4 大数据时代档案管理工作思路

大数据时代,地勘单位档案工作要有新的工作思路,充分整合利用档案资源,以服务为宗旨,不断改进工作方式,适应时代发展要求。

1)建立数据规范,整合资源。地勘单位各业务部门间的业务系统可能采用不同的数据库,而产生不同格式的数据,大量异构数据形成信息孤岛,建立标准化、规范化的体系,消除信息孤岛,形成资源共享是大数据时代背景下首要解决的数据问题。对结构化数据和非结构化数据合理整合,结构化数据和非结构化数据合理整合,努力实现对结构化数据和非结构化数据的合并管理,云计算、大数据技术的运用才能成为可能,分析挖掘海量数据才能成为可能。

2)改善工作模式。大数据时代背景下,各业务系统的建立,各业务数据的归档,对传统的收、管、用,均提出了新的要求。档案的“收”要做到贯穿全流程,做到前端控制,提前做好各个业务系统的调研,要针对不同数据类别采取不同的处理方法,与档案系统建立接口;档案的“管”要做到全技术支持,大数据时代背景下,档案管理已经不可避免的涵盖了计算机知识,同时海量的档案数据处理也需要计算机技术处理,在档案安全方面也需要做到备份与系统日志管理;档案的“用”要做到全智能服务,大数据时代,档案数据不应该是简单地存放在那里的“死”数据,应该“活”起来,而“活”即是对数据的分析与挖掘,应该具备智能化的服务,真正为档案利用者服务。

3)增强档案信息安全管理。大数据时代档案安全性不言而喻,地勘单位档案工作需特别强调档案信息安全。首先要以技术为支撑,加强档案信息安全全程管理。包括身份认证、单点登录、密码技术给数据加密、设置权限、做好备份机制、保留操作日志等。其次,要建立安全规章制度,确保各项工作有章可循。特别要做好档案开放标准和保密制度,在信息安全的前提下实现数据共享利用。

4)建立高质量的人才队伍。大数据时代下的档案工作,已经不是简单地把档案收集起来,装装订订,档案利用也不再是简单查阅、复印,档案从业人员应该以大数据的思维去管理档案。这就对档案从业人员提出了更高的要求,要具备专业的档案知识,还要有数据分析能力、数据建模分析能力和处理数据能力,最重要的是要具备较高的自学能力,紧跟不断出现的时代要求,更好地做好大数据时代下的档案工作。

猜你喜欢
数据量时代背景结构化
基于大数据量的初至层析成像算法优化
促进知识结构化的主题式复习初探
计算Lyapunov指数的模糊C均值聚类小数据量法
结构化面试方法在研究生复试中的应用
宽带信号采集与大数据量传输系统设计与研究
新时代背景下棊江区政协建设
基于图模型的通用半结构化数据检索
探索新时代背景下的交通运输管理模式
基于软信息的结构化转换