档案工作中大数据框架构建及应用思考

2016-06-30 17:05赵明芝
科学与财富 2016年14期
关键词:应用思考档案工作构建

赵明芝

摘 要:档案工作是当下时代发展的重点建设工作,并且在当今时代的经济全球化形式的渲染下,我国的经济建设得到了全方位的革新因此人们在生活质量随经济而得到全面提升的同时,也对自身的生活水平有了全新的要求,所以人们在各领域的需求观念也就有了实质性的变化,在档案工作这一与人们有着千丝万缕联系的体系性建设中也不例外,因此对于档案工作的建设细节来说,迫切需要将新时代发展进程中的数据以及科技化因素融于其中。因此本文在这一基础上主要分析和研究了档案工作中大数据框架构建及与之相关的应用性思考,以期为相关建设体系的开展提供一定的理论性借鉴。

关键词:档案工作;大数据框架;构建;应用思考

档案与我们的生活息息相关,并且我们的生活也离不开档案的建设性规划,因此,我们需要在此基础上进一步完善档案工作的相关建设项目,进而使我国档案体系的容纳力以及规划性都得到全方位的提升与发展。而在当今大数据的时代特色下,相应的诸如档案工作这类系统化的工作体系也都要或多或少地融入这一体系中,进而全面提升自身的工作建设思路,因此对于档案工作体系内部的大数据框架的建设也就显得尤为重要,因此我们需要对大数据体系展开较为全面而细致的了解,进而全面体提升档案工作的实际发展水平。

1 档案资源的大数据特征

1.1 种类繁多

档案资源以文本类为主,还有大量的音视频档案、照片图片档案、图纸、凭证档案、地理信息、网络日志等,都是非结构化数据,描述这些档案资源的元数据又是结构化数据。海量结构化数据与非结构化数据的混合正是传统数据处理难以解决的问题,符合大数据的多样性特征。

1.2 价值密度与价值成反比

档案留存着社会的历史记忆,具有很高的历史价值。然而对当前应用来说,海量档案信息,每次可能利用的数据非常少,存在着价值密度低的特点。如视频,连续不间断摄制过程中,可能有用的数据仅仅有一两秒。这些档案信息蕴含着巨大潜能,需要人员、流程与技术的密切配合,方能将其转化为更大的真正价值。

1.3 对处理速度要求较高

大数据要求实时或近乎实时的处理速度,这对企事业单位来说没问题,对于国家档案馆来说好像要求过高,其实不然。传统档案利用方式是被动等待用户来查找原始信息,给社会留下“故纸堆”印象。如果改被动服务为及时、准确的主动服务,这种主动服务不仅提供档案原始信息,还应提供BI、预测分析、内容分析、辅助决策分析等。

2 档案工作中大数据框架的具体应用

2.1 相应平台的搭建

大数据档案工作体系的建设在理论层面具备着十分充足的可行性,当在这一建设体系的具体实施层面依旧因实施条件的不足而潜藏着一定程度的阻碍性瑕疵,所以其具体的实施环节依旧存在着一定的执行难度,。因此需要经过全方位的权衡才能够确切地进行大数据档案工作的开展,而实际的权衡性环节需要结合具体的档案数据、相关技术的实际应用方法以及较为成熟化的实施机制这三点来进行实际的方案策划。而同时这三点也是大数据档案工作体系想进行较为成功的发展所必须具备的基础性要素。档案部门长期以来利用思想是提供原始信息的被动查询,还谈不上迫切且明确的大数据研究需求,即使在企事业单位,档案部门也很难做到主动提供服务,利用好大数据,依然需要敏锐的洞察和创新的思维,这是档案部门比较欠缺的。一定的技术积累与成熟度对于档案部门目前更是困难。综合上述分析,大数据目前在我国档案部门开展有相当大的难度。如果依靠档案部门自己,目前几乎是不可行的。但并不表示面对大数据,档案部门无所作为,可以做好迎接大数据的准备工作,同时借助外力开展试点工作。

2.2 服务观念的转变

档案部门作为一个服务部门,其服务态度的确立是这一部门想要取得发展性建设的必要保障,而同时态度问题也是服务类行业尤为重要的执行要素,因此在档案部门的大数据框及体系建设的环节也就要对此尤为注意。但是大多数的档案部门所持的服务观念以及对服务这一理论的理解依旧停留在传统的服务理论上,因此也就会一直延续传统服务行业的弊端,即服务者对被服务者持一种被动的等待态度,而且其实际的服务内容依旧也是以对档案信息的单纯性提供为主。随着档案信息化工作的开展,档案目录、部分档案全文经数字化后上网供利用者浏览,这是主动服务思想的体现。一些档案部门也在尝试开展进一步的主动服务工作, 面对大数据,这种转变尚不够。大数据数据量大、查询分析复杂,更重要的是精准把握利用者的需求。然而利用者很多时候并不知道准确的需求,需要档案管理人员主动深入了解业务,明确需求,准备相应数据,尤其对企事业单位档案部门更应该如此。

2.3 档案质量的提升

档案质量的提升也是档案大数据框架构建体系建设的必然性要素,而档案质量的提升其首先必然是先实现档案数量的提升,进而在此基础上由档案馆为基点,开展数字化档案网络体系的构建,进而实现其馆内档案的全部数字化,然后让这一批数字化的档案能够集结到统一档案数据库中,再经过对数据库的集中性建设后借助一定的共享性平台分布机制从而实现档案网络的构建,针对那些不全的档案信息进行二次修正性录入,并在此基础上实现对已录入网络的电子档案的全方位管理。由于与载体的不可分离,同一份传统档案可能在多个全宗或立档单位都存在,在大数据处理前需要查重,以免增加超级计算机或服务器集群的负担。查重的方法是利用档案目录。各档案部门基本都已建设自己馆藏的档案条目,先把条目上传,根据条目比对档案的重复性,将结果反馈给相应档案部门。以一个档案部门为主进行数字化,其他部门或下载拷贝或通过链接关联相应档案。

2.4 云服务的实现

大数据的基础是云计算,同时档案信息资源的整合也应该建立在云计算基础之上,可以考虑建设全国或区域性的公有云,实现全国或区域内档案条目的集中与共享,实现查重档案的存放与共享,甚至可以实现区域内所有电子文件、数字档案的存储,下级档案部门保留档案链接地址即可。这样的前提是访问公有云是高速网络。公有云下,区域内档案部门可以建设自己的私有云。档案云资源的建设使得大数据平台有了强有力的数据支撑。

结束语

总而言之,档案的大数据框架构建体系的建设以及具体应用体系的构建对于我国的信息化建设是十分有益的,其能将档案以数字的形式较为集中地规划到一处,并在此基础上,进一步来完善实际的档案数据库的确立,并对这一数据库进行较为稳妥地管理,这样档案的搜索机制的运行就无需通过冗杂的人力来实现,仅需通过数据库的调动就能够更为高效。迅捷地实现。因此,这一体系的建设性开展与实际的应用能为我国的相关信息化建设带去更值得借鉴的体系架构,进而在此基础上我国能够实现相应数字工程体系的全方位构建。

参考文献

[1]刘国华,李泽锋.档案工作中大数据框架构建及应用思考[J].档案管理,2014.

[2]滕春娥.大数据环境下档案工作转型研究[J].北京档案,2015.

[3]邹华英.试论大数据时代的档案工作[J].档案与建设,2013.

[4]兰祝刚,惠英,李刚.大数据时代下的档案工作[J].中国档案,2013.

猜你喜欢
应用思考档案工作构建
高职综合课程虚拟仿真实训平台开发与应用的思考
高中语文“翻转课堂”之我见
浅谈实现档案工作规范化管理的路径
探析全程管理视角下如何贯彻落实“344”制度
艺术档案工作重要性研究
试析机关档案管理工作的创新
环境生态类专业大学生创新创业能力培养体系的构建与实践
构建游戏课堂加强体育快乐教学的探究
共情教学模式在科学课堂的构建与实施研究
快乐学习,自主学习