应用大数据技术开展编研工作

2015-04-03 04:32王永梅
档案与建设 2015年12期
关键词:编研利用信息

王永梅 张 颖

(江苏省电力公司,江苏南京,212400)

近年来,电力系统档案数字化发展趋势愈发明显,信息技术的应用已成为提高档案管理效率、促进档案规范管理的重要手段和途径。档案编研本质上是对数据的分析、整理和再加工,是对原始档案信息价值的进一步挖掘,通过加工整理使一些不系统、零散的档案更加系统化、条理化。档案编研工作主要目的是方便档案的利用、扩大档案的影响,是为领导决策提供依据、为业务部门提供信息支撑、为用户提供针对性服务的有效途径。目前江苏省电力公司档案系统条目数据达1371 万余条,数据存储量11.5TB。文档信息数量巨大、类型繁多,通过人工整理无法及时发现有用信息并进行分析研究,传统的档案编研服务显然已经不能再满足企业发展的需求。然而,与之同时大数据时代也为海量数据信息价值的发挥提供了良好的契机与支持。我们需要正确认识档案电子编研工作的必要性及其重要价值,积极探索档案编研管理的信息化、科技化和数字化的发展轨道,为企业纵深发展提供重要支撑。

一、企业档案编研的价值

国家档案局在《全国档案事业发展“十二五”规划》中提出的任务之一就是加强档案编研工作,挖掘档案信息资源,开发、提炼档案信息产品,出版档案史料汇编,把“死档案”变成“活资料”,努力把“档案馆”建成具有特色的“思想库”;通过网络平台和媒体发布档案信息,档案利用工作向基层延伸,逐步开展远程共享服务。基于这些要求,企业档案编研的价值主要体现在三个方面:

第一,企业档案编研工作是企业提升自身发展水平的重要手段。企业档案是企业在各项活动中形成的历史记录,在企业生产管理经营过程中起着不可或缺的参考和凭证作用。在企业改革和发展的新形势下,做好档案编研工作,盘活档案信息资源,是让档案能够更好地服务于企业活动的重要举措。

第二,企业档案编研工作是企业历史文化传承的重要渠道。企业档案部门对企业活动中形成的各种材料进行集中统一的收藏、整理、保管与提供利用的过程,就是企业文化不断积累、传承和发展的过程。通过档案编研,企业文化得以形成、传播,对内可以增强员工的凝聚力、自豪感、责任感和使命感,对外可以显示企业核心文化价值,提升企业的知名度。

第三,企业档案编研工作是企业档案工作价值的重要体现。企业档案经过科学的编研整合,一方面,能够丰富企业档案室藏,增强企业档案部门的档案信息服务能力;另一方面,编研整合后的档案信息可以更好地发挥原始档案的价值,帮助企业上下更好地认识档案工作对企业发展的重要作用,为企业档案工作赢得更多的认同与支持。

二、传统档案编研管理现状

1.传统档案编研的主要做法

虽然目前我们开发了档案信息系统,也通过实体借阅、系统检索展开了档案利用工作,但还没有充分意识到深层次挖掘档案信息价值的重要性,目前档案部门的工作重点依然停留在档案的收集、整理、归档及提供普通利用服务等基本环节。传统档案编研主要依靠档案工作人员及相关专业人员手工来完成,主要包括两方面内容:

一是整理与集合。档案部门在完成档案的收集、整理等基础工作的同时,围绕企业工作重心,对频繁使用的依据性文件进行汇编,对档案中具有实用价值的信息进行抽取、整合,形成档案编研材料。

二是分析与研究。按照选定的专题,对档案资源进行深层次加工,通过编研人员自身的观点、看问题的角度和解决问题的方法,对档案信息进行挖掘与拓展,形成有借鉴意义的综合分析或专题研究材料。

2.传统档案编研成果的种类

通过对各市供电公司档案编研情况进行调研,统计目前共有各类编研材料390 种,累计4000 万字。(如图1)

传统档案编研成果的种类主要包括:

一是文件汇编。各类重要文件、标准规范汇编,涉及范围较为广泛,包括规章制度、人员任免、荣誉汇编等,主要为依据性编研材料,起到查考作用。

二是记录资料。记录和反映本单位基本情况、重大事件和主要生产经营活动及其成果,用于概要性介绍或一般性宣传,包括大事记、组织机构沿革、工程简介、工作报告专集、年报、电力工业统计资料等,主要起备查和提示作用。

三是研究材料。对企业发展具有一定研究价值的档案材料编研,包括史志、专业手册、经济活动分析、设备运行分析、运营诊断分析等,起到专业研究和为领导决策提供参考的作用。(如图2)

3.传统档案编研存在的问题及分析

在信息时代下,传统档案编研主要依赖于人工完成,这造成了许多问题,主要包括:

一是编研质量不高。目前档案部门人员的知识结构并不尽如人意,档案专业的人员较少,专业过于单一,综合素质不高,思想观念较为保守,很难意识到档案编研工作的重要性,充分挖掘档案信息的深层价值;另一方面,档案工作人员普遍年龄较大,其中50 岁以上占28.67%,40-50岁占41.26%,仅能完成各类档案的日常整理和入库工作,进一步开展档案编研的力量不足。这些因素使得企业档案编研工作中存在“编多研少”的状况,且题材单一,数量偏少,实用性不大,信息挖掘深度及开发利用程度并不理想。

二是时效性不够。传统档案编研是在档案节点后的一段时间,需要利用人力进行选题,对档案信息进行收集、整理、加工的工作周期较长,使得编研工作大大滞后于企业对于档案信息的利用需求,无法及时地为企业工作提供参考。

三是利用率不高。传统的档案编研方式是通过对大量档案的查阅、整理、编辑、归纳,形成文件汇编,其产品形式固定,表现形式单一,传播范围有限,并没有充分发挥数字化时代下的技术优势,使得档案编研产品往往难以获得理想的利用效果。

三、应用大数据技术开展电子编研研究的重要意义

档案编研可以被看作是一项由档案工作部门加工、研究、输出档案信息,最终实现主动全面地向目标用户提供针对性、系统性的档案信息服务的工作。大数据时代已经到来,对信息资源的开发利用能力已经成为企业竞争力的重要体现。基于企业快速发展的需求及长远利益的实现,我们需认识到档案智能编研的紧迫性和必要性。

图1 江苏省电力系统档案编研情况统计图

图2 江苏省电力系统档案编研种类统计图

1.应用大数据技术,全面提升档案编研价值

大数据对企业发展的影响绝不仅仅局限于技术层面,它为我们提供了一种全新的方法,档案编研加工有人力加工变为半自动化生成,更多的决策行为将基于数据分析,而不再是凭借经验和直觉做出。从浩瀚的数据中提取有价值的信息变为可能,通过对档案内容进行采集、整序、分析、加工而综合制成的档案电子编研产品,将档案承载的信息从静态的纸质转为动态形式,从而实现深层次、多元化、实用价值高的开发编研。

2.应用大数据技术,全面提升档案编研效益

处理速度快是大数据区分于传统数据分析的最显著特征。只有实现快速处理各种数据,才能及时挖掘信息价值并保证其短期内被利用,否则很多信息都将因为加工周期过长而丧失利用价值。大数据时代使得档案信息快速的收集、整理、加工变为现实,这一环境下,档案电子编研更能满足当前企业发展的新形势。

3.应用大数据技术,全面拓宽档案编研平台

公司各单位档案信息化和数字化工作已启动十多年,数字化档案信息日益增多。档案编研只需确定合适选题,即可进行相关素材的检索,从整个公司系统得到相关信息。可以讲,大数据时代的档案编研,其工作平台不再局限为某个单位室藏档案,而是整个公司系统乃至整个社会公开的联机档案数据库中的电子信息及其他相关信息,档案编研也可以做到文字、声音、影像、图片等多种形式并用。同时,数字化形式的编研成果也能大大缩短分散式查找利用档案信息的时间,最直接有效地服务于利用者,提高档案利用效率,加快推进工作进程。

四、应用大数据技术开展电子编研的方式方法和技术模式探讨

大数据技术,是从各种类型、未经加工的海量数据中快速获得有价值信息的技术。目前,数据采集、存储、处理和呈现等技术的快速发展更好地推动了大数据的发展。大数据处理的关键技术主要有:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。(如图3)

1.应用大数据技术开展电子编研工作思路

引入大数据概念,利用科学化方法,深度挖掘档案价值,对历史数据进行系统分析,深入开展电子编研研究。对用户历史借阅记录、查询记录进行统计,分析用户的查询习惯、重点关注内容、借阅频繁档案等信息,有针对性地对档案数据进行电子编研,主动推送给用户查询利用。通过对档案的深度挖掘和编研,实现档案价值实体化。

2.应用大数据技术开展电子编研工作模式

利用数据分析及挖掘技术,固化编研模式,完成电子编研展示。数据挖掘就是从大量的、未经加工的、随机产生的、并不精确的实际应用数据中,找到潜在的、从表面发现不了的但又极可能具备利用价值的信息和知识的过程。数据挖掘是网络信息服务实现智能、个性、精品化过程中不可或缺的手段。可针对目标用户的信息需求或某项具体任务,系统地收集各种类型的数据,并加以分析、判断、综合、归纳,将最终成果以综述、概述、进展报告、分析报告等形式呈现出来,形成电子编研材料,提供给决策部门和研究人员参考。数据挖掘还可跟踪记录用户的访问历史,收集分析用户的兴趣爱好并反映用户需求的变化与迁移,在用户下一次访问时,可以根据过往信息向用户推荐其有可能感兴趣的档案编研信息,并提供个性化界面;当新发现相关文献信息时,及时增补进入电子编研相应模块并告知用户。

图3 大数据处理流程

3.应用大数据技术开展电子编研工作成效

档案工作者可利用文本挖掘,运用关联、分类、聚类等方法,打破原有的整理体系,从海量档案信息中按照相关专题进行挖掘、分类、加工、整理和有序化重组,构建特色档案编研信息库及各类专题档案编研信息库等;为了弥补现有档案数据库在前期档案信息收集过程中的不足,还可利用数据挖掘技术从档案信息资源中提炼出与专题相关的文献信息资料,分类、整合后形成知识性、系统性的二次、三次电子编研信息资源,并建立电子编研信息资源主题指南。(如表1)

五、应用大数据技术开展电子编研利用服务前景

目前,公司已经对大数据时代下的电子档案编研工作展开了有意义的探索工作。2014年底“电网建设项目档案大数据深化应用项目”研究通过国家档案局科技创新项目验收并获得高度肯定。该项目即利用云计算、数据挖掘等先进技术,创新性地将编研成果利用系统进行展示。展示利用平台将工程档案涉及的文书、照片、实物等各类档案信息进行融合,并利用电子图册技术进行展现,全面梳理公司系统工程档案,绘制220 千伏及以上电压等级变电站及线路工程分布图,实现工程项目新建、改建、扩建、技改等数据自动关联,全方位展示工程概况、建设过程、领导关怀、参建单位、荣誉、照片、工程档案等内容,让档案查询利用更快捷、有效、全面;将项目历次建设投资、建设工期、建设内容、建设特色等通过时间这条主线贯穿起来,建立变电站投资规模与档案收集情况对比表、历年档案增量图、线路工程情况对比表、参建单位档案完成情况表、参建单位档案评分等统计分析图表,为公司领导决策提供依据,为规划、建设、档案等各部门管理提供信息支撑,实现档案价值实体化,在档案信息化领域具有创新示范效果。通过将编研思路的固化,形成了更加便捷和简单易用的电子编研成果,并通过系统进行在线展示,打破了原有纸质编研成果利用的局限性,开创了档案开发利用电子编研新模式。

表1

档案编研的意义就在于利用多种多样的服务方式,尽可能地满足利用者的各类需求。大数据时代为我们提供了先进的工具和各种技术手段,在政府支持以及社会档案意识不断增强的背景下,我们能够更加充分地利用总量巨大、内容丰富的档案信息突破档案人员自身能力的限制,满足档案事业高科技化、专业化的发展趋势,真正实现档案信息的“大编研”。档案信息资源的范围也不再局限于传统的纸制文件图纸等,各种图像视频资料都可以被提供利用。档案编研的信息资源将会得到很大的增长。在掌握充足编研资料后,编研人员就可以利用各种数据分析方法,对海量数据进行分析,找出数据之间的关系,发掘出其潜在的价值。然而我们也必须看到,快速增加的海量信息既是一种可贵的资源,同时也在技术、安全、资金、资源整合等方面给我们的工作带来了不小的挑战。在未来的工作中,我们不能放松对档案信息收集保管的重视,必须调动公司各方面力量,为大数据环境下的电子编研工作奠定坚实的基础。一方面我们要紧扣企业需求,丰富编研形式,提高档案人员相关素质,充分利用大数据时代带给我们的便利。另一方面,我们也要树立起大数据时代的风险意识,努力探索电子编研工作的新途径,注意工作过程中的信息安全,避免各种潜在的不利因素。

大数据时代的到来对档案电子编研工作是一次难得的机遇。抓住这次机遇,将会大大提升档案编研的水平,充分发挥档案的社会价值和经济价值,进而扩大档案工作的影响力,为档案事业的进一步发展做出贡献。

猜你喜欢
编研利用信息
利用min{a,b}的积分表示解决一类绝对值不等式
谈谈房地产档案的编研
利用一半进行移多补少
科研档案编研工作的新认识
利用数的分解来思考
Roommate is necessary when far away from home
订阅信息
档案编研在地铁文化中的应用
房地产档案编研工作的特点及其完善建议
展会信息