刘双玢
【摘要】大数据背景下海量数据的出现冲击着原有的传统档案编研的模式。大数据时代使得我们寻找新的档案编研策略,促进档案“大编研”。本文概述了传统档案编研管理现状,分析了大数据背景下档案编研工作的整体趋向,并给出了档案编研工作的开展策略。
【关键词】大数据;档案编研;新趋向
传统的档案编研工作以纸质材料为基础,进行人工分析后传播利用。随着互联网时代的到来,数据量爆炸式增长,传统的档案编研方式明显不能应对社会多元化的信息需求。档案工作者要借助大数据技术重新完善档案编研体系,促进档案“大编研”的发展。
一、传统档案编研管理的现状
(一)传统档案编研的具体做法。档案编研是以馆藏资源为基础,进行整合与开发,形成印刷型、音像型、数字型成果的一项工作。编研工作主要包括两个方面:编纂和研究。目前档案部门的重依然停留在档案的收集、整理、归档和普通利用服务的环节过程中。档案编研工作主要包括两个方面:一是档案的整理和汇编。档案部门先收集档案资料,然后根据档案的工作重心对有价值的信息进行汇编整合。二是分析和研究。根据编研主题,工作人员将根据自己的经验和观点对档案信息进行分析挖掘,形成较为精炼和概括性专题分析材料,供利用者查阅使用。
(二)传统编研方法存在的问题。目前各个省级档案馆已开通自己的档案信息网站,但是信息网站中有关档案编研的问题却还是存在各个方面。首先,从档案编研的名称来看,各个省级档案馆信息网站关于档案编研的词条名称大同小异,如
“档案编研”“编研成果”“编研出版”等等。其次,编研质量方面,各个网站也是呈现不同的水平。有的省级档案信息网站内容丰富新颖,上海档案信息网的“档案博览”中有各种历史档案故事汇编,如“老挝王室子弟中国留学记”“重访,邓小平的上海足迹”等等,有珍贵的历史考察价值,但是像广西档案信息网中却找不到专门归类的档案编研词条与内容。最后,从编研内容来看,多以“历史记录”“全宗介绍”“大事记”为主,和群众生活密切相关的内容相对较少。综合来看,档案信息网站主要存在以下问题:第一,档案编研选题较少拓展馆藏资源以外的内容。第二,档案编研人员素质和技术手段较为落后。第三,档案信息的开发利用主要依靠工作人员手工操作,档案工作“编多研少”。第四,档案编研主要是工作人员内部进行,与大众生活脱节。
二、大数据背景下档案编研工作的发展趋势
传统的档案编研是档案馆、档案室将以书刊为载体的档案进行汇编然后予以公布的过程。现在出现的“大编研”具体体现在编纂者不局限于是档案馆、档案室,可以是企事业单位、科研部门、学术机构等等。国家档案局在《全国档案事业发展的“十二五”规划》中提出的任务之一是加强档案编研工作,挖掘档案信息资源,把“死档案”变成“活资料”,努力把档案馆建成“思想库”。大数据时代的到来,数据中心的运维工作和之前有了很大不同。现在更多考虑如何根据数据预测并避免问题发生,以及大数据时代大量虚拟化设备对于数据分析难度和中心的转变。综合分析大数据背景下档案编研工作的发展趋势有以下几点:
(一)数据挖掘观念增强使得档案编研工作获得更广阔的发展空间。大数据时代档案信息急速增长,由于档案本身具有原始记录性的作用,那么档案信息的整合就显得迫在眉睫。大数据时代引导档案编研工作者对档案信息进行再加工,运用先进的数据挖掘技术和思维对海量数据进行整合,汇编成有价值的信息,促进编研工作发展空间扩大。
(二)海量数据的增长为档案编研工作提供了更丰富的信息资源。大数据时代档案规模的增长速度的加快极大地丰富了可编研的馆藏资源。另外,大数据技术的出现使得档案编研形式变得更加多样化,除了文本,还可以视频、音频、图片等多种方式进行编研,这样的编研成果更具有吸引力,也满足了社会需求。
(三)大数据技术的提升使得档案编研工作有了技术保障。大数据背景下处理档案信息更加注重效率。如果精细化处理,将会错过很多有用的信息,也会失去信息的时效性。数字处理技术变得逐渐发达,目前可以实现信息反复输出,编排方式灵活,进行迅速检索,提升工作效率。在数据处理技术的支持下,编研工作劳动量降低,档案信息编排结果更加清晰,表现形式更多样化。
三、大数据背景下档案编研工作的发展策略
(一)档案管理观念转变成数据管理观念。大数据时代,档案编研展现出了现代化、信息化、服务化。各个档案馆的电子档案仍属于稀缺状态。大数据时代要求档案馆跟进时代脚步,及时转变成数据管理思想,并进行信息挖掘。不管是“小编研”还是 “大编研”,都要摒弃“重保管轻利用”“只编不研”的思想,加强数据管理理念,借助现代科技手段,高效完成各类档案工作编研。
(二)应用大数据技术进行电子编研。大数据技术是指从各种类型、未经加工的海量数据中分析挖掘出有价值信息的过程。大数据处理的关键技术有:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据的展现及应用。档案编研在大数据时代的发展需要依托互联网平台,进行社会化存取和集约化处理。首先,分析档案信息内容和用户信息需求。分析档案信息要利用数据挖掘技术剔除多余信息,最终产生智能、精品化档案信息结果。而用户信息需求数据的挖掘可以借助谷歌大数据技术以及在其基础上发展起来的Hadoop技术。其次,建立电子编研系统。前期数据挖掘工作完成后,要及时将用户信息和档案汇编信息进行整理和数字化入库,将信息进行专题化分类,在分类后形成知识性、系统性的二次、三次电子编研信息资源,并建立电子编研信息资源库。
(三)突破界限,开展跨领域合作。大数据时代的档案编研呈现科技化、专业化,利用到各种较为复杂的数据分析技术。短时间内若想依靠档案人员解决技术问题并不现实,为了节约成本,提高工作效率,档案部门可以与其他精通技术行业的人进行跨领域合作,合力完成档案编研工作。跨领域合作不仅仅可以高效解决技术问题,还可以从专业的角度挖掘数据信息所呈现出的社会需求,对档案编研提出具有现实意义的指导。
(四)运用互联网技术加快档案编研成果的传播。互联网技术推动档案编研成果的快速传播,影响范围扩大,能够为档案编研成果的使用者提供更加便利的环境。互联网使得档案编研的成果接近社会需求,拉近了与社会大众之间的距离,使得档案编研成果能够得以在各个层次和专业的人群中传播,最大限度地发挥了档案的价值。
(五)构建满足社会需求的档案编研内容。档案馆的编研工作归根究底还是服务于社会大众,档案编研成果不能偏离群众生活太多,内容要引起大众的兴趣。因此,档案编研产品要做好前期需求分析,根据不同层次和专业的人群需求做出合適的、图文并茂的内容。首先,拓展选题视野。比如宁夏档案局、宁夏档案馆主编的《纪念世界反法西斯战争暨中国人民抗日战争胜利70周年档案文献汇编》是在2015年9月纪念反法西斯战争70周年纪念之际面世的,通过丰富的图文回顾展示光辉历程。其次,拓展选材空间。要将选材范围扩大到社会群体,和其他文化教育部门进行合作编研。比如:苏州大学档案馆、苏州大学校史研究室联合编辑的《东吴大学史料选辑(历程)》,内容来自多所文化教育单位,显示了丰富选材的重要性。最后,实现编者和利用者的互动化。
四、结语
大数据时代的到来给档案编研工作带来了发展机遇。档案工作者应当抓住机遇,学会运用数据挖掘技术,提升档案编研水平,充分且全方位地发挥档案的社会价值,开展全新的档案信息资源开发格局,为社会提供更有价值的档案编研成果。
【参考文献】
[1]吉星昇.对综合档案馆档案编研工作"编"多"研"少的新认识[J].档案与建设,2017(07):24-26.
[2]王永梅,张颖.应用大数据技术开展编研工作[J].档案与建设,2015(12):73-76.
[3]张隽轩,张文利,黄毅.数据中心运维系统应用ITIL管理体系分析[J].智能建筑与城市信息,2015(03):77-78.
[4]李莉.试析信息时代档案编研工作发展趋势[J].档案学研究,2017(S2):24-27.
[5]周焘.大数据时代的档案大编研[J].陕西档案,2014(02):24-25.