侯作龙 吴磊
摘 要:档案事业作为一项基础性服务性事业,面临大数据技术带来的冲击和影响。本文通过分析认为,作为档案工作的从业者,需要深入思考如何与大数据技术融合发展,既要为大数据技术产业发展服务,又要利用大数据技术发展促进自身发展。
关键词:大数据;档案管理;关注方向
人类进入二十一世纪之后,信息产业技术迅猛发展,特别是大数据技术更是突飞猛进,给人们的生活带来了普遍影响。时至今日,各个行业都在思考如何利用大数据技术为本行业本产业服务,都在寻找与大数据技术融合的最佳结合点。
档案事业是基础性事业,也是服务性事业,同样面临大数据技术带来的冲击和影响,一样要思考如何与大数据技术融合发展,既要为大数据技术产业发展服务,又要利用大数据技术发展促进自身发展。
1 大数据技术发展对档案资源体系建设影响之一:来源更广了
在人们的固有观念里,档案部门收藏的都是一些有关党和国家的档案,这就大大地限制了档案的来源,把档案的范围集中在机关和企事业单位。大数据时代背景下,互联网、社会、大众生活也应该成为获取档案数据的来源。随着互联网的普及,越来越多的数据来自互联网。互联网已经成为最大的信息资源生产地。我国的网民数量已经稳居世界各国之首。据中国互联网络信息中心官网消息,第49次《中国互联网络发展状况统计报告》(以下简称《报告》)2月25日在京发布。《报告》显示,截至2021年12月,我国网民规模达10.32亿,互联网普及率达73.0%,我国网民人均每周上网时长达到28.5个小时。城乡上网差距继续缩小,我国农村网民规模已达2.84亿,农村地区互联网普及率为57.6。老年群体加速融入网络社会,截至2021年12月,我国60岁及以上老年网民规模达1.19亿,互联网普及率达43.2%。可见,互联网产生的海量信息已经成为档案数据的一个重要来源。
同时,加大对民生的关注力度是档案部门获取档案数据来源的又一个大的变化。最近几年,为了响应国家政策,档案部门加大了收集与民众切身利益相关的民生档案的工作力度。档案部门还利用国际档案日对普通公民展开教育,帮助民众树立社会档案意识,唤起人们对我国的档案事业的关注。[1]当前,为了使我国的档案管理向生活化、草根化方向发展,家庭档案和个人档案的建立正成为一种新的趋势。
2 大数据技术发展对档案资源体系建设影响之二:内容更丰富了
信息资源是档案部门安身立命的根本所在。信息资源数量越是大、门类越是多,档案的价值才越能够发挥出来,愈加凸显档案部门的社会地位。当信息技术进入大数据时代,档案部门也意识到自身变革的重要性,开始不断改变自身[2]。
2.1 档案数据量几何级增长
大数据时代背景下,我国档案数据资源在总量上呈现出快速增长的趋势[3]。截至2020年底,全国各级综合档案馆馆藏档案91789.8万卷、件。其中,中央级2046.6万卷、件,省(区、市)级4666.9万卷、件,副省级2456.4万卷、件,地(市、州、盟)级19050.2万卷、件,县(区、旗、市)级63569.7万卷、件。照片档案2401.0万张。其中,中央级20.0万张,省(区、市)级285.5万张,副省级235.5万张,地(市、州、盟)级607.6万张,县(区、旗、市)级1252.4万张。录音磁带、录像磁带、影片档案112.1万盘。其中,中央级1.8万盘,省(区、市)级26.7万盘,副省级3.4万盘,地(市、州、盟)级32.5万盘,县(区、旗、市)级47.7万盘。馆藏电子档案1387.5TB,其中,数码照片390.2TB,数字录音、数字录像523.5TB。馆藏档案数字化成果19588.5TB。2020年度全国各级综合档案馆共接收档案8310.1万卷、件,照片档案105.3万张,录音磁带、录像磁带、影片档案4.4万盘。2020年度全国各级综合档案馆共征集档案91.7万卷、件,照片档案25.6万张,录音磁带、录像磁带、影片档案0.4万盘。截至2020年底,全国各级综合档案馆纸质馆藏资料4039.4万册。其中,中央级213.6万册,省(区、市)级272.9万册,副省级66.8万册,地(市、州、盟)级841.6万册,县(区、旗、市)级2644.5万册。随着新一轮各级各类档案馆的改扩建工程的批复与落地,我国档案馆馆藏容量必将持续增长,对于存量档案的数字化处理以及新增档案的电子化处理将是档案部门今后一段時间的工作重点,“双套归档制”仍是我国档案管理的主要制度[4]。而那些经过移交、寄存、撤转并改的档案,很容易就会让档案馆的馆藏存储量由TB级跨越到PB。
2.2 档案数据类型空前多样
纸质、声像、实物是常见的三种传统档案类型。随着信息化的普及,电子档案也成为档案的一种类型。此外,档案部门还要对浏览查询记录、用户信息等进行保存。这些信息的载体不同、各自特点突出、结构差异大,因此档案部门以不同的方式把它们分门别类地保管起来。这样,即使是同一个信息也会因载体的不同而呈现出不同的数据形式[5]。同样的道理,同一个数据形式会因载体的不同而呈现出不同的信息。异构数据大集群便由此产生。随着大数据技术的发展,越来越多的半结构化、非结构化的数据将以表格、文档、图像、音频、视频、网页等的形态呈现出来。异构化数据将是未来档案馆藏的重要来源,类型多样、非结构化的数据将在档案中占有越来越大的比例[6]。
2.3 档案数据价值密度大幅下降
与一般的信息资源比起来,档案能够真实地记录历史,因此有着很高的价值。然而,对于大多数的档案而言,从它们进入档案馆的那一刻起,便进入了深度睡眠的状态,少有人问津。相关调查表明,真正具有较大利用价值、利用率较高的档案在全部馆藏中的占比并不是很高[7]。随着大数据时代的到来,档案数量也在不断地增加,档案价值密度也越来越低,因此有价值的档案的占比越来越低。
2.4 档案数据处理速度随着技术进步不断加快
信息化技术的普及使得档案部门对档案的管理工作,由过去的人工手动管理模式转变为信息化的、网络化的收、管、用业务流程管理模式[8]。时效性和便捷性是大数据时代档案管理工作的两大特点:第一,互联网上的信息更新的速度都会很快,特别是那些有用的信息,若无法将它们快速地抓取出来,这些信息便难觅踪影;第二,为了更好地满足用户的需求,档案员应该快速地从海量的档案中提取用户想要的信息。怎样才能够快速地提取出用户想要的信息呢?云计算技术是大数据背景下档案部门亟须学习和掌握的一项技术[9]。云计算技术基于互联网技术,利用各种精密的算法,在大幅度提高档案资源处理速度的同时,提高查找的准确度。
3 大数据技术发展对档案资源体系建设影响之三:收集方式更多了
在实际工作中,一些单位总是借故拖延或是从未积极主动地把档案移交给档案馆。修订后的档案法赋予了档案行政管理部门强制执行档案收集移交的权利,也从法律层面明确了违法违规人员和行为的法律责任。但这依然属于传统的档案收集模式,随着互联网技术的发展,大数据技术给档案管理带来了新的档案收集方式:实时捕捉[10]。
互联网可谓是深入到每个人的日常生活当中,它所蕴含的信息具有数量大、更新快、传播广的特点。这给大数据时代下的档案收集工作提出了新的挑战。对于档案员而言,是否能够捕捉到有价值的信息并将其归档,是对档案员业务能力和操作水平的检验[11]。档案部门应该转变过去那种“等人送上门”的档案收集办法,利用云计算技术,实时抓取互联网上有用的信息,使档案资源动态化,不断提高互联网信息资源抓取的科学性、准确性[12]。
结语
人类进入二十一世纪之后,人们的生活受到计算机技术的影响越来越大,第三次技术革命之后产生的信息产业技术越来越快发展,技术进步带来的大数据技术更是突飞猛进。时至今日,信息产业技术特别是计算机技术的影响已经深入经济社会生活的方方面面,无论是朝阳产业还是夕阳产业,都在寄希望于能够利用信息产业技术或者计算机技术促进本行业本产业的技术革新,都在思考如何利用大数据技术为本行业本产业服务,都在寻找与大数据技术融合的最佳结合点。档案事业是基础性事业,也是服务性事业,档案工作者要思考如何与大数据技术融合发展,既要发挥档案事业基础性工作、服务性工作的特性,为大数据技术产业发展服务,发挥档案为科学研究科技进步提供基础数据服务的作用;又要利用大数据技术发展促进自身发展,利用大数据技术促进档案管理工作提高效率、降低成本,进一步利用大数据技术提高档案服务工作水平,做到超前服务、精准服务和个性化需求服务。本文从来源、内容和收集三个方面总结了大数据技术发展对档案资源体系建设具有重大影响,希望能够引起档案管理人员的注意,引起大家的共鸣,共同研究大数据技术发展对档案资源体系建设的意义,扬其所长,避其所短,让大数据技术为档案资源体系建设赋能。
参考文献
[1]陈如明.大数据时代的挑战:价值与应对策略[J].移动通信,2012(17):14.
[2]刘佳丽.数字时代红色档案资源开发利用策略研究[J].档案天地,2022(05):50-51+14.
[3]于秀.大数据背景下档案管理“价值链”的生成研究[J].文化产业,2022(12):100-102.
[4]董中印.大数据时代档案信息资源开发刍议[J].黑龙江档案,2022(02):95-97.
[5]赵卉.大数据指导下对办公室档案管理工作的创新研究[J].办公自动化,2022,27(02):44-46.
[6]舒琼.探究大数据时代下的档案管理工作[J].山西青年,2021(24):65-66.
[7]李文琼.大数据挖掘技术在高校档案管理中的运用[J].郑州铁路职业技术学院学报,2021,33(04):106-107+112.DOI:10.13920/j.cnki.zztlzyjsxyxb.2021.04.032.
[8]董继红.大数据背景下档案管理发展及趋势分析[J].兰台内外,2021(35):10-12.
[9]冯华.大数据时代档案管理的机遇与挑战[J].当代工人(C版),2021(05):94-95.
[10]曲晶瑶.大数据视域下档案信息建设发展研究动态研判[J].兰台世界,2021(10):110-114.DOI:10.16565/j.cnki.1006-7744.2021.10.29.
[11]杨爽.浅谈大数据时代档案管理工作存在的问题与对策[J].兰台内外,2021(27):64-65.
[12]王迎.基于大数据时代的档案信息(下接65页)
(上接62页)管理研究[J].无线互联科技,2021,18(18):33-34.
[13]盘活存量 优化增量 做强变量 提升质量 整体推进档案资源体系建设[J].四川档案,2022(02):26-27.
[14]加小双,姚静.数字人文赋能档案资源体系建设:机制与路径[J/OL].山西档案:1-9[2022-07-10].http://kns.cnki.net/kcms/detail/14.1162.g2.20220227.1215.002.html
[15]张腾华.建立适合乡村发展的档案资源管理体系思考[J].黑龙江档案,2022(01):108-110.
[16]倪代川,蔡丽华.数字档案资源文化软实力建设探析[J].山西档案,2021(06):31-37+14.
[17]李晉.运用大数据技术加强干部人事档案资源体系建设[J].数据,2021(12):66-67.
[18]刘凯,肖向华,霍艳芳,霍红霞,马立伟,李洁.“十四五”时期档案学专业教材资源体系的构建研究[J].档案学通讯,2021(06):100-102.DOI:10.16113/j.cnki.daxtx.2021.06.011.
[19]杨帆.国有企业档案资源体系构建研究[J].浙江档案,2021(08):28-30.DOI:10.16033/j.cnki.33-1055/g2.2021.08.010.
[20]王丽茹.地方综合档案馆馆藏资源体系建设的思考[J].兰台内外,2021(21):44-45.
[21]郭成斌,陈永楠,李珒,杜贞.社会治理视域下高校科技创新档案资源体系构建[J].浙江档案,2021(05):57-59.DOI:10.16033/j.cnki.33-1055/g2.2021.05.022.
[22]朱建邦,王巧玲,谢永宪.国家治理时代我国档案资源整体治理体系构建研究[J].档案学研究,2021(02):20-25.DOI:10.16065/j.cnki.issn1002-1620.2021.02.003.
[23]刘芳.档案资源体系建设研究[J].机电兵船档案,2021(02):39-40.
[24]秦敏.档案信息化背景下高校档案资源体系建设[J].办公自动化,2021,26(02):53-54+47.
[25]宋璇.运用大数据技术加强干部人事档案资源体系建设[J].办公室业务,2020(02):161+168.
作者简介:侯作龙,本科学历,通榆县债务管理服务中心馆员;吴磊,本科学历,白山市江源区机关事务服务中心职员。