李建 刘月皓 冯鑫 李佳培
(1 石家庄市公共资源交易中心 石家庄 050030;2 河北地质大学会计学院 石家庄050031;3 河北地质大学管理科学与工程学院 石家庄 050031)
随着科技的进步,人类早已进入了大数据和高度信息化时代,档案信息化领域的应用也逐步深入,并获得了档案界学者长期关注。新时代带来新要求,各级各类档案面对海量数据信息,急需更加完备和先进的档案智能管理系统。从国家政策层面以及基础档案工作需求层面,都急需档案信息化的理论和应用的进一步深入研究和发展。
如近年来,档案信息化管理与档案资源利用和分配具有密切的关系[1],在档案资源利用和分配方面目前已经有大量的学者对其进行了研究。马仁杰等提出影响档案利用的因素主要有社会政治、经济、民族历史和文化传统、人口、科学文化等5个方面[2]。霍振礼等提出由于档案利用效果的复杂性、隐含性和模糊性, 档案利用评价指标也须是全方位的, 应包括利用状态和使用效果的各个方面[3]。丁梅对档案利用中的安全问题进行了研究和分析[4]。档案信息化则是伴随信息技术的出现而逐渐引起人们关注[5]。何玲等对我国档案信息化存在的问题做出了总结并提出了改进措施[6]。
为探究我国近二十年来档案信息化研究的起步、发展及未来趋势,本文采用文献计量的方法,对该领域的主题文献进行可视化分析,重在梳理国内档案信息化领域年代更替、突变节点、主题团聚类、机构合作以及未来的发展趋势,为我国档案信息化的深入研究提供一定的参考。
本文以CNKI期刊全文数据库为数据来源,勾选北大核心、CSSCI、CSCD等核心期刊,设定检索条件为(主题=档案信息化)。因我国国家档案局于2000年开始正式全面部署推进档案信息化工作,为保证数据集的时效性与研究的价值性,将检索年份设定为2000年到2020年。数据集剔除非学术性的新闻报道、通知等与主题无明显相关的题录后共纳入1906篇期刊文献题录数据。
研究采用共词分析、突变检测、聚类分析等文献计量方法,利用Citespace对目标领域进行文献计量分析,以探寻出档案信息化领域发展的路径以及关键节点。对档案信息化研究关键词特征、核心作者群以及机构间合作进行分析,并生成了一系列的可视化图谱来展示学科发展的潜在动力机制以及对学科未来发展进行探测。
论文发表数量是该学科领域所受关注程度的具体体现之一。通过对档案信息化领域相关论文年发文量进行统计得到其文献发表量统计图(见图1)。
2000年到2007年为发展起步期。档案信息化领域年度发文数量从最初4篇呈逐年递增趋势,其中2002年到2003年的跨越式增长是因2002年颁布了《全国档案信息化建设实施纲要》,这标志了档案信息化建设从国家层面开始实施,对档案信息化领域产生了积极深远的影响,引起了学界极大关注,研究成果日渐丰硕。
2008年到2013年为研究高峰期。2008年档案信息化领域共发文149篇,达到小高峰,又于5年后发文量达到167篇。结合国家大数据发展战略、“互联网+”行动计划,不断深化档案信息化领域内涵[7],2013年我国档案信息化领域进入深化转型阶段。
2014年到2019年为研究递减期。从2014年到2019年档案信息化领域的年度发文数量总体上呈现递减趋势(因2020年数据采集仅为一个月,暂不考虑入内),学者对于档案信息化领域的发文量逐年减少,但是对于档案信息化领域的关注度并没有减少,反而是关键词的转换将研究进一步升级,变为互联网+下的电子档案、档案数字资源及智慧档案等领域的高阶研究。
图1 档案信息化领域文献发表量统计图
关键词是作者对于文章研究内容的高度概括,表达了研究者的核心思想。共词分析(Co-word Analysis)是利用关键词或名词短语共同出现的情况,来确定学科中各主题之间的关系。本文对关键词与关键词之间的共现情况进行统计分析,并根据关键词的节点大小和连线揭示其研究热点。通过对1906篇档案信息化领域核心期刊文献的关键词统计分析,得到了关键词频次排名以及中心性值和首次出现的年份。
关键词频次表示关键词出现总次数,在本数据集中,对全部文献的关键词进行统计和计数。中心性是指节点在网络中的重要程度,中心性的值越高代表它连接的节点越多,越处于网络的中心位置。本文对频次排名前16的关键词进行信息汇总,结果见表1所示。档案信息化领域的高频关键词的首次出现年份大多较早,其中2000年和2001年居多,在2003年首次对企业中的档案信息化开展研究。档案信息化建设、档案信息化、档案、档案信息资源和档案工作这5个关键词出现的次数最多,排在前五位。
表1 档案信息化领域关键词出现频次排序表
突变检测(Burst)是Citespace的一个重要指标,表示一个变量在一定时间段中的波动情况,其波动的大小用强度(Strength)来表示。利用Citepace得到档案信息化领域研究关键词年度突变图(见图2),从中可以看出档案信息化领域研究的核心关键词二十年间的变化,了解其热点的演进历程。蓝色线段为时间标识段,完整的蓝色线段为2000年到2020年,每年为一个隔断单位。红色线段表示核心关键词频繁出现的时间段。不同的时间段学者们的研究重心也不完全相同,总是处于动态变化中。
从2001年到2005年,主要研究方向为档案事业、档案部门、档案管理现代化、会议、北京市,该阶段围绕全国档案事业发展“十五”规划确定的“有中国特色的社会主义档案事业体系”为目标,不断加强档案信息化领域的基础建设。2002年和2003年分别对档案利用者和档案工作者开展了研究。2004年至2008年,学者们的研究方向侧重于长远计划、现行文件和未来规划,其中2005年至2007年科学发展观也是档案研究的侧重方向和时代特色。2008年至2009年的研究比较侧重于电子文件中心、档案材料、开发利用等。2010年数字化进程加速,对档案信息化领域产生了影响。在2010年学者们的研究方向出现明显的分水岭现象,开始与数字化相结合。2010年至2018年研究重点为民生档案、数字化加工,其中2010年和2011年还侧重于档案信息、档案登记备份。
图2 档案信息化领域研究关键词年度突变图
发文机构是研究领域的间接主体,通过对发文机构的研究可以观察出档案信息化领域研究的地理空间分布。利用Citespace机构发文量进行统计分析,共有535个机构在档案信息化领域发表了文献,截取了其中发文量排名前十五的机构(见表2)。我国档案信息化领域发文数量排名前5的机构依次是:中国人民大学信息资源学院(16篇),哈尔滨学院人事处(12篇),浙江省档案局(12篇),国家档案局(10篇),安徽大学管理学院(10篇)。这五家机构对档案信息化领域的研究做出了重要的贡献。档案信息化领域的高产出研究机构在空间分布上比较均匀,北部、中部和南部均有主要研究机构,为该主题的后续发展奠定了良好的研究基础。
发文机构合作网络可以反映出机构的科研实力,同时能清晰的展示出网络中知识的流动状况。如图3,节点(圆圈)半径的大小表示发文量,半径越大发文数量越大;节点的颜色深浅表示发文时间,颜色越深表示发文时间越早。从图中可以看出半径较大且颜色较深的机构有中国人民大学信息资源管理学院、国家档案局、浙江省档案局、哈尔滨人事处,说明这几家机构研究时间起点较早,且发文数量较多。北京市档案局、北京市档案馆、上海市档案局、北京市司法局等机构之间存在较多的连线,说明这几家机构之间合作较多。其余多数的机构为孤立的节点,表明该领域研究为“多中心机构合作”型,且表明机构间未来合作空间比较大。
对档案信息化领域主要研究机构进行突变分析,可以从更深的层面挖掘出该领域某个时间段最突出、最核心的机构。利用Citespace对档案信息化领域所有的研究核心机构进行突变分析,得到5所突变机构(见图4)。从中可以看出档案信息化领域核心研究机构从2000年至2020年的变化。红色线段表示该机构频繁发表文献的时间段。不同的机构在不同的时间段对档案信息化领域所做出的贡献有较大波动。在2009年到2010年中国人民大学信息资源管理学院、安徽大学管理学院、浙江省档案局在档案信息化领域较为活跃,2012年至2015年南京政治学院上海校区军事信息管理系为主要的研究机构,期间共发表文献7篇。国家档案局在2014年首次对档案信息化领域开展研究,并持续至今,期间共发表相关文献10篇,为现阶段主要研究机构。
表2 档案信息化领域研究机构发文量前15统计表
图3 档案信息化领域机构合作图
图4 档案信息化领域主要研究机构年度突变图
作者是学科领域研究的直接主体,通过对作者文献发表的数量和质量进行分析,可以看出作者的真实科研水平以及在学科领域研究的权威程度。表3是经Citespace统计分析得出的2000年至2020年作者发文量排名前13的作者信息汇总,可以看出张照余文献发表量为10篇。其次,丁德胜、李筱春、张鸿艳、马仁杰、薛四新均发表了6篇文献,并列第二。可以看出这几位构成了档案信息化领域的核心作者群。
表3 档案信息化领域研究作者发文量前13统计表
通过Citespace对作者进行分析,构建出作者合著网络,可以直观的展示出档案信息化领域研究中的关键人物和合作网络。经Citespace研究得出档案信息化领域作者合著可视化图(见图5)。从整体上来看,多数节点为分散、独立的个体。从局部来看,丁耀琪与朱晔之间存在较多连线,说明二者存在多次合著情况。图5中节点(圆圈)半径的大小表示发文量,半径越大表示发文数量越多。节点颜色的深浅代表文献发表时间,颜色越深说明发文时间越早。对作者合著网络图进行分析可以看出,节点最大且颜色较深的作者是张照余,说明其发文时间较早且研究较为深入,凸显出了其在档案信息化领域的权威地位。
图5 档案信息化领域作者合著可视化图
本研究采用log-likelihood ratio(LLR)算法,通过聚类生成主题团共现网络,共计8个聚类,见图6所示。这8个类别分别为:档案事业、人事档案管理、档案信息化管理、数字档案室、企业、档案馆、档案信息化、档案工作。各类主题团的紧密程度均在0.5以上。从表4中的主要标识词可以看出,各类聚类的标识词之间界限较明显,涵盖范围存在重叠部分。
图6 档案信息化领域研究关键词聚类分析图
表4 档案信息化领域主题聚类表
(1)聚类0的标题词为档案事业,是13个类别中的最大类,其紧密程度为0.737。其核心关键词包括了档案信息化建设、档案事业、国家档案局、档案安全、数字档案室、档案接收等。该类主要概述了档案接收与保存相关的安全、利用等问题。如谢永宪等提出我国档案信息长期保存缺乏整体规划,面临的最大困难是缺乏人员、经费和技术[8]。曾萨等对云环境下档案信息的安全性进行分析并提出应加强档案馆与云服务商之间的合作,提升档案信息系统云安全保护的能力[9]。
(2)聚类1的标题词为人事档案管理,其中核心关键词包括档案管理、人事档案管理、人事档案工作、人事管理、档案信息化建设、现行文件、文件生命周期等。该类主要涵盖人事信息与档案管理的融合以及人事档案的管理措施。如张鸿艳提出利用大数据技术,多渠道、全面收集人事档案数据,不断提升档案管理人员的水平和效率[10]。
(3)聚类2的标题词为档案信息化管理,其核心关键词包括档案信息化管理、档案信息资源、档案管理人员、工会工作、档案数据库、档案移交、纸质文件等。该类主要概述了档案信息资源的使用和分类。李春慧等提出纸质档案与电子档案各有优势,二者相辅相成,实行纸质档案与电子档案“双套制”管理具有必然性[11]。
(4)聚类3的标题词为数字档案室,其中核心关键词包括档案信息化建设、数字档案室、数字档案资源、经济社会发展、电子政务、资源管理、数字档案馆等。该类主要概述了数字档案的发展与数字信息资源的存储。刘越男等从术语定义、类型划分、实际项目建设内容等方面梳理出数字档案馆从机构、系统走向体系的发展脉络[12]。
(5)聚类4的标题词为企业,其核心关键词包括数据大集中、集中存储、企业管理、档案信息化、档案服务、档案管理方式、知识经济时代、企业档案信息资源、信息化工作、档案数据库等。该类主要概述了企业中的档案工作。高燕春提出企业档案工作存在工作基础不牢固、工作质量不平衡、档案信息化共享平台建设滞后等问题,并提出责任分工到位、资金保障到位、制度执行到位等解决措施[13]。
(6)聚类5的标题词为档案馆,其核心关键词包括文化机构、建立档案、信息网站、档案信息化建设、文书档案管理工作、档案信息资源、档案信息化建设等。该类主要概述了档案馆等文化机构的建设以及档案信息在社交传播媒介中的传播。如范智新等提出了利用信息化技术,创建服务型档案馆的建议[14]。王俊章等对自媒体时代下档案信息的传播进行研究,发现其具有传播途径多、可以随时发布等特点,但同时也面临可传播资料少、无法确定信息真实性的问题[15]。
(7)聚类6的标题词为档案信息化,其核心关键词包括档案信息化、行政监管、档案登记、立档单位、档案信息化建设、技术型人才、专业人才、档案从业人员、档案信息化建设、人才需求分析等。该类主要概述了档案管理人才队伍的建设。如李宗富等基于2015-2019年公务员考试中对档案学专业人才需求分析提出要加强对档案学专业学生就业规划与指导,培养学生的创新意识和能力[16]。
(8)聚类7的标题词为档案工作,其核心关键词包括档案工作、户籍档案、公安档案、档案收集、档案信息化、档案管理、企业档案管理模式、档案工作运行机制等。该类主要概述了档案工作的运行机制和外在因素。如王向女等提出“互联网+时代”影响档案利用的影响因素主要表现在档案的服务、形式特征、价值实现条件和用户特征四方面[17]。
4.2.1 理论研究方面
本领域理论的研究发展顺应了信息化之势,扩大学科口径,立足广义的档案学信息化理论和我国国家政策,定位自身发展方向。 “十四五”规划中指出全国档案系统2020年将进一步加大档案信息资源开发利用并且积极推动档案查阅一网通。互联网等计算机技术给档案信息化领域发展带来了巨大的发展前景,档案的利用者从有特定档案查询需要的个体拓展为海量的用户群体。由此带来的学科对象的拓展也会带来档案信息化研究知识体系的立体化变革,其原理、规律、方法等也会在“变与不变”中螺旋式上升中进化。
4.2.1 应用实践方面
科技含量的持续提升对档案信息化发展具有重要意义。二十年来随着网络平台不断发展以及人工智能的出现,档案事业也由数字档案转变为智慧档案。智慧档案馆应利用网络技术和社交媒体增强智慧档案馆服务的个性化和互动性,为用户打造一个信息交互环境。但海量的档案数据以及用户需求的不断变化为实际的运用带来了一系列的挑战。为了使用户能够随时随地查询到高质量的档案信息,预测档案信息化领域在应用实践方面会利用大数据技术深层次的挖掘用户需求,利用云服务构建用户反馈系统,构建更加知识化、个性化的智能档案馆。
4.2.3 研究热点方面
我国档案信息化建设历经了实体档案、数字档案、智慧档案三个阶段,不断与时俱进,顺应时代发展的潮流。从档案管理、档案馆等的研究转变为对新媒体、大数据、人工智能环境下数字人文档案信息的研究。研究范围不断扩大,研究深度不断加强,档案信息的社会化功能也不断增强。结合现阶段科技发展,未来档案信息化领域结合认知仿生等人工智能方式下的档案信息化利用、社会化功能拓展,数字人文档案将会成为研究的热点。
本研究通过对2000年至2020年档案信息化领域核心期刊所刊载文进行文献计量与分析。基于Citespace科学研究可视化软件,利用关键词提取、网络共现、主题聚类、研究机构合作等方法,得到了我国档案信息化领域的基本研究概貌。档案信息化领域研究机构分布较广,主要有档案事业、人事档案管理、档案信息化管理、数字档案室、企业、档案馆、档案信息化、档案工作等8个主题研究聚类。研究重心也随着国家政策与科技发展在不断提升,从档案事业、档案部门慢慢向电子文件中心、档案材料过度,再到对高校、数字化加工进行重点研究。我国档案信息化领域研究学者已在档案信息化领域取得了很大成绩,呈现出多层面、广角度的趋势。未来理论研究将在变与不变的基础上螺旋式上升,应用实践上将深化其科技含量,研究热点将在档案与人工智能的结合、档案信息的社会化功能拓展、数字人文档案等方面拓展。