赖雯 赵莉
摘 要:文章以国内电子档案研究为研究内容,通过采集CNKI核心期刊和CSSCI数据库的电子档案相关论文数据,利用Citespace软件对关键词、作者、发文机构等信息进行知识图谱分析,展示电子档案研究的总体情况,归纳出电子档案管理、电子档案归档、纸质档案信息化、电子档案管理系统、元数据、电子文件中心、数字档案馆、长期保存等研究热点,并预测前沿趋势。
关键词:电子档案;统计分析;知识图谱;Citespace
2020年6月20日国家颁布《中华人民共和国档案法》,第五章中提道:电子档案与传统载体档案具有同等效力,可以以电子形式作为凭证使用。这标志着我国的电子档案作为一种重要资源,在人民生活、国家经济和社会管理过程中的地位日益突出,电子档案的研究也显得越发重要。
了解电子档案研究的总体情况、研究热点和前沿趋势,是进行学术研究的前提。在CNKI数据库通过篇名=“电子档案综述或热点”搜索到22个结果,说明国内学者对电子档案研究现状的分析文章较少。
本文利用Citespace软件分析了我国三十多年来电子档案研究的知识图谱,展示了电子档案研究的总体情况,对重点、热点研究问题进行分析,并预测未来的研究趋势。
一、数据来源与研究方法
1.数据来源
核心期刊和中文社会科学引文索引文章在一定程度上反映学科的最新研究成果。本文选取的数据来源有两个:其一在CNKI数据库搜索题名包含“电子档案或电子文件”,文章来源=“《中国档案》《档案学研究》《档案学通讯》《档案管理》《北京档案》《浙江档案》《档案与建设》”,得到1397篇文章;其二在CSSCI数据库搜索题名包含“电子档案或电子文件”,得到233篇文章,检索时间为2020年10月9日。
CNKI数据库得到的文献样本量大、时间跨度长,可以很好地体现我国三十多年来电子档案的研究现状和研究热点。CSSCI数据库的文章更能代表前沿动态,体现电子档案未来的研究趋势。
2.研究方法
将CNKI和CSSCI导出的文件通过CiteSpace软件进行数据转换和聚类分析。CiteSpace是国内使用最多的可视化文献分析工具,采用最大相似度算法对关键词进行聚类处理,通过图谱直观展示高产作者、机构和研究热点等情况。
二、研究结果分析
本文采用Citespace软件分别对CNKI和CSSCI电子档案主题的文献进行知识图谱分析,并从作者、机构、研究热点、发展趋势几个方面进行阐述。从1988~2019年,电子档案的相关论文呈波动性增加,并在1997年后显著增加。
1.文章作者、发文机构分析
在Citespace界面,设置“TimeSlicing=1, NodeType=Author”,得到研究作者知识图谱(图2)。图中节点大小代表出现次数,节点间的连线说明两个作者有合作关系。发表论文数量大于10的作者有:刘越男、张正强、张宁、于英香、刘家真、何嘉荪、张照余、冯惠玲、于丽娟、田雷、傅荣校、安小米、薛四新、刘立和徐义全。
2.研究热点分析
在Citespace软件中,设置“TimeSlicing=1, NodeType=Keyword, SelectionCriteria-TopN=50”,得到关键词知识图谱,截取出现频次大于15的关键词得到关键词出现表格(表1)。关键词的大小代表出现频次,关键词之间的连线代表两个关键词曾出现在同一篇文章中,节点间连线越粗说明联系越紧密。在Citespace中,设置关键词突变参数,得到历年来关键词的突变图谱(图5),begin year代表該关键词的突然出现年份,end year代表该关键词的消失年份,关键词突变图谱能显示研究热点的突现和变迁。
由图3和表1综合分析,可得电子档案研究热点有以下几项。
(1)电子档案管理。电子档案管理从1999年开始成为热点,且历年来出现次数为376,是持续的研究热点、重点。电子档案与纸质档案相比,具有对设备的依赖性、信息与载体的分离性、信息共享安全性、信息易篡改性,所以对电子档案的管理也面临新的挑战。电子档案管理包括管理理论体系、管理流程、国家行业标准、技术应用等方面。
(2)电子档案归档。电子档案归档从1997年开始成为热点,历年来出现次数为134。电子档案归档包括归档策略理念、格式、范围、流程、载体、技术规范等方面,重点在于保证归档过程的安全性和电子档案的真实性。
(3)纸质档案。各档案馆大部分库藏历史档案都是纸质档案,研究集中在纸质档案与电子档案的差异、备份管理、纸质档案数字化、纸质档案与电子档案的关系等方面。
(4)电子档案管理系统。传统的档案管理系统多是对纸质档案的辅助管理,原有的功能设置无法满足电子档案的需求,所以电子档案管理系统需要重新设计。电子档案管理系统的研究包括电子档案自动化归档、元数据设计、加密算法、网络安全协议等方面。
(5)元数据。元数据是数据的数据,是描述资源的结构化信息。元数据能记录电子档案整个生命周期中的所有过程信息,是保证电子档案真实性的关键要素。元数据研究集中在标准制定和管理,包括元数据标准、编码、规范、模型、元素、管理等方面。
(6)电子文件中心。电子文件中心是一个应用系统和文件管理平台,用于对电子文件的集中管理、存放、备份、交换、利用。电子文件中心的研究包括功能定位、管理机制、业务流程、结构模型、技术实现等方面。
(7)数字档案馆。20世纪末,深圳档案馆开始探索数字档案馆建设。2014年,国家档案局在《数字档案室建设指南》中提出了数字档案室的具体建设原则与内容,数字档案馆的建设和研究进入快速发展阶段。数字档案馆的目标是把传统的纸质档案、音频、视频等传统载体存储的信息数字化,实现档案的永久存储、共享和快速利用。研究集中在理论分析、标准研究、数字资源建设、安全保护、模型设计、体系构建、系统建设等方面。
(8)电子档案的长期保存、凭证性。电子档案因内容与载体分离,具有易篡改性。如何在电子档案的长期保存中,保证电子档案的真实有效,是实际管理中的重点。长期保存的研究宏观上包括政策研究、标准制定、机制研究;微观上包括备份策略、防篡改技术应用等方面。
四、未来发展趋势分析
通过Citespace对CSSCI数据库电子档案主题论文进行关键词分析,对聚类分析得到的所有关键词,选取count>4和year=2019年的数据得到表2的结果。
从表格数据分析可知,电子档案管理、长期保存、元数据、管理系统和风险管理是十几年来的持续重点热点。而2019年开始的大幅出现的三个关键词:区块链、真实性、单轨制,则是前沿热点,值得研究者重点关注。
1.区块链
区块链本质上是一个分布式记账本,它融合了密码学、概率论、共识机制和分布式网络等多种技术,特点是去中心化、防篡改、信息可追溯,在电子档案真实性和长期保存方面具有优势。
区块链采取哈希算法、智能合约等技术手段使网络中的所有节点共同维护同一个数据库,网络中任何一个节点要篡改这个数据库,都要付出巨大的代价。将电子档案存储在区块链上,保证电子档案不被篡改和删除。区块链采用非对称加密算法和数字时间戳等技术,网络中任一节点对数据库做的任何操作都会被记录,并可追溯,以此保证电子档案的安全性,实现电子档案的全生命周期管理。
区块链技术在电子档案领域的研究包括可行性分析、瓶颈、应用分析、安全保护、系统设计、展望等方面。
2.真实性
电子档案的真实性是确定该电子文件是否具有法律效力的唯一依据,对电子档案真实性的保障也是电子档案管理的关键。研究的重点在于电子档案真实性的认定和保护,包括前端控制、管理规范、技术保障等保护机制。
3.单轨制
单轨制指电子環境下文件管理的整个过程不再生成纸质文件。2016年4月,国家档案局发布《全国档案事业发展“十三五”规划纲要》,提出“有条件的部门开展电子档案单套制、单轨制管理试点”。此后,单轨制的研究论文显著增多,研究内容包括概念分析、政策研究、单轨制管理、技术手段、档案系统设计等方面。要实现单轨制,对电子档案的整个生命周期管理需规范安全,在技术实现手段上有元数据规范、数字签名、区块链等。
五、结语
随着互联网的普及和大数据的应用,电子档案已成为档案管理的重点对象,国内众多科研机构、公司开启了单轨制试点,电子档案的管理成为研究的重点。我们应当紧跟时代的变化,通过分析电子档案的研究热点和未来趋势,指导实际档案工作开展的方向。
参考文献:
[1]中华人民共和国,《中华人民共和国档案法》[Z],2020
[2]肖 明,邱小花,黄 界,李国俊,冯召辉.知识图谱工具比较研究[J].图书馆杂志,2013
[3]张文亮.关于电子档案管理的思考[J].云南档案,2008
[4]李玉峰.浅谈电子档案和纸质档案[J].档案管理,2013
[5]毕建华.电子文件档案管理系统设计与实现[D].华中科技大学,2004
[6]陶水龙,田 雷.电子档案元数据管理方案策略研究[J].档案学研究,2016
[7]肖秋会,刘劲松,汪 好.我国电子文件中心研究综述[J].档案学通讯,2011
[8]陈忠海,崔晓惠.数字档案馆信息服务研究综述[J].档案管理,2008
[9]吕筱芬.电子档案原始性、完整性、真实性的保障体系[J].中国档案,2002
[10]国家档案局,《全国档案事业发展“十三五”规划纲要》[z],2016
(作者单位:广东外语外贸大学档案馆)
基金项目:本文系广东省档案局科研项目“精细化管理视角下高校档案监督指导工作机制探究”(YDK-225-2019)的阶段性研究成果。
作者简介:赖雯(1990—),女,汉族,江西赣州人,计算机硕士研究生,研究方向:档案管理、档案信息化、数据挖掘等;
赵莉(1979—),女,汉族,安徽桐城人,档案学硕士研究生,馆员,研究方向:档案信息资源管理与开发、档案基础理论与实践等。