周 露,黄晔凯
(南京航空航天大学 档案馆,江苏 南京 210016)
基于Citespace的大数据时代档案热点研究
周 露,黄晔凯
(南京航空航天大学 档案馆,江苏 南京 210016)
文章利用知识图谱可视化软件Citespace,对2012—2017年被CNKI收录的672篇大数据时代档案学领域相关研究论文进行关键词分析,旨在对近6年研究热点进行总结,分析现阶段研究成果存在的一些问题,以期对大数据在档案学领域研究的进一步深化及发展提供借鉴。
大数据;档案;Citespace;热点
2008年nature杂志出版大数据专刊,介绍了大数据的概念、特征、组织形式和利用等[1]。根据2012年互联网络数据中心发布的《数字宇宙2020》报告,预计到2020年,全球数据总量将达到35~40 ZB,10年间将增长20倍以上。现如今,各行各业都对大数据倾入一定程度的关注,走向“大数据化”,各类期刊杂志上关于大数据的科研论文数量也是呈指数增长。在此背景下,档案人也紧跟时代发展,将大数据研究引入到档案学领域,下面就基于Citespace对近6年大数据在档案学领域的研究论文进行热点分析。
关键词是学术论文核心内容的提炼,是文章主题的高度概括,而频次高的关键词常被用来确定一个研究领域的热点问题[2]。在中国期刊全文数据库数据中以“大数据”并“档案”为关键词进行题名检索,共检索到学术论文672篇,其中包括学位论文18篇,学术会议论文21篇,报纸5篇,如图1所示,从2012年仅有一篇相关论文,截至2017年5月,据不完全统计已经有110篇相关论文,可见大数据在档案学的研究热度仍持续上升。
图1 2012—2017年大数据在档案学领域研究论文数量
1.1 关键词分析
利用陈超美博士开发的信息可视化软件CitespaceⅢ对672篇学术论文的关键词进行分析,通过高频词来确定大数据在档案学领域的主要研究方向和热点。剔除高频词和噪声词大数据(313次)、大数据时代(121次)、档案(53次)、档案工作(50词)、管理(22次),频次最高的10个关键词如表1所示。
表1 大数据在档案学领域研究论文出现频次前10的关键词
在Citespace中关键词分析得到149个节点,212条连线,设置显示出现频率大于10的节点,得到图2所示知识图谱。
图2 大数据在档案学领域研究主题知识图谱
从图2我们可以大致看到当前大数据在档案领域研究热点及相关联系,可以概括为以下几点进行讨论。
2.1 相关技术研究
王兰成等[3-4]研究了大数据知识挖掘处理中的一些技术,包括数据集成、数据存储、数据检索、语义处理与可视化数据挖掘问题进行初步分析,初步指导计算机挖掘技术在档案管理中的应用。张倩[5]则试图将物联网与大数据技术融合,提出高校档案物联网大数据处理平台的构建。田伟等[6-7]分析了大数据处理工具TRIP数据库系统,并展现了若干TRIP数据库系统档案资源处理的案例。
2.2 部分领域档案工作
这些研究学者中大部分均是高校档案工作者,如表2所示。
表2 大数据在档案学领域研究论文前10名作者单位
由表2可见,前八位均是高校档案单位,而且其中有5个是辽宁省的档案机构。张倩等[8-12]均对大数据时代高校档案资源体系信息化建设以及档案信息服务等提出思考。而谈清辉等[13-15]站在企业档案信息化角度,提出将大数据技术应用在企业档案管理与技术创新。医院信息化程度已经成为衡量综合实力的标志之一,何莹等[16-18]研究了如今大数据时代医院电子档案建设的对策。临沂市国土资源局李晓虎[19]同样提出利用大数据解决国土资源档案管理中的问题的思路。
2.3 档案管理及利用
更多的研究学者将目光聚集在利用大数据技术来管理和利用档案上面。石峻峰等[20]用文献计量学方法对国内外有关大数据时代数字档案资源管理研究成果进行分析。程结晶等[21]用SWOT分析法对大数据时代档案编研工作的内部优势、劣势与外部机会、威胁因素进行分析。吴薇等[22-24]均研究大数据技术给档案管理工作模式带来的创新性改革,包括构建大数据集群、搭建档案大数据云平台、提供档案云服务、智慧档案馆的深度挖掘大数据等。崔海莉[25]站在大数据时代数据安全角度,解读了档案信息的收集、管理、利用3方面思考档案数据采集安全、档案信息管理系统安全以及档案数据提供利用安全的问题。
王霞等[26]利用层次分析法等原理构建出基于大数据背景的档案信息资源利用评价体系,对高校档案利用服务工作具有指导意义。朱建华等[27-29]探讨了大数据时代档案利用服务的方式和发展策略,提出了综合提升馆员业务素质、构建平台整合资源、利用社交网络平台等对策。肖敏[30]提出从加强意识、队伍、资源、服务平台及信息安全建设等5个方面来构建和完善大数据时代档案利用服务体系。
近几年,大数据在档案领域的研究发展势头迅猛,但并不代表相关研究已然成熟。相反,通过对研究论文的分析,笔者认为大部分的成果还处于比较浅显的解读探索阶段,给我们带来一些的启示。
首先,档案馆信息化技术基本外包,技术研究层面非常浅显。不断地变革,注入新鲜血液,档案工作才会不断有新的活力,我们将大数据技术引入档案学领域,不能仅仅停留在概念的引入,有相关计算机基础的档案人应当深入研究,站在专业角度,探析如何将大数据与档案真正结合在一起。
其次,当前研究内容主要是对大数据时代档案馆管理利用、档案工作机遇挑战、数字档案馆建设等方面进行探讨,涉及内容虽然广但还是泛泛而谈。很多论文只是反复讨论大数据概念,存在着不同程度的概念泛化、夸大与误读。
最后,很多研究其实还是停留在数字化的阶段,只是在理论上扣上了大数据这顶帽子而已,在国内档案馆内并没有付诸实践,而且短期内档案馆也难以真正实现大数据化。我们应当在做好传统工作的基础上,加快数字化的进程,在数字化的过程中,拓展适合自己新的发展路径。
[1]Nature.Big data[EB/OL].[2014-02-18](2017-08-30).http://www.nature.com/news/specials/bigdata.
[2]张凌.基于CiteSpace的竞争情报研究的可视化分析[J].图书情报工作网刊,2011(10):1-8.
[3]王兰成,刘晓亮.网上数字档案大数据分析中的知识挖掘技术研究[J].浙江档案,2013(10):14-19.
[4]陈小莉.基于大数据的计算机数据挖掘技术在档案管理系统中的研究应用[J].激光杂志,2017(2):142-145.
[5]张倩.高校档案物联网大数据处理平台的构建方案研究[J].档案与建设,2016(2):39-43.
[6]田伟,韩海涛.基于TRIP数据库系统的大数据档案资源处理[J].浙江档案,2015(7):16-18.
[7]田伟,韩海涛.一种基于非关系型数据库的大数据档案资源处理策略[J].兰台世界,2015(9):21-22.
[8]张倩.“大数据技术”在高校档案信息服务中的应用探索[J].档案与建设,2014(3):27-31.
[9]周美兰.大数据时代高校档案资源体系建设的思考[J].山西档案,2015(1):68-71.
[10]陈明九.大数据时代高校档案管理系统建设研究—以山东建筑大学为例[J].山东建筑大学学报,2015(5):506-510.
[11]王莉娜,程鹏.大数据环境下高校人事档案的管理与利用[J].兰台世界,2017(3):40-42.
[12]金波,蔡敏芳.大数据时代档案学专业高等教育的变革与创新[J].档案学研究,2016(6):12-17.
[13]谈清辉.国有企业科技档案检索方法提升与大数据管理探究[J].档案学研究,2014(5):60-63.
[14]王毅,赵淑梅.国有企业技术创新与档案大数据管理安全战略研究[J].档案学通讯,2014(2):63-67.
[15]邱世魁,陈玉朕.大数据,企业档案信息系统的技术架构[J].中国档案,2013(10):69-71.
[16]何莹.大数据条件下医院电子档案管理研究[D].秦皇岛:燕山大学,2015.
[17]李妙蓉.谈大数据时代的医院档案管理[J].黑龙江档案,2017(1):97.
[18]张涛.杨茜.大数据背景下医院档案管理的创新探讨[J].山东档案,2017(2):54-56.
[19]李晓虎.大数据时代的国土资源档案创新管理探析[J].兰台世界,2017(4):53-55.
[20]石峻峰,周俐霞,付双双.大数据时代数字档案资源管理研究现状与趋势分析[J].信息安全与通信保密,2014(9):87-93.
[21]程结晶,周咪咪,王齐,大数据时代档案编研的SWOT分析[J].档案学通讯,2015(5):58-62.
[22]吴薇.大数据时代下档案管理机制与模式创新[J].兰台世界,2016(10):4-5.
[23]吴曼丽.大数据时代下档案管理创新策略研究[J].兰台世界,2016(10):92.
[24]李小晨.大数据时代背景下的档案管理探讨[J].云南档案,2013(6):48-50.
[25]崔海莉.“大数据”时代档案信息安全管理新思考[J].档案学研究,2015(1):93-96.
[26]王霞,祝彩凤.大数据背景下的档案信息资源利用评价体系研究[J].兰台世界,2017(5):54-56.
[27]朱建华.面向大数据的档案信息资源服务与利用[J].信息与电脑,2014(8):46-47.
[28]金丹.大数据时代的档案利用服务工作研究[J]兰台世界,2015(7):111-112.
[29]阎晓峰.大数据与档案资源开发利用[J].中国档案,2015(11):16-19.
[30]肖敏.大数据环境下档案利用服务体系建设研究[D].湘潭:湘潭大学,2015.
Study on the archives of Citespace big data era based on hot spot
Zhou Lu, Huang Yekai
(Archive Department of Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
This paper takes advantage of the knowledge visualization software Citespace to analyze the key words of 672 papers related to archival studies in the era of big data collected by CNKI, which is aim to summarize the research hot spots in the past 6 years and analyze the existing problems of research results at this stage, so as to provide reference for further research and development of archival data in the fi eld of archival science.
big data; archives; Citespace; hot spots
中央高校基本科研业务费专项资金;项目编号:NR2016034。
周露(1988— ),女,江苏东台,硕士研究生,馆员;研究方向:数字档案馆。