我国档案大数据研究论文的计量学分析

2017-07-01 17:12慕容慧
关键词:发文论文期刊

慕容慧

(广东肇庆学院人事处,广东肇庆526061)

我国档案大数据研究论文的计量学分析

慕容慧

(广东肇庆学院人事处,广东肇庆526061)

本文运用文献计量学的相关知识,总结了2013年—2017年3月我国档案大数据研究论文的时间分布、期刊分布、机构分布、作者分布、关键词频分布、主题分布及合著情况,揭示了近几年档案大数据的整体研究状况和特点,并对其未来研究发展趋势进行了分析。

档案大数据;文献计量学;统计;分析

大数据是海量数据的代名词,是一种宏观的、综合性的概念,是对潜藏巨大价值、类型多样并且可被快速处理应用的巨量信息的一种描述。[1]目前,大数据技术在社会各领域全面渗透、已被广泛应用,并引起一系列社会变革,人类已经迈入大数据时代。我国关于大数据的理论成果从2011年开始增多,但是档案学术界对于大数据在档案领域的应用与研究起步较晚,文献研究成果直到2013年才开始逐渐出现。档案业务在大数据时代背景下,所产生的动态变化和发展必将受到档案工作者的共同关注。

一、研究对象与研究方法

以档案大数据为研究对象,通过对中国知网“中国期刊全文数据库”进行检索,在主题项输入“档案大数据”,检索年限为2013年—2017年3月,检索文献52篇。排除汇编及一稿多投各一篇,最后得50篇。对这些文献的发表时间、主题、作者、关键词等数据信息进行统计分析,从科学量化的角度探索档案大数据的文献情报规律,对档案大数据的研究现状和发展趋势进行宏观了解。

二、数据统计与分析

(一)发表时间与年度分布

分析论文发表的时间可以了解科研对象在时间序列方面的发展速度和受关注程度。对2013年至2017年3月档案大数据的论文数量做分析,有助于揭示档案学界对大数据研究进展的总体趋势。2013年至2017年3月我国档案大数据研究性论文的发表时间及年度分布情况具体见表1:

表1 论文的时间及数量分布

表1显示出2013年至2016年论文数量呈现上升趋势。其中,2013年至2015年,论文数量小幅增长,文献量趋于稳定;2016年文献数量达到统计期的最大峰值(20篇),2017年刊发的论文数量稀少,与当年被统计时间不长有一定关系。从总体趋势判断,档案大数据已经引起档案学界的注意,相关研究正在逐步深入,2017年的文献量有望持续稳定。

(二)载文期刊分布

学术期刊是科研工作者进行学术探讨、合作交流的平台,统计论文的期刊分布是总结学术期刊的学术取向,获取其研究重要性的重要方法。

表2 论文的期刊分布

表2是2013年—2017年3月的档案大数据论文在各期刊上的分布情况,50篇论文共刊登在32种期刊上。依布拉德福定律将上述32种期刊按载文数量n>3、1<n<4、n=1划分成核心区、相关区和非相关区,三区载文量依次是9,18,23,三区所含期刊数依次是:1,8,23,与布拉德福定律提出的核心区与后继各区所含的期刊数成1∶a∶a2(a为布氏系数,a=5)的比例基本吻合。

表3是论文在不同类型期刊上的分布情况。32种刊物中档案学核心刊物有8种,共发文15篇。档案类普通期刊7种,共发文16篇。这两种期刊上发表的论文,占发表论文总数的62%,说明档案专业刊物对档案大数据的研究给予了足够重视,科研产出水平比较高。档案学以外的其他学术期刊有17种,共发文19篇,占发表论文总数的38%。

表3 论文在不同类型期分布

(三)作者分布

1.核心作者分析

核心作者是指某一学科研究中造诣较深,发表论文较多,获得科研成果较多的学科带头人。[2]核心作者群由核心作者集合而成。核心作者群对科研工作有导向作用,能够进一步把学科研究推至新的高度。

表4 论文的作者分布

表4是2013年—2017年3月档案大数据论文的作者分布情况。对这一时期发表档案大数据论文的作者进行统计分析,可以了解档案大数据学术领域主要研究者及主要作者群的研究动态,进而推测他们的研究方向。普赖斯定律[3]指出,核心作者发文量应占论文总量的50%,核心作者最低发文量为N≌0.749(其中ηmax为最高产量作者的论文数)。据表4可知ηmax为2篇,N取最大邻近整数为2篇,发文2篇以上的核心作者有5人,占作者总数的11%,他们一共发表论文10篇,占论文总量的20%。由于数据与普赖斯定律“10%的作者发文量占发文总量的50%”的指标相距甚远,说明档案大数据研究的核心作者群未能有效形成,他们的研究对其他作者的影响力有限。

2.论文的作者合著分析

合著情况体现了学科综合水平和研究的难易程度。邱均平对作者合作的情况提出了两种指标:(1)合作度=(一定时期内相关文献的)作者总人次/(一定时期内相关文献的)论文总数;(2)合作率=(一定时期内相关文献的)合作论文数/(一定时期内相关文献的)论文总数。指标数值越高,合作智能发挥越充分。[4]

表5 论文作者合著分析

表5给出了论文作者合著分析数据。整体而言,档案大数据论文的合著度与合著率偏低,说明过去档案大数据领域以独立研究为主,与其他领域交叉不足,未来应该加强不同专业人员的共同深入研究,确保档案大数据研究全面、合理发展。

(四)发文机构统计分析

统计论文第一作者机构可以揭示不同系统的科研人员的学术水平与科研能力,掌握专业人才的分布情况。从图1可知,50篇论文的发文机构大致可以分为四类:档案馆(局)、高等院校其他机构、高等院校档案馆、其他社会机构。其中高等院校发文量最多,总共26篇(含其他机构20篇,档案馆6篇),占总发文量52%。此外,5位核心作者中有3位来自高等院校的档案馆及其他机构:张倩(南京艺术学院综合档案室)、李彦(湖南师范大学档案馆)、黄桂新(中山大学附属第一医院),说明高等院校是档案大数据科研成果的高发地,在该研究领域发挥了学术带头作用。其他社会机构发文量及占总发文百分比排名第二,说明档案大数据正以积极主动的姿态跨越学科专业和行业领域的界限,受到不同社会机构的共同关注。地方档案馆(局)发文量较少,说明对档案大数据的研究关注度不高,研究力度有待加大。

图1 论文发文机构分布图

(五)论文的主题分布

2013年至2017年3月档案大数据论文的研究主题分为5个方向。从表6可以看出,档案大数据的论文里面,主题排前三位的是“档案工作的现状与发展”、档案大数据建设、档案大数据的基础理论,分别占发文总数的44%、13%、9%。说明研究人员不仅介绍与分析档案大数据的基本理念,更注重研究档案大数据对现行档案工作的影响,以及如何优化现有的档案资源、平台和体系,达到建设档案大数据的目的。档案大数据挖掘与应用(包括档案大数据的利用及档案大数据与公共服务的关系)的论文占发文总数的10%,说明学者有意超越陕隘的基础理论研究,努力破解档案大数据在大数据时代中产生的实践难题。

表6 论文的主题分布

图2直观地反映了档案大数据论文各主题的研究发展过程和研究趋势:档案工作的现状与发展呈折线向上的发展态势,说明在将来一定时间内,档案大数据对档案工作的影响这一方面的研究还将会继续深入。档案大数据建设、档案大数据的挖掘与应用这两个主题呈折线向下的态势,说明作者对这两个主题的研究力度不够,缺少新颖的研究成果。档案大数据基础理论方面的研究则给人们留下了较多的深入空间。

图2 论文主题的年度分布图

(六)关键词频统计

关键词是作者对论文内容的高度提炼和概括描述,高频关键词经常被用于分析学科领域的研究热点。表7对2013年至2017年3月档案大数据论文的关键词进行了统计。

表7 论文关键词频统计

从表7可以看出:(1)大数据、档案大数据2个关键词出现的频次较高,说明这两个是档案大数据研究的基础词汇;(2)档案、数据化、高校、信息化等出现的频次仅次于档案出现的频次,说明档案大数据与档案的关系,以及如何把档案大数据进行数据化、信息化,也是人们的关注重点;(3)档案管理、公布式文件系统、档案工作、云桌面技术等关键词数次出现,这些方面的内容已经引起了人们的关注;(4)隐私保护、大数据分析方法、挖掘利用等研究有待进一步拓展与深入。

三、档案大数据研究的不足及发展趋势展望

纵观档案大数据论文,发现该领域研究存在以下问题:起步较晚,相关研究偏于表象,不够深入;重复介绍基本理念;在档案大数据对档案工作的影响的研究中,创新观点不多;对国外和港台的档案大数据实践应用方面的介绍和借鉴较少。

结合大数据时代的发展现状,对档案大数据的研究趋势作如下展望:(1)档案大数据是档案事业应对大数据时代信息技术迅猛发展的必然选择,是不容忽视的重要课题。(2)随着档案大数据研究的不断深入和发展,其理论归纳在深度和广度方面也会随之不断扩展。(3)档案大数据的概念框架与档案信息化、数字化存在不同,这种对比研究以及它对我国档案工作的影响会进一步深入。(4)在未来的研究中,将档案大数据的概念应用于档案资源的组织、管理,进一步开发相应平台,加强规范控制,完善档案大数据功能等实践应用的方面会不可避免地遇到障碍,寻求有效的解决方法并且加以完善会成为另一个关注点。

四、结语

档案大数据的研究论文是档案事业人员和学者对大数据领域已有知识进行归纳和总结,在分析前人研究成果的基础上,对未来研究方向做出的预测和指引,在一定程度上反映了该学科研究的发展水平。

本文运用多样化的文献计量工具,从时间分布、期刊分布、机构分布等七个方面对中国知网“中国期刊全文数据库”收录的50篇档案大数据研究论文的结构特征进行统计分析,从中发现,我国档案大数据研究论文在期刊分布、作者分布、主题层次上已经取得一定的进展,但是仍然存在发文量不多、论文合作率不高、相关主题研究较少等问题,还需要更多的研究论文来进行反思和总结,从而提升档案大数据研究的质量及其在实际工作中的应用水平。档案大数据建设赋予档案工作崭新的内容,面对大数据时代的机遇和挑战,档案工作者要适应档案大数据建设的需要,开创档案工作新局面。

[1]樊树娟.大数据时代档案职业改革与发展研究[D].山东:山东大学,2015:66.

[2]袁小翠.2005年—2011年我国档案信息化研究文献计量分析[J].档案管理,2011(6):61.

[3]罗式胜.文献计量学概论[M].广州:中山大学出版社,1994:309-310.

[4]张恺.2001—2010年我国档案学核心期刊综述类文献的计量分析[J].档案学通讯,2011(5):19.

(责任编辑:刘岭峰2572756826@qq.com)

A Bibliometric Analysis of Research Papers on Archival Large Data in China

MURong-hui
(Personnel Division,ZhaoqingUniversity,Zhaoqing526061,China)

In this paper,researches on archival large data,from 2013 to March 2017,are summarized and analyzed through bibliometrics,which contains the distribution of the time,journals,authors,cooperation, organizations,subjects and the frequency of key words.This paper also reveals researching status and characteristics of archival large data in recent years,and analyzes the research trend in the future.

archival large data;bibliometrics;statistics;analysis

G272.6

A

1008-018X(2017)03-0086-06

2017-03-23

慕容慧(1976-),女,广东肇庆人,广东肇庆学院档案馆员。

猜你喜欢
发文论文期刊
期刊更名启事
期刊简介
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
期刊问答
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文
期待您的加入