陈文娟
(河南财经政法大学,河南 郑州 450002)
基于CNKI的关联数据研究进展计量分析
陈文娟
(河南财经政法大学,河南 郑州 450002)
本文以CNKI中国学术期刊网络出版总库为文献来源,借助CNKI分析功能和Excel软件,针对2008-2013年我国关联数据学术研究进展,从年载文量、文献来源、著者、关键词、引文等多方面进行计量分析,从而揭示我国近年来关联数据的研究特点。
关联数据;计量分析;CNKI
关联数据概念的提出最初缘于互联网上普遍存在的信息异构、信息孤岛等问题,2006年万维网的发明者Tim Berners-Lee[1]在语义网的基础上提出发展关联数据之网的构想,并指出其核心和关键是关联数据。此后,关联数据迅速得到了图书情报界、信息界、政府机构及相关企业的广泛关注和重视,自2008年引入我国以来,国内学者对其研究热情也逐渐高涨。
2.1 数据来源与分析方法
本文以中国知网(CNKI)的中国学术期刊网络出版总库为来源,借助于CNKI数据分析和Excel统计功能,截取2008—2013年6年内有关关联数据的文献进行计量分析,以期揭示出我国关联数据研究的演变态势。具体检索策略是在“篇名”为“关联数据”,时间从2008年到2013年,在CNKI中共检索到文献153篇,去除一些会议通知、重复等错检项后,得到文献147篇。
2.2 年代分布与来源期刊分布
通过对一段时期内某主题领域的年发文量的统计分析可以了解该领域的发展态势。通过统计,2008年篇名为关联数据的文献仅有4篇,从2010年开始,关联数据的研究有了较快的发展,文献量逐年递增,到2013年论文达到58篇。我国2008—2013年关联数据的年代分布如图1所示。
图 1 关联数据文献年代分布
根据统计,刊载关联数据相关文献的来源期刊分布也相对集中,近75%的文献分布于图书情报领域的9种期刊中。其中,刊载量最多的是《现代图书情报技术》,载文21篇,其次是《图书情报工作》,载文19篇,随后依次是《中国图书馆学报》(载文10篇)、《图书馆学研究》(载文10篇)、《图书与情报》(载文6篇)等,上述几种期刊均为中文社会科学引文索引CSSCI来源期刊,反映了关联数据领域高质量的研究成果较多。根据布拉德福定律的描述,《现代图书情报技术》、《图书情报工作》是目前我国关联数据领域的核心期刊。图2显示了关联数据来源期刊的分布情况。
图 2 关联数据来源期刊分布
2.3 著者及研究机构、基金分布
伴随着关联数据研究领域著者的集中与分散的分布特点,研究机构也呈现出集中与分散的趋势。根据CNKI的统计,关联数据的学科研究队伍主要分布在中国科学院国家科学图书馆(13篇)、上海图书馆(7篇)、武汉大学(7篇)、中国农业科学院农业信息研究所(5篇)、浙江大学(5篇)。这些也是在信息界、图书情报界具有较大影响力的学术机构,具有较强的科研实力,足见关联数据这一新兴概念自引入国内以来便受到了极大的重视,成为图书情报研究领域一个新的研究阵地,相关的研究成果具有较高的学术水平和社会影响力。
2.4 关键词分析
通过对关键词及其词频的统计分析,能够揭示该领域现阶段的研究热点和发展趋势。根据CNKI统计,得出147篇关联数据论文中频次大于5的关键词共计10个,如表2所示。关联数据作为一个新兴的研究领域,在国内尚未形成清晰的脉络和学术派别。研究主题大致可概括为四个方面:关联数据的基础理论、语义网、关联数据技术、关联数据应用等。目前,对于关联数据的概念、研究进展、研究意义等基础理论所做的研究最多;语义网、数据网络作为关联数据的发展环境和发展目标,与关联数据的研究密不可分;关联数据的发展又依赖于技术的发展,RDF、知识组织、知识发现等关联数据相关技术逐渐受到关注,将成为未来关联数据的研究重点;图书馆和网络是关联数据应用的主要阵地,也是未来关联数据研究的前沿和重点。
表 2 关联数据关键词分布
2.5 引文分析
根据“H指数”理论[4],某研究领域文献中至少有N篇文献被引频次不少于N次,该领域文献的H指数就是N。通过对147篇文献进行统计,得知关联数据文献的H指数为14,这个数值并不高,进一步说明了国内关联数据的研究还处于初级阶段,学术产出还不丰富,学术影响力也有待提高。
这14篇文献中,引用频次最高的是黄永文的《关联数据在图书馆中的应用研究综述》(被引50次),其次是刘炜的《关联数据:概念、技术及应用展望》(被引46次),以及沈志宏的《关联数据及其应用现状综述》(被引42次),其余文献被引频率均在30次以下。内容主要集中在关联数据的基础理论、语义关联以及应用展望等方面。这些文献的作者大都是我国关联数据领域的核心著者,进一步体现了这些作者在关联数据领域的影响力和核心地位。
通过借助CNKI分析功能和Excel软件,对关联数据相关研究成果的统计和分析,可以看出关联数据自引入国内以来迅速引起了图书情报学界的重视,目前已经取得了一定的学术成果,涌现出了一批核心领军研究学者,但总体上还处于学科诞生起,尚未形成清晰的研究脉络和学术派别,研究内容主要体现在基础理论方面,有关技术和应用方面的研究将会是未来的研究热点和发展趋势。
[1]Berners-Lee T.Linked Data-Design Issues[EB/OL].[2014-03-14].http//www.w3c.org/DesignIssues/LinkedData.htm l.
[2]刘炜.关联数据:概念、技术及应用展望[J].大学图书馆学报,2011(2):5-12.
[3]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:191-195.
[4]Hirsch,Jorge E.An index to quantify an individual's scientific research output:PNAS,2005:102(46):16569-1657.
G353.1
A
1671-0037(2014)05-42-1.5
陈文娟(1988.3-),女,硕士,助理馆员,研究方向:信息资源管理与服务。