胡泽文 刘硕 冯睿 张小菜
〔摘要〕基于Web of Science數据库,以中美英图书情报学领域1990-1994年和2010-2014年期间文献的施引文献为样本,计量分析了:1)美国在1990-1994年和2010-2014年期间的施引文献特征:国别、机构、来源期刊、开源、类型和语言及其之间的差异;2)中美英2010-2014年期间图书情报学领域的施引文献特征及其之间的差异,揭示出中美英3国1990-1994年和2010-2014年期间图书情报学领域的施引特征分布情况及科学交流概况。研究发现:1)1990-2015年美国的年均发文数量是中国年均发文数量的24倍;2)中美英图书情报学领域的主要施引国家基本一致;3)美英图书情报学领域新时期(2010-2014)的主要施引机构中,出现香港城市大学、中国科学院大学和武汉大学等中国大学的身影;4)美国图书情报学领域施引文献的开源程度最高,比例达到1073%;5)中美英3国图书情报学领域的主要施引文献类型基本一致,全部为论文、会议论文、综述、专著和社论材料,且论文和会议论文的占比均在91%以上。
〔关键词〕图书情报学;施引文献;特征;国别;语言;计量分析
DOI:10.3969/j.issn.1008-0821.2018.11.017
〔中图分类号〕G250252〔文献标识码〕A〔文章编号〕1008-0821(2018)11-0095-10
Quantitative Analysis of the Characteristics of Citing Literatures from
Library and Information Science DisciplineHu ZewenLiu ShuoFeng RuiZhang Xiaocai
(School of Management and Engineering,Nanjing University of Information Science and Technology,
Nanjing 210044,China)
〔Abstract〕Based on the Web of Science database,the citing literatures of the Chinese,American and British literatures in two different periods:1990-1994 and 2010-2014 from Library and Information Science discipline were used as samples to analyze:(1)the characteristics of the American citing literatures in two different periods,including country,institution,source journal,open source,type and language,as well as the differences among them;(2)the characteristics of citing literatures during 2010-2014 from China,the United States and the United Kingdom,as well as the differences among three countries,thus revealing the map for the distribution of citing characteristics and the scientific exchanges among three countries.This study found that:(1)the average number of articles published in the United States in 1990-2015 was 24 times that of the average number of articles published in China;(2)the major citing countries in Library and Information Science in China,the United States,and the United Kingdom were basically consistent;(3)Chinese universities such as City University of Hong Kong,University of Chinese Academy of Sciences and Wuhan University became the major citing institutions of the United States and the United Kingdom in new period(2010-2014);(4)The open source degree of citing literatures in library and Information Science in the United States was the highest,with a ratio of 1073%;(5)The major types of citing literatures in library and information science in China,the United States and the United Kingdom were basically the same,all of which were papers,conference papers,reviews,monographs and editorial materials,and the proportion of papers and conference papers was above 91%.
〔Key words〕library and information science;citing literature;feature;country;language;bibliometrics
文献计量分析是目前图书情报学领域最活跃的研究方向之一,在期刊评价、科研效绩评价、图书馆文献资源配置和信息服务、科技管理以及学科建设等领域得到越来越广泛的应用。论文的引文分布和特征分析是文献计量学领域的核心问题[1],1963年,Eugene Garfield创建了科学引文索引SCI,掀起了引文分析(Citation Analysis)的新篇章[2]。随后围绕着引文网络、共被引分析、自引、影响因子和新理论等主题,“文献耦合”[3]、“科学引文网络”[4]、“同被引”[5]、“引文可视化”[6]、“睡美人”[7]等概念相继被提出。
引文分析是一种广泛使用的过滤科学信息的方法[8],许多作品试图通过分析引用语境来揭示其研究领域隐藏的知识结构,An J等人分析了高被引作者的特征,发现跨部门引文的分布是有偏差的,根据引用位置的不同,一组不同的高被引作者具有不同的学术特征[9]。Kolle S R等揭示了1991-2015年期间疟疾研究中高被引文章的文献计量特征,包括期刊、引用次数、作者数[10]。Martín-Martín A等人分析了Google学术搜索中高度引用文档集的核心特征:文档类型、语言、免费可用性、来源和版本数量[11]。Tsay M Y等通过引文分析探讨文献期刊(JOD)的期刊文献计量特征以及与其他学科之间的主题关系[12]。一篇好的原创论文对后续研究能起到参考和推动作用,甚至能孕育出一个新的学科,并且每年都有一定的被引次数,论文被引频次越多,论文的影响力就越大。利用被引频次评价单篇论文和期刊正在受到关注[13]。目前国内外学者已经从文献类型[14]、语言[14]、国别[14,20]、标题[15]、参考文献[16,19]、作者[17-18]、期刊[17-18,20]、年份[18]、基金[18,20]、关键词[18,21]等方面计量分析了高被引、零被引[22-25]等各类文献的特征及其之间的差异。
目前国内外相关文献主要从文献自身及其引用数量、高被引和零被引的角度计量分析各类文献自身特征(如期刊、类型、语言、国别、标题和作者等特征)和引用高低的影响因素。然而从文献施引的角度来计量分析施引文献的特征及其之间差异的研究甚少。论文被引频次是指自论文公开发表或公开发布以来被其他论文引用的次数,这里的其他论文便是施引文献。施引文献特征分析可以全面考察一个国家、机构和学科文献被哪些国家、机构、学科、语种和类型文献引用,从而展示不同主体之间的科学文化交流、引用特征及模式。为全面分析施引文献的特征,本文基于Web of Science数据库,以中美英图书情报学领域1990-1994年和2010-2014年期间文献的施引文献为样本,计量分析了美国在1990-1994年和2010-2014年期间的施引文献特征,以及中美英2010-2014年期间图书情报学领域的施引文献特征及其之间的差异。通常,论文的施引数量受其发表时间的影响,发表的文章越新,其施引数量相对越低。基于此考虑,本研究以发表时间距今3年以上的论文作为研究对象,对图书情报学领域文献的施引文献特征进行计量分析。
2018年11月第38卷第11期现代情报Journal of Modern InformationNov.,2018Vol38No112018年11月第38卷第11期图书情报学领域施引文献特征的计量分析Nov.,2018Vol38No111数据来源与研究方法
11数据来源与处理
在Web of Science数据库中,首先按照1990-2014年代区间—学科—国家的检索路径,获取到中美英3国的图书情报学领域文献数据,然后通过引用分析,获取美国图书情报学领域1990-1994年和2010-2014年期间发表文献的施引文献数据,以及中美英2010-2014年期间发表文献的施引文献数据。在数据处理过程中,将英国的4个领土:England,Scotland,Wales和North Ireland合并到一起,将中国的3个领土:中国大陆、中国香港和中国台湾地区合并到一起;同一国家或机构不同写法合并。中美图书情报学领域1990-2015年发表文献数量的年度变化情况,如表1所示。
12研究方法和内容
首先基于美国图书情报学领域1990-1994年期间和2010-2014年期间49 000篇文献的124 073篇施引文献,以及中美英图书情报学领域2010-2014年期间33 317篇文献的101 520篇施引文献(中国13 817篇,美国70 545篇和英国17 158篇),析出施引文献的不同特征,包括施引国别、机构、来源期刊、是否开源、文献类型和语言等。然后计量分析和比较了:1)美国图书情报学领域1990-1994年和2010-2014年两个周期施引文献的计量特征及其之间的差異;2)中美英图书情报学领域2010-2014年期间的施引文献的计量特征及其国别差异。
2结果分析
21美国图书情报学领域不同周期文献的施引文献特征分析从国别、机构、来源期刊、是否开源、文献类型和语言几个维度分别计量分析了美国图书情报学领域1990-1994年和2010-2014年期间的施引文献特征及其之间的差异。
211国别分布
对比分析了美国情报学领域1990-1994年和2010-2014年两个周期文献的Top15施引国别,如表2所示。
212机构分布
美国情报学领域1990-1994年和2010-2014年两个周期文献Top15施引机构的对比分析结果,如表3所示。表3Top15施引机构分布
1990-19942010-2014机构施引
数量机构施引
数量印第安纳大学659哈佛大学1 895伊利诺伊大学594印第安纳大学916威斯康星大学559威斯康星大学834北卡罗来纳大学556密歇根大学806宾夕法尼亚州立大学456伊利诺伊大学805德克萨斯大学452华盛顿大学791马里兰大学437北卡罗来纳大学787佐治亚州立大学434范德堡大学725新加坡国立大学413香港城市大学622匹兹堡大学398德克萨斯大学奥斯汀分校613亚利桑那大学377马里兰大学601香港城市大学364美国西北大学579罗格斯大学354哥伦比亚大学567华盛顿大学328武汉大学564科罗拉多大学326亚利桑那州立大学559
由表3可知,美国2010-2014年图书情报学领域文献主要施引机构的施引数量与1990-1994年相比有明显增长。1990-1994年和2010-2014年两个不同时期美国图书情报学领域主要施引机构的名称和排名变化较大。与1990-1994年期间相比,2010-2014年期间的Top15施引机构名单变化较大,出现很多不同的施引机构,如:哈佛大学、密歇根大学、范德堡大学、哥伦比亚大学、等等,其中,哈佛大学的施引数量变化最大,从1990-1994年期间不到252次施引,急剧增长到2010-2014年期间的1 895次施引。此外,香港城市大学的施引数量增幅较大,武汉大学首次出现在新时期(2010-2014)的Top15施引机构中,说明随着时代的发展,中美图情领域的科学研究交流越来越密切。1990-1994年期间的主要施引机构为印第安纳大学、伊利诺伊大学和威斯康星大学,而2010-2014年期间的主要施引机构为哈佛大学、印第安纳大学和威斯康星大学。
213来源期刊分布
选取美国图书情报学领域施引文献的Top10施引期刊进行计量分析,可以得到表4。
214是否开源分布
美国图书情报学领域施引文献是否开源特征的计量分析结果,如表5所示。
由表5可知,与1990-1994年期间相比,美国新时期(2010-2014)图书情报学领域施引文献的开源程度更高,开源的施引数量是1990-1994年期间的3倍多,占整体施引文献数量的比例更高,达到1074%。
215文献类型分布
美国图书情报学领域施引文献类型的分布情况,如表6所示。
由表6可知,美国1990-1994年和2010-2014年期间图书情报学领域的主要施引文献类型基本一致,施引数量排名前6的文献类型均为论文、会议论文、综述、专著、社论材料和图书,除会议论文的施引数量变化较少外,新时期(2010-2014)论文、综述和社论材料施引显著增长,而会议论文施引显著减少。其中论文的施引数量增长最多,达到1倍以上。
216语言分布
美国图书情报学领域文献的施引语言类型分布情况,如表7所示。
22中美英图书情报学领域2010-2014年期间施引文献特征的比较分析221国别分布
中美英图书情报学领域2010-2014年期间文献Top15施引国家的计量分析结果,如表8所示。
由表8可知:1)中美英图书情报学领域2010-2014年期间文献的主要施引国家中,排名前4位的施引国家名称保持一致,分别为中国、美国、英国和澳大利亚,说明稳居施引前4位的国家对图书情报学领域的关注和研究保持领先地位;2)中美英3国施引数量最多的国家均为自身;3)中美英3国排名第二的施引国家有所差异,中国的第二施引国是美国,美国的第二施引国是中国,而英国的第二施引国是美国。
222机构分布
选取中美英3国图书情报学领域施引数量排名Top15的施引机构,进行对比分析,得到表9。
从表9中可以看出,相对施引国家的分布来说,施引机构数量的分布更加松散,表现为机构数量多、施引数量少。此外,中美英图书情报学领域主要施引机构名单之间的差异较大,具体表现为以下几点:1)美國图书情报学领域Top15施引机构的施引数量整体高于中国和英国,其中,哈佛大学包含3家下属机构,施引数量为1 895篇,排名第1。2)中美英3国图书情报学领域文献的Top15施引机构均为大学。中国图书情报学领域文献的Top15施引机构中有13家为中国高校,中国科学院大学位居施引第1位;美国的Top15机构中有13家为美国大学,哈佛大学位
居施引机构第1位,另2家为中国高校;英国Top15施引机构有9家为英国大学,胡弗汉顿大学位居施引机构第1位。3)中美英3国图书情报学领域的主要施引机构中,以本国机构为主,国外机构相对较少,英国施引机构的国家分布相对多元化。例如,中国Top15施引机构中,仅有1家马来西亚高校和1家西班牙高校;美国的Top15施引机构中未出现英国大学,反而出现2家中国大学,分别为香港城市大学和武汉大学。而英国Top15施引机构中,出现2家中国大学,2家美国大学,1家荷兰大学和1家西班牙大学,其中,2家中国大学——中国科学院大学和武汉大学位居英国施引机构的第五名和第八名。4)中国图书情报学领域高校的国际科学交流方面,中国科学院大学、武汉大学和香港城市大学为中国情报学的领头机构,很注重学习和借鉴国外先进的图书情报学研究成果,施引美国和英国文献的数量位居前列。
223来源期刊分布
中美英3国图书情报学领域文献的施引文献数量Top15来源期刊的计量分析结果,如表10所示。
224是否开源分布
中美英3国图书情报学领域施引文献的开源分布情况,如表11所示。表11开源情况
国家开源数量不开源数量开源比例(%)中国1 31812 499954美国7 31160 8021073英国1 74715 4111018
由表11可知,美国图书情报学领域施引文献的开源程度最高,比例达到1073%,英国次之,中国最低。“人的行为是政策的产物”,政策对于开放获取的导向作用十分重要[26],很多科研大国,例如美国和英国,都颁布政策要求研究人员将科研成果开放获取,以此来推动科研成果的传播。
225文献类型分布
中美英3国图书情报学领域施引文献的主要类型分布情况,如表12所示。
226语言分布
中美英3国图书情报学领域施引文献的主要施引语言类型分布情况,如表13所示。
3结语
本文基于中美英1990-2014年期间文献的施引文献数据,计量分析和比较了美国图书情报学领域1990-1994年和2010-2014年两个周期的施引文献特征,以及中美英图书情报学领域2010-2014年期间的施引文献特征及其之间的差异,主要得出以下几点结论:
31成果规模方面
美国图书情报学领域的研究兴起于1990年,远早于中国的2007年,1990-2015年美国的年均发文数量是中国年均发文数量的24倍,美国图书情报学领域文献研究的规模和水平远远高于中国。
32施引国别方面
美国1990-1994年和2010-2014年期间排名前3的施引国家均为美国、中国和英国。然而1990-1994年期间主要施引国家为新加坡和日本,在2010-2014年期间未出现Top15施引国家名单。中美英图书情报学领域2010-2014年期间排名前4位的施引国家基本一致,均为中国、美国、英国和澳大利亚,稳居施引前4位的国家对图书情报学领域的关注和研究处于领先地位。此外,中国的第二施引国是美国,美国的第二施引国是中国,而英国的第二施引国是美国。
33施引机构方面
1990-1994年和2010-2014年两个不同时期美国图书情报学领域主要施引机构的名称和排名变化较大。与1990-1994年期间相比,2010-2014年期间的Top15施引机构名单变化较大,出现很多不同的施引机构,如:哈佛大学、密歇根大学、范德堡大学、哥伦比亚大学等。有趣的是,中国的武汉大学首次出现在新时期(2010-2014)的美国Top15施引机构中,说明随着时代的发展,中美图情领域的科学研究交流越来越密切。2010-2014年期间中美英图书情报学领域Top15施引机构均为大学,然而3个国家主要施引机构名单之间的差异较大。中美图书情报学领域的主要施引机构中,以本国机构为主,国外机构相对较少,而英国施引机构的国家分布相对多元化。此外,中国图书情报学领域高校的国际科学交流方面,中国科学院大学、武汉大学和香港城市大学为中国情报学的领头机构,很注重学习和借鉴国外先进的图书情报学研究成果,施引美国和英国文献的数量位居前列。
34施引期刊方面
根据对中美英图书情报学领域2010-2014年期间施引文献期刊的比较分析,发现:中国图书情报学领域文献的施引期刊主要为图书情报学和人机交互行为等方面的期刊;美国图书情报学领域文献的施引期刊主要为医学信息计量、科学计量和人机交互行为等方面的期刊;英国图书情报学领域文献的主要施引期刊为图书情报等方面的期刊。
35是否开源方面
与1990-1994年期间相比,美国新时期(2010-2014)图书情报学领域施引文献的开源程度更高,开源的施引文献数量是1990-1994年期间的3倍多,占整体施引文献数量的比例更高,达到1074%。从中美英图书情报学领域2010-2014年期间施引文献开源情况的比较分析结果来看,美国图书情报学领域施引文献的开源程度最高,比例达到1073%,英国次之,中国最低。
36施引文献类型方面
美国1990-1994年和2010-2014年期间图书情报学领域的主要施引文献类型基本一致,施引数量排名前6的文献类型均为论文、会议论文、综述、专著、社论材料和图书,新时期(2010-2014)论文、综述、专著、社论材料和图书的施引数量显著增長,而会议论文的施引数量显著减少。中美英3国图书情报学领域的Top6施引文献类型基本一致,全部为论文、会议论文、综述、专著、社论材料和图书,且论文和会议论文的占比均在91%以上。
37施引语言方面
美国1990-1994年和2010-2014年图书情报学领域施引文献使用的语言主要为英语,比例达到95%以上,其次为西班牙语、德语和葡萄牙语。1990-1994年期间中文施引文献数量35篇,占比007%,而新时期中文施引文献数量18篇,占比为003%。中美英图书情报学领域的第一施引语言全部为英语,第二和第三施引语言全部是西班牙语和葡萄牙语。中国图书情报学领域的中文施引文献数量是17篇,排名第4;美国的中文施引文献数量是18篇,排名第8;英国的中文施引文献数量是4篇,排名第9。
综上,通过分析中美英3国在Web of Science数据库中的图书情报学领域施引文献数据,全面分析了中美英3国图书情报学领域的施引文献特征,全面展示了施引者和被施引者不同主体之间的科学文化交流、引用特征及模式。由于本研究仅基于Web of Science单个数据库的图书情报学领域数据,研究结果可能并不全面,如果能综合Web of Science、Scopus、微软学术、谷歌学术等数据库的不同学科施引文献数据,进行对比分析,结果将更有说服力,这也将是本研究后续的研究方向。
参考文献
[1]梁春慧,孙艳,万跃华.高被引论文的参考文献特征研究——以化学领域为例的实证分析[J].科技与出版,2014,(7):119-122.
[2]胡惠芳,万跃华.SCI、SSCI收录的图书情报学学科期刊评价指标[J].大学图书馆学报,2001,19(4):62-64.
[3]Kessler M M.Bibliographic Coupling Between Scientific Papers[J].American Documentation,1963,14(1):10-25.
[4]Price D.Networks of Scientific Papers[J].Science,1965,149(3683):510-515.
[5]Smal H.Co-citation in the Scientific Literature:A New Measure of the Relationship Between Two Documents[J].Journal of the American Society for Information Science,1973:265-269.
[6]White H D,Griffith B C.Author Co-citation:A literaturemeasure of Intellectual Structure[J].Journal of the American Society for Information Science,1981,32(2):163-172.
[7]Anthony V R.Sleeping Beauties in Science[J].Scinentometrics,2004,59(3):461-466.
[8]Stringer M J,Sales-Pardo M,Amaral L A N.Statistical Validation of a Global Model for the Distribution of the Ultimate Number of Citations Accrued by Papers Published in a Scientific Journal[J].Journal of the American Society for Information Science and Technology,2010,61(7),1377-1385.
[9]An J,Kim N,Kan M Y,Chandrasekaran M K,Song M.Exploring Characteristics of Highly Cited Authors According to Citation Location and Content[J].Journal of the Association for Information Science and Technology,2017,68(8),1975-1988.
[10]Kolle S R,Vijayashree M S,Shankarappa T H.Highly Cited Articles in Malaria Research:A Bibliometric Analysis[J].Collection Building,2017,36(2),45-57.
[11]Martín-Martín A,Orduna-Malea E,Ayllón J M,López-Cózar E D.A Two-sided Academic Landscape:Portrait of Highly-cited Documents in Google Scholar(1950-2013).arXiv Preprint arXiv:1607.02861,2016.
[12]Tsay M Y,Shu Z Y.Journal Bibliometric Analysis:A Case Study on the Journal of Documentation[J].Journal of Documentation,2011,67(5),806-822.
[13]张建合,王荣珍.我国师范类自然科学学报高被引论文分析[J].中国科技期刊研究,2008,19(3):394-397.
[14]Tsay M Y.A Bibliometric Analysis of Hydrogen Energy Literature,1965-2005[J].Scientometrics,2008,75(3),421-438.
[15]Didegah F,Bowman T D,Bowman S,Hartley J.Comparing the Characteristics of Highly Cited Titles and Highly Alted Titles.In 21st International Conference on Science and Technology Indicators-STI 2016.Book of Proceedings,2016.
[16]梁春慧,孙艳,万跃华.高被引论文的参考文献特征研究——以化学领域为例的实证分析[J].科技与出版,2014,(7):119-122.
[17]肖慎华.环境与农业生物学科高被引论文的文獻特征研究[J].农业图书情报学刊,2016,28(12):78-82.
[18]陈霖,刘步平,宋璐,等.基于CNKI的装备采购高被引文献特征分析[J].图书情报导刊,2015,(16):111-114.
[19]张垒.论文高被引的参考文献特征及其对影响因子贡献研究[J].情报科学,2016,34(8):94-98.
[20]金卓,杨若愚.中国与“一带一路”沿线国家科技合作中高影响力文献特征研究——基于ESI数据库高被引论文的计量分析[J].科技管理研究,2017,37(20):14-20.
[21]胡泽文,武夷山,袁军鹏.零被引研究文献的知识图谱分析──历史发展脉络、主体和高频主题[J].情报科学,2016,36(3):85-91.
[22]Hu Z,Wu Y.A Probe Into Causes of Non-citation Based on Survey Data[J].Social Science Information,2018,57(1):139-151.
[23]Hu Z,Wu Y,Sun J.A Quantitative Analysis of Determinants of Non-citation Using a Panel Data Model[J].Scientometrics,116(2),843-861.
[24]胡泽文,武夷山,高继平.图书情报学领域期刊论文零被引率的演变规律研究[J].情报学报,2018,37(3):243-253.
[25]胡泽文,武夷山.零被引研究文献综述[J].情报学报,2015,34(2):213-224.
[26]付晚花,肖冬梅.国际开放获取政策及其研究进展综述[J].图书馆杂志,2010,(3):23-27.
(责任编辑:陈媛)2018年11月第38卷第11期现代情报Journal of Modern InformationNov.,2018Vol38No112018年11月第38卷第11期基于关键词的期刊发文的相似性测度研究Nov.,2018Vol38No11
收稿日期:2018-06-19