Altmetrics研究可视化分析

2020-06-22 13:15高蕴梅陈子豪张文韬
软件导刊 2020年5期
关键词:计量学发文论文

高蕴梅 陈子豪 张文韬

摘 要:Altmetrics作为一种新型科研产出评价方法,涌现了大量相关理论、方法、应用和工具的研究成果。梳理与总结这些成果,可为后续研究提供一定的参考和借鉴。使用文献计量学方法、BibExcel +Pajek等工具,分析作者机构数和发文量、作者数和发文量、期刊载文数和发文量的“二八规律”;采用关键词的Louvain社区发现方法,通过聚类分析挖掘出4类研究热点。

关键词:Altmetrics;BibExcel ;引用分析;共现网络; 聚类分析

DOI:10. 11907/rjdk. 192026 开放科学(资源服务)标识码(OSID):

中图分类号:TP391文献标识码:A 文章编号:1672-7800(2020)005-0178-03

0 引言

Altmetrics 是Alternative Metrics的缩写,中文称为补充计量学,又称替代计量学、选择计量学,是一种基于社会媒体的新型评价方法,通过测量研究成果受到网络的关注程度评估计算其影响力[1]。自2010 年Priem建立Altmetrics.com 网站以来,各界对Altmetrics广泛关注,产生了大量相关理论、方法、应用以及工具成果。因此,对Altmetrics领域研究现状进行梳理与总结十分必要。

基于中国知网数据库收录的文献梳理国内Altmetrics研究成果如下:武澎[2]分析了2012-2015年关于Altmetrics的内涵界定、国内理论与实证研究、相关科研机构应用;龚佳剑[3]分析了 2008-2018年Altmetrics研究文献的时间分布、机构分布、作者分布和研究热点;邓进[4]分析了2012-2017年Altmetrics研究的时间分布、期刊分布、高引用分布、作者分布、机构分布及研究热点。基于Web of Science核心合集数据库梳理国际Altmetrics研究成果:齐世杰[5]分析了2010-2016年Altmetrics研究文献的学科领域分布、国家及机构分布、核心作者分布和研究热点;杨思洛[6]分析了2012-2014年Altmetrics研究的发展阶段、内容归纳、优势与劣势和发展趋势;田文灿[7]分析了2012-2018年Altmetrics领域知识概念生长与凋亡。这些研究成果较好地总结了Altmetrics领域研究现状,但是缺乏对国际Altmetrics研究成果的作者机构数、作者数、期刊载文数与发文量的规律分析和总结,缺乏关键词聚类结果的文献内容分析。

本文在借鉴上述研究成果基础上,利用Pajek和VOSViewer等工具,分析作者机构数和发文量、作者数和发文量、期刊载文数和发文量的“二八规律”,基于关键词的Louvain社区发现聚类结果分析文献内容,期望能为Altmetrics领域的发展以及学者后续研究提供参考和借鉴。

1 数据来源与处理

研究数据来源于Web of Science数据库。检索式为:主题=“Altmetric”,检索年限限定为2012-2019年,选择Web of Science核心数据库,检索时间:2019年3月6日,共得到327条数据。

利用文献计量法对相关文献进行统计分析、数据描述,解释文献特征和变化规律,通过绘制科学知识图谱,揭示与解读相关文献。结合各软件的优势,选取BibExcel 、Pajek、VOSViewer、EXCEL、NotePad等软件进行整理、编辑、统计、挖据和可视化等工作。

2 文献“二八”特征分析

2012年Priem提出传统引文文献计量分析缺乏数据库、软件、博客等来源的引用问题,学者可在正式引用文献出现之前讨论、标注、推荐、驳斥、评论、阅读相关内容,提出利用Altmetrics统计分析、度量评价、科学发现或推荐评价、在线工具和环境的定性研究,Altmetrics理论及其学术影响等研究,这些研究解决了Altmetrics数据平台、指导思想、基本思路、应用范围等一些基本问题。

2.1 机构数与发文量特征

327篇Altmetrics 论文作者机构共403个(包括非第一作者机构),403个机构在327篇论文中出现了1 110次。发表1篇论文的机构有202个,占比50%,发表2篇论文的机构有93个,占比23.02%,发表3篇论文的机构有31个,占比7.67%,发表4篇论文的机构有28个,占比6.93%,发表5篇及以上论文的机构50个,占比12.38%。

Altmetrics机构发文量分布的“二八特征”,即80%的机构只发表了1~2篇论文,共计出现了388次(占总次数的35%);20%的机构发表了3篇及以上论文,共计出现了722次(占总次数的65%)。

高产机构有Wolverhampton Univ(53篇)、Dalian Univ Technol(30篇)、Nanyang Technol Univ(29篇)、Univ Cordoba(28篇)、 Univ Alberta(23篇)、 Univ Montreal(22篇)、Univ Toronto(18篇)、Wuhan Univ(18篇)、Max Planck Inst Solid State Res(16篇)、Reina Sofia Univ Hosp(16篇)、 Max Planck Gesell(16篇)、Univ Maryland(16篇)、Leiden Univ(15篇)。13家机构(不足机构总数的4%)出现了300余次,占总数的27%。

2.2 作者数与发文量特征

从作者的产出数量可以识别主要作者、該领域的研究者规模及活跃程度。327篇论文共有501名作者(包括非第一作者),501名作者在327篇论文中出现了758人次。发表1篇论文的作者有397人,占作者总数的79.24%,占总人次的52.7%;发表2篇论文的作者63人,占作者总数的12.57%,共计出现了126次,占总人次的16.62%;发表3篇论文的作者16人,占作者总数的3.2%,共计出现了48次,占总人次的6.3%;发表4篇及以上论文的作者24人,占作者总数的4.8%,共计出现了187次,占总人次的24.7%。

Altmetrics作者数和发文量分布的“二八规律”,即80%的作者只出现了1次,20%的作者发表论文大于等于2篇,共计出现了361次,占总次数的47.6%。

高产作者有Thelwall(31篇)、Bornmann(20篇)、 Haunschild(15篇)、 Haustein(10篇)、Lariviere(8篇)、Holmberg(8篇)、Costas(7篇)、Ortega(7篇)、Gorraiz(6篇)、Bowman(6篇)、Sugimoto(6篇)、Owen(6篇)。

高产作者的发文特征:12名作者(占作者总数的2.4%)发文130篇(占论文总数的39.8%)。

2.3 载文期刊数与发文量特征

327篇文章发表在105种期刊上,分布在计量学、信息学、化学、医学等多个学科期刊上,包括《NATURE》,《ACS CENTRAL SCIENCE》等多个世界顶级期刊,表明Altmetrics研究引起了众多学科领域注意,且取得了较高层次成果。

75种期刊只发表了1篇论文,占期刊数的71.4%,占论文数的22.9%。发文量在2篇及以上期刊30个,占期刊数的28.6%,占论文数的77.1%。

载文期刊数和发文量呈“二八规律”:大约80%的论文发表在20%的期刊上,20%的论文发表在80%的期刊上(每个期刊只发表了1篇)。

大于5篇的高产期刊有:SCIENTOMETRICS(87篇)、JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY(24篇)、PLOS ONE(20篇)、JOURNAL OF INFORMETRICS(17篇)、ELIFE(15篇)、ONLINE INFORMATION REVIEW(13篇)、ASLIB JOURNAL OF INFORMATION MANAGEMENT(12篇)、ABSTRACTS OF PAPERS OF THE AMERICAN CHEMICAL SOCIETY(8篇)。

高产期刊数和发文量特征:8个期刊(占期刊数的7.6%)发文196篇,占论文总数的60%。

3 基于Louvain社区发现聚类的内容分析

关键词是对论文主题的高度概括和凝练,是学术论文的核心与精髓。统计分析Altmetrics研究发表论文中关键词出现频次及其相互关系,可以揭示该领域的知识结构演变和研究热点分布。使用BibExcel 提取频次大于4的关键词生成关键词共现矩阵,Pajek生成共现网络并用Louvain社区发现算法聚类分析,VOSViewer可视化结果得到4类研究主题及热点。

第1个聚类的关键词包括Facebook、Tweets、Twitter、Researchgate等社会媒体(Social Media),使用Altmetrics、Plumx等平台和工具,获得Research Evaluation、Webometrics、Article-Level Metrics等指标的度量、影响因子、数据背景等主题。Zhang[8]基于生态学领域的40 000篇文献的计量学和Altmetrics数据,分析了科学论文在社交媒体上的传播模式,特别是高Tweet和高引用论文,发现Tweet时间和用户类型影响了科学出版物在社交媒体上的关注度。具有大量Tweet用户的文章能及时被社会媒体曝光,通常是期刊相关机构用户或有很多粉丝的用户。一般高引用论文既不是及时推送也不是期刊用户推动的结果;Vainio[9]研究是谁推送了农业、工程技术、医学、自然和人文社科等4个学科的论文,通过定性和定量的关键词分类、共词分析和内容分析研究,结果发现Twitter 用户推送学术文章的原因更多强调的是他们的职业专长而非个人兴趣;Yu[10]研究了Altmetrics 数据的上下文背景,包括计数类型和用户类别,不同twitter用户类别数据表明,一般发到Twitter的信息对公众用户影响很大,研究者用户比其他类别用户具有更多的引用相关性。

第2个聚类关键词包括Citation analysis、Impact factor、 Medndeley、H-index等,研究内容主要针对临床实验(Clinical Trials)等领域的传统引文H指数和基于Mendeley等文献工具的Altmetrics指数之间的对比分析、引用分析、引用特征、引用源等主题。Haustein[11]分析了37位天体物理学家的Twitter用户推文行为,并比较了他们的出版行为和引用关系,结果发现他们的推文与出版数呈中度负相关,转发与引用率不相关,推文和摘要的相似性很低;Costas(2017)分析了文献工具Mendeley的读者数分布与跨领域引用之间的不同和相似之处。通过特征分布和尺度方法分析两者的分布形状,解决两者差异引出的标准化问题度量框架,结果发现Mendeley阅读分布与各个领域的歪斜度高度相关,使用领域读者数的均值作为标准化因子可以得到较好结果,引用数量是度量产出的重要指标;Luo(2018)从实引论文和来自有名机构的引用源两个方面探究影响引用数量的因子,结果发现引用了有名机构的论文比无名机构的论文具有更高的引用数量,有名机构引用的论文作者和期刊具有更高的H指数、期刊影响因子、更高的Altmetric 分数和其它指标。

第3个聚类关键词包括Open Access、Peer Review、Research、Blogging等,主要研究内容包括Altmetrics开放获取、同行评审的相互影响和应用。Snijder(2016)从2009年就开始了一个实验,验证开放获取对引文数量和推文专著关注量是否有相关影响。2014年获取了引文和推文测试数据,结果表明开放获取略有优势,但是也应该考虑语言和主题的影响,Twitter的使用和引用行为很难有交集。在社交媒体、开放获取、Altmetrics和大數据的影响下,同行评审越来越开放;Tattersall(2015)讨论了公开同行评审意见的促进和障碍因素,鼓励在出版前后公开同行意见。平台(F1000 Research,Open Review,Peer J, Peerage of Science, PLOS ONE,PubMed Commons,Publons,PubPeer,ScienceOpen,The Winnower)可应用Altmetrics、雪球度量(Snowball Metrics)或其它类似的系统,公开和盲审出版前后的评审意见。

第4个聚类关键词包括 Journal、Metrics, Correlations, Indicators, Citation Index, 主要研究Altmetrics的期刊度量、引用指标和相关性分析等主题。Markusova(2018)分析了2015年俄罗斯国内37 200条SCIE论文,使用两个指标180天的使用数(记为U1),以及自2013年2月以来的使用数(记为U2),识别引用指标和论文级度量的Kendall相关系数,结果表明时间较长的U2比时间短的U1具有更强的相关性,U1的使用量和传统期刊度量的被引半衰期呈弱相关。DOI是多数网站或Altmetrics 工具检索、识别论文的关键元素,Boudry(2017)评估了在PubMed数据库中生物医学类期刊论文具有DOI的情况。使用出版商期刊的国家地理分析,结果发现1966-2015期间只有40.48%的期刊有DOI ,2000开始逐渐增加,到2015年86.42%的论文有DOI,但是仍有部分国家(如俄罗斯、泰国、乌克兰)很少有DOIs。

4 结语

Altmetrics研究从无到有、由点及面,從备受质疑到广为接受,并广泛作为论文、专利、图书、机构、期刊等评价的参考因素,进度和成果超出预期,相关研究成果丰硕。社交媒体平台为科研工作者和科学爱好者提供了丰富的资源、广阔的研究空间和研究前景。可以预见,有关Altmetrics的研究必将呈现蓬勃发展之势,研究成果将持续增长。

参考文献:

[1] 余厚强,任全娥,张洋,等. Altmetrics的译名分歧:困扰、影响及其辨析[J]. 中国图书馆学报, 2019(1):47-59.

[2] 武澎,李田田,王开阳,等. 我国Altmetrics研究现状与热点分析[J]. 科研管理,2018(5):122-130.

[3] 龚佳剑,孟群. 补充计量学研究可视化分析[J]. 首都医科大学学报,2019(1):106-111.

[4] 邓进. 基于科学计量学的国内Altmetrics研究文献的分析[J]. 西南民族大学学报(人文社会科学版),2018 (5): 236-240.

[5] 齐世杰,郑军卫. 基于文献大数据的国际Altmetrics研究力量与热点分析[J]. 现代情报,2017(10):130-138.

[6] 杨思洛,程爱娟. 社交网络环境下的计量学:Altmetrics研究进展综述[J]. 情报资料工作,2015(4) :33-37.

[7] 田文灿,胡志刚,王贤文.科学计量学视角下的Altmetrics发展历程分析[J]. 图书情报知识,2019(2):5-11.

[8] ZHANG L,WANG J. Why highly cited articles are not highly tweeted? a biology case[J]. Scientometrics, 2018(1):495-509.

[9] VAINIO J,HOLMBERG K. Highly tweeted science articles: who tweets them?an analysis of Twitter user profile descriptions[J]. Scientometrics, 2017(1):345-366.

[10] YU, H. Context of altmetrics data matters: an investigation of count type and user category[J]. Scientometrics, 2017 (1):267-283.

[11] HAUSTEIN S,BOWMAN T D,HOLMBERG K,et al. Astrophysicists on twitter: an in-depth analysis of tweeting and scientific publication behavior[J]. Aslib Journal of Information Management,2014 (3):279-296.

(责任编辑:杜能钢)

猜你喜欢
计量学发文论文
生物化学计量学原理在离散生物动力系统的应用
针刺治疗失眠症的文献计量学分析
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
基于科学计量学的公安院校科研与评价
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登