顶级期刊的高网络参与度论文分析

2018-05-31 09:34匡登辉
中国科技期刊研究 2018年5期
关键词:参与度论文期刊

■匡登辉

南开大学图书馆,天津市南开区卫津路94号 300071

目前,科学研究处于转型期——从相对封闭、学科专业界限分明走向开放、跨学科发展范式。开放科学是以合作为基础,结合新的协作工具,将科学研究的数据和成果向业界及公众开放,实时分享各阶段的研究成果[1]。现代网络的繁荣和社交媒体的广泛应用使科研人员更方便、自由地分享信息,开放科学已成为科研合作、交流的方向,因此Altmetrics得以蓬勃兴起[2]。这种融合测度网络用户行为与科学社群影响力的计量方法利用社会化网络提供的用户交互行为数据,快速追踪科学成果在社会化媒体被浏览、推送、标注、推荐、博客提及等情况,实时测量研究成果受网络关注程度,弥补传统成果计量方法滞后、马太效应等不足。

Nature作为全球久负盛名的三大科技期刊(Cell,Nature,Science)之一,主要刊载生命科学、医学、物理学等学科的顶尖研究成果,也是科研人员发文的目标刊物之一。有鉴于此,对Nature论文的Altmetrics研究、对高网络参与度论文的研究引起计量学界的关注。Xia等[3]通过Twitter和Facebook指标对Nature论文的出版年份和学科覆盖率进行分析,评估社会用户对论文的关注程度;Solomon等[4]将细胞生物学、物理化学和认知科学领域的学科顶级期刊论文与Nature、Science综合类顶级期刊的文章进行比较,研究其知识扩散速度的差异性;Wang等[5]使用文献计量指标分析Nature论文随时间的动态使用情况,并与开放获取刊物进行对比;余厚强等[6]通过对Nature的新浪微博指标进行分析,探索中文语境下Altmetrics指标的特征和规律。在网络参与度较高论文的研究中,匡登辉[7]以Altmetrics热点论文为例,探讨期刊的影响力;郭飞等[8]研究Altmetrics热点论文的传播特性,阐释学术内容的影响力;王睿等[9]研究高Altmetrics指标科技论文的学术影响力。这些研究多通过Altmetrics单个指标或指标组合来考察知识扩散或论文的受关注程度,展示高网络参与度论文的传播特性,研究其学术影响力。Nature论文的学术价值不言自明,但在社交媒体环境下,针对这些顶级学术成果中高网络参与度论文特征的研究鲜有报道。本文以Nature为样本,以其2016年发表的高网络关注度论文为研究对象,借助Altmetrics的理论与数据,结合传统评价指标(如数据库收录、被引频次等),基于社交媒体环境,从多方面概括高网络参与度论文的特征,以期对我国科技期刊出版提供借鉴。

1 数据来源与处理

1.1 基础数据集

期刊作为现阶段高校教学与科研的重要组成部分,在学者评价、基金申请、职称评聘等方面发挥重要作用,对其全面评价的重要性不言而喻。同时,“双一流”建设的逐步推进,需要积极探索一流成果的计量与评价分析方法。应南开大学图书馆Altmetrics研究组要求,Altmetric.com提供2016年1—12月Nature高网络关注度TOP 100论文的相关数据,数据采集时间为2016年12月22日。本研究的“高网络关注度”是指论文被网络关注的程度较高,主要采用Altmetric关注度指数(Altmetric Attention Score)来衡量、排序,在一定程度上反映了网民对论文的参与度,而“参与”包括论文被阅读、下载、引用,被在线社交媒体、博客、新闻媒体提及,在学术书签(如Mendeley,CiteUlike,F1000 Prime等)被收藏、推荐等[10-12]。Altmetric.com有关于各指标所占权重的详细评分算法。

1.2 数据组合与软件应用

Scopus数据库是目前全球规模最大的引文数据库,收录了5000多家出版社的21500多种经同行评议的出版物,包括期刊、会议论文、丛书、专利等[13]。在Scopus官方网站的基本检索界面选择DOI字段,依次获取基础数据集中论文的作者、被引频次,数据采集日期为2016年12月30日,对这些异构化的数据组合进行分析。统计分析软件为IBM SPSS Statistics 22.0。

2 研究结果

2.1 作者分析

统计结果显示:Nature高网络参与度论文的篇均作者数为7;48篇论文的作者数量为1,6篇论文的作者数量为2,20位以上作者合著论文所占比例仅为10%;单篇论文作者数量最多为41位。值得注意的是:有1篇论文没有作者署名(doi: 10.1038/538427a),本研究将其视为0个作者;有2篇文章(doi分别为10.1038/nature16549和 10.1038/nature20148)不仅包括非团队作者,也包括团队作者,仅统计非团队作者数量。

2.2 学科分析

从学科分布(图1)来看,顶级期刊高网络参与度论文的学科分布相对均衡,其中23篇为医疗健康科学,19篇来自人文社科研究,14篇来自生物科学领域。专业基础型学科所获得的关注则相对偏少,高网络参与度论文最多的是物理学(9篇),而数学、材料学则较少(各2篇)。空间发现和环境问题也引起了许多关注,相关论文2篇。人文社科领域范围比较广泛,涵盖儿童教育、出版压力、政府政策等诸多方面。与2015年Altmetrics热点论文[7]相比,2016年Nature的Altmetrics 热点论文学科分布更加均衡,不再以生物医学论文为主导。

图1 高网络参与度论文学科分布

2.3 收录引用与文献类型分析

对于引文数据库来说,收录是基础,引文是基于对数据库收录文献的引用。对文献类型的分析发现,Nature文献类型不同,其收录引用差异较大。

表1为2016年Nature高网络参与度论文被引用情况。从表1可以看出,Scopus数据库收录的类型为News的零引用论文占10%,有引用(被引频次不为零)的论文占25%,未被Scopus数据库收录的零引用论文占21%;Scopus数据库收录的类型为Article的零引用论文占3%,有引用(被引频次不为零)的论文占38%,未被Scopus数据库收录的零引用论文占3%。

表1 2016年Nature高网络参与度论文被引用情况

注:此处的文章类型Article包括通讯(Letter)。

3.4 Nature影响因子与CiteScore分析

2016年12月8日,Elsevier出版集团依托Journal Metrics平台发布衡量期刊影响力的重要指标CiteScore,目前其所涵盖的期刊数量为22618种,是《期刊引证报告》中有影响因子(Impact Factor, IF)期刊的2倍多[14]。如图2所示,Nature5年IF在40上下波动,而CiteScore仅在15上下波动,二者差异较大。

图2 近5年Nature的IF和CiteScore的变化情况

某期刊在y年的IF为

(1)

式中IIF(y)为期刊在y年的IF,Cy-1和Cy-2分别为该期刊在y-1年和y-2年所发表论文的被引频次,Ny-1和Ny-2分别为该期刊在y-1年和y-2年所发表论文的数量。

某期刊在y年的CiteScore为

(2)

从计算公式可看出IF和CiteScore的相同点是计算某一期刊在一定时间窗口的篇均被引频次,不同点为:(1)引证时间窗口不同,IF的时间窗口为2年,而CiteScore的时间窗口为3年;(2)计量数据来源不同,IF引用数据来自Web of Science数据库,而CiteScore引用数据则来自Scopus数据库;(3)IF、CiteScore分子、分母包括的文献类型不同,CiteScore包括所有文献类型[15],而IF被引频次来自所有类型的文章,但是分母的载文数量不包括Letter、Comment、News等类型的论文[16]。

从计算公式可大致看出,多数期刊CiteScore值低于IF。实际上,Nature的CiteScore较IF的下降幅度较大。从组合数据集来看,Scopus同样对Nature的论文选择性收录,在本研究中,未被Scopus收录且未被引用的论文占33%。

3.5 指标覆盖率分析

由表1对Nature论文的收录与引用统计可知,并非所有Nature论文均被Scopus数据库收录与引用,因此,数据集的引用数据未进行统计。

本研究中,覆盖率是指非零值文献占总文献量的比例,可一定程度上反映该指标在科学评价中的可利用价值。表2显示,所有论文均有在线关注,但关注度指数差异较大,这反映出高影响力论文的网络参与度也参差不齐,其他Altmetrics指标数值变化较大。

表2 文献指标的数值分布

社交媒体指标中,所有文献均在Twitter中被提及,99%的文献在Blog中被提及;在新闻报道中,98%的文献在Facebook、Google+中被提及,其他社交媒体提及率相对较低,如Reddit,覆盖率为70%,96%的文献在Mendeley上被用户保存过,99%的文献出现在新闻报道中,其他指标的覆盖率较低,如policy documents、Wikipedia、peer reviews、videos、Q&A threads、Research highlight均低于50%,甚至存在指标覆盖率为零的情况(如Weibo posts、LinkedIn posts、Pins、Syllabi)(图3)。

从基本统计指标来看,Blog、Facebook、Twitter、Google+、Reddit、Mendeley、news story具有较高的覆盖率,具有广泛代表性,可用于探讨顶级科研成果在网络上的关注程度及其传播规律。

图3 部分Altmetrics指标频数分布。(a)Facebook posts频数分布;(b)Google+ posts频数分布; (c)Reddit posts频数分布;(d)Mendeley posts频数分布

3.6 标识符PubMed ID、arXiv ID分析

PMC(PubMed Central)是一个提供有关生命科学与生物医学的回溯性电子期刊全文数据库,由美国国立卫生研究院/国家医学图书馆创建和管理[17];arXiv[18]作为开放获取的资料库,目前收录物理学、数学、非线性科学、计算机科学、定量生物学、定量金融学、统计学等学科的在线出版文献,可方便科研人员发布和检索论文,论文上传到arXiv,明确科研成果首发权,避免争议,推进学术传承。PMC、arXiv论文可接受同行随时随地的评论,扩大成果交流范围,对加速科学研究成果共享、助力追踪学科前沿进展大有裨益。

查看Altmetric.com 提供的Altmetrics数据,发现83%的Nature高网络参与度论文有PubMed ID标识符,4篇论文具有arXiv ID,可通过PubMed、arXiv获取这些文章的元数据。这说明这些论文在投稿至Nature前,曾在这些开放获取的在线出版平台发布。

4 结果与讨论

顶级期刊的影响因子、论文被引频次与其价值或作者水平存在相关关系,但非因果关系。本研究结合Altmetrics文献计量学工具,总结、分析2016年Nature高网络参与度论文的特征,以期对我国科技出版提供借鉴。

(1) 高网络参与度论文的合著率为52%,这反映出顶级科研成果研究过程中的困难程度和完成研究成果所必需的知识结构。一般认为,合著率越高,论文的学科发展水平和学术质量越高。合作既综合了所有作者的智慧,又增加了不同学科间的交叉与融合,扩展了研究深度,实现了资源共享、优势互补,有助于产生新的研究热点。

(2) 各学科分布相对均衡,人文社会科学论文占19%。Nature论文学术价值高、可读性强,适应科研人员、大众需要,是其了解自然基础科学领域最新研究动态及前沿消息的重要来源,尤其是生物、医学、物理等学科。News栏目向公众传播科学新闻,对科学研究进行评论,向大众进行科学普及,同时兼具较高的科学价值,常被新闻媒体作为最新科学信息的最可靠来源加以引用。因此,被引频次高的文献不一定都是原创论文。

(3) Scopus对Nature论文选择性收录,从本研究来看,News的收录仅占28.97%。Nature创刊伊始即为周刊,每期刊登的论文中,被认定为“引用项”的仅有三个栏目:通讯(Letter)、研究论文(Article)、消息和观点(News & Views)。Garfield[19]研究指出,除“评论”外,Nature归为“引用项”的栏目是“研究论文”和“通讯”。穆蕴秋等[20-21]研究发现Nature削减学术论文数量以提升IF,而且综述论文普遍具有引用优势。本研究发现,Nature相同年度的CiteScore低于IF,被收录或者引用的文献类型为Article与Review, Altmetric.com提供的文章类型包含通讯。

(4) Blog、Facebook、Twitter、Google+、Reddit、Mendeley、news story覆盖率较高,可用于探讨顶级科研成果在网络上的关注程度及其传播规律,这些线上交流应与现实中的交流同等对待。新闻、博客包含的信息丰富,且评论具有针对性,社会反响大,能产生更持久的社会影响力,大部分社交媒体只是转发,仅起扩散作用,但这些指标均可表征网络参与度,体现出其传播渠道的多样性。

(5) 83%的高网络参与度论文有PubMed ID标识符,4篇论文具有arXiv ID,这些标识符可以追踪文章的来龙去脉,保障作者首发权,此外也扩大了传播途径,有助于获得较高的用户参与度,包括收藏、点赞、评论、推荐等,在一定程度上造就这些高网络参与度论文。

5 结语

Nature为综合性科学周刊,是顶级学术期刊中的翘楚,其通过多样化栏目设置、不同的文献类型来传播各学科的最新科研信息,满足读者的多层次需求。通过对其高网络参与度论文的研究发现,高网络参与度的论文并非高被引论文,但对科学普及具有积极影响,公众直接参与科学内容的讨论与评述,有利于提升公众的科学素养。网络参与度、被引频次是论文评价的两个不同维度,前者为社会影响力,表征论文获得的社会关注;后者为科研影响力,代表学界同仁对科研价值和论文质量的认可。顶级期刊的高网络参与度论文的选题除了要关注与现实生活、社会发展密切相关的问题外,还需尽可能易于被发现、获得、理解和分享;此外,在线出版平台打破了芬格规则,Nature允许在作者投稿之前将论文手稿发布于在线出版平台上。我国科技期刊出版需探索与在线出版平台相融合的新型服务模式,推进中国高水平期刊建设。

致谢:感谢Altmetric.com数据专员Amy Rees提供Nature的相关Altmetrics数据。

[1] Wilsdon J R,Bar-Ilan J,Frodeman R,etal. Next-generation metrics:Responsible metrics and evaluation for open science[R]. Luxembourg:Publications Office of the European Union,2017.

[2] 余厚强,邱均平. 替代计量学视角下的在线科学交流新模式[J]. 图书情报工作,2014,58(15):42-47.

[3] Xia F,Su X,Wang W,etal. Bibliographic analysis ofNaturebased on Twitter and Facebook Altmetrics data[J].PLoSONE,2016,11(12):e0165997.

[4] Solomon G E A,Carley S,Porter A L. How multidisciplinary are the multidisciplinary journalsScienceandNature?[J].PLoSONE,2016,11(4):e0152637.

[5] Wang X,Mao W,Xu S,etal. Usage history of scientific literature:Naturemetrics and metrics ofNaturepublications[J].Scientometrics,2014,98(3):1923-1933.

[6] 余厚强,Hemminger B M,肖婷婷,等. 新浪微博替代计量指标特征分析[J]. 中国图书馆学报,2016,42(224):20-36.

[7] 匡登辉. 从Altmetrics热点论文看科技期刊影响力——以Altmetric.com Top 100论文为例[J]. 中国科技期刊研究,2016,27(11):1188-1194.

[8] 郭飞,游滨,薛婧媛. Altmetrics热点论文传播特性及影响力分析[J]. 图书情报工作,2016,60(15):86-93.

[9] 王睿,胡文静,郭玮. 高Altmetrics指标科技论文学术影响力研究[J]. 图书情报工作,2014,58(21):92-98.

[10] Galligan F,Dyas-Correia S. Altmetrics:Rethinking the way we measure[J].SerialsReview,2013,39(1):56-61.

[11] Lin J,Fenner M. Altmetrics in evolution:Defining & redefining the ontology of article-level metrics[J].InformationStandardsQuarterly,2013,25(2):20.

[12] Impact Story. A new framework for altmetrics[EB/OL]. [2017-11-07]. http://blog.impactstory.org/2012/09/14/31524247207/2013.

[13] Scopus content[EB/OL]. [2017-06-27]. https://www.elsevier.com/solutions/scopus/content.

[14] Journal Metrics[EB/OL]. [2016-11-29]. https://journalmetrics.scopus.com/.

[15] 刘雪立,任胜利,程维红,等. 不同学科期刊CiteScore与影响因子的比较研究[J]. 中国科技期刊研究,2017,28(9):837-841.

[16] 刘雪立,盖双双,张诗乐,等.“非可被引文献”的引证特征及其对科技期刊影响因子的贡献[J]. 编辑学报,2015,27(5):495-499.

[17] PMC (PubMed Central)[EB/OL]. [2016-12-18]. https://www.ncbi.nlm.nih.gov/pmc/.

[18] arXiv Public Wiki[EB/OL]. [2016-11-29]. https://confluence.cornell.edu/display/arxivpub/arXiv+Public+Wiki.

[19] Garfield E.Nature:112 years of continuous publication of high impact research and science journalism[J].CurrentContents,1981(40):5-12.

[20] 穆蕴秋,江晓原. 不公平游戏:“两栖”SCI刊物如何操弄影响因子——Nature实证研究之四[J]. 上海交通大学学报(哲学社会科学版),2016,24(2):59-67.

[21] 穆蕴秋,江晓原. 从SCI综述文章引用规则看中国期刊与国际接轨现状——Nature杂志实证研究之五[J]. 上海交通大学学报(哲学社会科学版),2017,25(4):78-86.

猜你喜欢
参与度论文期刊
期刊更名启事
期刊简介
提高学生课堂参与度 激活珠心算生命力
初中语文教学中如何有效提高学生的课堂参与度
期刊问答
鼓励自主安全活动 提升员工参与度
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文