■赵 越 肖仙桃
1) 中国科学院兰州文献情报中心,甘肃省兰州市城关区天水中路8号 7300002) 中国科学院大学,北京石景山区玉泉路19号(甲) 100049
一直以来,学术界对科技论文的关注多集中于高被引论文。一定程度上,引用次数高可以等同于文章影响力大、可参考性强,另外高被引文章的研究主题也被认为是学科的研究热点,因此受到学者更多的关注。与高被引论文相反,零被引论文是部分学者认为是无足轻重的,其学术价值基本可以忽略不计[1]。仅依据被引次数为零而直接否定论文的质量难免有失偏颇,科学引文索引(SCI)创始人加菲尔德早在SCI创始之际就呼吁大家理性地使用评价指标,理性地看待零被引论文[2]。
目前,零被引论文的研究多集中于分析特征以及探讨成因,而且由于学科选择和计量方法不同,各种研究结论不同。比较具有代表性的研究有:温芳芳[3]以中国知网(CNKI)收录的情报学期刊论文作为样本,揭示我国情报学零被引现象及其规律。郭永正[4-5]以科学引文索引扩展版(SCIE)数据库中的中国和印度的国际和非国际合作论文为样本,比较了中印两国的国际和非国际合作论文总体的零被引率、学科特征以及历时变化等。徐晓芹等[6]和高继平等[7]分别以单本期刊和单一学科领域为研究对象,探讨科技论文零被引的成因。Glänzel 等[8]统计了1980年SCI中零被引和低被引的文章的引用趋势以及规律。除此之外,还有学者关注零被引作为期刊评价反向指标的可行性[9-11],零被引与期刊影响因子的关系[12-13],零被引论文首次被引(“睡美人”现象)[14]。
综上所述,论文零被引的主题因素主要有:第一,文章主题具有高度前瞻性,不容易得到同行的认可。一个经典的例子就是孟德尔提出的遗传定律在豌豆实验论文正式出版34年后,才得到同行以及大众的认可;第二,文章偏离研究热点以及所属学科;第三,文章主题陈旧,而所属学科发展迅速。但零被引形成原因都偏向于学者的主观猜测,缺少有效的数据支撑。此外,仅有的少量定量研究只统计期刊零被引的基本情况,缺少进一步的数据分析。因此,本文以图书情报领域的零被引论文为例,从主题分析的角度入手,利用知识图谱的方法,实证研究零被引论文形成的原因,以期为科研工作者和期刊有效地避免产生零被引现象提供借鉴和建议。
选取《中文社会科学引文索引(2017—2018)》(CSSCI)的17种图书情报领域期刊为数据来源。这17种图书情报类核心期刊代表了我国图书情报领域的最高水平,对我国图书情报学科的研究方向具有重要的指导意义。其中,由于CNKI仅收录了《情报学报》1994—2002年的文章,因此未将《情报学报》纳入研究对象。鉴于数据库收录文章的差异性,为保证数据全面和准确,拟以CNKI为引用次数的主要来源数据库,以万方数据库为补充数据库,统计时间窗口为5年的期刊零被引情况。
1.2.1 选取时间段
文献[15-16]的研究表明,图书情报领域文章发表后2~3年到达被引高峰期,期刊被引半衰期为4~5年。零被引率随时间窗口的收紧呈上升趋势,理想时间窗口为5年[17]。基于此,将2012年12月31日设置为样本文章发表时间的上限,再以此为基准向前推5年,将2008年1月1日选定为样本文章发表时间的下限。
1.2.2 数据搜集
登录CNKI,设置文献来源字段分别为17种样本期刊,匹配选择“精确”,以2008年1月1日至2012年12月31日为检索时间范围,共获得零被引文献4800篇,包含作者、题名、摘要、关键词等基本信息。在此基础上,人工筛选4800篇文章,剔除投稿指南、征文启事、通知公告、新闻报导、征订启示以及游记随笔等,筛选后的零被引论文在万方数据库重复检索,将在2个数据库中被引次数均为0的文章作为研究对象,最终获得零被引样本文献2132篇(表1)。零被引论文的检索截止时间为2017年3月1日。
表1 CSSCI图书情报领域期刊2008—2012年零被引文章数量
1.2.3 研究工具与方法流程
文献分析软件选用CiteSpace(5.0.R2 SE版本)。该软件是由美国费城德雷克塞尔大学的陈超美教授开发的信息可视化软件,具有关键词共现分析、作者或机构的共被引和合作分析、文献共被引分析等多项功能。研究主要基于CiteSpace的关键词共现分析功能。
由于CiteSpace无法直接处理来自CNKI的文件格式,因此在分析之前,将CNKI导出的Refworks类型文档进行格式转换后作为CiteSpace的可读文件。导入数据,时间跨度选择2008—2012年,时间截面选择1年,节点类型设置为“Keyword”,连接强度设置为余弦相似度,默认阈值为50。最后,算法选择“Minimum Spanning Tree”和“Pruning Sliced Networks”,视图选择“Cluster View-Static”和“Show Merged Network”。
运行CiteSpace软件,CSSCI图书情报领域期刊2008—2012年零被引文章的关键词共现知识图谱如图1所示,其中,圆形节点表示关键词,点之间的连线表示关键词之间的关联。
图1 CSSCI图书情报领域期刊2008—2012年零被引文章的关键词共现知识图谱
通过“Export”下拉菜单中的“Network Summary Table”选项导出有效关键词,剔除“发展”“分析”等无效关键词,合并“开放获取”“开放存取”等同义词,统计有效关键词频次及其中心度。
运用相同的方法,将17种样本期刊2008—2012年刊登的文章按照被引次数降序排列,选取前2000篇文章,构建数据量为2000的高被引论文数据集,共现分析关键词(图2),排除无效关键词,例如“比较研究”“实证分析”“研究进展”,合并同义词,例如“社会网络分析”“SNA”,统计有效关键词频次及其中心度。
图2 CSSCI图书情报领域期刊2008—2012年高被引文章的关键词共现知识图谱
图1中,共有关键词362个,关联455条,密度为0.007。图2中,共有关键词171个,关联279条,密度为0.0192。零被引论文的关键词数量是高被引论文的2倍以上,密度却只有高被引论文密度的三分之一左右。“信息服务”在零被引论文中出现频次最高,共出现40次;“云计算”在高被引论文中出现频次最高,共出现77次。
表2 2008—2012年零被引与高被引文章关键词频次*
*注:表中所列为出现频次排名前15位的关键词频次。
由CiteSpace导出的结果以及表2关键词出现频次对比分析可知,零被引论文的关键词类别较多,出现频次相对分散,共362类关键词,最高出现频次只有40次;而高被引论文的关键词类别相对较少,出现频次相对集中,共171类关键词,最高出现频次为77次。因此,零被引论文的研究主题较为分散,主题间关联性不高。与零被引论文相比,高被引论文的研究主题更加集中,主题间关联性更强。
关键词中心度是指所在网络中通过该点的任意最短路径条数,是网络中节点在整体网络中所起连接作用大小的度量[18],中心度大的节点相对容易成为网络中的关键节点。选取2008—2012年零被引与高被引文章关键词,对比中心度(表3)。
表3 2008—2012年零被引文章关键词中心度*
*注:表中所示为出现频次排名前15位的关键词中心度。
由表2~3可见,高被引论文中,排名前15位的关键词中心度都不小于0.1,例如“社会网络分析”的中心度为0.22,“云计算”的中心度为0.20。然而同样的条件下,零被引论文中中心度大于0.10的关键词只有6个。
综上所述,高被引论文关键词节点间的联系相较于零被引论文的关键词节点更紧密,文章的研究主题相关性更强。
由图1~2可知,2008—2012年的图书情报领域零被引和高被引论文的研究热点差异很大。在CiteSpace导出的可视化知识图谱中观察两图的节点和关联连线粗细以及分布,选取高被引和零被引频次以及中心度排名均领先的3个关键词,分析与它们共现的关键词,结果见表4~5。
由表4~5对比可知,高被引论文的研究主题表现出了明显的新颖性,“云计算”“图书馆联盟”“真人图书馆”“虚拟社区”“泛在图书馆”等均为图书情报领域的新兴研究主题。与高被引论文相比,零被引论文的主题显示出明显的陈旧特征,这与图书情报学科的迅速发展具有密切的关系。图书情报领域的研究主题时效性较强,因此期刊通常将出版重心放在新颖的研究成果上,创新研究、理论改革类型的文章更容易受到期刊和读者的青睐。
表4 2008—2012年图书情报领域零被引论文的共现关键词
表5 2008—2012年图书情报领域高被引论文的共现关键词
另外,在图书情报领域零被引论文的共现研究主题中,“检索方法”“图书馆管理”“参考咨询”等关键词显示出明显的偏重工作研究、介绍使用方法的特点。此类文章实用性强,但理论创新性较差,不易获得引用。
需要指出的是,图书情报领域零被引论文的研究主题并没有显示出主题偏离学科研究领域或者研究选题高度前瞻性的特点。
以图书情报领域论文为例,得出零被引文章研究主题主要有以下几个特征:第一,研究主题分散。样本论文的主题并没有显示出集中于某一细分领域的特点,因此,图书情报领域各细分领域均存在零被引现象。第二,研究主题陈旧。这与图书情报学科的迅速发展以及图书情报领域的研究主题时效性较强有关。参照已有研究,生物学、物理学等应用性较强的学科,很多主题具有高度前瞻性特征的文章不容易被同行认可,因此较难获得引用,例如孟德尔遗传定律在豌豆实验论文正式出版34年后才得到认可;交叉学科的零被引论文表现出主题偏离期刊所属学科的特征[19]。可见,零被引的主题因素也存在一定的学科依赖性。第三,偏向工作、应用研究。对于此类文章,虽然实用性强、接受面广,但是由于缺乏理论创新的基础,因此较难获得引用。
主观上,科研工作者应当扎实自身写作,重视研究自身的意义,加强研究深度,不断提升自身的学术水平和学术成果的价值。一篇有价值的科技论文应当具备对相关研究领域具有学术贡献、发现问题并且解决问题以及推动科研发展等特征。科研工作者切勿追求文章数量而忽视文章质量,为发文而发文,忽视了研究本身的意义。
客观上,由上文实证分析不难看出,图书情报领域主题新颖性是获得同行认可的一个重要因素。因此,科研工作者在平日的科研积累中应当多关注图书情报领域的研究前沿,写作选题时跟进研究热点,发散思维,不断追求理论和方法创新,避免老题新做、模仿写作等行为。
选题策划应当平衡各项原则。创新性较强的选题更容易吸引读者,但是期刊审稿时也应当避免一味追求创新性选题而忽视了文章本身的学术价值。除了创新原则以外,期刊选题策划还应当兼顾以下方面:第一,学术导向性原则。学术期刊要发挥自身的学术导向作用,促进学术发展;第二,可持续发展原则。期刊的可持续发展是指选题时不能单纯为了满足读者或作者单方面的需要,在满足学科需要、解决问题以及推动科技进步的前提下,平衡作者、读者和期刊三方的利益。第三,特色发展原则。期刊选题时,在发展学科特色的同时,也要形成自身的选题特色,专注自身特色,将重点放在挖掘学科亮点,让选题更加有深度。这样在提高期刊自身质量的同时,也让作者更加明确投稿目标,让读者阅读更加有章可循。
除此之外,科技期刊应当严把来稿质量关,文章质量是文章能否获得引用的关键因素。近年来,图书情报领域期刊在逐步缩短出版周期,提高载文量,例如,《图书情报工作》自2009年起由月刊改为半月刊,《国家图书馆学刊》自2012年起由季刊改为双月刊。期刊提升载文量在惠及科研工作者的同时,需要统一审稿标准,要在源头上控制文章的质量,筛选优质文章,使文章经得起学术考验,这才是使文章获得引用次数并提高期刊自身影响因子的关键。与此同时缩短审稿周期,保证文章的时效性。对于图书情报等发展速度快的学科,文章时效性非常重要,漫长的审稿周期使文章刊登后学术价值大打折扣。期刊应当重视这一现象,在保证审稿质量的同时缩短审稿周期。另外,拓宽录用文章的传播渠道也是帮助作者提高文章影响力、降低期刊自身零被引率的有效措施。
针对零被引现象实证分析了文章主题因素,而造成文章零被引是多方因素共同作用的结果。引用动机的复杂性[20-21]、作者学科影响力、文章质量、期刊影响因子[22]甚至文章篇幅、摘要完善性[23]、科技资助(基金)[24-25]等都可能引起零被引现象。对于其他学科,文章观点的高度新颖性和尖端前沿性也可能是造成文章零被引的重要原因之一。
一篇论文从构思到写作再到发表,凝聚了作者大量的心血。在数据搜集过程中发现,一部分文章的被引次数为零,但是下载次数却很高,不得不承认在这些文章中不乏一些质量高的文章。因此,仅以被引次数为零这一特征来否认文章的质量和价值较为偏激。正如二八定律、长尾效应等理论,高被引文章毕竟是少数,低引用、零引用的文章可能蕴含着较高的学术价值,因此应该理性对待零被引论文。对于作者而言,把握学科的研究热点以及新兴研究领域是十分重要的,但是扎实的研究和写作才是重中之重;对于期刊而言,一方面要找准受众定位,满足读者需求;另一方面要找准质量定位,严把文章质量关。
[1] 钱贺进. “无用”论文激增现象透析[J]. 中国人才,2012(12):26-28.
[2] Garfield E. Uncitedness III:The importance of not being cited[J].CurrentContents,1973(8):5-6.
[3] 温芳芳. 我国情报学期刊论文零被引现象的计量分析——基于零被引与高被引论文的比较[J]. 情报科学,2016,34(8):128-132.
[4] 郭永正. 非国际合作论文零被引率的中印比较[J]. 图书与情报,2015(4):90-95.
[5] 郭永正. 国际合作论文零被引率的中印比较[J]. 情报杂志,2014,33(12):89-93.
[6] 徐晓芹. 零被引论文产生的原因分析——以《植物营养与肥料学报》为例[J]. 中国科技期刊研究,2015,26(7):763-768.
[7] 高继平,潘云涛,武夷山. 零被引论文的形成因素分析——以光谱学领域零被引论文的国家、机构和主题分布为例[J]. 科技导报,2015,33(8):112-119.
[8] Glänzel W,Schlemmer B,Thijs B. Better late than never? On the chance to become highly cited only beyond the standard bibliometric time horizon[J].Scientometrics,2003,58(3):571-586.
[9] 李美玉,王硕,郑德俊. 中文期刊零被引率与期刊关键评价指标相关性分析——以图书情报学科为例[J]. 中国科技期刊研究,2015,26(4):399-404.
[10] 顾璇,孙云鹏,汤建军,等. 预防医学类期刊引证指标与零被引论文率的相关性[J]. 中国科技期刊研究,2014,25(7):941-944.
[11] 刘雪立,方红玲,周志新,等. 科技期刊反向评价指标——零被引论文率及其与其他文献计量学指标的关系[J]. 中国科技期刊研究,2011,22(4):525-528.
[12] Egghe L. The distribution of the uncitedness factor and its functional relation with the impact factor[J].Scientometrics,2010,83(3):689-695.
[13] 唐晓莉,武群芳,王继民. 论文零被引率与期刊影响力关系的研究——以经济学学科为例[J]. 图书情报工作,2014,58(19):100-104.
[14] 李江. 科学中的“睡美人”与“昙花一现”现象评述[J]. 大学图书馆学报,2016,34(3):38-43.
[15] 黄利平. 基于引文分析的文献老化研究——以图书情报和管理学为例[J]. 情报杂志,2011,30(10):30-35.
[16] 何文,叶继元. 期刊影响因子与被引半衰期关系之比较研究——以图书情报学期刊为例[J]. 新世纪图书馆,2015(4):39-43.
[17] 李文平. 我国教育经济学研究零被引论文:分布特征、研究主题和知识基础——基于36种教育类CSSCI来源期刊2004—2013年刊载论文的知识图谱分析[J]. 教育与经济,2016(4):83-91.
[18] 林聚任. 社会网络分析:理论、方法与应用[M]. 北京:北京师范大学出版社,2009.
[19] 李长玲,郭凤娇,魏绪秋. 基于时序关键词的学科交叉研究主题分析——以情报学与计算机科学为例[J]. 情报资料工作,2014(6):44-48.
[20] Garfield E. Can citation indexing be automated?[C]. Proceedings of the Symposium on Statistical Association Methods for Mechanized Documentation,1965:189-192.
[21] Brooks T A. Evidence of complex citer motivations[J].JournaloftheAmericanSocietyforInformationScience,1986,37(1):34-36.
[22] 唐晓莉,武群芳,王继民. 论文零被引率与期刊影响力关系的研究——以经济学学科为例[J]. 图书情报工作,2014,58(19):100-104.
[23] 郭亿华. 地理学中文核心期刊零被引论文特征分析[J]. 中国科技期刊研究,2016,27(10):1094-1099.
[24] 谭雪静. 《海洋科学》零被引论文分析[J]. 编辑学报,2017,29(1):93-95.
[25] 张风. 科技资助对科技论文影响力的研究[D]. 吉林:吉林大学,2015.
作者贡献声明:
赵越:提出研究选题,设计论文框架,撰写论文;
肖仙桃:选题指导,修订论文,审核论文。