■张 垒
河南师范大学,河南省新乡市建设东路46号 453007
引证可以用来评价论文的学术价值及其影响力[1]、论文的被引频次可以表征论文被认同的价值[2-3]、论文被引频次越高,其越具有较高的学术价值[4],这已得到学界的共识。高被引论文也成为研究的热点。目前国内外有关高被引论文的研究主要集中在其分布特征的研究,包括被引时间分布、作者分布及合作、期刊分布、产出和机构分布[5-6]、高被引论文的老化特征[7]、类型特征[8]等。 尽管很多学者对高被引论文现象和规律进行了研究,高被引现象的深层原因和表现特征仍然有许多值得深入分析和研究的问题,尤其是高被引论文的参考文献特征及其对影响因子贡献大小的研究。高被引论文对期刊影响力、影响因子贡献也得到广泛认同,刘雪立[9]、韩维栋[10]、戴丽琼[11]认为期刊的影响因子主要由少数高被引论文贡献的。而参考文献作为科技论文不可或缺的组成部分,是影响科技论文质量的重要因素。二者之间关系的研究得到学界的关注,Gregory D.Webster[12]认为参考文献的数量与被引频次相关。简琳[13]认为英文文献的被引频次与参考文献的数量存在显著关系。姜春林[14]以图书情报学期刊为例证明了高被引论文倾向于引用高被引文献。梁春慧[15]以化学领域论文为数据证明了高被引论文的参考文献数量明显比一般论文多,高被引论文比一般论文更倾向于引用影响因子高的期刊论文。而姜磊[16]以物理化学、天文学、经济学等学科的数据证明出参考文献与被引频次之间的相关性不明显。为何会出现不同的结果呢,二者关系是否具有学科属性特征呢?上述研究多是基于文献引证的外部特征,没有研究内容特征对论文高被引的影响;况且多是基于理工科期刊数据进行研究的,而不同的学科期刊是否有相同特点还有待考证。鉴于此,本文以新闻学与传播学领域高被引论文为研究对象,深度分析影响该领域高被引论文的特征因素及其对影响因子的贡献度,对于丰富不同学科的高被引论文特征具有重要意义。
以新闻学与传播学为研究对象,以CSSCI收录的新闻学与传播学15种期刊作为高被引论文数据源。分别以这15种期刊为检索对象,对期刊发表的论文按照被引频次降序排列,按比例选取前3%论文为该领域的高被引论文,也即被引频次为大于等于18次的论文共116篇。检索时间为2015年6月25日。
以116篇高被引论文为检索对象,获取高被引论文的参考文献,再以参考文献为检索对象获取参考文献的被引情况。由于CSSCI数据库收录的数据有限,在研究参考文献的被引情况时,以CNKI为数据源。在研究设计中,按照高被引论文的前1%(前38篇),前1% ~2%(39-77篇),前2% ~3.15%(78-116)对116篇高影响力论文进行分组。
以新闻学与传播学领域的核心期刊2012年的影响因子为数据,分别获取核心期刊在2010年和2011年的发文总量,然后计算其5%的篇数。检索各个期刊2010年和2011年发文在2012年被引用情况,降序排列,取其前5%的被引频次,进而计算出其对影响因子的贡献。
CSSCI共收录新闻学与传播学领域的论文24971篇,总被引频次为51354,篇均被引2次以上。篇均被引频次最高的期刊是《编辑学报》为3.16,其次是《中国科技期刊研究》为2.69,《新闻与传播研究》篇均被引2.11。单篇被引次数最多的是94次,最低的是6次。116篇高被引论文分布于7个期刊中,最多的编辑学报59篇,中国科技期刊44篇,详细数据见表1。
表1 期刊载文、被引数据
本研究从论文的外部特征和内容特征两个方面七个指标研究影响论文被引用的特征因素。外部特征指标包括论文发表时间长短、论文引用响应时间、论文作者影响力、参考文献、高被引论文对影响因子贡献度五个因素,内部特征包括研究内容新颖性、研究主题内容两个因素。各特征因素定义如表2。
表2 各特征因素名称及定义
指标解释和说明:
论文引用响应时间表征论文发表后多久得到引用,以116篇高被引论文为检索对象,分别统计其首次被引用的时间,以年度为单位,发表当年即被引用的定义为响应时间为0,第二年引用的响应时间为1,以此类推。
关于论文作者的影响力,根据邱均平教授[17]的研究将H指数大于等于5的作者定义为高影响力作者。以每篇论文第一作者计,基于该作者在CSSCI数据库中数据,排除作者自引,计算其 H指数。
关于研究内容新颖性的界定,论文研究内容与最早发表内容在同一年的,认为有新颖性。
关于参考文献的质量用高被引论文的参考文献被引用情况表征。
(1)绝大多数高被引论文具有较长发表时间。高被引论文发表时间分布于3~19年之间,平均发表时间为10年,高被引论文集中在发表7~14年之间,其中发表11年的高被引论文有16篇,发表9年的有14篇,发表8年的有12篇。发表10年以上的几乎占一半左右。具体数据见表3。
表3 高被引论文发表时间
(2)该领域的高被引论文被引响应时间较短。36%的文章在发表当年就被引用,49%的文献在发表后第二年被引用,平均响应时间为0.9,也即高被引论文平均发表不到一年就被引用。说明新闻学与传播学领域的知识更新较为频繁。响应时间最长的是发表8年后才被引用,该文是1997年发表的关于内容分析法的,直到2005年才首次被引用,然后出现很高的被引频次,该文献属于论文引用领域的睡美人现象。具体数据见表4。
表4 高被引论文被引响应时间
(3)高被引论文的作者具有较高的影响力。116篇高被引论文中独著论文55篇,占高被引论文总数的48%。作者人数为2~4人的论文为38篇,占高被引论文的33%,5人以上作者合著论文为18篇,其中作者人数最多的7人合著,以课题组名义发表的论文有3篇。以第一作者计,发表文献最多的作者是游苏宁9篇,任胜利7篇,金碧辉5篇,程维红5篇。116作者次数中高影响力作者数为67次,占60%,作者H指数最高的为13。
(4)高影响力论文与研究内容是否新颖性关系不大。研究表明高被引论文的研究对象和研究内容往往是非常新的主题。但本研究表明在新闻学与传播学领域高被引论文中有73%的文章不是较早提出新兴的研究方向和领域,不具有研究内容新颖性,但进一步分析发现这些文献虽不是新兴研究主题,但都是紧跟新颖性主题,进行深刻研究,因此保持高被引。
(5)高被引论文的参考文献特征。116篇高被引论文共有参考文献762条,篇均6.6条参考文献。有20篇高被引论文的参考文献为0,高被引论文参考文献最多的64条。其中外文文献有223条,占参考文献的30%。中文期刊参考文献452条,占59%,图书参考文献24条,其它63条。
新闻学与传播学领域的高被引论文的参考文献外文文献占有很大的比例,这说明该领域的国际交流合作比较频繁,从另一个侧面也能发映出高被引论文的参考文献质量较高。根据中国现行期刊评价认定的方法,一般认为外文期刊水平质量较高。对中文期刊进一步分析发现,这些参考文献分布最多的期刊集中在新闻传播出版领域,也涉及到高校学报、图书情报、科学技术、印刷等领域杂志,在编辑学报有167篇,中国科技期刊研究有87篇,而且这些杂志基本都是CSSCI来源期刊,自然科学领域的杂志也是中文核心期刊。这说明高被引论文的参考文献发表的杂志质量较高,也可认为高被引论文的参考文献质量较高。具体数据见表5。
表5 高被引论文参考文献来源
把116篇高被引论文按照被引频次降序排列,然后平均分成三组,前1%高被引论文总被引频次为1283,参考文献为328篇,平均参考文献为8.4次。前1%~2%高被引论文总被引频次为963,参考文献为 197篇,平均参考文献为 5.1次。前2%~3%高被引论文总被引频次为758,参考文献为314篇,平均参考文献为8.3次。从上述数据可以看出高被引论文的被引频次和参考文献数量不存在关联性,并不是被引频次越高,参考文献的数量越多。
前1%高被引论文的篇均参考文献8.4篇,参考文献平均被引频次24.9次。前1%~2%高被引论文的篇均参考文献5.1篇,参考文献平均被引频次24.1次。前2%~3%高被引论文的篇均参考文献8.3篇,平均被引频次23.8次。这说明该领域的高被引论文的参考文献被引频次与高被引论文的被引频次存在正向关系,即高被引论文被引频次越高,其参考文献被引频次越多。以上数据统计结果表明,高被引文献更多的引用了高被引参考文献,并且越是高被引的文献越偏向于引用高被引参考文献。具体数据见表6。
表6 高被引论文参考文献分组数据
(6)高被引论文的主题内容分析。116篇高被引论文共有关键词521个,其中出现频次大于5的关键词有24个(见表7),累积频次252次,占总频次的48.3%。出现频次最高的科技期刊52次,学术期刊18次。
表7 高频关键词
利用24个关键词,构建共词矩阵。利用SPSS对该矩阵进行因子分析和多维尺度分析,可将新闻学与传播学领域的高被引论文研究内容分为四个知识结构单元,一是新闻工作与出版,包括新闻工作、新闻事业、新闻改革、新闻体制、新闻出版、出版模式、出版产业、数字化出版;二是网络传媒与新媒体,包括媒介、传播、舆论监督、新媒体、网络舆情、媒体融合、大众传媒;三是期刊评价与影响力,包括学术期刊、科技期刊、评价、影响因子、同行评价、影响力、学术论文、审稿质量、审稿专家、编辑、参考文献、引证;四是期刊媒体的发展措施与社会责任,包括国际化、产业化、经济效益、办刊模式、办刊理念、发展措施、开放获取。
通过共词分析可知新闻出版、新闻事业、出版业等传统的业务以及期刊评价、期刊影响力、期刊编辑与质量控制是新闻学与传播学高被引论文的研究热点领域,而随着环境、新媒体的发展,新媒体、数字出版、网络舆情、媒体融合等成为新的该领域的研究热点,同时期刊的国际化、产业化发展、经济模式、办刊理念也成为该领域的高被引研究热点。
(7)高被引论文对影响因子贡献度分析。TOP 5%高被引论文对影响因子贡献度普遍较高,范围为16.44%~39.71%,平均为27.12%,贡献度最大的期刊是中国科技期刊研究,贡献度达到39.71%。这与盛丽娜[18]研究认为TOP5%国际眼科期刊的高被引论文对影响因子的贡献度在20%~30%之间基本相符。
表8 TOP5%高被引论文对期刊影响因子贡献
通过对新闻学与传播学领域的高被引论文特征因素分析得出以下结论:
(1)时间累积是论文高被引的必要条件。作者影响力越高,论文越可能高被引。高被引论文首次被引时间较快。
(2)新闻学与传播学领域知识更新较快、知识国际间、跨学科之间交流较为频繁,但并不是最新的研究内容就会高被引。
(3)高被引论文倾向于引用高影响力论文。高被引论文引用的参考文献的被引频次一般较高。但参考文献的数量与论文高被引之间的并不存在明显的相关性。
(4)新闻学与传播学领域的高被引论文对影响因子贡献度较高,前5%的高被引论文对影响因子贡献平均达到27.12%、贡献度最高达到39.71%。
(5)新闻学与传播学领域期刊的高被引论文研究内容除有传统的新闻与出版工作、期刊评价、编辑质量控制外,还有新媒体、数字出版及期刊的国际化、产业化经营等内容。
以上研究对我们的启示:
(1)影响新闻学与传播学领域论文高被引的特征因素,既具有独立性,又相辅相成、互相促进,共同构成高被引论文产生的促进因素。因此,以上各因素具有一个就有可能产生高被引,但论文高被引往往受多种因素的影响。提高论文的质量需要参考现有知识的高质量论文,即高水平的研究更多建立在高水平的研究基础之上。但并不是参考文献越多越好。提高期刊的影响力要靠吸引高质量的论文,但也并非仅仅靠一两篇高质量的论文就行的,要提高期刊的整体质量才是期刊发展的长久之路。
(2)不同学科高被引论文现象具有不同的学科特征,由于学科性质不同导致高被引论文的形成机理、参考文献特征以及对影响因子的贡献度等不同。因此,我们要分学科研究高被引论文的现象,不能简单的拿不同学科之间进行对比,对于别的学科是否具有借鉴意义值得商榷。
(3)高被引论文的研究有其学术价值和实际作用,但该研究用于评价要谨慎,因为研究一般具有一定的局限性。
[1]牛昱昕,宗乾进,袁勤俭.开放存取论文下载与引用计量研究[J].中国图书馆学报,2012(4):119-127.
[2]Peritz B C.On the objectives of citation analysis:Problems of theory and method[J].Journal of the American Society for Information Science,1992,43(6):448-451.
[3]Hirsch J E.An Index to Quantify an Individuals Scientific Research Output[J].Proceedings of the National Academy of Science,2005,102(46):16569-16572.
[4]Moed HF.The impact-factors debate:The ISI's uses and lim its[J].Nature,2002,415(15):731-732.
[5]周晓英,董伟,朱小梅,等.图书馆学情报学高影响力论文特征及所反映的学科差异分析[J].中国图书馆学报,2012(4):99-109.
[6]屈清慧.30种药学期刊高被引论文研究[J].中国科技期刊研究,2008,19( 6):984-989.
[7]Elizabeth Sm ith Aversa.Citation patterns of highly cited papers and their relationship to literature aging:A study of theworking literature[J].Scientometrics,1985(7):383-389.
[8]Thomas A.Ham rick, Ronald D.Fricker, Jr., Gerald G.Brown,Assessing what Distinguishes Highly Cited from less Cited Papers Published in Interfaces[J].Interfaces,2010,40(6):454-456.
[9]刘雪立,徐刚珍,方红玲.如何提高医学期刊的影响因子—从《眼科新进展》论文分类被引情况谈起[J].中国科技期刊研究,2008,19(4):659-661.
[10]韩维栋,薛秦芬,王丽珍.挖掘高被引论文有利于提高科技期刊的学术影响力[J].中国科技期刊研究,2010(4):514-518.
[11]戴丽琼.2006~2010年《中国肿瘤》高被引论文分析[J].预防医学情报杂志,2012,8(5):392-396.
[12]R Tang,MA Safer.Author-rated importance of cited references in biology and psychology publications[J].Journal of Documentation,2008,64(2):246-272.
[13]GDWebster,PK Jonason,TO Schember.Hot topics and popular papers in evolutionary psychology:Analyses of title words and citation counts in evolution and human behavior,1979-2008[J].Evolutionary Psychology,2009,7(3):348-362.
[14]简琳,何静,周剑.论文被引的文本因素分析:多学科视角[J].图书情报工作,2011,55( 20):32-35.
[15]姜春林,刘学,张立伟.中文高被引期刊论文的参考文献也倾向于高被引吗?——以图书情报学为例[J].情报杂志,2015(1):105-109.
[16]姜磊,林德明.参考文献对论文被引频次的影响研究[J].科研管理,2015(1):121-126.
[17]邱均平,周春雷.发文量和h指数结合的高影响力作者评选方法研究——以图书情报学为例的实证分析[J].图书馆论坛,2008(6):44-49.
[18]盛丽娜.国际眼科学权威期刊不同文献对影响因子贡献度分析[J].中国科技期刊研究,2015,26(1):106-111.