黄崇亚,卓选鹏,张 敏,欧阳丰
500篇医学高被引论文的特征分析
黄崇亚,卓选鹏,张 敏,欧阳丰
(西安交通大学期刊中心医学编辑部,西安 710061)
利用中国知网的“中国引文数据库”、万方数据知识服务平台等数据库,对中国1979—2014年间医学期刊高被引论文进行筛选,被引频次最高的前500篇论文为高被引论文,从被引次数、作者、参与机构、参考文献及基金资助情况等方面进行统计分析。统计结果表明:500篇高被引论文发表在2000年以后居多;主要分布在专科性较强的期刊;被引频次最高的为《各类脑血管疾病诊断要点》,年均被引频次为1 172.40;学科栏目中高被引论文所占比重前六位栏目为临床研究(20.8%)、综述(11.4%)、调查研究(7.8%)、技术方法(7.8%)、诊断标准(7.6%)、诊断指南(7.6%);主要分布学科为内科、外科、妇产与儿科学、中医药学、药学;作者人数多数为3位以内或1个机构;尽管有国家、省部级或其他基金论文,无基金资助的论文仍占85.4%;参考文献总数基本在14篇以内,且引用发表当年近3年文献的论文接近50%。
医学论文;高被引论文;期刊论文
高被引论文是指被引频次较高的论文,根据文献计量学的二八定律定义为被引频次前20%的论文,汤森路透公司[1]将其定为10年内论文引用次数排在前1%的论文。高质量、高被引的学术论文往往是比较重要的科研成果,代表较高的学术水平[2],是树立期刊品牌的重要基石,也是影响因子的主要贡献者[3],对其特征进行统计分析能够准确地反映医学学科发展现状及未来发展趋势和研究热点,有利于期刊的选题策划和组稿方向,为进一步明确办刊思路及组约优质稿源提供参考,为医学期刊学术水平和影响力的提升提供数据及理论支持。近年来,相关研究[4-8]主要是对医学的某一个学科或某一种杂志的高被引论文加以分析,而对大数据背景下的全医学学科高被引论文大样本量的统计及特征分析目前尚未见报道。本研究基于大数据下的全医学期刊1979—2014年间发表的前500篇高被引论文为研究对象,用文献计量学的基本理论与方法,通过纵向、横向研究对高被引论文加以分析、归纳、总结,旨在得出医学高被引论文具有的特征、影响因素及传播的规律。
利用中国知网的“中国引文数据库”、万方数据知识服务平台等数据库,发布时间选择1979—2014年,被引时段截止到2015年9月30日,对期间医学正规期刊发表的全部医学论文的被引用情况进行检索。
筛选出被引频次最高的前500篇论文为高被引论文,将其被引用次数等资料下载、保存、整理、分类,无误后导入SPSS 16.0进行统计分析。分析包括被引次数、作者、参与机构、基金资助情况、关键词数及参考文献等。
500篇高被引论文的发表年份为1979—2014年,如图1所示,2000年为峰值。以2000年为分界点,2000年以后的高被引论文要多于2000年之前,分析原因可能与2000年以后随着国家的科研评价体系的变化,国家对科研投入的不断加大,研究成果数量增加及质量提升有关。方红玲指出,我国大多数科技论文被引峰值出现在论文发表后第8年[9],2008年以后高被引论文明显减少可能与论文发表时间短尚未达到被引峰值年代有关。
发表高被引论文5篇以上的期刊一共27种(图2),其中居多的是中华类杂志18种,占66.7%。排名前五位的分布为《中华护理杂志》《中华心血管病杂志》《中华妇产科杂志》《中华结核和呼吸杂志》和《中华骨科杂志》,医学专科性期刊高被引论文较多。
500篇高被引论文中,筛选出前30篇高被引论文的被引频次和下载频次,如表1所示,可看出标准、指南、建议、方案等规范性、指导性、参考性的医学文献居于高被引文献的前列。被引频次列居首位的是发表于《中华神经科杂志》的《各类脑血管疾病诊断要点》,其总被引频次达23 448,年均被引频次为1 172.40。而下载频次最多的为发表于《中华高血压杂志》的《中国高血压防治指南2010》,其总下载次数达56 276次,年均下载次数为11 255.20次,与总被引频次为2 438次不匹配。客观来看,被引频次并不能完全反映读者的阅读需求。指南类文献实用性强,读者很可能下载阅读后直接指导临床应用,而不需要作为文献引用。本研究的结果也验证了关卫屏[10]提出的观点。
表1 前30篇高被引论文被引频次及下载频次
次序篇名被引频次下载频次 总被引频次年均被引频次总下载次数年均下载次数 27急性胰腺炎的临床诊断及分级标准(1996年第二次方案) 1 64986.791 05755.63 28《社会支持评定量表》的理论基础与研究应用 1 60472.916 152279.64 29症状自评量表(SCL-90) 1 58249.443 14198.16 30儿童支气管哮喘防治常规(试行)1 569130.752 073172.75
500篇高被引论文中,所占比重最多的栏目为临床研究(20.8%),其次为综述(11.4%)、调查研究(7.8%)、技术方法(7.8%)、诊断标准(7.6%)、诊断指南(7.6 %)。这前六位栏目共包揽500篇高被引论文的63%。高被引论文所属的栏目显示,医学高被引仍以临床研究为主,其次是综述性的文章,通过大数据下的大样本量的统计与分析,本研究也验证了大家所说的综述论文容易高被引的观点。
对医学高被引论文10篇以上的学科分布进行对比分析发现,自1979—2014年间,内科、外科、妇产与儿科学、中医药学、药学一直稳居高被引学科的前列。除此之外,2000年以前,高被引学科还包括心理学、神经病学与精神学、临床医学综合;2000年以后护理学、预防医学与卫生学、肿瘤学、综合性医药卫生跻身于高被引学科前列,特别是护理学,跃居于第2位。说明自2000年以后,护理学研究逐渐成为热门,预防医学与卫生学也越来越受到重视,可能与我国人口老龄化与国际提出的健康中国2030规划需要以预防为主,关注老年护理与康复有关,同时由于肿瘤的高发使得肿瘤学相关的研究人员与机构越来越多,综合性医药卫生居于高被引前列,说明在2000年后医学相关学科有了长足的发展。
作者地区分布前5位分别为北京、上海、广东、江苏和四川,占71.7%。北京地区比例最大,占到48.6%。这与北京地区雄厚的科研力量、众多科研参与人员、丰富的资源以及独特的先天优势是分不开的(见图4)。
表2 高被引论文的学科分布
作者数量上来看,独立作者占20.8%,2位作者的占19.2%,3位作者占13%,作者数在3位以内(不包括没标识)的占到了53%;集体作者中1个机构占63.2%,2个机构占14.4%(见图5和图6)。
500篇高被引论文受基金资助情况,如表3所示。各类基金资助论文共73篇,其中国家级项目论文有36篇(7.2%),省部级项目论文29篇(5.8%),其他项目论文8篇(1.6%),其余427篇(85.4%)为无基金资助论文。在1996—2005年这10年间的基金项目论文达63篇,占全部项目论文的86.3%。提示在2000年前后,国家、省部级各类资助单位提高了对医学科研项目的重视程度,随之而来科研成果喷涌而出。值得注意的是,有85.4%的高被引论文无基金资助而篇均被引频次达737.4次,这提示期刊编辑人员在审稿过程中,要善于发现那些没有基金资助,但科研价值较高、有高被引潜力的稿件。
表3 高被引论文基金资助情况
500篇高被引论文篇均参考文献数(13.2±12.3)篇,其中中文参考文献数为(5.8±6.9)篇,英文参考文献数为(9.6±10.0)篇,发表当年近3年的参考文献数为(5.8±6.5)篇。各类参考文献数量及频次如表4所示。约60%的高被引论文总参考文献数在14篇以内,其中81篇其总参考文献数为0的文章栏目类型为诊断标准、指南、方案、会议纪要、技术方法等。调查研究类文章的参考文献总数基本在3~14篇之间。接近50%的高被引论文引用了发表当年近3年的文献,这提示编辑人员在稿件的审理过程中尤其要注意对参考文献的关注,同时也提示作者在做课题研究的同时要时刻关注国内外相关领域的最新动态,将有利于扩大研究成果的影响力。
表4 高被引论文参考文献数量情况
本课题在大数据的海量医学文献的基础上,不分刊源、不细分学科,共筛选出前500篇高被引论文,进行统计特征分析。结果显示:高被引论文多集中在2000年以后;发表在医学专科性强的期刊较多;标准、指南、建议、方案等规范性、指导性、参考性类的文献居于高被引文献的前列;学科分布以内科、外科、妇产与儿科学、中医药学、药学为主;作者人数多数为3位以内或1个机构;尽管有国家、省部级或其他项目论文,无基金资助的论文仍占绝大多数;参考文献总数基本在14篇以内,且引用发表当年近3年文献的文章接近50%。编辑人员在审稿过程中,可参考本次研究成果,发现科研价值较高、有高被引潜力的稿件。
[1] Thomson Reuters. Essential science indicators [EB/OL]. [2017-07-22]. https://esi.incites.thomsonreuters.com.
[2] 徐伟,张军,沈志超.科学产出的文献计量学研究[J].中华医学图书情报杂志,2003,12(2):55-57.
[3] 韩维栋,薛秦芬,王丽珍.挖掘高被引论文有利于提高科技期刊的学术影响力[J].中国科技期刊研究,2010, 21(4):514-518.
[4] 杨红芸,孙波,王晴.17种口腔医学核心期刊高被引论文的特征分析[J].中华医学图书情报杂志,2013(12): 75-78.
[5] 尚淑贤,吴晓初.1999—2008年皮肤科学高被引论文特征分析及思考[J].中国科技期刊研究,2012,23(3): 397-400.
[6] 方红玲.2003—2008年眼科学高被引论文统计分析[J].中国科技期刊研究,2010,21(2):197-200.
[7] 胡清华.《浙江大学学报(农业与生命科学版)》2002—2011年高被引论文特征分析及启示[J].中国科技期刊研究,2013,24(4):699-702.
[8] 张晓丽,乐建鑫.《东南大学学报(自然科学版)》高被引论文特征分析及启示[J].中国科技期刊研究,2012, 23(6):1008-1012.
[9] 方红玲.我国科技期刊论文被引量和下载量峰值年代——多学科比较研究[J].中国科技期刊研究,2011,22(5):708-710.
[10] 关卫屏,游苏宁.《中华儿科杂志》未被引文章分析[J].编辑学报,2008,20(6):560-562.
中国高校科技期刊研究会专项课题资助项目(CUJS2017-002);陕西省出版科学基金重点资助项目(17ASC01)