向 飞 郑 斌
(《人民珠江》编辑部 广东 广州 510611)
科技论文公开发表的目的在于知识分享与传播,但由于种种原因,部分论文长达数年只是被浏览、下载,未被引用到后面的研究中,犹如昙花一现;也有不少论文,不止获得高下载量,而且频频被后来者引用。有关零被引、高被引论文特征的研究中,陈勇等[1]统计了出现次数排名前20 位的零被引论文的题名高频词,但具体原因未做深层次分析;骆超等[2]认为高被引论文的典型特征为知名作者、热点问题和专题综述;蔡明科等[3]统计分析了普通高校水利类学报零被引论文与互联网篇均下载量、第一作者属性、论文类型与主题分布、基金资助等因素的关系,未涉及工程类水利期刊;黄翠芳[4]虽然在2012年以水利工程类科技期刊为研究对象,对2006—2010年的总被引频次、Web 即年下载率等指标进行了统计分析,但未涉及零被引、高被引频次的原因分析。
在以上文献研究结果的基础上,本文以《人民珠江》2009—2018年发表的论文作为数据源,从Web 即年篇均下载次数、基金论文比、参考文献数量、作者合作度、题目词频等指标使用Excel软件、语料库[5]、图悦进行统计和可视化对比,以期为期刊的稿源筛选、影响力提升提供有益参考。
借鉴普赖斯定律确定核心作者的方法确定高被引论文:N≈0.749×为论文最高被引频次。选取被引用次数为0的论文,于2021年3月18日在中国知网引文数据库检索、下载,剔除资讯类文献如致谢、稿约、启事、勘误等,得到零被引的论文322 篇,高被引的论文230 篇。需要说明的是,零被引论文只是一个相对概念,只能说明一篇论文在研究时间内未出现任何引用。
2009—2018年《人民珠江》发表的论文中,被引频次最高为88 次,为孟现勇等在2016年7 期发表的《CMADS 数据集及其在流域水文模型中的驱动作用——以黑河流域为例》一文。将代入上式后圆整,得到N=7,即被引次数N≥7的论文确认为高被引论文。
图1显示,2009—2018年高被引论文的Web即年篇均下载频次最低为2015年的188 次,最高为2012年的334次,分别比同期的Web 即年篇均下载频次平均值119 次、108 次高了57.98%和209.26%;零被引论文的情况则刚好相反,其Web 即年篇均下载频次最低为2011年的44 次,最高为2017年的110次,分别比同期的Web即年篇均下载频次平均值89 次、166 次低了50.56%、33.73%。某种意义上来说,Web即年篇均下载频次大,被引频次就高。值得注意的是,鉴于网络下载论文全文需要付费,所以摘要的撰写就显得尤其重要。按照《科学技术期刊编辑教程》对摘要的定义,撰写摘要时,应向读者提供论文中全部创新内容和尽可能多的定量或定性的信息,重点放在“结果和结论”的撰写上。
图1 :Web即年篇均下载频次之对比
研究数据表明,2009—2018年,基金论文在零被引论文、高被引论文中的占比分别为13.66%、38.70%;同时,高被引占比存在2个峰值,分别出现在2011年、2015年,与此对应的,零被引占比均为0;基金论文比在2014年以后呈明显递增趋势,但高被引占比在2015年以后却呈下降趋势。这些提醒编辑部在审稿的时候,对基金论文不可盲目信之而应该客观对待[6],因为不排除作者投稿时为了顺利发表而随意挂基金项目;而且无基金资助的论文,不乏佳作,比如2008年1期发表的《采用一维水质模型计算河流纳污能力中设计条件和参数的影响分析》,没有受到任何基金资助,在当年发表论文中被引次数却最高。该文作者从事一线水文工作,在文中分析采用一维水质模型计算纳污能力过程中设计条件和参数对计算结果的影响,并讨论如何确定设计条件和参数[7]。此类论文逻辑清晰、实用性强,被引次数高在意料之中。
参考文献反映论文研究工作的背景,是科研工作的联系性、继承性与相关性的体现,同时也是论文作者对其研究内容已有研究知识脉络把握情况的反映,一定程度可以反映科研论文的质量与信息量[8]、[10]。对《人民珠江》2009—2018年零被引、高被引论文的参考文献数量用Execl 进行统计分析,发现10年里零被引平均引文数量虽然从2009年的3.14 篇增加到2018年的10.76 篇,呈逐年递增趋势,但整体增速仍低于高被引论文。参考文献数量越多,一方面意味着该研究汇总了之前的众多研究成果,综合性强,跨学科性高,因而容易吸引多个学科的研究人员的关注,论文的可见度增加,从而使得论文的被引频次越高。
对2009—2018年零被引论文作者人数用Execl 统计发现,近八成的论文作者数在1-3 人,4 人及4 人以上作者的论文数量则仅为两成。这10年里零被引论文的作者合作度计算如下:ξ0=∑(零被引论文篇数×作者数)/刊文量= (101×1+91×2+61×3+50×4+13×5+2×6+2×7+2×8)/322=2.36,同样地计算出高被引论文的作者合作度ξh为2.87。
就统计数据而言,随着作者人数的增加,零被引占比的下降趋势明显,高被引占比除了在作者人数为3时出现一个峰值,整体呈下降趋势。这说明适当地提高合著规模有利于降低论文零被引现象的发生,因为论文合著现象体现了不同学者之间的学术交流活动,促进了知识的共享与创新。
词频分析作为一种定量定性相结合的方法,克服了知识梳理过程中的主观缺陷,本文用于分析题目主题词。先进行词频统计,将下载的零被引、高被引论文题目的文本文件导入语料库,生成结果再用Excel 导出,并用图悦对于载入文本进行词频提取和词语(重要性)权重分析,生成可视化词频图。剔除题目常见的“研究”“分析”等词,只列出中心词,零被引、高被引论文题目的高频词对比见表1、2,词频见图2。可以发现,零被引论文中,题目出现“工程”“设计”“水库”的比例排前三位。分析原因,这类题目的论文多为工程实践类,大多是成熟的理论、方法的应用结果评价,或者是新方法在不同工程中试验效果的评估[3],论文中提及的思路或方法,缺乏深入研究的必要,而且同类的文章较多,造成零被引。而高被引论文题目词频排前三位的是“模型”“流域”“评价”,这表明高被引论文多集中于学科研究的热点问题,具有一定的理论深度和研究基础,处于研究的中上游,衍生发展的研究方向可能就多,其被引用的概率就高。
图2 :零被引、高被引论文题目词频(2009-2018年)
表1 :零被引高频词频统计
按照《中国学术期刊影响因子年报(自然科学与工程技术)》2019年版的统计,水利工程期刊共75 本,选排名第一、居中的A、B 期刊与《人民珠江》(PR)进行比较,结果见表3。与执牛耳的A 相比,PR 在ηmax、零被引论文占比、高被引论文占比均明显处于劣势,尤其是高被引论文占比,落后A 期刊47.62 个百分点,差距甚大。究其原因,A 为创刊最早的水利专业性期刊,主办单位在水利行业内具有极高的影响力,学科背景强大,且第一作者多为博士及博士以上学历[2]。《人民珠江》要追赶先天条件优越的A 期刊,还有很长的一段路要走,还需在提升期刊质量、扩大期刊影响力等方面多花心思、多下苦功。
表3 :三本期刊对比(2009-2018年)
对编辑部而言,减少零被引和提高高被引论文比例的措施建议如下。①严格审稿,“三审制”任一环节,都需严把质量关,在初审阶段,重点审查论文研究选题的科学性、前沿性和创新性和内容的规范性,尤其重视引导作者撰写规范的中英文摘要;外审阶段,定期更新审稿专家库,甄选负责的审稿专家做稿件质量的把关人,提升外审环节对优秀学术论文的识别能力;终审阶段,重点把控论文学术价值能否真正起到助推学科发展的作用,并审视论文的政治性、前沿性、创新性等核心问题[9]。②仔细编校,重视插图的编辑加工和表格的规范化。一篇优秀的论文,不仅要有内涵,格式也非常重要,美观的版面、清晰规范的图表都会给论文加分,读者的悦读感也油然而生,引用几率也会相应增加。③加大宣传与推广力度,多样化推送论文,比如充分利用期刊微信公众号平台,及时推送最新出版的论文全文,期刊网站开放期刊全文免费下载通道,方便读者查询与下载,从而提升论文传播效果。④多向知名作者约有关热点话题的专题综述。
表2 :高被引高频词频统计
对作者而言,①建议积极参与基金项目的申请,提高论文学术质量;②重视摘要、关键词的撰写,应摘录出原文的精华,有较多而有用的定性和定量的信息;③关注研究热点,注重研究意义,以提高论文的引证价值;④适当地提高合著规模,结合3.4节可知,随着作者人数的增加,零被引论文的占比明显减小。
利用文献计量的方法,借助Excel、语料库、图悦等工具,首次分析《人民珠江》在2009—2018年刊登的零被引、高被引论文特点,绘制零被引、高被引词频图。分析自身期刊的零被引、高被引论文,并与行业龙头期刊进行对比,并非自揭其短,而是在前进的道路上不断自省,从而更好地前行。该文亦可为同行如何减少零被引论文发表数量、调整选题方向和栏目设置提供有益参考。■