高校学报载文特征对文献指标影响的量化研究
——以《中国矿业大学学报》为例

2016-03-24 07:23姚志昌张贵芬朱文祥
中国科技期刊研究 2016年5期
关键词:载文学报论文

■姚志昌 雷 萌 张贵芬 朱文祥

1)中国矿业大学学报编辑部,江苏徐州金山东路1号 221008

2)中国矿业大学信息与电气工程学院,江苏徐州大学路1号徐州 221116

高校学报文献指标是反映高校学报学术影响力的主要标志,在了解所办期刊与其它期刊间的差距,摸索高校学报选稿方向、筛选尺度与刊出效果间内在关系方面具有重要作用。高校学报来稿涉及学科多,发表不同学科的论文对期刊文献指标的贡献有所不同,目前对高校学报载文特征信息与其文献指标之间的相关性缺乏深入了解。虽然,近年来有关载文分析方面时有报道,数量上也在不断增加,但其研究的面还远远不够大,研究的力度和深度也十分有限,需要拓展和深化[1]。统计分析载文信息有助于做好选稿工作、提高送审的准确性和审稿效率、提高编辑工作水平[2]。为此,高校学报编辑有必要了解期刊载文特征信息与文献指标间的相关性,从中找出引起期刊文献指标数据变化的深层次原因,站在编辑学的角度,借助数学方法表述期刊载文特征信息对期刊文献指标的影响,以管理学方法来提升高校学报的学术影响力。

高校学报文献指标是论文发表后的统计结果,与来稿数量有关。高校学报来稿量与高校学报被引量、下载量等文献指标之间的关系可利用数学建模得到拟合曲线,以此来分析、检验编辑成效[3]。高校学报来稿数量越多,编辑挑选优质稿件的机会增多,稿件淘汰率增大,有益于提高高校学报文献指标数值。通过建立期刊来稿量与期刊被引量、下载量之间的数学关系式,根据今后期刊来稿量可以对被引量、下载量进行趋势估算,但想深入分析影响期刊文献指标的关键因素还是不够的,况且来稿量是一个论文发表前的统计量,发表前后的论文的统计信息存在缺少专家审核环节这一“质”的差别,而且发表论文中有关特征信息也没有考虑进去。因此,在探讨来稿量对期刊文献指标影响的基础上,需要进一步研究期刊载文特征信息对其文献指标的影响,因为文献指标不仅与来稿量有关,也与载文作者单位、作者背景、基金资助情况、所属学科等特征信息密切相关。也就是说,只有对期刊载文特征信息进行多方位的统计,分析各个因素对高校学报文献指标的影响,才能够真正帮助高校学报编辑确立稿件的优选方向。

一般来说,高校学报载文特征信息包括载文作者单位、基金资助情况、所属学科、作者背景等。在作者单位、作者背景、基金资助情况、所属学科等载文特征信息中,鉴于论文在审稿时采取匿名审稿,作者的单位属性可以忽略。通常资助论文的项目都经过了项目立项、论证、评审程序,一般起点较高,具有较强的创新性,易产生原创性的研究成果,而作为研究成果最直接体现者的研究论文一般也具有较高水平[4]。由于多年来在初审环节高校学报编辑部看重基金项目对产出论文的支撑和影响,对校内外来稿都以基金资助为首选点,在判断来稿创新性上进行了选择[5],这样将作者单位、基金资助情况等载文信息予以忽略,而以载文所属学科、作者背景为主要的特征信息进行提取并统计。众所周知,影响因子是国际上通行的评价期刊学术影响力的重要指标;被引量反映研究人员在后续研究成果中的借鉴程度;web下载量反映读者对论文的感兴趣程度,将这3项反映高校学报学术影响力的文献指标作为衡量办刊水准和检验编辑效果的标志,与高校学报载文特征信息放在一起分析,研究高校学报文献计量指标数据背后隐含着的一些规律和本质,有助于提高对高校学报文献指标变化的深层次认识。在获得高校学报载文特征信息后,用数学方法建立高校学报载文特征信息与其文献计量指标之间的复杂非线性关系,对影响期刊文献指标变化的主要因素进行定量分析,为有目的地优选稿件提供依据。

1 研究对象

高校学报载文特征信息统计是一个费时费力的工作,有的高校学报在脚注上标注作者特征信息,有的高校学报缺失。为了研究方便,以《中国矿业大学学报》为实例,通过统计10年期间期刊载文特征信息与中国知网影响因子、中国知网被引量、web下载量、中信所影响因子和中信所被引量等5项文献指标的数据变化而对其相关性进行定量研究。

2013年《中国矿业大学学报》在1994种中国科技核心期刊中以综合评价总分91.9分位列第20位[6];2014年在1989种中国科技核心期刊中以综合评价总分85.2分位列第31位[7];2015年在1989种中国科技核心期刊中以综合评价总分84.7分位列第34位[8],虽然连续3年入选“百种中国杰出学术期刊”,但期刊的综合评价总分和排名逐年有所下滑,在与国内其它科技期刊的竞争中有许多要改进的地方。为了了解影响期刊综合评价总分的深层次原因,有必要对期刊载文特征信息进行统计分析,引导编辑优选稿件。2005—2014年《中国矿业大学》校内外来稿和基金资助情况见图1。从图1中可以看出,这些年来有国家级基金项目资助的稿件数量稳定提升;校外作者逐年增加,说明期刊能够吸引校外作者投稿,但在吸引国内一流学术论文投稿上还需努力,选稿方向和审稿尺度有待进一步改进以提升期刊综合评价总分及排名。

图1 2005—2014年校内外来稿和基金资助情况作者背景情况

2005—2014年《中国矿业大学学报》的论文作者背景如图2所示,图中显示博士研究生已经成为期刊的主要作者群体,近几年来发表论文所占比例不断上升。各学科发表论文如图3所示,图中显示矿业工程、地球科学这2个学科在期刊发文量中所占比例较高,而地球科学学科在期刊发文量中所占比例逐年提高。

图2 2005—2014年作者背景情况

中国知网影响因子、中国知网被引量、web下载量、中信所影响因子和中信所被引量等5项文献指标数值见表1所示。

图3 2005—2013年《中国矿业大学学报》各学科发表论文统计

表1 《中国矿业大学学报》各项文献指标值

表1中数据分别来自2005—2014年中国知网、中信所提供的期刊年度报告,这些文献指标虽然来自国内2家权威统计部门,选择期刊的群体不同、数量上有差异,但都能从不同角度反映期刊的学术影响力。以影响因子为例,中国知网提供影响因子普遍高于中信所提供影响因子,这是由于中国知网统计源期刊数量高于中信所统计期刊数量所致。2005—2014年这2家部门公布的影响因子变化趋势基本相同,中国知网影响因子(a)与中信所影响因子(b)的关系式为:b=0.9274a-0.0937,相关系数R2为0.9287,不同之处是分别代表了该期刊在中国知网统计源期刊、中信所建立的中国科技论文与引文数据库(CSTPCD)中的被引表现,这里收集期刊5种文献指标就是要从不同统计渠道、不同角度分析载文特征信息对某一文献指标产生影响的敏感度。

2 分析方法

2.1 基于互信息的直接分析方法

互信息(mutual information,M I)用于描述两个关系变量间共有信息的含量,其值越大表示变量间的共有信息量越大、依赖程度越强[9-11]。由于M I对变量间的线性或非线性关系描述具有较高的准确度和适用性,而高校学报的载文因子(作者背景、学科)与文献指标间为复杂的非线性关系,因此利用M I评估各因子与文献指标间的相关性是切实可行。对于某载文因子xi与文献指标yj,它们之间的互信息I(xi; yj) 定义为

(i=1,2,…,n;j=1,2,…,m)

式中:p(xi) 和p(yj) 分别表示 xi,yj的边缘概率密度;p(xi,yj) 为 xi与 yj的联合概率密度;n为载文因子数,m为文献指标数。方法实现步骤如下:

数据集:高校学报载文因子和文献指标数据集分别为Xt×n与Yt×m,即第i个载文因子为xi(i=1,2,…,n),第j项文献指标为yj(j=1,2,…,m),其中,n为载文因子个数,m为文献指标项数。

步骤1:归一化载文因子Xt×n和文献指标Yt×m;

步骤2:分别计算每个载文因子xi的信息熵H(xi),文献指标的信息熵H(yj)以及二者的联合信息熵H(xi,yj)。 其中H(xi)=

步骤3:根据熵的定义和连锁规则可得:I(xi;yj)=H(xi)+H(yj)-H(xi,yj),由此计算每个载文因子 xi和文献指标 yj的互信息I(xi; yj)。

2.2 基于平均影响值的模型评估方法

平均影响值(mean impact value,M IV)由Dombi等人提出,是用于评估神经网络中各输入变量对输出变量影响大小的最佳指标之一[12-13]。偏最小二乘(partial least squares,PLS)方法由 S.Wold和C.Albano等在1983年首次提出,综合了PCA、多元线性回归分析和和典型相关分析的功能特点,可同时完成数据压缩、变量间相关分析和回归预测,在处理样本容量小、变量间存在多重相关性问题方便具有独特的优势[14-16]。

基于平均影响值的模型评估方法是一种间接分析方法,先利用PLS方法来构建高校学报载文因子与文献指标的数学模型,然后引入M IV的计算策略,获得各载文因子对某文献指标M IV的累积贡献率(accumulative contribution rate, ACR)。 M IV值的大小反映了输入变量对输出变量的影响程度,其值越大,相应的ACR值越大,表明输入变量对输出变量的影响越大。方法的实现步骤如下:

数据集:高校学报载文因子和文献指标数据集分别为 Xt×n与Yt×m,即第i个载文因子为xi(i=1,2,…,n),第j项文献指标为yj(j=1,2,…,m),其中,t为样本个数,n为载文因子个数,m为文献指标项数。

步骤1:构建PLS模型,初始输入变量为载文因子 Xt×n,输出变量为文献指标 Yt×m,设置主成分数目并训练模型;

步骤2:更新PLS模型中的输入变量,将原矩阵Xt×n中xi的值分别±10%,得到新变量训练模型得到与其相对应的实际输出

步骤3:计算MIV值,公式如下:

步骤4:计算ACR值,公式如下:

3 结果分析

3.1 互信息法的结果分析

基于互信息的直接分析方法通过计算各载文因子与文献指标的互信息,对其共有信息的含量和相关程度进行标定。根据M I的定义可知,其值越大,该载文因子与文献指标的共有信息越多。正高、副高、中级、初级、博士生和硕士生等6个作者因子与中国知网影响因子、中国知网被引量、web下载量、中信所影响因子和中信所被引量等5项文献指标的互信息M I如图4所示。由图4可知,在作者因子中,这些年来正高职称、博士生作者所发表的论文对文献指标的影响起主导作用。

图4 作者因子与文献指标的互信息M I

矿业工程、建筑科学、地球科学、自动化与计算机、环境科学、数理科学、化学工业、其它等8类学科因子与各项文献指标的M I如图5所示。由图5可知,在学科因子中,矿业工程、地球科学学科对文献指标的影响起主导作用。

图5 学科因子与文献指标的互信息M I

3.2 平均影响值模型的结果分析

PLS模型对载文因子与各文献指标的拟合描述结果如表2所示,Eave为模型实际输出与期望输出间绝对误差的均值,R2为相关系数。从表中可知,PLS模型能够准确地表达载文因子与文献指标间的数学关系,即分析测试平台具有较强的准确性和可靠性,与M IV策略相结合可有效评估来稿因子对文献指标的影响。

表2 PLS模型的分析结果

基于平均影响值的模型评估方法以M IV为评估依据,PLS模型为分析测试平台,依次对各载文因子分别取(100±10)%,训练模型,通过计算载文因子的ACR值,获得其对文献指标影响程度的评估分析,其值越大则表示影响度越高,两者之间的相关性越强。6种作者因子对5项文献指标影响度的累积贡献率ACR如图6所示;8种学科因子对5项文献指标影响度的累积贡献率ACR如图7所示。在作者因子中,正高、副高职称作者所发表的论文对文献指标的影响高于其它作者;在学科因子中,矿业工程、地球科学学科对文献指标的影响高于其它学科。

图6 作者因子对文献指标的累积贡献率ACR

图7 学科因子对文献指标的累积贡献率ACR

4 结果与讨论

通过用互信息法——直接分析方法、基于平均影响值的模型评估方法——间接分析方法,以10年《中国矿业大学学报》载文特征信息与中信所、中国知网公布的期刊主要文献指标之间进行量化分析,结果显示学科因子的互信息M I值高于作者因子的互信息M I,科学地给出学科方向是对高校学报文献指标起作用的关键因素,为高校学报编辑有方向、有尺度地优选稿件提供依据。

用互信息M I值放在一起进行比较是因为其计算方法都是一样的,每个因子的互信息M I值不受其它因子影响;对于累积贡献率ACR值,它是基于PLS模型间接得出的,学科因子和作者因子的PLS模型是有区别的,学科因子和作者因子的PLS模型之所以有区别是在构建PLS模型中有一步是主成分分析,主成分分析要提取主成分个数,因为学科因子个数比作者因子个数多,所以ACR的高低比较的参考意义没有互信息M I大,鉴于载文中作者背景是以第一作者进行统计的,没有考虑论文中各个作者的背景及每个作者对论文的贡献,也没有考虑有些论文中将博士生导师列为第一作者而实际从投稿到修改结束整个工作都是博士研究生完成的这种情况,故文中得出的关于作者因子对高校学报文献指标的作用和影响的量化数值宜作参考。

从表1中可以看出,《中国矿业大学学报》在2008年、2011年影响因子有向下又返上的变化,根据文中给出的直接计算、间接评估结果:《中国矿业大学学报》学科中矿业、地球科学学科起主导作用并对文献指标贡献大,与图3a中矿业、地球科学学科这些年所占比例的变化趋势相吻合,证明该分析方法可行有效。笔者分管地球科学、自动化和计算机、机电、材料等学科,2009年开始将地球科学列为优选学科后,所占份额明显上升,由2009年的10.12%升至2014年的29.65%,期间《中国矿业大学学报》中国知网影响因子也由0.970的提高到1.552;中信所影响因子也由0.866提高到1.419(表1),效果显著。

高校学报在高等教育中、在青年教师和硕博士研究生培养中、在高校学科建设中的创新、累积、继承作用和知识创新的传播交流中,发挥了无可替代的作用,彰显了其强大的育人功能、学科培育功能和窗口效应[17]。通过对《中国矿业大学学报》文献指标影响因素的分析,看到了对《中国矿业大学学报》文献指标贡献明显的作者群构成:正高职称作者是高校学报学术影响力的重要贡献者,他们以前瞻的视野、丰富的学识、深入的研究而撰写的论文具备高被引的潜质;副高职称作者有晋级动力而亲自撰写论文,其中不乏擅长科学研究并脱颖而出之佼佼者,是高校学报学术影响力的主要贡献者;博士研究生是从事其导师承担科研项目的青年骨干,奋战在科研第一线,其中许多论文涉及导师承担科研项目的阶段性成果,是高校学报学术影响力贡献的生力军,由此看出具有高级职称、主持科研项目的作者是科技创新的引领者,承担和参与科研项目的作者是科技创新的助力者,吸引高水平科学研究团队中重要成员投稿是高校学报助推创新、提升学术影响力的根本保证。

高校学报发表论文涉及学科多,各学科创新步伐不一,应将对期刊影响力贡献度高的学科列为优选学科以提升高校学报的影响力、竞争力[18]。期刊的组稿者对一篇论文从初选到发表负有责任,在高校学报刊期不变、年载文量变化不大情况下,期刊每期载文中优选学科论文的增加,因其研究前沿、深入而使期刊载文被读者广泛关注,也因优选学科对期刊影响力贡献度高,期刊影响提升快而吸引更多优秀作者投稿,期刊受益明显。本文采用数学方法对《中国矿业大学学报》10年统计数据进行相关分析的结果表明:矿业工程、地球科学学科对《中国矿业大学学报》文献指标的影响起主导作用,与文献[5]中统计的2005—2013年《中国矿业大学学报》进入被引频次TOP10中比例最高的学科依次为矿业工程、地球科学、化学工业的结果相一致,也与2012年中国矿业大学在教育部学科评估中“矿业工程、安全工程位列全国第一、测绘科学与技术位列全国第三、地质资源与地质工程位列全国第四”的学科优势相符,这也再一次表明:高校学报找准了办刊的支撑点,发挥其自身学科优势,吸收来自国内其它高校优势学科的稿件,就可以让刊出的每一篇论文为高校学报文献指标带来不俗表现。

本文选取的期刊文献指标作为体现期刊传播力的量化指标,也是期刊评价体系中的重要指标,虽然不能完全等同于期刊的学术水平,但从另一方面能反映期刊选用稿件引领学术创新的力度和受社会上读者喜好的程度。在学术期刊“做最好的传播”与“引领学术”这两种功能中,传播功能是期刊主编与编辑可以努力做到的事情[19],通过学术期刊数字出版平台,将刊用论文在中国知网(网络版)优先发表,缩短出版周期以提高论文出版速度,有利于提高期刊的各项文献指标,而期刊文献指标的提升直接关乎期刊在综合评价总分中的排名。在社会上普遍存在期刊排名越前说明期刊的水平越高这样一个观点下,排名居前的期刊会吸引国内大批科研人员投稿,其中不乏引领创新的作者,为刊出高影响力的论文创造了条件。高校学报办刊人希望每一篇发表的论文都具有增量的学术价值,能提升期刊学术影响力,而提升期刊学术影响力最有效的方法就是提高期刊发表论文的被引量,这需要期刊审稿者具有远见卓识的鉴别力,在筛选稿件时就考虑其发表后所能带来的社会经济效益,争取论文发表后受益面的最大化以此带来期刊被引量的最大化。对于一篇论文发表后的高被引,笔者认为70%归功于作者的研究水平及表述;20%归功于评审专家对稿件提出的修改意见和要求;10%归功于期刊审稿者的鉴别力。但对于一篇论文发表后的零被引,尤其是其下载次数也不尽如人意时,50%的责任在期刊审稿者,30%的责任在论文评审专家;20%的责任在论文作者选题及表述欠佳。为此,高校学报办刊必须注重优选稿件,必须向具有优势学科支撑的方向发展,对于《中国矿业大学学报》而言,以国家能源战略发展方向为指引,以能源科学为主线,以优选学科为核心,拓展期刊发展之路、优选学科方向后势必给期刊学术影响力带来新的提升。

5 结论

(1)高校学报来稿量对其文献指标有显著影响,但从来稿量的变化上只能预测期刊文献指标的变化趋势,只有多方位统计来稿信息,通过建立互信息(M I)对期刊载文特征信息与其文献指标的相关性进行定量分析,才能为优选稿件指明方向。

(2)PLS模型能够准确地表达期刊载文特征因子与文献指标之间的数学关系,与M IV策略相结合可有效评估载文因子对文献指标的影响。基于平均影响值模型评估方法作为间接分析方法有助于分析高校学报载文特征因子对其文献指标的影响程度。

(3)学科方向是对高校学报文献指标起作用的关键因素,将对期刊影响力贡献度高的学科列为优选学科可以提升高校学报的影响力、竞争力。

[1] 颜志森,邓友娥.92期《中国科学》若干载文特征分析[J].中国科技期刊研究,2009,20(2):262-265.

[2] 李娟.论科技期刊载文信息的统计分析[J].中国石油大学学报(社会科学版),2015,31(5):92-95.

[3] 姚志昌,王继红,段瑞云.高校学报(自然科学版)学术地位现状与提升对策——以首届江苏省新闻出版政府奖获奖期刊编辑的视角[J].中国科技期刊研究,2014,25(1):124-127.

[4] 吴琼.《中国地震》载文信息及期刊评价指标的统计分析[J].中国科技期刊研究,2010,21(3):291-295.

[5] 姚志昌,曹召丹,郑雪萍,等.入选百种杰出学术期刊的特征分析与持续影响力对策[J].中国科技期刊研究,2015,26(8):862-869.

[6] 中国科学技术信息研究所.中国科技期刊引证报告(核心版)[M].北京:科学技术文献出版社,2013.

[7] 中国科学技术信息研究所.中国科技期刊引证报告(核心版)[M].北京:科学技术文献出版社,2014.

[8] 中国科学技术信息研究所.中国科技期刊引证报告(核心版)[M].北京:科学技术文献出版社,2015.

[9] SHANNON C E.A mathematical theory of communication[J].ACMSIGMOBILE Mobile Computing and Communications Review,2001,5(1):3-55.

[10] BACCIU D,ETCHELLS T A,LISBOA P JG,et al.Efficient identification of independence networks usingmutual information[J].Computational Statistics, 2013, 28(2): 621-646.

[11] YANG Jianbo,WENG Chongjing.An effective feature selection method via mutual information estimation[J].IEEE Transactions on Systems Man and Cybernetics Part BCybernetics, 2012, 42(6): 1550-1559.

[12] 史峰,王小川,郁磊,等.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010:184-188.

[13] 李鸿志,陶委,高婷,等.基于平均影响值的反向传播神经网络方法用于提高密度泛函理论计算Y-NO键均裂能精度[J].高等学校化学学报,2012,33(2):346-352.

[14] ROSIPAL R,KRAMER N.Overview and recent advances in partial least squares[C]//Proceedings of Workshop on Subspace, Latent Structure and Feature Selection.Bohinj:Lecture Notes in Computer Science,2006: 34-51.

[15] 王惠文,吴载斌,孟洁.偏最小二乘回归的线性与非线性方法[M].北京:国防工业出版社,2006.

[16] HUBERTM,VANDEN B K.Robustmethods for partial least squares regression[J].Journal of Chemometrics, 2003, 17(10): 537-549.

[17] 刘惠生.中国学术期刊的前世今生 [N].法制日报·法治周末,2012-09-13(21).

[18] 姚志昌.高校办刊在竞争中前行[N].中国新闻出版广电报,2015-12-30(7).

[19] 王浩斌.国家、市场与社会:学术期刊变革中的三维结构[J].中国矿业大学学报(社会科学版),2016(2):82-89.

猜你喜欢
载文学报论文
向本期载文的审稿专家致谢
《北京航空航天大学学报》征稿简则
向本期载文的审稿专家致谢
向本期载文的审稿专家致谢
文以载道与道以载文
致敬学报40年
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
学报简介