基于主成分分析的果树学期刊质量综合评价

2022-05-26 15:51和静王珂张莉
传媒 2022年9期
关键词:综合评价主成分分析质量

和静 王珂 张莉

摘要:文章利用主成分分析法,对15种果树学期刊中最具代表性的9种数据进行综合分析,提取出两个主成分,分别定义为影响力指标和引用指标;且获得了果树学科的期刊排名,并与扩展总被引频次、扩展影响因子排序进行比较,确认综合排名结果。本研究可以为果树研究工作者了解果树学科期刊质量提供参考。

关键词:果树学期刊 主成分分析 质量 综合评价

果树学科隶属自然科学,是农业科学的重要组成部分。我国果树学科的研究进展位居世界前列。由于果树学期刊数量较多,亟需对期刊质量进行综合评价。近年来,主成分分析在期刊评价中得到了一定应用。主成分分析法属于因子分析的一种,主要运用降维的思想,从多个指标中提取出少数几个互不相关且可代表指标大部分信息的新指标。新指标的含义可通过原始指标的载荷重新定义。在应用主成分分析法进行期刊综合评价时,无需考虑指标间的相关性对评价结果的影响,对每个指标实行等权重,避免了人为赋权的问题,通过降维从多个评价指标中提取少数主成分,并获得综合评价值,使期刊评价更直观、便捷,还可消除由较高自引率导致的影响因子虚高问题。

科技期刊在科技成果传播和沟通方面起着举足轻重的作用。研究论文是科技成果的载体,但由于无法逐一对单篇论文进行评价,因此发表论文的期刊还承载着论文评价的部分功能。根据定位、质量等内容,期刊已经得到了不同的分类和评价。

《中国科技期刊引证报告(核心版)》对13种园艺学科的综合质量进行了排序,但由于园艺学科较小,入选期刊分布于果树、蔬菜、菌类、经济作物等亚学科,研究内容差异较大,综合评价数据的指导意义不大。而《中国科技期刊引证报告(扩刊版)》只给出了园艺学科期刊18个评价指标数据,并未进行综合评价。因此本研究从《2020年版中国科技期刊引证报告(扩刊版)》中选取了15种发表果树方面研究论文的期刊,对具有代表性的9种数据进行主成分分析,以期获得果树学科的期刊排名,为果树研究工作者提供参考。

从《2020年版中国科技期刊引证报告(扩刊版)》40种园艺学科期刊中,筛选出发表果树方面研究论文的15种期刊,其中包括专门发表果树方面文章的期刊9种,分别为《北方果树》、《果农之友》、《果树学报》、《河北果树》、《落叶果树》、《山西果树》、《烟台果树》、《中国果树》、《中国南方果树》;还包括园艺学科综合类期刊6种,分别是《北方园艺》、《东南园艺》、《南方园艺》、《西北园艺》、《园艺与种苗》、《园艺学报》。

选择《2020年版中国科技期刊引证报告(扩刊版)》评价指标中具有代表性的9种数据进行主成分分析,即扩展总被引频次、扩展影响因子、扩展即年指标、扩展他引率、扩展引用刊数、扩展学科影响指标、扩展学科扩散指标、扩展被引半衰期和扩展H指标。

利用主成分分析法对果树学科期刊进行排序,并结合总被引频次和影响因子排序,分析主成分评价数据的可靠性。使用IBM SPSS Statistics 26软件的因子功能,对上述15种发表果树方面研究论文期刊的9种评价指标进行主成分分析。由于各个指标的统计或计算方法不同,数据大小差别较大,甚至不在同一数量级,为了消除不同指标数据之间的量纲差异,利用IBM SPSS Statistics 26软件的描述统计功能对数据进行标准化处理,以便开展主成分分析。

利用主成分分析法对果树学科期刊进行排序,并结合总被引频次和影响因子排序,分析主成分评价数据的可靠性。

1.数据适合度检验和相关性矩阵建立。主成分分析要求评价指标之间高度相关,该检验是对数据是否适合主成分分析所进行的检验。本研究中,KMO检验系数为0.772,Bartlett球形检验近似卡方值为270.954,显著性结果为P=0.000<0.001。这说明15种果树学期刊9项评价指标数据满足主成分分析的数据要求,数据之间具有高度相关性,结构合理。

利用标准化后的数据,计算获得相关系数矩阵。发现扩展总被引频次与扩展引用刊数、扩展学科影响指标、扩展学科扩散指标的相关度均较高;扩展影响因子与扩展H指标呈正相关;扩展引用刊数与扩展学科影响指标的相关度为1.000,表明二者完全正相关。

2.主成分的确定与荷载矩阵。利用特征方程,可计算得出各指标相关矩阵的特征值。本研究中,特征值大于1的主成分为前2个,第一主成分的特征值为5.950,方差贡献率为66.117%;第二主成分特征值为1.403,方差貢献率为15.589%;前两个主成分的累计方差贡献率为81.706%,大于80%,保留了原始数据中的主要信息。因此,选取前2个因子作为主成分,且二者互不相关。

确定主成分的个数后,对其数据进行提取,得到前2个主成分的因子载荷矩阵。前7个评价指标在第一主成分(F1)中有较高的正载荷,说明F1主要反映了总被引频次、影响因子和学科扩散程度,这7个指标主要反映期刊的学术影响力,因此将其定义为影响力指标主成分;扩展他引率和扩展被引半衰期在第二主成分(F2)中的载荷较高,由于这2个指标都与期刊引用有关,因此将其定义为引用指标主成分。

3.主成分综合得分及评价。根据前2个主成分的特征值计算得到2个主成分的特征向量,结合主成分得分计算公式,得到2个主成分的表达式。根据2个主成分的方差贡献率,计算出各个主成分的权重值(W1和W2),并加权求和。

W1=66.117/81.706=0.809;

W2=15.589/81.706=0.191。

所以,主成分综合评价值F=0.809×F1+0.191×F2,则筛选出的15种果树科技期刊主成分综合得分结果见表1。

4.主成分分析综合评价与扩展总被引频次、扩展影响因子排序比较。根据主成分综合得分获得期刊排序(见表2)。扩展总被引频次和扩展影响因子是期刊评价中最重要的两项指标,是期刊质量的体现。将主成分排序与扩展总被引频次、扩展影响因子进行比较发现,主成分分析排序的前三位与扩展总被引频次完全相同,后面期刊的排序也差异不大,两种排序的数差不超过2,大多排序仅相差1位或相同;而主成分分析排序与扩展影响因子存在较大差别,也在一定程度上说明影响因子排序存在局限性,不能完全代表期刊质量。

根據期刊原始数据对主成分分析的综合排名进行验证,发现主成分分析的结果与期刊质量基本吻合,各个指标得到了全面、综合的体现,综合排序具有可靠性。《北方园艺》作为综合排序第1位,入选中文核心期刊、农林领域高质量期刊T2梯队,该刊的四项指标均位列15种期刊的首位,两项指标位于第二位,扩展学科扩散指标遥遥领先,为该指标第二位数值的近两倍,为平均值的3.13倍,该刊作为第一位有明显的数据优势。《园艺学报》作为园艺学科的龙头期刊,由中国园艺学会和中国农业科学院蔬菜花卉研究所主办,是中国科技期刊卓越行动计划入选项目和中文核心期刊。该刊的指标数据较为平衡,在五个指标中均位列第二位,是园艺学科均衡发展的典型期刊,综合质量高,位列主成分分析排序第二位实至名归。《果树学报》是果树行业的领先期刊,是农业农村部主管,中国农业科学院郑州果树研究所主办的国家级果树专业学术期刊,影响因子多次位列园艺学科第一位,多次被评为中国科技核心期刊、RCCSE中国权威学术期刊(A+)、中文核心期刊和中国精品科技期刊等。该刊三个指标排名第一,另三个指标排名第三,位列主成分分析排序第三位。《中国果树》、《中国南方果树》、《园艺与种苗》的指标排名多位于第四、五、六位,因此分别位列主成分分析排序的第四、五、六位。其他各刊的排序也与该刊的质量相符。综上,主成分分析可以客观地显示各个期刊的综合质量,该排名具有较高的可靠性。

本研究对发表果树论文的15种园艺期刊进行综合评价,给出了果树学科内排名,经与扩展总被引频次、扩展影响因子排序发现,主成分分析排序与扩展总被引频次更为相似,而与影响因子的差别较大,同时也说明影响因子指标的片面性与局限性。这也与国内近年来提倡的“破唯影响因子”的方向一致。

本研究选取的9种指标中,只有扩展总被引频次和扩展引用刊数为统计值数据,这两者指标的排序也与主成分分析综合排序最为相似,而其他指标是计算获得的二级指标,排序与主成分分析综合排序差异较大,说明一手统计数据对综合评价的影响更大,原因可能是由于二级指标均由一手统计数据计算获得,在主成分综合评价中重复利用所致。在本研究选取的15种期刊中,有5种期刊入选中文核心期刊,且位居主成分综合排序前六位,仅第五位《园艺与种苗》未入选,说明主成分分析的评价结果具有很高的可靠性和通用性,少部分差异可能是因为不同评价体系的原始统计数据及指标权重存在差异。

《北方园艺》在综合评价中排名第一,但在中文核心期刊中排名第三,次于《园艺学报》和《果树学报》,且《北方园艺》未入选中国科技核心期刊,这可能是期刊定位差异造成的,《园艺学报》和《果树学报》为学术期刊,而《北方园艺》为技术期刊。主成分分析法完全根据数据进行评价,基本去除了一切主观因素,具有很高的客观性,本研究结果可为果树学科期刊提供客观的综合排序,给科研人员提供新的参考依据。扩展他引率排序后四位的期刊(《中国果树》、《中国南方果树》、《果树学报》、《南方园艺》),其扩展影响因子排序均较综合排序靠前,说明主成分分析法可以消除因自引率较高导致的误差。

主成分分析法具有降维、新主成分间互不相关等优点,但也不可在评价之中随意使用。首先,主成分分析要求数据之间有较高的相关性,符合KMO检验和Bartlett球形检验的要求,若不符合,则不能使用该方法进行分析。其次,在运用主成分分析时,要注意分析指标的方向性,若为逆指标,则需要做正向性处理,如本研究中的扩展被引半衰期,该指标表示期刊的老化程度,数值越大,代表期刊的更新发展越慢,因此需要正向化处理,否则会对评价结果产生影响。再次,主成分分析在提取主成分时摒弃了特征值小于1的若干主成分,这对数据造成了损失,但相较于因子分析,主成分分析的信息损失较低。有研究指出,评价对象较多时,信息损失更大。本研究中分析了15种期刊的评价指标,数据数量符合主成分分析的条件。最后,主成分分析的指标权重为等权重,避免了人为赋权的主观性,但当数据存在显著的权重不一情况时,使用主成分分析可能无法客观反映数据信息。

本研究利用主成分分析法,对15种果树学期刊最具代表性的9种数据进行分析,获得了15种期刊的综合排名。通过与期刊原始数据和其他部门评价信息的比对,确认综合排名结果。该排名是15种期刊综合质量的体现,各个指标贡献等权重,对指标数据的处理不含主观影响,客观反映了期刊的综合水平,为果树研究工作者了解果树学科期刊质量提供了依据。

作者单位 中国农业科学院郑州果树研究所《果树学报》编辑部

本文系中国农业科学院基本科研业务费专项“融媒体立体传播平台建设”(项目编号:1610192022302)的研究成果。

参考文献

[1]叶继元.学术期刊质量评价具有多元性与复杂性[J].清华大学学报(哲学社会科学版),2015(02).

[2]刘莲花.主成分聚类分析法在数学中文核心期刊综合评价中的应用[J].长江大学学报(自科版),2016(31).

[3]辛督强.基于主成分分析的13种力学类中文期刊综合评价[J].中国科技期刊研究,2012(02).

[4]中国科学技术信息研究所.2020年版中国科技期刊引证报告(扩刊版)[M].北京:科学技术文献出版社,2021.

[5]董寒青.解析SPSS对主成分分析的计算技术[J].统计与决策,2004(03).

[6]俞立平,刘骏.主成分分析与因子分析法适合科技评价吗?——以学术期刊评价为例[J].现代情报,2018(06).

【编辑:杨石华】

猜你喜欢
综合评价主成分分析质量
二年级下册期末质量检测(一)
10kV配电线路带电作业安全综合评价应用探究
基于熵权TOPSIS法对海口市医疗卫生服务质量的综合评价
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
郑州市各县(市)创新能力综合评价
睡个好觉