温学兵, 刘 洋
(1. 沈阳师范大学 学报编辑部, 沈阳 110034; 2. 沈阳师范大学 数学与系统科学学院, 沈阳 110034)
结构方程模型在科技期刊量化指标研究中的应用
温学兵1,2, 刘 洋2
(1. 沈阳师范大学 学报编辑部, 沈阳 110034; 2. 沈阳师范大学 数学与系统科学学院, 沈阳 110034)
期刊量化评价指标现有20多项,新的量化指标还在不断涌现。因此,研究各项评价指标的特点、规律、相关关系以及对各指标间的结构进行分类和探讨尤为重要。结构方程模型利用不同统计方法对大样本进行结构关系分析,不仅具有先验性,还可以同时检验测量变量和潜在变量。介绍了结构方程模型的原理、应用及其专用软件AMOS,详细描述了其在期刊量化指标应用中的研究进展,分析了相关研究的优缺点,对文章的样本量、拟合指标数据、AMOS软件操作等注意事项进行了分析和探讨。研究表明,结构方程模型方法在期刊量化指标结构关系中研究具有重要的实践意义,但需进一步拓展研究深度和广度,重视并完善方法应用的规范性。
期刊评价指标; 结构方程模型; 测量模型; 验证性因子分析
结构方程模型(Structural Equation Model,SEM)的问世使得很多研究方向的难题都找到了解决算法。从提出至今,SEM被广泛地应用在心理学、社会学、教育学等领域。尽管近几年才开始应用在学术期刊评价中,但也受到了大量学者的关注和研究。
因素分析(factor analysis)和回归分析(regression analysis)可以说是过去一个世纪统计方法中,影响社会科学研究最大的。1904年,Spearman提出了心理特质的潜在结构因素分析模型,开启了潜在变量模型的大门[1]。1918年,Wright将回归分析深入到多重联立方程中,把回归分析提升到了一个更高的层次,进入路径分析的层面[2]。Joreskog在20世纪70年代时将因素分析与路径分析2种范式结合在一起,创立了量化研究中新的范式,并宣告结构方程模型的到来[3]。具体而言,因子分析对结构方程模型的贡献体现在2个方面:1)潜变量的概念;2)基于变量之间的协方差矩阵来估计模型的参数。路径分析对结构方程模型的贡献体现在3个方面:1)结构方程模型的基本形式;2)路径图的产生;3)用直接效应与间接效应来反应变量间的相关效应。迄今为止,结构方程模型已经拥有专属于他的期刊《Structural Equation Modelling》,同时也有LISREL、AMOS、Mplus等专门负责统计的软件以及相关论坛。在国内,结构方程模型在社会科学领域上的应用越来越多,对问题分析的角度更加广泛[4]。结构方程模型被称为社会科学定量研究领域第三代定量模型和第四代定量模型之间的桥梁,它将测量模型和因果模型二者相结合,实现了社会科学描述性研究和解析性研究的统一,也实现了研究层面的突破。
结构方程模型是一种具有良好发展前景的统计方法,其主要特点如下:
1) SEM中的模型是一种建立在原有理论基础上的,因此在全部SEM分析过程中,必须要求每个步骤都有清晰的理论概念和逻辑推理。
2) 通常情况下,SEM所处理的数据都是大样本的。其中,若样本数量少于200,则得到的结论便会不稳定,而200以上数据量才算得上是一个中型样本[5]。当然,随着研究学科和指标数量的不同,样本量的要求也会随之改变,这就要具体情况具体分析了。
3) SEM是一种包含了很多统计分析程序的新的统计分析方法。其中统计分析技术大体分为平均数检验的方差分析和线性关系的回归分析2大类,而SEM就是借用线性模式分析技术的一种变量之间的相关关系分析方法。
4) SEM以多个变量形成的总体为研究重点,因此不以某个单一变量为重要参考。同时,由于SEM是对整体关系的考量,也使得应用者能够在各个角度分析和研讨。
5) 在研究中,由于对同一组变量有不同的理论观点或者对假设关系的不同主张,研究者可以基于不同的理论基础和假设前提设计出不同的代替模型(alternative model),然后进行比较。
6) 结构方程模型在处理数据的时候可以同一时间对多个变量进行分析和处理,也能够接受自变量和因变量之间具有误差。
7) 在对潜在变量的处理过程中,一个潜在变量可以由不止一个外生变量组成,而且对变量的信度和效度都可以同时处理[6]。
随着结构方程模型的发展,与其相关的软件也随即产生并应用在各个领域中。这些软件总体上呈现2种趋势:1)方便用户体验和学习,即将原来复杂繁琐的方程式改变为容易操作的直观的交互界面;2)需要像Mplus一样超出SEM范畴并纳入新的统计模型的软件。
AMOS是Analysis of Moment Structures的缩写,最早属于SmallWaters公司产品,后由SPSS公司收购并独立研发。由于最早用于SEM的软件LISREL软件重新独立,SPSS不得不寻找到可以替代LISREL的软件,因此,AMOS迎运而生。AMOS软件的使用可以完全独立于SPSS,同时也可以识别Microsoft Excel、文本文件、Microsoft Access等格式的文件。AMOS可以进行协方差结构分析(Analysis of Covariance Structures),因此AMOS又被称为协方差结构分析、验证性因子分析、潜在变量分析。AMOS的一大特色就是软件中用绘图的形式代替了编写程序,将路径图可视化,可使用鼠标拖拽的方式构建模型。在某些方面,AMOS的功能较SPSS强大,例如AMOS不仅可以路径分析、区间关联性分析,还可以检验变量在多个组群中的相关关系。与此同时,AMOS软件还可以检验数据与假设模型之间是否具有拟合关系并探索最适合的模型。不过,尽管AMOS软件操作简单,用绘图工具就可完成模型构建,但是一定要遵守结构方程模型的理论要求和模型的严谨性。
首先,根据先前的理论和已有的知识脉络,经过推论和假设形成一个关于一组变量之间相互关系的模型。然后,经过测量,获得一组观测变量数据和基于此数据而形成的协方差矩阵,也称为是样本矩阵。而SEM的目的就是将构想的假设模型与样本矩阵的拟合程度进行检查。若假设模型可以和样本矩阵拟合,就说明模型是成立的;否则就要对模型进行修正。假设修正后仍然不能拟合,那说明假设的模型是有误的,此时就要对模型进行否定从而重新假设模型;假设修正后可以拟合,那就说明前面的假设仍然具有一定可信度。
4.1 样本量选择和模型初建
SEM是一种适合大样本检验的统计方法,因此所支持的样本量固然越大越好,并且当样本量足够大的时候,最大似然估计也会变得渐近有效[4]。但是这个大量的标准不尽统一。一般情况要求最小样本量要在200以上,才能得到一个相对稳定的模型,样本量较小时,模型在估计时可能会出现偏误现象[8]。当然也有学者认为样本量应该是待估计的自由参数的5~10倍才算上是可以接受的。到现在还没有一个准确的标准。也可以用下面的公式进行最小样本量的计算:
Nmin=Ni×df
其中:Nmin表示最小样本量;N表示观测变量的个数;df表示自由度。
模型的建立要有一定的理论进行支持,模型的设定不是学者的一厢情愿也不是由研究者凭空想象。设定测量模型时,要基于前人已经检验过的测量变量或者是具有内容效度的测量变量。这其实是一种验证性的因子分析(Confirmatory Factor Analysis)而不是探索性因子分析(Exploratory Factor Analysis)。而在确定测量变量的个数时要注意:每个潜在变量尽量要有4个或更多测量变量;多个潜在变量存在时要求每个潜在变量至少要有3个测量变量;最好不要用只含1~2个测量变量的潜在变量[8]。在结构方程方面,设定路径关系时不能盲目地连接任意2个潜在变量,而是要分析实际研究的问题的关系得出相应假设后再添加路径关系。
结构方程模型由结构模型(structural model)和测量模型(measurement model)组成,完整的结构方程模型是要同时包含以上2个部分的[5]。用方程式的形式表示为
结构方程描述了潜在变量之间的关系,测量方程描述了潜在变量和测量变量之间的关系。上文提到潜在变量和测量变量,潜在变量是指实际中无法直接测量的变量,例如期刊评价中的影响力情况、传播力情况等;测量变量是指可以直接观察并测量的变量,例如高校学生的身高、体重等变量都是可以测量并用以研究学生的体质情况。张建平最早提到结构方程模型并对结构方程模型进行了较为详细的叙述和分析[9]。SEM可以用路径图表示出各个变量之间的相关关系,在SEM的路径图中,常常使用椭圆形或圆形代表潜在变量,用矩形表示测量变量,用单箭头表示一个变量(自变量)对另外一个变量(因变量)具有直接的相关关系,双箭头表示二者变量之间具有相互关系如图1所示。
4.2 模型识别
模型的识别关系到假设模型是否能够成功拟合,前提是模型必须恰好识别或者过度识别。因为当模型的识别度较低或根本无法识别的时候,在模型拟合过程中会因为各种统计分析的原因导致模型无法成功拟合。识别是为了检测能否根据数据求得每一个自由或者位置参数的唯一估计值。无法识别或者识别不足说明符合条件的解有很多,即参数个数大于方程个数。恰好识别说明符合条件的解有且仅有一个,即参数个数等于方程个数。过度识别说明符合条件的情况很多,即参数个数小于方程个数。
图1 SEM原理图
模型的识别是一项较为复杂的过程,在AMOS软件中,若模型不可识别,软件会自动停止拟合,这种情况下研究者就要根据理论知识对模型的设定进行修改。
4.3 模型拟合和模型修正
模型进行识别完成,就要对产生的模型进行估计,也称为拟合。拟合目的就是求某个参数式的模型隐含的协方差矩阵与样本协方差矩阵“S”之间的“差距”最小。对模型的估计中参数的估计常用“t”值,而对模型估计的方法有两阶段最小二乘法TSLS(two-stageleastsquares)、最大似然估计ML(maximunlikelihood)、广义最小二乘法GLS(generalweightedleastsquares)、非加权最小二乘法ULS(unweightedleastsquares)、一般加权最小二乘WLS(generallyweightedleastsquares)。常用的估计方法是ML和GLS。
在评价模型的时候要注意几个指标,包括:
1) 比较吻合指数(CFI),对CFI的要求是越趋近于1,拟合程度越高。常用0.95标准监测。
2) 近似误差的均方根(RMSEA),对RMSEA的要求越趋近于0,拟合程度越高,常用0.05的标准检测。
3) 离中参数(RNI),对RNI的要求越趋近于0,拟合程度越高,常用0.06的标准监测。
4) 拟合优度指数(GFI),对GFI的要求越趋近于1,表示拟合程度越高,常用0.9的标准监测。
当然在模型估计的时候也有其他标准,比如卡方自由度比也可以用来判断模型的拟合。因子载荷量λ>0.55代表拟合较好,λ>0.63代表拟合非常好,λ>0.71代表拟合优秀,而λ<0.55则表示拟合结果一般。
在对模型的估计和评价时发现结果并没有拟合或者拟合程度不满意,就要对模型进行修正,例如上一段中提到λ<0.55的情况,不同的统计软件有它各自的修正方法。若修正后的指标都在评价的范围内,则说明模型符合目标;若修正后的指标仍不能满足拟合,那么就要否定原始模型重新进行构建。
在AMOS软件中, 当假设模型与观测样本无法拟合时, 软件会给出修正指标(ModificationIndices), 研究者就要根据软件给出的修正指标来添加或者删去相应的路径关系, 以达到优秀的拟合度。
模型修正要注意节省原则:在修正拟合时,如果2个模型的差别不大,要选择简单模型;若相差很大,要选择较为优化的一个。最后要达到模型参数较少但符合实际意义[5]。
YueWeiping[10]等人首次将结构方程模型应用在期刊量化评价领域,并对期刊中的评价指标进行了系统分类研究,但是作者未给出实证研究。
俞立平[11]等人在2009年将结构方程模型应用于学术期刊评价,同时首次进行了实例验证。作者客观地评价了结构方程模型的优点和局限性,并认为结构方程模型为学术期刊评价提供了新思路。作者以2004版中国科技期刊引证报告(扩刊版)中518种医学期刊数据为研究目标,分为影响力、时效性、期刊特征3类一级指标并下设总被引频次、影响因子、即年指标、他引率、扩散因子、学科影响指标、学科扩散指标、引用半衰期、他引半衰期、基金论文比、平均作者数、平均引文数、海外论文比等13个二级指标。在这13个指标中,由于引用半衰期和被引半衰期是2个反向指标,因此将这2个指标用100做了反向处理。在得到标准化数值后,作者使用结构方程专属软件AMOS7.0对数据进行模型拟合,检验方法采用极大似然估计法,发现有3个指标并不符合拟合标准,最终舍弃。再对剩下的10项指标进行最后拟合检验。拟合结果显示所有指标均显著且卡方值为42.06,GFI=0.868,IFI=0.801,CFI=0.800,RMSEA=0.159。总体上拟合度是良好的。作者将每个一级指标下的题目按照路径系数进行标准化处理,给出了计算公式,同时运用专家打分法将3个一级指标赋予权重。最后根据上述评分方法将医学类前20种期刊进行评价打分得出排名。但根据SEM原理以及AMOS软件的拟合要求,文章中的时效性只有2个测量变量,不符合结构方程中每个潜在变量都需要2个以上测量变量来估计的要求。同时,若想要得到较好的拟合,因子载荷量要求λ>0.55[5],文章中的实例验证不满足这个要求。
毛国敏[12]等人在2013年再一次将结构方程模型应用在期刊指标的分类研究上,明确地给出了初始模型标准化与非标准化模拟结果,同时也给出了模型修正的过程。作者基于2011年版中国学术期刊影响因子年报(工程技术类)中297种期刊数据,设定影响力因子和传播因子2个一级指标,下设总被引、影响因子、他引影响因子、即年下载率扩散系数5个二级指标,并加入一个为扩散系数的新指标:被引期刊数与引用期刊数的比值。作者先对期刊0-1标准化处理公式[13],即
在对数据结构检验前,进行了样本数据的正态分布检验。由于结果显示样本不能满足正态分布,因此作者选用AMOS软件提供的广义最小二乘估计(GLS,Generalized least squares)法进行模型拟合检验。初次检验结果显示有一部分拟合指数不满足合理的范围,因此对原模型进行修正,并最终得到拟合度较好的模型。其中卡方值=2.807,GFI=0.094,CFI=0.989,RMSEA=0.078。最后作者得出了影响力因子与总被引、他引影响因子、影响因子这者之间存在结构关系分别为0.43、0.99、0.91,反映了期刊的影响力情况;传播因子与即年下载率、扩散系数之间存在结构关系分别为0.74、0.51,反映了期刊的传播情况。然而,文章中传播因子这个潜在变量下也只有2个测量变量,不太符合SEM拟合时的要求。
程慧平等人[14]在把SEM应用于期刊研究时选择的9项指标分为2类:期刊引用计量指标和来源期刊计量指标,下设5项和4项二级指标。作者选取《2012年中国科技期刊引证报告》(扩刊版)中的544种期刊数据,首先对所有数据进行标准化处理,处理方法与毛国敏文章数据处理方法相同,再使用SPSS22软件对标准化数据进行信度和效度检验,结果发现期刊引用因子中的扩散因子的因子载荷量为负值,与常识不符,予以删除。而来源期刊因子下所有4项指标均具有良好的信度,最终保留了除去扩散因子以外的8项指标,而恰好这8项指标整体上也具有良好的收敛效度。然后,作者给出了初始假设模型并利用AMOS20对模型进行模拟检验。结果显示其中总被引频次和来源文献量2项指标的因子载荷量与实际情况不符,总被引频次严重偏离正态分布,而来源文献量得到了本应该为正却显示出负的载荷量。作者最终删掉了这2项指标。再次对剩下的6项指标重新模拟检验,结果显示并没有优秀拟合度,此时作者根据修正指标的要求进行修正处理,并得到了样本数据与假设理论模型之间良好的拟合。最后,作者对组合信度进行了计算,得到2个潜在变量之间较高的组合信度,也说明了模型内在的质量很好。作者的实验结果总体上看是很优秀的,但遗憾的是并没有说明数据是否来源于同一个类别,无法识别结论是否具有普遍性。不同类别之间的期刊指标数据存在着拟合良好的情况可能是巧合的,同时只有在同一个类别内寻找相关关系才具有实际意义。不能按照自己的意愿去得到自己想要的结论,才能为期刊评价提供可实施的方案[15]。
赵婧等人[16]利用SEM对科技期刊发展的影响因素进行了研究。利用定量的分析方法并结合PEST模型以及价值链模型,验证影响因素之间的相关关系。文章数据来源于调查问卷,在国内统一CN刊号内N-Z中的1 000种刊物随机发放问卷,最终在1 000份问卷中选出有效问卷457种进行分类检验。通过模型指标的识别过程舍去了文章类型、组稿能力等8项指标,并最终确定了包括有政治因素、基础活动在内的6项一级指标和收入方式、经济发展、数字化在内的33项二级指标。再利用AMOS软件进行拟合检验。配适度报表中显示一些指标无法达到标准,因此根据修正指标进行模型修正,最终达到标准,找到了各个潜变量指标之间的结构关系。在这里,笔者发现模型中有一些测量变量与潜在变量之间的载荷量并没有达到最低λ>0.31的标准,例如收入方式与基础活动之间只有0.14的相关度。按照SEM的原理要求,这种情况该潜在变量是无法解释测量变量的,应该删掉[7]。
陈小山等人[17]结合因子分析方法利用SEM对期刊评价指标进行了结构关系的研究。根据软件输出报表的呈现,得到了一个较优秀的结果,是把SEM应用在期刊量化指标研究上拟合效果较好的一个结果。不仅对数据的信度进行了检验,也利用因子分析对其数据的结构效度进行了验证。通过指标的分类和拟合验证,指出影响因子和5年影响因子之间的相似度较高,可以用其中之一代替二者。而平均引文数和可被引文献比并没有很高的可信度,因此二者在指标评价中也不可能占用很高的权重。作者选用2014年版中国学术期刊影响因子年报中自然科学与工程技术类中数学、地质学、食品科学、物理学等6类共252种期刊进行研究,选取包括综合总被引、基金论文比、总下载量在内的14个评价指标。作者对所有指标的信度和效度进行了检验,通过Kaiser标准化方法对14个指标分类并建立起初始模型。其中第1类一级指标为篇均指标,下设影响因子、他引影响因子、5年影响因子、即年指标、平均引文数、web下载率、历史影响因子等个二级指标;第2类一级指标为比例指标,下设基金论文比和可被引文献比2个二级指标;第3类一级指标为规模指标,下设可被引文献量、引用期刊数、被引期刊数、总下载量、综合总被引等5个二级指标。模型设定后用AMOS软件进行拟合检验,结果显示每个一级指标与其二级指标之间均存在结构关系。由于各项适配指标检验结果显示绝大多数拟合情况都达到标准,因此作者并没有进行修正。这种情况在SEM检验时属于少数情况,多数检验都无法一次性达到标准,需要修正。这应该和作者选取数据时先抽取满足正态分布的数据有关。在SEM样本选定时最好选取相同类别的期刊指标数据,得到的结果才有代表性。为了得到满意的结果而随机选取类别差别太大的期刊的数据,即使得到较好的配适度,这样的结果也未必有太大的实践意义。
结构方程模型在期刊领域的研究指标见表1。
表1 SEM应用于期刊评价研究统计表
续表1
统 计检验量适配标准文 章 作 者俞立平等毛国敏等程慧平等赵婧等陈小山等二级指标总被引频次、扩散因子、学科影响指标、学科扩散因子、影响因子;被引半衰期、即年指标、引用半衰期;平均引文数、地区分布数、海外论文比、基金论文比、平均引文数。总被引、影响因子、他引影响因子;即年下载率、扩散指数。影响因子、即年指标、学科影响指标、总被引频次;平均引文数、平均作者数、基金论文比、来源文献量。政策关注、政策适应……;经济发展、竞争强度……;新媒体技术、出版技术……;开放获取、科技评价;读者群、作者群、收入方式;经典支出、编委会……。综合总被引、影响因子、他引影响因子、5年影响因子、即年指标、可被引文献量、基金论文比、平均引文数、引用期刊数、web即年下载率、总下载量、历史影响因子、可被引文献比
SEM的问世为社会和行为科学研究界对于抽象理论的验证提供了一套严谨的程序,研究者可以用统计学的理论来分析和检验理论模型的正确性,将假设检验的运用由一个参数的分析提升为多个参数的高层次分析,突破了无法整合理论模型的窘境。SEM已经成为多个学科领域理论发展的工具,促使研究人员不断优化变量结构关系以及结构构思,使得理论与实际更完美的融合[18]。SEM还属于中年时期,拥有强劲的后劲和发展空间,希望更多的研究人员能够注意到结构方程模型并应用在不同学科领域中。
[ 1 ]SPEARMAN C. General Intelligence[J]. Objectively Determined and Measured, 1904,15(2):292.
[ 2 ]WRIGHT S. On the nature of size factors[J]. Genetics,1918,3:367-374.
[ 3 ]JORESKOG K G, SORBOM D. Advances in factor analysis and structural equation models[M]. Cambridge: MA, 1979.
[ 4 ]林嵩. 结构方程模型原理及AMOS应用[M]. 武汉:华中师范大学出版社, 2008.
[ 5 ]邱皓政,林碧芳. 结构方程模型的原理与应用[M]. 北京:中国轻工业出版社, 2009.
[ 6 ]孙连荣. 结构方程模型(SEM)的原理及操作[J]. 宁波大学学报(教育科学版), 2005,27(2):31-34,43.
[ 7 ]王卫东. 结构方程原理与应用[M]. 北京:中国人民大学出版社, 2009.
[ 8 ]吴明隆. 结构方程模型----AMOS实务进阶[M]. 重庆:重庆大学出版社, 2013.
[ 9 ]张建平. 一种新的统计方法和研究思路----结构方程建模述评[J]. 心理学报, 1993(1):93-101.
[10]YUE W P,WILSON C S. Measuring the citation impact of research journals in clinical neurology: a structural equation modeling analysis[J]. Scientometrics, 2004,3:317-334.
[11]YU L P,CHEN Y Q,PAN Y T. Research on the evaluation of academic journals based on structural equation modeling[J]. Journal of Informetrics, 2009,3:304-311.
[12]毛国敏,蒋知瑞,任蕾,等. 影响因子等主要期刊指标之间的关系研究[J]. 中国科技期刊研究, 2012,23(3):377-382.
[13]俞立平,潘云涛,武夷山. 学术期刊综合评价数据标准化方法研究[J]. 图书情报工作, 2009,53(53):136-139.
[14]程慧平,万莉. 学术期刊评价指标结构研究----基于结构方程模型[J]. 情报杂志, 2014,33(11):113-116,123.
[15]俞立平,潘云涛,武夷山. 学术期刊评价指标选取若干问题的思考[J]. 情报杂志, 2009,28(3):75-77,100.
[16]赵婧,潘云涛. 基于结构方程模型的科技期刊发展影响因素研究[J]. 科技与出版, 2016(9):120-125.
[17]陈小山,陈国福,张瑞. 基于因子分析和SEM模型的期刊评价指标结构关系研究[J]. 情报科学, 2016,34(10):61-64,71.
[18]王重鸣. 心理学研究方法[M]. 北京:人民教育出版社, 1990:293-295.
Applications of structural equation model in science and technology journal quantitative indicators research
WENXuebing1,2,LIUYang2
(1. The journal of Editorial Office, Shenyang Normal University, Shenyang 110034, China; 2. College of Mathematics and Systems Science, Shenyang Normal University, Shenyang 110034, China)
There are more than 20 quantitative evaluation indexes, and new indicators are coming forth. It’s particularly important to study the characteristics, regularity, correlation of each evaluation index,and classify structure between the various indicators of and discussion. SEM uses different statistical methods for large sample analysis of structural relationships, has the apriority, also can test measured variables and the potential at the same time. This paper introduces the principle and application of SEM and its special software AMOS, describes in detail its periodical research progress in the quantitative indicators application, analyzes the advantages and disadvantages of the related studies, analyzes and discusses the sample size, fitting index data, AMOS software operation and other attentions. Studies show SEM method has important practical significance in journal quantitative index structure research, but SEM needs to expand the research depth and breadth, and improve the method of normative.
journals evaluating indices; structural equation model; measurement model; confirmatory factor analysis
2017-05-16。
辽宁省教育厅科学研究一般项目(W2016014)。
温学兵(1975-),男,河北乐亭人,沈阳师范大学副教授,博士。
1673-5862(2017)03-0319-07
O212
A
10.3969/ j.issn.1673-5862.2017.03.012