湖州师范学院医学院(313000)
王丽娜△ 李莎莎
结构方程模型在修正和中介作用分析中的误区和对策*
湖州师范学院医学院(313000)
王丽娜△李莎莎
结构方程模型(structural equation modeling,SEM)作为多变量资料统计分析技术之一,其在营销学、心理学、管理学、社会及行为科学等领域的量化研究上已成为主流分析技术。近5年,在生物-心理-社会医学模式的指导下,SEM在医学相关领域的科研工作中应用活跃,包括医疗纠纷、职业倦怠感、心理健康状况、自我管理行为等变量的成因分析或中介机制的探索,以及量表结构效度评定的验证性因素分析。本文在广泛参阅国内外SEM相关著作及文献的基础上,对SEM在科研工作中的应用误区进行剖析,以减少SEM的分析判断失误,提高其统计分析质量,使各学科研究过程更为科学、规范。
1975年瑞典统计学家Jöreskog[1]首次开发了用于分析多指标变量之间复杂关系结构的多元统计分析方法SEM。该技术是结合证实性因素分析与回归分析或路径分析而形成。根据不同的统计分析目的,SEM的功能可划分为:(1)陈述、估计以及检验变量之间线性关系与非线性关系的假设[2];(2)检验观察变量与潜变量之间关系的假设[3];(3)同步检验一组观察变量或潜在变量之间的直接效果及间接效果的假设[4]。SEM统计分析的目的与回归分析相似,但由于其在使用上同时考虑了模型的交互作用、非线性关系、自变量相关、测量误差、测量误差相关、多指标的外生潜在变量及多指标的内生潜在变量,因此SEM的统计分析过程更为严谨,结果更具有说服力,尤其适用于科学研究中以问卷或量表测量为手段的研究变量间关系的分析。
SEM作为第二代统计技术,其与SPSS/SAS等第一代统计技术相比,具有2个显著的优势。
1.SEM较SPSS/SAS更为严谨
SPSS/SAS只能分析观察变量,对于潜在变量的分析,将通过各维度题目加总后再代入多元回归方程[5]。各维度分数加总即承认了每个题目的信度均为100%的假设,鉴于随机误差及系统误差的存在,这种假设是不切实际的,特别是通过问卷量表、测评获取的资料。同时,SPSS/SAS只能分析变量之间的直接效果,无法分析间接效果。在可能存在间接效果的模型中,需要执行两次回归才能完整分析出所有变量之间的关系。同一模型进行两次统计推断,将导致I型错误的增加。SEM考虑了观察变量的估计残差,能够反应样本资料的真实情况,因此估计的偏差较小,结果更为严谨。
2.SEM图形输出简洁,易于理解
SEM可以根据模型图上的执行结果迅速判读变量(观察变量或潜在变量)之间的相关程度及影响方向,并可以直观地显示中介效果或干扰效果。SPSS将多个变量纳入回归方程,统计结果缺少图形呈现功能,此时,多数学者的做法是通过绘制路径分析图加以呈现各变量间的影响方向,但路径分析图忽略了自变量间的共线性。Raykov[6]认为,当多个自变量同时估计因变量时,自变量之间不可能完全独立。因此,Raykov团队在制定SEM模型估计准则时强调:自变量间的共变是结构方程模型估计的参数,如果自变量间的共变性被忽略,将造成估计上的偏差。
“结构方程模型”、“影响因素”、“中介效应/机制”、“探索性因素分析”及“验证性因素分析”检索近5年科研文献,通过专家咨询及文献佐证,本研究共总结3点SEM的使用误区。
1.模型修正过程中对修正指数的指导作用尚不明确
通过样本数据构建的结构方程模型不一定均符合研究的预期或理论假设。此时,研究者需进行模型修正。模型修正可依据既往研究的理论基础,增加或删减变量,以实现模型和数据的拟合;或通过SEM软件产生的参考指标对配适度不良的模型加以修正。修正指数(modification indices,MI)是模型修正的常用参考指标,一般SEM软件均可提供。MI利用资料驱动的方式,改变指标之间的关系以达到改善配适度的目的。MI主要提供两个修正检验值:变量之间的相关及残差独立的相关。因此,MI值将建议增加相关以达到改善模型的目的。既往科研文献呈现的结构模型图常存在同一潜变量下观察变量间残差独立相关,或不同潜变量的观察变量间残差独立相关。
这种做法有2点质疑之处:如果修正的模型中潜变量下的观察变量间残差独立相关,即承认了观察变量间的相关性,那么,研究者为何在理论假设模型构建之初没有考虑到这种相关性;(2)按照MI增加相关的建议,模型依据某一特定的样本进行修正后,修订后的模型是否稳定,即是否同样适合于研究总体中抽取的其他随机样本?这便引发模型是否是随机产生的问题。因此,模型修正不能仅靠模型估计复杂化的手段以改善模型配适度[7]。正如Diamantopoulos[8]在其评论中强调,除非存在清晰而具体的理论基础提供支持,否则,无论MI提供增加相关的建议多诱人,都应加以严格拒绝。在此背景下,Hu[9]提议,进行量表结构效度检验时,参照MI建议的增设相关,可以认定同一构面(即一个维度或因子所包含的条目形成一个构面,或一个潜变量所包含的数个观察变量形成一个构面)的两个题目较为相似,建议删除其中一个题目。这一提议,为模型修正提供了一条科学的路径,并在后期多项研究中得到了广泛运用[10-11]。
2.研究变量间中介作用/效果的显著性缺乏科学的统计推断
中介变量是社会科学领域中研究变量间关系时重点关注的一个因素。其意义在于:(1)中介变量意味着自变量对因变量影响的一种内在机制,能够解释两个变量之间“如何”及“为何”发生关系的过程;(2)如中介效果显著,便可通过中介变量寻找更多影响中介变量的自变量,这将有助于对因变量进行更为全面而深入的研究;(3)以实务统计角度分析,对中介变量的调整及操控,可以对因变量发挥预测及控制作用。
自变量X对因变量Y的作用包括直接效果(c′)、间接效果(a×b)和总效果(c),其中直接效果及间接效果的识别是中介效果检验的主要工作。自SEM方法引入科学研究以来,中介效果的统计推断技术大体经历了3种方法的变革。
(1)因果法(B-K method)
Baron和Kenny[12]最早提出了中介作用的因果检验法。该方法通过建立三个回归方程式,凭借回归系数对中介作用的显著性进行判定。Me中介作用检验的具体操作过程:
(1)Me=aX+ε……1→a≠0 且显著;
(2)Y=cX+ε……2→c≠0 且显著(总效果);
(3)Y=bMe+c′X+ε…3→b≠0 且显著,
如c′≠0 为部分中介效果,c′=0 为完全中介效果
a、b均显著,表明中介效果存在,c′如显著,则中介变量发挥部分中介作用,如不显著,则发挥完全中介作用。在某些学科的科研中,一些研究者多凭借路径分析技术,在因果法原理的指导下检验中介效果的显著性。伴随着SEM应用技术的日趋成熟,因果法的局限性逐渐暴露,包括:(1)因果法检验中介效果的必要前提为c显著,但在一些实际情况中,由于抑制效应的存在[13],尽管c不显著,仍然存在实际意义上的中介效果;(2)X对Me的作用(a)显著,Me对Y的作用(b)显著,但却无法保证X通过Me对Y的作用(a×b)显著。实际上,因果法并没有对中介效应(a×b)的显著性进行检验。
(2)系数乘积法(sobel test)
基于因果法无法实现a×b显著性检验的功能,针对a×b显著性检验的系数乘积法[14]应用而生,即系数乘积法。具体操作过程为:Sobel 检验统计量为z值,计算公式z=ab/SEab,
其中,a与b均为非标准化系数,SEa及SEb分别为a与b的标准误,在α=0.05的检验水准下,z值>±1.96即为中介效果显著。然而,系数乘积法最大的缺陷在于其在使用条件上要求样本服从正态分布。在多数情况下,即使a和b均服从正态分布,a×b通常多不符合正态分布的要求[15-16]。同时,|z|值>1.96在实务上并不代表一定显著,中介效果在0.05的置信区间上是否显著,仍有待于检验[17]。经回顾,既往多数科研文献中尚未发现系数乘积法技术的应用。
(3)置信区间法(bootstrapping method)
为解决因a×b非正态分布导致的中介效果显著性检验失效的问题,Hayes[18]提出了bootstrapping技术。该技术的运用原理是以研究样本作为抽样总体,经多次重复抽样(通常为2000次),重新建立起足以代表总体分布特征的新样本(自举样本)。对于一个研究样本,只能计算某个统计量(例如均值)的一个取值,无法获知均值统计量的分布情况。但通过bootstrapping技术可以模拟出均值统计量的近似分布。有了这种数据分布便可计算相应的统计量(Z值),用以推测实际总体的情况。同时,bootstrapping技术亦可呈现Z值的置信区间,可进一步用于假设检验(a×b的置信区间如不包含0,表明间接效果成立)。
bootstrapping技术比上述2种中介效果检验法具备更强的统计功效。随着Amos软件功能的不断拓展,bootstrapping抽样法对中介效果的检验得到了广泛应用。然而,近5年的医学相关学科,甚至是某些人文社会学科的科研文献中,鲜见bootstrapping技术的运用与报道。鉴于bootstrapping技术精准的统计分析质量,有必要在某些学科的科研中,特别是中介效应探索的研究中进行推广。
3.忽略多因子无因果中介模型的中介效果检验过程
bootstrapping技术仅用于验证单因子中介效果,对于多因子无因果中介模型的中介效果检验目前应用最为广泛的技术,即Preacher等[19]提出的SPSS Syntax语法编辑技术,分别评估不同中介变量远程特定的间接效果。既往医学相关学科的科研文献中(亦包括某些人文社会科学文献),虽有双因子无因果中介模型的构建,但尚未采用任何技术对各项中介因子的间接效果进行单独剖析,从而无法纯化单一中介因子对因变量变异的贡献程度。
SEM技术在各学科科研中的应用日趋广泛,其在潜变量与观察变量间的结构分析中以及潜变量间的关系分析中显示了强大而精准的统计优势。在SEM的应用过程中,应妥善处理MI的建议,并按照相应的统计程序对中介作用进行显著性检验,从而强化SEM技术的规范化使用,以提高其在科研中的统计判断效能。
[1]Jöreskog KG,Goldberger AS.Estimation of a model with multiple indicators and multiple causes of a single latent variable.Journal of the American Statistical Association,1975,70(351):631-639.
[2]Rigdon EE.Structural equation modeling:In modern methods for business research quantitative methodology.New Jersey:Lawrence Erlbaum Associates,1998:251-294.
[3]Hoyle RH,Panter AT.Writing about structural equation models,in structural equation modeling:concepts,issues,and applications.California:Sage publications,1995:158-176.
[4]MacCallum RC,Austin JT.Applications of structural equation modeling in psychological research.Annual Review of Psychology,2000,51:201-226.
[5]Hair JF,Anderson RE,Tatham RL,et al.Multivariate data analysis 5nd ed.New Jersey:Prentice Hall,1998:224-238.
[6]Raykov T,Marcoulides GA.A first course in structural equation modeling.New Jersey:Lawrence Erlbaum Associates,2006,210-224.
[7]MacCallum RC,Roznowski M,Nwcowitz LB.Model modifications in covariance structure analysis:The problem of capitalization on change.Psychological Bulletin,1992,111:490-504.
[8]Diamantopoulos A,Siguaw JA.Introducing LISREL:a guide for the uninitiated.California:Sage publications,2000:148-157.
[9]Hu L,Bentler PM.Cutoff criteria for fit indices in covariance structure analysis:Conventional criteria versus new alternatives.Structural Equation Modeling,1999,6(1):51-55.
[10]Jennifer CE,Kate BC,Lori AF.Development of a decisional balance scale for young adult marijuana use.Psychology Addict Behavior,2011,25(1):90-100
[11]Watt T,Groenvold M,Deng N,et al.Confirmatory factor analysis of the thyroid-related quality of life questionnaire ThyPRO.Health Quality Life Outcomes,2014,12:126.
[12]Baron RM,Kenny DA.The moderator-mediator variable distinction in social psychological research:Conceptual,strategic,and statistical considerations.Journal of Personality and Social Psychology,1986,51(6),1173-1182.
[13]Mackinnon DP,Kbull JL,Lockwood CM.Equivalence of the mediation,confounding and suppression effect.Prevention Science,2000,1(4):173-181.
[14]Sobel ME.Asymptotic intervals for indirect effects in structural equations models.San Francisco:Jossey-Bass,1982:290-312.
[15]Bollen KA,Stine R.Direct and indirects:Classical and bootstrap estimates of variability.Sociological Methodology,1990,20(1):150-140.
[16]Stone CA,Sobel ME.The robustness of total indirect effects in covariance structure models estimated with maximum likelihood.Psychometrika,1990,55(2):337-352.
[17]Mackinnon DP,Lockwood CM,Williams J.Confidence limits for the indirect effect:Distribution of the product and resampling methods.Multivariate Behavioral Research,2004,39(1):99-128.
[18]Hayes AF.Beyond Baron and Kenny:Statistical mediation analysis in the new millennium.Journal of Communication Monographs,2009,76(4):408-420.
[19]Preacher KJ,Hayes AF.Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models.Behavior Research Models,2008,40(3):879-891.
(责任编辑:刘 壮)
* 本文获国家社会科学基金项目资助(项目编号:13CRK009)
△ 通信作者:王丽娜,E-mail:aring2000@163.com