范会勇
(渤海大学教育与体育学院,锦州121013)
因子确证指的是一个因子(factor),或一个构念(construct)需要达到哪些要求才能被人们所接受。因子的确证问题源自因子分析(factor analysis)。采用因子分析范式的研究者常常会遇到这样的疑惑:应该保留几个因子?如何确定是几个因子?对这类问题,国内外经典的心理测量教材——如彭凯平(1989)的《心理测验》、安娜斯塔西和厄比纳(2001)的《心理测验》、金瑜(2010)的《心理测量》、戴海崎,张锋和陈雪枫(2007)的《心理与教育测量》——大都语焉不详,相关理论讨论更是付诸阙如。
因子确证问题从根本上决定了我们对于“如何确定是几个因子”这类问题可以归结为因子确定问题。如何确定是几个因子,可以分解为两个相互关联的问题:一是提出的因子能否确立?二是有多少个因子?其中,第一个问题即因子如何确证,第二个问题则可以归结为第一个问题。
因子确证问题不仅是教师和学生需要面对的问题,更是方法学研究者必须关注的问题。它若得不到解决,不仅会影响到研究群体的成长和有关课程的教学,还会影响到因子分析研究的质量。近年来,国内外采用因子分析范式的研究越来越多,却少有上乘之作。缺乏对因子确证问题的理论探讨是导致这种现象的重要原因。
因子确证问题虽然产生于因子分析的背景中,但是它的解决必须使用因子分析以外的信息。研究者必须跳出因子分析,采用更宽广的视角,才有可能找到问题解决的路径。下面将以心理测量学史和心理研究方法学为背景,以理论思维为工具,对历史上出现过的实践和思想进行一番梳理,试图呈现给读者一幅思考的地图,以期达到抛砖引玉之作用。
历史上对因子确证问题的回答可概括为三种取向,分别是:数理取向、哲理取向和心理取向。下面将总结这三种取向的内涵和做法,并分析其不足。
虽然心理测量学的产生最初源于比奈对落后儿童心理过程的诊断,但数学家们不久就加入了这个行列,而且很快在其中占据了主导地位。数理取向即是产生于数学家们“入侵”之后。
数理取向认为因子确证是在与别的因子的数理关系(如相关)中进行的。数理取向首先要考虑的是符合数理原则,因子的存在依据等问题并不是数理取向的内在要求。这种取向至今仍然占据着主导地位。
历史上先后出现了以下几种确定因子的方法(Coovert & McNelis,1988;Hayton,Allen,& Scarpello,2004;Lambert,Wildt,& Durand,1990;侯杰泰,成子娟,温忠麟,2004):
第一,最弱下限法(weakest lower bound)。由Guttman(1940)提出。研究者分析相关矩阵(对角线元素为1),根据特征值大于1 的个数来决定因子的数目。
第二,最强下限法(strongest lower bound)。与最弱下限法类似,研究者分析相关矩阵(对角线元素为多元相关平方,SMC),特征值大于0 的数目暗示了因子的数目。这两种方法虽然都很简单,但都存在不足。主要是提取了过多的因子,而且得到的结果也不稳定。
第三,特征值大于1(Eigenvalues greater than one)的方法。这在探索性因子分析中使用最多,它的问题也是提取了过多的因子。
第四,解释方差变异量法(percentage of variance accounted for)。要求因子能解释一定的方差变异量,例如要求解释总方差的80%。这也是个似是而非的原则,很难区分出重要因子和非重要因子。
第五,碎石图(scree test)法。碎石图法是Cattell 在1966 年提出的,它反映了因子解释变异量的变化趋势。碎石图法既可能过多地提取因子,也可能过少地提取因子。
第六,不连续原则(Discontinuity)。假设重要的因子解释的变异量多,而不重要的因子解释变异量少,反映在碎石图上就是解释变异量曲线出现断点。问题是:该曲线可能出现多个断点。
第七,平行分析法(parallel analysis)。将从观测数据的相关矩阵中提取的特征值和从相应的随机数字产生的相关矩阵中提取的特征值进行比较。从碎石图上看,两条曲线会有一个交叉点。交叉点前的因子解释了比随机数字更多的变异,可以保留。研究显示,平行分析是确定因子数目最“客观”的原则,尽管它有时也会过多地提取因子。
第八,主观设定法。要么根据探索性因子分析,要么根据理论分析,研究者提出因子模式的假设,再进行假设检验。这是验证性因子分析中最常见的做法(侯杰泰等,2004)。这种方法的优点是采用了假设检验的程序,但在设定因子时也带有很强的主观性。比如,同样是时间管理倾向,黄希庭和张志杰(2001)的因子设定与支富华、杨志红和樊琪(2002)的因子设定就相去甚远。
总的来说,数理取向存在以下问题:
第一,主观性强。除平行分析法外,其余方法都需要研究者进行主观判定。因此,因子确定在很大程度上依赖于研究者的主观性。
第二,重复性差。同一组数据,研究者不同,所提出的因子就很可能不同。虽然近期有研究者试图从降低数理要求的角度来解决因子分析,特别是探索性因子的重复性问题(Asparouhov & Muthén,2009),但是,如果不考虑到单个因子的确证问题,重复性差的问题仍然得不到解决。
第三,依据不足。数理观专注于数量关系,对数量关系赖以生存的“质”的考虑明显不足。由于这个原因,研究者就很可能提出一些似是而非的“构念”,在数据质量不高的情况下尤其如此。
哲理取向产生于对科学的哲学反思。在心理学独立前,哲理取向就存在了,在心理测量学的发展过程中,哲理取向也几度彰显其作用。因子的确证包括因子的提出和有效性证明两个环节。哲理取向是有关哲学思想(如操作主义、分析哲学)在这两个环节上的反映。
哲理取向认为一个确证之后的因子就是科学的概念,因子的确证是在概念系统的逻辑关系中进行的,它考虑的这个因子的推演是否符合某些既定法则(如逻辑自洽)的要求。具体来说,哲理观主要有以下几种方法:
第一,操作性定义(operational definition)方法。即根据测量指标和操作程序来界定因子。包括从具体的行为、特征、指标上对变量的操作进行描述,将抽象的概念转换成可观测、可检验的项目。通过操作性定义,以及相应的数据指标,研究者就可以确证某个或某组因子。这种方法源自物理学家布里奇曼提出的操作主义哲学思想,对心理学的发展产生了深远的影响。
第二,法则网络(nomological net)方法。该方法是Cronbach 和Meehl(1955)提出的。该思想源自卡尔纳普等的科学哲学。该方法的核心包括三个方面:必须有两个及其以上的构念、构念之间的关系、允许构念被准确测量并与经验相联系的对应规则。其核心仍然是构念之间的经验关系,而不是心理的“质”。Cronbach 似乎让大家不要去考虑这个问题,因此他管因子叫“构念”,在他看来这只是一个研究的方便工具(Slaney & Racine,2013)。
第三,简约原则(parsimonious rule)。即奥卡姆剃刀法则。奥卡姆只承认那些确实存在的东西,那些空洞无物的普遍性概念应该被剔除,“如无必要,勿增实体”。这要求在因子的确证过程中,能够用两个因子说明的,就不要用三个因子;另外一个要求是研究者提出的因子要与已有的心理学知识体系相一致,若能用已有的概念加以说明,就不要强添新词(侯杰泰等,2004)。
哲理取向给因子确证提供了指导性的法则。但也存在如下问题:
第一,哲理取向本身是模糊的,没有给出充分的说明。操作性定义方法没有充分说明对于某操作定义在什么条件下可以进行,该操作是否适当,该测量能否被明确地限定等问题;而且操作定义没有预设心理的客观存在性,导致了测量范围的任意扩大,没有限制(郭贵春,殷杰,2003)。
第二,忽略了因子背后的“质”,甚至否认这种“质”的客观存在性。与Cronbach 和Meehl(1955)同样持有操作主义观点的司马贺认为,认知心理学家所提的短时记忆这些概念也只是一种临时的方便的“构念”,并不是一个客观的存在;他还说也许有一天研究者会用生理过程来解释短时记忆等概念所解释的心理现象(司马贺,1983)。
哲学取向和数理取向其实都忽略了因子背后的“质”。这一忽略,造成了两个大的问题:首先,造成了一种错觉,容易使人们认为心理是神秘的,难以捉摸的;其次,遮蔽了我们对因子的实质进行思考的企图,也造成了很多实践的问题。比如,在因子分析中我们不知道取舍的根本标准,大量的因子分析结果没有进行更高层次的综合。
心理取向认为因子的确证不能只考虑数理关系和逻辑关系,必须要将这两种关系建立在某种心理模型的基础上,心理模型应该在因子确证过程中被明确地陈述。在心理测量学的早期,心理取向曾经是主流。后来,数理取向的一枝独大导致了心理测量学逐渐远离心理学的中心(杨向东,2010),若心理测量学里再没有“心”,那么心理测量学的健康发展将会受到影响。
哲理取向和数理取向的共通之处是从关系中确证因子。Cronbach 和Meehl(1955)曾说:要搞清楚它是什么,意味着要搞清楚它发生的法则(to“make clear what something is”means to set forth the laws in which it occurs),这一思想想与现代科学从关系中把握事物,而不追求事物的实质这种传统是一脉相承的(陈立,1993)。这种处理手法不过是将事物的实质赶到了研究者个人关于世界本质的信念中去。物理学的历史表明,物理学家是难以完全摆脱掉“世界的本质是什么”这个问题的。物理学是如此,心理学更是如此。
唯物主义哲学认为:心理是脑的机能,但心理有不同于脑的质。张岱年(1996)曾提出“一本多极”论,认为世界在本质上是物质的,但在不同的水平上存在着不同的质。张岱年的观点可以佐证此处的观点。这是心理取向得以成立的根本依据。
总的来说,心理取向的具体做法是构建起一个因子的心理模型。杨向东(2010)称之为实质理论。心理取向的主要做法如下:
第一,搜集行为的定性资料,提出因子的质。通过访谈,我们可以搜集到与目标因子有关的行为表现;通过对访谈记录的质的分析,我们可以归纳出一个行为谱系,即因子的质。
第二,借鉴多学科分支的证据,提出因子的质。通过系统的文献复习,我们可以搜集到文献中有关该因子的各种观点、各种证据,这包括来自实验心理学、生理心理学等方面的证据。根据这些证据,我们可以更深层次地分析因子的质。换句话说,心理测量学的证据与实验心理学的证据是互相参照的,而不是一点关系都没有的。
第三,参照心理学的理想概念体系,确定因子的内容。在理想情况下,心理学的所有概念构成的集合应该是一个逻辑自洽的分类体系,也就是要满足分类的完备性和无重复性。这样看来,确证后的因子在心理学的理想概念体系中应该具有唯一性。
纯粹的心理取向可能存在如下问题:
第一,心理模型的构建具有较强的主观性。心理系统及其子成分并不像物理系统那样看得见摸得着,以至于我们很难做到客观,只能是凭借当前的认识能力主观地加以构建。
第二,因子内容的定性资料难以直接检验,很难断定其真假。因子本身是不能证明自己的,否则就成了循环论证。因子内容的定性资料要证明其自身的合理性,必然要借助于外部的力量。
数理取向、哲理取向和心理取向分别关注了因子确证中的三个方面,并不是互相对立的。应该说,这三种取向统一于因子确证的过程中。心理取向着重于因子的提出过程,数理取向和哲理取向则着重于因子的证明过程。心理取向告诉我们如何建构因子的内容模型,数理取向提供了处理经验关系的法则,哲理取向则介于科学与哲学之间,给予研究者设计研究的指导性法则。
要整合这三种取向,还必须考虑因子的分类问题。从相关的文献看,研究者们并没有关注这个问题。但搞清楚因子的分类将有助于我们理解三种取向在因子确证过程中的作用。
因子可以从不同角度进行分类。从有无生理基础的角度可以分为:有直接生理基础的因子和没有直接生理基础的因子。从唯物主义哲学看(张岱年,1996;潘菽,2009),表征心理的因子本身具有客观实在性。有的因子可以找到直接的生理基础,如智力中的反应速度。有的则难以找到直接的生理基础,或者目前难以找到直接的生理基础。如司马贺认为短时记忆就是如此。事实上,心理测量学中的大量构念目前都没有找到直接的生理基础。随着认知神经科学研究方法的应用,研究者可能会澄清更多因子的生理基础。甚至可以预计:寻找既存的心理构念(因子)的生理基础很可能会开创心理测量学的又一次繁荣。
从研究证据的完备程度可以分为:确证的因子和尚待确证的临时“构念”。此处的构念与Cronbach 和Meehl(1955)的构念相同,构念在确证后变成科学概念进入心理学的概念体系,为人们所接受。事实上,没有因子是完全确证的,只有目前被证据支持的因子。得到较多证据支持的因子就可能被接受为科学概念。尚待确证的临时“构念”则等待着更多的证据。
数理取向、哲理取向和心理取向整合后的具体表现形式是一个三阶段的整合模式。在因子模型阶段,研究者的主要任务是在现有的“本体论”证据上提出因子模型。在测量检验阶段,研究者的主要任务是进行因子分析和相关研究,用于检验基于因子模型的预测。在实验检验阶段,研究者的主要任务是通过实验的方法进一步检验基于因子模型的预测。
心理取向主要着重于第一个阶段,即因子模型的提出;数理取向主要着重于第二个阶段,即测量检验(包括因子分析、相关研究);哲理取向则对三个阶段都有指导作用。
艾森克曾与寇斯特等人之间展开过一场论战,争论的问题是:“大三”和“大五”人格,谁才是人格的基本维度(Costa & McCrae,1992;Eysenck,1992)。艾森克提出了精神质这个因子,进而提出了“大三”(包括精神质、神经质和外向性)人格模型。艾森克认为“大五”并非人格的基本维度;寇斯特等则坚持“大五”是,“大三”不是。艾森克提供了从基因、生理基础到病理学、行为学的完整证据链来支持自己的观点;而寇斯特等人则仅有来自行为层面的孤立证据。那么,谁是谁非呢?按照本文的观点,应该是艾森克对。因为艾森克综合运用了三种取向,并将来自三种取向的研究证据组织成完整的证据链,而寇斯特等人仅仅遵循了数理取向,所以稍逊一筹。
陈立.(1993).心理科学论著选.杭州:杭州大学出版社.
郭贵春,殷杰.(2003).科学哲学教程(pp.3 -8).太原:山西科技出版社.
侯杰泰,温忠麟,成子娟. (2004).结构方程模型及其应用.北京:教育科学出版社.
黄希庭,张志杰.(2001).青少年时间管理倾向量表的编制.心理学报,33,338 -343.
潘菽.(2009).心理学简札(上册).北京:人民教育出版社.
司马贺.(1983).关于心理学的发展道路和展望.心理学报,(4),375 -379.
杨向东.(2010).测验项目反应机制与心理测量模型假设的对应性分析.心理科学进展,18(8),1349 -1358.
张岱年.(1996).张岱年全集(第八卷)(p.596). 石家庄:河北人民出版社.
支富华,杨志红,樊琪. (2002). 青少年时间管理倾向探析.宁波大学学报(教育科学版),24,10 -13.
Asparouhov,T.,& Muthén,B.(2009).Exploratory structural equation modeling. Structural Equation Modeling,16,397 -438.
Coovert,M.D.,& McNelis,K.(1988).Program determining the number of common factors in factor analysis:A review and program.Educational and psychological Measurement,48,687-693.
Costa Jr,P.T.,& McCrae,R. R. (1992). Four ways five factor are basic.Personality and Individual Differences,13(6),653-665.
Cronbach,L. J.,& Meehl,P. E. (1955). Construct validity in psychological tests.Psychological Bulletin,52,281 -302.
Eysenck,H.J.(1992).Four ways five factor are not basic.Personality and Individual Differences,13(6),667 -673.
Hayton,J.C.,Allen,D. G.,& Scarpello,V. (2004). Factor retention decisions in exploratory factor analysis:A tutorial on parallel analysis.Organizational Research Methods,7(2),191-205.
Lambert,Z.V.,Wildt,A.R.,& Durand,R.M.(1990).Assessing sampling variation relative to number -of -factors criteria.Educational and Psychological Measurement,50,33 -49.
Slaney,K.L.,& Racine,T.P.(2013).What’s in a name?Psychology’s ever evasive construct.New Ideas in Psychology,31(1),4 -12.