MMPI在中国应用的信度概化研究

2010-12-28 05:04焦璨张洁婷吴利张敏强
关键词:概化变异性信度

焦璨,张洁婷,吴利,张敏强

(1.深圳大学 心理学系,广东 深圳 518000;2.华南师范大学 心理应用研究中心,广东 广州 510631)

MMPI在中国应用的信度概化研究

焦璨1,2,张洁婷2,吴利2,张敏强2

(1.深圳大学 心理学系,广东 深圳 518000;2.华南师范大学 心理应用研究中心,广东 广州 510631)

对1989-2008年国内发表的有关明尼苏达多相人格测验(MMPI)的文章进行信度概化研究。对MMPI的10个临床量表和3个效度量表信度系数的报告情况、信度水平和变异性进行描述性分析;以样本类型、样本量等作为预测变量,探讨影响MMPI量表信度水平的因素。在此基础上,与国外关于MMPI的信度概化研究结果进行比较,结果表明二者在信度水平、信度系数的变异性及其预测源方面都存在异同。

信度概化;明尼苏达多相人格测验(MMPI);信度

一、前 言

经过20年的发展,中国版MMPI的应用已十分广泛,成为精神病检测最常规的工具之一,并且也应用于正常人群的咨询、就业、医学、军事和法律等领域。同时,这个重要的临床诊断量表也有了更为严格的信度要求,因为信度影响了量表的有效性和推广的可行性。

信度是量表特性研究的重点,是测验分数或者测验结果的属性,会随着施测样本的变化而变化,信度系数的跨样本使用要以样本组成和分数变异性相似为前提[1]。但许多研究者错误地、简单地认为信度是量表本身的属性。针对信度的可变性,Vacha-Haase[1]提出了“信度概化”这种应用概化理论的思想来指导信度研究的元分析技术——以已有研究的信度系数作为研究样本,用描述统计、层次回归分析等统计方法对其进行再研究,探究影响信度系数变异的预测源,进而说明测验更适合的样本群体的属性和特征[2-5]。这一思想和方法可以纠正测量研究者只重视控制量表编制过程中的误差,忽略施测过程中因样本特征等产生的随机误差的错误思想。此方法在国外经过了11年的推广和运用,不但形成了如MMPI、EPQ等各种量表的信度概化实证研究结果,而且在方法技术上也随之得到了改进。

本研究对MMPI在中国应用进行信度概化研究,并与国外同类研究结果进行比较;旨在为MMPI量表使用者提供代表性的信度系数及其变异性方面的参考;通过探讨信度系数的预测源,为控制测量条件进而改善其施测信度提出初步的建议。

二、研究方法

(一)数据来源及描述性分析

在中国期刊全文数据库中以“MMPI”作为检索词进行全文搜索,得到770个搜索结果,从这些结果中删除与MMPI无关的或不需要提供MMPI信度系数的文章(如将MMPI作为效标、实验材料、被试选取或分组标准的文章和理论文章)后余215篇,其中只有2篇报告了信度系数。

在215篇文章中有129篇报告了分量表原始分数的均值、标准差,用KR-21公式估计得到143个信度系数,删除缺失值及估计出负数的信度系数后,对各分量表信度系数的均值、中位数以及范围进行比较。

(二)各分量表信度影响因素的回归分析

1.因变量的确定

信度概化研究主要运用线性模型确定各预测变量和信度系数之间的关系。线性模型中因变量需要满足正态性,因此要对信度的两种形式信度系数r、信度系数平方r2进行正态性检验,以确定是否需要对信度系数进行Fisher's Z转换[5-7]。结果表明:Pt和Sc分量表两种形式的信度系数都不服从正态分布(P<0.05),需要先进行Fisher's Z转换。在Mf量表中,r服从正态分布,r2不服从正态分布,因此采用r作为因变量;在K量表中,r不服从正态分布,r2则服从正态分布,因此采用 r2作为因变量。其他量表两种形式的信度系数都服从正态分布,这些量表则采用r作为因变量。

2.预测变量的选取

在可选取的12个预测变量中,MMPI的版本、身份类型、健康类型、文章级别类型、文章专业类型、东西地域差异、南北地域差异为类别变量,将之进行虚拟编码①。其余变量均龄、年龄标准差、男性比例、有配偶的人数比例(简称“有偶比例”)、样本量为连续变量。

采用逐步回归分析方法对以上预测变量与因变量建立模型[8,9]。

(三)国内外MMPI信度概化研究结果的比较分析

Vacha - Haase、Kogan,Tani 和 Woodall[10,11]用PsycINFO数据库搜索15年(1984-1998)以来发表的与MMPI量表有关的文章,除了数据收集背景及预测变量的选取与本研究有所差别之外,其余的研究操作十分相似。因此本研究可与国外MMPI信度概化研究结果进行比较。

三、结果与分析

(一)各分量表的信度系数及其变异性分析

如表1所示,Pt和Sc分量表的信度系数均值最高,达到0.80;Hs、Si、F、K 的信度系数在0.60 以上;Mf分量表的信度系数则低至0.38。Hs分量表信度系数的波动范围最小,Sc和Pt分量表的标准差最小。与国外MMPI的信度系数相比,两者Hs量表信度系数的中位数、均值以及变异大小和范围都相似,F量表的中位数和均值相似;前者的Pt和Sc量表的信度系数在中位数和均值上比后者的高;对于D、Pd、Mf、Ma、Si、L 和 K 分量表,前者的信度系数水平则比后者的低,而变异性比后者大,且前者的信度系数下限多接近0。

表1 国内外MMPI各分量表信度比较表

(二)预测变量的逐步回归结果

如表2所示,南北地域差异对中国MMPI量表中的D、Mf、L分量表的信度系数有影响,方差解释率分别是19.33%,16.45%和20.22%。对于D、Mf分量表,南方样本的施测信度系数比北方小;对于L分量表,南方样本的施测信度系数比北方的大。样本量对Hs、Pa分量表有负向的预测作用,方差解释率分别为30.19%和28.27%。

其他分量表则各有不同的预测源。对于Hy分量表,逐步回归所得到的模型1和模型2的回归方程均有效,模型2增加了文章专业类型这一预测变量,其方差解释率是40.88%,比模型1的方差解释率增加了17.24%,因此认为文章专业类型和男性比例都是Hy分量表的重要预测变量,文章专业类型的回归系数都比男性比例的低,即其预测能力低于男性比例这一变量;男性比例对Hy信度系数有正向的预测作用,发表于心理学专业期刊里的文章,运用Hy分量表时的施测信度比发表于非心理学专业期刊的高。样本均龄对Pt量表信度系数有正向预测作用,方差解释率为17.19%。有偶比例对Sc量表信度系数有正向的预测作用,方差解释率为21.2%。年龄标准差对K量表信度系数有正向的预测作用,方差解释率为15.14%。

根据Cohen1988年提出对于效果量R2大小的划分[12]:R2=0.0196(效果小),R2=0.13(效果中),R2=0.26(效果大),各分量表被相应预测变量解释的回归方程都有中等或大的效果量。国外MMPI的信度水平主要受年龄和版本所影响,各回归方程的效果量也达到了中上水平,各分量表的预测源比较见表3。

表2 各分量表信度系数的回归分析表

表3 影响MMPI各分量表信度系数的重要预测变量

四、讨 论

(一)MMPI信度水平及其变异性

中国版MMPI的大多数分量表的信度水平比国外版的低;除了语言文化差异的原因之外,也可能由于施测条件缺乏严格控制。Mf量表的信度很低,其原因可能是研究的文章多运用1940年制定的MMPI原版的翻译版。随着时代的发展,性别角色界线的淡化,男女性别特征也可能有更多的融合和交叉,因此该量表的得分可能有所提高,使得呈现负偏态,信度则随之降低。在Vacha-Haase的研究中,Pd和Pa量表的信度水平相对于其他分量表是最低的,而在本研究中,两者的信度水平也很低,反映其项目之间的一致性较差。

本研究与Vacha-Haase的研究结果都表明各分量表的信度系数存在变异性,信度的波动范围都在0.64以上,这反映了信度是测验分数或结果的属性,而非测验工具本身恒定的属性。有7个分量表的变异性大于国外,这表明这些分量表在国内的施测有可能受到更多的变异源影响。

信度水平低以及信度的变异性大说明了对该测量工具进行信度概化研究的必要性和可能性。APA美国心理协会在1999年的统计会议中对信度报告的强调,使得国外众多研究人员逐渐开始重视对测验信度的报告[13],而国内使用MMPI量表时报告信度的研究仍然少见(只占1%),还不及国外10年前的数目(7.8%)。这致使信度系数的数据极度缺乏,也就阻碍了对国内信度概化的研究以及提高测验的可靠性和有效性的途径。对信度概化思想缺乏认识是该现状的主要原因,因此,需要心理学研究的权威机构对信度的报告进行严格的规定,并让研究者意识到这种无限制“信度引用”的错误所在。

(二)各预测变量对信度系数的影响

南北地域差异是D、Mf和L分量表信度的影响因素,这可能受到人格某些稳定的特征差异以及语言表达方式差异所引起,有待进一步探讨,以针对性地进行题目和提问方式上的修改。样本量对Hs和Pa分量表有负向影响,但影响很小;对其他分量表则没有显著预测作用。这可能是由于样本的选取和构成不够合理而形成偏态分布,影响其信度水平。同时,也表明盲目地增加样本并不能有效地提高测验的信度,甚至会形成反效果。因此,在抽样时要有代表性,而不能方便抽样,并且要清楚样本相关的人口学变量。男性比例、文章期刊来源的专业性、年龄均值和标准差以及有偶比例是影响个别分量表信度水平的预测源,而其他的变量没有进入回归模型,即表明MMPI各分量表在这些变量条件下有相对稳定的信度水平。对于那些无法建立回归方程或者解释率较低的分量表,其信度水平很可能主要受观察分的标准差和量表的项目数所影响。这有待今后收集到原始的信度数据以对这些重要变量的预测作用进行验证性研究。

在本研究与Vacha-Haase的研究结果中,各分量表的预测源都不多,但都能较好地解释信度系数的变异。本研究分量表的预测源呈现多样性;而国外研究结果中,各分量表的信度系数主要受年龄、版本所影响。

五、结 论

本研究通过数据收集、描述性统计、回归分析对国内近20年来MMPI量表进行信度概化研究,并与国外相关的研究进行对比分析,结果表明:

(1)国内研究者报告信度系数的意识有待提高。

(2)Pt和Sc分量表的信度水平在各分量表当中处于最高,且高于国外MMPI相同分量表的信度水平,Hs、F分量表的信度水平与国外的相似,其他分量表的信度水平都比国外的低;D、Pd、Mf、Ma、Si、L和K分量表信度的变异性高于国外MMPI相应分量表的信度变异性。

(3)南北地域差异对MMPI中的D、Mf、L分量表的信度水平有影响;样本量对Hs和Pa量表信度系数有负性的预测作用;Hy量表的信度水平受到文章专业类型和男性比例所影响;样本均龄对Pt量表有正向的影响;有偶比例对Sc量表有正向的影响;年龄标准差对K量表的信度系数有正向的影响;Pd、Si、Ma和F量表的信度水平不受本研究的12个预测变量所影响。

注释:

①MMPI的版本(由宋维真在1989年正式出版的版本使用最为广泛,因此将之编码为1=宋维真89年版,0=非宋维真89年版),身份类型(1=学生样本,0=非学生样本),健康类型(1=身心正常,0=身心异常),文章级别类型(1=中国期刊网核心期刊,0=中国期刊网非核心期刊),文章专业类型(1=心理学专业期刊,0=非心理学专业期刊),东西地域差异(根据中国区域经济学的划分标准,将辽宁、河北、北京、天津、山东、江苏、浙江、上海、福建、广东、广西和海南12个省份归为东部地区,其余为中西部,1=东部,0=中西部)、南北地域差异(以长江为划分线,1=南方,0=北方)。

[1]VACHA -HAASE T.Reliability Generalization:Exploring Variance in Measurement Error Affecting ScoreReliability across Studies.Educational and Psychological Measurement,1998,58(1):6 -20.

[2]关丹丹,张厚粲.信度的再认识与信度概括化研究.心理科学,2004,27(2):445 -448

[3]THOMPSON B,VACHA -HAASE T.Psychometrics is Datametrics:The Test is not Reliable.Educational and Psychological Measurement,2000,60(2):174 -195.

[4]VACHA -HAASE T,KOGAN L R,THOMPSON B.Sample Compositions and Variabilities in Published Studies Versus Those in Test Manuals:Validity of Score Reliability Inductions.Educational and Psychological Measurement,2000,60(4):509 -522.

[5]焦璨,吴利,张敏强,张文怡.信度概化研究的新进展评析.学术研究,2009,(2):54 -59

[6]LANE G G,WHITE A E,HENSON R K.Expanding Reliability Generalization Methods with KR-21 Estimates:An RG Study of the Coopersmith Self-Esteem Inventory.Educational and Psychological Measurement,2002,62(4):685-711.

[7]CHARLES F B Jr.,RICHARDSON K.Seeing the Fisher Z Transformation.Psychometrika,2004,69(2):291 -303

[8]HENSON R K,THOMPSON B.Characterizing Measurement Error in Scores across Studies:Some recommendations for Conducting“Reliability Generalization”Studies.Measurement and Evaluation in Counseling and Development,2002,35(2):113 -127.

[9]CARUSO J C,WITKIEWITZ K,BELCOURT - DITTLOFF A,et al.Reliability of Scores from the Eysenck Personality Questionnaire:A Reliability Generalization Study. Educationaland PsychologicalMeasurement,2001,61(4):675-689.

[10]VACHA -HAASE T,TANI C R,KOGAN L R,et al.Reliability Generali-zation:Exploring Reliability Variations on MMPI/MMPI-2 Validity Scale Scores[J].Assessment,2001,8(4):391 -401

[11]VACHA-HAASE T,KOGAN L R,TANI C R,et al.Reliability Generalization:Exploring Variation of Reliability Coefficients of MMPI Clinical Scales Scores.Educational and Psychological Measurement,2001,61:45-59.

[12]COHEN J.Statistical Power Analysis for the Behavior Sciences.New York:Academic Press,1988.

[13]WILKINSON L.The American Psychological Association(APA)Task Force on Statistical Inference.Statistical methods in psychology journals:Guidelines and explanations.Educationaland PsychologicalMeasurement,1999,54(8):594 -604.

Scores Reliability from the Minnesota Multiphasic Personality Inventory in China

(by JIAO Can,ZHANG Jie-ting,WU Li,ZHANG Min-qiang)

This reliability generalization study was based on data from studies published in Chinese journals from 1989 to 2008,which used MMPI as a psychometric tool.The report rate,mean and variance of reliability coefficient were described,and the predictor variables such as sample type and sample size were further investigated for their influence on reliability of MMPI by means of regression analysis.Finally,these results were compared with the result conducted by a foreign researcher;there was similarity as well as difference in the level,variance and predictors of reliability between the two researches.

reliability generalization(RG);Minnesota Multiphasic Personality Inventory(MMPI);reliability

B841

A

1000-5455(2010)04-0048-05

2009-11-24

广东自然科学基金项目“基础教育学业水平质量监测CAP系统研发”(9151063101000002);教育部人文社科重点基地项目“现代测量理论的测量误差估计及改进方法”(2009JJDXLX006)

焦璨(1979—),女,湖南益阳人,心理学博士,深圳大学心理系讲师;张洁婷(1985—),女,广东湛江人,华南师范大学教育科学学院硕士研究生;吴利(1984—),女,广东梅州人,华南师范大学教育科学学院硕士研究生;张敏强(1955—),男,广东河源人,华南师范大学心理应用研究中心教授、博士生导师。

【责任编辑:王建平】

猜你喜欢
概化变异性信度
《广东地区儿童中医体质辨识量表》的信度和效度研究
几种桥墩概化方法在MIKE 21FM模型中的应用及适用性分析
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
结构化面试中多源变异的概化分析
中文版脑性瘫痪儿童生活质量问卷的信度
拦污栅条概化试验
咳嗽变异性哮喘的中医治疗近况
清肺止咳汤治疗咳嗽变异性哮喘40例
冬病夏治止咳贴贴敷治疗小儿咳嗽变异性哮喘40例