邹丹杰,张灵聪,伍 霞
(北京化工大学文法学院,北京 100029;闽南师范大学教育科学学院,福建漳州 363000;中华女子学院学生处,北京 100101)
关于症状自评量表合成常模与元分析的讨论*
邹丹杰,张灵聪,伍 霞
(北京化工大学文法学院,北京 100029;闽南师范大学教育科学学院,福建漳州 363000;中华女子学院学生处,北京 100101)
以症状自评量表为工具,以StataSE12.0和SPSS19.0为主要统计工具,模拟合成量表常模的过程,并进行同质性检验、亚组分析、回归分析和发表偏倚分析。结果表明有4个因子拒绝同质假设,元分析的同质性检验结果拒绝同质性假设,亚组分析和回归分析无法解释其异质性来源,发表偏倚检验结果表明所列文献无发表偏倚。进而得出结论:1.以文献上的二手数据为基础合成的大学生SCL-90常模在统计上极有可能是无效的,从程序上讲也是不可靠的;2.已有的元分析报告中,SCL-90各因子得分与常模比较得出的效应量在统计上是无效的。
症状自评量表;SCL-90;大学新生;常模;元分析
症状自评量表(Symptom Check List 90,以下简称“SCL-90”)是我国高校使用最广泛的心理健康调查工具之一。1984年,王征宇[1]首先对SCL-90进行介绍,之后金华等[2]为其建立了一个正常人常模,这促进了SCL-90的广泛使用和研究,每年都有许多研究报告发表。
由于相关文献众多,有研究者尝试以报告中的统计数据为基础,将各个报告中的因子得分与标准差合成一个“大样本”的均值与标准差。以标准方式建立的常模通常样本容量较小,而且年代比较久远,距今最近的为1999年,由胡启先等[3]建立。以合成方式建立的常模通常样本容量较大,时间跨度比较长,距今最近的为2009年仲稳山等[4]建立。但其建立程序缺失,常模群体的界定、抽样数据的代表性等问题无法得到验证。
此外,随着元分析(Meta Analysis)技术的普及,有些研究者将元分析运用于SCL-90的研究报告上,试图定量分析全国大学新生的心理健康在总体上是否与常模有显著差异等问题。虽然元分析方法已经得到国内研究者的重视,但是其应用还处于推广阶段。我们有必要从格式、步骤、内容等方面提高元分析应用的规范性。因此本文尝试回答两个问题:(1)以文献上的二手数据为基础合成的大学生SCL-90常模在统计上是否有效?(2)已有的元分析报告中,SCL-90各因子得分与常模比较得出的效应量在统计上是否有效?
(一)文献搜集
本文的搜索对象是以国内大学一年级新生为对象,使用SCL-90进行测试,并报告了相关统计数据的文献。分别以“心理健康+新生”、“新生+SCL-90”、“新生+测查”、“新生+普查”等为关键词,在中国知网、万方数据资源、维普科技期刊数据库上进行搜索,在检索结果中人工选取符合要求的文献,剔除重复文献、部分统计数据缺失的文献,初步得到125篇。进一步选取符合统计要求的文献,最终得到有效样本94个。在有效样本中,每篇文献至少报告了SCL-90的前九项因子均分和标准差(最后一项为“其他”项,许多报告常将此项忽略)。
(二)样本描述性统计
94个有效样本总共调查了235621名大一新生,学生的入学年份跨度是1992-2011,文献的发表年份跨度是1993-2013。以学历层次分组,本科组62个,大专及以下组29个,未记录学历层次的样本3个;以入学年份分组,1998年及之前入学的样本16个,1999-2004入学的样本15个,2005-2009入学的样本23个,2010及之后入学的样本26个,未记录入学年份的样本14个。从时间上来看,1999年是一个重要的时间点,因为从当年起我国高校开始大规模扩大招生;而2005年是另一个重要的时间点,当年1月份教育部、卫生部和共青团中央联合下发“教社政一号”通知,要求各高校“要认真开展大学生心理健康状况摸排工作”,此后大学新生的心理健康调查变成心理健康教育的常规工作;而2010年以后,研究者发表调查报告的热情更加高涨。
(三)统计分析工具
使用EXCEL 2010对原始数据进行初步处理,使用Stata SE 12.0进行元分析计算,使用SPSS 19.0进行元分析之外的其他统计。
(一)合成常模
由于方差具有可加性的特点,合成常模其实是将各个单项研究所得到的均值及其标准差通过计算合成一个总的均值及标准差,公式[5]如下所示:
式中:s2T为总方差、sT为总标准差,si为各样本标准差,Ni为各样本容量。
计算后得到的常模如表1所示。
由表1可见,以多个单项研究的二手数据为基础合成新的常模在计算上并无困难,但是这些单项研究是否具有同质性?换句话说,这些数据能否被当作来自同一总体的样本?以往合成常模的研究并没有进行相关检验。以下对各因子进行Kolmogorov-Smirnov检验(以下简称K-S检验),结果如表2。
如表2所示,各因子K-S检验结果表明,躯体化、焦虑、敌对、恐怖、精神病性的数据并非来自同一个正态总体,各项数据间存在显著性差异,拒绝同质假设。其他因子虽然保留同质假设,但其P值也接近0.05,如九项总均分(P=0.065)。为何以二手数据为基础建立常模会产生异质性问题?笔者认为大致有以下几个原因:①数据的时间跨度比较大,如有学者搜集的数据涵盖1979-2008年[6],不同年代的学生身心发展存在较大的差异;②样本容量大小不一,如有些样本仅有30人,有些则多达12357人[7],样本大小的差异可能引起不同学校学生比例的偏差;③测试时间不一致,有些测验在新生入学后立即进行,有些则在入学2-3个月后进行,有些则在一年级第二学期进行,时间上的不同可能意味着心理状态的差异,这在大学第一年是相当明显的;④抽样的随机性无法保证,研究者能获得的都是公开发表的数据,事实上还有许多未发表的测验结果和报告;⑤抽样的代表性无法保证,理由同上条;⑥数据的真实性无法保证,由于是二手数据,研究者无从检验数据的真实性。因此,合成“常模”的异质性在所难免,以此得出的统计推断也是不可靠的。
表1 SCL-90合成常模的均值和标准差
表2 合成常模各因子的同质性K-S检验
(二)元分析计算
1.同质性检验
关于SCL-90用于大学新生的调查,研究者最为关心的一个问题是:大学新生的调查结果从总体上讲与成年人常模、大学生常模等有无显著差异?为了回答这个问题,已有元分析的普遍做法是把搜集到文献数据和已有的常模对比,通过计算合成总的效应量,以此考察大学新生调查结果与常模之间是否存在显著差异。但由于没有使用专业软件,缺少了其他必要的统计步骤,如同质性检验、使用模型说明、发表偏倚检验等,读者无从得知这些效应量得出的结论是否可靠。
本文以搜集到的94个有效样本作为实验数据,以金华等人于1986年建立的常模为参照标准进行比较,三种同质性检验(Q检验、I2检验和H检验)结果见表3。从表3可知,三种检验方法一致表明,各研究之间存在着极大的异质性,并且接近极值(I2均大于98%,接近100%)。
2.亚组分析
为了探索数据的异质性来源,接着进行亚组分析。分别以学习层次(本科、大专及以下)、新生入学年份(1=1998以前、2=1999-2004、3=2005-2009、4=2010及以后)为分组依据,再次进行同质性检验。发现分组后检验结果并没有发生明显变化,各研究之间仍然存在着极大的异质性,如表4所示(由于篇幅所限,仅以精神病性因子为例)。由此可见学习层次和入学年份的差异并非数据异质性来源。
表3 元分析同质性检验(Q检验、I2检验和H检验)
3.回归分析
为了进一步探索数据的异质性,仍以精神病性因子为例,进行回归分析,采用REML法,建立效应量“标准均数差SMD(此处显示为_ES)”对单个协变量“新生入学年份(year2)”的回归模型,结果如表5所示。
表4 亚组分析
结果列出了SMD值对新生入学年份的回归系数(Coef.)、回归系数的标准误(Std.Err.)、对回归系数的检验统计量(t)、P值及95%置信区间。发现P=0.943>0.05,表明新生入学年份的差别无法说明数据异质性来源。而且I2值由98.7%上升到了98.85%,研究间差异的解释比例为-1.30%,考虑入学年份的影响后,研究间的异质性反而增大了。再以文献发表年份(year1)为协变量,也得到了类似的结果(P=0.657>0.05),如表6所示。将用于比较的常模换成其它常模,均得到了类似的结果。
由以上分析可知,将搜集到的文献数据与常模直接比较,进行同质性检验时会发现各研究间异质性的指标值接近极大,而且通过亚组分析、回归分析都无法解释其异质性来源。因此笔者认为调查数据和常模的t检验结果不适合进行元分析。
4.发表偏倚检验
最后进行文献发表偏倚检验,考察搜集到的文献是否由于有统计学意义的显著性结果才得以发表。本文使用常见的Begg法和Egger法,仍以金华等人于1986年建立的常模为参照标准,将数据输入Stata一一检验,所得结果如表7所示。
从表7可知,Egger法检验各研究得到的p值均大于0. 05,且95%置信区间均包含0;而Begg法检验得到的p值除了躯体化和抑郁二项,也均大于0.05。因此基本可认为搜集到的文献不存在发表偏倚。以其他常模为参照标准也得到了类似的结果,限于篇幅不再将检验结果一一列出。
表5 Meta回归分析1
表6 Meta回归分析2
表7 发表偏倚检验(Begg法和Egger法)
经过以上统计和分析,笔者认为以文献数据为基础合成新“常模”的做法看似改进了旧常模的时效性,增大了常模的样本量和地域的覆盖面,但由于其数据来源均为二手统计数据,无法保证样本来源于同一总体。本文模拟合成常模的过程说明了这一问题。而且从程序上讲,合成“常模”的方法虽然省时省力,但却无法保证常模团体的确定性和样本的代表性。因此,合成常模的做法是不合适的,许多文献将实际调查数据与这些“常模”进行比较也是没有统计学意义的。鉴于互联网技术的发展,网上实时测验已经成为大趋势。笔者认为可以由相关主管部门牵头建立专门的心理测量网站,负责整个地区(如省级或全国)新生的心理普查工作,该地区的高校在大一新生入学后某个时间段内组织网络测验,这样得到的测验数据和全部新生的数量大致相等。所得数据可供各高校下载分析,而主管部门可获得本地区的大数据用于监管、预测,以及建立常模。这种做法在技术上毫无困难,而且对主管部门的教育管理也是十分有益的。
此外,SCL-90旧常模的确存在年代久远时效性差的问题,如果与之比较很容易出现各因子t检验或秩和检验结果显著。冯正直等[8]指出,SCL-90虽然具有较好的效度,能够区分健康和不健康人群;但其九个因子之间存在高相关,因子之间不是互相独立的。因此对各因子之间的详细比较并无多大统计意义。笔者认为,如果研究者非要对SCL-90结果进行比较,可以把本校上一年的新生调查结果作为参照标准,与本年度的调查结果相比较,这样可能更有实际意义。
本文对元分析之前的必要检验表明,使用SCL-90对大学新生进行调查的文献不存在发表偏倚,但若与已有的常模进行比较,则存在极大异质性的问题,而且无法通过亚组分析、回归分析明确其异质性来源。笔者认为原因可能是:各研究之间的确存在较大的异质性,由于实验组是各项具体不同的数据,而控制组却是由常模提供的唯一一个对照数据,组中各项均值和标准差是完全相同的。这样一列数和一个已知点的比较可能无法进行元分析。笔者对照循证医学方面的元分析文献,发现其控制组和实验组类似,也是由具体测量数值构成的数据,这样同质性检验的结果虽然也有部分提示异质性,但没有出现I2>90%的极端情况。因此,在提示极端异质性的情况下,已有元分析将SCL-90各因子得分与常模比较得出的效应量是无效的。
[1]王征宇.症状自评量表(SCL-90)[J].上海精神医学,1984,(2).
[2]金华,吴文源,张明园.中国正常人SCL-90评定结果的初步分析[J].中国神经精神疾病杂志,1986,(5).
[3]辛自强,张梅,何琳.大学生心理健康变迁的横断历史研究[J].心理学报,2012,(5).
[4]仲稳山,李露.全国大学生SCL-90新常模构建问题研究[J].中国校医,2009,(3).
[5][6]张厚粲,徐建平.现代心理与教育统计学[M].北京:北京师范大学出版社,2009.
[7]曾宪涛.应用STATA做Meta分析[M].北京:军事医学科学出版社,2014.
[8]冯正直,张大均.中国版SCL-90的效度研究[J].第三军医大学学报,2001,(4).
(责任编校:简子)
Discussion on Synthetic Norm s and M eta-analysis of Sym ptom Check List 90
ZOU Danjie,ZHANG Lingcong,WU Xia
(School of Literature and Law,Beijing University of Chemical Technology,Beijing 100029,China;School of Educational Science,Minnan Normal University,Zhangzhou Fujian 363000,China;Students’Affairs Office,BeijingWomen’s University,Beijing 100101,China)
In this study,two conclusions are obtained:1.Synthetic norms of SCL-90 based on the secondhand data are very likely to be statistically invalid,and unreliable with regard to procedures of norm building;2.the effective size calculated to compare differences between research data and existing norms is statistically invalid.
Symptom Check List90;SCL-90;freshmen;norm;meta-analysis
G525.5;R195.1
A
1008-4681(2014)06-0134-04
2014-09-14
邹丹杰(1979-),男,福建漳州人,北京化工大学文法学院讲师,硕士。研究方向:大学生心理健康、心理与教育统计。张灵聪(1957-),男,福建漳州人,闽南师范大学教育科学学院教授,博士。研究方向:人格培养。伍霞(1977-),女,江西九江人,中华女子学院学生处心理咨询中心负责人。研究方向:大学生心理健康、女性心理。