10项流调中心抑郁自评量表在中国中老人群中的信效度

2015-04-03 09:24黄庆波王晓华陈功
中国健康心理学杂志 2015年7期
关键词:信效度一致性量表

黄庆波王晓华陈功△

①中国.北京大学人口研究所(北京)100871②北京师范大学社会发展与公共政策学院△通讯作者E-mail:chengong@pku.edu.cn

为筛查社区抑郁人群,美国国立精神卫生研究院Radloff于1977年编制了20项流调中心抑郁水平评定量表(the Center for Epidemiological Studies Depression Scale,CES-D),包括16个描述消极情绪的项目和4个描述积极情绪的项目[1],此量表在许多国家的研究中被证明具有较高的信效度[2-3]。原有量表在计分方法上基本上是将4个描述积极情绪的题目进行反向计分然后计算量表总分。

然而,一些研究者发现,20项CES-D要求作答的时间过长,被试情绪负荷较高,以及项目内容敏感等问题,导致较高的拒答率[4-5]。为此,研究者根据不同的人群和目的,设计多种简版CES-D,其中包括10项、9项等简短量表[6]。比如Kohout等人根据修订的简版量表与完整量表之间的对比结果筛选出10个项目,在65岁以上老年人样本中构建了Boston版本和Iowa版本,这两个简版量表与原量表的结构效度一致[4]。Cole等人利用RASCH模型的交叉检验筛选出9个项目,用来测量不同人群的抑郁水平,该量表在不同人群中信度和结构效度较高[7]。这表明,缩短CES-D的长度并不会降低该量表的稳定性和有效性。

许多研究发现,中文CES-D在我国不同的人群中有较高的信效度[8-10],可以稳定且有效地测查抑郁症状。然而,由于简版CES-D的缩短时间和问卷长度的优越性,在不降低测量信效度的情况下,许多大型调查或研究已逐步开始采用简版CESD[11-12]。由于老年人缺乏耐性,简版量表在老年人群体中更具有适用性[13-14]。比如,中国健康与养老追踪调查作为一个针对中老年人的大型微观调查,该调查使用了由Andresen等修订的10项CES-D问卷[15]。

与此同时,10项CES-D的因子结构在国外得到了较多的研究,且研究结论并不一致。部分研究发现10项CES-D只有一个因子结构[16-17]。比如,Bjorgvinssonb等利用内部一致性分析和因子分析方法,对755名精神病人的分析后发现,10项CES-D具有较高的内部一致性,具有1个因子结构。但一些学者研究发现了两个因子结构:积极因子和消极因子[18-20]。Lee在3个不同模型的假定下,利用验证性因子分析对1013名非机构老年人进行分析后,发现样本数据在两因子模型中拟合更好。此外还有少数研究发现此量表有3个因子结构[21]。如Cheng对231名中国老人进行了分析,发现10项CES-D的结构效度有3个因子,依次为积极因子、躯体因子、消极因子。

研究结论的不一致,可能由于社会文化与关注人群的差异。一方面,由于社会文化背景的不同,不同种族和地域的人对量表项目的理解和解释会存在差异,量表的因子结构也可能随之而发生一定改变[22]。比如研究结论为一因子结构的研究来自美国,二因子结构的研究来自加拿大和新加坡,三因子结构的则来自中国。另外,上述研究关注的人群也有较大的差异,从青少年、精神病人到老人各不相同。

由此可见,10项CES-D在不同的人群和社会文化背景中,其信效度可能有所差异。随着中文10项CES-D被广泛使用,此类简版量表在中国人群中的信效度评价就显得十分迫切。因此,本文将利用中国健康与养老追踪调查数据,分析中文10项CES-D的信效度,为未来10项CES-D的广泛使用提供一些依据。鉴于此,本文提出如下研究问题,中文10项CES-D的信效度与国外的研究结论是否有所不同呢?在中年和老年群体中的信效度是否存在差异呢?

1 对象与方法

1.1 对象

本研究利用中国健康与养老追踪调查2011年第一波追踪数据,该调查是对中国中老年人进行的一项调查。抽样方法为多阶段分层概率比例抽样(PPS),经过县级抽样、村居抽样、家户抽样和个人抽样等4个阶段抽取了28个省150个县区的450个村、居。该样本代表了中国45岁及以上住户人群,机构中的老年人并没有进入抽样。总样本17705人,剔除掉无效样本和年龄不足者2774人,共获得有效样本14931人,其中中年人群(45~60岁)8337人,老年人群(60岁以上)6594人。

表1 10项CES-D项目构成

样本中,平均年龄为(60.21±9.63)岁,其中45~60岁8337人(55.84%),60岁以上6594人(44.16%);男性7172人(48.03%);受教育程度方面,文盲3943人(26.41%),小学未毕业者2658人(17.8%),小学毕业3264人(21.86%),中学毕业者3126人(20.94%),高中以上1940人(13%);婚姻状况方面,13129人(87.93%)已婚,1802人(12.07%)不在婚。

1.2 方法

本研究采用Andresen于1994年修订的10项流调中心抑郁量表,该量表由10个项目构成,要求被访者在回答过去1周内各项目所描述症状出现的频率,并以(0~3)4级记分,其中“对未来充满希望”和“我很愉快”属于反向计分题目(见表1)。

1.3 统计处理

使用SPSS 20.0和IBM SPSS Amos 21.0对数据进行分析。首先,本研究在整个人群样本中,使用内部一致性分析方法检验10项CES-D的内部一致性,运用验证性因子分析方法分析10项CES-D的因子结构。其次,分别检验10项CES-D在中年人群和老年人群中的内部一致性,并使用多组验证性因子分析方法,检验最优因子结构在中年人和老年人群体中的恒等性。多组验证性因子分析方法是在原来SEM的分析之外,增加了另一个(或多个)平行样本的估计,即在SEM模型的基本设定之外,另外纳入一个类别变量反映共变结构的跨样本变化[23],其统计学原理是将跨样本因子结构模型视为单一样本的因子结构的更严格限制模型,再透过嵌套模型的比较决定样本间的因子恒等性[24]。该方法主要的拟合函数如下:

其中,Fg为拟合函数,Ng为各组样本数

一方面,考虑到χ2随样本量的增加而变大,模型很容易被拒绝,所以本研究报告χ2与df,但并不进行深入讨论,而主要使用RMSEA,NNFI,CFI,GFI,AGFI,SRMR等指标来评价模型的拟合优度。根据以往研究的经验,RMSEA和SRMR<0.08,NNFI、GFI与AGFI,CFI>0.95时,模型拟合程度较好[23]。另一方面,由于判断模型恒等性的χ2差异检验对于一致性检验过于苛刻,结构方程模型最多只是趋近现实,而且CFI、RMSEA和SRMR受样本量影响较小,所以利用△CFI、△RMSEA和△SRMR测量模型恒等性的效果要优于△χ2[25]。根据研究者的推荐,本研究采用△CFI<0.01、△RMSEA<0.015和△SRMR<0.01为各嵌套模型恒等的临界值[26]。

最后,利用量表总分最高27%百分数和最低27%百分数的样本,运用独立样本t检验分析10项CES-D各条目在该样本中区分不同水平被试的能力。

1.4 分析框架

假定3种因子结构,利用多组验证性因子分析分别对这3个因子结构进行检验,并选择最优因子结构。3个因子结构包括:单因子结构,两因子结构(积极因子和消极因子),三因子结构(积极因子、躯体因子和消极因子),具体构成条目见表2。

表2 假定的三种因子结构

2 结果

2.1 整个人群分析

2.1.1 区分度分析首先,由各项目得分计算10项CES-D的总分,以百分位数最高和最低的27%为临界点,将被试分为高低两组,其中低分组和高分组的临界分值分别为4分和12分。对两组人群在每一个项目上的得分进行独立样本t检验,结果发现两组被试在所有项目上得分显著地统计学差异,见表3。

2.1.2 信度检验内部一致性检验发现,10项CES-D的信度为0.81,是可以接受的。删除当前条目后量表的Cronbach's系数在0.791~0.819之间,量表的总Cronbach's系数为0.815;各条目得分与删掉此条目后量表得分的相关系数分别为0.299~0.647,该量表的内部一致性较好。已有学者指出,当项目与测验总分的相关在0.30~0.80之间,测验的会聚效度是令人满意的[27]。

表3 老年抑郁量表项目区分度(±s)

表3 老年抑郁量表项目区分度(±s)

注:对积极题目进行反向计分后计算总分

类别低分组高分组P我因一些小事而烦恼0.258±0.5522.030±0.997<0.001我在做事时很难集中精力0.219±0.5541.827±1.060<0.001我感到情绪低落0.186±0.4612.050±0.920<0.001我觉得做任何事都很费劲0.191±0.5152.070±1.000<0.001我对未来充满希望0.495±0.8951.835±1.133<0.001我感到害怕0.033±0.2040.900±1.103<0.000我的睡眠不好0.352±0.7671.881±1.145<0.001我很愉快0.270±0.5961.922±0.993<0.001我感到孤独0.060±0.3061.306±1.187<0.001我觉得我无法继续我的生活0.024±0.1881.007±1.093<0.001

表4 10项CES-D内部一致性检验±s)

表4 10项CES-D内部一致性检验±s)

条目得分条目-总分相关系数Cronbach's系数11.02±1.100.5650.791 20.91±1.080.5100.797 30.97±1.060.6470.782 40.99±1.140.5820.789 51.84±1.190.2990.819 60.35±0.770.4390.805 71.05±1.190.3930.809 81.96±1.110.4920.799 90.54±0.940.5080.797 100.36±0.780.5240.795总系数0.815

2.1.3 结构效度检验假定3个不同的因子结构模型,用验证性因子分析验证各模型的拟合优度。第一个模型是所有条目都由一个公因子解释,即单因子结构模型;第二个模型假定所有条目由积极因子和消极因子共同解释;第三个模型假定所有条目由3个公因子,即积极因子、消极因子和躯体因子所解释。

检验结果显示,单因子结构模型的RMSEA>0.08、AGFI和NNFI<0.95,模型不满足最低临界值的要求;两因子模型和三因子模型的拟合指数均满足最低拟合指数的要求,但是两因子模型中RMSEA、NNFI和AGFI均优于三因子模型,所以两因子模型是最佳拟合模型。

表5 10项目CES-D各因子结构模型的因子载荷与拟合优度

2.2 分组别的信效度分析

2.2.1 信度分析将整个样本人群分为中年人和老年人后,分别对这两个样本进行信度分析。内部一致性分析发现,中年人和老年人的Cronbach's系数分别为0.8145、0.8128;删除当前条目后的Cronbach's系数分别在0.7817~0.8195,0.7780~0.8167,条目得分与删除条目后的总得分之间的相关系数分别在0.288~0.6412,0.2974~0.6549之间。

2.2.2 多组验证性因子分析首先,本研究利用验证性因子分析检验最优因子结构在中年人群和老年人群中的拟合情况,结果发现,中年人群和老年人群中,两因子结构模型的GFI、SRM、RMSEA、CFI均满足临界值,显示中年人群和老年人群的因子结构和数量是类似的,见表6。所有因子载荷在0.01的水平上具有显著性差异。两个因子之间的相关系数在中年和老年人群中分别为0.54和0.56。

其次,具有类似因子数量与结构并不能保证条目和潜在的理论因子结构的一致性,据此本研究利用多组验证性因子分析对中年和老年群体的模型参数进行同时预测以检验因子结构模型差异的显著性,为模型比较提供参数指标[28]。模型一的拟合指数显示,χ2为1876.43,df为68,CFI和RMSEA分别为0.973、0.042,这表明两因子模型的因子结构和因子数量在老年人和中年人群体中具有一致性。

表6 中年人群与老年人群中X因子结构模型的因子载荷与拟合优度指数

表7 10项CES-D因素结构在中年人群和老年人群中的恒等性检验

最后,在检验了因子结构模型在中年和老年人群中的差异性后,通过多组验证性因子分析检验模型在两个群体中的恒等性。依据群体间模型恒等性检验程序,设定4个嵌套模型:模型一(基准模型,两个群体的模型参数均自由估计),模型二(两个群体的模型的因子负荷设定相等),模型三(除残差误差外,两个群体的模型其他参数均设定相等),模型四(两个群体的模型参数均设定相等),然后将其他模型分别与模型一进行对比,以△CFI、△RMSEA和△SRMR为指标来判断模型的一致性。

多组验证性因子分析的结果显示,模型二和模型三满足△CFI<0.01、△RMSEA<0.015和△SRMR<0.01;虽然模型四△SRMR并不满足临界值,但由于该模型所有参数都受限,其参考意义不大[28]。综上所述,两因子结构模型在中年人群和老年人群中的具有稳定性,适用于中年人群和老年人群。

3 讨论

研究显示,10项CES-D具有较高的信效度,并没有因为条目的减少而降低。首先,内部一致性分析发现,10项CES-D的总量表系数和删除条目的系数都较高,并没有因为条目的减少而降低,这在其他的研究中也得到了证实[17-18,29]。

3个假设的因子模型在整个样本人群中进行了检验,检验发现两因子结构,即积极因子和消极因子拟合数据更佳。研究结果与先前的其他研究一致[15,18-20,29],但却与另外的研究结果相反[17,21]。研究结果的不一致可能来源于不同社会文化中,研究人群理解问卷的方式有所不同。比如,Boey对中国香港的研究结果与本研究的结论不一致,这可能与香港的殖民历史有关,香港的文化已经逐渐地演变成欧洲文化,与中国所属的儒家道家文化并不一致。

多组验证性因子分析发现,两因子结构在中年和老年人群中具有恒等性。研究老年人群的中年生活对于研究老年人阶段的各种问题具有非常大的意义,所以本研究的结论对于以后同时调查中年人群和老年人群提供了重要的应用依据。因子结构恒定性可能是由于中年人群和老年人群均处于生活的焦虑和压力期,两个群体具有相似性。一方面,中年人群正处于事业成就和孩子发展所带来压力期,他们面对各种挑战;另一方面,老年人面临社会角色丢失等生活方式变迁的压力,疾病和收入降低也随之而来。基于中年和老年人群一致性,研究者可以利用该量表来比较中年和老年人群的抑郁水平。在本研究中通过独立样本t检验发现老年人的抑郁水平显著高于中年人的抑郁水平,这与以往的研究相一致[30]。最后,区分度分析显示高分组和低分组之间的各项目得分差异在99%的水平上具有统计学显著性,证明该量表具有良好的区分度,能区分不同水平的被试。

国内外学者评价了其他版本的CES-D的信效度[6,31-32],但10项CES-D的信效度研究,除了少数在中国香港的研究外[29],对中国大陆人群中的研究却十分不足,本研究为进一步的使用10项CES-D提供了依据。

综上所述,10项CES-D量表由于具有良好的信效度,加上其较短的回答时间和较高的回收率,该量表在大型调查研究中具有较大的应用潜力。这在中国健康与养老追踪调查、及其国外其它姊妹调查中得到了印证。然而,因本研究局限于内部一致性分和验证性因子分析,所以还需要更多的信效度分析以进一步确定其信度和效度,比如ROC分析、重测信度、效标关联效度、内容效度等。

[1] Radloff L S.The CES-D scale a self-report depression scale for research in the general population[J].Applied Psychological Measurement,1977,1(3):385-401

[2] Beekman A T,Deeg D,Van Limbeek J,et al.Criterion validity of the Center for Epidemiologic Studies Depression scale(CES-D):Results from a community-based sample of older subjects in The Netherlands[J].Psychological medicine,1997,27(1):231-236

[3] 张宝山,李娟.流调中心抑郁量表在老年人群中的因素结构[J].心理科学,2012,29(4):993-998

[4] Kohout F J,Berkman L F,Evans D A,et al.Two shorter forms of the CES-D depression symptoms index[J].Journal of Aging and Health,1993,5(2):179-193

[5] Santor D A,Coyne J C.Shortening the CES-D to improve its ability to detect cases of depression[J].Psychological Assessment,1997,9(3):233

[6] Grzywacz J G,Hovey J D,Seligman L D,et al.Evaluating short-form versions of the CES-D for measuring depressive symptoms among immigrants from Mexico[J].Hispanic Journal of Behavioral Sciences,2006,28(3):404-424

[7] Cole J C,Rabin A S,Smith T L,et al.Development and validation of a Rasch-derived CES-D short form[J].Psychological Assessment,2004,16(4):360

[8] 吴九君,郑日昌.高三学生人格、应对方式、亲子沟通、社会支持与抑郁的关系[J].中国健康心理学杂志,2007,15(12):1101-1103

[9] 崔向军,魏志霞,李丽娜,等.农村老年人抑郁症状及其影响因素的相关研究[J].中国健康心理学杂志,2012,20(4):536-538

[10] 常向东,马丹英.企业员工工作倦怠与抑郁的相关性[J].中国健康心理学杂志,2013,21(11):1663-1666

[11] 林俞均.老人忧鬱状态與休閒活动之相關性研究[J].亚洲大学長期照護研究所,2008:1-72

[12] 林正祥,陳佩含,林惠生.臺湾老人忧鬱状态變化及其影響因子[J].Journal of Population Studies.2010(41):67-109

[13] Shrout P E,Yager T J.Reliability and validity of screening scales:Effect of reducing scale length[J].Journal of Clinical Epidemiology,1989,42(1):69-78

[14] Cheng S T,Chan A C.The center for epidemiologic studies depression scale in older chinese:Thresholds for long and short forms[J].Int J Geriatr Psychiatry,2005,20(5):465-470

[15] Andresen E M,Malmgren J A,Carter W B,et al.Screening for depression in well older adults:Evaluation of a short form of the CES-D[J].American Journal of Preventive Medicine,1994,10(2):77-84

[16] Carpenter J S,Andrykowski M A,Wilson J,et al.Psychometrics for two short forms of the center for epidemiologic studies-depression scale[J].Issues Ment Health Nurs,1998,19(5):481-494

[17] Bjorgvinsson T,Kertz S J,Bigda-Peyton J S,et al.Psychometric properties of the CES-D-10 in a psychiatric sample[J].Assessment,2013,20(4):429-436

[18] Lee A E,Chokkanathan S.Factor structure of the 10-item CESD scale among community dwelling older adults in singapore[J].International Journal of Geriatric Psychiatry,2008,23(6):592-597

[19] Bradley K L,Bagnell A L,Brannen C L.Factorial validity of the center for epidemiological studies depression 10 in adolescents[J].Issues Ment Health Nurs,2010,31(6):408-412

[20] Zhang W,O'Brien N,Forrest J I,et al.Validating a shortened depression scale(10 item CES-D)among HIV-positive people in British Columbia,Canada[J].PLoS One,2012,7(7):e40793

[21] Cheng S T,Chan A,Fung H H.Factorial structure of a short version of the Center for Epidemiologic Studies Depression Scale[J].International Journal of Geriatric Psychiatry,2006,21(4):333-336

[22] Vandenberg R J,Lance C E.A review and synthesis of the measurement invariance literature:Suggestions,practices,and recommendations for organizational research[J].Organizational Research Methods,2000,3(1):4-70

[23] 邱皓政,林碧芳.结构方程模型的原理与应用[M].北京:中国轻工业出版社,2009

[24] Joreskog K G.Simultaneous factor analysis in several populations[J].Psychometrika,1971,36(4):409-426

[25] Cheung G W,Rensvold R B.Evaluating goodness-of-fit indexes for testing measurement invariance[J].Structural Equation Modeling,2002,9(2):233-255

[26] Chen F F.Sensitivity of goodness of fit indexes to lack of measurement invariance[J].Structural Equation Modeling,2007,14(3):464-504

[27] 戴忠恒.心理与教育测量[M].上海:华东师范大学出版社,1987

[28] Byrne B M.Structural equation modeling with AMOS:Basic concepts,applications,and programming[M].Routledge,2013

[29] Boey K W.Cross-validation of a short form of the CES-D in Chinese elderly[J].International Journal of Geriatric Psychiatry,1999,14(8):608-617

[30] Burns R A,Butterworth P,Windsor T D,et al.Deriving prevalence estimates of depressive symptoms throughout middle and old age in those living in the community[J].Int Psychogeriatr,2012,24(3):503-511

[31] 陈祉妍,杨小冬,李新影.流调中心抑郁量表在我国青少年中的试用[J].中国临床心理学杂志,2009,17(4):443-445

[32] 张宝山,李娟.简版流调中心抑郁量表在全国成年人群中的信效度[J].中国心理卫生杂志,2011,25(7):506-511

猜你喜欢
信效度一致性量表
叙事安全教育材料的初步编制与信效度检验
注重教、学、评一致性 提高一轮复习效率
对历史课堂教、学、评一体化(一致性)的几点探讨
网络服装虚拟体验的概念模型及其量表开发
IOl-master 700和Pentacam测量Kappa角一致性分析
《公共体育服务政府供给社会期待量表》的编制与修订
CSE阅读量表在高中生自我评价中的有效性及影响因素
胸痹气虚证疗效评价量表探讨
高中生个人成长主动性问卷(PGIS—Ⅱ)的修订
基于事件触发的多智能体输入饱和一致性控制