中文版挫败感量表在男男性行为人群中的信度和效度评估

2021-07-02 09:30刘尚滨董婧雯喻晓月
关键词:效度信度条目

刘尚滨,杨 皓,徐 晨,董婧雯,喻晓月,蔡 泳,袁 东,王 英#

1.上海交通大学公共卫生学院,上海200025;2.上海市疾病预防控制中心,上海200336

挫败的概念是由人类抑郁的社会等级描述发展而来[1],被定义为一种在社会斗争中失败、社会等级降低或丧失的感觉[2]。这种失败、社会等级降低或丧失可发生于人与人之间的直接冲突中,或某些个体不能接触到某些社会资源(例如高端产品、高等教育、人脉、场所等)的情况。一项纳入了40 篇文献的meta 分析[3]发现,挫败通常与抑郁、焦虑、创伤后应激障碍和自杀倾向相互有关联,而抑郁、焦虑、创伤后应激障碍和自杀倾向都是近年来人类健康的巨大障碍;其中,抑郁对男男性行为人群(men who have sex with men,MSM)健康的影响尤为突出。世界各地均有研究[4-8]表明,MSM 的负面情感以及因负面情感累积所导致的抑郁的发生率均高于同龄异性恋人群。

社会等级理论[9]认为,在人类社会的资源冲突中(包括斗争、争夺、竞争等),有些个体会在冲突中胜出,与之相对的就会有个体的失败。这些在冲突中失败或处于劣势的个体会表现出顺从行为,即逐渐退缩、屈服甚至完全放弃,以此尽量避免将冲突进一步加剧而受到更大的伤害或损失。但是逐渐退缩、屈服甚至完全放弃的过程就是产生挫败感的过程,而挫败与抑郁关系紧密,是与抑郁相关的一个关键变量[10],在抑郁症的进化过程中起到核心作用[1]。国内MSM 的抑郁流行态势严峻,挫败与抑郁关系紧密,因此可以通过量表量化MSM 的挫败感,并根据此结果判断被测对象是否处于抑郁状态,随后较为准确地将该人群中被判断处于抑郁状态的个体筛选出来,对这些个体开展心理健康干预,以减轻或释放其挫败感。如此便可控制产生抑郁的一个关键变量,最后达到减轻或缓解抑郁对MSM 造成的心理健康负担。但是,目前国内暂无针对MSM 的挫败感测量工具。为使上述理论在未来能得以实现,本研究针对MSM 引入并汉化了挫败感量表(Defeat Scale,DS),且在此基础上将其应用于上海市和沈阳市的MSM 中,检验其信度、效度以及对抑郁状态的判断价值,为将来通过DS 测量国内MSM 的挫败感和判断其抑郁状态,进而减轻或缓解抑郁对MSM 造成的心理健康负担提供测量工具。

1 对象与方法

1.1 研究对象

2018 年3 月—11 月在上海市长宁区、静安区、闸北区、浦东新区,以及沈阳市大东区、沈河区、和平区、铁西区、皇姑区选择年龄18 周岁以上且在过去的6 个月曾经发生过男男性行为的人群展开横断面调查。

1.2 研究工具

1.2.1 DS DS是1998年由Gilbert和Allan提出,用于量化因失去社会地位、财富、资源和奋斗的挫败感觉的量表[11]。该量表作者已经验证此量表在其国家的学生和抑郁症患者群体中有着良好的信度和效度;同时土耳其和德国的研究[2,12]也表明,土耳其语言版本和德语版本的DS 也具有良好的信度和效度。DS 共有16 个条目,其中条目2、4和9为反向计分,其余为正向计分。采用5点计分法:按“从不”“极少”“有时”“经常”“总是”的顺序依次计0~4 分,将反向计分条目进行转化之后计算总分,总分区间为0~64,得分越高者挫败感越强。

1.2.2 患者健康问卷抑郁量表 患者健康问卷抑郁量表(Patient Health Questionnaire-9,PHQ-9)是一个成熟的抑郁症筛查量表,量表总得分≥10,可判断受试者处于抑郁状态[13]。多篇文献[14-16]指出其简单、有效,被广泛应用于国内外基层卫生服务的研究和实际工作中。本研究中的挫败感与抑郁有密切的相关关系[17],所以本研究以PHQ-9作为校标量表。

1.3 研究过程

1.3.1 DS 及其汉化 通过电子邮件征求到DS 研制者的同意后,采用双人回译法对量表进行翻译和文化调试。首先在1 名流行病及预防医学专家的指导下,由2 名母语为中文且英文水平较好的预防医学专业的硕士研究生分别独立将量表翻译成中文,并与专家共同讨论,将量表整合成中文译本。然后由母语为英文且中文较好的2名医学专业留学生分别独立将整合后的中文译本进行回译,之后将2 份译本交予1 名精通英文和中文的流行病学专家进行对照、比较和整合。确定译本初稿后,采用方便抽样的方法,选取2020 级预防专业的42 名本科学生进行预试验。在预试验中,研究者记录调查对象填写量表的用时、存在问题和建议,了解调查对象对条目的理解和感受,根据调查结果对初稿进行适当的修正。当预试验对象均反馈量表所有条目清晰、易懂、无歧义时定稿。定稿的量表条目和计分方法与原量表保持一致。

1.3.2 样本量的计算 在量表方法研究中要求样本量至少是量表条目数的10 倍[18-19]。本研究使用的量表共有16个条目,样本量最低要求为160 人,实际纳入530 名参与者,满足最低样本量要求。

1.3.3 调查方法 由于MSM的隐匿性,因此采用“滚雪球”的抽样方法[10]。首先,与各个区的疾病预防控制中心联系,并与能接触到MSM 非政府组织的工作人员合作,在每个区随机确定5~10个符合研究纳入标准的MSM作为“种子”并完成调查。然后通过“种子”的推荐招募更多符合研究纳入标准的同伴,形成滚雪球效应,纳入更多符合标准的MSM。经过统一培训的工作人员与MSM 展开一对一的匿名问卷调查。在调查之前,由工作人员向调查对象详细解释本研究的目的、过程及意义,并回答他们所有的疑问。本研究获得了上海交通大学公共卫生学院伦理委员会的批准,所有研究对象在调查前均签署了书面形式的知情同意书。

1.3.4 统计学方法 使用Excel 2010 建立数据库,采用SPSS 23.0 和AMOS 25.0 软件对数据进行信度和效度分析。采用探索性因子分析和验证性因子分析来验证DS 的结构效度。用Shapiro-Wilk检验方法检验数据是否服从正态分布。用Spearman相关系数评价DS的内容效度。采用Cronbach'sα系数评价其内部一致性信度。 采用Spearman-Brown 系数评价其折半信度。采用二元Logistic回归判断挫败感是否能影响抑郁状态,在此结果基础上进一步使用ROC曲线判断其诊断价值。P<0.05为差异具有统计学意义。

2 结果

2.1 结构效度

2.1.1 探索性因子分析 进行因子分析前,用Kaiser-Meyer-Olkin(KMO)检验和Bartlett's 球形检验评价数据抽样的充分性和因子分析的可行性,结果显示KMO值为0.946,Bartlett 球形检验的χ2值为4 011.71(P<0.01),表明数据满足进行因子分析的条件。采用主成分分析和最大方差正交旋转共提取出2个公因子,分别命名为“颓败感”和“低成就感”,累计方差贡献率为69.35%。各个条目的因子载荷在0.695~0.883 之间,见表1。各条目因子载荷均大于或接近0.7,累计方差贡献率接近70.00%,因此接受此两因子模型,且无需删除DS中的任何条目。

表1 DS的因子载荷Tab 1 Factor loading of DS

2.1.2 验证性因子分析 在探索性因子分析的基础上,对得到的两因子模型进行验证因子分析,并参照修正指数对两因子模型进行修正。结果(图1)显示,两因子模型中的各个条目因子载荷均大于0.50,最小值为0.52,且因子载荷均有统计学意义。本研究采用了多个拟合指标来评价该模型的拟合情况:卡方自由度比(χ2/df)=3.430,<5;近似误差均方根(root mean square error of approximation,RMSEA)=0.068,标准化均方根残差(standardized root mean square residual,SRMR)=0.043,均<0.080;标准适配指数(normed fit index,NFI)=0.944,增值适配指数(incremental fit index,IFI)=0.959,比较适配指数(comparative fit index,CFI)=0.959,拟合优度指数(goodness of fit index,GFI)=0.909,塔克·刘易斯指数(Tucker-Lewis Index,TLI)=0.958,均>0.900。两因子模型拟合优良。

2.2 校标效度

本研究DS 与PHQ-9 数据均不服从正态分布,因此采用Spearman 相关系数评价2 个量表的相关性。结果显示,相关系数为0.678(P<0.01),具有统计学意义。

2.3 内容效度

图1 修正后的两因子DS模型Fig 1 Model of DS revised by two factors

因大部分条目不服从正态分布,因此采用Spearman相关系数进行相关性分析。结果表明,各条目与其所属维度(颓败感和低成就感)有较强的相关性,分别为0.771~0.881和0.752~0.847(均P<0.05,表2),具有统计学意义。

表2 DS各条目与所属维度间的相关系数Tab 2 Correlation coefficient between each item and its dimension of DS

Continued Tab

2.4 内部一致性和折半信度

DS 中16 个条目的内部一致性Cronbach'sα系数为0.934,2 个维度即颓败感和低成就感的Cronbach'sα分别为0.962和0.758。Spearman-Brown系数为0.933。

2.5 挫败感对抑郁状态的判断价值

以抑郁状态作为因变量,DS 得分为协变量,进行二元Logistic 回归,结果显示:β值为0.178,P=0.000;比值比(odds ratio,OR) 为1.195, 95% 置信区间(confidence interval,CI)为1.147~1.245,可认为挫败感与抑郁状态正向关联显著。在此基础上绘制出受试者操作特征曲线(receiver operator characteristic curve,ROC curve)(图2),曲线下面积(area under the curve,AUC)为0.891,P=0.000;最大约登指数值为0.667,其所对应的DS 得分为21.5,其灵敏度和特异度分别为87.0%和80.7%。

图2 DS得分判断个体抑郁状态的ROC曲线Fig 2 ROC curve for predicting individual depression by DS score

3 讨论

相比于普通人群,MSM 常遭受歧视和污名化,导致其在求职、工作和社交等方面上更易被拒绝和经历失败。挫败感可增加个体的沮丧情绪和心理负担,由此导致抑郁的发生[20]。DS被国内外的多项研究证实在各人群中可有效测量挫败感。本研究为了给国内MSM 提供可测量其挫败感同时又能对该人群抑郁状态进行初步判断的量表,从而引进并汉化了DS,并选取了上海和沈阳530 名MSM进行了信度、效度分析和ROC曲线分析。

结构效度能反映量表的结构是否与制表的理论设想相符合,测量结果的各内在成分是否与设计者意图测量的领域一致。关于DS 的结构效度,我们最关心的问题是“DS 实际测量了MSM 的哪些特征”和“DS 在MSM 中为什么有效”。本研究在KMO 检验和Bartlett's 球形检验中提示530 名MSM 数据满足进行因子分析的可行性基础之上,经探索性分析提取出“颓败感”和“低成就感”2个公因子。这回答了第一个问题,DS 在MSM 中实际测量的是颓败感和低成就感,这与DS 在国内医学生[20]、土耳其大学生[2]和德国的一项网络调查[12]结果一致,进一步证明了DS 的广泛适用性。在探索性分析基础上,我们凭借AMOS 结构方程模型软件进行验证性因子分析,最终得到了修正后的两因子DS模型(图1),其拟合度比国内医学生群体[20](χ2/df=7.199,RMSEA=0.097,CFI=0.925,Cronbach'sα=0.933)更优。因子载荷反映条目与所对应的公因子的相关程度,累计方差贡献率则是反映公因子对量表的累积有效程度。修正后的模型中,颓败感13 个条目的因子载荷在0.72 到0.87 之间,低成就感3 个条目因子载荷分别为0.75、0.95 和0.52。结合探索性因子分析中的累计方差贡献率,我们不难发现DS 各个条目与所在公因子相关良好,而且公因子对量表的累积有效度也是良好的,这回答了上文的第二个问题。值得一提的是,两因子DS 结构方程模型中的相关性和有效度并不是简单的两两关系,而是考虑了所有条目和2个公因子同时存在情况下的结果,这更贴近量表在实际填写下的场景,进而反映了DS能够真实测量MSM的挫败感程度。

信度即可靠性,是指采用同一量表对同一人群进行调查时,问卷调查结果的稳定性和一致性,即量表能否稳定地测量目标人群的某种特性。本研究使用了最常用的Cronbach'sα系数和折半信度法来评价DS在MSM 中的信度。一般认为量表的Cronbach'sα>0.80 表示量表内部一致性较好[21]。本研究中DS 的Cronbach's α=0.934,颓败感和低成就感的Cronbach'sα分别为0.962 和0.758,这说明DS 不仅整体可靠性优良,而且两公因子也具有不错的可靠性。折半信度法是将调查数据分为2个部分,计算2 个部分得分的Spearman-Brown 系数,进而估计整张量表的信度。DS 在MSM 中的Spearman-Brown 系数为0.933,这一数值同样能够反映DS 在MSM 中具有良好的信度,能稳定测量MSM心理挫败感程度。

为了验证DS 是否具有较好的特异度和灵敏度来初步判断MSM 的抑郁状态,需将数据进行ROC 曲线分析找到其临界点,但是在此之前必须确定挫败感是否能影响MSM 的抑郁状态。如果挫败感不能影响MSM 的抑郁状态,就不会存在对其的判断能力。本研究通过以PHQ-9所测出的个体抑郁状态作为因变量,挫败感量表得分为协变量的二元Logistic回归得出其β值为0.178、P=0.000,OR值为1.195、95%CI1.147~1.245,可认为挫败感与抑郁状态正向关联显著。在此结果基础上绘制出ROC曲线、计算并找出最大约登指数值0.667 对应的DS 量表得分为21.5,结合其灵敏度和特异度均>80%,可以得出当MSM的DS量表得分大于21.5时可判断其处于抑郁状态。

本研究存在以下不足之处。招募MSM 采用了滚雪球的抽样方法,后续加入的MSM 由早期加入的MSM 介绍而来,通过彼此引荐招募的MSM 可能具有某些相互吸引特性或者在某些方面有一致的观点和看法。这可能使得样本人群的代表性不足,研究结果的外推性受到限制。尽管本研究是一项多中心、较大样本量的研究,但是也只是涉及上海和沈阳2 个城市的530 名MSM,可能难以代表全国的MSM。还有一点不足之处是量表由研究对象主观填写,这使得研究的客观性不足,且无法得知结果是被高估还是被低估。

综上所述,本研究初步证实汉化版DS 在国内MSM中具有良好的信度和效度,挫败感对于抑郁状态具有判断价值。本研究为国内MSM 挫败感的测量提供了适宜量表,同时也为将来通过DS 量表判断抑郁状态,并通过控制产生挫败感的变量来预防抑郁状态创造了前提条件。运用DS 量化MSM 挫败感程度,可实现在较早时间点判断其是否处于抑郁状态,为后续改善或预防该人群的抑郁状态提供基础和参考。

参·考·文·献

[1] Taylor PJ,Gooding P,Wood AM,et al. The role of defeat and entrapment in depression,anxiety,and suicide[J]. Psychol Bull,2011,137(3):391-420.

[2] Akın A, Uysal R, Çitemel N, et al. The validity and reliability of Turkish version of the defeat scale[J]. IOJES,2013,5(3):660-666.

[3] Siddaway AP,Taylor PJ,Wood AM, et al. A meta-analysis of perceptions of defeat and entrapment in depression, anxiety problems, posttraumatic stress disorder,and suicidality[J]. J Affect Disord,2015,184:149-159.

[4] Kerridge BT, Pickering RP, Saha TD, et al. Prevalence, sociodemographic correlates and DSM-5 substance use disorders and other psychiatric disorders among sexual minorities in the United States[J]. Drug Alcohol Depend,2017,170:82-92.

[5] Luo ZZ, Feng TJ, Fu HL, et al. Lifetime prevalence of suicidal ideation among men who have sex with men: a meta-analysis[J]. BMC Psychiatry,2017,17(1):406.

[6] Sivasubramanian M, Mimiaga MJ, Mayer KH, et al. Suicidality, clinical depression,and anxiety disorders are highly prevalent in men who have sex with men in Mumbai,India:findings from a community-recruited sample[J]. Psychol Health Med,2011,16(4):450-462.

[7] Tomori C, McFall AM, Srikrishnan AK, et al. Diverse rates of depression among men who have sex with men (MSM) across India: insights from a multi-site mixed method study[J]. AIDS Behav,2016,20(2):304-316.

[8] 刘珺,郜艳晖,杨翌. 男男性行为者抑郁症状流行病学研究现状[J]. 中华疾病控制杂志,2012,16(6):527-530.

[9] Wetherall K, Robb KA, O'Connor RC. Social rank theory of depression: a systematic review of self-perceptions of social rank and their relationship with depressive symptoms and suicide risk[J]. J Affect Disord,2019,246:300-319.

[10] Liu J,Yi Z,Zhao Y,et al. The psychological health and associated factors of men who have sex with men in China: a cross-sectional survey[J]. PLoS One,2018,13(5):e0197481.

[11] Galynker I, Yaseen ZS, Cohen A, et al. Prediction of suicidal behavior in high risk psychiatric patients using an assessment of acute suicidal state: the suicide crisis inventory[J]. Depress Anxiety,2017,34(2):147-158.

[12] Forkmann T, Stenzel JS, Rath D, et al. "Defeated by life" - validation of a German version of the defeat scale (DS-d)[J]. Psychother Psychosom Med Psychol,2018,68(7):300-308.

[13] Manea L,Gilbody S,McMillan D. A diagnostic meta-analysis of the Patient Health Questionnaire-9 (PHQ-9) algorithm scoring method as a screen for depression[J]. Gen Hosp Psychiatry,2015,37(1):67-75.

[14] 李振华,肖亚洲,谢知,等. 病人健康问卷抑郁量表(PHQ-9)在农村社区老年人群中的应用[J]. 中国临床心理学杂志,2011,19(2):171-174.

[15] 杨海洪. 9条目病人健康问卷抑郁量表在卒中后抑郁筛查中的应用价值[J].实用临床医药杂志,2016,20(8):28-30.

[16] 周春兰,刘颖,罗祥蓉. 病人健康问卷抑郁自评量表在住院糖尿病足溃疡患者中应用的信效度研究[J]. 中国全科医学,2016,19(28):3461-3466.

[17] 方鸿志,崔汶,范会勇. 挫折事件、抗挫折能力与大学生抑郁的关系[J].中国健康心理学杂志,2017,25(7):1089-1092.

[18] Bobov G, Capik C. The reliability and validity of the religious health fatalism scale in Turkish language[J]. J Relig Health, 2020, 59(2): 1080-1095.

[19] Joo H, Kang HH, Moon HS, et al. Validity and reliability of the Korean version of the Wisconsin Smoking Withdrawal Scale[J]. Korean J Intern Med,2021,36(1):135-144.

[20] 唐华,王甦平,龚睿婕,等. 挫败感量表对医学生焦虑抑郁态的信效度评估[J]. 上海交通大学学报(医学版),2019,39(1):84-88.

[21] 李灿,辛玲. 调查问卷的信度与效度的评价方法研究[J]. 中国卫生统计,2008,25(5):541-544.

猜你喜欢
效度信度条目
以患者为主的炎症性肠病患者PRO量表特异模块条目筛选
平衡损失函数下具有两水平共同效应的信度模型
净保费在平衡损失函数下的回归信度估计∗
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
《词诠》互见条目述略
Beep test评估11~15岁少年游泳运动员有氧能力的效度研究
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
语言测试效度研究的另一视角:考试的因子结构研究
墨子论度