陈 然,王 瑜,余建英,张 岚
(四川大学华西医院心理卫生中心,四川 成都 610041*通信作者:张 岚,E-mail:zhangzilan102@126.com)
论著·预防
PHQ-9在综合医院住院患者中信效度研究
陈 然,王 瑜,余建英,张 岚*
(四川大学华西医院心理卫生中心,四川 成都 610041*通信作者:张 岚,E-mail:zhangzilan102@126.com)
目的 检验病人健康问卷抑郁量表(PHQ-9)在综合医院住院患者中应用的信度和效度,探索PHQ-9在综合医院住院患者中快速筛查抑郁的可行性。方法 方便抽取四川大学华西医院569名住院患者,在规定指导语下完成PHQ-9评定,采用随机数字表法随机抽取38名患者在完成初次评定2周后进行PHQ-9重测;以简明国际神经精神访谈(MINI)作为“金标准”,评估中文版PHQ-9的效标效度,共139名患者接受MINI中文版访谈。结果 PHQ-9在本研究中的Cronbach' s α系数为0.839,各条目与总评分的相关系数r=0.484~0.724(P<0.01),各条目间相关系数r=0.229~0.520(P<0.01);两周后重测系数r=0.846(P<0.01);因子分析获得3个公因子,分别为自我评价因子、情感因子和躯体化因子;最佳诊断划界分为8分,敏感度为92.6%,特异度为60.6%;PHQ-9的ROC曲线下面积为0.841(95%CI:0.777~0.905)。结论 PHQ-9应用于综合医院住院患者抑郁评估中具有良好的信效度,8分为该量表的最佳划界分。
PHQ-9;信度;效度;综合医院;住院患者
研究表明,中国普通人群的重性抑郁障碍发病率约为2.07%~6.87%[1-3]。然而在综合医院,由于缺乏对患者精神问题的关注,综合医院对普通住院患者抑郁发作识别率仅为13.0%~31.8%[4-5],加之国内综合医院非精神科专业医师对精神类疾病识别率低[6-7],且目前国内尚未广泛普及应用于普通住院患者快速筛查抑郁的工具,非精神科患者的抑郁问题往往被忽视。使得患者反复就医、延误治疗、浪费医疗资源[8],甚至患者在住院期间发生自伤、自杀等严重后果[9]。因此,在该人群中验证一项便捷、可信度高的抑郁自评问卷意义重大。
病人健康问卷抑郁量表(Patients’ Health Questionnaire Depression Scale-9 item, PHQ-9)是以《精神障碍诊断与统计手册(第4版)》(Diagnostic and Statistical Manual of Mental Disorders, fourth edition,DSM-IV)的重性抑郁障碍(Major depressive disorder,MDD)为标准编制而成的9个条目自评工具,临床使用方便[10]。该量表已被翻译为多种语言版本,在不同人群中应用显示其具有良好的信效度[11-15],在国外已成为基层医疗中筛查抑郁症的首选工具之一。但目前还缺乏对该量表在综合医院普通住院患者中的信效度研究,在一定程度上限制了该量表的使用。本研究旨在检验PHQ-9在综合医院住院患者中的信效度,以便更好地服务于临床。
1.1 对象
采用方便取样,于2015年4月对四川大学华西医院的心脏内科、肿瘤科、风湿免疫科、疼痛科、甲乳外科5个科室共582例住院患者进行问卷调查。其中肿瘤科238人,风湿免疫科134人,心脏内科96人,疼痛科64人,甲乳外科50人。入组标准:①年龄≥16岁;②受教育程度在初中及以上;③身体状况能满足独立完成问卷评定;④患者自愿参加本研究并签署知情同意书。排除标准:①调查当日安排出院的患者;②有明显认知功能障碍或严重躯体疾病而无法完成调查者。
1.2 研究工具
采用自编一般资料调查表收集患者年龄、性别、民族、职业、婚姻情况、受教育程度、医疗保险、家庭年收入情况、目前疾病诊断、患病时间、健康状况、生活质量、心理健康状况自我评价。采用PHQ-9评估过去两周患者抑郁症状的发生频率,PHQ-9由9个四分类条目组成,0分为完全没有,1分为有几天, 2分为有一半以上的日子,3分为几乎每天都有。以中文版简明国际神经精神访谈(Mini International Neuropsychiatric Interview,MINI)评定结果作为“金标准”来评估PHQ-9的效标效度。
1.3 评定方法
预调查阶段,在四川大学华西医院住院患者中随机选取9例进行预调查,重点考察对9例患者进行MINI评定的调查员的一致性,调查员均为经过统一MINI评定培训的精神科医生。
正式调查阶段,由经过统一培训的3名四川大学临床心理学研究生进行自编一般资料调查表及PHQ-9的发放和收集,若患者因年龄、受教育程度、躯体疾病等而无法自行作答者,由调查员采取个别访谈的方式完成评定。问卷回收后当日交于质量控制员并编号。为了更有效地评价PHQ-9的校标效度,由质量控制员采用盲法分配方式将不同分数段的150名患者分配给调查员,由调查员在初次评定的当日或第二日对其进行面对面的MINI诊断访谈。
重测阶段,在正式调查完成2周后,由控制员采用随机数字表法抽取38名患者进行电话访谈以获取其一般资料及PHQ-9信息。
1.4 质量控制
当调查员之间MINI评估结果出现分歧,则由高年资心理学专家协助讨论,尽量提高研究者内部一致性。PHQ-9及MINI访谈问卷均在患者床旁、在研究者的指令下完成,调查时研究者与患者一一对应,避免患者相互讨论,问卷完成时间少于3 min则视为无效问卷。
1.5 统计方法
采用SPSS 18.0进行统计分析。采用Cronbach' s α系数评估量表内部一致性;采用Spearman相关系数法评估条目间及条目与总评分的相关性;探索性因素分析(exploratory factor analysis,EFA)用于评估结构效度;采用受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)检验PHQ-9诊断效能,以最大Youden指数确定最佳划界分。另外,根据数据分布特点,采用的统计方法包括描述性统计、方差分析、Bartlett球形检验、Mann-WitneyU检验等。检验水准α=0.05。
2.1 一般资料
本研究共纳入582例患者,其中13例未完成评定,最终回收有效问卷569份,有效问卷回收率为97.8%。其中男性264例(46.4%),女性305例(53.6%);年龄16~81岁,平均(51.0±15.0)岁。患者分布的科室情况:肿瘤科234例(41.1%),风湿免疫科131例(23.0%),心脏内科94例(16.5%),疼痛科62例(10.9%),甲乳外科48例(7.4%)。在569例患者中,初筛PHQ-9评分<10分者464例(81.5%),PHQ-9评分≥10分者105例(18.5%)。随机抽取40名患者进行PHQ-9重测,最终共完成38例(2例患者失访);对150例患者进行MINI访谈,最终完成139例(11例拒绝参与)。
2.2 信度检验
2.2.1 内部一致性检验
本研究中研究者内部一致性系数(intraclass correlation coefficient, ICC)为0.973,PHQ-9在本研究中的Cronbach' s α系数为0.839。
2.2.2 相关分析
Spearman相关分析显示:各条目与总评分的相关系数为0.484~0.724(P均<0.01),各条目间相关系数为0.229~0.520(P均<0.01)。见表1。
表1 PHQ-9各条目间及各条目与总评分的相关性(r)
注:aP<0.01(双侧检验)
2.2.3 重测信度
采用Spearman相关系数法对中文版PHQ-9初测与2周后重测结果进行分析,相关系数r=0.846(P<0.01)。
2.3 效度检验
2.3.1 结构效度检验
采用主成分分析法得到的KMO检验值为0.719,且Bartlett球形检验统计量为249.176(P<0.01),表明可进行探索性因子分析,并提取到三个成分,其特征值均大于1(分别为2.975、1.315、1.042),其累积方差贡献率为59.248%。经方差最大旋转后因子矩阵来看:条目 2(心情沮丧)、条目 6(自我否定)、条目 9(消极观念)在因子1的负荷值在0.554~0.897之间,可归为一个因子(自我评价因子);条目 3(睡眠障碍)、条目 4(精力不足)、条目5(饮食障碍)在因子2的负荷值在0.688~0.752之间,可归为一个因子(躯体化因子);条目 1(兴趣下降)、条目7(注意力难集中)、条目8(烦躁不安)在因子3的负荷值在0.530~0.720之间,可归为一个因子(情感因子)。见表2。
2.3.2 ROC曲线
139例接受MINI评定的患者中,阳性68例(48.9%),阴性71例(51.1%)。本研究中ROC曲线的标准为MINI诊断结果,以最大Youden指数(灵敏度+特异度-1)作为临界值的筛选标准,而以阳性预测值和阴性预测值作为参考值。最终得出:本研究最佳划界分为8分(对应的敏感度为92.6%,特异度为60.6%)。见表3。PHQ-9的ROC曲线下面积为0.841(95%CI:0.777~0.905,P<0.01)。见图1。
表2 PHQ-9因子分析结果
既往关于PHQ-9信效度检测的研究主要局限于特定病种的患者和特定人群,而随着近年来综合医院规模不断扩大、病种日趋复杂化,住院患者总体的抑郁症罹患率常常被低估。本研究对PHQ-9在综合医院住院患者中应用的信效度进行评估并探讨最佳划界分,旨在探索PHQ-9在该类群体中的应用价值。
表3 不同划界分时PHQ-9筛查诊断性能指标
图1 PHQ-9的ROC曲线
徐勇等[16]总结了PHQ-9在社区老年人群中应用的Cronbach' s α为0.832,各条目间的相关系数为0.233~0.523,各条目与量表总评分的相关系数为0.451~0.693,重测系数为0.934;胡星辰等[17]分析得到PHQ-9在青少年人群中的Cronbach' s α为 0.85,条目间相关系数为0.289~0.560,各条目与PHQ-9总评分相关系数为0.616~0.730,4周后重测信度为0.88;Wang等[15]对1 045例上海市社区普通人群进行分析得出Cronbach' s α为0.86,2周后重测信度为0.86。Gelaye等[18]研究显示,PHQ-9在926例东非国家成人中的Cronbach' s α为0.85,重测信度为0.92。本研究显示PHQ-9在综合医院住院患者中的Cronbach' s α为0.839,各条目评分与总评分之间的相关系数为0.484~0.724,提示该量表的内部一致性较好;其重测信度系数为0.81,表明PHQ-9具有良好的时间稳定性,即可重复评定的特性,这与PHQ-9在国内外不同群体中的研究结果接近。
关于PHQ-9结构效度分析,国内外少量研究中采用探索性因子分析得出1个潜因子[15,17,19],命名为“情感-躯体化因子”,而目前比较公认的为2因子结构,即“认知-情感和躯体因子”[12,14]。本研究得出三个特征值大于1的因子(自我评价因子、躯体化因子、情感因子),累积方差贡献率为59.248%,且各条目在其所属因子的负荷值均在0.5以上而在其他因子的负荷值明显较低,说明该量表具有良好的三因子结构。虽然为三因子结构,但本研究得出的“自我评价因子”仍可被认为是传统“认知-情感因子”的一部分。
胡星辰等[17]总结的PHQ-9在471名青少年中的ROC曲线下面积(AUC)为0.984(95%CI: 0.969~0.993),且PHQ-9评估抑郁情绪的最佳划界分为10分;Wang等[15]总结的PHQ-9在1 045名中国普通人群中的ROC曲线下面积为0.92(95%CI: 0.86~0.97),最佳划界分为7分(敏感度为86%,特异度为86%)。而既往有研究认为PHQ-9的最佳划界分为9~11分[20]。本研究PHQ-9应用于综合医院患者的ROC曲线下面积(AUC)为0.841,最佳诊断划界分为8分(敏感度为92.6%、特异度为60.6%),稍优于10分(灵敏度为85.3%、特异度为67.6%)。本研究最佳划界分下的敏感度高而特异度稍低于既往研究,可能与患者住院期间的抑郁状况较平时严重有关,这也与临床实际情况吻合。另外,较低的划界分(8分)更有利于早期发现、及时干预。
总之,本研究验证了PHQ-9在国内综合医院住院患者中应用具有良好的信效度,探讨了在该人群中应用的最佳划界分,为综合医院快速筛查抑郁症患者提供了有效的工具。但本研究仍存在一定局限性,首先患者均来自西部同一所大型综合医院,可能存在选择偏倚,不能代表全国所有综合医院。另外,PHQ-9为自评量表,会受到患者受教育程度及认知功能的影响,而本研究并未对此展开深入分析。在以后的临床运用中,还需进一步加以研究和完善。
[1] Lee S, Tsang A, Huang Y, et al. The epidemiology of depression in metropolitan China[J]. Psychol Med, 2009, 39(5): 735-747.
[2] Phillips MR, Zhang J, Shi Q, et al. Prevalence, treatment, and associated disability of mental disorders in four provinces in China during 2001-05: an epidemiological survey[J]. Lancet, 2009, 373(9680): 2041-2053.
[3] Liu J, Yan F, Ma X, et al. Prevalence of major depressive disorder and socio-demographic correlates: results of a representative household epidemiological survey in Beijing, China[J]. J Affect Disord, 2015, 179(8): 74-81.
[4] 陆峥, 朱俊娟, 蔡军, 等. 上海市综合性医院精神科门诊医师对抑郁症识别及治疗的对照研究[J]. 中华全科医师杂志, 2008, 7(4): 231-234.
[5] Sang W, Sun X, Li B, et al. A cross-sectional survey on the identification and treatment rate for depression of inpatients in general hospitals at country and city levels in Baoding City[J]. J Nerv Ment Dis, 2013, 39(7): 347-351.
[6] 张国芳, 赵均, 饶顺曾, 等. 2345名综合医院医务人员精神卫生知识知晓率的调查[J].上海精神医学, 2005, 17(增刊): 17-18.
[7] Li XJ, He YL, Ma H, et al. Prevalence of depressive and anxiety disorders in Chinese gastroenterological outpatients[J]. World J Gastroenterol, 2012, 18(20): 2561-2568.
[8] Karasz A, Dowrick C, Byng R, et al. What we talk about when we talk about depression:doctor-patient conversations and treatment decision outcomes[J]. Br J Gen Pract, 2012, 62(594): e55-63.
[9] Ng CW, How CH, Ng YP. Depression in primary care: assessing suicide risk[J]. Singapore Med J, 2017, 58(2): 72-77.
[10] Kroenke K, Spitzer RL, Williams JB. The PHQ-9: validity of a brief depression severity measure[J]. J Gen Intern Med, 2001, 16(9): 606-613.
[11] Kiely KM, Butterworth P. Validation of four measures of mental health against depression and generalized anxiety in a community based sample[J]. Psychiatry Res, 2015, 225(3): 291-298.
[12] Beard C, Hsu KJ, Rifkin LS, et al. Validation of the PHQ-9 in a psychiatric sample[J]. J Affect Disord, 2016, 193(5): 267-273.
[13] Liu ZW, Yu Y, Hu M, et al. PHQ-9 and PHQ-2 for screening depression in Chinese rural elderly[J]. PLoS One, 2016, 11(3): 1-10.
[14] Hinz A, Mehnert A, Kocalevent RD, et al. Assessment of depression severity with the PHQ-9 in cancer patients and in the general population[J]. BMC Psychiatry, 2016, 16(22): 1-8.
[15] Wang W, Bian Q, Zhao Y, et al. Reliability and validity of the Chinese version of the Patient Health Questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2014, 36(5): 539-544.
[16] 徐勇, 吴海苏, 徐一峰. 病人健康问卷抑郁量表(PHQ-9)在社区老年人群中的应用——信度与效度分析[J]. 上海精神医学, 2007, 19(5): 257-259.
[17] 胡星辰, 张迎黎, 梁炜, 等. 病人健康问卷抑郁量表(PHQ-9)在青少年中应用的信效度检验[J]. 四川精神卫生, 2014, 27(4): 357-360.
[18] Gelaye B, Williams MA, Lemma S, et al. Validity of the patient health questionnaire-9 for depression screening and diagnosis in East Africa[J]. Psychiatry Res, 2013, 210(2): 653-661.
[19] Kocalevent RD, Hinz A, Brähler E. Standardization of the depression screener patient health questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2013, 35(5): 551-555.
[20] Manea L, Gilbody S, McMillan D. Optimal cut-off score for diagnosing depression with the Patient Health Questionnaire (PHQ-9): a meta-analysis[J]. CMAJ, 2012, 184(3): E191-196.
(本文编辑:陈 霞)
Evaluation of the reliability and validity of PHQ-9 in general hospital inpatients
ChenRan,WangYu,YuJianying,ZhangLan*
(WestChinaHospitalofSichuanUniversity,Chengdu610041,China*Correspondingauthor:ZhangLan,E-mail:zhangzilan102@126.com)
Objective To investigate the reliability and validity of Patients' Health Questionnaire Depression Scale-9 item(PHQ-9) in general hospital inpatients and to explore the feasibility of PHQ-9 in screening hospitalized patients in general hospital.Methods To facilitate the extraction of 569 hospitalized patients in West China Hospital of Sichuan University, PHQ-9 was completed under the specified guidance. 38 patients were randomly selected by random number table and PHQ-9 retest was performed after 2 weeks of initial evaluation. Mini International Neuropsychiatric Interview(MINI) was used as the “gold standard” to evaluate the efficacy and validity of the Chinese version of PHQ-9. A total of 139 patients were interviewed by MINI Chinese version.Results The Cronbach' s α coefficient of PHQ-9 was 0.839 and the 2-week test-retest reliability was 0.846. The correlation coefficient of the items and total score was 0.484~0.724(P<0.01) and between items was 0.229~0.520(P<0.01). Factor analysis suggested a three-factor solution: self-assessment factor, affective factor and somatic symptom factor. The best diagnostic demarcation point is 8, maximizing the Youden Index, yielded a sensitivity of 92.6% and a specificity of 60.6%. The results of ROC analysis indicated that the area under the curve (AUC) was 0.841(95%CI: 0.777~0.905).Conclusion The Chinese version of PHQ-9 was shown to have good reliability and validity in general hospital inpatients. 8 is the best demarcation of the scale points.
PHQ-9; Reliability; Validity; General hospital; Inpatients
R749
A
10.11886/j.issn.1007-3256.2017.02.013
2017-02-27)