孙 硕 卓 琳 刘佳佳 于海元 卓 朗△
联合分析法探索EQ-5D量表积分体系*
孙 硕1卓 琳2刘佳佳3于海元1卓 朗3△
目的 使用联合分析法探索适合我国人群的EQ-5D量表积分体系。 方法 以典型抽样的方法,从医学院校按年级、专业分层抽取在校大学生200人,使用联合分析法设计18种状态,在计算机辅助下对假想状态的生命质量进行测评。使用广义最小二乘(GLS)构建多元线性回归模型,模型包括10个哑变量及常数项。 结果 两个模型均无内部逻辑错误,两者相关系数为0.999,R2分别为0.510、0.514,对13个经典状态的评分结果与其他欧洲国家研究结果有近似的趋势,但具有显著的国人文化特征。 结论 本研究可为我国EQ-5D量表积分体系建立的方法学和指标体系结果提供新的视角和参考。
联合分析法 EQ-5D量表 积分体系
欧洲生命质量量表(EQ-5D)是一种普适性量表,由五维度量表和直观视觉标尺量表(visual analogue scale,VAS)组成[1-2],其从五维度三水平的角度上要求被应答者勾选出最符合当天自身实际状况的等级水平[3],并在VAS轴上进行自我评分。用一个特定状态和一个综合评分来反映应答者当天健康状况,因其简明、易于操作、应用面广、可信度高等优点在国际上得到了广泛应用[1]。
1997年,英国学者Dolan等[4]采用时间交换法(TTO)直接测量了42个健康状态的效用值,并据此通过计量经济学方法建立了经典的N3模型。之后,美国、日本等相继在其基础上建立了适合本国人群偏好的效用值积分体系[5]。目前,韩国等国家已经开始这项研究工作[6-10]。而我国还没有建立适合我国人群偏好的效用值积分体系,最常用的仍是英国或日本的结果[12]。由于42个状态测量需要的样本量较大,而且TTO较VAS测量变异系数大,模型稳健程度低。所以成本高、难度大一直是该方法在国内难以推广使用的根本原因。
本研究旨在探索使用联合分析法选取典型状态[13],使用改进的VAS方法进行评分测量,使用计算机辅助测量,提高评分信度,从而丰富生命质量效用值积分体系的研究方法,提高我国关于居民生命质量测量的研究水平,为我国相关卫生政策提供参考。
1.资料
为了减少应答者对评价结果的影响,本研究以典型抽样的方法,选取具有一定医学知识背景的医学院校在校大学生为测评对象,按不同年级、专业进行分层,随机抽取200人作为应答者,对假想状态的生命质量进行测评。信度合格视为一个合格样本,共进行200份调查,回收200份,有效合格率100%。
2.方法
(1)联合分析法设计标准状态
EQ-5D量表五因素三水平的问卷,为了便于扩展性别、年龄组、社会经济状况等因素,同时提高应答者样本量,选取L18(2×37)正交设计表,得到18个标准状态,见表1。
(2)VAS评分范围的设计
ModelA生命质量VAS评分范围为10~0~-1,其中10为心目中最优状态,0为死亡状态,-1为心目中最差状态。ModelB把VAS<0的值直接乘以3.333,将模型VAS评分范围为调整为10~0~-3.333。如果应答者认为某个状态比死亡差,可以适当给负分,但应慎重使用极端负值。生命质量VAS评分调整值的计算公式,VASrescale=VASraw/10。
(3)信度控制方法
信度控制来自三个方面:首先使用应答者对18个标准状态的评分,应用多元线性回归模型预测应答者自己的健康得分,应答者认为合理;其次回归模型内在逻辑合理比例超过80%,即回归模型中各维度健康得分要高于中等障碍,中等障碍得分要高于严重障碍;最后从最优状态到最差状态的数据分布合理标准差在2.5左右,离差偏移控制在80%以内。三个信度指标由计算机辅助过程完成。
(4)统计分析方法
本研究使用广义最小二乘(GLS)回归分析法进行数据分析,应用Stata12.0SE软件进行多元线性回归模型构建,并经过模型诊断,逐步删除异常值、杠杆值、强影响点后,得到最终回归模型。
模型哑变量设计M2、S2、U2、P2及A2分别表示行动能力(mobility)、自我照顾能力(self-care)、日常活动能力(usual activity)、疼痛/不舒服(pain)、焦虑/抑郁(anxiety)处于水平2时为1,其他为0;M3、S3、U3、P3及A3分别表示这五个维度处于水平3时为1,其他为0。例如行动能力处于水平1,2,3时分别记为m2=0,m3=0;m2=1,m3=0;m2=0,m3=1。其余类推。有些国家的模型使用了N3哑变量,表示至少有1个维度处于水平3时为1,其他为0。但本研究参照多数国家的模型,同时考虑到模型的简洁性,构建不带N3变量的模型。R2为模型的决定系数。
1.模型系数
本研究的ModelA、ModelB及同其他五个国家的模型系数[14]见表2。
2.经典状态的评分
用本研究的ModelA、ModelB及同其他五个国家的模型系数[14]对13个典型状态进行评分见表3、图1。
*:ModelA:F=189.83,P<0.001,R2=0.5098,adjustedR2=0.5072; ModelB:F=193.34,P<0.001,R2=0.5144,adjustedR2=0.5118
本研究ModelA、ModelB两个模型对13个典型状态的评分差值不超过0.024,有11个状态差值在0.01以内,两者的相关系数为0.999,经配对样本t检验,两者差异无统计学意义(P=0.712)。
图1显示本研究ModelA、ModelB在最上方,而且两条曲线十分接近,几乎重合。
3.经典状态评分的内在逻辑错误核查
为了能更直观地理解生命质量得分,使用13个经典状态评分,每个维度使用“完全障碍”为对照组,并将生命质量评分值换算为满分10分,重新换算后,结果见表4。
表4中,逻辑合理性指与行动完全障碍(定义为参照组0 分)相比,行动自如>行动不便>0,表中斜体显示的数据均为逻辑错误。
1.研究方法简单易行信度高 随着社会经济的发展,疾病谱的变化和健康观念的改变,人们越来越重视疾病给身体、心理及社会等方面带来的影响。生命质量[15]开始走进人们的视野[16],发展以我国人群偏好为基础的生命质量量表积分体系成为近年研究热点[17]。本研究使用联合分析方法、改进的VAS评分、计算机辅助、广义最小二乘多元线性回归法进行VAS积分体系研究,样本量小,信度高,操作简单易行。R2值高于英国的模型,内在逻辑错误为0,而其他国家的模型均存在内部不一致的情况,说明计算机辅助在这种复杂的调查过程中可以提高测量信度。
2.本模型具有突出的国人文化特征 由图1可见,与其他欧洲国家相比较,本模型曲线形态相似,但分值普遍高于其他模型,尤其是状态“33333”,其他国家的评分已经低于0分,而本研究的两个模型仍然高于0分,应验了国人一句老话“好死不如赖活着”。应答者以失去自我照料能力、失去社会活动能力为最高的生命质量损失,而其他国家多以“行动完全障碍”为最大的影响因素。
3.对经典EQ-5D的VAS评分的改进 经典VAS测量中,应答者要人为指定死亡的位置,然后再经过VASrescal=(VASraw-VASdead)/(VAS11111-VASdead)进行调整[18],这样,比死亡好的状态可以调整为0~1,而比死亡差的状态则可以调整为0~-∞,这个显然是不合理的。本研究在预试验中发现,很少有人把死亡标记超过25分,如果状态“11111”认为是满分的话,比死亡差的生命质量VAS应该在0~-0.3333。所以本研究针对比死亡差的状态使用了0~-1和0~-3.333两个VAS范围构建了两个模型,并证明数据的换算不影响测量的可行性。
4.其他需要阐明的问题 取L18正交设计一方面可以扩充研究变量而保持典型状态不变,另外一方面增加多元线性回归模型的稳定性。此外,由于1个应答者要完成18个标准状态的评定,难以满足独立、正态、等方差等一般最小二乘(OLS)对数据的要求,故使用了广义最小二乘(GLS)方法[19]。此外在评分环节,明确告知应答者不要过分关注变量间的相关性问题,慎重给予负的极端值评分。
5.本研究的局限 本研究主要目的是在方法学上进行改进和创新,存在样本量偏低、模型稳健程度中等、模型变量完备性尚需进一步考察等不足,所选的医学生群体作为样本不能代表全人群,可能会造成结果的偏倚。样本的性别、年龄、经济状况等因素的影响需要进一步探讨。所以模型不能作为国人积分体系使用,但可以用作同类研究的方法学和指标体系的参考。
[1]田斐,高建民,郭海涛,等.欧洲五维度健康量表(EQ-5D)研究与应用概况.卫生经济研究,2007(9):42-44.
[2]Richard Brooks,With the EuroQol Group.EuroQol:the current state of play.Heath Policy,1996,37:53-72.
[3]Rabin R,de Charro F.EQ-5D:A measure of health status from the EuroQol group.Annals of Medicine,2001,33(5):337-343.
[4]Dolan P.Modeling valuations for EuroQol health states.Med Care,1997,35(11):1095-1108.
[5]伍红艳,孙利华.欧洲五维健康量表效用值积分体系构建方法及结果的国际比较.中国新药杂志,2012(6):587-591.
[6]Lee YK,Nam HS,Chuang LH,et al.South Korean time trade -off values for EQ-5D health states:modeling with observed values for 101 health states .Value in Health,2009,12(8):1187-1193.
[7]Chevalier J,Pouvourville G.Valuing EQ-5D using time trade off in France.Value in Health,2009,12(7):A224-A233.
[8]Bansback N,Tsuchiya A,Brazier J,et al.Canadian valuation of EQ-5D health states:preliminary value set and considerations for future valuation studies.PLoS One,2012,7(2):1-11.
[9]Golicki D,Jakubczyk M,Niewada M,et al.Valuation of EQ-5D health states in Poland:first tto-based social value set in Central and Eastern Europ.Value in Health,2010,13(2):289-297.
[10]Augustovski FA,Irazola VE,Velazquez AP,et al.Argentine valuation of the EQ-5D health states.Value in Health,2009,12(4):587-596.
[11]Zarate V,Kind P,Valenzuela P,et al.Social valuation of EQ-5D health states:the Chilean case.Value in Health,2011,14(8):1135-1141.
[12]岳明,赵绯丽,吴久鸿,等.地区因素对生活质量总体评分和效用的影响:北京昆明两地慢性前列腺炎患者生命质量比较调查.中国卫生经济,2010,29(11):89-91.
[13]关丽征,金岳,滕菲,等.联合分析法在社区卫生服务选择偏好中的应用.中国全科医学,2011(16):1758-1762.
[14]Agota SO,Namcy MD.EQ-5D Value Sets:Inventory Comparative Review and User Guide.Springer,The Netherlands,1-102.
[15]张阳,武玉欣,曲波,等.SF-36量表在医学生生命质量评价中的应用.中国卫生统计,2013(30):468.
[16]Bunossi ZM,Guyatt G.Cholestatic liver diseases and health related quality of life.AJG,2000,95:497-502.
[17]伍红艳,刘国恩.生命质量量表不同计分方法对评价结果的影响.中国卫生经济,2013(08):66-67.
[18]Szende A,Oppe M,Devlin N.EQ-5D value sets:Inventory,comparative review and user guide.Dordrecht:Springer,2007.
[19]郎静波.广义最小二乘法在建立回归模型中的应用.统计科学与实践,2001(5):18-19.
(责任编辑: 郭海强)
江苏省大学生创新计划(201410313045Y)
1.徐州医学院临床医学系(221004)
2.新乡医学院基础医学院
3.徐州医学院公共卫生学院
△通信作者:卓朗,E-mail:episoft@163.com