欧洲生命质量五维度量表-儿童及青少年版测量属性与效用积分体系的研究进展

2022-09-02 06:02杨智豪张若钰
中国医学科学院学报 2022年4期
关键词:效度效用信度

孙 悦,杨智豪,张若钰,王 沛

1复旦大学公共卫生学院,上海 200032

2贵州医科大学医药卫生管理学院,贵阳 550025

2009年欧洲生命质量学会的专家在欧洲生命质量五维度量表(EuroQol Five-Dimensional Questionnaire,EQ- 5D)的基础上专为儿童和青少年开发的未成年人版本(EuroQol Five-Dimensional Questionnaire-Youth Version,EQ- 5D-Y),可广泛用于8~15岁儿童和青少年健康相关生命质量(health-related quality of life,HRQOL)测量[1]。EQ- 5D-Y由五维度的健康状态描述系统(行动能力,自我照顾,做经常做的事,疼痛或不舒服和感到担心、伤心或不高兴)和视觉标尺(visual analogue scale,EQ VAS)组成,其维度标题、措辞和布局相对于EQ- 5D都做了修订,以提高对儿童和青少年的友好性、适用性和可理解性。与EQ- 5D有两个版本即3水平(three-level version,3L)EQ- 5D (EQ- 5D- 3L,3L)与5水平(five-level version,5L)EQ- 5D(EQ- 5D- 5L,5L)一样,EQ- 5D-Y也有3水平EQ- 5D-Y(EQ- 5D-Y- 3L,Y- 3L)和5水平EQ- 5D-Y(EQ- 5D-Y- 5L,Y- 5L)两个版本,但后者目前尚未最终定稿还只是属于试验版本。

相较于其他用于测量未成年人HRQOL的量表如KIDSCREEN- 27、PedsQL、CHU9D等[2- 5],EQ- 5D-Y具有几个显著优点。首先,它保留了EQ- 5D结构简洁、便于操作等特点,对儿童和青少年的填写负担较小。其次,如果分别在儿童和青少年时期使用EQ- 5D-Y、在成年阶段使用EQ- 5D进行HRQOL测量,可以有意义地追踪从儿童期到青春期再到成年期HRQOL的变化。最后,EQ- 5D-Y作为效用值量表,可以将其定义的健康状态转化为健康效用值从而用于卫生经济学评价,能够为基于未成年人的医疗政策或治疗方案的卫生经济学研究提供参考信息。因此,近年来越来越多研究开始关注EQ- 5D-Y。本文对目前有关EQ- 5D-Y的文献进行了系统性总结,以阐明EQ- 5D-Y的研究现状与发展趋势。

资料和方法

文献检索策略在PubMed和Web of Science中以“EQ- 5D-Y、children/adolescents”为关键词、在中国知网和万方等数据库中以“EQ- 5D-Y、儿童/青少年”为关键词,搜集国内外公开发表的关于EQ- 5D-Y量表的文献,检索时限为2021年4月前的所有文献。

纳入与排除标准纳入标准:(1)正式发表的所有关于EQ- 5D-Y的中英文原创性文章;(2)关于EQ- 5D-Y测量属性验证和效用积分体系构建的研究内容。排除标准:(1)非中文或非英文文献;(2)综述、系统评价和指南等非一次文献;(3)只提及EQ- 5D-Y,而没有收集其数据并对其进行分析;(4)将EQ- 5D-Y作为辅助测量工具,着重论述其他工具测量属性,或只运用了EQ VAS的文献。

研究方法通过研究纳入和排除标准对文章进行筛选与确定,采用比较分析法对纳入的文章进行分析。按照研究内容的不同进行初步分类,总结研究内容的共性与不同,梳理出EQ- 5D-Y的研究现状。

结 果

通过检索并去除重复文献后,得到95篇文献,再根据上述的纳入与排除标准,最终纳入38篇文献(37篇英文文献,1篇中文文献)(图1)。对上述文献进行整理归类后,我们发现目前关于EQ- 5D-Y的研究内容主要有4类:(1)Y- 3L与Y- 5L量表的开发[6- 7];(2)EQ- 5D-Y测量属性的评估和验证;(3)应用EQ- 5D-Y测量未成年人的HRQOL[8- 14];(4)关于EQ- 5D-Y效用积分体系构建方面的研究。EQ- 5D-Y作为一种效用值量表,若想用于经济学评价,要解决的两个核心问题就是验证其测量属性以及开发对应的效用积分体系,因此下面将基于这两方面的研究加以叙述。

测量属性HRQOL量表的测量属性是指其标准化客观性的特质,即准确且稳定地测量HRQOL的基本特征,包括信度、效度、反应性和灵敏度[15]。

信度:是指测量HRQOL的可靠程度或可重复程度,其检验主要包括重测信度(重复测量HRQOL,两次测量结果的一致性和稳定性程度)、分半信度(量表各条目间的一致性)和克隆巴赫系数(Cronbach’s alpha,内部一致性,大于0.7为可接受,大于0.8表示内部一致性较好)。EQ- 5D-Y信度的验证主要基于重测信度:其5个维度以Kappa系数(Kappa coefficient)或AC1系数(Gwet’s AC)判断前后两次测量结果的一致性程度,EQ VAS得分则采用组内相关系数(ICC)。研究发现Y- 3L和Y- 5L均具有较好的信度(表1)。

图1 文献筛选流程和结果

效度:是指HRQOL测量工具准确客观地反映HRQOL内容的程度,主要包括内容效度、结构效度和表面效度等[16]。目前关于EQ- 5D-Y效度的研究主要是结构效度的验证,具体又包括聚合效度、区别效度和知组效度等。聚合效度是指不同测量工具测量同一HRQOL结果的相似程度,区别效度是指不同工具测量不同HRQOL维度的差异程度,以斯皮尔曼、皮尔森相关系数(Spearman/Pearson correlation coefficient)计算EQ- 5D-Y和其他测量儿童和青少年HRQOL的工具如KIDSCREEN- 27、PedsQL、CHU9D之间测量结果的相关程度;知组效度是指测量工具识别已知不同健康状况人群HRQOL差异的能力,采用T检验或F检验比较两类已知健康状态不同人群的EQ- 5D-Y维度得分和EQ VAS得分的差别。研究结果表明Y- 3L和Y- 5L的效度较好(表1)。

反应性:是指测量工具捕捉HRQOL发生变化的能力和程度[36],EQ- 5D-Y反应性的验证通常基于效应量(effect size,ES):ES<0.2,反应性弱;ES=0.2- 0.5,反应性中等;ES>0.5,反应性强。Scott等人[24]基于52例急重病患者、67例慢性病患者和105名普通学生,探究Y- 3L能否反应出3个月内受访者健康状况的变化,研究得出ES=0.02~0.15(普通群体、慢性病患者),ES=0.36~0.43(急重病患者),Y- 3L测量普通人群/轻症患者生命质量的反应性弱,测量(严重)疾病人群生命质量的反应性较强。Wong等[37]基于中国香港129例脊柱侧弯儿童和青少年研究了Y- 3L和Y- 5L的反应性,探究Y- 3L和Y- 5L能否反应出3个月内自我健康评估的变化以及反应程度的差异,两者的ES值范围分别为ESY- 3L=0.344~1.176,ESY- 5L=0.531~1.328,所以认为Y- 3L和Y- 5L在测量患有脊柱侧弯的儿童和青少年HRQOL时具有相似的反应性。

灵敏度:是指测量工具区分不同HRQOL水平患者的能力,灵敏度越高,区分不同健康状态患者的能力越强,天花板效应(多数应答停留在量表的顶端水平,因此无法区分它们)越弱[16],可以采用配对卡方检验计算天花板效应的差异。Wong等[27]以中国香港129例脊柱侧弯患者为研究对象,采用配对卡方检验计算Y- 3L和Y- 5L天花板效应的差异,发现相比于Y- 3L,Y- 5L可降低各个维度的天花板效应(0.8~7.8%),但降低的比例与5L相对于3L所降低的比例(9.0~20.0%)[38- 40]相比要偏少。Wang等[41]基于中国262名在校学生的数据也发现相较于Y- 3L,Y- 5L降低的总的天花板效应(3.8%)幅度不大。

构建EQ- 5D-Y效用积分体系的探索

EQ- 5D-Y效用积分体系的标准化研究方案:研究发现EQ- 5D-Y健康状态的效用值不适宜使用EQ- 5D效用积分体系获得,因而需要单独开发EQ- 5D-Y效用积分体系[42- 43]。2020年,Juan等[44]代表欧洲生命质量学会研究出Y- 3L效用积分体系构建的标准化研究方案,方案建议让普通成年人基于10岁儿童的立场,回答相关的健康偏好问题。研究方法具体分为两个步骤:首先开展离散选择实验(discrete choice experiments,DCE),让受访者基于10岁儿童的立场,在10*15组(每组2个健康状态)EQ- 5D-Y健康状态中选择更偏好的那个健康状态;然后通过面对面访谈,采用时间权衡法(time trade-off,TTO),补充DCE结果。

各国探索各自的EQ- 5D-Y效用积分体系:目前加拿大、美国、斯洛文尼亚和日本已经构建了Y- 3L的效用积分体系(表2),其中斯洛文尼亚和日本是依据Y- 3L效用积分体系标准化研究方案。但是加拿大和美国没有依据此方案,并且其研究结果存在一定问题:加拿大效用值的计算是基于EQ VAS值,不适宜用于转换为健康效用值(EQ VAS值不是基于偏好得到);美国得出的结果缺乏表面效度等。

同时,中国、德国、印度尼西亚和澳大利亚等国家也正在依据标准化研究方案构建各国的Y- 3L效用积分体系,这些研究或处于数据收集阶段,或建模阶段。可以预计的是,今后会有越来越多的Y- 3L效用积分体系在不同国家得到开发。

讨 论

通过对国内外文献的归纳总结,我们发现EQ- 5D-Y的可行性很高(如绝大多数研究都表明其各维度和VAS缺失值都很少等),显示其继承了成年人版本的优点。不仅如此,EQ- 5D-Y对于测量儿童和青少年HRQOL也具有较好的信度和效度,但是部分重测信度的Kappa>系数在0.35~0.60之间[18- 19],即为中等水平以下的一致性。这可能是因为未成年人的认知水平还处于发展过程,能力相对成年人有限,对于问卷的回答在重测过程中更容易出现理解或记忆上的偏差。同时部分验证聚合效度的研究中,Spearman相关系数也仅为0.25~0.50(即中、低相关性)[20- 21,23],这可能是由于两点原因。首先还是因为未成年人的理解能力有限,可能会对聚合效度的测量结果造成更大的波动。其次,EQ- 5D-Y各维度与其他测量工具维度的相似程度可能有限,例如Wang等[41]的一项研究发现EQ- 5D-Y的“感到担心、伤心或不高兴”维度和KIDSCREEN- 10的“感到孤独”维度的相关系数为0.440。虽然这两个维度都是描述心理方面的状况,但它们在内涵上还是有不小的区别。

表2 Y- 3L效用积分体系构建的研究现状

续表2

关于EQ- 5D-Y反应性和灵敏度的研究目前还相对较少。从初步的研究结果来看,Y- 3L和Y- 5L可能具有相似的反应性;Y- 5L灵敏度可能比Y- 3L要好,但是这个优势和5L相对3L的优势相比,不甚明显。比如相较于Y- 3L,Y- 5L降低了0.8%~7.8%的天花板效应[27],而5L相对于3L则可降低至9.0%~20.0%[38- 40]。这可能是因为儿童和青少年较难辨别Y- 3L“没有困难”与Y- 5L“有一点困难”的细微差异,因此是否需要进一步推广Y- 5L并构建其效用积分体系尚需更多的经验证据。

在效用积分体系开发方面,很多研究已经或正在基于Y- 3L效用积分体系的标准化构建方案在不同国家或地区开发各自的效用积分体系。它们的开发不仅将有利于在当地开展针对未成年人健康干预措施的卫生经济学评价,而且基于标准化研究方法获得的积分体系之间便于进行国际间的比较,这将有助于探索各国人群对于EQ- 5D-Y健康状态的偏好是否以及存在何种差异。

总 结

EQ- 5D-Y的可行性很好,测量属性包括信度和效度都较好,Y- 3L和Y- 5L反应性相似,Y- 5L的灵敏度稍好(相较于Y- 3L),但其测量属性仍需要基于更多人群和疾病样本的验证。目前,各国依据Y- 3L效用积分体系的标准化研究方案,已经或正在构建各自的效用积分体系,将Y- 3L定义的健康状态转化为健康效用值从而用于卫生经济学评价。本综述全面总结了EQ- 5D-Y的测量属性与效用积分体系的研究进展,以期为在我国推广使用EQ- 5D-Y提供参考依据。

猜你喜欢
效度效用信度
平衡损失函数下具有两水平共同效应的信度模型
呼和浩特市中心城区低效用地潜力分析
中医特色护理技术在老年高血压患者中的应用效用观察
净保费在平衡损失函数下的回归信度估计∗
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
高等院校对我国残疾人冰雪运动发展的效用研究
Beep test评估11~15岁少年游泳运动员有氧能力的效度研究
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
语言测试效度研究的另一视角:考试的因子结构研究