第四军医大学卫生统计教研室(710032) 孙斯睿 赵云松 张海悦 梁 英 谭志军 徐勇勇
【提 要】 目的 比较EQ-5D-3L量表与EQ-5D VAS映射模型及值域表,提出不同人群EQ-5D VAS映射模型的选择策略。方法 通过对某功能社区的现场调查,获取EQ-5D-3L量表和EQ-5D VAS的实测值,对比国内外12个映射模型和本研究建立的预测模型的相关性和绝对误差。所有模型均为一般线性模型,数据处理采用R语言。结果 (1)欧洲及英国、芬兰等7个国家及新西兰之间EQ-5D VAS映射模型的相关系数均大于0.9。以芬兰作为国外VAS映射模型的代表,芬兰模型与中国2次调查和本研究的相关系数分别为0.969、0.939和0.976;(2)本研究和芬兰模型的VAS预测值与实测值的拟合曲线相似,平均绝对误差分别为17.11和16.96;(3)VAS预测值比TTO预测值平均少20分,更接近实测值。结论 2008年和2013年在第四次和第五次国家卫生服务调查建立的EQ-5D VAS映射模型,对于相对健康人群,2008年建立的N3模型误差较小。国外模型中,芬兰模型误差较小。根据特定人群建立的映射模型不能外推到其他人群。
EQ-5D可视化模拟标尺评分(visual analogue scaling,VAS)是与欧洲生命质量五维健康量表(EuroQol five-dimensional questionnaire,EQ-5D)配套使用的健康状态评分工具,即在最小值为0、最大值为100的标尺上,对评价对象整体健康状况进行评价。100表示评价者认为最好的健康状态,0表示评价者认为最差的健康状态[1]。在不同的场景下,评价对象可以是居民、学生、职工和患者,评价者可以是评价对象本人、监护人、调查员和医护人员。我国目前使用最多的是3水平的EQ-5D量表(EQ-5D-3L),并且先后在2008年和2013年在第四次和第五次国家卫生服务调查中,拟合了EQ-5D-3L与EQ-5D VAS的映射模型[2-4]。同时,一些对糖尿病、高血压、冠心病、慢性阻塞性肺炎等疾病人群的健康效用研究中,多采用日本、英国、美国、泰国的映射模型(积分体系)作为健康效用的估计值[5]。本文拟通过某功能社区的VAS实测数据,建立EQ-5D-3L与EQ-5D VAS的映射模型,并与国内外13种EQ-5D VAS映射模型比较,提出不同人群EQ-5D VAS映射模型的选择策略。
1.数据来源
欧洲、英国、新西兰等国家建模数据来自EQ-5D index calculator[6],中国数据来自2008年和2013年2次国家卫生服务调查。企业建模EQ-5D-3L与EQ-5D VAS数据来自对西北地区某大型企业的在岗员工的现场调查,见表1。
表1 数据来源
2.方法
(1)映射模型
m模型:EQ-5D-3L量表5个维度:行动能力(MO),自我照顾(SC),平常活动(UA),疼痛/不适(PD)和焦虑/抑郁(AD)的主效应模型,则映射模型可表达为:
(1)
上式中,a,b,c,d,e为一般线性模型的估计参数,MO2,MO3,……,AD3为亚变量,MO2表示MO维度为2水平,MO3表示MO维度为3水平,……,余类推。当5个维度均为1水平时,即MO1=SC1=UA1=PD1=AD1=1,常数项cons=1。
N3模型:在式1基础上,增加一个估计参数N3,见式2。
(2)
式2中,z为亚变量。z=1,表示EQ-5D-3L量表5个维度至少有一个维度为水平3。
(2)模型拟合
式1、式2的模型参数采用一般线性模型(generallinear model)估计。计算及绘图采用R语言-R 3.4.4 (2018-03-15)。
1.EQ-5D VAS调查结果
EQ-5D VAS实测值分布(n=2193)见图2。实测值密度函数低于普通人群的95.9,P<0.01。EQ-5D-3L量表5个维度中,行动能力无任何问题(MO1)、自我照顾无任何问题(SC1)、平常活动无任何问题(UA1)、疼痛/不适(PD1)无任何问题和焦虑/抑郁无任何问题(AD1)分别占91.6%、95.9%、91.9%、64.8%和69.0%,其中疼痛/不适(PD1)和焦虑/抑郁2个维度,低于普通人群(2013年第五次国家卫生服务调查)的87.4%和94.7%,P<0.01。
图1 EQ-5D状态(无任何困难)百分率比较
2.EQ-5D 模型的估计参数与相关性
欧洲及英国、芬兰等7个国家及新西兰、中国的2次调查和本研究建立的EQ-5D-3L量表与EQ-5D VAS映射模型的估计参数见表2。本研究VAS实测相关系数为0.55,与国外模型比较,VAS实测值与芬兰的相关系数0.545。
表2 EQ-5D VAS映射模型的估计参数及与VAS实测值相关系数
*:与VAS实测值相关系数,**P<0.01
欧洲及英国、芬兰等7个国家及新西兰之间EQ-5D VAS映射模型的相关系数均大于0.9。以芬兰作为国外VAS映射模型的代表,芬兰模型与中国2次调查和本研究的相关系数分别为0.969、0.939和0.976,见图2。
图2 芬兰模型与中国2次调查和本研究的相关图
3.EQ-5D 模型的量效关系
依据EQ-5D-3L量表理论上能表示35=243种健康状态。为了评价EQ-5D-3L与EQ-5D VAS的量效关系可用图3表示。 图3中,“11111”表示无健康问题,“21111”、“12111”、“11211”、“11121”、“11112”表示有轻度健康问题,“32211”、“22323”、“22233”、“33321” 表示有较大健康问题,“33333”表示最差健康状态。本研究因调查的是在职人员,没有出现图3最后的5种情况。图3所有模型中,本研究和芬兰模型的VAS预测值与实测值(VAS/100)最为接近。
图3 VEQ-5D VAS映射模型比较
4.EQ-5D 模型预测值绝对误差
各模型预测值与实测值的绝对误差见表3。绝对误差较小的模型分别是芬兰(16,93)、丹麦(16.96)和本研究(17.11)。
EQ-5D VAS映射模型获得的预测值U(h)(U(·)为映射模型,h为健康状态)是采用效用方法(the utility approach)建立值域表(utility-based value set,UBVS),EQ-5D-3L量表的健康状态h可表示35=243种健康状态,EQ-5D-5L量表的健康状态h可表示35=3125种健康状态[7-8]。UBVS是用介于0和1之间的基数尺度(cardinal scale)评价个体健康状况以及与健康相关的生活质量。完全健康状况(full health)用1表示,因慢性病或其他因素导致的生活不便、疼痛及健康损失(disabilities)导致的健康效用损失1-U(h),理论上1-U(h)介于0,1之间,1-U(h)=0为完美健康状况(无损失),1-U(h)=0为最差健康状况(死亡)。然而,表2中EQ-5D VAS映射模型建模或调查对象是普通人群,EQ-5D-3L量表或EQ-5D-5L量表的最差结果“33333”并不表示死亡,因此,表2中EQ-5D VAS映射模型会出现负数(图3芬兰和C2013),EQ-5D VAS映射模型建立的预测值域表称为基于体验的值域表(experience-based value set ,EBVS)。由于EBVS基于调查对象的个人体验,不同群体建立的EBVS会有很大差异,例如2008年第四次国家卫生服务调查中,真实的EBVS有167种健康状态,“11111”占87%,其次是“11121”和“11112”。“11111”状态VAS=82.6, “33333”状态 VAS=33.0。本研究因调查对象是在职员工,真实的EBVS仅有60种健康状态,前4位健康状态是“11111”、“11122”、“11121”和“11112”,分别占50.6%、13.0%、11.3%和8.8%,4种健康状态占到总调查人数的83.7%。本研究的60种健康状态中,大于等于20例的有9种(第四次国家卫生服务调查51种),占到总调查人数的89.3%,见表4。健康状态没有MO3(不能下床活动)、SC3(无法自己盥洗或穿衣服)和UA3(无法从事日常活动),见表2。“11111”状态 VAS=78.1±12.3,比第四次国家卫生服务调查低4.5分。
表3 EQ-5D模型预测值与实测值绝对误差
EBVS的误差来自2个方面。一是调查对象对自己健康状况的描述,二是调查对象的EQ-5D VAS评分。欧洲等7国EQ-5D VAS建模的调查对象需要经过培训,调查对象的健康状态描述要覆盖无健康问题、有轻度健康问题、有较大健康问题和最差健康状态,见图3中4个区域。因此,虽然欧洲等7国建模的样本量不大,如西班牙仅300人(表1),但代表性好。本研究发现VAS实测值存在较大个体差异(表4),且“11111”、“11121”等个别组峰度、偏度检验均有统计学意义,但无明显“天花板效应”(图4)。
表4 EQ-5D健康状态及VAS峰度、偏度检验
*:*P<0.05
图4 本研究EQ-5D VAS分布
最后讨论时间权衡法(time trade-off,TTO)与VAS的区别。TTO是在特定的场景下生活10年,如在 “21111”状态下生活10年,让调查对象选择相当于在完全健康“11111”的状态下生活了多少年?如果答案是T年,TTO=T/10[9]。目前,丹麦、德国、日本、荷兰、西班牙、泰国、英国、美国津巴布韦、中国等10个国家建立了EQ-5D-3L与TTO的映射模型[1,10]。德国、加拿大、中国还建立了EQ-5D-5L与TTO的映射模型[11-13]。中国EQ-5D-3L与TTO的映射模型的建模样本1147人,主效应模型为
TTO=0.956-0.099*MO2-0.252*MO3-0.103*SC2-0.214*SC3-0.075*UA2-0.201*UA3-0.093*PD2-0.244*PD3-0.087*AD2-0.214*AD3
(3)
中国TTO和VAS研究的最大区别在于,TTO是在 96种假设场景下的概率选择(类似方法还有标准博弈法,standard gamble ,SG)[10],VAS是基于真实场景和亲身体验的实测值[2-3]。TTO“33333”状态表示死亡,VAS“33333”状态表示存活者最差健康状态。对于有轻度健康问题的受试者,VAS小于TTO。本研究实例,VAS预测值要平均比TTO预测值少20分,更接近实测值。或者说,TTO会高估评价对象的健康状况。因此,外部数据比较时,只有在方法相同(TTO或VAS)才有可比性。对于本研究,目标人群有7万多员工,企业建模的EQ-5D VAS值域表误差最小,但不一定适用于其他人群。对于普通人群,VAS较TTO更容易解释。VAS映射模型选择,中国2008年模型和芬兰模型的误差最小。