陈丕楠 谢诗桐 贺小宁 杨智豪 吴 晶
1.天津大学药物科学与技术学院 天津 300072
2.天津大学社会科学调查与数据中心 天津 300072
3.贵州医科大学医药卫生管理学院 贵州贵阳 550025
健康相关生命质量(Health-related quality of life,HRQoL)作为衡量健康产出的重要内容,一直是普适性健康测量量表最常见的测量概念[1],如今36题健康调查量表(36-item short form health survey,SF-36[2])等普适性HRQoL量表已被广泛应用于健康调查和临床试验中监测人群的健康水平与健康变化。而其中基于偏好(Preference-based)的普适性健康效用量表,如五维健康量表(EuroQol Five Dimensions Questionnaire,EQ-5D)[3]、六维健康调查简表(Short Form-6 dimensions,SF-6D)[4, 5]等,由于形式简短、填写方便,并能通过配套的健康效用积分体系计算得到健康效用值、进而计算质量调整生命年(Quality adjusted life years,QALYs),是卫生技术评估(Health technology assessment,HTA)中的关键工具之一,常用以指导卫生决策和卫生资源配置[6, 7]。
然而,现有普适性HRQoL量表因为无法测量幸福感(well-being)(1)此处的well-being虽然译为幸福感,但其指的是生命质量,而非主观幸福感(happiness)。、社会护理相关生命质量(social care-related quality of life,SCRQoL)和护理者相关生命质量(carer-related quality of life),常会低估卫生技术带来的实际产出收益。[8, 9]其中,虽然还未形成统一定义,但国际学者普遍认为well-being在广义上等同于比HRQoL概念更广泛的生命质量(quality of life,QoL),例如安全感、社会关系等[10];而SCRQoL和护理者相关生命质量则指护理活动带来的QoL影响,例如患者自主能力改善、负担感减轻,非正式护理者(informal carer)(2)非正式护理者(informal carer)指照护家人或朋友、没有护理报酬的人。心理压力缓解等[8, 9, 11]。测量这些概念有助于在疾病谱变化、人口老龄化的现代社会背景下全面衡量卫生技术的产出收益,避免评估结果发生偏差。虽然已有学者研发了能够测量上述相应概念的量表,但拥有不同测量概念目标的量表的所含维度存在差异,无法在不同领域(例如医疗健康领域、社会护理领域)间进行横向比较,也无法针对可能在跨领域均可获益的卫生技术进行直接评估[8, 9]。
为弥补上述获益的测量空白与缺陷,2017年由John Brazier教授牵头,来自英国谢菲尔德大学、英国肯特大学和澳大利亚墨尔本大学的学者组成了E-QALY(Extending the QALY)项目的主要研究团队,开始致力于研发国际新普适性QoL量表,即健康与幸福感量表(EuroQoL Health and Wellbeing,EQ-HWB)。该量表的核心优势在于能够同时测量HRQoL、Well-being、SCRQoL和护理者相关生命质量,并实现医疗健康、社会护理(social care)(3)社会护理(social care)在英国指一种长期照护行为,即为生活不能自理的人、有认知或心理障碍的人、老年人等提供日常生活(例如洗澡、吃饭等)、生活活动(例如做家务、洗衣服等)、社区服务(例如居家照护、社区活动等)和居住服务(例如养老院、疗养院等)等方面的帮助。、公共卫生(public health)等多领域间QALY结果的直接比较。[9]2022年,EQ-HWB量表的健康状态分级系统(Health State Classification System)已经构建完成,目前有多篇文献对其构建过程进行了具体介绍。本文旨在系统检索该量表的所有相关研发文献,对E-QALY项目的进展和EQ-HWB量表健康状态分级系统的构建进行梳理总结,并探讨新量表的研发启示要点,以期为国内学者深入了解国际QoL量表的研发新进展、积累量表健康状态分级系统的构建经验奠定基础。
本研究在PubMed、Embase、中国知网、万方数据库中,利用关键词“E-QALY”“Extending the QALY”“EQ-HWB”和“EQ Health and Wellbeing”(关键词限定在“全文/全部[All fields]”)全面检索并筛选纳入E-QALY项目和EQ-HWB量表已发表的所有文献,检索时限截至2022年8月15日。随后通过阅读纳入文献,研究提取并梳理E-QALY项目的目的与步骤,以及该项目构建EQ-HWB量表健康状态分级系统的具体流程与方法。在此基础上,研究进一步分析与总结上述构建过程中的关键考虑、方法学创新与技术要点,为未来的量表研发者与使用者提供参考与借鉴。
本研究共筛选纳入9篇英文文献[9, 11-18],并通过追溯其参考文献补充纳入2篇英文文献[19, 20],目前尚未有中文文献对E-QALY项目和EQ-HWB量表进行介绍与研究,文献的检索与筛选流程图如图1所示。综上,研究共纳入11篇英文文献作为信息提取和分析述评来源,其关键信息如表1所示。
图1 文献检索与筛选流程图
表1 E-QALY项目发表文献的关键信息
续表1 E-QALY项目发表文献的关键信息
E-QALY项目的研究目的包括:(1)研发涵盖HRQoL、Well-being、SCRQoL和护理者相关生命质量概念的普适性量表EQ-HWB,纳入各类疾病患者、社会护理使用者(social care users)、非正式照护者和相关利益部门决策者看重的维度(domain)/条目(item)[11-13];(2)验证EQ-HWB量表的心理测量学性能(psychometric property)和跨文化效度(cross-cultural validity),并在全球进行推广与应用[13, 14];(3)研发一个长版量表(EQ-HWB)和一个短版量表(EQ-HWB-S),后者可用于测量健康效用值[16]。研究项目共分为6个步骤(图2),其中用于构建量表健康状态分级系统的前4个步骤已完成[11-16],目前正在开展构建EQ-HWB-S健康效用积分体系的第5个步骤[20]。
图2 E-QALY项目研发EQ-HWB量表的步骤内容
EQ-HWB量表通过识别量表维度、组成备选条目池、基于表面效度(face validity)筛选条目、基于心理测量学筛选条目四个步骤构建其健康状态分级系统。
第一步,识别量表维度。首先,研究团队通过系统的文献检索与筛选,纳入17种最具经济负担的疾病的QoL定性综述文献,以及9个普适性量表、3个社会护理量表、3个非正式照护者量表的研发文献(定性研究为主),总计65篇文献。[12]随后,研究团队基于框架法(framework method),参考Wilson等提出的QoL模型,从纳入文献中提取并梳理出主题(theme)、子主题、子主题间关系和子主题术语。[11-12]最后,研究团队根据表2中的4项维度筛选标准,听取量表目标使用人群和相关专家的观点与意见,对所有主题和子主题进行整合与筛选,形成包含7个维度(主题)和32个子维度(子主题)的量表概念框架(Conceptual framework,图3)。[11, 12, 16]
图3 EQ-HWB量表概念框架与量表包含维度
第二步,组成备选条目池。首先,研究团队从已有普适性量表、社会护理量表、照护者量表、心理量表共62个量表中,提取并整理出量表概念框架中32个子维度对应的条目内容和回答选项(response option)等重要信息,形成包含687个条目的量表条目池(item pool)。[13]随后,研究团队根据表2的4项22条条目筛选标准,对条目池中的所有条目进行讨论后筛选出89个备选条目。[13, 20]最后,研究团队邀请量表目标人群和相关专家来评价备选条目的描述、水平和回忆期限(recall period)设置,并依据其意见修改得到97个备选条目。[13, 20]
表2 EQ-HWB量表的维度筛选与条目筛选标准
第三步,基于表面效度(face validity)筛选条目。研究团队从英国、阿根廷、澳大利亚、德国、中国、美国6个国家,招募量表目标人群(一般人群、患者、社会护理使用者、非正式护理者)共168人参加认知访谈(cognitive debriefing),对每位受访者选取30~50个备选条目,通过认知访谈的方法,让受访者对每个条目提出自己的理解和意见。[13]访谈结束后,各国依据录音总结访谈要点,包括受访者对每个条目的理解、消极/积极评价和修改建议等。[13]基于各国的访谈结果和表面效度要求(全面性、相关性、可读性),研究团队进一步筛选得到64个备选条目,并对其进行了表面效度打分(4分代表很好,3分代表较好,2分代表较差,1分代表差;打分由研究人员依据受访者的评价数量和严重程度主观给出,例如发现无消极评价则给4分,大多受访者不理解条目则给1分)。[13, 16]
第四步,基于心理测量学筛选条目。研究团队在6个国家再次招募了量表目标人群共4 879人,邀请其填答基本信息和EQ-HWB量表的备选条目。[14]除英国627人填答邮寄的纸质版问卷外,其他人均在线填答问卷。基于收集到的数据,研究团队分析了条目的缺失值、选项分布和已知群组效度(known group validity)3个基本心理测量学特性,还使用因子分析(factor analysis)分析条目间的结构关系,通过项目反应理论(Item Response Theory)分析条目测量潜在健康状态的能力,并依据以上结果对每个条目进行心理测量学性能打分(1~4分,同表面效度打分)。[14]最终,研究团队综合表面效度和心理测量学两项打分给出每个条目的总得分(1~4分),并以此筛选得到25条目的EQ-HWB量表和9条目的EQ-HWB-S量表(图3)。[14, 16]
从EQ-HWB量表健康状态分级系统的构建研究与探索中,本研究总结了识别维度、编写条目和筛选条目三方面的经验启示要点如下。
第一,量表研发者应基于广泛来源和透明过程开展量表潜在维度的识别。首先,应考虑从多个途径全面识别量表维度,以期更详尽、深入地获取对相关QoL维度的认知。量表的维度一般来源于QoL理论、已有量表问卷、多方人群观点。传统普适性量表往往只采取一种途径识别维度,但EQ-HWB量表综合从能力概念框架(capabilities framework)、已有相关量表、量表目标人群观点、专家与决策者观点等多个途径识别维度,有助于捕捉到量表目标人群所看重的维度,从而整体提升其测量的精准性、有效性和敏感性。[11, 12]EQ-HWB量表在研发初期就广泛收集与分析了英国、美国、澳大利亚等30多个国家(覆盖欧洲、北美洲、大洋洲、南美洲、亚洲、非洲)的定性数据,使得该量表纳入的维度具有较强的国际可比性与跨文化QoL内涵共通性。此外,基于透明、公开、标准的步骤与原则识别量表维度的过程与方法,也有助于提升其研发的规范性与可靠性。[11, 12]
第二,量表研发者应关注所编写条目的可读性、一致性和合理性。在可读性方面,可参考EQ-HWB量表目标人群和领域专家的相关建议,尽量使用简单句式和相关举例来描述具体条目。[13]在一致性方面,首先应避免在量表中混杂设置正向条目(例如“我能够做我想做的事”)和负向条目(例如“我感到难以应对日常生活”),EQ-HWB量表已通过因子分析发现同一维度下的正负向条目形成了不同的结构关系[13, 14, 20];其次,应尽量保证各个条目的水平选项和回忆期限设置相同,EQ-HWB量表统一在每个条目下设置5个水平选项和“过去7天”回忆期限,不需要受访者进行思维转换,从而降低了其填答量表负担。[13, 20]在合理性方面,应特别关注现有条目对后续构建健康效用积分体系的影响。例如,在EQ-HWB量表研发过程中,有受访者提到相邻2个水平之间的差异不够大,例如难以区分2、3水平,或难以区分4、5水平。在构建积分体系的过程中,这会对2个水平的模型系数逻辑一致性产生一定影响。为此,EQ-HWB量表目前也在进一步探索合并最严重的2个水平(即简化为4水平选项)的合理性问题。[9]
最后,量表研发者应重视条目筛选所倚赖的表面效度和心理测量学性能验证的研究设计。EQ-HWB量表的构建研究特别提醒研发者今后在设定亚组样本和分析指标时应进行深入考虑。在亚组样本方面,应在尽可能纳入不同亚组以增强样本代表性的同时,确保亚组样本量能够具有统计学意义。如EQ-HWB量表进行调研时在各国纳入的社会护理使用者、非正式护理者人群亚组样本量过小,这就可能导致后续得到的分析结果存在较大偏倚,影响结论的准确性。[14-17]在分析指标方面,应选取恰当、全面的指标进行心理测量学性能验证。EQ-HWB量表发现条目在护理者样本中的已知群组效度结果不显著,认为可能是对护理者人群亚组的分类指标较为粗略,导致条目的区分度无法有效显现,因此未来需要通过细化亚组分类指标来明确这一问题的答案。[14]此外,进一步使用相关统计学指标测验EQ-HWB量表目前尚未涉及的条目重测信度(test-retest reliability)、反应度(responsibility)等也仍有研究必要性。[14]
由于EQ-HWB旨在同时测量各类患者、社会护理使用者和非正式护理者的QoL,因此其维度概念范围要远超现有普适性HRQoL量表。EQ-HWB-S的控制/选择、孤独维度和EQ-HWB的不安全感、自我价值、应对能力、耻辱/归属感、支持维度,都几乎未在EQ-5D、SF-6D等普适性健康效用量表和SF-36等普适性HRQoL量表中出现[2-5],但这些维度的确有助于捕捉更广泛的QoL、SCRQoL和护理者相关生命质量。此外,对于EQ-HWB-S而言,其包含的专心/清晰思考和疲劳维度也很少出现在传统普适性健康效用量表中,但却是近年来学者在探索EQ-5D附加(Bolt-on)维度时认为有助于全面描述HRQoL的内容。[21-23]此外,为避免维度涵义混杂和条目填答歧义,EQ-HWB-S未像EQ-5D、SF-6D等量表一样将抑郁和焦虑、疼痛和不适感合并为一个维度/条目。[3-5]
EQ-HWB量表通过表面效度和心理测量学结果筛选性能表现更佳的条目,从而形成25条目的EQ-HWB和9条目的EQ-HWB-S[13-16],Monteiro等还将EQ-HWB-S和EQ-5D-5L进行了初步性能对比[17]。但在上述过程中,仍存在社会护理使用者和非正式护理者亚组样本量较小、受访者填答的是备选条目而非完整量表、未进行重测信度和反应度验证等问题。[14]未来仍需在更广泛的量表目标人群中对量表进一步做更全面的性能验证,并将EQ-HWB量表和国际常用普适性HRQoL/健康效用量表进行性能对比。另一方面,在何种情况下应用EQ-HWB量表也是值得思考与澄清的问题。Richard等表明新研发的EQ-HWB-S并不会取代目前最常用的EQ-5D,其更有可能作为传统量表的补充用于更广泛的健康与护理交叉领域[9],但未来仍需对这一设想的可能性进行充分验证与明确。此外,由于EQ-HWB量表的测量概念突破了HRQoL,因此澄清EQ-HWB-S和传统普适性健康效用量表计算得到的增量QALY差异,以及现有成本—效用阈值(Threshold)对EQ-HWB-S是否仍然适用,是十分必要的。[9]
作为多国共同参与研发、开展验证工作的量表,EQ-HWB已在英国、阿根廷、澳大利亚、德国、中国、美国6个具有地理与文化代表性的国家进行了条目筛选。[16]但其中中国数据在备选条目的表面效度、天花板效应、偏态分布和已知群组效度等方面,与其他5个国家的数据存在一定差异[13, 14];通过验证性因子分析得到的维度框架,在英国、美国、澳大利亚拟合程度较好,在阿根廷和德国需要进行些许调整,而在中国可能需要进行更多的模型调整。[14]对此,近年来已有学者提出了国际量表跨文化适应性的质疑,认为受历史文化、医学体系和社会经济影响,中国人群和欧美国家人群的健康观念存在差异。[24-30]EQ-HWB量表在识别维度步骤中纳入的相关中国健康测量量表与中国生命质量定性研究数量相对较少,可能会忽略具有中国文化特异性的维度和条目相关内容与表达[12],这也许是其在中国人群中性能受限的主要原因。后续相关研究中,国际量表也应充分认识各个国家/地区的健康观念差异,并在研发过程中谨慎考虑不同文化特异性融合与体现对量表测量的影响。
作者声明本文无实际或潜在的利益冲突。