连 代,夏 宇,魏 艳,陈英耀
复旦大学公共卫生学院,国家卫生健康委员会卫生技术评估重点实验室(复旦大学),上海,200032
癌症是威胁人们健康的主要因素之一[1]。数据显示,我国2022年中国癌症新发482余万例,死亡321余万例[2];2010年-2030年癌症疾病负担预测值高达33280亿美元[3]。为提高癌症患者的生存率,降低癌症患者的疾病负担,我国开展了大量癌症筛查项目,为居民提供诊断、治疗等服务。为了有效分配有限的卫生资源,我国研究者开展了针对癌症筛查的卫生经济学评价,以此来比较不同筛查技术、筛查频率、筛查人群的经济成本和综合收益,进而形成决策所需的优选方案, 提高卫生系统资源利用的总体效率[4]。
当前关于我国卫生经济学评价文献质量的研究较少,主要关注各类药物经济学研究的文献质量。冯莎等依照《中国药物经济学评价指南》评价了2009-2013年间国内发表的药物经济学评价文献质量[5];Ma等用CHEERS量表探索了2014年前在英文期刊发表的我国药物经济学评价文献质量[6];高海亮等使用中华中医药学会的《药物经济学评价报告质量评估指南》评价了2017年1月-2018年5月发表的药物经济学研究[7];徐蔼琳等采用儿童药物经济学评价问卷分析了2009年1月-2018年12月间发表的中文儿童药物经济学研究质量[8];Yan等用CHEERS量表评价了发表于2001年-2021年的中英文中医药经济学研究[9]。现有的文献质量评价集中在药物经济学评价方面,且研究使用的评价工具并非国际通用标准,评价出版物的时间范围较短或未覆盖近年文献[10]。而筛查对肿瘤的早诊早治具有不可估量的意义,高质量卫生经济学评价能够为筛查相关的资源分配决策提供支撑[11],然而针对数量一直在增长的我国癌症筛查类卫生经济学研究,尚未有研究探索该主题卫生经济学评价的文献质量,也未研究探索文献质量的影响因素。
本研究旨在使用CHEERS量表评价我国癌症筛查类卫生经济学评价的文献质量,并探究质量得分的影响因素,为规范相关卫生经济学研究提供借鉴和参考。
基于PubMed、Embase、中国知网、万方数据库等数据库进行文献检索。检索时限为2000年1月1日-2021年2月28日。检索关键词包括“成本效果分析”“成本效益分析”“成本效用分析”“经济学评价”“癌症”“筛查”等。检索所得题录导入EndNote X9.3.3进行去重和筛选。两位研究者依照下列排除标准背对背完成筛选:①研究对象是动物;②非原始研究;③研究类型非经济学评价;④研究人群非中国人群;⑤没有对照措施(包括空白对照)的研究;⑥干预措施非癌症筛查的研究。如遇分歧,与第三位研究者共同讨论决定。最终共检索到658篇文献,经过筛查后纳入78篇文献。随后提取纳入研究的基本信息,包括语言、发表年份、经济学评价类型、第一作者单位、是否使用决策模型等。具体排除纳入过程见图1。
图1 PRISMA 流程
1.2.1 质量评价。CHEERS量表是由国际药物经济学与结果研究协会良好文献质量工作组(Health Economic Evaluation Publication Guidelines Good Reporting Practices Task Force)开发的指南性文件,是目前卫生经济学质量评价最常用的评价工具之一[12]。为了保证质量评价的准确性,选取两位接受过卫生经济学系统训练,有相关论文发表经历的博士生背对背开展质量评价。事先对两位评价者进行培训,促使其了解CHEERS报告的条目含义,形成统一、规范的评判标准。随后两人背对背使用24个条目的CHEERS量表对纳入文献进行评价。根据文献满足条目的情况进行赋值:完全满足条目要求为1(是);部分满足条目要求为0.5(部分);不满足条目要求为0(否);条目不适用的情况为NA(not applicable)。如遇分歧,与第三位在卫生经济学领域具有丰富研究经验的研究者共同讨论决定。
1.2.2 数据处理。对提取到的基本信息进行描述性分析。为了排除不适用的选项影响文献间质量的可比性,将每篇文献质量评分的结果使用如下公式进行标化:
本研究使用广义线性回归模型来确定影响文献质量标化得分的因素,分析文章语言、发表年份、第一作者单位、经济学评价类型等特征与文献质量标化得分间的关系,显著性水平α=0.05,使用R 4.1.1进行统计分析。
随着时间变化,经济学评价的发文量呈现逐年增长的趋势。其中, 48篇(61.5%)文献基于Markov、决策树等分析模型模拟人群队列来获得研究结果,30篇(38.5%)文献基于单个实证研究开展;开展最多的研究类型为成本效果分析(53.8%),其次是以健康效用值为效果指标的成本效用分析(35.9%)。见表1。
表1 纳入文献特征
所有纳入文献的平均标化质量得分为0.57(s=0.13),单篇文献得分最小值为0.33,最大值为0.83,CHEERS量表各条目的具体得分情况见表2。观察到得分较低的条目(标化得分小于0.5)包括研究视角(条目6)、贴现率(条目9)、效果的测量(条目11)、货币及价格日期和换算(条目14)、分析方法(条目17)、不确定性描述(条目20)、异质性描述(条目21)、利益冲突(条目24)。
表2 CHEERS量表的条目得分情况
表3 纳入文献特征的多因素分析
参考Spiegel等人的分类标准,经过讨论,本研究选取文章总质量得分将文章进行分类,0.75分以上为高文献质量,0.5分-0.75分为中等文献质量,0-0.5分为低文献质量[13]。本文纳入的文献有7篇为高文献质量研究,45篇中等文献质量研究,26篇为低文献质量研究。由此可见我国相关研究的质量还有待提升。
通过广义线性回归分析,确定报告评估质量的预测因素。文章语言、第一作者单位、评价类型对质量得分产生了显著影响,使用英语发表的文献得分较高(β=0.080,P=0.002);来自医院的研究者发表的经济学评价文献的文献质量偏低(β=-0.072,P=0.004);在经济学评价类型方面,相较于成本效果分析(β=-0.104,P<0.001)和成本效益分析(β=-0.116,P=0.014),使用成本效用分析法的研究有更高的质量。见表4。
本研究梳理了国内癌症筛查主题的卫生经济学评价研究。研究纳入文献平均得分为0.57,范围为0.33-0.83,也即当前我国癌症筛查类经济学评价研究只能满足约一半的CHEERS量表要求,这表明现有研究的透明度和可解读性不足。纳入文献中高质量文献占比仅为8.9%,低质量文献占比(33.3%)远高于高质量文献,这也提示国内癌症筛查类卫生经济学评价文献质量有待提升。与其他亚洲背景下使用CHEERS量表的质量评价研究结果相比,Ma等的研究平均得分为0.77,Karekar等的研究平均得分为 0.74,国内癌症筛查类经济学评价研究得分相对较低,同时高质量文献占比也较低(Ma等的研究为68.8%)[6, 14]。需要注意的是,在Ma的研究中,量表中应为“不适用(NA)”的条目被赋分为1,在Karekar的研究中,条目满足程度仅被评为“是”(1)或“否”(0),而在本研究中,NA的条目从总分中剔除,因此前人研究存在高估文献质量评分的可能性[6, 14]。
针对CHEERS条目得分较低可能的原因,本文提出如下改进建议供研究者参考。首先,研究者应主动报告研究采用的视角,如社会视角、卫生系统视角、患者视角、医保支付方视角等,以提高针对性[15-16]。其次,作者应详细报告数据外推、人口异质性和不确定性分析的方法,以及偏态、缺失或删减数据的处理方式,并对开展的敏感性分析加以说明;只有报告以上所有的分析方法,读者才能判断方法的适当性和结果的可靠性。第三,基于单一研究和反应模型的经济学评估都应该采用敏感性分析反映所有输入参数的不确定性影响。第四,研究者也应考虑亚组间基线特征的差异,其在基线特征上的异质性可能会导致患者从干预措施中的获益不同,从而使得卫生经济学结果存在偏倚。最后,研究人员应主动报告利益冲突情况。与其他质量评估研究相比[13, 17],本研究纳入的文献很少声明(26.9%)其利益冲突。90.7%的中文文章不符合该标准,这可能是由于国内期刊没有做相关要求,但CHEERS要求作者主动报告利益冲突以避免对文献质量的质疑。现有研究表明,作者在经济方面的利益冲突很可能影响研究结果的客观性[18-21]。
研究确定了经济学评价类型、第一作者单位、文章语言等三个显著影响文献质量得分的因素。与大学等研究机构的第一作者相比,来自医院的作者发表的文章质量相对偏低。类似的德国研究也表明,由检验实验室人员发表的经济学研究质量较低[22]。这可能因为医院研究者接受的卫生经济学培训更少,大部分医院研究者受到的教育以临床医学为主,对于经济学领域知识的了解可能存在欠缺。例如,干预措施的时间范围和成本是经济学评价的重要构成[23-24],但对于医院临床背景的研究人员而言,掌握选择时间范围和调整估算单位成本的方法存在一定挑战,相较于大学、研究院等专业的卫生经济学研究机构研究者,对卫生经济学的理解、模型方法的应用能力存在差异[25]。因此,建议在医院进行有关卫生经济报告指南的培训,让有志于开展卫生经济学评价的医院研究者了解其原理,规范掌握相关的方法学。同时鼓励医院研究者和研究机构之间加强合作,共同提高文章的文献质量。
成本效用分析的文献质量明显优于成本效果分析和成本效益分析。由于成本效用分析对每获得一个质量调整生命年(quality-adjusted life year,QALY)的成本都进行报告,使得将标准化的干预效果与对照措施进行比较成为可能[26],成本效用分析由此获得众多高水平研究者的青睐,许多权威指南也建议或提倡使用QALY作为效果单位[27-28]。同时,CHEERS清单也强调报告干预措施对预期寿命和生活质量的影响[29],QALY可以很好地满足上述要求。这些因素都可能使得成本效用研究的质量相对较高。尽管如此,研究者也应根据研究目的和需要合理选择经济学评价类型。此外,效用值的研究通常是一项复杂而繁琐的工作[30],对不从事卫生经济或卫生服务研究的作者可能存在一定的难度,因此非上述背景的研究者可能更倾向于选择成本效果分析或者成本效益分析。最后,本研究纳入的成本效益分析和成本效果分析中利用筛查项目现场数据开展的经济学评价占比较大,这类项目开展时可能并未针对卫生经济评价收集所需的成本数据和效果数据,也包括可能所需的效用数据,因此研究者在项目结束后开展研究时可能出现因信息缺失而降低文献质量的问题。
英文文献往往具有更高的文献质量得分,原因可能来自中文杂志对于文章字符数严格的限制,使得研究者精简了报告内容导致较低的质量得分,另一个原因可能是部分高水平机构和研究者对国际交流的偏好使得他们更多在英文期刊上发表文章,这提示未来发表中文的卫生经济学研究者应注重参考权威指南来规范研究。
为了提高我国癌症筛查类经济学评价文献质量,首先应推动建立符合我国背景的类似CHEERS声明的经济学报告指南。发布CHEERS声明的项目组由研究人员、政府雇员、杂志编辑构成,通过德尔菲法综合了当前经济学评价的各类准则,筛选出的对文献质量最重要的条目清单,供卫生经济学领域的研究者、编辑和审稿人参考[12]。现阶段,良好的指南在我国医药卫生事业发展进程中发挥着积极作用[31],我国卫生经济领域的研究机构和期刊杂志及相关政府部门也可以推动建立符合我国国情,具有中国特色的本土化筛查技术的经济学评价报告指南,向研究者进行宣传和推广,以提升中文筛查类经济学评价的文献质量。其次应加强卫生经济学研究机构与癌症筛查工作承担主体,包括体检机构、基层卫生机构等各类医院和疾控部门间的合作,前者对经济学评价规范和原理的了解与后者对疾病进展、筛查技术的认识和实践经验能够使得双方开展的经济学评价更加准确、深入、透明,有助于产出更高价值的研究。除此之外,卫生经济学研究机构也可以开设相关的继续教育培训课程供感兴趣的其他部门研究者了解和学习,共同促进国内卫生经济学评价的发展。