——蔡逸舟 史黎炜 肖 月*
X线计算机断层扫描仪(Computed Tomography, CT)是临床上重要的诊断成像工具,在诊断头部血管及肿瘤等疾病中具有快速、准确的优势[1]。但调查[2-5]显示,国内医院存在盲目购置大型医用设备,设备利用不充分或利用过度等现象。为此,国家卫生健康委员会发布的《大型医用设备配置许可管理目录(2018年)》将64排及以上CT纳入乙类设备,由省级卫生健康行政及发展改革部门负责规划配置[6]。
我国于上世纪90年代末引入卫生技术评估(Health Technology Assessment,HTA)方法对医用设备进行评估[7],为有关部门制定医疗设备配置规划、医疗供方合理应用技术提供了决策依据[8]。但目前国内缺乏统一的方法学指南和规范,导致评估项目质量良莠不齐,影响其对决策的支撑作用[9-10]。本研究系统分析了CT 卫生技术评估国际经验,总结主要的方法工具及核心指标,梳理CT评估差异,以期为我国开发相关评估指南提供参考。
采用范围综述方法。浏览国际卫生技术评估机构网络(International Network of Agencies for Health Technology Assessment,INAHTA)及其13个成员机构网站(ACE、AHRQ、AHTA、ASERNIP-S、CADTH、HQO、IHE、IQWiG、MaHTAS、NICE、NIHR、SBU、ZonMw)。这些机构分布于新加坡、美国、澳大利亚、加拿大、德国、马来西亚、英国、瑞典、荷兰。采用英文关键词“computed tomography” “CT”在网站进行检索,截止日期为2021年12月31日。纳入HTA报告,排除其他类型文献(如新闻和技术指南),对纳入报告进行信息提取,包括题目、评估机构、发表年份、评估对象、评估问题、评估类型、评估维度和指标、评估方法和数据来源等,并采用定性归纳法进行分析和比较。
共检索得到41篇相关文献,最终纳入HTA报告24篇。其中:MaHTAS(马来西亚)2篇, NIHR(英国)2篇, MSAC(澳大利亚,来自INAHTA网站)1篇, CADTH(加拿大)15篇, MAS(加拿大,隶属HQO,该机构现已重组)3篇, IHE(加拿大)1篇,详见表1。
由于各卫生机构使用的HTA名称和分类不统一,本研究将纳入的HTA报告分为全面卫生技术评估(full HTA,fHTA)和快速卫生技术评估(rapid HTA,rHTA)两类(表2)。rHTA也可作为是否开展fHTA研究的依据。
24篇报告中,7篇(29.2%)涉及心血管疾病,包括冠状动脉疾病(Coronary Artery Disease,CAD)和卒中;5篇(20.8%)涉及结直肠检查或筛查结直肠癌;2篇(8.3%)涉及肺癌;1篇(4.2%)涉及骨骼、肌肉顿挫伤;1篇(4.2%)涉及前列腺癌;1篇(4.2%)涉及口腔及颌面问题。另外,4篇(16.7%)评估时未确定具体疾病类型,仅评估CT检查本身或涉及了多个系统的疾病;2篇(8.3%)以儿童为目标人群,其中1篇关注儿童阑尾炎,1篇未关注特定疾病;1篇(4.2%)涉及引导活检。
由于评估目的和报告类型不同,不同国家和地区HTA机构对技术评估维度的选择存在差异。CT HTA的主要评估维度包括:技术特性、有效性、安全性、经济性、可及性和其他。
2.3.1 技术特性(18篇) 主要围绕技术原理、技术发展及现状、临床应用优缺点等相关内容展开。其中评估最多的内容为临床应用优缺点。多数报告旨在界定评估对象,介绍评估问题的重要性和必要性。
2.3.2 有效性(19篇) 有效性为设备检查对患者短期和长期健康结果改善的贡献程度。本研究中,有效性评估指标分为通用指标、心血管疾病相关指标、癌症相关指标、引导活检相关指标。通用指标中,灵敏度、特异度等诊断准确性指标较常用,其次为生存率/死亡率、诊断准确性、诊断一致性、病灶检出率等;心血管疾病相关指标包括心脏不良事件发生率、复发率等;癌症相关指标主要包括与癌症筛查相关的指标,如额外检查率、筛查召回率、筛查降低死亡率等;引导活检相关指标包括活检样本中肾小球数、复检次数。
2.3.3 安全性(9篇) 安全性指使用CT检查对患者健康产生的影响。纳入报告中,关注较多的是辐射暴露剂量、相关患癌风险和死亡风险,还有检查操作所导致的不良事件或并发症,以及检查结果不准确或不充分所导致的不良结果相关指标,如重复检查率、额外检查率。
2.3.4 经济性(10篇) 经济性指设备使用的成本投入和健康产出的关系。纳入报告的经济学评价分为文献综述和基于真实世界数据研究。文献综述内容包括成本效果、成本效益或增量成本效益,以国家货币或美元为成本单位,以质量调整寿命年(Quality Adjusted Life Years,QALYs)为主要效益结果。基于真实世界数据评价的内容较为丰富。
2.3.5 可及性(5篇) 可及性是指患者获取CT检查的可能性与便利性。评估问题主要为是否能够将CT技术用于目标疾病的人群筛查。多在评估报告的背景介绍中总结CT技术的可及性,内容包括设备来源、设备数、人均设备数、扫描次数以及公/私立医院检查构成比等。
2.3.6 其他(5篇) 将评估报告中不属于以上维度且不宜归纳为某一类的评估内容及指标均归纳为其他,包括检查后医生的治疗方案变化、各诊治过程时长变化、患者的主观感受(接受度/满意度)、筛查前后患者的行为改变等。
在所有纳入的HTA报告中,对于技术特性维度描述均在研究方法之前,用于简单介绍CT技术和研究背景,因此数据来源多为综述、专家共识或权威机构。有效性、安全性及其他维度也均以文献综述为主,另外有3篇进行了数据分析(1篇来自NIHR,2篇来自MAS);13篇包含经济性研究文献分析的报告中,4篇进行了基于模型的成本-效果分析和预算影响分析。
表1 纳入HTA报告信息摘要
2.4.1 文献综述 12篇(50%)为fHTA,12篇(50%)为rHTA(均来自CADTH)。综述均采用PICOS(人群,干预,对照,结局指标,研究类型)或类似原则定义检索问题和内容。不同机构检索数据库差别较大,通用数据库或网站有MEDLINE、the Cochrane Library、国际卫生技术评估机构网站(如INAHTA)以及网络检索(如Google)。国际卫生技术评估机构网站和网络多用于检索灰色文献。有效性、安全性和其他维度的证据包括卫生技术评估、系统综述、专业机构指南、随机对照试验(Randomized Controlled Trial,RCT)和观察性研究;可及性维度证据除检索以上文献获得外,还来自于国家数据、国际数据和专家共识;经济性维度证据包括系统综述、观察性研究和经济学评价研究。
表2 fHTA和rHTA的主要区别
各机构对于纳入文献类型的标准有所不同,部分规定了文献类型。信息提取表主要包含作者、发表年份、研究设计(如研究类型、随访时间、对照组/控制组、样本量、指标)、结果、结论/评论、研究优势、研究局限性等内容,来自CADTH的快速报告提取信息内容较一致,少数文献还提取了研究资金来源、利益冲突说明。
文献质量评估工具中,各类型文献通用工具有:CASP checklist、GRADE、修订的QUADAS、NHMRC、CEBM scale;针对系统综述的是:AMSTAR、修订的Oxman and Guyatt scoring;针对诊断性研究的是:NHS Centre for Reviews and Dissemination (CRD) University of York, Report Number 4、Fryback and Thornbury grading;针对有效性研究的是:US/Canadian Preventive Services Task Force;针对临床试验的是:Jadad量表、the Down and Black checklist;针对非随机研究的是:JAMA User’s Guide;针对官方指南的评价工具是AGREE II。
2.4.2 诊断准确性Meta分析 有3篇报告对CT的诊断准确性进行了Meta分析(见表1)。研究者提取符合纳入标准的诊断性研究结果数据,绘制不同分析水平的SROC曲线或HSROC曲线、森林图,如不同大小息肉(MAS(2009)[32]),计算不同水平的诊断优势比、合并灵敏度、合并特异度以及95%可信区间,以AUC和Q值作为准确性的综合衡量标准。同时提示,研究间存在较大的异质性,合并结果应谨慎参考。
2.4.3 成本-效果分析 4篇报告进行了成本-效果分析(见表1),均基于模型。其中:两篇将CT用于临床疾病诊断,均运用了决策树模型。MSAC[14]参考基于多中心RCT报告结果的经济学评估[35]构建决策树模型,比较整个诊断过程中CTC和双重造影钡剂灌肠(Double-Contrast Barium Enema,DCBE)的增量成本效益;MAS[31]构建了一个短期决策分析模型,从安大略省卫生护理部视角分析了两类人群(稳定胸痛的门诊患者和急性不稳定胸痛的住院患者)的冠心病诊断成本效益,比较了现有多种影像学方法的正确诊断增量成本,包括CT血管造影、负荷超声心动图检查、对比负荷超声心动图、心脏灌注MRI、衰减校正单光子发射计算机断层扫描(Single-Photon Emission Computed Tomography,SPECT)。
另外两篇来自加拿大,关注CT用于癌症筛查的评估报告,但时间相隔较长,使用了不同的模型。CADTH[16]于2008年以50岁~74岁具有大肠癌风险的加拿大人为目标人群,采用马尔可夫分析和年周期进行建模,构建10万人的模拟队列进行基本案例分析,先使用替代建模策略(一阶蒙特卡洛模拟)评估癌症发病率和结肠镜检查次数,再使用TreeAge Pro 2008 (Williamstown, Massachusetts)进行决策分析。IHE[34]于2014年使用了The Canadian Partnership Against Cancer和加拿大统计局于2011年联合开发的加拿大癌症风险管理模型(Cancer Risk Management Model,CRMM模型),并构建了一个线上平台,研究者注册之后可以在网站上设置想要的干预场景,运行程序后可以直接得到相应的计算结果。
2.4.4 预算影响分析 4篇报告分析成本效果的同时也进行了预算影响分析,但分析方法和模拟情景各不相同。MSAC[14]针对两类目标人群:(1)接受结肠镜检查机会有限的患者;(2)临床上不适合结直肠镜检查或有结直肠镜检查禁忌证的患者,分别进行预算影响分析。将第一类人群分为中心地区人群、城郊人群、偏远地区人群、非常偏远地区人群四类。从MBS报告和国家统计局获取各地区往年CTC检查数、人口数和相关费用,分别分析2015年-2019年每年增加的CTC服务量和MBS需支付的费用、患者自付费用和总费用。分析第二类人群时,使用市场份额法,利用MBS、国家统计局、卫生费用公报、相关文献的数据,预计了2014年-2018年CTC和DCBE服务量和成本的变化、对MBS预算、国家和地区医疗系统的费用、私立健康保险公司和患者的费用的影响以及对整个澳大利亚医疗系统的费用影响。CADTH[16]根据成本-效益分析中决策分析的结果,从卫生保健系统角度出发,估计了相应的国家和各省对额外结肠镜检查、息肉切除、粪便潜血试验和CTC的需求,以及每种筛查策略(同CADTH 2008[16]成本-效果分析)的并发症病例数和CRC病例数,计算了采用不同筛查策略进行大肠癌筛查的成本。MAS[31]评估了用一种技术按不同比例去替代另一种技术对安大略省卫生和长期护理部(Ontario Ministry of Health and Long-Term Care,MOHLTC)预算的影响(如用负荷超声替代10%的SPECT,或用CT血管造影替代25%的负荷超声)。心脏检查估计量(包括两组人群,同成本-效果分析)根据安大略省2004—2008财政年度的管理数据库(OHIP、DAD、NACRS)的数据估计了5 a(2009年-2013年)的预计总费用,以及相应的5 a费用差异和年均费用差异。IHE[34]同样使用CRMM进行预算分析,预测在1 a 1次和1 a两次两种不同筛查频次下2012年-2024年的LDCT筛查肺癌的成本,假设项目从2012年开始,参与率为79%,过渡期为5 a。
本研究系统检索并分析了国际上CT HTA案例,围绕当前我国大型医用设备治理改革要求,结合医用设备配置与使用管理办法,对未来我国开展CT等大型医疗设备评估的启示如下:
一是卫生技术评估组织体系建设。本研究纳入文献的机构均为独立的官方卫生技术评估机构,或由卫生部管理的专门卫生技术评估机构,从而保证其在评估中的独立性和客观性,且评估机构与各医疗机构、医学院合作紧密,各医疗机构可向评估机构申请课题或提供课题建议,评估机构也可通过竞标或直接指派医疗机构进行课题研究,如NIHR、MaHTAS等机构。国内目前虽已有多个卫生技术评估机构,但各机构仍为分散状态[36],并且缺乏国家级评估机构和专家委员会。因此,我国应尽快建立健全卫生技术评估工作体系,组建全国网络组织,如创建HTA数据共享平台。近几年,已有学者分析了国外HTA数据库的特点,提出了相应建议[37],数据共享平台既可加强相关学者之间学术交流合作,促进研究领域内部信息畅通,也可以避免重复研究导致的资源浪费。
二是标准的卫生技术评估机制构建。包括确定评估问题、设计评估方案、选择评估工具和方法以及确定评估维度和具体指标等。
首先,确定评估问题。目前,我国CT设备配置率较高,但存在利用不充分或利用过度的现象,另外CT影像学检查随着设备升级,应用范围在不断拓展。临床上针对不同疾病和不同人群,如何科学选择影像学检查以及医保报销制度如何更新等仍是长久问题。因此,建议我国尽快建立评估课题收集通道和评估课题筛选标准,便于CT影像学医务工作人员及时反映实际工作中的问题,并对重要问题及时开展评估。
其次,设计评估方案。相较于fHTA,rHTA虽然在一定程度上可能存在偏倚,但其简化了系统评估流程,可迅速获取和分析证据,在短时间内为决策者提供证据支持。我国在制定评估标准体系和评估指南时,应参考国际上fHTA和rHTA设计的区别,以及某些专业机构的HTA分类标准,根据课题的重要性、紧急性等设定多种评估类型。其中,fHTA设计应尽可能遵循HTA检查清单进行撰写[38],提供全面的信息。在进行医用设备卫生技术评估时,应注意区别设备的不同类型或规模,如CT的层数和排数,从而保证评估结果的准确性和精确性。
第三,选择评估工具和方法。应以文献综述为基础,以多种数据来源和方法收集并分析证据,比如采用基于真实世界数据或构建模型的方法开展费用分析和成本-效果分析。还可借鉴CADTH的经验,研发适用于我国的专项经济评估模型。对于已投入使用的设备,可建立专门的数据抓取系统和数据库,收集设备使用和维护情况的相关数据,为后续评估、配置与监管提供参考资料。
最后,确定评估维度和具体指标。应以有效性和安全性为核心指标,根据评估的目的和类型增加经济性及其他重要维度。根据关注的疾病和人群不同,各维度所包括的指标也应有所不同,以本研究归纳的指标为参考,需根据国内临床指南以及医学工程、临床医学、卫生经济学等相关专家意见来确定。