汤雪瑶 宣吉晴 李 璇 李明星
克罗恩病是一种累及肠壁全层的慢性非特异性炎性疾病,涉及胃肠道的各部位,但最常见于回肠和结肠[1]。近年来发病率在我国逐渐增高。克罗恩病以炎症发作与缓解期交替为特征,临床症状和体征复杂多样。因此,对疾病活动状态定期准确诊断和评估,可以帮助选择适宜、有效的临床治疗方案。对克罗恩病活动性的诊断通常需要临床、内镜、组织病理学、实验室检查及影像学资料的综合评估,目前尚无单一的金标准。超声造影将对比增强造影剂与低机械指数实时谐波超声相结合,可提供肠壁微血管和肠周组织的血流灌注特征。欧洲联盟指导医学和生物学超声学会[2]指出,在超声诊断方案中加入超声造影可提高评估克罗恩病活动性的可靠性;另有研究[3-6]报道,超声造影通过定性和定量方法确定肠壁的增强,其诊断性能可与MRI 和CT 媲美。超声造影诊断克罗恩病活动性具有较高的价值,但既往研究[5-20]样本量少,研究人员、时间及地点不同,且各研究之间的敏感性和特异性存在较大差异,因此此类报告的统计效力有限。为此,本研究将对超声造影诊断克罗恩病活动性的研究进行Meta 分析,以期为今后开展超声造影诊断克罗恩病活动性提供合理的决策依据。
计算机检索PubMed、Embase、Cochrane图书馆、中国知网、万方数据库、维普数据库,收集超声造影诊断克罗恩病活动性的诊断性试验,检索时间为建库至2020 年 1 月。英文检索词为 Crohn disease、Crohn、CEUS、Contrast enhanced ultrasound、Contrast-enhanced ultrasonography;中文检索词为克罗恩病、克罗恩、超声造影、CEUS。采用主题词与自由词相结合的方式进行检索,且对相关文献的参考文献进行了二次检索,以补充获取相关文献。
纳入标准:①研究类型。国内外公开发表的超声造影诊断克罗恩病活动性的诊断性试验;②研究对象。怀疑有活动性克罗恩病的患者,患者年龄、种族、国别不限;③诊断方法。待评价试验为超声造影,采用适当的临床评分系统、组织病理学、影像学或非侵入性标志物作为参考标准;④结局指标。超声造影对克罗恩病活动性诊断的敏感性、特异性、阳性似然比、阴性似然比、诊断比值比及受试者工作特征(SROC)曲线下面积。排除标准:①非中、英文文献;②重复发表的文献(仅选样本量最大或质量最佳者);③会议摘要、评论、文摘、综述、信件及病例报告等;④样本量<10 例的文献;⑤提取的数据不能制成四格表的文献。
两名研究者根据已制定的纳入及排除标准独立进行文献筛选、资料提取,并交叉核对,当意见不一致时,通过讨论协商解决。提取内容包括:第一作者姓名、国家、发表年份、研究类型、样本量、平均年龄、克罗恩病诊断标准、克罗恩病活动性诊断标准、超声造影评价部位、超声造影阈值、仪器、探头、造影剂及剂量、机械指数、克罗恩病活动性诊断与超声造影平均间隔时间,以及真阳性、假阳性、假阴性、真阴性等诊断结果。
纳入研究的质量评价由两名研究者采用Cochrane协作网推荐的QUADAS-2 工具独立进行评估[21]。该工具一共包括病例的选择、待评价试验、金标准、病例流程及进展情况4 个板块,共13 个条目。对每一项条目分别给出“高风险”、“低风险”、“不清楚”的选择。
应用Meta Disc 1.4软件,绘制SROC平面散点分布图,观察有无“肩臂形”标志,并计算Spearman 相关系数,评估有无阈值效应引起的异质性。当无阈值效应存在时,采用χ2检验计算各研究结果之间的统计学异质性,并结合I2定量评估异质性的大小。若I2≤50%,采用固定效应模型进行合并;反之,则采用随机效应模型。按照可能产生异质性的因素进行亚组分析,并逐一剔除纳入文献行敏感性分析以评估研究结果的稳定性。计算合并敏感性、特异性、阳性似然比、阴性似然比、诊断比值比及其95%可信区间(CI),并计算SROC 曲线下面积。采用Stata 12.0 软件绘制漏斗图检验是否存在发表偏倚。P<0.05 为差异有统计学意义。
初步检索共纳入304 篇文献,去重后逐步剔除文献(包括内容不相关的文献79 篇,Meta 分析3 篇,综述 22 篇,病例报告 4 篇,会议摘要 11 篇,信件 1 篇,样本量不足和数据不全的文献6 篇),最终纳入16 篇文献[5-20]。
纳入的 16 篇文献中,12 篇为英文文献[5-16],4 篇为中文文献[17-20],共 913 例克罗恩病(其中 2 篇文献[14,16]的四格表数据为肠段数目)。4 篇文献的纳入对象比较特殊,其中,Paredes 等[13]研究纳入的是肠吻合术后的对象,Serra 等[9]研究纳入了21例曾行肠道手术的对象,Ripollés 等[14]及陈瑜君等[19]的研究对象均在超声造影后行选择性肠切除术;11 篇文献选择了以内镜和组织病理结果作为克罗恩病的诊断依据,Robotti 等[7]仅使用了实验室/临床结果作为粗略的判断;所有文献均通过静脉注射造影剂,除1 篇文献[8]使用Levovist外,其余均使用的SonoVue;在超声造影阈值选择方面,3 篇文献[7-8,11]选择以存在增强来判定克罗恩病的活动性,6 篇文献[5,12-14,16-17]选择相对增强来判定,5 篇文献[9-10,18-20]选择以增强方式来判定;4 篇文献[6,10,12,15]选择以增强曲线来判定,其中Giangregorio 等[10]分别研究了增强方式和增强曲线的诊断效能,Quaia 等[12]分别研究了相对增强和增强曲线的诊断效能,因此,这两个诊断标准的相关数据均被提取为一个独立的数据集,在进行所有研究的Meta 分析时,从上述研究中选择诊断比值比最高的方法。见表1。本研究所纳文献参差不齐,质量偏低,见图1。
ROC平面散点分布未见明显“肩臂形”标志,Spearman相关分析均提示无阈值效应(γ=0.250,P=0.351);DOR的同质性检验表明存在异质性(I2=54.7%),且来自非阈值效应,因此采用随机效应模型来合并分析。Meta分析结果显示:超声造影诊断克罗恩病的合并敏感性、特异性、阳性似然比、阴性似然比、诊断比值比及其对应的 95%CI分别为 0.94(0.92~0.96)、0.76(0.71~0.81)、3.30(2.60~4.10)、0.07(0.03~0.18)、64.72(27.87~150.28),曲线下面积为0.92。
表1 纳入研究的基本特征
图1 纳入文献的质量评价
由于无明显阈值效应存在,考虑到造影结果判定时所用的不同阈值可能是不同研究之间异质性的来源,因此将纳入研究根据存在增强、相对增强、增强方式、增强曲线分组进行了分析,亚组分析结果见表2,提示以增强曲线参数作为阈值的研究对克罗恩病的活动性具有最高的诊断价值,以存在增强、相对增强、增强方式作为阈值的研究诊断价值相对较低。
逐一排除纳入文献,对剩余的研究重新进行Meta分析,总体敏感性、特异性改变不明显,提示本Meta 分析的合并效应量较稳定,未对某一个研究的过度依赖。Deeks 漏斗图总体对称(t=-0.75,P=0.47),表明无明显发表偏倚。见图2。
表2 超声造影诊断克罗恩病活动性及亚组分析结果
图2 超声造影诊断克罗恩病活动性发表偏倚漏斗图
组织病理学和高水平的血清血管生成因子表明,克罗恩病的活跃状态与新血管化和肠壁血流增加有关[22],故壁内血流信号的存在被认为是活动性克罗恩病的潜在标志。血管生成是影像学检查可视化炎性肠壁的基础。欧洲克罗恩病和结肠炎组织和美国胃肠病学学会指南[2]认为CT 或MRI 是诊断克罗恩病肠病变(包括肠外并发症)准确性最高的影像学技术,但高成本和辐射使其不适合反复随访检查。彩色多普勒超声主要检测来自供应肠壁的大血管的血流信号,而非来自触发新生血管形成的炎症小血管[23]。超声造影对比增强剂的使用可以有效提高彩色多普勒超声的检测灵敏度,更好地显示微脉管系统的血流灌注。Ma等[24]最早使用Meta分析结果显示,超声造影诊断克罗恩病活动性的合并敏感性和特异性分别为0.93和0.87,但该研究包括了口服的造影剂PEG-3350,导致了实用价值的降低。Serafin等[25]进一步针对静脉超声造影剂进行了Meta 分析,结果发现超声造影诊断的合并敏感性和特异性分别为0.94和0.79。
本研究共纳入16 篇关于超声造影诊断克罗恩病活动性的文献,Meta 分析后得出的合并敏感性和特异性分别为0.94 和0.76,曲线下面积为0.92,综合考虑超声造影对克罗恩病活动性的诊断价值较高。本研究中超声造影诊断的敏感性与Serafin 等[25]报道结果相当,而特异性较低,推测与纳入文献的数量、语言及年限等有关。值得注意的是,本次纳入的文献中,Rapaccini 等[8]使用的造影剂是二代超声造影剂Levovist,这种微气泡稳定性差、容易破裂、对低速血流时显示时不易消除多种伪像,因此在实时超声造影时性能欠佳,但逐一排除文献时敏感性结果无明显变化,漏斗图结果提示无明显发表偏倚。因此本研究的Meta 分析结果稳定可信,通过超声造影诊断活动性克罗恩病具有临床推广的价值。
目前,通过超声造影表现区分克罗恩病活动性虽尚缺乏统一的标准,但超声造影可观察炎性肠壁内激活的小血管,而血管化的存在可能暗示着活跃期,故有研究[7-8,11]通过肠壁的增强来粗略判定。在强化方式方面,克罗恩病的超声造影表现常被分为4种:①整个肠壁强化;②黏膜及黏膜下层强化;③仅黏膜下层强化;④无任何壁层增强,故不同强化方式也能对克罗恩病活动性行半定量分析。但这两种诊断方式均主观性强。定量技术的引入使对比增强造影剂注射后小肠壁血管分布的客观测量成为可能。通过定量分析感兴趣区域的灰度或者通过获取推注造影剂后的时间-强度曲线,峰值强度、时间-强度曲线下面积、上升时间、通过造影剂达峰时间、平均通过时间等参数可以获得更精准的结果[1,12]。以往研究[25]报道,使用相对增强作为评价克罗恩病活动性的阈值时诊断价值最高,利用专用软件进行增强曲线分析的诊断价值有限。然而,本研究亚组分析结果显示,增强曲线对克罗恩病的活动性具有最高的诊断价值,推测这种差异可能由发表研究的偏倚引起,因为不同亚组的纳入文献数目不尽相同,甚至采用相对增强的文献数是肠壁存在强化的2 倍,容易导致选择偏倚;同时,在相对增强的亚组中,各原始研究使用的特定百分比有显著差异(34.5%~65.0%),并且是基于原始数据建立的回顾性阈值,因此也可能存在偏倚,所以在对本亚组分析结果进行解读时应慎重。
本研究的局限性:①仅纳入了中、英文文献,这可能会引入语种发表偏倚风险;②各研究使用的造影剂种类及剂量、仪器设备和探头、诊断实验与金标准检查之间存在差异,这也可能会影响本研究的结果;③纳入了范围广泛的参考标准研究,包括组织病理学标本评价、内镜及临床疾病活动指数等,因此对克罗恩病活动性的准确分类可能存在偏倚;④本研究纳入的文献在病例选择、待评价试验、金标准合理性、病例流程及进展情况方面的报告质量均参差不齐,提示研究质量较低,这可能与纳入的研究中含有病例对照研究、盲法的实施,以及超声造影与金标准检查间隔时间不明确有关。建议今后研究尽量采用诊断性试验报告标准,以提高诊断试验的报告质量;⑤由于超声造影在克罗恩病领域的应用缺乏广泛接受的共识,因此纳入文献判定克罗恩病活动性时使用阈值存在较大差异,希望今后能找到一种工具实现对造影结果更为准确、客观的判读。
综上所述,超声造影在诊断克罗恩病活动性方面具有较高诊断价值,尤其应用增强曲线进行判定时具备更高的诊断效能。但该结论仍需要更多高质量、大规模前瞻性多中心研究进一步证实。