许凯强,邱国春,张菠,施权,王寓平,尚忠明
(西南医科大学附属中医医院血管甲状腺乳腺外科,四川 泸州 646000)
甲状腺结节是普通外科常见的疾病,在一般人群中发病率高达76%[1]。根据既往的研究,大多数甲状腺结节是良性的[2],但即使大多数为良性,患者仍经常遭受不同困扰,例如吞咽困难、局部疼痛及由结节造成颈部肿块引起的美容问题。特别是冷结节还会增加恶变的风险。目前,对于甲状腺结节的标准治疗方法仍为甲状腺切除术,虽然能达到根治的目的,但它可能导致严重的并发症,如喉返神经和甲状旁腺的损害,或美容问题,如永久性疤痕形成等。而且部分行全甲状腺切除术的患者还可能会出现甲状腺功能减退,需要终生服用左旋甲状腺素治疗,这不仅会造成经济损失,还会导致不良反应[3,4]。此外,甲状腺切除术对于手术风险高或年龄较大的患者可能不是一种选择。虽然左旋甲状腺素和放射性碘已被用作老年和高手术风险患者的非侵入性治疗,但这些治疗不能避免医源性甲状腺功能减退或甲状腺功能亢进的出现[5,6]。因此,临床诊疗工作中,亟待需要一种新的治疗技术来弥补现有技术的不足,以提高甲状腺良性结节的治疗效果。
随着医疗技术的发展,超声引导下的热消融(射频、微波)治疗已成为良性甲状腺结节的替代治疗方法[7-9]。既往研究表明,热消融对于甲状腺良性结节的治疗具有很好生活质量和性价比[10]。然而,对于良性甲状腺结节的治疗,热消融是否与常规甲状腺切除术具有相当甚至优于切除术的效果,至今仍不清楚。目前,对于热消融和手术切除在甲状腺良性结节治疗中的有效性和安全性,还没有进行过大样本meta 分析比较。因此,考虑到缺乏证据,本meta 分析的目的是系统回顾已发表的文献,评估TA 与SR 在BTN 中的有效性和安全性。研究结果可为临床实践提供参考。
通过计算机从Pubmed、Web of Science、Embase、Cochrane Library、中国生物医学文献数据库、中国知网数据库、万方数据库和维普数库系统的检索从建库至2020 年07 月关于比较TA 和SR 治疗BTN 患者的临床对照研究。英文检索词包括:Thermal ablation, microwave, radiofrequency, benign thyroid nodules, surgical excision, thyroid;中文检索词包括:热消融、微波、射频、甲状腺良性结节、手术切除、甲状腺。
①需要治疗的甲状腺结节疾病患者;②比较TA 与SR 治疗BTN 已发表的回顾性或前瞻性对比研究;③至少报告下列结果之一且数据完整的研究:手术时间、术中出血量、住院时间、术后并发症;④经手术病理或细胞病理学确诊为良性甲状腺结节;⑤本研究无语言限制,且发表文献限于核心期刊及以上级别。
①没有对比TA 与SR 治疗BTN 的研究;②个案报道、摘要、会议报告或者实验论文及重复性研究;③没有全文,同时从摘要中不能提取有效数据的研究。
2 位评研究者对文献独立进行检索、资料提取并进行质量评价,如遇到不一致的情况,则通过双方讨论或征求第3 位评价者的意见。数据不全时,尽可能通过与通信作者取得联系获得。对于没有均值和标准差(SD)的定量数据,如果无法从作者处获得缺失的信息,则采用基于中位数、范围和样本量的均值和标准差估算方法进行计算[11,12]。
对RCT 研究的方法学质量评估,采用Jadad 量表[13]进行评分,分数大于等于3 分表明该RCT 是相对高质量的研究。对非RCT 研究的质量评价均采用纽卡斯尔-渥太华量表(NOS)进行评估,该量表已被广泛用于非随机研究的质量学评价中[14]。该评估量表对纳入研究的质量评分,主要包括3 个方面:研究对象的选择、研究群体的可比性及对结局的评估。该量表最高评分为9 分,如果分数大于5 分,表明该研究方法质量较高。
为检测不同研究设计结果的一致性与潜在的偏倚,根据消融类型分组( 微波和射频)进行总体分析和两个亚组分析(微波meta 分析和射频meta 分析)。所有分析都采用Revman 5.1 软件进行数据合并及处理。对研究中的连续性变量及二分类变量分别采用均数差(mean difference,MD)及率差(odds ratio ,OR)为效应指标计算它们的合并值及95%CI,P<0.05 为差异有统计学意义。并用Mantel-Haenszel 检验法对研究进行异质性检验,以I2表示各研究之间的异质性。若I2≤ 50.0%,表明各研究结果差异无统计学意义(P ≥ 0.1),则采用固定效应模型;若I2>50.0%,表明有统计学异质性(P<0.1),则采用随机效应模型分析;明显的临床异质性采用敏感性分析方法处理。如果纳入研究数量超过10 篇则通过漏斗图来判别可能的发表偏倚[15]。
通过系统的检索,共找到1816 篇文献;去除重复性研究文献892 篇。对剩下的924 篇文献进行全文阅读后,排除911 篇个案报道、非对照研究文献或普通期刊。最后,本Meta 分析共纳入13 项研究[16-28],其中RCT 1 篇[16],回顾性队列研究12篇[3,17-27],共包括2688 例患者。文献筛选流程详见图1。纳入研究基本特征及质量学评分见表1。总的来说,纳入的研究显示出中等到高的方法学质量。因此,纳入研究都为高质量研究。
图1 纳入文献筛选流程图
2.2.1 手术时间的比较
8 篇研究报道了手术时间[3,16-18,23-26]。异质性检验提示各研究间存在异质性(I2=98%,P<0.01),选用随机效应模型进行合并,总体分析结果显示:TA 组手术时间明显短于SR 组,差异结果有统计学意义[MD=-50.81,95% CI,-59.08—-42.53,P<0.01]。亚组分析结果显示:较手术切除相比,微波[MD=-53.34, 95% CI,-67.71—-38.98,P<0.01]和射频[MD=-44.87,95% CI, -45.97—-43.77,P<0.01]组手术时间均明显缩短,差异结果有统计学意义,如图2。
表1 纳入研究基本特征及质量学评分
图2 手术时间比较的森林图
图3 术中出血量比较的森林图
图4 住院时间比较的森林图
2.2.2 术中出血量的比较
5 篇 研 究 报 道 了 手 术 时 间[3,17-18,24,26]。异 质 性 检 验 提示各研究间存在异质性(I2=95%,P<0.01),选用随机效应模型进行合并,总体分析结果显示:TA 组的术中出血量明显少于SR 组,差异结果有统计学意义[MD=-18.82,95% CI, -20.94—-16.71,P<0.01]。亚组分析结果显示:与手术切除相 比,微 波[MD=-17.05,95% CI,-18.35—-15.74,P<0.01]和射频[MD=-21.60,95% CI,-26.77—-16.42,P<0.01]组术中出血量均明显减少,差异结果有统计学意义,如图3。
2.2.3 住院时间的比较
8 篇研究报道了两组住院时间[3,16-19,21,24,26]。异质性检验提示各研究间存在异质性(I2=98%,P<0.01),选用随机效应模型进行合并,总体分析结果显示:TA 组的住院时间明显短于SR 组,差异结果有统计学意义[MD=-3.76,95% CI,-4.42—-3.10,P<0.01]。亚组分析结果显示:微波[MD=-3.94,95% CI,-4.83—-3.05, P<0.01]和射频[MD=-3.54,95% CI,-4.44—-2.63,P<0.01]组住院时间均明显短于手术切除组,差异结果有统计学意义,如图4。
2.2.4 术后并发症的比较
8 篇 研 究 报 道 了 术 后 总 体 并 发 症[3,16-18,20-22,26]。异 质 性检验提示各研究间不存在明显异质性(I2=46%,P<0.01),选用固定效应模型进行合并,总体分析结果显示:TA 组的术后总体并发症发生率明显少于SR 组,差异结果有统计学意义[OR=0.19,95% CI,0.15—0.24,P<0.01]。亚组分析结果显示:较手术切除相比,微波[OR=0.25,95% CI,0.13—0.49,P<0.01]和射频[OR=0.18,95% CI,0.13—0.23,P<0.01]组术后总体并发症发生率均明显较少,差异结果有统计学意义,如图5。
图5 术后总体并发症比较的森林图
图6 术后声音嘶哑比较的森林图
7 篇研究报道了术 后声音嘶哑发生率[16-17,19-21,25,27]。异质性检验提示各研究间不存在明显异质性(I2=33%,P=0.17),选用固定效应模型进行合并,总体分析结果显示:TA 组的术后声音嘶发生率明显少于SR 组,差异结果有统计学意义[OR=0.41,95% CI,0.20—0.84,P<0.05]。亚组分析结果显示:较手术切除相比,微波[OR=0.16,95% CI,0.06—0.48,P<0.01]组术后声音嘶哑发生率明显较少,差异结果有统计学意义,而射频组两组比较无统计学意义,如图6。
3 篇研究报道了术后颈部血肿发生率[17,19,21]。异质性检验提示各研究间不存在明显异质性(I2=0%,P=0.79),选用固定效应模型进行合并,总体分析结果显示:TA 组的术后颈部血肿发生率明显少于SR 组,差异结果有统计学意义[OR=0.41,95% CI,0.20—0.84,P<0.05],如图7。
3 篇研究报道了术后喉返神经损伤发生率[17,18,24]。异质性检验提示各研究间不存在明显异质性(I2=0%,P=0.49),选用固定效应模型进行合并,总体分析结果显示:对于术后喉返神经损伤发生率,两组比较差异结果无统计学意义[OR=0.26,95% CI,0.18—0.39,P<0.01],如图8。
5 篇研究报道了术后甲减发生率[17-18,21-22,24]。异质性检验提示各研究间存在明显异质性(I2=72%,P=0.006),选用随机效应模型进行合并,总体分析结果显示:对于术后甲减发生率,两组比较差异结果无统计学意义[OR=0.15,95% CI,0.02—1.02,P=0.05],如图9。
6 篇研究报道了术后颈部疼痛发生率[16-18,20,22,24]。异质性检验提示各研究间存在明显异质性(I2=89%,P<0.01),选用随机效应模型进行合并,总体分析结果显示:TA 组的术后颈部疼痛发生率明显少于SR 组,差异结果有统计学意义[OR=0.08,95% CI,0.02—0.34,P<0.05]。亚 组 分 析 结 果 显 示:较 手 术切 除 相 比,微 波[OR=0.06,95% CI,0.00—0.78,P<0.05] 和 射频[OR=0.09,95% CI,0.01—0.87,P<0.05]组术后竟不知道疼痛发生率均明显较少,差异结果有统计学意义,如图10。
2.2.5 术后敏感性分析和发表偏倚评估
异质性检验分析结果提示在手术时间、术中出血、住院时间、术后甲减及颈部疼痛发生率比较上,各研究间存在明显异质性,采用逐一排除单项研究的方法对结局指标进行敏感性分析。敏感性分析结果表明,在分析中,所考虑的任何参数或异质性水平的OR 或MD 的方向或统计意义均无变化。
对术后总体并发症进行漏斗图分析,结果显示漏斗图中8个点在漏斗图两侧分布不完全对称,提示可能存在发表偏倚,如图11。
图7 术后颈部血肿比较的森林图
图8 术后喉返神经损伤比较的森林图
图9 术后甲减比较的森林图
图10 术后颈部疼痛比较的森林图
图11 基于术后并发症的漏斗图
该研究通过对2688 例患者进行系统回顾和meta 分析,比较热消融和常规甲状腺切除术治疗良性甲状腺结节的效果和安全性,为临床实践提供了强有力的证据。本研究表明,与常规甲状腺切除术相比,超声引导下的热消融术对良性甲状腺结节的治疗是有帮助的,主要体现在安全性、缩短住院时间等方面。
需要治疗的良性甲状腺结节患者的标准疗法是常规甲状腺切除术,但它并不总是最好的选择。既往研究表明这种方法可能导致严重并发症、美容问题及长时间住院和其他问题[28-30]。在甲状腺良性疾病的治疗过程中,患者是否应该必须经历这些问题,目前仍存在争议[31]。此外,一些患者由健康状况不佳或者高龄,不适合做甲状腺切除术。超声引导下的热消融可能是一种极具潜力的替代治疗方法。虽然热消融治疗良性甲状腺结节的疗效已得到证实[32-33],然而热消融是否相当于甚至优于常规甲状腺切除术,目前仍不清楚。据我们所知,超声引导下的热消融与常规甲状腺切除术对于良性甲状腺结节在治疗的安全性和有效性方面的差异,目前还没有系统的综述或meta 分析。因此,本研究的目的是采用系统评价的方法,综合各中心临床研究,分析评估热消融术在良性甲状腺结节治疗上的效果及安全性。
本meta 分析结果显示,热消融术患者手术时间、术中出血量、住院时间及术后并发症发生率指标均明显优于手术切除组;主要是因热消融术组操作简短,无需开关切口,创伤小,因此手术时间短、术中出血量少,住院时间也相应缩短。同时患者的术后并发症也较少,主要体现在较少的声音嘶哑、颈部血肿、颈部疼痛发生率上,而对于其他并发症的发生情况,未来还需要多中心,大样本随机对照研究来加以验证。
虽然热消融在很多方面优于常规甲状腺切除术,但需要注意的是,热消融前的病理结果是通过细针穿刺(FNA)或芯针活检(CNB)获得的,可能会产生假阴性或假阳性结果。因此在实时热消融治疗时应被至少两种FNAs 或CNBs 确认为良性时,才应该进行热消融治疗。此外,对于一些位于胸骨后的良性甲状腺结节,热消融的效果往往不理想,应该首选常规甲状腺切除术[34]。因此,在进行热消融治疗时,应进行全面的术前评估,包括可靠的术前诊断和热消融的可行性评估只有当这两个条件同时满足时,热烧蚀才是治疗良性甲状腺结节的首选。
本研究也存在以下局限性:①该只检索了公开发表的中英文文献,一些以非中英文发表的文献未被纳入,可能会削弱结果的稳定性;②在手术时间、术中出血、住院时间、术后并发症发生率分析中发现了纳入研究的异质性,因此使用了随机效应模型,这可能削弱结果的证据;③分析结果可能会受小样本量研究的影响;④漏斗图结果提示可能存在发表偏倚。
综上所述,当前证据显示,在甲状腺良性结节的治疗中,热消融术的有效性和安全性优于手术切除,未来还需要多中心大样本随机对照试验来予以验证。