徐琦德,崔旻,王海昆,姚萍
(新疆医科大学第一附属医院 消化病一科,新疆 乌鲁木齐 830011)
胃食管反流病(gastroesophageal reflux disease,GERD)指:因食管下段结构异常或功能退化,导致胃或十二指肠内容物反流至食管所引起的疾病[1]。烧心和反流是该病的典型症状[2]。GERD 的治疗分为药物抑酸治疗和手术治疗。手术治疗又包括腹腔镜下治疗和内镜下治疗。抑酸治疗主要以口服质子泵抑制剂(proton pump inhibitor,PPI)为主。但部分患者抑酸治疗效果欠佳[3],并且长期服用PPI 会影响营养物质的吸收,增加社区获得性肺炎和小肠菌群过度繁殖的风险[4]。腹腔镜下治疗主要以腹腔镜下胃底折叠术为主,但其创伤较大,且存在较多的不良反应,如:腹胀综合征、吞咽困难、腹泻和反复反流等[5],临床上已逐渐减少使用。因此,内镜下治疗成为了研究重点。内镜下治疗方式主要包括:射频消融术(radiofrequency ablation,RF)、经口无切口胃底折叠术(transoral incisionless fundoplication,TIF)和抗反流黏膜切除术(anti-reflux mucosectomy,ARMS)。RF 的原理是:应用相关设备,在食管下括约肌(lower esophageal sphinter,LES)或贲门处释放电流,造成局部肌肉组织纤维化、挛缩,通过LES的压力增加及胃食管交界处(esophagogastric junction,EGJ)顺应性的减弱,来起到抗反流的作用。TIF 的原理是:通过将胃底翻折并固定,使His角更加锐利,并形成一个抗反流瓣膜,以加强食管抗反流屏障。ARMS 的原理是:切除部分贲门或EGJ 的黏膜组织,通过手术部位瘢痕组织的不断增生、挛缩,来达到抗反流的作用。3种内镜下治疗方式在临床上都处于探索阶段,但哪种方式最好仍存在争议。本文拟通过网状Meta分析的方法,比较RF、TIF和ARMS的临床疗效,以期为临床治疗GERD 提供可靠的循证医学依据。
1.1.1 检索者 由第二作者和第三作者分别按照关键词进行独立文献检索。
1.1.2 资料库 中文数据库包括:中国知网(CNKI)、中国生物医学文献数据库(CBM)、维普(VIP)和万方数据(Wanfang data);英文数据库包括:Cochrane图书馆、PubMed、Embase和Medline。
1.1.3 检索词 中文检索词:射频消融术、经口无切口胃底折叠术、抗反流黏膜切除术、胃食管反流病和随机等;英文检索词:gastroesophageal reflux、transoral incisionless fundoplication、radiofrequency ablation、anti-reflux mucosectomy、randomized 和randomized controlled trials等。
1.1.4 检索时间 自建库至2021年12月1日。
1.2.1 纳入标准 ①研究类型:为随机对照试验(randomized controlled trial,RCT),不限制语言;②研究对象:临床确诊为GERD的成年患者,且符合里昂共识[6]或反流性食管炎诊断标准[7],无人种、年龄、性别、工作和病程等限制;③干预措施:对照组为单纯PPI 治疗或假手术(Sham)治疗;实验组为RF、TIF 和ARMS 中的任意1 种内镜下治疗方案;④结局指标:停止服药人数、pH <4.2的酸反流时间、食管下段压力和健康相关生活质量(health-related quality of life,HRQL)评分等指标,且数据完整。
1.2.2 排除标准 ①重复发表的文献;②病例报道、会议记录、动物性研究、综述及Meta 分析;③简单的描述性文献、结果不明确的文献、数据不完整的文献、使用其他治疗方法的文献和儿科相关文献;④实验设计不符合研究要求的文献[4]。
将各数据库检索题录导入EndNote X9 软件,根据排除标准进行文献筛选。建立新的文件库并下载全文。由两位研究人员独立进行评估及筛选,当有冲突时,邀请另一名参与者讨论,根据预先确定的表格提取数据。提取内容包括:第一作者、发表年份、病例数、治疗措施、随访时间及结局指标。研究人员交叉核对和审查数据。
依据5.1 版Cochrane 系统评价手册给出的质量评价表格,完成对纳入文献方法学上的质量评价[8]。评价项目包括:①是否随机;②是否隐藏分配;③是否采用盲法;④结局数据是否完整;⑤是否选择性报告;⑥是否有脱落病历;⑦是否有其他偏倚。每个项目分为3 个风险等级:高风险、低风险和不确定性风险。根据纳入文献中对上述7 个方面的描述,研究者对纳入文献进行解读和评价。5 个及以上项目评价为低风险,则判定纳入的文献为高质量文献。
①主要观察指标:停止服药人数;②次要观察指标:pH <4.2 的酸反流时间、食管下段压力及HRQL评分。
运用RevMan 5.4软件对纳入的文献进行风险偏倚评价。运用Stata 19.0 软件对数据进行汇总分析,针对各指标绘制网络关系图,依据发表偏倚绘制比较-校正漏斗图进行检验,同时针对闭合环状数据,进行非一致性检验判定结果的可靠性。使用ADDIS 16.6软件,应用贝叶斯法(采用4条链进行仿真分析,初始值为2.5,迭代步长为10,迭代次数调整为20 000次,模拟迭代次数为50 000 次),对收集的数据结果进行评估和处理分析,完成网状Meta 分析及概率排序。二分类资料采用比值比(odds ratio,O)作为统计量,连续性资料用均数差(mean difference,MD)作为统计量。用P<0.05及95%可信区间(confidence interval,CI)作为差异标准,若O值的95%CI不包括1,或者MD值的95%CI不包括0,则认为差异具有统计学意义。CochraneQ检验进行异质性分析,I2<50%表示异质性较低,反之异质性较高。潜在尺度缩减因子(potential scale reduced factor,PSRF)反映了收敛性。如果PSRF 接近1 或等于1,则表明收敛效率较好[9-10],模型所得的结果可信度较高。
首次检索文献共2 550 篇,完成多次筛选后,最终纳入16 项RCT[9-24],总计950 例患者。见图1和表1。
表1 纳入研究的基本特征Table 1 Basic characteristics of the included studies
图1 文献筛选流程图Fig.1 Flow chart of studies selection
在16 篇RCT 中,11 篇文献为高质量文献,其他5篇文献为低质量文献。3篇研究[9-11]为RF对比Sham,3 篇研究[12-14]为RF 对比PPI,5 篇研究[15-19]为ARMS对比PPI,5篇研究[20-24]为TIF对比PPI或Sham(3篇[20,23-24]为双臂研究,2 篇[21-22]为三臂研究)。7篇[9,11-12,15,18,20,23]使用双盲,其他研究未具体说明。所有研究的数据完整,无选择性报告及其他偏倚情况。质量评价见图2。
图2 纳入研究的风险偏倚图Fig.2 Plot of risk bias for included studies
各治疗方法直接Meta分析结果见表2。
表2 各治疗方式间直接比较的Meta分析Table 2 Meta-analysis of direct comparison among treatment methods
2.3.1 停止服药人数 共存在RF 对比PPI、RF 对比Sham、TIF对比PPI及ARMS对比PPI的4种直接比较类型。TIF优于PPI的治疗效果,但P>0.05,提示:差异无统计意义,且I2=83.2%,表明存在明显异质性,通过逐个剔除单个研究进行敏感性分析,结果未发生明显改变,提示:结果稳定性较强。RF优于PPI的治疗效果(P=0.009),且I2=0.0%,提示:异质性较低。RF 优于Sham 的治疗效果(P=0.001),且I2=0.0%,提示:异质性较低。ARMS优于PPI的治疗效果(P=0.035),且I2=0.0%,提示:异质性较低。
2.3.2 pH <4.2 的酸反流时间 共存在RF 对比PPI、RF 对比Sham、TIF 对比PPI、TIF 对比Sham 及ARMS 对比PPI 的5 种直接比较类型。ARMS 优于PPI的治疗效果(P=0.030),但I2=85.9%,表明存在明显异质性,通过逐个剔除单个研究进行敏感性分析,结果未发生明显改变,提示:结果稳定性较强。RF弱于PPI 的治疗效果,但P=0.060,提示:差异无统计学意义,I2=0.0%,提示:异质性较低。RF 优于Sham 的治疗效果(P=0.001),且I2=0.0%,提示:异质性较低。TIF弱于PPI的治疗效果,但P=0.320,提示:差异无统计学意义,I2=0.0%,提示:异质性较低。TIF 优于Sham 的治疗效果(P=0.001),且I2=0.0%,提示:异质性较低。
2.3.3 食管下段压力 共存在RF 对比PPI、RF 对比Sham、TIF 对比PPI、TIF 对比Sham 及ARMS 对比PPI 的5种直接比较类型。RF 优于Sham 的治疗效果,但P>0.05,提示差异无统计意义,且I2=87.8%,表明存在明显异质性,通过逐个剔除单个研究进行敏感性分析,结果未发生明显改变,提示:结果稳定性较强。ARMS 优于PPI 的治疗效果,但P>0.05,提示:差异无统计意义,纳入文献1 篇,异质性无法求得。RF 优于PPI 的治疗效果(P=0.040),且I2=0.0%,提示:异质性较低。TIF 优于PPI 的治疗效果(P=0.010),且I2=42.5%,提示:异质性较低。TIF优于Sham的治疗效果(P=0.020),且I2=0.0%,提示:异质性较低。
2.3.4 HRQL 评分共存在RF对比PPI、RF 对比Sham、TIF 对比PPI、TIF 对比Sham 及ARMS 对比PPI的5 种直接比较类型。TIF 优于PPI 的治疗效果(P=0.045),但I2=69.4%,表明存在明显异质性,通过逐个剔除单个研究进行敏感性分析,结果未发生明显改变,提示:结果稳定性较强。TIF 优于Sham的治疗效果(P=0.001),但I2=78.3%,表明存在明显异质性,通过逐个剔除单个研究进行敏感性分析,结果未发生明显改变,提示:结果稳定性较强。ARMS优于PPI 的治疗效果(P=0.001),但I2=60.2%,表明存在明显异质性,通过逐个剔除单个研究进行敏感性分析,结果未发生明显改变,提示:结果稳定性较强。RF 优于PPI 的治疗效果(P=0.020),但纳入文献1篇,异质性无法求得。RF优于Sham的治疗效果(P=0.011),且I2=0.6%,提示:异质性较低。
2.4.1 网络证据关系 文章共涉及5 种干预措施。停止服药方面,共纳入8 篇文献。pH <4.2 的酸反流时间方面,共纳入9篇文献,存在由PPI、RF、Sham及TIF 组成的闭合环。食管下段压力方面,共纳入7篇文献,存在由PPI、RF、Sham 及TIF 组成的闭合环。HRQL评分方面,共纳入10篇文献,存在由PPI、RF、Sham 及TIF 组成的闭合环。各个结局的网络关系图中,对于每组比较,连接线段的宽度与纳入文献的数量成正比并指示直接比较,节点的大小与样本量的大小成正比。见图3。
图3 网状Meta分析网络证据图Fig.3 Mesh Meta-analysis network evidence map
2.4.2 一致性检验 针对4 种研究指标收集数据,进行一致性及非一致性模型分析,分别得出随机效应标准差。在两种模型下,该指标结果大致一致且PSRF=1,表示数据拟合较好,故采用一致性模型分析。见表3。
表3 纳入文献的一致性检验Table 3 Consistency detection of included studies
2.4.3 非一致性检验 对各个结局指标中的各个闭合环进行非一致性检验。在pH <4.2的酸反流时间方面,对PPI-RF-Sham-TIF 闭合环进行非一致性检验,结果显示:95%CI 为0.00~4.15,包含0,提示数据不存在非一致性且结果稳定可靠。在食管下段压力方面,对PPI-RF-Sham-TIF 闭合环进行非一致性检验,结果显示:95%CI 为0.00~4.92,包含0,提示数据不存在非一致性且结果稳定可靠。在HRQL评分方面,对PPI-RF-Sham-TIF 闭合环进行非一致性检验,结果显示:95%CI 为0.00~14.20,包含0,提示数据不存在非一致性且结果稳定可靠。见图4。
图4 非一致性检验证据图Fig.4 Evidence diagram of non conformance inspection
2.4.4 纳入研究各指标网状Meta 分析结果①在停止服药人数方面,TIF与RF比较,差异无统计学意义(95%CI跨过1),余均显示:差异有统计学意义;②在pH <4.2的酸反流时间方面,TIF与RF、RF与PPI 比较,差异均无统计学意义(95%CI 跨过0),余均显示:差异有统计学意义;③在食管下段压力方面,TIF 与ARMS、TIF 与RF、ARMS 与PPI 比较,差异均无统计学意义(95%CI跨过0),余均显示:差异有统计学意义;④在HRQL评分方面,TIF与RF、RF与PPI 比较,差异均无统计学意义(95%CI 跨过0),余均显示:差异有统计学意义。见表4。
表4 网状Meta分析结果Table 4 Network Meta-analysis results
2.4.5 纳入研究各结果指标的网状Meta 分析排序结果 ①在停止服药人数方面,其临床疗效顺序依次为ARMS、RF 和TIF,秩序概率分别为1.00、0.95 和0.46,表明:在3 种内镜下治疗方法中,ARMS 最有可能使患者停止服药;②在pH <4.2 的酸反流时间方面,其临床疗效顺序依次为ARMS、RF 和TIF,秩序概率分别为1.00、0.33 和0.15,表明:在3 种内镜下治疗方法中,ARMS 对减少酸反流时间最有效;③在控制食管下段压力方面,其临床疗效顺序依次为ARMS、TIF 和RF,秩序概率分别为0.98、0.94 和0.80,表明:在3 种内镜下治疗方法中,ARMS 对增加食管下段压力最有效;④在HRQL 评分方面,其临床疗效顺序依次为ARMS、TIF 和RF,秩序概率分别为0.98、0.94 和0.80,表明:在3 种内镜下治疗方法中,ARMS对减少HRQL评分最有效。见表5和见图5。
图5 不同结局指标的概率排序Fig.5 Probability ranking of different outcome indicators
表5 概率最佳排序(Rank 1结果)Table 5 Probability best ranking(Rank 1 results)
针对4 个结局指标所纳入的文献绘制比较-校正漏斗图。漏斗图中相同颜色点,代表相同的直接比较研究。若漏斗图发现明显不对称,表明发表偏倚或小样本效应较大。①在停止服药人数方面,漏斗图分布较对称,提示:存在的发表偏倚或者小样本效应较小;②在pH <4.2 的酸反流时间方面,漏斗图较为对称,但PPI 治疗与ARMS 治疗的研究分布较远,提示:可能存在发表偏倚或者小样本效应,而其他研究存在较小的发表偏倚或者小样本效应;③在控制食管下段压力方面,漏斗图较为对称,但PPI 治疗与TIF 治疗的研究分布较远,提示:可能存在发表偏倚或者小样本效应,而其他的研究存在较小的发表偏倚或者小样本效应;④在HRQL评分方面,漏斗图分布较为对称,但PPI 治疗与TIF 治疗的研究分布较远,提示:可能存在发表偏倚或者小样本效应,而其他的研究存在较小的发表偏倚或者小样本效应。见图6。
图6 各手术方式发表偏倚分析Fig.6 Analysis of publication bias of various surgical methods
GERD 是消化系统的常见疾病。抗反流屏障和(或)食管防御功能低下是引起GERD 患者烧心、反酸等不适症状及黏膜组织损伤的主要病因[25]。治疗原则主要包括:减少胃酸分泌、加强抗反流屏障和预防食管外症状(如慢性咳嗽和非心源性胸痛等)。虽然PPI 被推荐作为GERD 的一线药物,但仍有某种程度的局限性,如:总有效率低和停药后易复发等。因此,GERD的内镜下治疗逐渐在临床中得到重视。
3.2.1 ARMS 目前,临床上有多种内镜下治疗方式。本研究针对常用的3 种内镜下治疗GERD 的方法,从4 个方面进行了综合分析,结果发现:ARMS效果最优。ARMS的原理是:通过部分或完全切除食管下段或贲门处的黏膜组织,在相对狭窄的食管末端中形成瘢痕,以此起到抑制反流的作用[26]。但是其缺点也随之显现,例如:一项纳入10 例患者的研究[27]中,术中患者均无严重并发症(出血或穿孔)发生,在后期随访中,24 h 食管pH 检测项目也均提示pH <4.2 的时间较前缩短,但是仍有2 例患者术后出现吞咽困难,需反复行球囊扩张以解除狭窄,这无疑给患者带来了痛苦。另一方面,由于操作空间较小,ARMS 对操作者的技术要求相对较高,培训周期也较长。
3.2.2 TIF 在控制食管下段压力及改善HRQL评分方面,TIF 为第2 位。其原理为:将EGJ 处折叠,使His 角的角度更加锐利,同时形成抗反流瓣,从而达到抑制反流的目的[28]。一项纳入66 名患者的研究[29]中,TIF 组在HRQL 评分和食管下段压力增加方面,均优于PPI 组,且在第6 和12 个月时对TIF 组进行随访,分别有66.0%和39.0%的患者完全停止使用PPI,但远端食管酸暴露没有明显改善,分别只有44.0%和29.0%的患者实现了pH 正常化。有研究[30]表明,TIF手术发生重大不良事件较少,安全性也较高。
3.2.3 RF 在停止服药人数和控制酸反流时间方面,RF 为第2 位。其原理是:通过点阵式的电流释放,造成食管下段的神经肌肉组织凝固坏死,通过后期纤维增生达到抗反流的作用[31]。RF 技术成熟,且对操作者技术要求相对较低,其治疗总体安全性较高,并发症也多为一过性轻微症状(如胸痛和咳嗽等),无需特殊干预。一项纳入2 468 名患者的Meta分析[32]表明,该手术安全性、耐受性及有效性均较高。
除上述3种治疗方法外,内镜下硬化剂注射术经过多次迭代,也显示出较好的疗效。目前,主要的注射剂为Durasphere材料,其本质是碳涂层的石墨微球混悬液。一项纳入12例患者的研究[33]显示,6例患者完成内镜下硬化剂注射后,PPI 用量减少50.0%,相关评分也均有改善。但是该操作有误伤临近器官的风险,目前仍不被积极推广。
MUSE手术原理是:在影像系统辅助下,吻合系统将胃上部钉合至食管下段,通过加强瓣阀,加锐His 角,从而起到抗反流的作用[34]。一项纳入65 例GERD 患者的研究[35]中,所有患者使用MUSE 手术治疗,有48 例患者PPI 药物减量50.0%以上,HRQL 评分也较前改善,在之后的随访中统计,可停用PPI药物的患者合计有42 例,剩余的23 例患者中,药物剂量减半的合计有13例。
本研究广泛检索了相关文献,并对数据完成了综合分析。研究结果对临床医师选择何种内镜手术方式治疗GERD时,有一定的参考价值。但尚存在一些不足:①纳入的相关文献较少,且个别文献纳入病例数较少,一致性检验及偏倚分析均提示仅存在较小的差异及偏倚;②纳入文献的语言类型只包括少数国家,可能存在地区及人种限制,语言类型不够全面;③纳入文献的随访时间较短,尚需要补充长期随访实验数据,来论证长期治疗效果;④某些研究中没有提及分配隐瞒、偏倚风险和随访结果,最终会影响研究结果的真实性。
综上所述,在选择内镜下手术治疗GERD时,为提高临床总有效率,应首选ARMS。但本研究存在一定的局限,为确保研究结果的可靠性,仍需今后纳入更严格的大样本、多中心和双盲RCT来佐证。