D1和D2淋巴结清扫术治疗胃癌的系统评价

2014-12-03 08:09李育泉窠文博魏茂强兰州大学第一临床医学院甘肃兰州730000

中国老年学杂志 2014年15期

李育泉陈燕窠文博魏茂强姜雷 (兰州大学第一临床医学院，甘肃兰州 730000)

目前胃癌的治疗方法有手术、化疗、放疗、热疗、免疫治疗和中医中药等。手术切除仍然是目前最为有效的治疗方法。有研究表明胃癌早期即发生淋巴结转移，因此，淋巴结清扫是胃癌根治术中的主要组成部分〔1〕。根据日本胃癌治疗处理规约胃癌的淋巴结清扫手术方式有D1、D2及D3〔2〕。目前对于D1和D2术式的选择尚存在较多的争议，在大多数东亚国家，特别是中国、日本、韩国D2淋巴结清扫术被作为胃癌手术的标准术式;而在西方国家多主张行D1手术〔2，3〕;而最近意大利的一项随机对照试验(RCT)却提示保留脾脏和胰腺的D2手术和D1手术的安全性相似〔3〕。为此，有必要对胃癌D2和D1淋巴结清扫术的安全性进行系统评价，为临床实践提供决策依据。

1 资料与方法

1.1 文献纳入标准 (1)研究类型:RCT无论是否采取随机隐藏或盲法，语种不限。(2)研究对象:①经病理或细胞学诊断为胃癌;②Karnofsky评分≥80，预计可手术切除;③无手术禁忌证。(3)干预措施:D1淋巴结清扫术(即D1淋巴结清扫术，其清扫范围是胃周淋巴结〔2〕)和D2淋巴结清扫术(即D2淋巴结清扫术，其清扫范围是在D1范围的基础上加上肝周、脾周和肝十二指肠动脉周围的淋巴结〔2〕)。(4)手术分类标准:根据第14版日本《胃癌处理规约》对混乱的胃癌手术名称进行统一规范〔4〕，即将淋巴结按3站16组分类方法进行统一，淋巴结清除在此之前用“R”表示的现在一律采用字母“D”表示如(D1到D3)和应用D0到D4分类的一律改为D1到D3分类。(5)结局指标:5年生存率、术后病死率、术后并发症(包括淋巴瘘，肺部并发症，胰瘘，腹腔脓肿和吻合口瘘)发生率。

1.2 检索策略计算机检索:检索Cochrane Library、PubMed、Embase、中国生物医学文献数据库(CBM)、中文科技期刊数据库、中国学术期刊全文数据库和万方数据库，收集所有比较D1和D2的随机对照试验(截至2012年4月)。RCT检索遵循Cochrane系统评价手册5.1中描述的RCT检索策略。检索词分目标疾病和干预措施两大部分(中文检索词:胃癌，胃肿瘤，淋巴结清扫术和淋巴结切除术;英文检索词:Stomach Neoplasm，Gastric Neoplasm* ，Cancer of Stomach，Stomach Cancer* ，Cancer of the Stomach，Gastric Cancer* ，Lymph Node Excisions，Lymphadenectomies，Lymph Node Dissection* ，lymphadenectomy，D1 和D2)，并根据具体数据库调整，所有检索采用主题词与自由词相结合的方式，所有检索策略通过多次预检索后确定。手工检索:相关领域的重要期刊。

1.3 文献筛选和资料提取首先通过文献管理软件剔除重复的文章，然后根据预先制定的纳入排除标准筛选文献，阅读所获文献题目和摘要，排除明显不符合纳入标准的文献后，对可能符合纳入标准的文献下载和阅读全文，以确定是否符合纳入标准并提取相关资料，核对纳入文献的结果。对符合纳入标准的RCT进行资料提取，填写资料提取表格。提取资料包括:①试验的基本情况、两组患者的基线情况和疾病状况;②试验设计、研究时间、干预措施、反应研究质量的指标等。③ 结局测量指标:5年生存率、胃癌复发率、术后病死率、术后并发症(包括淋巴瘘，顽固性腹泻，肺部感染，胰瘘，十二指肠残端瘘，上消化道出血，吻合口瘘)发生率。

1.4 文献质量评价参照Cochrane手册提供的评价条目并结合本研究特点，选择适当的标准进行质量评价:① 随机分配方法;②隐藏分组;③盲法;④结果数据的完整性;⑤选择性报告研究结果;⑥其他偏倚来源。

1.5 统计学方法采用Cochrane协作网提供的RevMan5.1进行Meta分析。计数资料采用相对危险度(RR)或优势比(OR)为疗效分析统计量，计量资料采用加权均数差(WMD)或标准化均数差(SMD)。各效应量均以95%可信区间(CI)表示。各纳入研究结果问的异质性采用Chi检验。如果各研究间有统计学同质性(P＞0.1，I2＜50%)，采用固定效应模型;反之，采用随机效应模型。

2 结果

2.1 文献检索结果初检有关文献334篇。通过文献管理软件剔除重复文献34篇后剩余300篇。阅读题名、摘要共排除274，其中综述43篇，其他非随机对照试验、非临床研究文献7篇，干预措施不符224篇。剩余26篇查找原文，排除未达到纳入标准的文献11篇，最终纳入15〔3～16〕篇文章，共9个随机对照试验，其中4篇文献〔5～8〕描述1项研究，3项RCT试验均由2篇文章〔9～14〕先后报道。纳入研究的一般特征见表1。

2.2 质量评价 9个研究都采用随机分配，但只有7个研究〔5～14，16，18，19〕描述随机方法，其他研究未描述随机的具体方法。9 个研究中，6 个研究〔5～14，18，19〕有明确的隐蔽分组方法，其他研究未描述。9个研究都没有使用盲法。9个研究中有2个研究〔18，19〕明确说明有失访，但失访人数少对结果影响不大故认为结果数据是完整的。详情见表2。

表1 纳入研究的一般特征

表2 9个纳入研究的质量评价表

2.3 统计结果分析

2.3.1 5 年总生存率共有 7 个篇研究〔8，10，12，15，17～19〕报告该指标，D1组1 059例，D2组1 015例。Meta分析结果提示D1组与D2组在5年生存率方面无显著差异，合并OR=0.87，95%CI(0.67，1.14)，纳入研究间有异质性(P=0.08，I2=46%)，故采用随机效应模型，合并效应量检验Z=1.02，P=0.31。

2.3.2 术后并发症发生率共有 6 篇研究〔6，9，12，14，15，19〕报道该指标，D1组953例，D2组906例。Meta分析结果提示D1组与D2组在术后并发症发生率方面的差异有统计学意义，合并OR=0.49，95%CI(0.39，0.61)，纳入的研究间同质性较好(P=0.49，I2=0%)，故采用固定效应模型，合并效应量检验Z=6.17，P＜0.00 001。

2.3.3 围术期死亡率共有 6 篇研究〔8，9，12，14，15，18〕报道了该指标，D1组956例，D2组914例。Meta分析结果提示D1组与D2组在术后并发症发生率方面的差异有统计学意义，合并OR=0.89，95%CI(0.30，0.67)，纳入的研究间无统计学异质性(P=0.48，I2=0%)，故采用随机效应模型合，合并效应量检验(Z=3.83，P=0.000 1)。

2.3.4 吻合口瘘共有 6 篇研究〔5，9，12，15，18，19〕标报道该指标，D1组845例，D2组801例，Meta分析结果提示两组在吻合口瘘发生率方面差异有统计学意义，合并OR=0.43，95%CI(0.28，0.66)，纳入研究间有无统计学异质性(P=0.39，I2=4%)，故采用固定效应模型，合并效应量检验(Z=3.88，P=0.000 1)。

2.3.5 胰瘘共有 5 篇研究〔5，12，14～16〕标报道该指标，D1 组761例，D2组715例，Meta分析结果提示两组在胰瘘发生率方面差异有统计学意义，合并 OR=0.24，95%CI(0.10，0.55)，纳入研究间有无统计学异质性(P=0.80，I2=0%)，故采用固定效应模型，合并效应量检验(Z=3.38，P=0.000 7)。

2.3.6 淋巴瘘共有2篇研究〔12，15〕标报道该指标，D1组218例，D2组220例，Meta分析结果提示两组在淋巴瘘发生率方面差异无统计学意义，合并 OR=1.60，95%CI(0.41，6.21)，纳入研究间无统计学异质性(P=0.26，I2=20%)，故采用固定效应模型，合并效应量检验(Z=0.68，P=0.49)。

2.3.7 切口感染共有 3篇研究〔5，12，16〕标报道该指标，D1组520例，D2组472例，Meta分析结果提示两组在创口感染发生率方面差异有统计学意义，合并 OR=0.41，95%CI(0.23，0.73)，纳入研究间无统计学异质性(P=0.99，I2=0%)，故采用固定效应模型，合并效应量检验(Z=3.01，P=0.003)。

2.3.8 腹腔脓肿共有2篇研究〔14，15〕标报道该指标，D1组241例，D2组243例，Meta分析结果提示两组在腹腔脓肿发生率方面差异无统计学意义，合并 OR=1.47，95%CI(0.55，3.93)，纳入研究间无统计学异质性(P=0.96，I2=0%)，故采用固定效应模型，合并效应量检验(Z=0.76，P=0.45)。

2.3.9 肺部并发症共有3篇研究〔5，14，15〕标报道该指标，D1组621例，D2组574例，Meta分析结果提示两组在肺部并发症发生率方面差异有统计学意义，合并OR=0.40，95%CI(0.29，0.63)，纳入研究间无统计学异质性(P=0.42，I2=0%)。

2.3.10 五年生存率亚组分析对5年生存率进行亚组分析，按照国家不同分成欧洲国家和亚洲国家两个亚组，欧洲国家亚组无统计学意义，合并OR=1.02，95%CI(0.83，1.25)，此亚组纳入研究间无统计学异质性(P=0.51，I2=0%)，合并效应量检验(Z=0.18，P=0.85);亚洲国家亚组有统计学意义，合并OR=0.66，95%CI(0.44，0.89)，此亚组纳入研究间有统计学异质性(P=0.06，I2=65%)。

2.3.11 围术期死亡率亚组分析对围术期死亡率进行亚组分析，按照干预措施的不同，分为D1组和D2组两个亚组，按照国家不同分成欧洲国家和亚洲国家两个亚组，欧洲国家亚组有统计学意义，合并 OR=0.46，95%CI(0.29，0.71)，此亚组纳入研究间无统计学异质性(P=0.30，I2=16%)，合并效应量检验(Z=3.50，P=0.000 5)。

3 讨论

3.1 淋巴结分级分站及清扫手术的名称的统一规范在纳入的文献中淋巴结分级分站及清扫手术的名称都根据不同版本的胃癌处理规约进行命名的，从而导致在淋巴结分级分站及清扫手术规范方面带来了混乱。所以，本研究根据第14版日本《胃癌处理规约》对混乱的胃癌手术名称进行统一规范，在一定程度上解决了这一混乱。

3.2 安全性本研究通过采用Meta分析的方法，对国内外的9个关于D1和D2淋巴结清扫术对治疗胃癌的研究结果安全性进行定量分析，结果显示:与D1淋巴结清扫术相比较，D2淋巴结清扫术的术后总并发症发生率、围术期死亡率、术后胰瘘发生率、吻合口瘘发生率和创口感染率都较高。关于术后总并发症发生率、围术期死亡率、肺部并发症发病率和创口感染率D2淋巴结清扫术组高于D1淋巴结清扫术组，这可能与D2淋巴结清扫术组比D1淋巴结清扫术组的脾脏和胰体尾切除率高有关。但早期研究认为，胃癌根治术中脾切除可使脾门、脾动脉干淋巴结和周围组织暴露更清楚，清扫更彻底，这可以减少肿瘤复发和增加生存率〔20〕。而在1994年香港的研究〔6〕指出，当脾被切除后，会引起人体免疫系统的免疫力下降，从而使术后并发症发生率、围术期死亡率、肺部并发症发病率和创口感染率升高。在1996年英国的研究〔9〕指出，在D2淋巴结清扫术中由于清扫的范围较D1的广，所以更容易损伤到脾脏和胰腺。故有些病例在进行D2淋巴结清扫术时比D1更常合并有脾脏和/或胰体尾的切除。由此可见，D2淋巴结清扫术组的胰漏发生率会明显高于D1淋巴结清扫术组。

术后吻合口瘘发生率的Meta分析结果显示D2淋巴结清扫术组高于D1淋巴结清扫术组。Cuschieri等〔9〕的研究描述了吻合口瘘的产生主要有两大原因:①胰液瘘波及吻合口时，胰酶会破坏吻合口，使吻合口裂开形成吻合口瘘;②在吻合时结扎了血管使部分组织缺血坏死形成吻合口瘘。而本研究数据显示D2淋巴结清扫术组胰漏发生率高于D1淋巴结清扫术组，所以D2淋巴结清扫术组的吻合口瘘发生率会高于D1淋巴结清扫术组。

本研究对术后5年生存率和淋巴瘘的发生率进行了meta分析，结果都显示无统计学意义，且术后5年生存率还存在异质性(P=0.08)。无统计学意义可能是因为纳入的样本量较少引起的。而对于5年生存率的异质性可能与是否切除脾脏和(或)胰体尾有关。Wu等〔13〕的研究发现当把所有做了脾脏和(或)胰体尾切除的病例剔除，剩余的病例按淋巴结清扫术的类型分为D1组和D2组，两组比较5年生存率，结果显示D2组的5年生存率高于D1组60.8%(51.1～70.5)vs 53.8(44.3～63.3)。在Cuschieri等〔9〕也报道了类似的结论。所以，5年生存率可能与是否切除脾脏和/或胰体尾有关。而本研究纳入的RCT在胰体尾、脾脏切除率上参差不齐，故可能因此引起异质性。

但本研究将5年生存率分析纳入的研究分为欧洲国家组和亚洲国家组进行了关于5年生存率的亚组分析。结果显示欧洲组的D2淋巴结清扫术生存率与D1淋巴结清扫术生存率的比较无统计学意义。这可能是因为样本量少只纳入了3个RCT。而且不同研究的质量控制有差异，例如英国Cuschieri等〔9，10〕的研究是根据日本的标准进行手术，但他们在手术培训时是通过参加人员联合录制和编写的手术资料进行的;而荷兰Bonenkamp等〔6〕的研究术者则是经过音像资料、书面资料和专家来培训过的。有一个RCT(Bunt等〔17〕的研究)没有提到质量控制。基于外科手术曲线我们可以了解到当手术经验积累到一定程度时，能在一定程度上降低术后死亡和并发症等的发生，从而提高手术质量。通过上述3个研究质量控制的对比，本研究可以发现3个研究在质量控制上存在差异。所以，这就可能造成无统计学意义。

对于亚洲组，结果显示有统计学意义，但有异质性。这可能也与质量控制有关。因为收集的3个RCT的质量控制也有所不同，台北Wu等〔13〕的研究在实验前邀请日本的专家来对手术人员进行培训;另外两个研究则没有描述质量控制，而且在对胰体尾和脾脏切除的统计中我们发现香港的每例进行D2淋巴结清扫术的患者都进行了胰体尾和脾脏的切除，台湾的研究则只有11%左右。由此可见质量控制的差异所造成的手术质量上的差异可能是引起异质性的原因。

此外，本研究还对围术期死亡率进行了亚组分析。结果显示，总的死亡率欧洲组明显大于亚洲组。这也可能是由于亚洲组的手术质量高于欧洲组的原因。因为相对于欧洲，胃癌在亚洲的发病率要高，这就使得大多数亚洲的医生在做胃癌手术上的经验比大多数欧洲的医生要丰富。

综上所述，术后总并发症发生率、围术期死亡率、术后胰漏发生率、吻合口瘘发生率、创口感染率和五年生存率都可能与胰体尾、脾脏切除有关，还可能与手术质量控制有关。从本系统评价的结果看来，D1淋巴结清扫术比D2淋巴结清扫术安全。荷兰研究15年的随访结果显示D2淋巴结清扫术可以使患者生存受益，且D1组患者胃癌相关死亡率显著高于D2组。而D2组患者手术死亡率、手术并发症发生率和再手术率均显著高于D1组。由此可见，早期文献报道〔8〕D2淋巴结清扫术式在生存率方面并无优势可能是因为围术期D2组死亡率太高掩盖了其生存受益的效应量。而围术期的死亡率是可以通过留胰体尾和脾脏，加强护理等方法来减小的。因此保留脾脏和胰体尾的D2淋巴结清扫术应推荐为胃癌手术的标准术式。

3.3 纳入研究的局限性本研究共纳入15篇文献，9个RCT。其中只有2个RCT对隐藏分组做了具体的描述，而且所有的RCT中都没有使用盲法，这是由于外科手术本身的原因，外科手术很难对术者和患者做到盲法。此外，2个RCT〔15，17〕仅提到随机分组但并没有介绍随机的方法，文献质量较低。而另外7个 RCT〔5～14，16，18，19〕都描述了随机分配的方法、随访情况、暴露的措施和研究的设计等，质量相对较高。本系统评价研究过程中，纳入文献质量参差不齐，纳入研究的样本量偏小。且在分析 5 年生存率时纳入的 7 篇文献〔8，10，12，15，17～19〕存在异质性(P=0.08)采用随机即效应模型合并统计量后，得出D1淋巴结清扫术组和D2淋巴结清扫术组差异无统计学意义。而且在手术的质量控制上也存在差异，有的文章有明确的质量控制，而有的文章却没有提到，这就可能造成实施偏倚。综合以上因素可以看出在一定程度上降低了系统评价结果的可靠性。

1 Asoglu O，Matlim T，Kurt A，et al.Guidelines for extended lymphadenectomy in gastric cancer:a prospective comparative study〔J〕.Ann Surg Oncol，2012;20(1):218-25.

2 Dikken JL，van de Velde CJ，Coit DG，et al.Treatment of resectable gastric cancer〔J〕.Ther Adv Gastroenterol，2012;5(1):49-69.

3 Seevaratnam R，Bocicariu A，Cardoso R，et al.A meta-analysis of D1 versus D2 lymph node dissection〔J〕.Gastric Cancer，2011;5(1):60-9.

4 胡祥.第14版日本《胃癌处理规约》的重要变更〔J〕.中国实用外科杂志，2010;30(4):241-6.

5 Bonenkamp JJ，Songun I，Hermans J，et al.Randomised comparison of morbidity after D1 and D2 dissection for gastric cancer in 996 Dutch patients〔J〕.Lancet，1995;345(8952):745-8.

6 Bonenkamp JJ，Hermans J，Sasako M，et al.Extended lymph-node dissection for gastric cancer〔J〕.N Engl J Med，1999;340(12):908-14.

7 Hartgrink HH，van de Velde CJ，Putter H，et al.Extended lymph node dissection for gastric cancer:who may benefit?Final results of the randomized Dutch gastric cancer group trial〔J〕.J Clin Oncol，2004;22(11):2069-77.

8 Songun I，Putter H，Kranenbarg EM，et al.Surgical treatment of gastric cancer:15-year follow-up results of the randomised nationwide Dutch D1D2 trial〔J〕.Lancet Oncol，2010;11(5):439-49.

9 Cuschieri A，Fayers P，Fielding J，et al.Postoperative morbidity and mortality after D1 and D2 resections for gastric cancer:preliminary results of the MRC randomised controlled surgical trial.The Surgical Cooperative Group〔J〕.Lancet，1996;347(9007):995-9.

10 Cuschieri A，Weeden S，Fielding J，et al.Patient survival after D1 and D2 resections for gastric cancer:long-term results of the MRC randomized surgical trial.Surgical Co-operative Group〔J〕.Br J Cancer，1999;79(9-10):1522-30.

11 Degiuli M，Sasako M，Ponti A，et al.Survival results of a multicentre phase II study to evaluate D2 gastrectomy for gastric cancer〔J〕.Br J Cancer，2004;90(9):1727-32.

12 Wu CW，Hsiung CA，Lo SS，et al.Randomized clinical trial of morbidity after D1 and D3 surgery for gastric cancer〔J〕.Br J Surg，2004;91(3):283-7.

13 Wu CW，Hsiung CA，Lo SS，et al.Nodal dissection for patients with gastric cancer:a randomised controlled trial〔J〕.Lancet Oncol，2006;7(4):309-15.

14 Degiuli M，Sasako M，Ponti A.Morbidity and mortality in the Italian Gastric Cancer Study Group randomized clinical trial of D1 versus D2 resection for gastric cancer〔J〕.Br J Surg，2010;97(5):643-9.

15 李伟文，陈丽昆，黄河，等.胃癌D2式淋巴结清除术的临床研究〔J〕.中华肿瘤防治杂志，2007;14(24):3.

16 刘金炎，许国平，庄丹，等.胃癌D1和D2术式的疗效比较〔J〕.中国普外基础与临床杂志，2001;8(3):2.

17 Bunt AM，Hermans J，Smit VT，et al.Surgical/pathologic-stage migration confounds comparisons of gastric cancer survival rates between Japan and Western countries〔J〕.J Clin Oncol，1995;13(1):19-25.

18 Robertson CS，Chung SC，Woods SD，et al.A prospective randomized trial comparing R1 subtotal gastrectomy with R3 total gastrectomy for antral cancer〔J〕.Ann Surg，1994;220(2):176-82.

19 Dent DM，Madden MV，Price SK.Randomized comparison of R1 and R2 gastrectomy for gastric carcinoma〔J〕.Br J Surg，1988;75(2):110-2.

20 Wanebo HJ，Kennedy BJ，Winchester DP，et al.Role of splenectomy in gastric cancer surgery:adverse effect of elective splenectomy on longterm survival〔J〕.J Am Coll Surg，1997;185(2):177-84.