薛剑超,王亚东,李博文,刘新宇,梁乃新*,李单青
1.中国医学科学院 北京协和医学院 北京协和医院 胸外科,北京 100730;2.北京协和医学院 临床医学八年制 2016级, 北京 100730
随着全世界的人口增长和老龄化,肺癌(lung cancer)的发病率和病死率在全球范围内快速增长。2020年报道全球范围内新发肺癌病例约220万例,死亡病例达180万,占总恶性肿瘤诊断病例的11.4%和其总死亡的18.0%[1]。国家癌症中心最新公布的数据显示,2016年中国新发肺癌病例82.8万,病死病例65.7万,是中国人群发病率和病死率最高的恶性肿瘤[2]。ⅠA~ⅢA期非小细胞肺癌患者即使接受根治性手术切除,仍有很高的复发和死亡风险,5年生存率从ⅠA1期90%骤降至ⅢA期41%。即使TNM同分期的患者之间,5年生存率也存在很大差异,现有的分期系统不足以预测个体患者的治疗结果和预后。因此,寻找能够对肺癌患者进行复发风险评估的预后标志物,对不同风险的患者采取个性化治疗,将有助于提高肺癌患者的生存率。在过去的20年中,越来越多的DNA甲基化改变在肺癌中被报道。
DNA甲基化在肺癌的发生发展过程中扮演着重要的角色,其性质稳定且易于检测,在肺癌的预后预测中有巨大潜力。本文就DNA甲基化在肺癌发生及预后方面的相关进展进行总结。
DNA甲基化是人类认识最早、研究最多的表观遗传学改变,是指由DNA甲基转移酶(DNA methyltransferases,DNMTs)以S-腺苷甲硫氨酸(S-adenosyl methionine,SAM)作为甲基供体,与CpG二核苷酸中5′端胞嘧啶以共价键结合。经甲基化修饰后5′端胞嘧啶在离体状态表现出更强的惰性;在活体状态则表现为基因表达活性降低。DNMTs主要分为两个家族,DNMT1家族在DNA复制和修复中维持其甲基化;而DNMT3家族则催化CpG从头甲基化(denovomethylation)[3-4]。
肺癌的发生是一系列的基因组和表观遗传组改变的累积,如抑癌基因的沉默、原癌基因的激活和管家基因的功能异常。表观遗传组改变通常表现为全基因组的DNA低甲基化和特定基因的DNA高甲基化。一般情况下,原癌基因处于抑制状态,DNA低甲基化可促使这些原癌基因及其转录因子发生活化,导致基因组的不稳定性和染色体的结构改变,同时基因组中正常沉默区域的转录激活可能导致插入的病毒基因和正常沉默基因(如印记基因和不活跃的X染色体上的基因)的表达,最后导致肺癌的发生。同时,抑癌基因的启动子区域会出现异常的高甲基化,导致这部分抑癌基因沉默,使肺癌发生的概率大大增加。
从正常肺组织到原位癌和侵袭性肺癌的过程中,涉及多种基因启动子甲基化的频率和水平增加,如p16、DAPK、MGMT和RASSF1A等。基因p16负责编码p16INK4a和p14arf,p16INK4a是一种细胞周期蛋白依赖性激酶抑制剂,在G1/S期细胞周期停滞中起关键作用。RASSF1A是一个重要的抑癌基因,通过Ras信号通路参与肿瘤的发生。RASSF1A启动子的高甲基化通过HOXB3介导DNMT3b表达,导致RASSF1A基因沉默。Wnt通路相关拮抗基因APC、Dkk1、DKK3、LKB1、WIF1、RUNX3
表1 常见基因的DNA甲基化及其在肺癌发生发展中的作用
NSCLC.非小细胞肺癌; SCLC.小细胞肺癌.和SFRP1/2/4/5通过DNA高甲基化被沉默,从而促进Wnt信号通路的功能,导致肿瘤的发生,APC甲基化发生率在非小细胞肺癌中高达94%,而在正常组织对照组中为20%。TGFBR2是上皮细胞增殖的主要抑制因子,它的异常甲基化与非小细胞肺癌中TGFBR2在转录水平的表达下调有关。启动子高甲基化是FHIT表达缺失的主要机制,在癌前病变中即可检测到,FHIT缺失促进肺癌细胞获得过度增殖、抗凋亡、侵袭性和上皮细胞-间充质转化(epithelial-mesenchymal transition,EMT)等表型[5-6]。
肺癌相关基因调控区域的低甲基化可导致其转录活性增加,从而促进肿瘤的发生[7]。70%-85%的非小细胞肺癌中发现MAGE的异常激活,这一现象与低甲基化有关,MAGE的过表达与肺癌的发生和转移有关,是预后不良的危险因素。编码γ-突触核蛋白的SNCG的低甲基化与肺癌的进展和转移相关。在 NSCLC 中GPC5的低甲基化程度比正常肺组织明显增高,导致表达激活,促进肺癌细胞的增殖迁移,与不良的预后相关[6]。
在肺癌的发生过程中,低甲基化和高甲基化途径之间存在相互作用。DNA低甲基化可能是正常细胞的一种表观遗传修复,试图代偿与肿瘤抑制基因或靶基因启动子的CpG岛的异常甲基化。但是相较于传统的DNA修复途径,这种表观遗传修复途径并不精准有效,可能除修复异常甲基化的CpG岛外,还会对更多的DNA序列进行去甲基化。DNA低甲基化发生在肺癌的早期,随后导致高甲基化的发生,这可能是基因组低甲基化导致的一种代偿性的高甲基化[8-9]。
目前临床主要根据肺癌的病理亚型、淋巴结侵犯和转移等来粗略判断患者的预后,但因缺乏特异性,即使是相同分期的患者预后差异也较大,预测效力差。其他方式如PET/CT的标准摄取值(standard uptake value,SUV)等也被证明是肺癌预后的独立风险因素,但其价格高昂、对患者有辐射损伤,无法多次、长期预测。分子标志物可以提供病理分期之外的预后预测信息,已有许多研究对非小细胞肺癌预后预测因子进行探索:1)DNA层面:已有数种基于多基因组合的预测标志物,可以区分不同肺癌患者组的复发风险。血液中循环肿瘤细胞DNA(circulating tumor DNA,ctDNA)的检出与复发相关。2)RNA层面:MicroRNA(miRNA)通过靶向作用于癌基因或肿瘤抑制基因,参与调节肿瘤的增殖、侵袭和转移过程,miRNA多个位点改变与患者术后复发及总生存率相关。3)蛋白质层面:CHRNA蛋白阳性表达与患者更短的中位无复发生存期(recurrence-free survival, RFS)和总生存期(overall survival, OS)相关。神经加压素受体符合物具有促进NSCLC细胞增殖和迁移的能力,与更差的预后相关。尽管有大量涉及NSCLC预后预测因子的研究,但其预测价值和临床转化潜力仍存在较大争议,真正走向应用仍需更全面的验证。
DNA甲基化稳定且易于在组织或体液中检测,并且随着高通量的表观遗传学筛选及检测技术的发展,DNA甲基化改变作为肺癌预后的分子标志物有着巨大的潜力。既往多项研究发现肺癌组织中许多抑癌基因的异常甲基化与较差的预后有关:在对163例受试者(包括30例Ⅰ期,29期Ⅱ期,26期Ⅲ期和68例Ⅳ期肺癌患者)血浆中异常甲基化的SHOX2水平进行检测,发现肺癌大小与血浆mSHOX2水平之间存在线性关系。根据治疗反应将患者分为部分缓解(partial response, PR)组和疾病稳定(stable disease, SD)组后,发现mSHOX2水平的变化是治疗是否有效的敏感标志物。通过对31位患者进行871 d的随访后,发现治疗前mSHOX2水平低的患者比治疗前mSHOX2高的患者具有更好的生存率水平,表明治疗前血浆mSHOX2水平是患者长期生存的预测因素[10]。转化生长因子β诱导蛋白(TGFB1)是一种分泌的细胞外基质成分,在肿瘤生长和转移中起着至关重要的作用。通过检测138例NSCLC患者的肿瘤组织中转化生长因-β-诱导蛋白(TGFBI)基因启动子区域的甲基化状态,发现在淋巴结转移患者的TGFBI甲基化频率高于无转移患者,其发生率具有临床意义,同时在肺腺癌患者中,TGFBI甲基化与较差的OS显著相关[11]。在Ⅰ期肺癌患者中,跨膜蛋白酶丝氨酸4(TMPRSS4)基因启动子低甲基化引起的蛋白高表达,与更差的预后显著相关[12]。TMPRSS4在实体瘤中(包括肺癌)被高度上调,促进癌细胞的增殖和转移扩散。TMPRSS4是NSCLC的独立预后标志物,尤其是在非常早期的阶段就可以显着区分高复发风险的患者。研究者们发现,在107例非小细胞肺癌患者中,与正常组织配对的肺癌组织相比,肺癌组织中FBP1启动子的甲基化率显著较高,同时高分化的肿瘤的FBP1甲基化水平在统计学上显著较低;肺癌组织中FBP1的甲基化程度较低与肺癌患者的总体生存期有关,FBP1启动子的甲基化水平有可能作为新的预后指标[13];在一项对155例肺癌患者和50例非肿瘤患者的研究中,发现TMEM196高甲基化患者的生存率明显低于肺癌基因组图谱中低水平患者,多变量模型显示TMEM196甲基化是肺癌的独立预后指标[14];在对142例接受免疫治疗的患者的回顾性研究中,发现FOXP1基因的甲基化状态与患者是否能通过PD-1抑制剂治疗得到临床获益相关,FOXP1基因甲基化有巨大的预后预测价值,但仍需要通过前瞻性的研究来确定[15];通过对13项研究共1 056例患者进行的Meta分析显示,肺癌组织的hMLH1甲基化率与正常肺组织相比明显较高。晚期阶段的hMLH1基因甲基化水平较高,具有hMLH1基因甲基化的NSCLC患者预后较差[16]。
随着高通量测序技术的发展,越来越多的研究通过组合不同位点基因的甲基化,提高DNA甲基化预测肺癌预后的效能。使用高通量450 k芯片DNA甲基化分析,检测了444例非小细胞肺癌患者组织及25例癌旁组织的甲基化水平,发现5个基因(包括HIST1H4F、NPBWR1、PCDHGB6、ALX1和HOXA9)的高甲基化与Ⅰ期非小细胞肺癌无复发生存期缩短显著相关,因此完善了预后评估[17]。在对51例接受根治性切除但在40个月内复发的Ⅰ期NSCLC患者与116例接受根治性切除且40个月内无复发的患者进行差异性分析,发现Ⅰ期NSCLC患者中4个基因(p16、CDH13、APC和RASSF1A)启动子区甲基化与早期复发相关[18]。
此外,有多项研究基于对公共肿瘤数据库的挖掘分析,筛选出不同的甲基化位点组合,进一步完善肺癌患者的预后预测。以TCGA数据库中370份肺鳞癌和42份健康DNA为样本,发现低甲基化和高表达水平为特征的PMPCAP1和SOWAHC与肺鳞癌患者的预后不良有关,而以高甲基化和低表达水平为特征的ZNF454与较好的预后相关[19]。基于对475例肺腺癌组织及32例癌旁组织进行的差异甲基化分析,构建的以CCDC181、PLAU、S1PR1、ELF3和KLHDC9的5个基因甲基化水平的风向预测模型,可将患者分为高风险组和低风险组[20]。通过GEO数据库分析特发性纤维化与肺癌的差异表达基因,发现高补体蛋白C1q基因是特发性纤维化与肺癌的共驱基因,C1q的低甲基化水平与肺癌患者的不良预后相关[21]。使用LASSO Cox回归模型对TCGA数据库中446例非小细胞肺癌患者进行分析,筛选出16个CpG位点与患者预后显著相关,该模型的ROC>0.7,预测效力较强[22]。在TCGA和GEO数据库中,采用机器学习算法筛选出4个预测复发风险的甲基化位点(cg0.0253681/ART4、cg0.0111503/KCNK9、cg0.27156.29/FAM83A、cg0.3282991/C6orf10),构建预测NSCLC患者无复发生存和预后的风险评分模型,并进一步探讨DNA甲基化与免疫治疗相关反应性的关系[23]。
近20多年来,表观遗传学领域的研究蓬勃发展。表观遗传改变在肺癌发生和发展中的作用的了解已经逐步加深。尽管有许多学者投入研究并发表了约14 000篇论文,但最后具有临床转化价值的生物标志物却寥寥无几[24]。迄今仍有许多问题亟待解决:如DNA甲基化的检测方法众多,但均存在局限性,难以在临床工作中普及;绝大多数研究均为回顾性分析,发现的甲基化位点尚缺乏前瞻性的临床验证。但是,随着高通量技术的高速发展,越来越多的组织DNA甲基化标志物被发现且应用于肺癌患者的预后预测之中。同时,随着液体活检技术的兴起,无创性监测肺癌患者DNA甲基化标志物的动态变化成为可能。DNA甲基化有望在将来成为NSCLC预后预测的有效工具。