齐义军,朱亚飞,李恩民
食管癌(esophageal cancer,EC)是常见的消化道恶性肿瘤之一,在全球的发病率和死亡率分别位居第七位和第六位[1]。由于EC起病隐匿,大部分确诊的EC患者已发展至中晚期,因而治疗失败,复发和转移是EC患者死亡的主要原因之一[2-5]。组织学上,食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)和食管腺癌(esophageal adenocarcinoma,EAC)是EC的两种主要组织学类型,其中ESCC是目前中国和全球主要的组织学类型[6-7]。ESCC和EAC在流行病学、组织起源、病因学、分子生物学、治疗策略等方面均有不同变化,是两种不同类型的肿瘤。EC的形成、演进、浸润和转移是多分子参与、相互调控的复杂生物学过程,其中表观遗传学变异在该过程中发挥着重要作用。表观遗传学是指调控基因表达的DNA序列以外的因素,不涉及DNA序列改变,主要包括:组蛋白修饰、基因启动子区CpG岛的甲基化、miRNA甲基化、各种非编码RNA(miRNA、lncRNA和ceRNA)、调节DNA高级结构的蛋白质等。本文主要阐述EC转移过程中涉及的表观遗传学变异,为EC的筛查、诊断、预后评估及治疗策略提供参考。
DNA甲基化是指由DNA甲基转移酶(DNA methyltransfereses,DNMTs)催化,把S-腺苷甲硫氨酸(SAM)的甲基转移到胞嘧啶5位碳原子上,生成5-甲基胞嘧啶(5-mC)的过程[8]。哺乳动物DNA甲基化主要发生在CpG二核苷酸位点,同时CpNpG、CpA和CpT位点也可发生较低频率的甲基化[9]。肿瘤发生时全基因组呈低甲基化状态,导致染色质特别是重复序列的染色质不稳定性增加;癌基因多为不充分甲基化,导致重新开放或异常高表达。癌细胞在整体低甲基化水平下,一些管家基因和抑癌基因启动子却是过度甲基化,引起基因表达水平下降。
1.1 p16ink4A和p14ARF人类的p16ink4A和p14ARF是细胞周期调控蛋白编码基因,位于核基因组9p21.3位点,是两个在恶性肿瘤中常见的通过遗传或表观遗传学改变被灭活的肿瘤抑制基因。EC中约40%~61%的原发性肿瘤发生了p16ink4A基因甲基化,导致该基因表达缺失,p16ink4A基因纯合性缺失或突变而造成的p16ink4A基因表达缺失,较少发生于ESCC[10-12]。与此相反,p14ARF表达缺失主要是由于该基因的纯合性缺失导致的,p14ARF基因甲基化发生率约有13%~15%[10]。上述表明,在EC发病过程中,p16ink4A启动子甲基化是p16ink4A失活的主要机制。
1.2 钙黏蛋白1钙黏蛋白CDH1(Cadherin 1)属跨膜糖蛋白,是一种典型的肿瘤转移抑制蛋白,其编码基因位于核基因组16q22.1,参与维持正常组织细胞构筑,抑制肿瘤发生。CDH1失活可发生于肿瘤的各个阶段[13]。原发性ESCC中CDH1编码基因启动子区甲基化的发生率为41%~80%,与Ⅰ/Ⅱ期ESCC患者的预后不良相关[14-16]。同样,在多种恶性肿瘤中,其他的细胞黏附相关蛋白,如CDH11、CDH13、claudin 3和claudin 4,其编码基因也常常发生启动子区甲基化。在ESCC中,低密度脂蛋白受体相关蛋白1B(LRP1B)、原钙黏蛋白10(PCDH10)、原钙黏蛋白17(PCDH17)、肺癌相关肿瘤抑制因子1(TSLC1/CADM1)等肿瘤转移抑制蛋白,其编码基因的启动子区也常发生甲基化[17]。
1.3 O-6-甲基鸟嘌呤DNA甲基转移酶编码基因人类的O-6-甲基鸟嘌呤DNA甲基转移酶(O-6-methylguanine DNA methyltransferase,MGMT)的编码基因位于核基因组10q26.3。MGMT通过去除DNA分子中O-6-甲基/烷基鸟嘌呤的甲基/烷基,参与细胞DNA损伤修复,保护细胞免受烷基化剂的诱变[18]。约30%的人类癌症中发生MGMT编码基因启动子甲基化,导致该基因失活[19]。在ESCC中,MGMT编码基因启动子区的甲基化程度与肿瘤进展呈正相关[20]。值得注意的是,ESCC中MGMT编码基因启动子区甲基化与TP53基因突变或5,10亚甲基四氢叶酸还原酶(MTHFR)的C677T多态性相关,TopoⅡα的表达和MGMT的表达呈负相关[21-22]。提示表观遗传学和遗传学机制在ESCC中协同发挥作用。
1.4 DNA错配修复蛋白MLH1编码基因人类的DNA错配修复蛋白MLH1编码基因位于核基因组3p22.2。MLH1失活发生于多种人类癌症,失活的机制涉及遗传学和表观遗传学异常[23]。在ESCC中,MLH1编码基因启动子区甲基化的发生率约62%,最终导致MLH1蛋白表达水平降低[24]。在ESCC中,表观遗传学异常所导致的MLH1编码基因表达沉默,常常与基因组相关区域的微卫星不稳定性有关。此外,MLH2是人类另一个重要的DNA错配修复蛋白。在ESCC中,MLH2编码基因启动子区甲基化发生率约32%。不仅如此,MLH1多态性和MLH2多态性存在相互作用,共同增加了食管癌的发生风险,作用强于MLH1或MLH2单一分子的作用[25]。
1.5 脆性组氨酸三联体蛋白编码基因脆性组氨酸三联体蛋白FHIT(fragile histidine triad)编码基因位于核基因组3p14.2,其失活易引发DNA损伤[26]。有研究报道,在ESCC中FHIT编码基因启动子区甲基化发生率约69%,导致ESCC组织FHIT蛋白表达水平降低,而匹配的癌旁组织,该基因启动子区不发生甲基化[27]。由于FHIT表达水平降低发生于ESCC发生早期阶段,因此,FHIT编码基因启动子区异常甲基化可能会成为ESCC早期诊断和预后的分子标志物[28]。此外,尼古丁能诱发FHIT编码基因启动子区异常甲基化,表明FHIT基因启动子区异常甲基化可能是吸烟参与ESCC发生的机制之一[29]。
在外部环境诸因素的刺激之下,组蛋白会发生修饰改变,导致染色质结构变化,影响相关基因表达。发生修饰的组蛋白会提供一种分子识别标志,为其他相关功能蛋白的进一步结合导向。这些组蛋白修饰构成了组蛋白密码,是重要的表观遗传学标志。常见的组蛋白修饰包括乙酰化、甲基化、磷酸化、泛素化、糖基化、ADP核糖基化和羧基化等,是构成组蛋白密码的元素。同一组蛋白的不同修饰类型之间发生相互影响称顺式作用,不同组蛋白的修饰之间发生的相互影响称反式作用。目前,乙酰化和甲基化修饰是组蛋白最常见的修饰形式。组蛋白的乙酰化能够选择性地使染色质特定区域的结构变松散,利于基因转录、增强基因表达,而组蛋白的甲基化则可能增强或抑制基因表达。
在EC中,组蛋白修饰相关基因常发生序列突变的有KMT2C、KMT2D、KDM6A、CREBBP和EP300等。GASC1是组蛋白去甲基酶,GASC1相关基因,MDM2和NANOG高表达的ESCC患者预后不良[30]。WNT信号通路的分泌型配体WNT2编码基因增强子区甲基化程度增高,抑制EZH2与该区域结合,使EZH2介导的H3K27me3的表达量降低,对WNT2抑制作用减弱,导致Wnt/β-catenin/MMP等细胞信号通路活性增强,ESCC的侵袭转移能力增加[31]。
人类基因组,约30亿个碱基对,其中编码蛋白质的序列仅占基因组的1.5%,非编码DNA在人类的基因组中占绝大多数。在非编码DNA中,部分序列转录rRNA、tRNA、snRNA、snoRNA和miRNA等,与2万余个编码蛋白质的基因一起分散排列。目前,有观点认为,占人类基因组98.5%的非编码DNA决定了人类与其他物种的区别。人类基因组80%的DNA具有结合蛋白质的能力,且具有细胞特异性,提示这些非编码区域具有功能活性,可能参与相关基因的表达调控。因此,可以认为蛋白质是人类组织细胞的重要物质基础,但基因组的非编码序列决定了组织细胞的表型及功能特异性。人类基因组中非编码DNA序列可分为如下几类:结合转录因子的基因启动子区和增强子区、结合其他因子具有调控染色质结构的区域、非编码RNA(如lncRNA、miRNA和ceRNA)、转位子等可移动元件,以及端粒和中心粒等特殊区域。近年来研究表明,大多数人类疾病相关遗传变异位于基因组的非蛋白编码区域,提示在人类疾病的发生发展过程中,基因表达调控区的变异可能比蛋白编码区的变异发挥更重要作用。
3.1 miRNA
miRNA是一类单链、进化保守的非编码RNA,17~25个核苷酸,通过对基因表达的负性调控广泛参与细胞的各种生物学事件[32]。miRNA与相应的mRNA结合,阻断蛋白编码基因的翻译表达。目前已鉴定的miRNAs超过了9 500个,在细胞增殖分化和细胞周期的调控等方面发挥着重要作用。许多癌基因和抑癌基因的表达受miRNAs调控,miRNAs可能发挥肿瘤抑制基因或癌基因的功能,参与肿瘤的发生发展[33]。
癌细胞的运动能力是癌细胞侵入血管和扩散到周围组织器官的前提条件。在癌细胞的侵袭转移过程中,EMT是其早期表型。在ESCC中,miR-9、miR-25和miR-92a表达增高,通过抑制CDH1表达,促进癌细胞侵袭转移[34-36]。有研究表明miR-200a、miR-21促进ESCC细胞增殖、迁移和侵袭[37]。miRNA-10b促进细胞周期的进展,抑制细胞凋亡,促进EC细胞的迁移和侵袭,其机制可能与TGF-β的上调和PTEN的下调有关[38]。与此相反,miR-205和miR-200家族在ESCC中低表达,使对ZEB表达抑制能力降低,诱导EMT,促进ESCC侵袭转移[39]。有研究报道,miR-21和miR-183通过靶向PDCD4促进ESCC细胞生长和侵袭[40]。Ohta等报道,在16个ESCC细胞系中,GNG7的mRNA和miR-328的表达呈显著负相关关系,提示miR-328可能通过抑制GNG7,导致ESCC细胞的侵袭能力增强[41]。有研究表明,miR-21在ESCC组织和细胞系中表达增加,miR-21的敲除显著增加PTEN蛋白的表达,降低ESCC细胞的增殖、侵袭和迁移能力[42]。Tian等发现ESCC细胞中miR-10b过表达显著抑制内源性KLF4蛋白的功能,使ESCC细胞迁移侵袭能力增加[43]。Rong H等发现过表达LINC-PINT可以抑制人ESCC细胞中miRNA-21的表达,而过表达miR-21不会改变LINC-PINT的表达。因此,LINC-PINT的下调可能通过与miRNA-21相互作用参与了ESCC的复发[44]。另一项多因素分析显示,miR-1304是影响EC患者预后的独立因素,并且miR-1304可作为EC诊断、复发和生存的潜在分子标志物[45]。
一些miRNAs通过抑制靶基因/蛋白表达,抑制ESCC细胞侵袭。如在ESCC组织细胞中,miR-100对mTOR、miR-625对Sox2、miR-326对VEGF-C、miR-133a对Fascin和基质金属蛋白酶14、miR-195对Cdc42等,前者miRNAs通过抑制后者靶基因/蛋白表达,最终抑制ESCC细胞侵袭[46]。
在ESCC组织中,miR-203表达下调,失去了对靶蛋白LASP1表达的抑制作用,进而促进ESCC细胞侵袭[47]。miR-203高表达通过靶向小G蛋白RAN,诱导ESCC细胞凋亡,抑制ESCC细胞生长、迁移和侵袭[48]。在ESCC中,检测miR-21、miR-25、miR-27b、miR-100、miR-126、miR-143和miR-145表达具有预后预警意义。miR-550a-1、miR-7705、miR-935、miR-4326、miR-5010、miR-589和miR-3199-2可能与EC的肿瘤进展和复发相关[49]。
外周血miRNA标志物的鉴定对于ESCC的早期检测和预后预警具有重要的临床意义。有研究表明,ESCC患者血浆miR-19b和miR-25的水平明显高于健康对照组;术后ESCC患者血浆miR-25的水平,与术前相比,显著降低;ESCC复发患者外周血miR-25的水平显著增高[50]。另有研究表明:①ESCC患者血清miR-1246明显增高,有可能成为ESCC早期诊断的分子标志物[51];②与健康对照相比,ESCC患者血浆miR-18a、miR-21和miR-375的浓度明显增高,而术后ESCC患者血浆中这些miRNAs的浓度显著降低[52];③ESCC患者血清中miR-200c的浓度明显高于健康对照组,高表达miR-200c与ESCC化疗抵抗显著相关[53];④外周血miR-331-3p高表达与EAC高复发风险相关[54]。然而,在外周血中寻找ESCC miRNA生物标志物尚处于初步阶段,有待今后进一步研究探索。
除血浆miRNA,有关外泌体miRNA也成为近年来的研究热点。有报道,ESCC患者外泌体miR-21水平高于对照组,外泌体中miR-21水平与ESCC的肿瘤分期、淋巴结转移,以及远处转移呈正相关[55]。
3.2 长链非编码RNA
在哺乳动物基因组序列中,大约4%~9%的序列产生的转录本是长链非编码RNA(long noncoding RNA,lncRNA)。lncRNA为长度超过200个核苷酸的非编码RNA转录本,广泛参与了诸如X染色体沉默、基因组印记、染色质结构重塑、基因转录激活、基因转录干扰、靶蛋白核内运输等重要生物学过程。lncRNA分子内部拥有特定而复杂的二级结构,能提供与相关蛋白质分子的结合位点,或通过与DNA或RNA碱基互补配对发生特异性相互作用,共同构成由lncRNA参与的复杂精妙的基因表达调控网络。
目前已鉴定的与食管发生发展相关的lncRNA有HOTAIR、MALAT1、POU3F3、POU6F2-AS2、AFAP1-AS1、HNF1A-AS1、TP73-AS1、SPRY4-IT1和ESCCAL1等。HOTAIR高表达能够影响染色质的结构,影响多个基因的表达,增强癌细胞的侵袭转移和抗凋亡的能力,同时HOTAIR高表达提示ESCC患者预后不良,靶向沉默ESCC细胞中HOXA11-AS表达能够抑制癌细胞的增殖和迁移能力[56]。在ESCC中,高表达的MALAT1能明显增加癌细胞的增殖、迁移和侵袭能力。拥有肿瘤抑制功能的miR-101和miR-217,通过转录后调控抑制MALAT的表达,高表达miR-101和miR-217能降低MALAT1诱导的ESCC细胞的增殖和迁移能力。与此同时,沉默MALAT1后,P21和P27表达上调、B-MYB表达下调,使细胞阻滞于G2/M期,抑制癌细胞的增殖[57]。lncRNA/POU6F2-AS2特异性表达于ESCC中,参与DNA损伤修复。长链非编码RNA/POU3F3,在ESCC中表达显著上调,增加癌细胞的增殖能力、集落形成能力和致瘤性。分子机制研究结果表明,POU3F3通过与EZH2编码基因的增强子序列结合,促进癌细胞恶性进展[58]。另有研究表明,SPR64-IT1、CCAT2和PCAT-1亦高表达于ESCC,与ESCC的临床病理分期正相关,与ESCC患者生存期负相关[59-61]。与此相反,LOC285194在ESCC中低表达,与ESCC的放化疗抵抗和不良预后相关[62]。LINC00857和MIR22HG高表达于EAC,LINC00857沉默后能够诱导腺癌细胞迁移和转移能力降低,该过程涉及MET、STAT3、c-Myc、p-CREB等多个信号通路蛋白分子表达降低[63-64]。在血浆/血清中,可检测lncRNA作为非侵入性生物标志物,用于癌症的早期诊断和预后预警。在ESCC患者的血浆中,POU3F3、HNF1A-AS1和SPRY4-IT1的水平显著上调。在此3种lncRNA分子中,相比较而言,检测POU3F3血清水平诊断ESCC的准确性更高[65]。
EC的复发转移是一个涉及多分子、多步骤的极其复杂的生物学过程,表观遗传变异是该过程的关键驱动因素之一。相对于稳定的基因组和基因变异而言,表观遗传学变化在一定条件下可以逆转,鉴定和开发逆转肿瘤相关表观遗传学变异分子及通路,可为EC治疗提供新的思路和策略。