汪显坤 林欣娅 胡雪峰
(福建师范大学生命科学学院 福州 350108)
2002年,日本科学家Okazaki在对小鼠cDNA文库大规模测序时第一次发现了一类较长的转录产物,并将其命名为长链非编码RNA(Long non-coding RNA, lncRNA)[1]。lncRNA是一类长度为200~10 000 nt之间的非编码RNA。研究表明,人类许多疾病的发生都涉及到lncRNA的过度表达、缺失或突变;另一方面,lncRNA能在X染色体失活、染色质修饰、干细胞定向分化以及转录沉默、激活等重要生物学过程中施加影响。
1.1 lncRNA的种类 根据与编码蛋白基因的位置关系,lncRNA分为以下几种: ①反义lncRNA(antisense lncRNA),由编码蛋白基因的反义链(模板链)转录而成;②正义lncRNA(sense lncRNA),由编码蛋白基因的正义链(非编码链)转录而成;③内含子lncRNA(intronic lncRNA),完全由基因的内含子区域编码而成;④基因区间lncRNA(large intergenic noncoding RNA, lincRNA),由两个基因之间的区域编码而成,因此不与编码基因的内含子和外显子相重叠;⑤反义上游lncRNA(antisense ustream lncRNA),其序列位于反义链上游,编码基因的启动子为双向启动子,采用与编码基因转录的反方向进行转录,因而与编码基因头对头相邻;⑥增强lncRNA(enhancer lncRNA),由基因的增强子转录而成的,可以促进基因转录[2]。
1.2 lncRNA的产生方式 lncRNA有以下产生方式: ①编码基因的发生框插入一段序列,进而破坏原有的编码功能,转录成一个与先前编码序列合并的lncRNA;②染色质在发生重排后,两个不转录并且间隔距离很远的序列区合并到了一起,产生了一个含多个外显子的lncRNA;③在两次连续的重复时间内,ncRNA内部产生相邻的重复序列以增加ncRNA的核酸数,从而产生lncRNA;④通过转座因子的自由插入产生一个有功能的lncRNA;⑤非编码基因通过反转录转座作用复制,产生一个有功能的非编码逆转录基因,或产生一个无功能的逆转录基因。
1.3 lncRNA的结构和功能特点 在人类基因组中约有70%的基因被转录成RNA,但只有2%左右的RNA编码蛋白质的合成。与mRNA相同,lncRNA也是由对应的基因转录而成,具有5′帽子、poly(A)尾巴和启动子结构,通过前体的适当剪接,便可形成成熟体的lncRNA;同一基因可以形成不同的转录本的lncRNA。然而,与miRNA相比lncRNA具有相对较长的核苷酸链,在发挥作用时既可以与DNA杂交来调控基因的表达,也可与mRNA结合来调控转录;更重要的是,它能够通过空间的盘曲,折叠成许多特定而复杂的二级结构,这些独特的空间结构能够提供分子结合位点,从而使其可以行使特定的生物学功能。
2.1 lncRNA与癌症 主要介绍lncRNA与肝癌、肺癌、胃癌和乳腺癌之间的关系。
2.1.1 肝癌 肝癌是常见的癌症,具有转移发生率高以及术后复发率高的特点。lncRNA具有与微小RNA(micro RNA, miRNA)竞争性结合、从而使mRNA正常表达的功能。miRNA是一类序列小于200 nt的非编码RNA,可以与靶mRNA通过碱基互补配对结合,从而抑制mRNA的表达[3]。在肝癌的研究中发现,名为miR-372的mRNA与cAMP依赖蛋白激酶(PRKACB)的mRNA 3’非编码区有相同靶点,从而抑制PRKACB基因的表达。肝癌高表达转录本(HULC)在肺癌组织中高水平表达,而lncRNA-HULC作为一种内源性的“海绵”可以竞争性地抑制miR-372的活性,进而上调靶基因PRKACB的表达,诱导磷腺苷效应原件结合蛋白(CREB)的磷酸化。磷酸化的CREB会结合到HULC基因的近端启动子区域,促进RNA聚合酶Ⅱ与染色质的结合,进而激活致癌基因HCLU的转录[4]。这是一种正反馈的调节机制。根据以上的调节机制,lncRNA-HULC可以作为早期肝癌预测与诊断的标志物。
在研究间充质干细胞(mesenchymal stem cells, MSC)对肝癌发生的作用时,发现一些lncRNA异常表达,并鉴定出一种在肝癌组织中高表达、名为lncRNA-MUF的、新的lncRNA。研究表明lncRNA-MUF可以结合膜联蛋白A2(annexin A2, ANXA2),进而激活Wnt/β-连环蛋白信号通路(Wnt/β-catenin)和上皮间充质转化(epithelial-mesenchymal transition, EMT),而EMT可以减少肿瘤细胞的凋亡与衰老,增强耐药性[5]。同样lncRNA-MUF也可以作为miR-34a的竞争性内源RNA,导致转录因子Snail1上调和EMT活化。
2.1.2 肺癌 肺癌主要分为非小细胞肺癌(non-small cell lung cancer, NSCLC)和小细胞肺癌(small cell lung cancer, SCLC),其中,NSCLC的发病率占总数的85%。在NSCLC中,lncRNA-MEG3(maternally expressed gene 3)通过多条信号通路发挥作用: 在p53通路中,p53抑癌基因是MEG3的下游靶点,MEG3与癌基因(murine double minute2, MDM2)作用,阻碍MDM2对p53蛋白的泛素化降解,从而活化p53,抑制癌细胞生长;在Rb通路中,Rb的活化可以下调DNA甲基转移酶1(DNA methyltransferase 1, Dnmt1)的表达,降低MEG3基因及其附近DNA的甲基化水平使MEG3高表达,从而抑制癌细胞的增殖[6]、调节血管内皮生长因子(vascular endothelial growth factor, VEGF)和跨膜受体蛋白(Notch)的信号通路。
lncRNA会影响前体mRNA(pre-mRNA)的可变剪接。研究表明,肺腺癌转移相关转录本1(metastasis associated lung adenocarcinoma transcript 1, MALAT1)是一条长度为8 708 nt的lncRNA,它与癌症的发生和发展有着密切的关系。研究发现,MALAT1能够招募丝氨酸/精氨酸结合SR(serine/argine)蛋白剪接因子,通过控制SR蛋白的富集方式,调节其在细胞核内的分布和活性,从而影响一些pre-mRNA的可变剪接。近年来,不断有新的lncRNA被发现并被证实与肺癌的发生与迁移有着重要的关系。例如,李雪萍等[7]发现lncRNA-LOC90024与肺癌的发生密切相关,当过表达LOC90024时,可显著促进肺癌细胞生长和迁移。因此,lncRNA-LOC90024可能作为癌基因发挥作用,有望提供新的治疗靶点。
2.1.3 胃癌 我国胃癌的发病率和死亡率高居世界第二。lncRNA-H19可促进细胞增殖。例如,在人胃腺癌AGS细胞系中上调H19基因后,癌细胞增殖明显增加,而沉默H19基因后,癌细胞呈现持续凋亡的状态。其调节机制涉及H19/ISM1和miR-675/CALNI两条通路,当过表达H19基因时,一方面使ISM1上调,呈正相关,另一方面通过miR-675抑制CALN1的表达,促进癌细胞的增殖与转移[8]。除了通过多条信号通路来调节之外,也可通过lncRNA与靶mRNA结合来调节。胃癌高表达转录本1(gastric carcinoma proliferation enhancing transcript 1, GHET1)是与胃癌发生、发展、迁移密切相关的lncRNA。GHET1与胰岛素样生长因子mRNA结合蛋白1(insulin-like growth factor 2 mRNA binding protein 1, IGF2BP1)结合,IGF2BP1再作用于癌基因c-Myc mRNA,使c-Myc mRNA维持稳定并提高表达水平[9]。而c-Myc的表达产物使细胞无限增殖,并且可调节细胞的恶性转化,是早期发现的一种重要的癌基因。
2.1.4 乳腺癌 乳腺癌是女性最常见的恶性肿瘤之一,发病率和死亡率都高居女性癌症的首位,严重影响女性的健康生活。lncRNA调控着乳腺癌的发生和转移。人们对生长阻滞特异转录本5(GAS5)研究最为深入,在乳腺癌中,GAS5基因是Notch-1信号传导通路中的下游靶点。研究表明,当干扰Notch-1时,乳腺癌细胞中的GAS5基因的转录水平可显著提高,从而诱导癌细胞的凋亡和生长阻滞[10],GAS5和miR-21还存在着相互抑制、双向调控的机制,以促进癌细胞的生长[11]。GAS5可靶向糖皮质激素受体(GR)的DNA结合区,阻碍受体和下游蛋白的表达,影响细胞的增殖和代谢。基于以上机制,GAS5可作为手术预后评估的重要标志物。除此之外,lncRNA ANRIL的基因在肺癌、肝癌、乳腺癌等恶性肿瘤的组织中也高水平表达,充当原癌基因的作用。在乳腺癌细胞系MCF7细胞的研究中发现,ANRIL可能通过与PRC2的核心亚基——多梳蛋白SUZ12相互作用,介导组蛋白的甲基化,沉默p15基因的转录,当ANRIL基因沉默时,干扰SUZ12与p15的结合,从而促进p15的表达,并进一步促进乳腺癌细胞的增殖和侵袭[12]。ANRIL还可通过相同的机制来沉默p53基因。
2.2 lncRNA与心血管疾病 心血管疾病常常伴有心肌增厚、心力衰竭、心肌梗死等症状,而lncRNA与心肌细胞的分化密切关系,因此也在疾病的发生中发挥着重要的作用。研究发现,在血管紧张素(AngII)诱导的人心肌增厚的模型中,心肌增厚相关因子(cardiac hypertrophy related factor, CHRF)高水平表达,lncRNA-CHRF干扰miR-487,抑制其与髓样分化因子88(Myd88)的结合,而Myd88介导下游转录因子NF-kB[13],参与心肌增厚的信号传导,结果导致心肌细胞的肥大。
Greco等[14]在对照非终末期心力衰竭病人与健康组成人的左心室心肌细胞时,发现有9种lncRNA(CDKN2B-AS1/ANRIL、 EGOT、 H19、 HOTAIR、 LOC285194/TUSC7、 RMRP、 RNY5、 SOX2-OT和SRA1)在非终末期的调节水平与终末期一致,且都表达下调。另外,在心血管疾病中,心肌梗死因为部分心肌细胞的急性缺血而对患者造成严重的威胁。Zangrando等[15]曾发现并命名了心肌梗死相关转录物lncRNA-MIRT。他利用原位杂交技术,基因间lncRNA-MIRT被定位在心肌梗死模型鼠的左心室,并且MIRT1和MIRT2的表达水平的分别提高了5倍和13倍。进一步研究发现,MIRT的剂量与射血分数正相关,而与梗死面积负相关。
2.3 lncRNA与神经退行性疾病 lncRNA可调控神经干细胞(neural stem cell, NSCs)的定向分化。NSCs具有可分化成神经元、少突胶质细胞和星形胶质细胞的潜能,而一些lncRNA在中枢神经系统的表达具有细胞和组织的特异性。研究发现,Dlx5/6基因间的增强子转录形成3.8 kb的lncRNA Evf-2,通过与Dlx-2结合并使后者活化,招募CpG甲基结合蛋白2(methyl CpG binding protein 2, MECP2)、DLX等转录因子与Dlx5/6基因结合,提高Dlx5/6的表达,是促进NSCs向γ-氨基丁酸神经元分化的关键因子[16]。研究还发现,lncRNA-RMST、 lncRNA-N1、 lncRNA-N2和lncRNA-N3能通过结合表观沉默蛋白SUZ12和神经元限制性沉默因子(neuron-restrictive silencer factor, NRSF),激活下游通路而促进NSCs向神经元分化,为研究NSCs定向诱导成多巴胺能神经元、并用以治疗帕金森病提供了理论依据。
阿尔兹海默病(Alzheimer’s disease, AD)是严重影响生活质量、且发病率较高的神经退行性疾病。其发病的机制之一是β分泌酶1(β-site of APP cleaving enzyme 1, BACE1)能够使淀粉样蛋白前体(amyloid precursor protein, APP)断裂而产生突触毒性物质Aβ,Aβ42大量累积形成大脑皮质老年斑。而BACE1的反义转录物BACE1-AS可以缓解这一过程,这是明显的反馈—应激的机制。Liu等人[17]利用siRNA技术沉默了AD老年斑lncRNA BACE1-AS的表达,结果表明BACE1的异常剪切APP的能力明显下降,Aβ42的生成量也随之减少。由此推测,lncRNA BACE1-AS可能是形成Aβ的关键因子。
2.4 lncRNA与自身免疫疾病 自身免疫疾病常包括系统性红斑狼疮(systemic lupus erythematosus, SLE)、类风湿性关节炎(rheumatoid arthritis, RA)、I-型糖尿病(type 1 diabetes mellitus, T1DM)、银屑病(psoriasis)等,这些疾病的致病机理大致相同,而SLE、 RA等常伴随着慢性的关节炎症反应。SLE是一类先天性免疫和获得性免疫共同调控的复杂免疫疾病。lncRNA-Gas5可能通过竞争性结合GR而阻断GR下游信号的转导[10],当GAS5表达量提高时,则会削弱糖皮质激素对SLE患者的治疗。lncRNA-NFAT1在SLE患者外周血的单核细胞中浓度较高,这主要与炎症反应密切相关。Zhang等[18]的研究发现,NFAT1的表达可激活p38/MAPK通路,从而导致白介素-6(IL-6)、趋化因子-10(CXCL-10)等炎症因子的大量聚集。
RA的临床表现主要为手足等关节的僵硬、畸形,异常表达的lncRNA主要存在于RA患者的外周血和关节滑液中。Song等[19]利用微矩阵技术,发现至少有Hotair、 LUST和MEG9等七种lncRNA在RA患者体的内表达上调。同时高剂量的Hotair活化巨噬细胞,低剂量的Hotair却激活MMP-2、 MMP-3等基质蛋白酶,lncRNA可能作为有效诊断RA的标志物。在小鼠胰腺癌细胞(MIN6)中表达大量的lncRNAs,这些lncRNA被定位在胰岛,并且在非肥胖型糖尿病小鼠(NOD)的患病前期高水平表达。其中的lncRNA-3和lncRNA-4能够跟肿瘤坏死因子-α(TNF-α)和白介素-61β(IL-1β)等炎症因子共同调节胰岛细胞的凋亡[20]。
lncRNA在发挥其功能的过程中,与各种疾病的发生与迁移有着密切的联系,这已经成为近年来疾病机制研究的重点领域,而对lncRNA的结构与功能的深入了解,则有望为疾病的治疗提供新的思路。