庄佩佩,邓光存*
(1.西部特色生物资源保护与利用教育部重点实验室,宁夏银川750021;2.宁夏大学生命科学学院,宁夏银川750021)
随着生命科学的不断发展,人们发现,一些复杂疾病,像肿瘤、心血管疾病等的发生,与蛋白质功能紊乱及DNA 突变等关系密切[1]。在过去的10 年中,大规模的基因组测序使人们对基因组结构有了更深入的了解,人们认识到疾病的发生是细胞内多个分子多环节作用失调的结果,蛋白编码基因仅仅是疾病发生过程中复杂分子网络相互作用的一部分,一些非编码基因在其中也发挥了重要的调控作用。目前,人们研究较多的有小非编码RNA(microRNA),研究认为,其与细胞的凋亡和肿瘤的发生等关系密切[2-3]。也有研究发现,长链非编码RNA(lncRNA)也参与了众多疾病的发生发展,对疾病有一定的调控作用。目前对lncRNA 的研究主要集中在对其表达差异的检测上,对其作用机制的研究还少见报道,尚处于起步阶段。本文就lncRNA 可能参与的调控及其与肿瘤、心血管疾病和感染性疾病的关系做一综述。
现代生物学研究发现人类基因组大约只有20 000个蛋白编码基因,所占比例不到全基因组序列的2%,其余的核酸序列不编码蛋白质,这些基因组序列曾经被认为是基因组在进化过程中产生的“垃圾序列”。近年来,随着高通量测序技术的不断发展,人们在对小鼠全长cDNA 文库预测中发现一类这些“垃圾序列”的转录产物—长链非编码RNA(long non-coding RNA,lncRNA)。lncRNAs具 有重要的生物学功能,可在多个水平对基因的表达进行调控,在细胞分化及疾病的发生过程中都起着重要的作用,已在基因组研究领域掀起了新的研究热潮。
2002 年,Okazaki Y 等[4]在 对 小 鼠 全 长 互 补DNA(cDNA)文库的大规模测序过程中鉴定了大量较长的非编码RNA 分子,即lncRNA。LncRNA是一类转录本长度大于200个核苷酸单位的功能性RNA 分子,它们不具有编码蛋白的能力,位于细胞核或胞质内。LncRNA 在结构上类似于mRNA,但序列中不存在开放阅读框(open reading frame,ORF)。许多已知的lncRNA 由RNA 聚合酶Ⅱ(RNA polymeraseⅡ,RNA polⅡ)转录并经可变剪切形成,通常被多聚腺苷酸化,但反义asOct4-pg5、BC200等例外,它们具有功能,但却没有被多聚腺苷酸化。目前,对于lncRNA 的来源尚不十分清楚,普遍认为可能有以下途径:①在早期进化过程中,蛋白质编码基因的开放阅读框突变、基因结构破坏而形成;②染色质重排,两个非转录片段串联到一起而形成;③非编码基因通过反移位产生;④由局部的串联复制子产生邻近的非编码RNA;⑤基因中插入一个转座成分而产生。
研究发现,lncRNA 可以 与DNA、RNA 或蛋白质等分子相互作用,广泛参与机体的病理生理过程,与许多疾病的发生发展密切相关。lncRNA 主要从表观遗传水平、转录水平和转录后水平等3个层次对基因表达进行调控,参与疾病的发生发展。
LncRNA 可以在表观遗传水平上对基因进行调控。表观遗传是指DNA 序列没有发生变化,但基因表达发生了可遗传的改变,表观遗传包括有基因印记、X 染色体失活、染色质重塑等。
在表观遗传调控中,lncRNA 可直接与染色质结合并与其相互作用,沉默或激活部分基因,也可以通过组蛋白修饰来沉默基因,还能通过募集染色质修饰抑制因子来参与等位基因的特异性沉默[5]。研究发现,lncRNA-HOTAIR 能够募集染色质重构复合体2(PRC2),并将其定位到HOXD 位点,诱导HOXD 基因座上的一个转录本发生表观遗传沉默。在胚胎发育阶段,lncRNA 还能参与可遗传的等位基因后期的表达沉默、表观性状的维持,对多细胞动物的发育和细胞分化有重要作用。
LncRNA 不仅能在表观遗传水平,还能在转录水平对基因进行调控。在真核生物中,基因转录具有严格的时间和空间特异性。但是LncRNA 可以通过多种方式在转录水平对基因进行调控。LncRNA 的转录可以干扰邻近基因的表达,可以通过与影响启动子选择的抑制性复合物相互作用,封锁启动子区域来调控RNA 聚合酶(RNAP)Ⅱ的活动从而干扰基因表达,还能直接作为调控因子或共调控因子,通过形成转录起始复合体来实现调控[6]。研究发现,DNA 损伤信号可以诱导人类细胞中的细胞周期蛋白D1(CCND1)基因启动子上游一段lncRNA 的表达,使CCND1基因沉默。
除了在表观遗传水平和转录水平外,lncRNA还能在转录后水平对基因进行调控。LncRNA 在转录后水平的调控主要是通过与靶基因序列的互补配对来实现。LncRNA 可以与mRNA 形成RNA 二聚体,掩蔽mRNA 的主要顺式作用元件,以此来调控转录后水平的剪切、拼接、翻译等过程[7]。有研究发现lncRNA-Zeb2 能够和HOX 位点转录的mRNA 的一个内含子的5′端剪切位点形成双链,从而防止该内含子被剪切。
研究表明,lncRNA 的突变和异常调节与包括肿瘤、心血管及感染性疾病等在内的众多疾病的病理过程及发生发展关系密切[8]。
目前,已研究证实在肝癌、乳腺癌和前列腺癌等众多恶性肿瘤中都存在有差异表达的lncRNA,某些特异lncRNA 可以作为癌症特异性生物标记物。
研究发现,与肝癌有关的lncRNA 有HULC、HEIH、Dreh等,它们在肝癌组织中表达异常,与肝癌的发生关系密切。肝癌组织中HULC(highly upregulated in liver cancer)是第1个被发现在肝细胞癌胞质中过表达的lncRNA。Yang F等[9]研究发现lncRNA-HEIH 与肝癌的复发密切相关,通过检测其表达水平,可预测患者的生存时间。Huang J等[10]研究发现,lncRNA-Dreh能通过改变细胞骨架结构和形态阻止肝癌细胞的转移。还有研究者通过对肝癌细胞株和肝癌病例进行MALAT1基因表达分析,发现无论在癌细胞株还是临床病例中,MALAT1的表达均上调,而且MALAT1高表达病例肝移植后更易复发,提示MALAT1 可作为预测肝癌复发的独立预后因子[11]。
LncRNA 与乳腺癌的相关研究表明,许多lncRNA 与乳腺癌的发生发展关系密切。大规模基因组研究表明,Xist、HOTATR 等lncRNAs在乳腺癌与正常乳腺组织中的表达存在统计学上的差异。Yildirim E等[12]研究发现Xist的缺失能使X 染色体活化,使造血干细胞功能异常,导致乳腺癌的发生。Costa F F等[13]研究发现,HOTAIR 在乳腺癌患者组织中高表达,并且高表达HOTAIR 的乳腺癌患者生存率较低,提示HOTATR 可作为乳腺癌诊断和预后判断的一个重要标志。SRA(steroid receptor RNA activator)是一类对乳腺癌雌激素受体(estrogen receptor,ER)和孕激素受体PR(progestogen receptor)表达具有重要调控作用的lncRNA,Tahira A C等[14]研究结果显示,SRA 在乳腺癌癌变细胞中的表达量明显高于正常细胞。以上研究提示,通过调节特定lncRNA 的表达可能会抑制乳腺癌的发生,虽然这些lncRNA 在乳腺癌中的作用机制尚不清楚,但是它们为乳腺癌的诊断和治疗提供了新思路。
目前,在前列腺癌中确定的lncRNA 主要有INK4位点反义非编码RNA(lncRNA-ANTIL)、前列腺特异转录物1(lncRNA-PCGEM1)和前列腺癌相关转录3(lncRNA-PCA3)。Burd C E 等[15]研究发现,lncRNA-ANTIL 在前列腺癌组织中表达上调,它可能是通过调节INK4a/ARF 的表达而参与了癌症的发生。Chang C N 等[16]发现,过表达lncRNA-PCGEM1可导致前列腺癌症细胞的增殖。lncRNA-PCA3在正常前列腺组织和前列腺癌组织中表达具有差异性,可能与前列腺癌的发生有关。
相关研究发现,与肿瘤有关的lncRNA 还有H19、MEG3和ANRIL等,它们在一些恶性肿瘤中也存在异常表达的现象,与肿瘤的发生发展关系密切。
目前,有研究显示,lncRNA 与心血管系统密切相关。研究发现,许多lncRNA 参与了心脏、血管的生长和分化,与心肌病、心肌梗塞和强直性肌营养不良等心血管疾病关系密切。
Guttman M 等[17]在胚胎干细胞基因相关研究中发现,一些lncRNA 表达量的改变可以影响到胚胎干细胞状态的维持和分化的特异性。2010 年,Bondue A 等[18]发现一种lncRNA-AK143260,敲除AK143260后发现,心肌细胞失去搏动能力,并使心脏关键转录因子(Hand2、Myocardin、Nkx2-5、Gata4、Mef2c等)失活。此发现有助于了解干细胞增殖分化为心肌细胞的分子机制,为先天性心肌病的治疗提供思路。Klattenhoff C A 等[19]发现并被鉴定 了 lncRNA (lncRNA-Braveheart,lncRNABvht),研究发现,它参与了胚胎干细胞的分化,与心脏的早期发育有重要的联系。大规模关联分析表明,心肌梗塞相关转录产物lncRNA-MIAT 第5外显子的单核苷酸多态性(single nucleotide polymorphism,SNP)位点变异与心肌梗死的易感性密切相关,但其具体分子机制还不清楚。同时,Rapicavoli N A 等[20]也在对视网膜细胞生长分化的研究中发现,MIAT 在其中起重要的调控作用。
强直性肌营养不良(myotonic muscular dystrophy)是一种多系统受累的常染色体显性遗传病,严重时会导致猝死。目前研究表明,此病为一种毒性RNA 疾病。Yadava R S等[21]在强直性肌营养不良的小鼠模型上实现DMPK 过表达后发现,3′UTR区的DMPK 过表达会使转录因子Nkx2-5的表达量上调,同时还发现Nkx2-5在心脏中表达量的增加能引起心脏传导阻滞。研究发现,lncRNA-ANRIL 为冠状动脉疾病遗传易感性最强的位点,lncRNAANRIL在细胞增殖和衰老中起重要作用。Holdt L M 等[22]研 究 表 明,lncRNA-ANRIL 与 动 脉 粥 样 硬化密切相关,其表达水平的升高与病情严重程度直接相关。
感染性疾病严重威胁着人类的公共卫生安全,研究表明,宿主感染致病微生物以后,会引起宿主lncRNA 表达量的变化,这些lncRNA 的变化可能与感染性疾病的发生发展关系密切。
Peng X 等[23]用SARS 冠 状 病 毒(severe acute respiratory syndrome coronavirus(SARS-CoV))感染小鼠,并测定了组织中lncRNA 变化,发现509个已注释lncRNA 和1 406个未注释区域的lncRNA的表达量有明显变化。Rossetto C C等[24]深入研究卡波氏肉瘤相关疱疹病毒(Kaposi's sarcoma-associated herpesvirus,KSHV)编码的多聚腺苷酸化的核内非编码RNA(polyadenylated nuclear RNA,PAN RNA),证实PAN RNA 干扰了IRF-4转录因子对IL-4启动子的激活能力,表明PAN RNA 在免疫调控中发挥了重要的作用。Yin Z 等[25]用EV71感染RD(恶性胚胎横纹肌瘤)细胞后发现,细胞中有2 990种lncRNAs表达量上调,有1 876 种lncRNAs表达量下调。
LncRNA 与感染性疾病关系密切,虽然目前的研究大多都集中在对其表达差异的分析上,关于其在感染性疾病中的作用机制的研究较少,但这为以后进一步研究lncRNA 在感染性疾病中的作用机制奠定了基础。
LncRNA 除了与肿瘤、心血管疾病和感染性疾病关系密切外,部分lncRNA 与人类的其他疾病的发生关系也十分密切。
近来FaghihiM A 等[26]在对阿尔茨海默病的研究中发现了lncRNA-BACE1AS,BACE1AS能够防止 BACE1 mRNA 受 核 酸 酶 降 解,增 加BACE1mRNA 的稳定性,从而诱导β淀粉样蛋白的累积,并促进BACE1AS的表达,从而加速阿尔茨海默病的发展。当试验中加入特异性针对BACE1AS的siRNA 后,发现BACE1AS 的表达水平降低,同时,β淀粉样蛋白的表达也下降,这表明BACE1AS是治疗阿尔茨海默病的一个非常理想的药物靶点。Cesana M 等[27]研 究 发 现 肌 肉 特 异 性lncRNA LINC-MD1是一个竞争的内源RNA,它通过沉默miRNA 来控制调节肌肉的分化。此外,LINC-MD1与杜氏肌营养不良症的发病关系密切。Barry G等[28]发现横向中胚层特异性lncRNA-Fendrr,可以通过结合到组蛋白重塑复合物PRC2 和TrxG/MLL来控制中胚层分化。同时,他还发现lncRNAGomafu参与神经元和视网膜发育,Gomafu 下调,会导致剪切模式改变,剪接因子和由此产生改变的剪接模式进行结合,会导致精神分裂症的发生。
除了lncRNA 自身发生异常外,一些神经退行性疾病如脊髓小脑共济失调症,肌萎缩测速硬化症及X 染色体易损综合征等已被证明是受lncRNA 结合蛋白调控,它们的共同特征是错误折叠和突变蛋白的积累。
目前,对于lncRNA 的研究主要是集中在对其表达差异的分析上,相关研究表明,lncRNA 具有基因印记、调控蛋白活性、参与RNA 的可变剪切等分子生物学功能,这为深入研究其对疾病的调控作用奠定了基础。虽然LncRNA 自身的复杂性使人们对其的研究进展缓慢,但对lncRNA 的研究具有重要的临床和科学价值,它不仅可以为包括肿瘤及心血管疾病在内的许多复杂疾病的诊断和治疗提供新的依据和靶点,而且有助于人们进一步认识高等真核生物复杂的调控网络。因此,研究lncRNA 在疾病中的作用机制,将是未来的重要研究方向。
[1] 孔汉金,张克山,刘永杰,等.亚细胞蛋白质组研究进展[J].动物医学进展,2013,34(6):167-171.
[2] 王娇娇,王泽英,罗光彬,等.动物microRNA 研究现状[J].动物医学进展,2014,35(6):144-148.
[3] 张晋平,丁艳平,冯汉青.MicroRNA 与动物细胞凋亡的调控[J].动物医学进展,2013,34(6):172-174.
[4] Okazaki Y,Furuno M,Kasukawa T,et al.Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs[J].Nature,2002,420:563-573.
[5] 武志娟,钟金城.长链非编码RNA 的功能与疾病[J].中国生物化学与分子生物学报,2012,28:203-210.
[6] Hung T,Chang H Y.Long noncoding RNA in genome regulation[J].RNA biol,2010,7:582-585.
[7] 高 原,惠 宁,刘善荣.长链非编码RNA 的研究进展[J].第二军医大学学报,2011,32:790-794.
[8] Maass P G,Luft F C,Bahring S.Long non-coding RNA in health and disease[J].J Mol Med,2014,92:337-346.
[9] Yang F,Zhang L,Huo X S,et al.Long noncoding RNA high expression in hepatocellular carcinoma facilitates tumor growth through enhancer of zeste homolog 2in humans[J].Hepatology,2011,54:1679-689.
[10] Huang J,Guo Y,Zhao C,et al.HBx-related lncRNA Dreh inhibits hepatocellular carcinoma metastasis by targeting the intermediate filament protein vimentin[J].Hepatology,2012,57:1882-1892.
[11] Lai M C,Yang Z,Zhou L,et al.Long non-coding RNA MALAT-1overexpression predicts tumor recurrence of hepatocellular carcinoma after liver transplantation[J].Med Oncol,2012,29:1810-1816.
[12] Yildirim E,Kirby JE,Brown DE,et al.Xist RNA is a potent suppressor of hematologic cancer in mice[J].Cell,2013,152:727-742.
[13] Costa F F.Non-coding RNAs:Meet thy masters[J].Bioessays,2010,32:599-608.
[14] Tahira A C,Kubrusly M S,Faria M F,et al.Long noncoding intronic RNAs are differentially expressed in primary and metastatic pancreatic cancer[J].Mol Cancer,2011,10:141-160.
[15] Burd C E,Jeck W R,Liu Y,et al.Expression of linear and novel circular forms of an INK4/ARF-associated non-coding RNA correlates with atherosclerosis risk[J].PLoS Genet,2010,6:e1001233.
[16] Chang C N,Feng M J,Chen Y L,et al.p15PAF is an Rb/E2F-regulated S-phase protein essential for DNA synthesis and cell cycle progression[J].PLoS One,2013,8:e61196.
[17] Guttman M,Donaghey J,Carey B W,et al.LincRNAs act in the circuitry controlling pluripotency and differentiation[J].Nature,2011,477:295-300.
[18] Bondue A,Blanpain C.Mesp1Akey regulator of cardiovascular lineage commitment[J].Circul Res,2010,107:1414-1427.
[19] Klattenhoff C A,Scheuermann J C,Surface L E,et al.Braveheart,a long noncoding RNA Required for Cardiovascular Lineage Commitment[J].Cell,2013,152:570-583.
[20] Rapicavoli N A,Poth E M,Blackshaw S.The long noncoding RNA RNCR2directs mouse retinal cell specification[J].BMC Devel Biol,2010,10:49.
[21] Yadava R S,Frenzel-Mc Cardell C D,Yu Q,et al.RNA toxicity in myotonic muscular dystrophy induces NKX2-5expression[J].Nat Genet,2008,40:61-68.
[22] Holdt L M,Beutner F,Scholz M,et al.ANRIL expression is associated with atherosclerosis risk at chromosome 9p21[J].Arterioscler Thromb Vas Biol,2010,30:620-627.
[23] Peng X,Gralinski L,Armour C D,et al.Unique signatures of long noncoding RNA expression in response to virus infection and altered innate immune signaling[J].MBio,2010,1:e00206-10.
[24] Rossetto C C,Pari G S.Kaposi's sarcoma-associated herpesvirus noncoding polyadenylated nuclear RNA interacts with virus-and host cell-encoded proteins and suppresses expression of genes involved in immune modulation[J].J Virol,2011,85:13290-136297.
[25] Yin Z,Guan D,Fan Q,et al.LncRNA expression signatures in response to enterovirus 71infection[J].Biochem Biophys Res Commu,2013,430:629-633.
[26] Faghihi M A,Modarresi F,Khalil A M,et al.Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation ofβ-secretase[J].Nat Med,2008,14:723-730.
[27] Cesana M,Cacchiarelli D,Legnini I,et al.A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA[J].Cell,2011,147:358-369.
[28] Barry G,Briggs J,Vanichkina D,et al.The long non-coding RNA Gomafu is acutely regulated in response to neuronal activation and involved in schizophrenia-associated alternative splicing[J].Mol Psych,2013,45:486-494.