王 宁 范志朋
miRNA 是一种小的非编码RNA,长度约22 个碱基,主要的生物学功能是通过结合目的mRNA来沉默靶基因。大多数miRNA 首先在细胞核内通过RNA 聚合酶II 转录,形成具有发卡样结构的初级转录本,即pri-miRNA,它包含有miRNA 的序列。Pri-miRNA 通过Exportin-5(EXP-5)出核,这时称为pre-miRNA,含有约70 个碱基的茎环结构。之后经过RNase 内切酶III-Dicer 的作用,产生miRNA 双链。miRNA 双链和AGO 蛋白结合进入RISC 复合体,其中一条链被选作成熟的miRNA[1]。miRNA 的生物学过程可以在很多层面被调控,包括miRNA 的转录水平,在细胞核和细胞质中分别被Drosha 和Dicer 处理,包括RNA的编辑,甲基化,尿苷化和腺苷化,以及AGO 蛋白的负载等等。miRNA 能够在细胞质内发挥作用,也能够被运输到细胞核内,结合到目的基因的启动子区域,导致目的基因的沉默或增强目的基因的表达。miRNA 还能够结合外泌体被分泌到细胞外,作用于其他细胞发挥其生物学功能。
miRNA 是最为丰富的基因家族之一,广泛分布在动物,植物和病毒中。一般认为,miRNA 在碱基序列2-8 识别序列相同的属于同一个miRNA家族。多数miRNA 首先发生在细胞核内,经过RNA 聚合酶II 转录形成发卡样结构的pri-miRNA,其中包含有miRNA 序列,之后经过RNase III核酸内切酶-Drosha 修剪等作用后出核。在细胞质内,经过RNase 内切酶III-Dicer 修剪作用后形成成熟miRNA。
1.1 在细胞核内的过程 Pri-miRNA 通过RNA 聚合酶II 从DNA 上转录形成的,包含有局部的茎-环结构,有成熟的miRNA 嵌入其中。典型的pri-miRNA 由33-35 个bp 组成,环的尾端和单链部分分别为5'和3'区,5'端含有7-甲基鸟苷区,3'端有poly 尾。RNase III-Drosha 通过剪切pri-miRNA 的茎环结构释放一个长度约70个碱基的发卡样结构的RNA(pre-miRNA)来启动miRNA 成熟的过程。Drosha 是一种分子量约160kDa 核蛋白,和Dicer 一样是属于作用于特定的RNA 双链的RNase III 的内切酶[2]。Drosha 的羧基端有两个RNase III 域(RIIIDs)和双链RNA 结合域,两个RIIIDs 内二聚形成一个处理中心,两个RNase III 域分别为RIIIDa 和RIIIDb,分别同时作用于pri-miRNA 的3'和5'端。Drosha 和共作用因子DGCR8 形成一个复合体,DGCR8 提供了RNA 结合的部位,它的C 末端能够和Drosha相互作用,N 末端区域包含有细胞核定位的信号,它能够通过Drosha 的中间区域来募集RNA[3]。
1.2 出核的过程 经过Drosha 的作用过程之后,pre-miRNA 被运输到细胞质中,之后完成miRNA 的成熟过程。蛋白质exportin5(EXP5;XPO5)结合到Ran-GTP 形成转运复合物,EXP5用一个类似于棒球手套样的结构包裹pre-miRNA的茎的区域,并且伸出隧道样结构识别pre-miRNA的3'过长端的2 个碱基,形成转运复合物出核后,GTP 水解,导致复合物解体并将pre-miRNA 释放到胞质中[4]。
1.3 在细胞质内的过程 Pre-miRNA 被输出到细胞质中,被Dicer 内切酶在近末端环处进行剪切,释放出一个小的双链RNA。Dicer 是一种多结构域蛋白,约218kDa,属于RNase III 家族,它可以处理各种pre-miRNA 释放出约22 个碱基的miRNA,在小RNA 的生物学功能方面具有重要的作用[5]。Dicer 包含有六个重要的区域:螺旋酶区域,未知功能的区域(DUF283),平台-PAZ 连接体(PPC)区域,两个RNase III 区域和双链RNA结合区域(dsRBD)。Dicer 的PPC 区域是RNA 结合区域,能够识别dsRNA 的尾端[6]。Dicer 的C端有RNase III 结构域形成分子内二聚体的催化中心,这类似于Drosha。Dicer 的N 端解旋酶域通过与末端环的相互作用促进pre-miRNA 识别[7],并增加了某些pre-miRNA 的处理。有研究证实PPC 区域和RNase III 区域能够作为一种“分子标尺”来控制剪切dsRNA 的大小。相比于AGO 蛋白相同的区域,Dicer 的PAZ 区域是保守的,能够锚定在双链RNA 底物3'末端过长的2 个碱基内[8]。这大概能够剪切21-25 个碱基的长度,主要取决于Dicer 的种类和类型。
有研究发现,Dicer 剪切的核酸序列的位点会影响miRNA 的特性。对于剪切的机制,研究证实Dicer 的RNase IIIa 区域相比于RNase IIIb 区对于剪切pre-miRNA 的3'端更为敏感。pre-miRNA在RNase IIIa 区域剪切后的miRNA 的5'端避免释放带G 的核苷酸,更能够释放带U 的miRNA。并且,Dicer 的剪切序列可能是导致miRNA 双链3'端过长碱基的原因[9]。
miRNA 发挥的生物学功能可以在细胞质内沉默目标mRNA,抑制靶基因的表达,也可以在细胞核内作用,结合到目的基因的启动子区域,导致目的基因的沉默或过表达,甚至可以结合外分泌体分泌到细胞外作用于其他细胞来发挥生物学作用。
2.1 在细胞质内miRNA 的作用 miRNA 在细胞质中作用的基石是形成了RISC 复合物-由AGO蛋白和一个单链miRNA 组成。miRNA 作用主要依赖于以下两个条件:①miRNA 能够通过Watson-Crick 互补原则特异性识别靶向mRNA。同时,可以轻易地分离和重新附着在不同的靶标上,从而对广泛的目标分子进行连续的控制;②AGO 蛋白提供了一个非常有效的平台,调节辅因子可以在上面结合它们的靶标。miRNA 负责识别被调控的mRNA 靶点,而AGO 蛋白的任务是确定RISC 介导的基因调控的作用模式[10]。miRNA 沉默靶标mRNA 主要通过mRNA 衰变和翻译抑制来调节互补mRNA 的。
miRNA 介导mRNA 衰变的机制是AGO 蛋白招募182kDa(GW182)蛋白家族的甘氨酸色氨酸蛋白成员(在人类中,是TNRC6A、TNRC6B 和TNRC6C 蛋白的三核苷酸重复序列)。GW182 与聚腺苷酸结合蛋白(PABPC)相互作用,从而通过招募PAN2-PAN3 和CCR4-NOT 复合物来促进mRNA 去烯基化,导致mRNA 的不稳定[11],使mRNA 易受5'-3'外核糖核酸酶1(XRN1)的快速降解。TNRC6A-C 蛋白是一种中枢蛋白,它向靶mRNA 募集多种因子,包括PABP、CCR4-NOT和PAN2-PAN3 复合物。研究表明,导致miRNA介导的去烯基化和mRNA 衰变的主要触发因素是CCR4-NOT 复合物,而不是PAN2-PAN3 复合物。在去烯基化后,靶mRNA 在5'-3'mRNA 衰变途径中降解[12]。
miRNA 对mRNA 的翻译抑制是通过抑制翻译的起始步骤。虽然目前还不清楚miRNA 是如何抑制翻译的,但是在过去的几年里,有三种主要的机制被提出,包括:①GW182 介导的PABP 移位;②通过GW182 招募翻译抑制因子;③真核生物翻译的起始因子eIF4A 与cap 结合复合体eIF4F的分离,干扰了真核生物的翻译过程。这些机制并非互斥的,它们可能重叠,同时发生,或以不同的动力学发生,以增强翻译抑制的效果[13]。
2.2 在细胞核内的作用 有研究报道miRISC复合物也存在于哺乳动物的细胞核中,细胞核组分分离分析发现存在AGO 蛋白、Dicer、TRBP 和GW182/ TNRC6,在那里它们结合形成多蛋白复合物[14]。尽管Dicer 和TRBP 同时存在于细胞核内,但是加载过程似乎发生在细胞质中。目前的假设是miRNA-AGO2 的组装发生在细胞核外,那里存在一些关键的负载因子。一旦建立,最小的RISC可能随后被导入细胞核中,核RISC 似乎比细胞质RISC 小。介导miRISC 的细胞质核穿梭的机制尚未明确,有研究报道称AGO-miRNA 复合物是通过与importin 8(IPO8)结合而导入细胞核的[15],IPO8 的沉默减少了核AGO2 的数量。AGO2 缺乏核定位信号,然而,AGO2 通过与TNRC6A 结合克服了这一缺陷。TNRC6 具有核定位信号而不是核输出信号,并作为核-细胞质穿梭蛋白将最小的miRNA 重新定位到细胞核[16]。miRISC 可以通过一条以上的路径到达细胞核。研究表明,miRNA的3'末端序列在确定成熟miRNA 细胞定位中有重要作用。在miRNA 的3'末端含有ASUS 元素(其中S 可能是胞嘧啶或鸟嘌呤)或者3'末端鸟嘌呤核苷酸,能够以非模板的方式添加,优先在细胞核内定位[17]。因此,可能存在涉及基序的miRNA 核易位的机制能够赋予特定miRNA 的核通路。这些数据表明,外源的小干扰RNA 能够优先定位到细胞质或细胞核,其方式取决于其靶点的捕获能力[18]。它们在细胞核和细胞质之间来回移动,直到识别目标分子。
研究证实,细胞质加工的miRNA 可以被导入细胞核内调节目的基因的表达。现有一部分miRNA已经证实能够在细胞核内结合到靶基因的启动子区域调节目的基因的表达[18]。研究发现,靶向基因启动子的合成双链RNA,通过RNA 活化过程激活基因表达。突变分析表明,靶向基因启动子的双链RNA 与靶向启动子不匹配也能诱导基因的表达[19]。这说明靶向基因启动子的RNA 不要求与靶向RNA之间具有完全互补性。这一观察结果可以得到假设,内源性表达的miRNA 也能够触发靶向mRNA 的激活。有实验证实miR-373 能够结合靶向mRNA的启动子,激活基因的表达[20]。
研究表明,为了使miRNA 在细胞核中发挥作用,Ago-miRNA 复合物通过与Imp8 结合导入细胞核。与启动子序列互补的靶向miRNA 与Ago 蛋白结合,结合到染色体DNA 序列或从启动子衍生的新生同源转录物上。比如,Kim 等报道了靶向miRNA 的启动子miR-320,它是从POLR3D 基因的启动子上转录的,它与基因启动子具有良好的序列互补性。miR-320 水平与POLR3D 在不同组织中的表达成负相关,miR-320 的转染诱导POLR3D 基因沉默,提示miR-320 靶向POLR3D的启动子,并在细胞中指导POLR3D 的转录基因沉默。转染miR-320 后,在POLR3D 启动子处观察到Ago1 和H3K27me3 的富集。miR-320 还诱导了组蛋白甲基转移酶EZH2 的富集,最终导致POLR3D 的基因沉默[21]。Huang 等研究发现miRNA 能够与小鼠细胞周期蛋白B1(Ccnb1)基因启动子中的位点高度互补,在启动子处募集H3K4me,激活Ccnb1 基因的表达。证明miRNA具有核功能,能够积极影响基因的转录[22]。
随着高通量测序技术的发展,越来越多的miRNA 被发现。然而,我们对miRNA 在生物体生长发育以及疾病中的调控机制认识仍然有限,miRNA 调控的机制有极大的丰富性和复杂性,总结现有miRNA 的作用机制有以下几种:
3.1 miRNA 与蛋白的相互作用 miRNA 在成熟的过程中与多种蛋白相互作用,miRNA 的生物发生首先发生在细胞核内,RNase III 复合物DROSHA 将pri-miRNA 切割成pre-miRNA,一旦pre-miRNA 被Expotin5 输出到细胞质,RNase III 复合物DICER/ TARBP2,识别它们发夹样结构并加工它们以产生成熟的,约22 个核苷酸长的miRNA。随后将成熟的miRNA 双工体装载到AGO2 上,促进了mRNA 诱导沉默复合物(RISC)的形成。AGO2 及其家族蛋白被认为是唯一与成熟miRNA 相互作用的RNA 结合蛋白。最近研究表明,除了AGO 蛋白还存在其他蛋白与成熟miRNA 相互作用。
人体几乎每个细胞都包含了一系列可编程的基因沉默蛋白称为AGO 蛋白。Argonaute 蛋白是由四个球状和两个连接域组成的两个叶组成,它们共同形成一个中心的RNA 结合间隙。AGO 蛋白的N 端叶包含了N 和PAZ 区域,然而C 端叶包含了MID (middle) 和PIWI (p-body-induced wimpy testes)区域[23]。现有证据表明,miRNA 导向的种子区(g2-g7 或者g2-g8)是发现靶标的主要决定因素,结合AGO 蛋白的PIWI/ MID 区域时能够快速识别并作用于靶标[24]。Ago 蛋白有Ago1-4 种类型的蛋白,有研究证实Ago2 通过miRNA 的种子区和补充区域(g13-g16)区域共同作用识别靶标RNA[25]。
RISC 的功能核心是由miRNA 加载到Ago 蛋白家族上形成的,Ago 蛋白是用有编码信息的miRNA 作为引导去识别互补的mRNA 沉默靶标。RISC 复合体以接近于极限的速度和精准的方式识别靶标,避免了细胞环境中的大量脱靶[26]。
除了Ago 蛋白,成熟的miRNA 可以与包括AUF1、HuR 以及其他的蛋白相互作用,使其在miRNA 介导的基因沉默中发挥作用。
3.2 miRNA 与miRNA 的相互作用 在发现自然存在的miRNA 海绵之前,有研究小组将人工miRNA 海绵作为miRNA 抑制剂,从而抑制miRNA 下游的作用。研究表明,miRNA 能够靶向多个基因,一个基因可以被多个miRNA 调控,这表明miRNA 与miRNA 之间存在协同调节[27]。比如,Chen 等发现miR-124 和miR-203 协同抑制透明细胞肾癌中的ZEB2 的EMT 通路[28]。Liep J 等发现miR-141-3p 和miR-145-5p 在透明细胞肾细胞癌靶基因调控中的协同作用[29]。越来越多的证据有力地表明,miRNA 的新疗法可能是未来疾病治疗最有前景的方法,尽管调节一些关键的miRNA 就可以成功地逆转病理过程,但有研究认为miRNA 调节的内在协同作用可能会对疾病的治疗有更好的疗效[30]。
3.3 miRNA 与LncRNA 的相互作用 非编码RNA 转录物如miRNA 和LncRNA 是重要的遗传调控因子,但是这些转录本的许多功能尚未完全明了。近来研究发现,miRNA 和LncRNA 之间存在明显的串扰,导致miRNA、LncRNA 和其他监管目标之间存在着绑定竞争。LncRNA 是通过隔离miRNAs 起作用,这导致了miRNA 沉默或者衰减靶标mRNA 的作用下调,类似于海绵的作用能够吸收miRNA 从而下调miRNA 的表达。LncRNA作为miRNA 的功能靶点的第一个证据就是被Hansen 等提出的,细胞增殖相关蛋白CDR1 的反转录物CDR1as 是一种circRNA,能够与miR-671 完美地互补。miR-671 能够影响CDR1 的表达,提出非编码RNA 的反义转录物可以直接作为miRNA 的靶点,这是提出海绵现象研究的重要的起点[31]。比如,Lang Chen 等发现LncRNAKCNQ1OT1 通过调节miR-701-3p/ FGFR3 轴促进骨折的愈合。LncRNA-KCNQ1OT1 作为竞争性内源性非编码RNA 能够抑制miR-701-3p 的表达,而升高FGFR3 mRNA 的水平,从而促进成骨细胞MC3T3-E1 的增殖、迁移和存活[32]。总之,LncRNA 和miRNA 在细胞的生物学活动和病毒感染、肿瘤发生等病理过程中都发挥着重要作用。
3.4 miRNA 与circRNA 的相互作用 近年来研究发现,大量的环状RNA 是内源性的、保守的、稳定的和特异的。新的研究表明,最常见的功能是通过结合位点充当miRNA 海绵,CircRNA丰度的变化可以相应地调节miRNA 对靶基因的活性。CircRNA 海绵富含大量的miRNA 结合位点,当circRNA 过表达时,会导致miRNA 的表达量降低,从而导致miRNA 对于下游靶向mRNA 抑制作用降低,降低了下游靶基因的表达[33]。比如,Circ-MALAT1 同时作为mRNA 翻译制动器和microRNA 海绵促进肝癌干细胞的自我更新。Yu等发现CircRNA 0003645 通过海绵作用清除肝癌细胞中的microRNA-1299 而显示出致癌作用[34]。Circ-ABCB10 在乳腺癌组织中高表达,沉默此基因可抑制乳腺癌细胞的增殖和凋亡。Circ-ABCB10可吸附miR-1271。circRNA 对乳腺癌细胞的作用可以被miR-1271 所拯救[35]。总之,circRNA 通过海绵miRNA,在调节细胞的生物学功能方面发挥重要的作用。CircRNA 与miRNA 的相互作用在生物体的生长发育等生物学过程以及病理学过程中都发挥了重要功能。
miRNA 被认为是决定转录后基因沉默特异性和敏感性的关键因素,在调控表观遗传方面有重要的作用。现有研究发现miRNA 在细胞质、细胞核、甚至在细胞外发挥重要的生物学作用。因此,能够从基因组中识别miRNA 及其靶基因,进一步推断miRNA 的功能和调控机制,对理解生物体的生物学过程和疾病的病理过程具有重要的意义。虽然现在已经对miRNA 及其靶基因已有所研究,如miRecords[36]和Tarbase[37],但都不能反映miRNA的多样性和丰富性。因此,对miRNA 的功能和精确的调节机制仍需进一步探索。