环状RNA与人类神经系统疾病

2018-07-23 08:07聂志妍陈林军
生命科学研究 2018年6期
关键词:内含子外显子位点

许 飞,金 磊,聂志妍,陈林军,郑 红*

(上海健康医学院a.微生物与免疫教研室;b.检验与检疫系,中国上海201318)

非编码RNA(non-coding RNA,ncRNA)领域突破性的发现为探索人类疾病的机制和治疗提供了新的视角。1976年,研究者在马铃薯纺锤块茎病的研究中发现,类病毒(viroid)能侵染植株并导致死亡。与病毒不同的是,类病毒没有蛋白质外壳包被,基因组是单链、闭合的RNA分子[1]。1979年,洛克菲勒大学的Hsu和Coca-Prados在电子显微镜下观察到,真核细胞细胞质中有环状RNA的存在[2]。这类RNA缺乏5′帽结构和3′poly(A)尾,单链呈环形,因此被称为环状RNA(circular RNA,circRNA)。起初,circRNA被认为是RNA剪接过程中的无用产物。随着高通量测序技术以及生物信息学的飞速发展,人们才逐渐揭示circRNA 的真正“面目”[3]。

在正常的转录环境中,外显子剪接使得前体RNA转变为成熟的信使RNA(messenger RNA,mR-NA),但是对于环状RNA而言,外显子的不规则拼接导致了环状RNA的形成[4~6]。例如,性别决定基因SRY(sex region of Y chromosome)在正常情况下转录翻译成SRY蛋白。但是,RNA不规则拼接使得外显子转录的前体RNA成环,从而导致蛋白质翻译受阻[7]。circRNA的环形结构可以保护其免受核酸外切酶的水解,与其他线性RNA相比结构更加稳定。circRNA的主要功能之一是作为miRNA“分子海绵”,吸附miRNA,从而抑制miRNA的活性[8]。因此,circRNA在基因表达的转录后修饰过程中起着重要的“微调(fine-tuning)”作用。越来越多的研究显示,circRNA在肿瘤、肥胖、动脉粥样硬化以及神经系统疾病等人类疾病过程中都发挥着重要作用[3,9,10]。随着高通量测序、芯片技术、生物信息学分析技术的广泛应用,circRNA在神经系统中的功能受到越来越多的关注。circRNA在神经系统中高度富集,其表达的高度保守性、特异性和稳定性,为circRNA作为神经系统疾病诊治的标志物提供了巨大的潜力。这里,我们首先对circRNA的产生机制以及生物学功能做简单概述,然后着重介绍circRNA在神经系统疾病中的研究进展。

1 circRNA的产生机制及检测方法

目前,有关circRNA的产生机制主要有3种模型假说:套索驱动的环化(lariat-driven circularization)、内含子配对驱动的环化(intron-pairingdriven circularization)以及RBP配对驱动的环化(RBP-pairing-driven circularization)[11,12]。第 1 种模型认为前体RNA的转录过程中由于RNA发生了部分折叠,拉近了原本非相邻的外显子,从而发生了外显子跳跃(exon skipping),使得被跨越的区域形成了环形RNA中间体,中间体则进一步通过套索剪接形成由外显子构成的环形RNA分子,即外显子circRNA(图1)[11]。在内含子拼接位点的短重复序列,例如 Alu序列,可以通过碱基互补配对促进外显子环化[13~15]。Aktas等[16]发现 RNA 解旋酶DHX9特异性结合反向Alu元件调控RNA加工和circRNA形成,DHX9缺失会导致环状RNA增多,这为反向Alu元件调控RNA转录产物加工过程提供了全新的机制模型。

图1 套索驱动的环化[11]Fig.1 Lariat-driven circularization[11]

第2种模型认为,位于内含子区域的反向互补序列介导内含子区域配对,从而形成内含子circRNA(图2)[12]。近期有报道称,发现了环化的外显子中间保留内含子序列的circRNA,即外显子—内含子环状RNA(exon-intron circRNA,EIci-RNA),但其发生机制尚不明确[17]。一项研究表明,内含子拼接位点中的反向互补重复序列(reverse complementary repeat,RCR)会增强环化效率[18]。在进化的过程中,RCR序列的产生源于碱基序列的随机重复。一种RNA编辑酶——腺苷脱氨酶1(adenosine deaminase that acts on RNA,ADAR1),可抑制RCR的作用,敲除ADAR1可显著增强circRNA 的表达[14]。

图2 内含子配对驱动的环化[12]Fig.2 Intron-pairing-driven circularization[12]

第3种模型是依赖RNA结合蛋白(RNA-binding protein,RBP)的环化(图 3)[19]。RBP 结合在序列的两端,促进两端靠近、成环,再将环中的内含子序列去除,仅保留外显子序列。例如,甘露糖结合凝集素(mannose binding lectin,MBL)可以作为RNA结合蛋白促进circMBL的生物合成[9]。此外,科学家们发现RBP也可能抑制circRNA的形成,例如前文陈述的ADAR1蛋白[14]。

图3 RBP配对驱动的环化[19]Fig.3 RBP-pairing-driven circularization[19]

上述3种模型并非平等存在,实验数据显示内含子配对驱动的环化往往较常发生[5]。虽然以上3种模型都已被证实,但是circRNA的精确形成机制尚未明了。circRNA的表达调控以及是否还有其他合成方式等问题仍需更加深入的研究。

circRNA没有5′端帽结构和 3′端 poly(A)尾,因此能抵抗核酸外切酶的水解。与其他RNA相比,circRNA更加稳定,半衰期大约是mRNA的5倍[15]。但是,正是由于5′端帽结构和3′端poly(A)尾结构的存在,mRNA能够从细胞核出来进入到细胞质,而缺乏这些结构的circRNA又是通过什么方式进入细胞质的呢?关于circRNA的出核机制有一些不同的理论,其中有人推测circRNA是在细胞分裂的时候进入细胞质的,但是在非分裂的神经元中circRNA也可以进入细胞质,推翻了这一猜测。因此,circRNA的出核机制还有待深入研究。

目前常用的circRNA分离方法有以下几种。第1种是利用RNase R酶水解线性RNA。用RNase R处理总RNA,即可分离出circRNA[20]。第2种是利用凝胶电泳阻滞来分离circRNA。将总RNA与融化的凝胶混匀,在凝固的过程中,只有circRNA可以与凝胶交联。凝胶凝固后,在电场的作用下,线性RNA迁移,一定时间后线性RNA全部迁移出凝胶,这样就可将凝胶中交联的circ-RNA分离出来[21,22]。另外,还可以利用含有poly(T)基质的亲和层析方法,将含有poly(A)尾的线性mRNA与没有poly(A)尾的circRNA分离[23]。

稳定表达的外显子circRNA可以通过高通量测序进行检测。circRNA可以用发散性引物(divergent primer)来扩增(图4)[24]。发散性引物不能扩增引物之间的区域,而是从引物所在位点向序列两端扩增。因此,应用此引物进行扩增时,线性RNA是没有扩增产物的,只有环形circRNA有大小一定的目的产物[24]。

图4 扩增circRNA的发散性引物[24]Fig.4 Divergent primers used for quantitation of circ-RNA[24]

此外,一些在线数据库可用于circRNA的信息查询。Glazar等[25]发表了circBase数据库(http://www.circbase.org/),这个数据库整合了目前已经报道的所有circRNA。Ghosal等[26]开发了Circ2Trait在线工具(http://gyanxetbeta.com/circdb/),可以预测circRNA与miRNA、circRNA与蛋白质等的相互调控网络。最近,Dudekula等[27]公布了CircInteractome数据库(http://circinteractome.nia.nih.gov/),该数据库可预测miRNA和circRNA的相互作用。

2 circRNA的生物学功能

2.1 circRNA作为miRNA“分子海绵”

外显子circRNA的主要功能是作为特定mi-RNA的“分子海绵”,抑制miRNA的活性,从而增强miRNA下游靶基因的表达[28,29]。这类circRNA主要存在于细胞质中。例如,ciRS-7含有超过70个miR-7的结合位点,可作为miR-7的“分子海绵”吸附miR-7,从而抑制miR-7的活性[8]。ciRS-7能够调节翻译小脑变性相关蛋白1(cerebellar degeneration-related protein 1,CDR1)的转录物,故又称之为CDR1as(antisense to the cerebellar degeneration-related protein 1 transcript)。ciRS-7/CDR1as与miR-7的结合使miR-7的靶基因表达得以增加[8,30]。在斑马鱼胚胎中过表达CDR1as会导致中脑缩小,与miR-7缺失所引起的表型类似[30]。与SRY基因共表达的circRNA Sry有16个miR-138结合位点,可使miR-138的表达降低[30]。另一项研究显示,ZNF基因的circRNA ZNF91有24个miR-23结合位点和7个miR-199结合位点[31]。此外,cir-ITCH的序列跨越E3泛素连接酶的外显子序列,可作为miR-7、miR-17和miR-214的“分子海绵”[32]。

2.2 circRNA与蛋白质相互结合

circRNA不仅能与RNA结合,也能与蛋白质(主要是RBP)结合。有研究报道circRNA能够与AGO蛋白(Argonaute)以及RNA聚合酶Ⅱ相互结合[15,30]。MBL基因表达的MBL蛋白可以作为RBP结合在MBL的前体RNA上,促使其环化形成circMBL,抑制RNA的翻译。而且circMBL又能与MBL蛋白结合,抑制MBL蛋白的活性[9,33]。一些circRNA(如 ci-ankrd52、ci-mcm5 和 ci-sirt7)参与RNA聚合酶Ⅱ的延伸机制,顺式调节宿主基因的转录活性[34]。例如,ci-ankrd52可以在宿主基因的转录起始位点积累,并参与RNA聚合酶Ⅱ的延伸,促进基因的转录[34]。一些EIciRNA(例如circ-EIF3J和circPAIP2)可以与U1 snRNA相互作用促进转录[35]。此外,circRNA还可以调节mRNA的稳定性。研究报道,CDR1as能通过稳定CDR1的mRNA促进蛋白质的表达[21]。circRasGEF1B可通过稳定ICAM-1的mRNA,正向调节ICAM-1基因的表达[36]。

2.3 circRNA的翻译功能

事实上,绝大多数的circRNA来源于编码蛋白质的基因序列,而且定位于细胞质中。那么这些circRNA是否能够有翻译的功能呢?Wang等[37]通过基因编辑的方法证实,含有内部核糖体进入位点(internal ribosome entry site,IRES)的circRNA能够翻译产生多肽。最近一项研究则显示,没有IRES或者经典翻译结构(5′帽结构和3′poly(A)尾结构)的circRNA也存在翻译功能[38]。有研究报道,一些外显子circRNA含有起始密码子[39]。但是相关研究显示,circRNA的起始密码子很可能是抑制线性mRNA转录本的翻译,其本身并不能编码蛋白质,即“mRNA 陷阱(mRNA trap)”[40]。最近,Yang等[28]首次报道了circRNA存在N6-甲基腺苷化修饰(N6-methyladenosine,6mA or m6A),并且该修饰能促进circRNA的翻译。紧接着,Sebastian Kadener的研究团队利用果蝇模型通过核糖体印迹分析(ribosome footprinting)发现了大量具有翻译功能的circRNA[41]。而Irene Bozzoni团队则通过临床样本和小鼠模型证实circ-ZNF609可直接翻译蛋白质,并且该蛋白质与肌肉发生过程有关[42]。这些研究结果为环状RNA的功能研究提供了非常有价值的思路。

3 circRNA参与神经系统疾病的调控

人体各个组织的深度测序结果显示,脑的circRNA含量最高[43]。而且在神经发育过程中,circ-RNA在大脑的各个部位均有较高的表达[44,45]。circ-RNA在神经形成、神经发育以及突触可塑性过程中的高表达,暗示了circRNA在中枢神经系统中的重要作用[46]。表1总结了与神经系统疾病相关的circRNA。

帕金森病(Parkinson’s disease,PD)是由大脑黑质致密部的多巴胺能神经元退行性病变引起的神经系统疾病。基因水平、神经病理学水平、细胞水平的实验研究均证实,α-突触核蛋白(α-synuclein,α-Syn)是PD发病机制过程的关键分子[47,48]。α-Syn的过度积累会引起多巴胺能神经元的功能损伤。细胞实验结果显示,miR-7能降低α-Syn的mRNA水平[48]。而且,敲减CDR1as可增加miR-7的活性,抑制miR-7靶基因的表达。因此,CDR1as和miR-7很可能在PD发病机制的调控过程中起着重要的作用[30]。

另一种重要的神经系统疾病——阿尔茨海默病(Alzheimer’s disease,AD)是由 β-淀粉样蛋白过度积累造成的。这一过程也与miRNA有关,包括let-7i、miR-451、miR-338、miR-210、miR-181c、miR-146b、miR-15 和 miR-9 等[49~52]。泛素蛋白连接酶A(ubiquitin protein ligase A,UBE2A)是miR-7的一个靶基因,在β-淀粉样蛋白的清除过程中起着非常重要的作用。Lukiw等[53]发现,与正常组织相比,AD患者海马区ciRS-7显著下调,从而导致miR-7水平增加,过量的miR-7可以促进β-淀粉样蛋白的积累,也可促进tau蛋白的高磷酸化,最后导致病变。近期一项研究显示,miR-138可通过RARA(retinoic acid receptor alpha)/GSK-3β(glycogen synthase kinase-3β)通路促进 tau的磷酸化,而且AD小鼠模型中miR-138表达上调[54]。因此,circRNA Sry和miR-138在AD中的具体调控机制也值得我们更深入的研究。

MBL可以促进circMBL的生物合成,而circ-MBL又可以作为MBL蛋白的海绵,与MBL相互结合[33]。人类MBL的直系同源物MBNL蛋白在强直性肌营养不良(myotonic dystrophy,DM)中起着重要作用。当DM相关致病基因表达时,CUG和CCUG重复序列会缠绕形成颈环结构,MBNL蛋白可与这些颈环结合从而导致转录本的错误剪接,而这些错误剪接的转录本翻译的蛋白质产物与DM临床病理相关[55,56]。因此,circMBL很可能通过MBL/MBNL蛋白在DM的致病机理中起着关键的作用。

另外,研究发现在重性抑郁障碍(major depressive disorder,MDD)患者的外周血单个核细胞中某些circRNA的表达异常[57]。与健康对照相比,MDD患者外周血单个核细胞中的hsa_circRNA_103636表达下调。但在抗抑郁治疗8周后,MDD患者的hsa_circRNA_103636表达有显著增加。上述结果提示,hsa_circRNA_103636很可能是MDD诊断和治疗的新靶点[57]。

circRNA不仅仅直接参与神经系统的调控,还可以通过其他途径影响神经系统的功能[19]。很多研究已证实,circRNA参与多种肿瘤的发生发展,包括消化系统肿瘤[32,58,59]、乳腺癌[60]、慢性淋巴细胞白血病[61]等等。ciRS-7不仅在大脑中表达,在神经母细胞瘤和星形细胞瘤中也表达[62]。在小鼠神经母细胞瘤模型以及恶性胶质瘤模型中,miR-7能显著抑制肿瘤的血管生成和肿瘤增殖[63,64]。因此,ciRS-7很可能参与神经系统恶性肿瘤的发病机制。Fu等[65]研究发现,miR-138能通过靶基因RUNX3(Runt-related transcription factor 3)调节 T辅助淋巴细胞亚群的平衡。而circRNA Sry可抑制miR-138的活性。此外,Has-circRNA 2149只有在CD19阳性的淋巴细胞中表达,在CD34阳性的淋巴细胞以及中性粒细胞中均不表达[66]。综合上述分析可知,circRNA很可能与神经系统的炎症性疾病相关。

实际上,circRNA在神经系统疾病的精确角色还有待更加深入的探索和研究。circRNA和神经系统疾病的关系将为疾病的机制研究和诊断提供新的思路和角度。

4 总结与展望

非编码RNA(包括miRNA、lncRNA以及circ-RNA等)的研究发展迅速,已经成为探索人类疾病机制以及诊断的热点[67]。非编码RNA就像是分子促发器,可以促发多种相关因素的发生。而circ-RNA独一无二的环状分子结构使其成为非常独特的分子标记物,很容易与其他细胞内的分子相区分。circRNA为疾病的靶向治疗提供了全新的视角。circRNA作为疾病诊断工具,具有以下几个特点[15,43,45,67~71]:1)序列的保守性;2)结构的稳定性;3)表达的普遍性;4)组织的特异性。作为比较前沿的研究领域,circRNA的结构和功能仍然有很多有趣的问题值得研究,比如:影响circRNA表达的上游调控机制;在不同生理和病理条件下circRNA的功能;在神经组织中circRNA表达的动态性和亚细胞定位的生物学功能等等。

circRNA独特的结构和功能使其成为探究疾病机制、诊断和治疗的潜在靶点。尤其是针对多种特定circRNA组成的特异指纹图谱的研究,可以为早期诊断提供更为完善的标记。circRNA的miRNA“分子海绵”功能也有可能作为基因编辑和基因调控的新技术。关于circRNA在神经系统疾病的机制研究正飞速发展。随着生物信息学以及结构生物学的不断发展,揭示circRNA在神经系统疾病的生理学和病理学功能,将为我们建立基于circRNA的临床治疗和诊断策略提供有力的支持和帮助。

表1 神经系统疾病相关的circRNATable 1 Summary of circRNAs in human neurological diseases

猜你喜欢
内含子外显子位点
外显子跳跃模式中组蛋白修饰的组合模式分析
镍基单晶高温合金多组元置换的第一性原理研究
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
外显子组测序助力产前诊断胎儿骨骼发育不良
不同方向内含子对重组CHO细胞中神经生长因子表达的影响
二项式通项公式在遗传学计算中的运用*
更 正
外显子组测序助力产前诊断胎儿骨骼发育不良
一种改进的多聚腺苷酸化位点提取方法