王海涛 闵建平 苏海翔
甘肃省医学科学研究院/甘肃省肿瘤医院,甘肃 兰州730050
RNA编辑(RNA editing)是指在转录后水平上发生的核苷酸插入、缺失或替代,导致核苷酸序列发生改变,使其翻译的蛋白质氨基酸序列、结构、功能或表达水平等不同于原基因序列所携带遗传信息的生物学现象。1986年,Benne等描述锥虫线粒体细胞色素C氧化酶亚基Ⅱ(cytochrome C oxidase subunitⅡ,coxⅡ)转录后修饰时首次提出这一概念,coxⅡ基因包含一个移码突变,后者经RNA编辑插入一个尿苷酸得以修复[1]。RNA编辑增大了转录多样性,进而增加了蛋白质的种类,使生物体能够更好地适应环境,其不仅扩充了遗传信息,也进一步补充和扩展了中心法则,使人们对基因表达调控有了更进一步的认识[2]。RNA编辑广泛存在于物种中,是机体维持正常代谢活动和稳态的重要基础。
迄今为止,已经发现了多种不同类型的RNA编辑现象,包括C-to-U、U-to-C、A-to-Ⅰ等。
1.1 C-to-U编辑 哺乳动物中首次发现RNA编辑现象是在小肠上皮细胞中,该细胞合成一种载脂蛋白ApoB-48,能够结合并运输血脂到机体各组织进行代谢及利用。人类肝脏细胞也表达同一基因ApoB,但合成更大的蛋白ApoB-100,广泛存在于另一种脂质载体LDL颗粒中。ApoB-48和ApoB-100 N末端的序列是一致的,但前者长度只有后者的48%。ApoB-100基因第6666位核苷酸是谷氨酰胺密码子CAA中的C,而在ApoB-48中相应的核苷酸是U,从而形成了一个终止密码子UAA,导致了开放读码框的中断。C-to-U编辑由载脂蛋白B编辑酶催化多肽(apolipoprotein B mRNA editing enzyme,catalytic polypeptide,APOBEC)催化完成[3]。
1.2 U-to-C编辑 研究发现,在肾母细胞瘤基因(wilms tumor 1,WT1)mRNA的一个位置有两种不同的核苷酸形式,与基因序列比对发现该mRNA发生了Uto-C的转变,这说明存在一种在嘧啶上酶促结合一个氨基的编辑形式[4]。
1.3 A-to-Ⅰ编辑 高等真核生物中最常见的一种RNA编辑类型是A-to-Ⅰ编辑,在这种类型的编辑中,腺苷(A)被脱氨基形成次黄苷(Ⅰ),后者在mRNA中极少出现。次黄苷跟鸟苷一样,优先同胞苷配对,以同样的方式与核糖体互相作用。因此,在反转录和翻译中,发生A-to-Ⅰ改变就如同将A替换为G[5]。
谷氨酸受体是由GluR-A、-B、-C和-D基因编码的不同亚基形成的异聚体,包含GluR-B亚基的受体对Ca2+是不可渗透的。序列分析表明,不同受体亚基之间Ca2+通透性的差异是由于跨膜结构域中一个氨基酸的不同造成的—在GluR-B中是精氨酸,而其他亚基中相应位置却是谷氨酰胺。在蛋白和mRNA水平上这一差异是显而易见的,但在编码各亚基的基因上相应位置却完全一致[6]。GluR-B mRNA的编辑将一个谷氨酰胺密码子(CAG)改变为CIG,后者在翻译过程中被识别为精氨酸密码子(CGG),这一编辑位点被称为Q/R位点[7]。据推测,GluR-B前体mRNA序列在Q/R位点与下游内含子序列间配对形成了一个颈环结构。通常认为,双链RNA是编辑发生的必要条件,而依赖双链RNA的腺苷脱氨酶(adenosine deaminase acting on RNA,ADAR)就是催化编辑发生的酶[8]。
2.1 ADAR家族ADAR在哺乳动物多种组织中广泛表达,而在中枢神经系统中表达量最高,ADAR家族包括三个成员:ADAR1、ADAR2和ADAR3,这三者在蛋白结构和生物功能方面有一定的相似性,也有较大的差异。
2.1.1 ADAR1。ADAR1是首个被发现并克隆的双链RNA腺苷脱氨酶[9]。这种酶在脊椎动物中高度保守,其包含3个双链RNA结合结构域(double strands RNA bindingdomains,dsRBD)和一个C端催化脱氨结构域[10]。ADAR1是由ADAR基因编码的,在哺乳动物绝大多数组织中都有表达,一般有两种亚型—ADAR1 p150和ADAR1 p110,前者是从一个干扰素(interferon,IFN)-诱导型启动子开始表达的,在核内和胞质都有表达;而后者主要在核内基础性表达[11]。ADAR1是生命活动所必需的,ADAR1基因敲除小鼠在胚胎期死于异常的细胞凋亡和造血功能缺陷[12-13]。ADAR1也是一种干扰素信号抑制剂,可以保护机体免遭疾病相关的干扰素激活[14]。研究表明,ADAR1发生错义突变在易感儿童中会引起一种致命的自身炎症性疾病—Aicardi-Goutières综合征,这是一种罕见的以神经系统及皮肤受累为主的遗传性疾病,主要临床特征包括颅内多发钙化灶、脑白质病变、脑脊液慢性淋巴细胞增多症和冻疮样皮损[15]。
2.1.2 ADAR2。由ADARB1基因编码的ADAR2在大脑中高表达,心脏、肺、肝和肾中也有少量表达。如同ADAR1一样,ADAR2的两个N端dsRBD和一个近C端脱氨基结构域也是高度保守的。ADAR2主要存在于核仁中,但在未成熟的神经元中则集中于胞质中,表明随着发育调控,酶的分布有所变化。与ADAR1相比,在编辑底物的选择上,二者既有相似性,也存在差异。ADAR2与多种肿瘤、炎症、红斑狼疮、肌萎缩侧索硬化症、阿尔茨海默症等疾病相关[16-17]。
2.1.3 ADAR3。ADAR3同ADAR1、ADAR2在序列和结构上有很大的相似性,包括核酸定位、脱氨酶、dsRBD等结构域[18]。迄今为止,还没有研究显示ADAR3具有可以影响生理功能的脱氨酶活性。最近一项研究表明,ADAR3可能作为其他ADAR蛋白的显性失活形式发挥作用。相比正常脑组织,ADAR3在多形性成胶质细胞瘤中是高表达的,其通过RNA结合结构域与ADAR2竞争同GluR-B的结合[19]。鉴于ADAR3主要在大脑中表达,推测其可能通过调节ADAR2/ADAR1介导的RNA编辑来调控脑部肿瘤的发生[20]。
2.2 APOBEC家族 在人类基因组中,有11个基因属于APOBEC家族,包括APOBEC-1、-2、-3A、-3B、-3C、-3D、-3E、-3F、-3G、-3H、-4等[21]。APOBEC蛋白是胞苷脱氨酶,在脊椎动物中高度保守。研究发现这些蛋白能够催化高频突变,驱动肿瘤发生并产生治疗抗性[22]。
RNA编辑受到高度精准的调控,RNA编辑酶定位与表达的相关调控机制已经得到广泛研究[23-24]。根据组织来源和疾病状态,不同癌症与总RNA编辑水平的增加或减少相关。在一些具有清晰的总编辑水平(过编辑vs低编辑)或RNA编辑酶表达水平明显改变的疾病中,许多靶基因以相反的方式被编辑[25-26]。
同样的编辑事件可以导致完全不同的功能或表型,例如在肿瘤发生过程中ADAR1介导的胶质瘤相关致癌基因1(glioma-associated oncogene 1,GLI1)的编辑和ADAR2介导的衣被蛋白复合体亚基α(coatomer protein complex subunit alpha,COPA)的编辑[27-28]。APOBEC1编辑生成的apoB48和其对应的全长蛋白apoB100促进了动脉粥样硬化和肥胖症的发展,其程度与周围的环境调控有关[29-30]。在两种不同的动物模型中,同一靶基因上完全相同的编辑事件(如5-HT2CR的编辑)也可能会导致相反的表型(肥胖vs.瘦)[31-32]。
RNA编辑的几个调控机制最近已得到鉴定,在诸如三阴性乳腺癌、化生性乳腺癌等恶性乳腺癌中,ADAR1的存在对肿瘤形成非常重要。研究发现,在这些癌症中,ADAR1的表达和活性受到肿瘤促进蛋白CPSF6(cleavage and polyadenylation factor-6)和突变的核糖体蛋白RPL39(ribosomal protein L39,A14V)的调控。CPSF6和ADAR1相互作用,稳定其定位并增强其RNA编辑能力[33]。另外,CPSF6介导的ADAR1的活化可被催乳素抑制,后者是一种乳腺分化因子。致癌突变体RPL39(A14V)通过与诱生型一氧化氮合酶iNOS和激活的信号转导与转录活化因子STAT3作用诱导ADAR1的表达,从而促进了肿瘤的生长和药物抗性[34]。
ADAR2在大脑中的功能得到广泛研究,据报道一种剪接因子SRSF9(serine and arginine rich splicing factor 9)对ADAR2介导的RNA编辑有抑制作用。SRSF9同ADAR2及其编辑底物相互作用,干扰了ADAR2二聚体的形成,这对控制细胞生存相关基因的编辑至关重要,证实了剪接在RNA编辑调控机制中的重要性[35-36]。在结直肠癌中,PKCζ(protein kinase C zeta)对ADAR2进行磷酸化,激活了其RNA编辑活性,磷酸化的ADAR2可能通过对COPA和其他底物的编辑促进miR-200的累积,抑制了结直肠癌的肝转移[37]。
鉴于ADAR1和ADAR2介导的RNA编辑之间的复杂关系,可能存在同时调控二者RNA编辑的机制,最新的一个例子是RNA解旋酶DHX9(DEAH box helicase 9),通过利用一种食管癌细胞系(EC109)中的过表达系统,发现DHX9促进ADAR1介导的RNA编辑而抑制ADAR2介导的RNA编辑[38],这一结果是DHX9表达与肿瘤发生具有紧密联系的一个力证。高通量筛选技术被用于鉴定ADAR介导的RNA编辑的内源性调节因子[39],目前,研究人员正不断尝试鉴定关于RNA编辑的其他内源或外源的强化因子和抑制因子。
APOBEC1介导的C-to-U RNA编辑是在多个蛋白质组成的编辑体中完成的[40]。迄今为止,这一编辑体中与其功能有关的许多组分已经得到鉴定,包括ACF(APOBEC1 complementation factor)、HNRNPAB(heterogeneous nuclear ribonucleoprotein A/B),DNAJB11(DnaJ heat shock protein family member B11)、KSRP(KH-type splicing regulatory protein)、CELF2(CUGBP Elav-like family member 2)、SYNCRIP(synaptotagmin binding cytoplasmic RNA interacting protein)和RBM47(RNA binding motif protein 47)[41-47]。BAG4(Bcl2-associated Athanogene-4)是这一编辑体中一个罕见的负调控因子,研究发现这一调控因子通过将APOBEC1协助转运到细胞质中,从而抑制了APOBEC1介导的RNA编辑[48]。除ACF和RBM47外,其他调控因子的生理学意义仍需要进一步的验证[49]。
为证实APOBEC1调控癌症发展的过程中这些“搭档”的角色,一个利用睾丸生殖细胞肿瘤(testicular germ cell tumor,TGCT)小鼠模型完成的实验有力地揭示了这一联系。利用自然发生TCGT的129/Sv同系交配小鼠,发现Apobec1缺陷会影响TGCT的易感性。更有意思的是,Apobec1缺陷在TGCT易感性中的作用受到种系的影响(母系vs.父系),而且以隔代遗传的方式显现,表明APOBEC1可能通过RNA编辑调控可遗传的表观改变,影响了诸如睾丸癌等疾病的发展[50]。
一种代谢调控因子PPARα(peroxisome proliferatoractivated receptor alpha)在体内影响了APOBEC1介导的RNA编辑。在缺乏低密度脂蛋白(LDL)受体的小鼠中,PPARα激活剂ciprofibrate(一种常见的降胆固醇药物)通过减少Acf的表达降低了apoB在肝脏中的RNA编辑,结果导致apoB100相关的超低密度脂蛋白(very low density lipoprotein,VLDL)的不断累积和动脉粥样硬化[51],进一步证实RNA编辑能够通过影响对治疗的应答从而影响人类疾病。
由于RNA编辑在癌症发展中起着显著的作用,肿瘤发生相关通路和因子可能是这一机制重要的调控因素。例如,肿瘤抑制蛋白TP53参与肿瘤发生过程中的各个方面,但TP53与RNA编辑之间几乎无关系[52]。目前,构建了仅删除TP53的活细胞模型,以研究先天性免疫应答中ADAR1介导的RNA编辑[53]。TP53状态影响ADAR1相关表型,这一事实表明其在RNA编辑中具有重要的作用。最近一项研究确证IFI16(interferon gamma inducible protein 16)是ADAR1和TP53共同的“互动合作伙伴”,进一步证实了这一推测[54]。
对于另一个TP53相关蛋白ARF(alternative reading frame,或CDKN2A/p14),有证据暗示其在RNA编辑中发挥的角色。已知ARF通过抑制MDM2(mouse double minute 2)从而激活TP53,但迄今已经鉴定了ARF的许多不依赖TP53的功能[55],其中之一便是最近在三阴性乳腺癌中证实的—ARF同TP53协作抑制了涉及干扰素β和STAT1的肿瘤促进炎症通路,而后两者均为ADAR介导的RNA编辑重要的因子[53,56-58]。ARF和ADAR都将细胞核作为一个关键的中心,结合这一事实,ARF似乎处于非常接近RNA编辑世界的中心位置[59-60]。
随着对RNA编辑在癌症和代谢性疾病中作用的理解不断深入,RNA编辑和许多人类疾病相关因子之间的联系会不断被发现。不同肿瘤中编辑位点的分析有望为癌症的诊断和预后提供新的标记,有助于肿瘤的早期检测,也有助于治疗反应的监控及微小残留病灶的发现。