非编码RNA来源的小肽:“微不足道”却“功能强大”*

2023-06-01 07:20陈晓彤赵文龙孙林玉王文涛陈月琴
关键词:核糖体密码子环状

陈晓彤,赵文龙,孙林玉,王文涛,陈月琴

中山大学生命科学学院,广东 广州 510275

随着人类基因组计划的完成以及ENCODE 计划的开展,科学家发现,约75%的基因组可以产生 转 录 本(Derrien et al.,2012;Djebali et al.,2012)。早期对于蛋白质编码基因的鉴定和注释主要集中在以ATG起始的能够编码至少100个氨基酸的多肽的ORF,因此过去普遍认为,能够形成遗传信息最终产物的蛋白质编码基因仅占整个基因组的2%,剩余的转录本构成了非编码RNA转录组(Derrien et al.,2012;Djebali et al.,2012;Guttman et al.,2013)。在非编码RNA 转录组中,长链非编码RNA 是数量最多的成员,在各种生物学过程中扮演了重要的角色,包括维持细胞干性、调控生长发育以及参与肿瘤发生发展等重大生命活动(Esteller,2011;Hangauer et al.,2013;Wang et al.,2013a;Iyer et al.,2015;Brazão et al.,2016;Delás et al.,2017)。

随着转录组学和蛋白质组学等生物信息学技术发展,越来越多的研究表明,一些传统上被认为不编码蛋白的RNA 区域(包括长链非编码RNA以及信使RNA(mRNA,messenger RNA )的5’和3’非翻译区(UTR,untranslated region)等)实际上也存在开放阅读框(ORF,open reading frame)(Orr et al.,2020)。这些开放阅读框的长度通常小于300 nt(nucleotide),被称为小开放阅读框(Orr et al.,2020)。由核糖体印记技术(ribosome footprint pro‐filing)发展而来的翻译组测序(Ribo-Seq,ribosome profiling sequencing),为发现新的翻译模式提供了技术手段(Ingolia et al.,2012)。Ribo-Seq 结合质谱技术(MS,mass spectrometry),许多sORF 被发现可以翻译出长度通常小于100 个氨基酸的小肽(Slavoff et al.,2013)。这些长度短于100个氨基酸的小肽在生物体内发挥重要功能,包括参与个体发育、肌肉收缩和DNA 修复等(Lu et al.,2004;Ma et al.,2014;Ma et al.,2016;Olexiouk et al.,2018)。

由于这些非编码RNA 来源的小肽长期以来被认为并不存在,所以被称为“幽灵蛋白质组”(ghost proteome)或“隐藏的蛋白质组”(hidden proteome)(Yang et al.,2019;Cardon et al.,2021)。当前,功能性 sORF 的鉴定已成为基因组注释中的主要挑战,本文将从非编码RNA 来源小肽的鉴定方法、可编码小肽的非编码RNA 种类、小肽的功能等几个方面来系统综述这类新发现的小肽,重点论述这类小肽的功能机制,以期为非编码RNA 来源小肽的系统鉴定、编码规律和功能研究提供新视角。

1 非编码RNA来源小肽的鉴定方法

小肽由于其肽段长度较短,容易降解等特点,难以被传统翻译分析方法所捕捉。因此,为了探寻当前未注释和未充分研究的“隐藏蛋白质组”,需要更精准的鉴定方法。

翻译起始的标准扫描模型认为,核糖体与RNA 5’帽结构结合形成起始前复合体,该复合体在mRNA 上扫描,当发现以起始密码子AUG 为中心的Kozak序列后开始进行翻译且多肽延伸,直至遇到终止密码子结束翻译,核糖体从转录本上脱落(Moteki et al.,2002;Sonenberg et al.,2009)。由于翻译的场所在细胞质,而核内的ncRNA 无法接触翻译机器,因此对于具有潜在翻译能力的ncRNA 的初步筛选是寻找具有m7G 结构且定位于胞质的ncRNA(A)。(1)分析ncRNA 序列是否具有7-甲基鸟苷(m7G)帽子结构以及Kozak 序列;(2)利用核质分离以及荧光原位杂交(FISH,fluores‐cence in situ hybridization)实验,检测ncRNA 是否稳定存在于细胞质中。

除了标准扫描模型外,核糖体还存在泄露扫描、分流、通读和内部核糖体进入位点(IRES,internal ribosome entry site)等替代翻译模式,研究发现多数真核生物的蛋白质编码基因缺乏最佳的Kozak区间序列,且翻译可以在近源起始密码子(CUG/GUG/ACG 等)处起始(Ivanov et al.,2011;Kearse et al.,2017;Yang et al.,2019;Cao et al.,2020)。Ribo-Seq 从多核糖体复合物中提取完整的RNA 转录物,并通过核酸酶处理降解未受核糖体结合保护的RNA 片段,因此可预测潜在的sORF(Olexiouk et al.,2018)。因此,通过结合Ribo-Seq 技术可以全局鉴定具有潜在翻译能力的ncRNA。翻译起始测序(TI-Seq,translation initia‐tion sequencing)通 过lactimidomycin(LTM)或harringtonine (HARR)等翻译抑制剂诱导核糖体在起始密码子处阻滞,可预测起始密码子,特别是非经典起始密码子(Ingolia et al.,2012)(B)。

一些研究显示ncRNA 本身可以通过结合核糖体发挥翻译调控功能(Carrieri et al.,2012;Yoon et al.,2012;Tran et al.,2016)。因此,为了排除核糖体仅停留在ncRNA 上不进行翻译的情况,需要进一步确认ncRNA 上的开放阅读框是否能够进行有效翻译。通常可采用以下方法:(1)生物信息学预测。通过RNA 编码预测工具,例如sORFfinder(Hanada et al.,2010),PhyloCSF(Lin et al.,2011),CPAT(Wang et al.,2013b),CPC/CPC2(Kong et al.,2007;Kang et al.,2017),IRESite(Mokrejs et al.,2006),M6AMRFS(Qiang et al.,2018)等,寻找ncRNA 上潜在的开放阅读框,并通过查找序列上下区间中的翻译调节元件(如IRES、m6A修饰等)进行序列的编码能力预测(图1C);(2)保守性分析,功能编码序列通常表现出较高的跨物种密码子保守性,虽然lncRNA 保守性比mRNA 低,但通常具有功能活性的蛋白编码ORF 序列保守性比较高,因此可以通过分析序列片段的保守性来寻找有效ORF(图1D)。(3)转录组学分析。通过Ribo-Seq 测序技术可以检测核糖体结合的ncRNA 转录本,进一步的生物信息学分析算法可以对潜在的活跃翻译ORF实现密码子分辨率的预测。

图1 非编码RNA来源小肽的鉴定方法Fig.1 Methods for identification of small peptides derived from non-coding RNA

sORF 编码的小肽通常比蛋白质更易降解,ncRNA 如果翻译了却没有产生稳定表达的蛋白,那么核糖体通读产生的小肽可能只是一个副产物。因此对蛋白是否真实表达并且稳定存在的检测非常重要,可通过以下5种方式筛选。(1)质谱鉴定。质谱技术提供小肽存在的直接证据,可以鉴定小肽在生理条件下的氨基酸组成以及丰度(图1E)。(2)标签肽验证。在ORF 序列N 或C 末端进行标签标记,通过蛋白质印迹法(western blot)验证标签肽是否翻译。(3)内源抗体检测。生产靶向小肽的特异氨基酸序列抗体,通过western blot 确认小肽的大小是否与预期相符,在内源细胞系样品中验证小肽在体内条件下是否真实存在(图1F)。(4)体外翻译。将ncRNA 全序列经过原核/真核体外转录以及翻译系统,结合35S同位素放射性自显影技术,检测ncRNA 是否可以翻译小肽以及可以翻译几条小肽。(5)开放阅读框突变。使用起始密码子突变或者移码突变,可以确认开放阅读框及其产生小肽的准确性。

2 可编码小肽的非编码RNA种类

非编码RNA 在转录组中占据极大的比例,形成了高度复杂的家族,包括长非编码RNA(lncRNA,long non-coding RNA)、微小RNA(miRNA,microRNA )、环状RNA(circRNA,circular RNA )、核 糖 体RNA (rRNA,ribosome RNA)、小 干 扰RNA (siRNA,small interfering RNA)等(Kapranov et al.,2007)。目前对于非编码翻译的研究主要集中在包括mRNA 的5’和3’UTR 以及lncRNA、pri-miRNA 和circRNA 等非编码RNA 区域中(Orr et al.,2020)。

2.1 mRNA非翻译区(UTR)

UTR 位 于 成 熟mRNA 两 端,分 为5’UTR 和3’UTR。过去认为UTR 通常不编码蛋白质,主要行使对蛋白质编码区(CDS,coding sequence)的翻译调控功能(图2A)。随着越来越多的sORF 在UTR 区域被发现,人们将位于mRNA 的5’UTR 上的ORF 命名为上游ORF(upORF,upstream ORF),位于3’UTR 的ORF 称为下游ORF(dORF,down‐stream ORF)(Calvo et al.,2009;Couso et al.,2017;Wu et al.,2020a)。

图2 可编码小肽的非编码RNA种类Fig.2 Classification of non-coding RNA encoding micropeptides

sORF 在5’UTR 中大量存在,根据终止密码子的位置,upORF 可分为完全上游ORF(cuORF,completely upstream ORF)和 上 游 重 叠 ORF(uoORF,upstream overlapping ORF)(Calvo et al.,2009;Ye et al.,2015)。目前研究发现,许多具有较长5’UTR 的转录本的蛋白质翻译水平会显著下降,upORF 的存在可能会翻译产生小肽,进而导致核糖体在mRNA 上的提前脱离,通过阻止部分或全部核糖体对CDS 区的扫描来抑制mRNA 的常规蛋白翻译(Calvo et al.,2009;Ye et al.,2015)。当然upORF 不一定总会影响CDS 的翻译,这取决于upORF 的终止密码子与CDS 区的距离,以及upORF 前后序列的起始能力强弱(Wagner et al.,2020)。Rodriguez et al.(2019)发现31% 的神经母细胞瘤转录本中,一共鉴定了4 954 个可翻译的upORFs,且主要是通过非经典起始密码子起始翻译,所得小肽可以作为CDS 翻译的顺式调节因子。例如,从GADD34 的5’UTR 中的upORF 翻译而来的SEP 通过C 端保守的3’氨基酸序列介导核糖体释放从而抑制主CDS 的翻译(Young et al.,2015)。相比upORF,位于3’UTR 上的dORF 的功能较少被报道,其中一些dORF 的翻译也被证实参与主CDS 的翻译调控中(Couso et al.,2017;Wu et al.,2020b)。例如Wu et al.(2020b)发现dORF 可作为CDS的翻译增强子,当对dORF的起始密码子进行突变以抑制其翻译时,CDS 的表达水平随之降低,暗示了dORF 编码的小肽与CDS 翻译之间存在的联系。

2.2 长链非编码RNA (lncRNA)

相对于其他非编码RNA,lncRNA 具有数量众多并且功能多样等特点,在可产生小肽的非编码RNA 中,lncRNA 是最被关注的一类ncRNA(图2B)。与其他非编码RNA 不同的是,大部分lncRNA 与mRNA 有着相似的特点。例如,它们均由RNA 聚合酶Ⅱ转录出来,转录完成后均有m7G加帽以及Poly A 加尾的过程,经过可变剪切的加工,并且它们都容易在细胞质聚集,这些特点使得lncRNA 具备翻译小肽的潜能(Ruiz-Orera et al.,2014)。目前发现一些lncRNA 编码功能小肽,如lncRNA ASHIL-AS1 编码位于内质网的小肽APPLE,通过调控翻译维持癌细胞高速合成,促进AML发展(Sun et al.,2021);lncRNA HOXB-AS3编码保守的53 aa(amino acids)小肽,通过调节肿瘤能量代谢来抑制结直肠癌(CRC,colorectal carcinoma)细胞的生长、集落形成、迁移、侵袭和肿瘤发生(Huang et al.,2017);LINC00691编码的小肽SPAR可以调控肌肉细胞的再生能力等(Matsumoto et al.,2017)。但是也有研究提出质疑,认为仅仅是RNA 结构以及核糖体的结合并不能作为一个转录本的绝对可翻译条件,实验污染会导致核糖体结合的RNA中不仅有lncRNA,还包括了一些核内的非编码RNA。这些核内非编码RNA 由于空间阻断缺乏翻译机会;而采用核糖体释放速率算法可以将核糖体结合lncRNA 与翻译的mRNA 显著区分,这暗示了大量与核糖体结合lncRNA 可能未被真实翻译(Guttman et al.,2013)。的确,也有研究表明lncRNA可通过结合核糖体参与mRNA翻译调控中,如LincRNA-p21(Yoon et al.,2012)、AS-RBM15(Tran et al.,2016)以及antisense Uchl1(Carrieri et al.,2012)等均结合在核糖体上,但是不翻译成小肽,而是以RNA 的形式发挥翻译调控的功能。这些研究表明,功能小肽的准确鉴定仍然具有很大挑战。

2.3 环状RNA (circRNA)

环状RNA 是一类共价闭合单链RNA,由前体转录本(pre-RNA)的可变剪接而来,包括内含子来源的环状RNA 和外显子来源的环状RNA,后者占总环状RNA 比重最大(Li et al.,2018)。与经典RNA顺式剪接不同,外显子来源环状RNA由RNA的反式剪接生成。在成环过程中,外显子序列中上游外显子3’剪切位点同下游外显子5’剪切位点剪切连接成环状结构,进而形成成熟的环状转录本(Ashwal-Fluss et al.,2014;Zhang et al.,2014;Ivanov et al.,2015;Starke et al.,2015;Wang et al.,2015)。由此可见,环状RNA具有环化以及部分基因的外显子序列,因此,具有潜在ORF 的特点,暗示了环状RNA 具有翻译的潜能(图2C)。此外,大部分环状RNA 主要存在于细胞质中,在空间上为环状RNA 的翻译提供了可行性(Sinha et al.,2022)。

与mRNA 不同,环状RNA 的闭合结构使其缺少5’端m7G 帽子,导致翻译起始复合物eIF4F无法结合并介导核糖体进入环状RNA 从而启动翻译过程(Jeck et al.,2013;Guo et al.,2014;Schneider et al.,2016)。近年来陆续有文章报道环状RNA 上存在多个开放阅读框,并且可以通过帽子非依赖途径实现核糖体进入,这些途径包括:(1)通过IRES介导的翻译起始。研究表明,许多环状RNA 上存在IRES序列,这些IRES序列可以通过自身结构或者结合帽子非依赖翻译起始蛋白来招募核糖体起始翻译(Yang et al.,2019)。(2)通过m6A 甲基化修饰介导的翻译起始(Yang et al.,2017a)。研究表明mRNA 5’UTR 上存在的m6A 修饰可以介导帽子非依赖的翻译起始过程,由于m6A 修饰在环状RNA上分布广泛,环状RNA 可以通过m6A 阅读蛋白YTHDF3 招募翻译起始复合物与核糖体从而起始翻译(Legnini et al.,2017;Pamudurti et al.,2017;Yang et al.,2017a)。

尽管大部分环状RNA 自身序列并不是很长,但是由于其共价闭合环状的特点,开放阅读框可以跨过成环位点直到出现终止密码子(Liang et al.,2019;Zhang et al.,2021)。因此,一部分环状RNA编码的“小肽”会超过100个氨基酸,包括 SHPRH-146aa(Begum et al.,2018)、AKT3-174aa(Xia et al.,2022)、FBXW7-185aa(Yang et al.,2018)、circDIDO1-529aa(Zhang et al.,2021)和 β-catenin-370aa(Liang et al.,2019)等。然而,很多具有明显IRES元件和开放阅读框的环状RNA 无法翻译出蛋白,提示明确环状RNA 翻译规律仍是一个亟须解决的科学问题。最近研究发现环状RNA的翻译亦或受到压力影响,例如细胞饥饿可以增强circMbl翻译效果(Pamudurti et al.,2017);热刺激可以促进包含m6A 的环状RNA表达报告基因如绿色荧光蛋白GFP(Yang et al.,2017a)。这些研究进展表明了部分环状RNA 翻译具有一定的时空特异性。

2.4 pri-miRNA

miRNA 的生物发生包括两个步骤:(1)通过RNA 聚合酶Ⅱ转录产生初级miRNA (pri-miRNA)转录物;(2)由Dicer like 1 (DCL1)蛋白将primiRNA 加工成前体miRNA(pre-miRNA)和最终成熟miRNA(Carthew et al.,2009)。最近研究表明,原始病毒可能含有编码调节性小肽(miPEPs)的短开放阅读框(图2D)。这些短肽影响相关miRNA 的积累(Fang et al.,2017;Lauressergues et al.,2015)。虽然,这种调节的分子机制仍未被破译,但是目前 已 经 证 明miPEPs、miPEP171d、miPEP172c、miPEP858a和miPEP165a可以调节植物的生长和发育(Yadav et al.,2021)。

关于pri-miRNAs 的肽编码潜力的第一个证据是:Lauressergues et al.(2015)发现,蒺藜状苜蓿的pri-miRNA171b 和唐松草的pri-miR165a 含有编码调节肽的sORF。这些短肽特异性地正向调节其相应成熟miRNA 的积累。MiPEP171b 过表达导致侧根密度降低,与miPEP171b 过表达植株的表型一样。类似地,miPEP165a 过表达导致根伸长。此外,为了验证miPEP 过表达和相应miRNA 积累之间的正相关性,同时分析了其他5 种主要miRNAs的 开 放 阅 读 框。这 些miPEP (miPEP 160b、miPEP164a、miPEP319、miPEP169d 和miPEP171e)的过度表达或外部应用导致其相应miRNAs的更高积累(Lauressergues et al.,2015)。

2.5 核糖体RNA (rRNA)

核糖体RNA 编码小肽的报道较少(图2E)。目前发现线粒体16S rRNA 编码的小肽Humanin 参与细胞凋亡等多种生命活动的调控(Lee et al.,2013)、线粒体12S rRNA 编码的小肽MOTS-c 可以通过调控胰岛素敏感性来抑制饮食诱导的肥胖(Lee et al.,2015)。

3 小肽的功能

虽然近年来在真核基因转录本中挖掘出大量的sORF,但是目前已被鉴定的具有体内翻译能力和生物活性的小肽数量仍非常少(Vitorino et al.,2021)。越来越多的研究证实,小肽在哺乳动物和植物中均有存在,且在多种生物进程中发挥着重要功能,如RNA 去帽过程、DNA 修复、压力通路、凋亡、肌肉形成、代谢稳态、钙离子稳态等(Yeasmin et al.,2018)。转录组测序结果显示,编码小肽的非编码RNA如lncRNA往往在癌症中异常表达,并可以编码与患者总生存期和治疗反应相关的小肽。这些研究结果提示非编码RNA 来源的小肽可能参与癌症发生发展,具有潜在的临床应用价值(Hanahan et al.,2011;Merino-Valverde et al.,2020;Wu et al.,2020b;Ye et al.,2020 ;Prensner et al.,2021)。研究显示许多小肽在癌症中失调表达,通过调节增殖、凋亡、代谢和细胞炎症反应影响肿瘤进程(Yang et al.,2017b;Zhang et al.,2018)。在植物中,也发现可以通过外源合成pri-miRNA来源的小肽来改善植物的农艺性状(Yadav et al.,2021)。

3.1 小肽参与调控细胞增殖

在生理条件下,细胞通过严格控制有丝分裂信号来维持正常的结构和稳态。相比之下,癌细胞最突出的特点就是过度的有丝分裂导致的无限增殖以及永生化(图3A)。最近研究表明,一些小肽参与调节了癌细胞的有丝分裂信号传导(Polycarpou-Schwarz et al.,2018;Pang et al.,2020;Xu et al.,2020;Zheng et al.,2021)。在癌细胞中显著高表达的小肽通常通过激活信号通路来促进癌细胞增殖。例如,癌症相关小整体膜开放阅读框1(CASIMO1,cancer-associated small integral membrane open reading frame 1)来源于非编码RNA NR_029453上的一个sORF,在乳腺癌中显著高表达(Polycarpou-Schwarz et al.,2018)。研究发现CASIMO1 编码的小肽SMIM22 与角鲨烯环氧化酶(SQLE,squalene epoxidase)相互作用,导致SQLE 蛋白积累和脂滴聚集增加,SQLE 蛋白可促进ERK 磷酸化和MAPK 通路激活,进而导致G0 / G1 细胞周期停滞,促进癌细胞增殖。同样,circPPP1R12A 编码的功能小肽circPPP1R12A-73aa(PPP1R12A-C),在结直肠癌组织中显著增加,通过激活 Hippo-YAP 信号通路促进CRC 生长和转移(Zheng et al.,2021)。LINC00998 编 码 的 小 肽SMIM30 在肝癌患者中高度表达,SIMM30 与非受体酪氨酸激酶 SRC/YES1 结合,驱动其膜锚定和磷酸化,激活下游MAPK 信号通路,促进肝癌细胞在体外和体内的增殖和迁移(Pang et al.,2020)。相反,在癌细胞中显著低表达的小肽则发挥了抑制癌细胞生长增殖的作用。例如,lncRNA NCBP2-AS2 编码的小肽KRASIM 与KRAS 蛋白及其蛋白水平相互作用,抑制ERK 信号活性,从而抑制肝细胞癌(HCC,hepatocellular carcinoma)的细胞生长和增殖(Xu et al.,2020)。

图3 小肽的功能Fig.3 The function of micropeptides

sORFs除了通过调控信号通路来影响有丝分裂之外,还可以通过其他方式调节癌细胞的增殖。例如,lncRNA LINC00467 编码的ATP 合酶相关肽(ATP synthase-associated peptide,ASAP),通过与ATP5A 和 ATP5C 相互作用提高 ATP 合酶活性和线粒体耗氧率,从而促进体外和体内CRC 细胞增殖(Ge et al.,2021)。LINC-PINT 编 码 的 小 肽PINT87aa 与forkhead box M1(FOXM1)的 DNA 结合域结合,减少其靶基因抑制素2(prohibitin 2,PHB2)的转录,从而发挥抗增殖和抗衰老作用(Xiang et al.,2021)。circPINTexon2 编 码 的PINT87aa直接与聚合酶相关因子复合物 (polymerase associated factor complex,PAF1c)相互作用,参与PAF1/RNA Ⅱ 聚合酶复合物调控,使RNA 聚合酶Ⅱ在特定癌基因启动子(如细胞周期蛋白D1、CPEB1、c-MYC 和SOX2)处暂停,从而在体外和体内抑制胶质母细胞瘤细胞增殖(Zhang et al.,2018)。在结肠癌中低表达的HOXB-AS3 peptide 可以通过调控mRNA 的可变剪切来影响癌细胞的生长、转移和侵袭(Huang et al.,2017)。

3.2 小肽参与调控细胞凋亡

调节细胞死亡和存活之间的平衡对于维持组织稳态至关重要。细胞凋亡作为一种由基因编程的自主细胞死亡形式,是正常发育和组织稳态所必需的(Delbridge et al.,2012;Childs et al.,2014;Aubrey et al.,2018)。研究表明,一些非编码RNA来源的小肽参与细胞凋亡功能调控。lncRNA LINC00278 编码小肽YY1BM(Yin Yang 1-binding micropeptide),可在营养剥夺下通过雄激素受体途径诱导细胞凋亡,在食管鳞状细胞癌(ESCC,esophageal squamous cell carcinoma)中具有肿瘤抑制活性(Wu et al.,2020c)。在肿瘤内注射纯化的小肽YY1BM 在异种移植模型中显示出治疗效果,表明其具有作为肿瘤抑制剂的潜力。同样,胃肠道特异性lncRNA LINC00675 被发现可编码小肽FORCP(FOXA1-regulated conserved small protein),在CRC 中显著低表达。FORCP 定位于内质网(ER,endoplasmic reticulum),通过与BRI3BP 相互作用从而抑制CRC细胞增殖,并在ER 应激下诱导细胞凋亡(Li et al.,2020)。

线粒体是细胞凋亡调控中心,多数凋亡刺激因子通过线粒体激活细胞凋亡途径。Humanin是在线粒体基因组中鉴定出的第一个sORF,由线粒体16S rRNA 编码,研究发现Humanin 可通过介导BCL-2蛋白质家族的细胞内定位来调节内源性或线粒 体 凋 亡 途 径(Guo et al.,2003;Luciano et al.,2005;Lee et al.,2013)。Humanin 可上调BCL-2 的表达并抑制BAX 表达以抑制细胞凋亡(Guo et al.,2003)。此外,Humanin 还可以与其他BCL-2 蛋白家族成员(如BID 和BAX)相互作用,并调节它们的易位以抑制凋亡体的产生(Luciano et al.,2005)。PIGBOS 是一种由PIGB 基因的反义链RNA 编码的新型小肽,定位于线粒体外膜,通过CLCC1 蛋白与ER 相互作用,PIGBOS 的下调通过增加对化学诱导的UPR 的敏感性来诱导细胞凋亡(Chu et al.,2019)。虽然PIGBOS功能的分子机制尚未被描述,但有理由认为,其可能通过使细胞对未折叠蛋白质反应(UPR,unfolded protein response)敏感并迫使它们进入细胞凋亡,其在癌细胞中的抑制可能具有治疗潜力。

3.3 小肽参与调控细胞物质代谢与能量代谢

细胞代谢是指细胞通过对葡萄糖、氨基酸、脂肪酸等燃料的分解,产生用于细胞活动的ATP(Judge et al.,2020)。这些过程主要发生在人体的能量工厂——线粒体中,并需要多种酶和辅助因子的参与(Fernie et al.,2004)。实验生物学和生物信息学分析均表明,小肽在线粒体内膜(IMM,inner mitochondrial membrane)上大量富集,参与细胞的代谢活动(Kim et al.,2017)(图3C)。小肽BRAWNIN 由C12orf73 基因编码,在心脏和骨骼肌细胞中高度表达并定位于IMM 中(Zhang et al.,2020)。小肽BRAWNIN 通过与UQCRC1 的相互作用来促进呼吸链复合物Ⅲ(CIII,respiratory chain complex Ⅲ)组装,通过反馈回路调节细胞能量状态。敲低BRAWNIN 可导致细胞ATP 合成减少,从而促进 AMPK 活化。小肽Mtln 与BRAWNIN类似,在心脏和骨骼肌中高表达,与线粒体三功能蛋白(MTP,mitochondrial trifunctional protein)的亚基HADHB 互作,因此,Mtln 被认为参与脂肪酸氧化的调节(Makarewich et al.,2018)。除MTP 外,Mtln 还与心磷脂相互作用,心磷脂对于维持膜完整性和组装呼吸用多蛋白复合物至关重要(Stein et al.,2018)。Mtln 的过表达增加了基础和最大呼吸速率,减少了糖酵解(Chugunova et al.,2019)。

LncRNA HOXB-AS3被证明可以翻译产生参与RNA 剪接的53AA 小肽。Huang 及其合作者发现,HOXB-AS3 在结直肠癌细胞中下调,改变了丙酮酸激酶M(PKM,pyruvate kinase M)前mRNA 的剪接形式,重新表达胚胎同种型PKM2,有利于糖酵解活性;与此同时,HOXB-AS3 来源小肽的表达有利于促进氧化磷酸化的成体亚型(PKM1)的表达。总的来说,HOXB-AS3 来源小肽在结直肠癌细胞系中的过表达可以通过改变其对葡萄糖代谢的使用而减弱其致癌能力(Huang et al.,2017)。线粒体基因组12s rRNA 上的开放阅读框编码的小肽MOTS-c 被发现在体外可增加葡萄糖摄取、糖酵解活性和AMPK 活化,同时降低耗氧率,改善了与体内肥胖相关的代谢参数(Lee et al.,2015)。

3.4 小肽调控炎症免疫通路

炎症是由先天免疫系统发起的一系列细胞反应,通过消除病原体以及恢复细胞和机体稳态来维持宿主健康(El-Kenawi et al.,2017;Evavold et al.,2019;Medzhitov,2008)。已有研究表明,线粒体为免疫细胞识别外来抗原以及合成促炎细胞因子和趋化因子提供能量,在调节炎症反应方面起 关 键 作 用(Subramanian et al.,2013;Jo et al.,2016;West et al.,2017;Forrester et al.,2018;Neagu et al.,2019;Andrieux et al.,2021)。小肽在线粒体中的富集也暗示其对细胞炎症免疫反应的调控作用(Kim et al.,2017)(图3D)。

炎症小体是一种大分子蛋白复合物,其中IL-1β前体通过半胱天冬酶1(caspase 1)转化为生物活性IL-1β,引发IL-1介导的炎症(Weber et al.,2010)。线粒体小肽-47(Mm47,mitochondrial micropeptide-47)被发现在活化的巨噬细胞中差异表达,其对免疫刺激的下调和线粒体定位使其在Nlrp3 介导的炎性小体反应具有调节作用(Bhatta et al.,2020)。然而,Mm47 在调节Nlrp3 寡聚化程度和OMM 招募方面的分子机制仍然未知。此外,线粒体小肽MOTS-c 和Humanin 也被报道能够通过调节衰老细胞的线粒体活性来加剧衰老相关分泌表型(SASP,senescence-associated secretory phenotype)的促炎作用(Kim et al.,2018;Mendelsohn et al.,2018)。

3.5 小肽调控植物生长发育

在植物中,近年研究发现pri-miRNA编码的小肽(miPEPs)发挥了重要的作用,特别是在农艺性状方面。miR172c 是大豆结瘤的正向调节因子(Wang et al.,2019),其过度表达导致结节数量的增加,抑制则具有相反的效果。Couzigou et al.(2016)表明,用合成的大豆miR172c 前体编码的小肽miPEP172c 处理大豆可显著增加根瘤数,而不影响其他根系发育特征,与在大豆中过量表达miR172c 的结果一致。进一步研究还发现,用miPEP172c 处理大豆还可以增加了miR172c 的积累,说明小肽miPEP 可以上调miRNAs 表达(图3E)。并且,与对照植株相比,经miPEP172c处理的植株中ENOD40–1、NIN、NSP1 和Hb2 表达也显著提高,表明miPEP172c 在植物发育过程以及植物-微生物相互作用中都发挥重要作用。这些进展揭示了调节性miPEPs 在改善作物农艺性状中的重要性。

类似地,发现由pri-miR858a 编码的小肽miPEP858a 调节拟南芥类黄酮的生物合成和发育(Sharma et al.,2020)。外源应用合成的miPEP858a可恢复由miPEP858a 缺失导致的拟南芥植物发育缺陷。此外,启动子报告基因分析表明,miPEP858a 具有调控自身启动子活性和GUS 基因转录的作用,暗示miPEPs 具有特定的生物学功能(图3F)。

不定根的形成是葡萄无性繁殖的主要障碍。最近的一项研究发现了外施miR-171d 编码的小肽miPEP171d1 在不定根形成中的重要作用(Chen et al.,2020)。将外源miPEP171d1 导入欧洲葡萄组培苗中,可促进miR171d 的积累和不定根的发育(图3G)。这些结果显示了一种新的miRNA 调节机制,该机制与其相关的miPEP 有关。在拟南芥中,通过对pri-miRNA 来源小肽miPEP164a、miPEP165a和miPEP319a 等的研究(Yadav et al.,2021),发现这些小肽对植株生长都具有明显的促进作用。与对照植株相比,喷洒、浇水、堆肥、添加肥料等外施miPEPs 的植株在茎高、早花、花数增加和花柄高度方面均表现出明显优势。外源施用miPEPs时,植株内的miPEP 总量增加,因此总体上调节了相关miRNAs 的积累。有趣的是,miPEPs 可以在外源施用下发挥作用,这一发现将在农业上有广泛的用途。

在蒺藜苜蓿中外施和过表达miPEP171b 均能使植株内的miR171b 表达升高并抑制其靶基因(Lauressergues et al.,2015)(图3H)。miPEP171b1过表达导致MtmiR171b 累积,从而负调控靶基因HAM 和HAM2,使植株侧根数量减少,表明其在根发育中的重要性。MtmiR171b 和MtmiPEP171b1在烟草中的过表达也具有相似的结果(Lauresser‐gues et al.,2015)。通过对MtmiORF171b 和Mtmi‐PEP171b1 以及突变ORF MtmiORF171b 的相对表达量发现,MtmiORF171b 对MtmiPEP171b1 的翻译作用增加了Mtmir171b 的积累(Lauressergues et al.,2015)。外施和过表达MtmiPEP171b1可增加各自pri-miRNAs、pre-miRNAs 和成熟miRNAs 的积累(图3I)。而用ATT 替代pri-miR171b ORF1 中的ATG 起始密码子后,仍有少量的miR171b 产生,这表明miPEP171b 充当了调节介质并使相关的miRNA积累增加(Lauressergues et al.,2015)。

外源miPEPs 如何进入植物细胞内是限制其在植物中发挥功能的重要问题。一般认为,内吞作用和被动扩散是miPEPs 内化的主要途径(Ormancey et al.,2020)。在用荧光染料标记MiPEP165a 对拟南芥进行外源处理后,观察到miPEP165a 能快速进入根冠和分生组织区,而根部其余部分的渗透延迟(Ormancey et al.,2020)。通过研究进入植株体内的网格蛋白介导途径和膜微结构域途径发现;miPEP165a在根冠、分生组织和根的分化区是被动进入,而在根细胞成熟区的进入受到影响。其中,rem1-2 在miPEP 吸收中受到强烈影响。进一步通过使用化学抑制剂 TyrA23 和 MβCD 分别抑制网格蛋白介导和膜微域途径。结果表明,这些分子阻断了施用miPEP165a 对根长的正向表型效应。这说明miPEPs 可能具有局部效应,而不是系统效应。

4 小结与展望

虽然许多具有sORF 的RNA 曾经被归类为ncRNA,因而在以往的研究中忽视了对这些具有潜在翻译能力的sORF 鉴定,但是越来越多研究结果表明具有生物活性的非编码RNA 来源小肽真实存在并且在生物体内发挥不可替代的功能,使我们重新认识这些非编码RNA 的功能形式(Lu et al.,2004;Ma et al.,2014;Ma et al.,2016;Olexiouk et al.,2018)。本文总结了识别、筛选和鉴定sORF的方法,以及编码小肽的非编码RNA 种类,揭示了非编码RNA 来源小肽在生物体内的多重作用机制与生物功能。这些进展揭示了非编码RNA 来源的小肽具有成为抗肿瘤药物、治疗靶点以及肿瘤生物标志物的巨大潜力,例如作为新型抗肿瘤药物,小肽相比其来源RNA 具有更高的活性,更低的免疫原性和更低的细胞毒性,因此可以合成肿瘤抑制微肽并直接递送到癌症组织(Zhu et al.,2018;Bakhti et al.,2022)。由于小肽易于代谢降解的特点,也使在植物中应用外源合成小肽相比使用转基因手段和化学农药具有更高的安全性,将成为一种新的改善植物农艺性状的手段(Yadav et al.,2021)。这些新发现使研究者开始重新审视过去的非编码RNA 研究,是否由于技术限制了对其编码能力的预测和验证?其编码小肽是否可能发挥与母体RNA 相似的功能,甚至其母体RNA“表现”出的功能是否实际上由其编码小肽执行?分子研究手段的不断发展让小肽的功能与RNA 自身活性得以区分,也强调了在未来的非编码RNA 研究中分离RNA 功能和小肽功能的必要性。此外,一些研究发现mRNA 也具有与其编码蛋白无关的非编码功能,例如一种编码早期减数分裂诱导蛋白1(Emi1)的mRNA 转录本,可从其3’UTR 加工成熟一种功能性长非编码RNA——端粒酶RNA(TER)(Logeswaran et al.,2022)。目前已有定义统一将既能以RNA 形式发挥功能,又能以蛋白形式发挥功能 的RNA 称 为cncRNA (coding and non-coding RNAs),也叫双功能RNA,包括了具有编码功能的ncRNA 和具有非编码功能的mRNA(Kumari et al.,2015)。未来的小肽研究可能会将更多的非编码RNA列入双功能RNA的队伍中。

同时,尽管一些非编码RNA 来源的小肽的重要功能已经被揭示,但是还有许多问题尚未解决。例如,在小肽的筛选和翻译验证方面,如何进一步优化现有检测技术减少假阳性,找到更多可翻译的小肽?决定sORF 成功翻译小肽的关键因素是什么?是否有特定的上下文序列决定sORF 能否进行翻译?无义介导的mRNA 衰变(NMD,nonsensemediated mRNA decay)作为监视机制可降解错误的mRNA,并对虚假翻译做出反应(Lykke-Andersen et al.,2015;Supek et al.,2021)。含 有sORF 的lncRNA 很可能成为NMD 的目标,那么NMD 靶向lncRNA 的程度如何?同时,在对小肽的功能研究方面,如何系统性大量验证小肽的不同生理功能?如何克服小蛋白的研究障碍(如蛋白丰度低、不稳定、缺乏特异性抗体等)?如何改善和优化小肽的结合亲和力和长效呈递能力来实现小肽在疾病中和植物中的实际应用?因此,未来我们不仅仅需要努力扩大和完善小肽检测技术,还需要继续发展各种各样的实验手段来验证和研究小肽的时空表达模式及生物学功能,丰富和完善小肽在生物体中发挥功能的各种分子机制,为利用小肽作为药物研发或者农作物增产的关键靶点和实际应用提供新的思路和方向。

猜你喜欢
核糖体密码子环状
环状RNA在肾细胞癌中的研究进展
核糖体成熟因子RimP、Era和RimJ的研究进展
结直肠癌与环状RNA相关性研究进展
密码子与反密码子的本质与拓展
核糖体生物合成与肿瘤的研究进展
例析翻译过程中核糖体移动方向的判断
10种藏药材ccmFN基因片段密码子偏好性分析
三角网格曲面等残留环状刀轨生成算法
C60二取代化合物与环状二卟啉相互作用研究
茶树CsActin1基因密码子偏性分析