致病性大肠杆菌非编码小RNA(sRNAs)的研究进展

2022-12-29 22:41:42李干武江丰伟
中国预防兽医学报 2022年4期
关键词:信息学碱基靶标

杨 延,毛 曌,李干武,江丰伟

(中国农业科学院哈尔滨兽医研究所,黑龙江 哈尔滨 150069)

细菌非编码小RNA(Small non-coding RNAs,sRNAs)是一类长度介于40 nt~500 nt 不编码蛋白质的RNA 分子,其半衰期短,常作为基因表达的调节物。sRNAs 多由一段多变的靶标结合序列、保守序列和不依赖于Rho 因子的转录终止序列等3 部分组成[1],其形成的二级结构多存在茎环结构,该结构显著提高了sRNAs 的稳定性[2]。sRNAs 与靶基因的配对方式多样,根据配对方式的不同,可以将细菌sRNAs 分为顺式编码的sRNAs(Cis-encoded sRNAs)和反式编码的sRNAs(Trans-encoded sRNAs)。顺式编码的sRNAs 存在于质粒、染色体、转座子等多种位置,由调控靶基因的反义链编码而来,能与靶基因的mRNA 完全互补配对。反式编码的sRNAs 是由与编码靶标mRNA 的基因完全不同的基因组位置转录而来,这些sRNAs 与靶标mRNAs 的互补性较小且多依赖Hfq、ProQ、CsrA 等RNA 伴侣蛋白来维持其结构稳定性和功能的发挥[3]。作为细菌众多调控网络中的重要分支,sRNAs 通过直接或间接的作用方式在转录后水平调控靶基因的表达,进而对外界环境刺激做出迅速的反应。由于sRNAs 在调控基因表达方面存在耗能低、反应快等优势,因此针对sRNAs 及其生物学功能的研究一直是近年来的研究重点。

1984年,Mizuno等首次发现大肠杆菌(Escherichia coli,E. coli)中存在一个174 nt 的sRNAmicF,可以在环境胁迫条件下通过RNA/RNA 碱基配对的方式抑制外膜孔蛋白OmpF 的翻译[4]。但是,大肠杆菌sRNAs 的研究受制于传统的序列分析及实验技术因而进展缓慢,在近30 年的时间里仅发现了4 种sRNAs[5]。21 世纪以后,随着对sRNAs 结构及靶标序列特征的深入研究,研究者开发了许多高精度识别sRNAs 的生物信息学分析程序,比如SIPHT 和NAPP等[6]。2001 年Liron 等首次在大肠杆菌全基因组水平筛选并验证了14 个新型sRNAs[7],生物学技术的发展推动了sRNAs的不断发现。这些生物信息学算法及后续的荧光定量PCR(RT-qPCR)和Northern blot 等能够准确反映生物体内sRNAs 的实际表达情况,使得sRNAs的发现迅速加快。截止目前,在sRNAmap数据库已记载了数百种sRNAs,其中以大肠杆菌和沙门氏菌中发现的最多。因此,发现并验证sRNAs 的存在已经不能阻碍sRNAs 的研究,有关sRNAs 的研究更倾向于对sRNAs 生物学功能的探究、靶基因的鉴定、sRNAs调控靶基因的分子作用机制以及sRNAs 的应用前景等方面。

近年来随着多组学技术的迅速发展,sRNAs 在调控致病性大肠杆菌毒力基因表达中发挥的重要作用也得到了探究,同时也发现了许多新的作用机制。本文主要对致病性大肠杆菌sRNAs 的生物学功能、sRNAs 靶基因的筛选、sRNAs 对靶基因调控的分子作用机制等方面进行系统的阐述,旨在明确sRNAs在大肠杆菌致病过程中发挥的作用,为研究致病性大肠杆菌sRNAs 在调控毒力基因表达方面提供新视野,为防控该类疫病提供理论基础。

1 靶基因确定

随着生物学技术的发展,研究者在全基因组水平高精度预测并证实了数百种sRNAs。但有关sRNAs 靶基因的研究仍相对较少,远远跟不上sRNAs的发现速度,因此极大地限制了sRNAs作用机制的研究。究其原因,一方面是因为sRNAs 与mRNAs 发生有限的碱基互补配对且不存在杂交热点区域;另一方面是因为在不同环境刺激下,同一种sRNA 往往靶向不同的mRNAs,增加了靶基因寻找的难度。为了能够更好的从分子水平解析sRNAs的作用机制,靶基因的寻找是实现这一目标的关键。目前对于靶基因的寻找方法,主要归结为以下4 类:

1.1 生物信息学方法预测靶基因sRNAs 靶基因的筛选可以通过生物信息学的方法进行预测,常用的生物信息学软件包括TargetRNA 2[8]和CopraRNA[9]等。TargetRNA 2 可在线预测细菌sRNAs 调控的mRNAs 靶标及其结合位点。该预测软件根据细菌sRNAs 的保守性、sRNAs 的二级结构、候选靶基因的二级结构以及sRNAs 与每个候选靶标之间的杂交能量,对可能的调控靶标进行筛选,进而快速、准确地识别sRNAs 的作用靶标[10]。但由于其数据库内参考菌株较少,对于非参考菌株sRNAs 靶基因的筛选存在不确定性。CopraRNA 是一种将系统发育信息整合到基因组水平上进而预测sRNAs 靶标的比较预测算法。该算法根据不同生物体中同源靶标的保守性,通过功能富集分析和网络分析后重建调控网络,进而精准识别sRNAs 的靶基因。分析表明,CopraRNA 可以极大改善靶基因的生物信息学预测水平,与Target-RNA 2 相比假阳性率显著降低,且该方法适用于非参考细菌sRNAs 靶基因的识别[11]。

尽管这些生物信息学预测的方法可以有效地筛选候选靶标,极大地降低寻找靶标的盲目性。但是由于这些预测方法多是基于碱基配对的基本原则,针对mRNA 中的碱基位点进行预测,忽视了sRNAs可以通过与蛋白直接互作的方式调控靶基因。因此,该方法在预测sRNAs 的靶标方面具有一定的局限性。另一方面,生物信息学方法预测的结合靶标是否真实可靠,经软件预测的互作又是否在细菌体内真实发生,这些情况均需要在生物体内进一步验证。为此,研究者开发了一系列实验技术用以筛选sRNAs 的靶标。

1.2 通过Hfq 蛋白筛选sRNAs 调控的靶基因大肠杆菌中约40%的已知sRNAs 需要通过分子伴侣蛋白Hfq 的桥梁作用与靶基因相互作用。Hfq 通过与细菌sRNAs 的富含AU 的单链区紧密结合,对sRNAs 产生很强的保护作用,显著促进了sRNAs 的稳定性,同时Hfq 还能与sRNA 的靶标mRNA 结合,促进sRNA与其靶标mRNA 的相互作用[12]。因此,根据免疫共沉淀(Co-IP)的原理,通过在hfq基因C-端添加FLAG 标签的方式构建3×FLAG-hfq标签菌株,FLAG标签能与吸附在亲和介质上的FLAG 抗体相互作用,从而将与Hfq 特异性互作的RNA 沉淀下来,再通过转录组测序的技术对洗脱并纯化的mRNA/sRNA 测序,完成对分子伴侣Hfq 蛋白参与下的sRNAs 靶向位点的筛选[13]。但是,由于Co-IP 本身存在非特异性结合的缺点,常导致后期的筛选困难;而且由于这类依赖Hfq 辅助的sRNAs 通常利用反式编码的方式与靶基因形成不完全互补的碱基配对,忽视了那些与sRNA 形成顺式编码互作的靶基因,因此该方法在进行sRNAs 靶标筛选时存在一定的局限性。

1.3 转录组测序筛选靶基因转录组测序筛选靶基因,是通过比较野生株、sRNAs 缺失株以及sRNAs过表达菌株中差异表达的基因进而筛选靶基因的方法。该方法将目标sRNAs 克隆在异源质粒PBAD的启动子之后,通过阿拉伯糖对sRNAs 进行短时间(10 min~15 min)诱导,诱导生成的sRNAs 能够直接靶向mRNAs,进而通过转录组测序技术比较sRNAs过表达菌株和野生株之间差异表达的基因。该方法能够避免长时间诱导sRNAs 所导致的间接调控效应[14],同时可以结合生物信息学预测的方法,显著缩小候选靶标的筛选范围。

通过这种方式,Choi 等将sRNAsdsR克隆至质粒pHM4T 中构建了重组质粒psdsR,在利用阿拉伯糖诱导sRNAsdsR短时间过表达后,通过转录组测序技术筛选出sRNAsdsR过表达菌株与野生株中存在2 倍以上表达差异的209 种mRNAs。最后,结合CopraRNA软件及构建人工sRNAs 的方法,筛选并验证了sRNAsdsR在大肠杆菌MG1655 生长稳定期调控的靶基因—yhcB[12]。

1.4 蛋白质组学技术筛选与sRNAs 直接相互作用的靶基因蛋白质组学技术一般用于分析sRNAs 在整体层面上调节转录后基因表达水平的变化,该方法有助于识别出翻译水平上受sRNAs 调控的靶分子,以及在转录组分析过程中被忽视的靶分子。该方法通过iTRAQ 和LC-MS 技术寻找那些在sRNAs 缺失株和野生株中显著差异表达的蛋白质,进而根据差异表达蛋白的特性筛选出sRNAs 的靶向位点。在大肠杆菌HMS174 sRNAS-20的研究中,研究者利用蛋白质组学技术,通过比较野生株和诱导sRNAS-20表达菌株在对数生长期差异表达的蛋白质,发现了存在明显差异表达的蛋白TrpB和GlyRS,这两种蛋白质分别调控氨基酸合成和甘氨酰-tRNA 的合成。在此基础上研究者通过体外翻译实验验证了sRNAS-20对trpB、glyRS基因表达具有直接调控的作用,从而证实了S-20通过对这些靶基因的调控进而介导对大肠杆菌的生长抑制[15]。

此外,核糖体图谱(Ribo-seq)[16]、差异性RNAseq(dRNA-seq)[17]、通过连接和测序进行sRNA 靶标识别(GRIL-Seq)[18]等技术也先后应用于sRNAs 靶基因的预测,这些方法显著地提高了sRNA 靶基因的寻找速度,具有广泛的应用前景。

2 作用机制

原核生物由于自身结构的特异性,其基因的转录和翻译是偶联在一起的。因此前期的研究认为在原核生物中,转录水平上的调控相对于转录后水平的调控更加高效,是原核生物基因表达的主导调控方式。但随着对基因表达调控方面研究的深入,发现原核生物也存在许多与真核生物类似的microRNA调控、蛋白质调控等转录后水平的调控现象。这些调控方式通过解除转录和翻译的偶联来微调基因表达,在基因表达调控中同样发挥着不可替代的作用,也因此成为近年来的研究热点。相对于蛋白质介导的翻译水平的调控,sRNAs 介导的转录后调控具有生成速度快、耗能低、易降解等特点,在细菌应对外界环境压力时表现出明显的优势,因此引起研究者的广泛关注。有研究表明,sRNAs 不仅可以通过与其靶标之间的相互作用直接促进或抑制基因的表达,还可以作为诱饵与RNA 结合或与蛋白结合,间接调控基因的表达[19]。目前,原核生物sRNAs的作用机制可按照其调控靶基因的方式分为直接调控、间接调控以及构建调控网络进行调控等。

2.1 直接调控

2.1.1 sRNAs 与mRNAs 通过碱基互补形式发挥直接调控作用 随着生物信息学预测软件的发展更新,使得高精度识别sRNAs 的靶标mRNAs 并寻找mRNA中的碱基互补位点得以实现。细菌sRNAs 与mRNAs通过互补配对的方式调控靶基因的表达已成为现阶段研究最为广泛的sRNAs 介导的调控机制。sRNAs与mRNAs 的碱基互补区域也从单一的核糖体结合位点(Ribosome binding site,RBS)扩展到5'非翻译区(Untranslated region,UTR)、3'UTR 等一至多个区域。在大肠杆菌MG1655 中,顺式编码的sRNAryeA的碱基序列能够与sdsR-pphA双顺反子5'UTR 完全碱基互补,抑制sRNAsdsR和PphA 蛋白的表达,影响磷酸酶的产生[20]。另外,反式编码的sRNAgadY通过与mRNAgadX的3'UTR 进行碱基互补配对,进而抑制RNase 对gadX基因的降解,促进GadX 的表达,使得大肠杆菌可以抵御外界的酸性环境[21]。

2.1.2 sRNAs 与蛋白质相互作用 sRNAs 除了通过与靶基因mRNA 直接进行碱基互补配对发挥作用以外,还可以通过直接结合靶蛋白发挥作用。相对于sRNAs 与mRNAs 的互作方式,sRNAs 与蛋白质的直接互作由于缺乏相应的生物信息学预测方法,导致有关sRNAs 与蛋白直接互作的研究相对较少且进展缓慢,但已有的研究表明这种调控方式在细菌适应环境刺激方面发挥着重要的作用。例如,在大肠杆菌中,CsrA 作为一种具有全局性调控作用的RNA 结合蛋白,可以结合多种靶mRNAs 的5'UTR GGA 基序,进而影响靶mRNAs 的稳定和(或)翻译。而sRNAcsrB能够在细菌生长对数期或营养缺陷的情况下被诱导表达,直接与CsrA 蛋白的多个亚基结合,从而遮盖了CsrA 的活性位点,导致CsrA 活性降低进而影响细菌的核心碳通量[22]、生物被膜(Bacterial biofilms,BF)[23]、运动性[24]等多种生物表型。

2.2 间接调控研究发现,sRNAs 除了通过与靶位点直接结合发挥生物学作用外,还可以利用sRNAs间的相互作用,消除阻遏物sRNAs,进而激活其靶mRNAs 的翻译,间接调控基因表达。这类sRNAs,通过与具有潜在沉默子功能的特定sRNAs 碱基互补配对,阻碍特定sRNAs 发挥沉默基因的功能,减轻阻遏物sRNAs 对靶mRNAs 的抑制作用进而促进蛋白质合成。例如,大肠杆菌中编码谷氨酸/天冬氨酸ABC 转运蛋白的gltIJKL 操纵子,能够在gltI-gltJ的顺反子间隔产生一个不依赖Rho 的RNA,该RNA 在RNase E 的参与下产生一个长160 nt 的sRNAsroC[25]。sRNAsroC可以通过碱基互补配对的方式与抑制gltIJKL 操纵子活性的sRNAgcvB相互作用,进而解除了受sRNAgcvB抑制的整簇基因的表达[26]。Choi 等人2018 年在大肠杆菌首次发现一种新型的毒素-抗毒素(T/A)系统,其毒素SdsR 和抗毒素RyeA 均为sRNAs,且由同一基因非编码间区的DNA不同链编码而来。毒素SdsR可抑制编码内膜蛋白的基因—yhcB的表达,引起细胞丝化进而导致细菌死亡,抗毒素RyeA 可以通过与sRNA SdsR 形成完全碱基互补配对的sRNAsRNA 二聚体结构进而抑制sRNA SdsR 杀菌功能的发挥,从而保证大肠杆菌的正常生存[20]。

2.3 调控网络随着研究的深入,研究者发现,细菌的适应性调控不仅可以通过单个sRNA 直接影响单个或多个基因的表达,而且还存在多个sRNAs 共同作用调控细菌适应性的复杂调控网络系统。其中研究较为清楚的有两种:(1)sRNAs 分级调控系统,即第一个sRNA 结合并充分重排其靶标,从而为第二个sRNA 提供结合位点。这种调控级联中,两个或多个不同sRNAs 与它们的靶标之间发生顺序相互作用从而调控基因表达的方式称为分级调控[27]。例如,在大肠杆菌中sRNAglmY和sRNAglmZ组合形成调节级联,依次调控mRNAglmS的表达,进而促进编码氨基糖代谢中的一种必需酶—氨基葡萄糖-6-磷酸合成酶GlmS 的合成[28]。(2)多种sRNAs 分别调控同一基因表达。在大肠杆菌中,sRNAomrA、oxyS和arcZ均可以抑制编码大肠杆菌鞭毛合成的fhlDC操纵子的表达且不存在功能冗余[29]。

3 生物学功能

sRNAs 作为细菌响应外界环境变化的一种适应性调控机制,对细菌的生长、增殖具有重要的调节作用。在致病性大肠杆菌中,它们的主要功能表现在调控毒力基因的表达、参与BF 形成、参与环境应答调控等多个方面。

3.1 调控毒力基因的表达致病性大肠杆菌在侵入机体后,为应对宿主的杀伤机制,会产生sRNAs 以迅速调控毒力基因的表达,促进细菌的粘附和侵袭,进而增强细菌对宿主的适应能力。近年来,有关肠道外致病性大肠杆菌(Extraintestinal pathogenicE. coli,ExPEC)sRNA 的报道逐渐增多,sRNA 在调控大肠杆菌毒力基因表达方面的作用也越发明显。在肠出血性大肠杆菌(EnterohemorrhagicE. coli,EHEC)O157:H7 菌株中,肠细胞抹除位点(Locus of enterocyte effacement,LEE)致病基因岛和志贺氏毒素作为研究最为深入的毒力因子,其表达情况受到多水平的调控,sRNAs 在其中也起着不可或缺的作用。例如,sRNAdicF可以感知宿主结肠内的低氧环境进而通过结合于mRNApchA的核心编码区(Coding sequence,CDS)以促进mRNApchA的表达,进而促进LEE 致病基因岛的表达,导致肠上皮细胞发生明显的脱落病变,引起血性腹泻和溶血性尿毒症综合征的暴发[30]。此外,Wang 等发现sRNAcsrB/C也可以通过调控csrA基因的转录,从而促进LEE 致病岛上ler(LEE 基因的主要调控子)、escT(LEE1 编码基因)、escC(LEE2 编码基因)等基因的表达[31]。Brandon等发现,编码志贺氏毒素的stx1A基因上游存在一个长为74 nt 的sRNA—stxS,该sRNA 可以在Hfq 蛋白的参与下,直接结合于志贺氏毒素基因stx1B的核糖体结合位点进而抑制志贺氏毒素在细菌溶源期的表达[32]。

近期的研究发现sRNAs 在调控尿路致病性大肠杆菌(UropathogenicE. coli,UPEC)致病过程中也发挥着重要作用。Porcheron 等在2014 年首次发现UPEC CFT073 菌株中的sRNAryhB,对于UPEC 在膀胱中的持久性定植起到关键作用。在小鼠感染模型中,sRNAryhB通过调节产气菌素相关mRNAiucD的表达,进而调控铁载体总量的表达,最终使得UPEC在宿主泌尿道内定植[33]。Khandige 等在研究中发现,UTI89 在侵染膀胱上皮细胞PD07i 后,促使sRNApapR在菌体内富集,该sRNA 在Hfq 的参与下与靶基因papI进行碱基互补配对进而调控P 菌毛的表达,从而促进UPEC 在膀胱上皮的黏附和侵袭[34]。

新生儿脑膜炎大肠杆菌(Neonatal meningitisE.coli,NMEC)作为一种严重威胁人类健康的ExPEC,可造成新生儿出现脑膜炎症状,具有极高的致死率,其毒力基因的表达也受到sRNA 的调控。孙浩等在研究中发现NMEC RS218 在yfdP-orf基因间区存在一个新型的sRNA—sRNA17。该sRNA 在氧气感应调节因子ArcAB 的调控下,通过感知血液内的微氧条件进而下调自身的表达,从而促进glnP基因的表达,导致NMEC 在血液中的存活能力增强并有利于其穿越血脑屏障[35]。

3.2 参与BF 的形成细菌BF 是由细菌分泌到细胞外的多糖、蛋白质、核酸、脂质和生物表面活性剂等成分聚合形成的膜状结构。该结构可以直接影响细菌的一系列生理行为,包括生物发光、毒力因子的表达、对抗生素的抗性以及浮游和固着生活方式之间的转变[36]。研究表明,BF 的形成受到多个水平的调控,sRNA 所介导的转录后水平调控在其中也发挥着不可替代的作用。在大肠杆菌中,许多sRNAs(omrA、omrB、mcaS、rprA、gcvB、rydC和rybB)都可以将信号传送到遗传网络中形成复杂的调控网络,以非冗余的形式调控csgD基因的表达,csgD基因是编码大肠杆菌胞外纤维状蛋白的重要组成部分,可以直接影响BF 的形成。其中sRNAsomrA、omrB、rydC、rybB通过抑制核糖体的结合进而抑制csgD的表达,而sRNAmcaS通过招募核糖核酸内切酶裂解csgD基因5' UTR 的A/U 富集区进而抑制其表达[37]。这些sRNAs 通过调控大肠杆菌BF 的形成,进而增强其抵御外界不良环境的能力并提高其对抗生素的耐受能力,更有利于大肠杆菌在动物机体的定植并发挥致病作用。

3.3 参与环境应答调控为了实现在动物体内的定植,肠道内致病性大肠杆菌(Intestinal pathogenicE. coli,IPEC)必须适应机体内不断变化的环境压力,比如胃肠道内的低氧、低pH、低离子环境等,sRNAs 在其中发挥着重要的作用。Lay 等在2012 年证实sRNAsarcZ、omrA、omrB、oxyS、sdsR和gadY等可以抑制大肠杆菌的移动,而sRNAsmcaS、micA可以促进大肠杆菌的移动,这些sRNAs 可以协同调控大肠杆菌的运动性使菌体向适宜的生存条件移动[29]。Bak 等发现,大肠杆菌MG1655 在酸性环境下(pH5)可以诱导sRNAdsrA和rprA的表达,进而上调转录活化因子RpoS 的表达,导致Ⅱ型酸耐受系统(Acid resistance 2,AR2)的活化,从而增强大肠杆菌对胃酸等低pH 环境的适应能力[38]。在大肠杆菌K12株的Csr 信号通路中,sRNAcsrC和其同源类似物sRNAcsrB可以直接与CsrA 蛋白相互作用并抑制其功能的发挥,一方面可以促进糖原的合成和分解代谢[39]、糖异生[40]和BF 形成[23];另一方面可以抑制糖酵解运动[41]、鞭毛合成[24]和乙酸酯代谢[40]。通过sRNA 调控生物合成代谢的过程,使细菌能够迅速响应外界环境的变化,进而完成其生长和增殖等生命过程。

4 小结与展望

sRNAs 介导的转录后调控具有合成快、半衰期短、功能多样等特点,是细菌响应外界环境变化进而做出迅速应答的适应性调控机制,一直是人们研究的热点。近年来,随着sRNAs 筛选及其靶点鉴定相关技术的不断发展与更新,使得越来越多的sRNAs 及其作用机制被揭示。同时,sRNAs 的实际应用价值也得到了逐步开发,最新的研究显示,人工合成的sRNAs 已经被用以改造大肠杆菌以提高免疫球蛋白IgG 的产量,该产物在治疗自身免疫性疾病和肿瘤相关疾病方面发挥重要的作用[42]。同时,通过向工程菌导入质粒介导的人工合成的sRNAs,极大地提高了苯酚、1, 5-戊二胺、腺苷甲硫胺酸、正丁醇、N-乙酰氨基葡糖(GlcNAc)等工业用品的产量,并且部分改造的工程菌已经成功应用于工业生产中,产生了巨大的经济价值。但有关sRNAs 对病原菌毒力基因表达调控方面的研究还相对较少,在这方面的应用价值仍待进一步发掘。因此,从sRNAs角度揭示病原菌的致病机制,解析sRNAs 在毒力基因表达中所发挥的作用将是下一步的研究重心,这将为疫病的防控提供重要的理论基础,为开发新的药物靶点提供新思路。

猜你喜欢
信息学碱基靶标
鸡NRF1基因启动子区生物信息学分析
“百灵”一号超音速大机动靶标
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
纳米除草剂和靶标生物的相互作用
世界农药(2019年3期)2019-09-10 07:04:10
生命“字母表”迎来4名新成员
科学24小时(2019年5期)2019-06-11 08:39:38
生命“字母表”迎来4名新成员
发明与创新(2019年9期)2019-03-26 02:22:48
初论博物馆信息学的形成
中国博物馆(2018年2期)2018-12-05 05:28:50
复杂场景中航天器靶标的快速识别
前列腺特异性膜抗原为靶标的放射免疫治疗进展
肿瘤影像学(2015年3期)2015-12-09 02:38:45