被子植物中核糖体失活蛋白基因家族分子进化研究

2018-08-10 09:32薛亚杰余亚军侯佳佳韩雅彭袁红雨周思源
关键词:蓖麻核糖体失活

薛亚杰,余亚军,侯佳佳,程 柯,韩雅彭,袁红雨,周思源,程 琳*

(1. 信阳师范学院 生命科学学院,河南 信阳 464000;2. 信阳森林工作站,河南 信阳 464000;3. 郑州外国语学校,河南 郑州 450000)

0 引言

核糖体失活蛋白(Ribosome-inacticating proteins, RIPs)是广泛存在于植物界的一类毒蛋白,通过对核糖体大亚基rRNA进行脱嘌呤作用而抑制蛋白质生物合成,在植物中起到防御作用[1].在应用中,利用RIPs构建免疫毒素、抗人类免疫缺陷病毒制剂等,具有广阔的应用前景.根据RIPs的物理特征,可以将核糖体失活蛋白分为三种类型[2, 3]:Ⅰ型RIPs广泛分布在植物中,为一条大约30 kDa的蛋白质单链,见图1A.它具有RNA-N-糖苷酶的活性,包含典型的RIP结构域,能脱去真核生物核糖体28 s rRNA茎环结构SRL的腺嘌呤[4, 5],从而阻止核糖体60 s大亚基和延伸因子II之间的相互作用,抑制后续蛋白质的合成.Ⅱ型RIPs包含一条与I型RIPs相似的A 链和至少两个重复的Ricin_B_Lectin结构域RBL的B链,A、B两条链通过二硫键连接而形成异二聚体[3, 6, 7],见图1B.B链具有植物凝集素的功能,对细胞表面的糖蛋白具有强的亲和力,有助于促进蛋白质跨细胞膜的移位,所以Ⅱ型RIPs通常比Ⅰ型RIPs毒性作用强.第三类RIPs较少见,先合成没有活性的前体RIPs.然后通过对活性位点氨基酸进行酶解加工形成.从19世纪末在蓖麻中分离到第 1 个 RIP——蓖麻毒蛋白(ricin)[8]开始,关于RIPs的研究以及其在转基因工程和医疗方面的应用层出不穷,然而关于RIPs自身的进化以及在被子植物中的进化过程仍不明了.

图1 两种类型的RIP的模式图,其中SP为信号肽Fig. 1 Schematic representation of two types of RIPs. SP: signal peptide

多种研究报道已证实,RIPs主要是通过RNA-N糖苷酶活性或RNA水解酶活性导致生物来源的核糖体失活[9],在植物中具有广谱的抗病毒、抗真菌和一定的昆虫抗性.如林娟等[10]人首次证明麻疯树核糖体失活蛋白是一种RNA-N-糖苷酶,并阐述麻疯树核糖体失活蛋白失活核糖体的分子机制.董槁等[11]阐述植物核糖体失活蛋白的基本特性并从分子水平上讨论核糖体失活蛋白作用于真核细胞核糖体的机制,同时介绍了核糖体失活蛋白的免疫毒素及其在癌症治疗中的应用,为植物核糖体失活蛋白的研究提供新的研究方向和思路.Zhu等[12]从苦瓜籽提取获得的苦瓜素蛋白对植物病毒具有明显的抑制作用,同时也对玉米、小麦的病原真菌具有一定的抗性.尽管核糖体失活蛋白具有广阔的应用价值和前景,但由于条件限制和研究目标的差异,目前尚缺乏全基因组水平上对该基因家族在植物中进化趋势的整体把握.近几年,随着全基因组测序和生物信息学技术的飞速发展,越来越多的研究可以从基因组的角度重新定位,这也为全面了解基因家族的进化规律提供了契机.本研究从植物基因组的角度出发,利用生物信息学手段,深入挖掘不同植物类群基因组中RIPs基因家族成员的构成、序列差异以及功能分化等,重建该超基因家族的进化历史并探讨其总体进化规律.为寻找新型药物、提高植物自身防御反应以及促进作物遗传改良等提供新的途径.

1 材料与方法

1.1 数据的收集及本地数据库的构建

从Phytozome(https://phytozome.jgi.doe.gov/pz/#)、TAIR(http://www.arabidopsis.org/)等公共数据库下载了34个被子植物代表性物种的基因组和蛋白质序列,运用Makeblastdb程序构建本地数据库.

1.2 被子植物RIPs 同源基因的筛选与鉴定

采用 BLASTP和 HMMsearch[13-15]两种检索方法对 RIPs 进行同源基因鉴定.BLASTP检索方法如下:利用蓖麻中已报道的 15条RcoRIPs 氨基酸序列,运用本地BLASTP程序检索本地数据库,E值为1e-10.HMMsearch 检索方法具体如下:首先,在Pfam数据库(http://pfam.xfam.org/)下载RIP(PF00161)结构域以及Ricin_B_Lectin(PF00652)结构域的种子序列[14].其次,利用HMMER软件包中的hmmsearch程序在默认参数条件下进行基于本地数据库的检索,并筛选出符合以下条件的序列作为同源候选基因:E≤1e-5.筛选得到的蛋白质序列进一步用SMART(http://smart.embl-heidelberg.de/)和CDD(http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)网站的批量搜索功能进行验证,同时筛选去掉冗余的序列,经两种方法验证后的序列用于后续分析中.其中II型的RIPs是利用Ricin_B_Lectin结构域的种子序列通过hmmsearch程序在已鉴定的RIPs家族成员中确认.

1. 3 被子植物代表性物种RIPs序列比对

用已公布的蓖麻的15条序列,去除其中结构域不完整的一条,运用DNAMAN2软件进行序列分析.

1. 4 被子植物RIPs 基因家族系统发育树的构建

采用本地的MUSCLE[15]程序在默认参数设置下对植物 RIPs 同源基因序列进行多序列比对.利用RAxML[12]软件,选择Jones-Taylor-Thornton (JTT)模型,bootstrap 检验使用 100 次重复,选用 Maximum Likelihood (ML)法构建 RIP 基因家族的系统发育树.利用MEGA[16]软件选择NJ法建系统发育树,bootstrap 检验使用 1000 次重复.Mrbays软件使用贝叶斯法构建系统发育树,用MEGA软件展示系统发育树.

2 结果与分析

2.1 被子植物 RIPs 同源基因鉴定结果

将BLASTP和 HMMsearch 鉴定的结果进行手工去除冗余,从而得到候选序列.然后针对所获得的候选序列,利用SMART和MEME 分析蛋白结构,剔除不含完整RIP 结构域的蛋白序列.最终发现在所选的 34 种被子植物中,有10种植物中存在RIP基因家族蛋白,共鉴定出79 个 RIPs家族成员(表1,图2).其中模式植物拟南芥以及其他多种植物中没有发现RIPs基因家族成员.单双子叶中均有RIPs基因的分布,但是并不呈均匀分布.双子叶植物中的RIPs主要集中在大戟科,其中最少的是棉花和杨树中只有一个RIP基因,最多的是蓖麻中有15个RIPs基因,同时两种类型的RIPs在物种分布中也呈现一定的特点,蓖麻15个RIPs基因中有近一半编码的是II型RIP,而木薯中所有的RIPs都是以I型的形式存在,这和可可、杨树中的情况一致.单子叶植物中的RIPs基因,主要集中在禾本科.这可能与禾本科作为一类相对较大的科有关,也可能与本研究所选择的代表性物种有关.可以看出在禾本科中RIPs发生了一定程度的扩张,其中RIPs基因的数目明显多于双子叶中的RIPs基因数目.然而禾本科中RIPs绝大部分的都以I型的形式存在,只有玉米和高粱中分别有一个和两个RIPs基因家族成员.将含RIPs基因家族的10个物种构建物种树,并利用CoGepedia网站(https://genomevolution.org/)数据将全基因组重复事件补充.

2.2 被子植物代表性物种 RIP 基因家族的序列比对

选取蓖麻中14条序列,取出RIP结构域进行序列比对, “*”表示构成A链 N-糖苷酶活性位点的氨基酸残基,第一个活性位点酪氨酸(Y)和天冬酰胺(N)之间存在替换,其他活性位点较为保守[3, 17],见图3.

表1 含RIPs基因家族的10个物种信息及RIPs分类Tab. 1 The information of 10 species including RIPs and the classification of RIPs

图2 10种陆生植物中RIP基因家族成员的物种发育关系树Fig. 2 Phylogenetic relationships among 10 land plant species and the distribution of RIP gene family identified*.Genome size in Gb

图3 核糖体失活蛋白的RIP结构域序列比对Fig. 3 Alignment of the RIP domain of ribosome-inactivating protein

注:*表示构成 A 链 N-糖苷酶活性位点的氨基酸残基,是较为保守位点;方框标出的部分这些物种在该位点发生非同义替换

2.3 植物 RIPs 基因家族系统发育分析

为探究被子植物RIPs基因家族的系统发育关系,本研究基于RIPs保守的RIPs功能结构域的氨基酸序列构建了无根ML进化树(图4).根据进化树的拓扑结构,被子植物RIPs基因家族可划分为2个保守的亚家族.这两个亚家族的划分基本与两种类型的RIPs的分类相一致.在亚家族I中,包含了除大戟科之外所有的I型的RIPs.在亚家族II中,包含了所有的II型RIPs,以及大戟科的I型的RIPs,蓖麻以及木薯的I型的RIP序列.同时发现,在两个亚家族中均有单双子叶植物的分布,这说明RIPs基因家族在单双子叶分化之前就已经存在,这和前人[3]关于该基因家族的分子进化研究结果相一致.

上述结果显示,亚家族II中大戟科的I型RIPs与其他的II型RIPs聚在一起,说明这两种植物的I型的RIPs很有可能是由原本II型的RIPs在植物进化的过程中丢失了B链而形成,所以才导致其A链的RIP结构域与其他物种的II型的RIPs具有较高的相似性而聚在一起.亚家族I中特别是禾本科植物中的水稻,存在大量的旁系同源基因,这表明在植物物种分化形成之后,RIPs基因家族在各物种内进行了特异性的扩增.

图4 被子植物RIP基因家族的系统发育进化树Fig. 4 Phylogenetic tree of RIP gene family in angiosperm

3 讨论

核糖体失活蛋白基因编码的RIPs蛋白具有抑制真核生物核糖体合成蛋白质的功能.自发现以来,关于其功能研究以及应用研究不断涌现,转RIPs基因的植物用于增强植物自身制剂抵抗病虫害的能力[18]、核糖体失活蛋白提纯作为抗肿瘤药物[2, 19]等.然而关于该蛋白质在被子植物中的进化分析却未见报道.本文从被子植物代表性物种出发,鉴定成员、序列比对、构建系统发育进化树,旨在为研究核糖体失活蛋白的进化及功能研究提供参考.

3.1 RIPs基因家族的起源和进化

核糖体失活蛋白在植物防御、发育等方面承担着多种重要的生理功能[19-21].通过全基因组扫描,我们在被子植物代表物种中获得79个RIPs基因,但是在绿藻中没有同源拷贝,说明该基因家族为陆生植物所特有,而且该基因数量的大规模扩增主要发生在后期的谱系进化过程中.目前有更多的证据证实,在植物进化的历史中存在多次全基因组重复事件,其中包括发生在十字花科谱系的2次比较近的α和β事件[22-26],所有真双子叶植物共有的一次三倍化事件(γ)[27],以及发生在单子叶植物的谷物和其他禾本科草类分化之前的ρ和σ事件[28, 29].本文在34个被子植物代表性物种中鉴定了79个RIPs基因家族的成员,通过序列比对发现蓖麻中的RIPs具有保守的功能活性位点,只有一个位置发生了氨基酸的替换.同时就鉴定成员的结果发现,RIPs基因在单双子叶植物中呈不均匀的分布,且两种类型的RIPs在单双子叶植物中分布较为悬殊.

3.2 RIPs基因进化过程中的功能分化

遭遇环境胁迫或者掠食者时,植物不能像动物一样移动逃离,只能依靠自己遗传变异来抵抗外界伤害[30].全基因重复是进化的主要驱动力之一,而基因重复及重复后的分化是新基因产生、提高物种适应性以及产生新物种的基础[30-33].基因家族的扩张促使基因拷贝数的增加,而基因拷贝数的增加则与基因功能分化密切相关.基因重复后会发生基因的丢失和保留,保留下来的基因则可以维持原有功能或发生分化[32-35].大部分保留下来的重复基因存在一定的功能偏好性,与物种自身的生理变化相关,帮助其更好地适应环境,同时,也会推动基因调控网络的进化[36-38].根据对鉴定出的RIPs基因的数目以及在不同物种中的分布不难看出,以双子叶中蓖麻中含有为数最多的II型RIPs,其他物种中II型的RIPs总数也比蓖麻中的数量少.其他多个物种如禾本科水稻、小米等,都只有一种类型的RIPs存在,且都是I型的不具有破坏真核细胞核糖体的功能,这很有可能与人类长期的驯化和遗传育种过程有关[20, 21].这些结果表明,这些基因在不同植物物种中已经发生了功能分化,并且对应了基因功能分化的不同类型.

4 结论

利用生物信息学分析方法,对被子植物代表物种RIPs基因进行筛选、鉴定和进化分析,在10个被子植物物种中鉴定出79个RIPs基因家族成员;通过序列比对和系统进化树的构建,发现RIPs在单双子叶分化之前就已存在,为适应复杂的环境而出现在早期陆生植物中,随后在长期进化过程中不断发生谱系的扩张和拷贝丢失,最后通过功能分化在不同植物中保留下来,其在被子植物进化的过程中有物种特异性.这些结果将为进一步阐明RIPs在被子植物中的进化模式和理解被子植物中类似基因家族的进化规律提供参考.

猜你喜欢
蓖麻核糖体失活
核糖体成熟因子RimP、Era和RimJ的研究进展
中科院物理研究所等发现钠通道快速失活新机制
核糖体生物合成与肿瘤的研究进展
例析翻译过程中核糖体移动方向的判断
研究揭示哺乳动物高温保护机制
巧嘴绕口令
蓖麻蒴果剥壳过程中的力学性能有限元仿真
Antipulp和亚砷酸失活剂用于恒磨牙牙髓失活的效果比较
蓖麻防害虫效果佳
蓖麻醇酸锌在除臭方面的应用