董章勇, 陈欣瑜, 舒永馨,罗 梅,向梅梅
(仲恺农业工程学院,广东 广州 510225)
【研究意义】茄子是一种十分重要的农作物,在我国的栽种面积逐年增加。至今为止,茄子的栽种面积高达20余万hm2[1]。近年来,茄子病害的发病程度与日俱增,其中茄子枯萎病是一种对农业生产影响严重并且非常常见的土传性病害,其发病率在10 %~40 %[2]。茄子枯萎病发病流行期可使植株整株死亡,使病田中茄子产量减产20 %~30 %[3]。茄子枯萎病在农业生产中有“难防治,防治效果差”的特点。引起茄子枯萎病菌的病原物是由尖孢镰刀菌所引起的。尖孢镰刀菌属于半知菌亚门(Deuteromycotina)梗胞目(Moniliales)镰刀菌属(Fusarium)[4]。Snyder和Hansen把镰刀菌属里面组内的全部的种都合为1个种,并命名为尖孢镰刀菌(Fusariumoxysporum)[5]。而由尖孢镰刀菌是引起的茄子枯萎病对茄科作物的危害极大,能够在对农业生产上造成严重的经济损失[6]。尖孢镰刀菌的防控是十分艰难的,主要是因为它不仅能在宿主植物中存活,还能在土壤及空气中存活8年以上并且仍然能够表现出非常强的致病性[7]。对于其致病机理的研究显得尤其重要。而效应蛋白被认为在植物病原物与寄主间的相互作用中发挥着重要的作用。【前人研究进展】效应因子(effector)也称效应子或效应蛋白,广义上是指能够选择性地结合其他目标蛋白及调节其生物活性的一类小分子蛋白[8-11]。依据病原菌效应分子的特点,绝大多数效应分子都是分泌蛋白[9,12]。效应分子一般具有以下特征:①含有N-端信号肽;②没有跨膜结构域;③定位于细胞质;④序列具有特异性;⑤富含半胱氨酸;⑥重复元件多;⑦小分子蛋白[13-14]。前期有众多关于病原菌效应蛋白的研究。【本研究切入点】本研究以本实验室前期测序获得的茄子枯萎病菌菌株Fomg14004全基因组的16485个蛋白序列为研究材料进行效应子的筛选。依靠前述的7个特点以及病原互作数据库(PHI)进行候选效应子的初步筛选。研究结果一方面为茄子枯萎病菌的致病机理研究建立材料基础,另一方面为其它植物病原菌的效应因子筛选提供方法参考。【拟解决的关键问题】筛选出茄子枯萎病菌效应蛋白,为进一步研究其功能提供材料。
茄子枯萎病菌菌株Fomg14004的全基因组序列来自本实验室测序组装预测数据,共16 485个蛋白质序列。
1.2.1 分泌蛋白组的预测 利用SignalP v4.1进行信号肽的预测[15]。得到具有信号肽的蛋白序列。利用TMHMM v2.0 (http://www.cbs.dtu.dk/services/TMHMM/)进行跨膜层数的预测[16-17]。将具有信号肽的蛋白序列文件提交。得到跨膜数小于2的蛋白序列。采用TargetP v1.1(http://www.cbs.dtu.dk/services/TargetP/)分析软件[18]。将跨膜层数小于2 的蛋白序列进行筛选。使用ProtCompv9.0(http://linux1.softberry.com/berr y.phtml?topic=protcomppl&group=programs&subgroup=proloc)在线分析软件[17]。筛选出蛋白质定位于细胞质器中的蛋白序列。
1.2.2 分泌蛋白组的特征分析 利用perl工具进行分泌蛋白组的特征分析,分析出经过分泌蛋白组预测的蛋白序列的长度特征。将最终结果复制到Excel中进行统计,并作图。
1.2.3 效应因子的致病性预测 在Linux系统中采用perl程序对经过分泌蛋白组预测的蛋白序列进行cysteine含量分析。筛选出cysteine含量大于等于6的蛋白序列,并进行cysteine含量柱形图统计。使用T-Reks(http://bioinfo.montp.cnrs.fr/?r=t-reks/)在线分析软件[18]。得到高重复性高氨基酸含量的蛋白序列。再使用PHI数据库进行蛋白序列的分析(http://www.Phi-base.org/downloadLink.htm)。将小于或等于300个氨基酸残基的小分子蛋白序列挑取出来,作为候选的致病效应因子。
茄子枯萎病菌全基因组共16 485个蛋白序列。经过SignalP v4.1分析后得到1601个具有信号肽的蛋白序列;然后经过TMHMM v2.0分析得到1481个跨膜数小于2的蛋白序列;1481个具有信号肽的蛋白经过TargetP v1.1分析得到1449个定位为S的蛋白序列;最后经过ProtComp v9.0分析,得到1376个蛋白质定位于细胞质中的分泌蛋白序列。
将1376个蛋白序列进行长度分析后,得到516个蛋白序列长度小于300(图1),占37.5 %;632个蛋白序列长度在300~599,占45.93 %; 178个蛋白序列长度在600~999,占12.94 %;46个蛋白序列长度在1000~2000,占3.34 %;4个蛋白序列长度大于2000,占0.29 %。
图1 1376个基因蛋白长度分类Fig.1 1376 gene protein length classification
2.3.1 分泌组蛋白的半胱氨酸含量和重复元件分析结果 将1376个蛋白序列进行cysteine含量分析,得到cysteine含量大于等于6的蛋白序列共733个(图2)。将733个cysteine含量大于或等于6的蛋白序列进行multiple tandem repeats分析。最终得到219个multiple tandem repeats大于或等于9的蛋白序列。
2.3.2 病原寄主互作数据库分析比对结果 将富含半胱氨酸且高重复性的219个蛋白序列和Pathogen-Host Interaction database(PHI)数据库进行比对。共216个蛋白在PHI数据中获得注释。其中,97个蛋白被证明缺失后会造成致病力减弱(reduced virulence),占总数的50 %;11个蛋白缺失后会完全失去致病力(loss of pathogenicity),占总数的6 %,推测其为致病因子;10个蛋白已被证明是植物无毒效应因子(Effectors),占总数的5 %;其中17个Mixed outcome蛋白序列里面有7个蛋白序列分别为失去致病力-毒性减弱和毒性减弱-失去致病力,归为候选效应因子,占总数的4 %;剩余的65个蛋白则被认为是不影响病原的致病力的,占总数的33 %。因此,作为候选效应因子的基因共有125个,其中包括:植物无毒效应因子10个,致病力减弱基因97个,致病力丧失基因11个,混合型基因7个,具体分类及基因功能如表1所示。
图2 733个分泌基因的半胱氨酸含量分类Fig.2 Number of cysteine residues of the 733 secretome genes
2.3.3 小分子蛋白的筛选结果 一般的效应因子都是小分子蛋白,其蛋白序列长度均应小于300个氨基酸,因此,将上述步骤获得的125个基因序列进行长度筛选,去除大于300个氨基酸的蛋白序列。最终得到29个基因序列,这29个基因序列则被认为是候选致病相关效应因子(表2)。
表1 219种蛋白的基因功能的汇总Table 1 Summary of gene functions of 219 proteins
表2 29个候选致病相关效应因子Table 2 29 candidate pathogenic effectors
续表2 Continued table 2
序号Code基因名称Genename蛋白长度ProteinlengthCysteine数目Thenumberofcysteine基因的功能Genefunction6g2630.t127913毒力减弱Reducedvirulence7g2867.t119213毒力减弱Reducedvirulence8g4309.t11976毒力减弱Reducedvirulence9g4311.t12039毒力减弱Reducedvirulence10g5742.t124826毒力减弱Reducedvirulence11g5896.t12298毒力减弱Reducedvirulence12g5964.t113011毒力减弱Reducedvirulence13g6744.t12627效应子(植物无毒性决定簇)Effector(plantavirulencedeterminant)14g7829.t11088毒力减弱Reducedvirulence15g8388.t12079毒力减弱Reducedvirulence16g9248.t12939毒力减弱Reducedvirulence17g10142.t11978毒力减弱Reducedvirulence18g10352.t12288效应子(植物无毒性决定簇)Effector(plantavirulencedeterminant)19g10355.t12966毒力减弱Reducedvirulence20g11621.t12147毒力减弱Reducedvirulence21g12071.t12916毒力减弱Reducedvirulence22g12442.t124020毒力减弱Reducedvirulence23g12923.t12646毒力减弱Reducedvirulence24g13311.t12967毒力减弱Reducedvirulence25g13540.t12808毒力减弱Reducedvirulence26g13889.t118110毒力减弱Reducedvirulence27g15041.t12997毒力减弱Reducedvirulence28g15627.t12819毒力减弱Reducedvirulence29g16404.t12929毒力减弱Reducedvirulence
病原菌是通过分泌一定数量的效应因子到寄主体内完成侵入、定殖和扩展,从而实现致病过程,因此效应因子是植物病原菌的重要功能蛋白[8-11,20]。随着大量病原真菌基因组测序的完成,许多植物病原真菌基因组的效应因子被逐渐预测和分析。曹友志[17]利用杨生褐盘二孢菌(Marssoninabrunnea)全基因组数据,基于真菌效应因子的普遍特征,利用生物信息学工具预测出约106个符合要求的候选效应因子基因。李孟琼[18]从稻瘟菌数据库中的到21个效应因子基因的开放阅读框序列。由此可见,效应因子在各个物种维持正常生命活动中扮演着重要角色,但在不同物种中效应因子的功能差异很大。本论文首次对茄子枯萎病菌Fomg14004 全基因组的16 485个蛋白质的氨基酸序列进行预测,除了使用SignalP v4.1, TargetP v1.1, TMHMM v2.0和ProtComp v9.0等主流分泌蛋白分析软件进行筛选外,还结合半胱氨酸含量、蛋白重复序列,PHI数据库比对以及小分子蛋白筛选等步骤,最终获得29个候选致病效应因子。与上述已经报道到的其他真菌的全基因组效应分子的预测所得到的数量相比,本次试验所得的候选效应分子的数量更少、更严谨,也更有利用下游的基因功能验证实验。
目前,效应子虽然已经归纳出了一些分析特征[23-25],依照不同的标准分析还是可能得到不同的结果。曹友志[17]将筛选条件设定为:① 氨基酸序列长度:50~300 aa;②含有信号肽;③ 不含跨膜区域;④富含半胱氨酸;⑤具有高度序列特异性。其筛选到106个蛋白为效应子。闫丽斌等[26]是基于对玉米大斑病菌全基因组序列进行分泌蛋白的筛选,继而对其蛋白半胱氨酸含量、信号肽长度及冗余性分析,其获得了60个候选效应分子。而本研究将获得的219个蛋白序列进一步跟PHI数据库进行比对分析,且保留了小于300个氨基酸序列的蛋白作为最后的候选效应子,最后得到29个候选效应子。这可以进一步将一些已经确认的非致病性的蛋白剔除,有利于缩小范围进行后续功能验证实验的开展。
本论文首次对茄子枯萎病菌全基因组的致病相关效应因子进行了预测和分析,流程简单,耗时较少,结果准确。一方面,获得的29个致病相关效应因子可作为下一步致病功能的研究材料;另一方面,本论文所建立的方法则为其它植物病原真菌的效应因子筛选提供方法参考。