董章勇,舒永馨,陈欣瑜,罗 梅
(仲恺农业工程学院 农业与生物学院,广州 510225)
玫烟色棒束孢(Isariafumosorosea,原名玫烟色拟青霉Paecilomycesfumosoroseus)属于半知菌亚门(Deuteromycotian)丝孢纲(Hyphomycetes)丝孢目(Moniliales)丛梗孢科(Moniliaceae)棒束孢属(Isaria),是一种重要的昆虫致病真菌。其分布广泛,寄主范围也相当广泛,能侵染粉虱、蚜虫、小菜蛾等多种半翅目、双翅目、鞘翅目等昆虫[1-4]。黄振等[5]研究表明,玫烟色棒束孢与毗虫琳等化学农药使用时能较好地发挥其联合控制的效果。念晓歌等[6]用玫烟色棒束孢与化学农药进行混配使用,验证其与高效氯氰菊酯的相容性最好,在常规使用浓度下,该农药对玫烟色棒束孢菌丝生长和孢子萌发影响极小。而目前国内外对玫烟色棒束孢的研究报道主要为生物学、分类鉴定、致病力测定、致病机理、防治应用等方面并且北美和欧洲已经有真菌杀虫剂产品登记注册并用于害虫的防治[7-8]。但是由于生防真菌受多种生态因子影响,对寄主昆虫的致病过程复杂,实践应用防效不稳定,在一定程度上限制了其应用[9]。随着分子生物学技术的发展,利用基因工程等生物技术手段对菌株进行改良以提高菌株的毒力和稳定性成为目前的研究热点。昆虫病原真菌的侵染过程分为体表吸附阶段、孢子萌发、体壁穿透阶段和菌体在寄主体内增殖等4个阶段。而昆虫在长期进化过程中也建立了一套特殊的针对外来病原物的防御体系。在昆虫寄主与病原物的互作过程中,有众多的影响因素。随着多种昆虫生物防治菌株的测序完成[10],给该研究带来极大便利。
效应因子也称效应子或效应蛋白,广义上是指能够选择性地结合其他目标蛋白及调节其生物活性的一类小分子蛋白[11-13]。随着研究的深入,效应因子被认为在病原物与寄主的互作过程中发挥着重要作用[11-16]。传统效应因子的验证是通过寄主互作的试验进行验证[17-18],这种方法效率较慢。随着生物信息学的快速发展,已经有越来越多的人选择利用高通量的方法进行快速筛选[19-20]。效应分子一般具有以下特征:(1)含有N-端信号肽;(2)无跨膜结构域;(3)定位于细胞质;(4)序列具有特异性;(5)富含半胱氨酸;(6)重复元件多;(7)氨基酸残基数量大约在50~300氨基酸[13-14]。运用生物信息学的方法可以高效快速地找到靶标。
本研究拟以玫烟色棒束孢全基因组的10061个蛋白序列作为研究序列,根据效应因子的7个典型特征,利用生物信息学软件对其候选效应因子进行预测,并对预测结果作初步分析,为玫烟色棒束孢效应子的进一步筛选与验证提供一定的理论依据,并为探究效应子在昆虫与病原菌互作过程中的作用奠定基础,为玫烟色棒束孢的防治应用提供新的依据和途径。
玫烟色棒束孢蛋白序列于NCBI(https://www.ncbi.nlm.nih.gov/genome/?term=Isaria+fumosorosea)下载,共包含10 061个蛋白序列(GenBank ID:AZHB00000000.1)。
利用SignalP v4.1进行信号肽的预测[21],利用TMHMM v2.0进行跨膜层数的预测[22-23],采用TargetP v1.1 和ProtComp v9.0在线分析软件进行细胞定位分析[24],筛选出定位于细胞质器中的分泌蛋白序列。
将“1.2”分析得到的蛋白序列进行半胱氨酸(Cysteine)含量及多串联重复序列(Multiple tandem repeats)进行分析。半胱氨酸含量采用perl工具进行计算。将具有高半胱氨酸含量的(≥6)的蛋白序列进行多个串联重复序列分析。多个串联重复序列采用T-Reks (http://bioinfo.montp.cnrs.fr/?r= t-reks/)进行预测。
将“1.3”所获得的蛋白序列和PHI数据库(Pathogen-Host interaction database,http://www.Phi-bas e.org/downloadLink.htm)进行比对分析,筛选出具有致病功能的蛋白。
将“1.4”获得的蛋白序列进行长度筛选,去除大于300个氨基酸的蛋白序列,剩余的为候选的效应因子。
玫烟色棒束孢全基因组共10 061个蛋白序列。利用SignalP v4.1进行信号肽的分析,共得到1 112个蛋白具有信号肽;然后以1 112个蛋白进一步应用TMHMM v2.0进行跨膜结构分析,得到1 030个跨膜数小于2的蛋白;将1 030个蛋白用TargetP v1.1进行分析,得到1 001个定位为分泌途径的信号肽(SP);最后将这1 001个蛋白用ProtComp v9.0进行定位分析,得到929个蛋白定位于细胞质中(图1)。以这929个蛋白作进一步分析。
图1 玫烟色棒束孢基因组分泌蛋白的鉴定Fig.1 Identification of secretome in Isaria fumosorosea
将929个蛋白序列进行半胱氨酸含量及多串联重复分析。得到半胱氨酸含量大于等于6的蛋白序列共495个。含有半胱氨酸的个数为6~51。其中含有6个半胱氨酸的蛋白最多,有117个蛋白;含有7、8、9、10个的分别有68、86、38和55个;超过21个半胱氨酸个数的蛋白相对较少(图2)。将495个蛋白序列进一步进行多串联重复分析,最终得到146个多串联重复大于或等于9的蛋白序列。
将富含半胱氨酸且多串联重复性高的146个蛋白序列和PHI数据库进行比对。结果如下:共有137个蛋白在PHI数据中获得注释。其中,68个蛋白被证明缺失后会造成致病力减弱(Reduced virulence),占总数的50.7%;2个蛋白缺失后会完全失去致病力(Loss of pathogenicity),占总数的1.5%,推测其为致病因子;9个蛋白已被证明是效应因子,占总数的6.7%;其中7个Mixed outcome蛋白序列里面有4个蛋白序列分别为失去致病力-毒性减弱和毒性减弱-失去致病力,归为候选效应因子,占总数的3.0%;剩余的41个蛋白则被认为是不影响病原的致病力(Unaffected pathogenicity),占总数的30.6%,2个蛋白会导致毒力增强,占总数的1.5%。通过与PHI数据库比对后,作为候选效应因子的基因共有91个,其中包括:效应因子9个,致病力减弱基因68个,失去致病力基因2个,混合型基因4个,致死的有8个(表1)。
一般的效应因子蛋白序列长度小于300。因此,将上述步骤获得的137个基因序列进一步进行长度筛选。结果剩余19个基因序列,这19个基因序列则被认为是候选致病相关效应因子(表2)。
图2 495个玫烟色棒束孢分泌基因的半胱氨酸含量分类Fig.2 Classification of cysteine content in 495 Isaria fumosorosea secretory genes
表1 137个玫烟色棒束孢候选效应蛋白的基因功能的汇总Table 1 Summary of gene functions of 137 candidate effectors of Isaria fumosorosea
注:*混合型里面有4个蛋白序列分别为失去致病性以及效应因子,归为候选效应因子。
Note: * Four protein sequnces in mixed outcome are loss of pathogenicities and effectors,it belongs to candidate effectors.
植物病原菌的分泌蛋白及效应因子的研究相对较多。如曹友志[25]利用杨生褐盘二孢菌(Marssoninabrunnea)全基因组数据,预测出106个符合要求的候选效应因子。李孟琼[26]从稻瘟菌基因组中分析得到21个效应因子。陈琦光等[20]从希金斯刺盘孢基因组中分析得到135个蛋白。在病原菌的生防真菌的预测主要集中在分泌蛋白。如枯草芽孢杆菌、粘绿木霉和哈赤木霉[27-29]。昆虫病原真菌的效应蛋白预测研究相对较少。而在效应蛋白的预测上,前期分泌蛋白的预测方法相对较统一,后期的筛选由于使用方法的不一样,导致获得效应因子的数量也有很大差别。本研究通过与PHI数据库进行比较,剔除了一些已经证实与致病效果不相关的蛋白,有利于缩小范围进行后续功能验证试验的开展。最终得到19个候选效应因子,16个为敲除后致病能力减弱的效应因子,其他3个分别为失去致病力以及植物无毒性决定簇的效应因子。其中15个基因的注释均为假定蛋白,说明尚有许多基因尚未定名,而此15个候选的玫烟色棒束孢的效应因子的功能需要进一步的进行验证。其余4个蛋白分别为细胞外膜蛋白,CFEM结构域(Extracellular membrane protein,CFEM domain protein,OAA52920)、类胰蛋白酶丝氨酸蛋白酶(Trypsin-like serine protease,OAA57155)、细胞壁半乳甘露蛋白MP2/类过敏原F17蛋白(Cell wall galactomannoprotein Mp2/allergen F17-like protein,OAA57821)及蓝藻抗病毒蛋白N(Cyanovirin-N,OAA72610)。有意思的是,其中CFEM结构域蛋白在球孢白僵菌的效应蛋白中也分析到该蛋白[30]。张腾飞等[31]在球孢白僵菌对小菜蛾的侵染相关基因分析中表明,胞外丝氨酸富集蛋白在其侵染过程中表达差异显著,该蛋白在玫烟色棒束孢的致病过程中发挥何种作用尚需进一步分析。
表2 19个玫烟色棒束孢候选致病相关效应因子Table 2 19 candidate pathogenic effectors of Isaria fumosorosea
注:*基因编码指玫烟色棒束孢基因组翻译蛋白的NCBI序列号。
Note: * Gene code refers to the sequence number of translated protein ofIsariafumosoroseagenome in NCBI.
随着更多的昆虫病原真菌全基因组序列的公布,为进一步利用生物信息学的方法对这些基因组进行效应因子分析提供了数据。预测得到的这些效应蛋白液仍然需要进一步进行相应的功能验证及与寄主互作的验证。本研究首次对玫烟色棒束孢全基因组的效应因子进行标准化的预测和分析,结果准确。
本研究通过对玫烟色棒束孢全基因组的 10 061个蛋白序列进行筛选,共获得929个分泌蛋白;将940个蛋白序列进行半胱氨酸含量及多个串联重复序列分析,共得到495个含有高半胱氨酸含量(≥ 6)的蛋白和146个含有多个串联重复序列(≥ 9)的蛋白;病原寄主互作数据库进行比对,筛选到91个致病蛋白,去除>300的氨基酸序列,最终得到19个候选致病相关的效应因子。本研究为进一步深入研究玫烟色棒束孢效应子的功能奠定一定理论基础。