长足大竹象超长链脂肪酸延长酶家族的全基因组鉴定及其分子进化

2022-09-16 01:30甘东平杨瑶君
乐山师范学院学报 2022年8期
关键词:大竹进化树磷酸化

付 春,甘东平,杨瑶君

[竹类病虫防控与资源开发四川省重点实验室(乐山师范学院),四川 乐山 614000]

0 引言

长足大竹象,属鞘翅目(Coleoptera)象虫科(Curculionidea)弯颈象属(Cyrtotrachelus),主要分布于我国的西南地区、沿海地区广东和上海、等地以及东南亚越南、泰国等国家[1-2]。该虫完全变态,需要经历成虫、卵、幼虫和蛹四个阶段[3]。成虫是靠取食竹笋补充营养,该虫的卵产在笋壳下,幼虫孵化后再钻食竹笋并咬破竹笋后在土里化蛹并以成虫越冬,而由卵发育成五龄幼虫大约只需15 d,且长足大竹象为寡食性昆虫,主要取食丛生幼嫩的竹笋尖部[4-5]。长足大竹象的隐蔽性很强且是当前竹林的主要害虫之一,在2003年国家林业局将该虫列为我国林业主要有害生物之一[6]。

超长链脂肪酸延长酶(Elongation of very long chain fatty acids protein)在植物中,名为FAE[7],在昆虫及真菌酵母中,名为ELO[8],而在鱼类以及哺乳动物中,名为ELOVL[9],是脂肪酸延伸反应第一步的限速性缩合酶[8]。超长链脂肪酸(VLCFA)合成时碳链的缩合延长过程是类似于β-氧化逆反应的循环过程,以脂酰CoA(fatty acyl-CoA)作为起始点,通过缩合、加氢、脱水、再加氢四个步骤循环完成碳链的延伸,其中脂肪酸碳链的延伸主要发生在线粒体,内质网、过氧化物酶体中[10]。其中的缩合反应是由ELO 催化,丙二酸单酰CoA 提供2 个碳原子,使脂肪酸碳链延长,而活性位点与赖氨酸残基之间的距离决定ELO 脂肪酸的长度[11]。由此可见ELO 对脂肪酸代谢调控以及脂类的生物合成起着至关重要的作用。昆虫领域研究中,Chertemps 等首次报道了昆虫的ELO基因并命名为elo68α 和一种在雌果蝇中特异性表达的ELO,命名为eloF[12]。对ELO研究主要集中在黑腹果蝇,其中主要包括在ELO对形成受精卵过程中生殖能力的影响[13]、对表皮功能的影响[14]、对运动功能影响,降低其生存力[15]、对绛色细胞的影响[16],以及在信息素合成中影响合成酯类、烃类和醇类化合物等信息素。研究发现ELO对意大利蜂(Apis mellifera)中表皮转录功能也有影响[17]。Juárez 研究了德国小蠊(Blatella germanica)表皮中ELO的功能[18]。在黄粉虫中也略有报道,其中主要集中在ELO可以干扰黄粉虫幼虫的基因,影响黄粉虫的成长从而导致黄粉虫死亡率的增加[19]。

目前对于长足大竹象的研究主要集中在消化系统、呼吸系统、生殖系统、形态结构、生活习性、以及防治方法等方面[20-24]。而对于长足大竹象遗传学方面的研究还相对较少,主要为汪振宇等研究的染色体核型分析[25]。尚且没有关于长足大竹象全基因组的研究报道,而解密基因组里的遗传信息是研究长足大竹象的分子进化、生理结构的基础。本研究以长足大竹象超长链脂肪酸延长酶全基因组为材料,采用生物信息学方法,研究长足大竹象全基因组中的CbuELO 蛋白的理化性质、亚细胞定位情况、跨膜域结构、蛋白亲水性疏水性、磷酸化位点情况、蛋白二级结构、蛋白三级结构、保守结构以及染色体定位。同时构建系统发育树分析基因间的同源性以及种族间亲缘关系。为深入分析长足大竹象的生物学功能提供可靠的数据支持和理论依据。

1 材料与方法

1.1 材料

长足大竹象基因组序列、其所有蛋白质序列文件和注释文件均来自于本科研团队完成的全基因组测序数据[26]。同时在InsectBase2.0 数据库(http://v2.insect-genome.com/)通过查找下载所有鞘翅目昆虫的ELO 蛋白序列用于构建长足大竹象与其他鞘翅目昆虫的ELO基因家族的系统发育树(表1)。

表1 用于本研究的鞘翅目昆虫物种名称

1.2 方法

1.2.1 长足大竹象ELO基因家族鉴定、染色体定位预测及基因结构的分析

利用ELO基因家族的Pfam 模型对长足大竹象全基因组的编码蛋白质序列PfamSearch 检索其基因组中所有ELO基因家族的蛋白编码序列,然后结合SMART 工具对经pfam 鉴定的所有蛋白成员序列检索保守结构域,剔除不存在ELO保守结构域的序列后即为ELO基因家族的所有蛋白质序列。从长足大竹象的gff 信息中获得ELO基因所在染色体和基因起始位置,然后利用MapChart 软件对CbuELO基因家族进行染色体定位分析。利用在线网站Gene Structure Display Server2.0(http://gsds.gao-lab.org)分析基因结构中外显子与内含子的情况。

1.2.2 CbuELO 蛋白理化性质的分析与亚细胞定位

利用EXPASY-ProtParam tool(https://web.expasy.org/protparam/)预测CbuELO蛋白理化性[27]。可以分析出蛋白的分子量大小、氨基酸数目、不稳定指数、脂肪族氨基酸指数、等电点、总平均亲水性以及正负带电荷残基总数。利用CELL:Subcellular(http://cello.life.nctu.edu.tw/)进行亚细胞定位[28]。

1.2.3 CbuELO 蛋白的跨膜域分析、亲疏水分析以及蛋白氨基酸序列的磷酸化位点预测

利用TMHMM-2.0-Services(https://services.healthtech.dtu.dk/service.)进行蛋白的跨膜域分析,利用EXPASY-Proscale(https://web.expasy.org/protscale/)进行蛋白亲疏水分析[29]。用NetPhos-3.1-Services(https://services.healthtech.dtu.dk/service.)预测磷酸化位点,输入的是蛋白质序列fasta格式,默认参数[30]。

1.2.4 CbuELO 蛋白的二级结构、三级结构以及保守结构的分析

利用SOPMA Secondary Structure Prediction(https://npsa-prabi.ibcp.fr/) 预测蛋白质的二级结 构,利 用SWISS-MODEL(https://swissmodel.expasy.org/interactive)预测蛋白质的三级结构,利用MEME-Submission Form(https://meme-suite.org/)分析蛋白的保守结构,初始基序数目设置为10,输入的蛋白质序列是fasta 格式[31]。

1.2.5 CbuELO 构建系统发育树

为了了解长足大竹象ELO基因与其他物种的ELO基因的进化关系,利用在线网站InsectBase 中下载与长足大竹象同科、同目的物种的ELO基因的蛋白序列,并通过MEGA11 软件构建进化树,其蛋白序列为fasta 格式,采用邻接法(Neighbor-Joining),采用bootstrap 方法进行重复检验,bootstrap 次数设置为1000。采用最大似然法(MaxmummLikelihood,ML)构建多个物种的ELO 蛋白序列的系统发育树[32]。

2 结果与分析

2.1 长足大竹象ELO 基因的鉴定及染色体定位

通过对长足大竹象ELO基因的鉴定,已知长足大竹象ELO基因共有15 个,按照基因顺序,分别命名为CbuELO01-CbuELO15(表2)。利用MapChart 软件对CbuELO基因家族进行染色体定位分析可知,CbuELO的基因分别位于0、5、8、9 号染色体上,其中0 号染色体占比最多,共有11 个CbuELO基因,其基因分别为CbuELO01-CbuELO11。而基因CbuELO12-15分别位于5 号、8 号、9 号染色体上(图1)。

图1 长足大竹象ELO 基因家族染色体定位图

表2 长足大竹象CbuELO 家族基因的基本信息

续表2

利用在线网站Gene Structure Display Server2.0分析CbuELO基因结构可知,每个CbuELO基因的序列长度与编码长度之间不是完全相同的,15 个CbuELO基因的序列长度的在1958~31756 bp 之间,而编码长度则在863~29913 bp 之间。由图2 可知CbuELO家族蛋白成员都含有外显子(CDS);除了CbuELO12没有内含子(Intron)外,其余家族成员都有内含子;除了CbuELO04没有非编码区(UTR)外,其余家族成员都有非编码区。每个家族成员含有外显子的数量为1~10 个,内含子的数量为0~9 个,非编码区为0~2 个。其中成员CbuELO14含有最多的外显子和内含子,分别为10、9 个。

图2 长足大竹象ELO 家族基因结构图

2.2 长足大竹象ELO 基因家族蛋白理化性质分析

基于长足大竹象ELO的氨基酸序列,利用EXPASY-ProtParam tool 对蛋白质的理化性质(分子量、等电点、不稳定性等)进行分析。结果表明CbuELO 蛋白家族的氨基酸数目在219~368 之间,其中所含氨基酸数目最多的是CbuELO03 蛋白,为368。所含氨基酸最少的是CbuELO02 蛋白,为219,而整个CbuELO 家族里的蛋白平均氨基酸含量为285.4。CbuELO 蛋白家族的分子量在25.99~43.33kDa 之间。其中分子量最大的是CbuELO03,为43.33 kDa。分子量最小的是CbuELO,为25.99kDa。而整个CbuELO 蛋白家族的平均分子量为33.67 kDa。CbuELO 蛋白家族的理论等电点在9.22~9.68 之间。由此可知,整个CbuELO 蛋白家族为碱性蛋白,此结果与黄粉虫ELO 基因家族一致[11]。基于理论不稳定指数大于40 的为不稳定性蛋白,小于四十的为稳定性蛋白。由此可得,不稳定性蛋白的有6个分别为CbuELO03、CbuELO04、CbuELO06、CbuELO07、CbuELO10、CbuELO12。其余的皆为稳定性蛋白,总体上稳定性蛋白数量大于不稳定性蛋白。脂肪族氨基酸指数总体含量范围在72.28~120.22 之间,说明CbuELO 蛋白家族之间热稳定性差异较大。从总平均亲水性上分析,负值代表亲水性,正值代表疏水性,绝对值代表其亲疏水性大小。除了CbuELO03 蛋白为亲水性蛋白外,其余蛋白皆为疏水性蛋白,整体CbuELO蛋白家族亲水性平均系数为0.433,说明其为疏水性蛋白。从带正负电荷数分析,整体CbuELO蛋白家族带正电荷残基总数(Arg+Lys)要远大于带负电荷残基总数(Asp+Glu),说明CbuELO 蛋白家族整体是带正电荷。利用CELL:Subcellular进行亚细胞定位分析,结果表明CbuELO 蛋白家族全定位在细胞膜上,说明CbuELO 蛋白家族在 细胞膜上发挥着生物学作用(表3)。

表3 长足大竹象CbuELO 蛋白的理化性质

2.3 CbuELO 蛋白的跨膜域分析、亲疏水以及蛋白氨基酸序列的磷酸化位点预测

利用TMHMM-2.0-Services进行CbuELO蛋白家族的跨膜域分析,结果表明蛋白家族中的每个成员都有数量不一的跨膜结构,其中蛋白CbuELO01、CbuELO003、CbuELO05~CbuELO008、CbuELO15都含有最多的跨膜结构,7 个(表4、图3)。因此可以推断CbuELO 蛋白家族为跨膜蛋白。

图3 长足大竹象CbuELO 蛋白的跨膜域分析

表4 长足大竹象CbuELO 蛋白的跨膜域分析

利用EXPASY-Proscale 进行CbuELO 蛋白家族亲疏水分析,结果表该蛋白家族最大疏水性的数值范围在2.311~3.378 之间,成员CbuELO05有最大数值3.378。而最大亲水范围在-3.344~-2.067 之间,成员CbuELO01 有最小数值-3.344(表5)。由分值绝对值代表亲疏水性大小可知疏水性氨基酸残基数量远大于亲水性氨基酸残基(图4),可知,ELO 蛋白为疏水性蛋白,因此可以推断出为不溶性蛋白。

图4 长足大竹象ELO 疏水性分析结果

表5 长足大竹象CbuELO 蛋白的亲水性/疏水性分析

用NetPhos-3.1-Services 预测磷酸化作用位点,结果表明CbuELO 蛋白家族具有多个不同的磷酸化位点,总体上该蛋白家族共有247个丝氨酸可磷酸化位点、125 个苏氨酸可磷酸化位点、102 个酪氨酸可磷酸化位点。其中成员CbuELO03 蛋白含有最多的磷酸化位点,为51 个,而成员CbuELO10 含有最少的磷酸化位点,为15 个。含丝氨酸磷酸化位点最多的是成员CbuELO12,有29 个,而含量最少的是成员CbuELO13,有9 个,其中极有可能的磷酸化位点位于27、276 上,其数值为0.996(远大于阈值0.500);含苏氨酸磷酸化位点最多的是成员CbuELO13、14,有13 个,含量最少的是成员CbuELO10,仅有1 个,其中极有可能的磷酸化位点位于85 上,其数值为0.964;含酪氨酸磷酸化位点最多的是成员CbuELO03,有16 个,而含量最少的是成员CbuELO10,仅有1 个,其中极有可能的磷酸化位点位于147 上,其数值为0.973(表6)。

表6 长足大竹象CbuELO 蛋白氨基酸序列的磷酸化位点预测

2.4 CbuELO 蛋白的二级结构、三级结构以及保守结构的分析

利用SOPMA Secondary Structure Prediction 预测蛋白质的二级结构,结果表明,CbuELO 家族整体上的二级结构以α-螺旋为主,由2064 个氨基酸残基组成,占整体的48.51%;扩展链结构由802 个氨基酸残基组成,占整体的18.72%;β-转角由126 个氨基酸残基组成,占整体的2.98%;而无规则卷曲由1289 个氨基酸组成,占整体的29.79%。其中α-螺旋中,CbuELO10 蛋白占比最高,有55.84%是α-螺旋,由129 个氨基酸残基组成,而最少的是CbuELO14 蛋白有42.39%是α-螺旋,由156 个氨基酸残基组成;在扩展链结构中,CbuELO04 蛋白占比最高,有24.64%是扩展链结构,由65 个氨基酸残基组成,而占比最少的是CbuELO13 仅有15.13%是扩展链结构,由46 个氨基酸残基组成;在β-转角中,CbuELO12占比最高,有4.53%是β-转角,由13 个氨基酸残基组成;而占比最少的是CbuELO01,仅有1.67%是β-转角,由5 个氨基酸残基组成;在无规则卷曲中,占比最高的是CbuELO05,所含量35.92%,由111 个氨基酸残基组成,而占比最少的是CbuELO10,所含量有22.08%,由51 个氨基酸残基组成(表7、图5)。

表7 CbuELO 蛋白的二级结构分析

图5 大竹象CbuELO 蛋白的二级结构

利用SWISS-MODEL 预测蛋白质的三级结构,根据结构的相似程度共分为四类,为了方便观察每张图按顺序用A、B、C、D、E、F、G、H、I、G、K、L、M、N、O 表示。首先第一类是I、J、K、L、M、N、O,数目最多,有7个,分别对应蛋白CbuELO04、CbuELO06~08、CbuELO10、CbuELO13、CbuELO15;第二类是E、F、G、H,分别对应蛋白CbuELO09、CbuELO11、CbuELO12、CbuELO14;第三类是B、C、D,分别对应蛋白CbuELO01、CbuELO03、CbuELO05;第四类仅有1个A所对应蛋白为CbuELO02。从三级结构图中可以看出,CbuELO蛋白家族中α-螺旋与无规则卷曲为主要结构元件,而无β-转角则零星散落,这一点结构预测与二级结构分析一致(图6)。

图6 长足大足象ELO 蛋白的三级结构图

利用MEME-Submission Form分析蛋白的保守结构,结果表明,CbuELO 蛋白家族共鉴定出10 个保守基序,其基序长度在10~50aa之间。在CbuELO 蛋白家族中有最重要的4个保守基序,分别为motif1、motif2、motif3、motif4,其中motif4 在每个成员中都存在。蛋白CbuELO06~09 含有最多的保守基序,都有9 个,而含有最少的保守基序是蛋白CbuELO12,仅有1 个保守基序(表8、图7)。

表8 保守基序序列logo

续表8

图7 保守基序序列

2.5 CbuELO 构建系统发育树

通过MEGA11 软件构建CbuELO 蛋白家族进化树,校验参数Bootstrap 重复1000 次。结果表明,15 个家族成员根据其在进化树中的聚集程度分成了3 个亚家族(依此标记为Group1、Group2、Group3)。其中Group1 家族成员最多,有6 个家族成员,占整体的40%;而Group2 家族成员最少,有四个家族成员,占整体的26%。根据进化树的自展值可以得到基因的同源性,可以看出,蛋 白CbuELO02 与CbuELO10,CbuELO06与CbuELO07、CbuELO11、CbuELO15 这些基因的自展值均为100%。在整个家族中Group2 是最原始的,而Group3 则是进化最快的(图8)。

图8 长足大竹象ELO 基因系统进化树

长足大竹象与中欧山松大小蠹的ELO 蛋白序列构建系统进化树。把两者之间的进化关系分为了四组(标记为Group1、Group2、Group3、Group4)。在1组里面有4个CbuELO成员分别为CbuELO01、CbuELO08、CbuELO09、CbuELO14;2组里面也有4个CbuELO成员分别为CbuELO03、CbuELO06、CbuELO07、CbuELO10;3组有3个,分别为CbuELO05、CbuELO12、CbuELO13;4组里面有4个,分别为CbuELO02、CbuELO04、CbuELO11、CbuELO15。而中欧山松大小蠹的ELO蛋白在Group1~4的数量分别为3、1、4、1。根据进化树自展值得到了长足大竹象与中欧山松大小蠹的直系同源基因对,如CbuELO08与DpoELO07,CbuELO05 与DpoELO05、DpoELO06,CbuELO12与DpoELO04,这些基因对的自展值均大于95%(图9)。

图9 长足大竹象和中欧山松大小蠹的ELO 基因家族系统发育进化树

长足大竹象与红棕象甲的ELO 蛋白序列构建系统进化树。根据进化分析,把两者之间的进化关系分为了四组(标记为Group1、Group2、Group3、Group4)。在1 组里面有5 个CbuELO成员分别为CbuELO01、CbuELO08、CbuELO09、CbuELO12、CbuELO13;2 组里面也有2 个CbuELO成员分别为CbuELO02、CbuELO05;3组有3个,分别为CbuELO03、CbuELO10、CbuELO14;4组里面有5个,分别为CbuELO04、CbuELO06、CbuELO07、CbuELO11、CbuELO15。而红棕象甲的ELO 蛋白在Group1~4的数量分别为5、3、1、4。根据进化树自展值得到了长足大竹象与红棕象甲的直系同源基因对,如CbuELO12 与RfeELO03,CbuELO13 与RfeELO04,CbuELO09与 RfeELO10、RfeELO12,CbuELO05 与RfeELO01、RfeELO07、RfeELO08 这些基因对的自展值均大于99%(图10)。

图10 长足大竹象和红棕象甲的ELO 基因家族系统发育进化树

长足大竹象与赤拟谷盗的ELO蛋白序列构建系统进化树,研究其进化关系。根据进化分析,把两者之间的进化关系分为了5组(标记为Group1、Group2、Group3、Group4、Group5)。在1组里面有1个CbuELO成员为CbuELO05;2组里面也有3个CbuELO成员分别为CbuELO08、CbuELO12、CbuELO13;3组有5个,分别为CbuELO04、CbuELO06、CbuELO07、CbuELO011、CbuELO15;4组里面有1个,为CbuELO02;5组有5个,分别为CbuELO01、CbuELO03、CbuELO09、CbuELO10、CbuELO12。而赤拟谷盗的ELO蛋白在Group1~5的数量分别为8、1、4、1、4。其中Group2 最原始,而Group1 进化最快。根据进化树自展值得到了长足大竹象与赤拟谷盗的直系同源基因对,如CbuELO05 与TcaELO14,CbuELO12 与TcaELO02,CbuELO09 与TcaELO01这些基因对的自展值均100(图11)。

图11 长足大竹象和赤拟谷盗的ELO 基因家族系统发育进化树

长足大竹象ELO 家族蛋白与中欧山松大小蠹、红棕象甲、咖啡果小蠹、象鼻虫、光臀八齿小蠹、云杉八齿小蠹、米象的ELO 序列构建系统进化树。根据进化分析,把两者之间的进化关系分为了5 组标记为(Group1、Group2、Group3、Group4、Group5)。在1 组里面有2 个CbuELO成员为CbuELO05、CbuELO12;2组也有5个,分别为CbuELO06、CbuELO07、CbuELO11、CbuELO13、CbuELO15;4组里面有5个,为CbuELO01~4、CbuELO09;5 组有3 个,分别为CbuELO10、CbuELO08、CbuELO14。从整个发育树来看长足大竹象ELO 家族蛋白与赤拟谷盗的亲缘关系最近,除此之外中欧山松大小蠹和象鼻虫也近(图12)。

图12 长足大竹象和所有象虫科昆虫的ELO 基因家族系统发育进化树

长足大竹象ELO 家族蛋白与所有鞘翅目的ELO 序列构建系统进化树,根据CbuELO 与所有鞘翅目的ELO 家族蛋白的进化关系,共分为了8 个亚家族(分别用Group1、Group2、Group3、Group4、Group5、Group6、Group7 和Group8 标记。其中CbuELO 家族蛋白在Group1 中有3 个成员;在Group3 中有1 个成员;在Group5 中有2 个成员,在Group7 中有3 个成员;Group8 含有最多成员,有6 个。由图13 可以看出,Group1 进化最快,而Group8 则最为原始(图13)。

图13 长足大竹象和所有鞘翅目的ELO 基因家族系统发育进化树

3 讨论

长足大竹象在四川1年发生1代,以成虫在土中蛹室内越冬[33]。成虫在清晨活动性较弱但随着温度的升高,活动性会增强且飞行能力较强[34]。幼虫、成虫均会食竹笋,导致有大量断头竹和畸形竹的出现,且成虫有假死性,寿命一般在50~70 d,竹林中成虫于10 月上旬绝迹[35]。长足大竹象是主要的林业害虫,危害率可达50%~80%,严重的达100%[36]。主要危害青皮竹(Bambusa textilis)、慈竹(Neosino Calamusaffinis)等丛生竹竹笋[36]。

超长链脂肪酸延伸酶(ELO)参与长链脂肪酸(C16、C18 和C20)的生成[37],在ELO 的作用下形成超长链脂肪酸,此反应需要NADPH 提供能量[38]。近年,ELO 在脂肪酸的具体作用得到广泛的关注。在哺乳动物中,ELOVL 家族蛋白不仅可以控制脂肪酸碳链的长度外,其中ELOVL2 对雄性鼠的精子成熟有影响[39]。除此之外研究发现ELOVL 家族蛋白与糖尿病[40]、肥胖症[41]、癌症[42]等疾病都有所关联。在酿酒酵母(Saccharomyces cerevisiae)中,发现了三条编码脂肪酸延伸酶基因,对其功能进行研究发现它们可以将C14 催化生成不同长度的长链脂肪酸[43]。在昆虫中,ELO参与交配、繁殖、信息素生物合成以及表皮形成等生命活动过程[44]。同一种昆虫中,不同的ELO具有不同的底物偏好性和组织特异性表达。如今,对于ELO 在昆虫这方面的研究主要集中在果蝇上,共发现了20 条ELO 家族蛋白并研究出ELO是果蝇发育过程中的关键基因[45]。研究白纹伊蚊(Aedes albopictus)ELO 发现,ELO 家族蛋白对于其滞育卵和抵抗干燥具有重要作用[46]。在褐飞虱中,共鉴定出20 条ELO 家族蛋白,它们具有不同的表达部位和表达图谱,从而行使不同的生物学功能[44]。尽管ELO 基因在一些昆虫中有了深入的研究,但在长足大竹象中ELO 基因的研究还是一个空白。

本研究利用生物信息学手段对长足大足象ELO 全基因家族进行了全面分析。对其基因家族鉴定发现,CbuELO 蛋白家族共有15 个成员,15个成员位于4 条染色体上。通过Gene Structure Display Server2.0 分析基因结构发现,CbuELO 家族蛋白成员都含有外显子(CDS);除了CbuELO12没有内含子(Intron)外,其余家族成员都有内含子;除了CbuELO04没有非编码区(UTR)外,其余家族成员都有非编码区。通过EXPASY-ProtParam预测蛋白理化性质发现CbuELO 蛋白家族的理论等电点在9.22~9.68 之间,总体稳定性蛋白数量大于不稳定性蛋白,脂肪系数在72.28~120.22 之间。整体CbuELO 蛋白家族亲水性平均系数为0.433,说明其为疏水性蛋白,这与苗璐等研究预测一致[46]。整体CbuELO 蛋白家族Arg+Lys 总数要远大于Asp+Glu,说明CbuELO 蛋白家族整体是带正电荷。利用CELL:Subcellular 进行亚细胞定位分析,CbuELO 蛋白家族全定位在细胞膜上。利用TMHMM-2.0-Services 进行CbuELO 蛋白家族的跨膜域分析,结果表明蛋白家族中的每个成员均有跨膜结构,因此可以推断CbuELO 蛋白家族为跨膜蛋白,这与雷娜娜研究预测一致[47]。用在线软件NetPhos 预测磷酸化位点发现该蛋白家族有多个磷酸化位点。用SWISS-MODEL 预测蛋白质的三级结构,发现CbuELO 蛋白家族中α-螺旋与无规则卷曲为主要结构元件。利用MEME分析蛋白的保守结构,结果表明,CbuELO 蛋白家族共鉴定出10 个保守基序,其中motif4 在每个成员中都存在,这与郭兵研究预测一致[48]。通过MEGA11 软件构建CbuELO 蛋白家族进化树分析,长足大竹象ELO 家族蛋白与赤拟谷盗多个基因序列同源性达到100%,说明长足大竹象与赤拟谷盗的ELO 蛋白家族亲缘关系最近,除此之外与中欧山松大小蠹和象鼻虫最近。

4 结语

综上所述,本文对长足大竹象ELO基因家族进行了详细的生物信息学研究,研究结果为揭示长足大竹象分子机制奠定了基础,同时也为害虫绿色防治提供了新的靶标[49]。

猜你喜欢
大竹进化树磷酸化
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
ITSN1蛋白磷酸化的研究进展
大竹农商行向贫困村捐赠图书
磷酸化肽富集新方法研究进展
不要轻易辜负曾真心对你的人
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
MAPK抑制因子对HSC中Smad2/3磷酸化及Smad4核转位的影响
大竹县联社:金融服务送到企业“家门口”