对Deinococcus actinosclerus RM菌株分泌蛋白的预测

2021-07-23 06:55:40彭阳选李昊然刘曜荣梅颖诗
韶关学院学报 2021年6期
关键词:信号肽残基羽毛

柯 野,彭阳选,李昊然,刘曜荣,梅颖诗,郭 阳

(韶关学院 英东生物与农业学院,广东 韶关 512005)

随着国家政策对畜牧养殖业扶持与推广,使得我国畜牧养殖业飞速发展,我国家禽生产量已跃居全球第2位,据估算,此行业每年产生的干羽毛量约130万t[1].羽毛中的粗蛋白含量高达80%,氨基酸含量则达到70%,由此可见,羽毛具有十分可观的开发利用价值[2].羽毛的主要成分是角蛋白,角蛋白亦被称为硬性角蛋白,不容易被一般的蛋白酶所降解.然而,废弃的羽毛不仅对环境有极大的危害作用,而且羽毛中的蛋白质资源也不能得到充分有效的利用[3].因此,越来越多的研究者关注于对羽毛的有效降解.一方面,以期实现羽毛中蛋白质的高值化利用.另一方面,则希望通过经济环保的方式,解决废弃羽毛对生态环境带来的危害.据报道,在自然界中已离获得具有降解废弃羽毛的微生物30多种,并且在细菌、放线菌和真菌[4-6]中均有分布,如细菌中的枯草芽孢杆菌属和放线菌中链霉菌属,它们主要产生碱性蛋白酶,可应用于高蛋白动物饲料、原料皮的脱毛和植物含氮肥料添加剂等领域的开发[7].

本文前期研究中已分离筛选获得一株Dactinosclerus actinosclerusRM(下文简称RM菌株)野生型菌株,它是一株具有高效降解羽毛的细菌菌株(初测对4.0%的羽毛粉有高达64.0%的降解率).目前未见对该菌株所属的属和种的分泌蛋白系统研究.因此,本文采用生物信息学知识和在线网站对RM菌株全基因组序列编码的分泌蛋白进行预测和分析,以此可知该菌株对羽毛高效降解作用的相关酶,进一步对该酶的基因、结构与功能进行深入的研究,更全面地为探究RM菌株降解羽毛的机制提供参考.

1 材料与方法

1.1 实验材料

1.1.1 菌株来源

RM菌株是本实验室分离筛选获得的一株具有高效降解羽毛的优势菌株,由本实验室保藏提供.

1.1.2 培养基

牛肉膏蛋白胨培养基:牛肉膏3.0 g,氯化钠5.0 g,蛋白胨10.0 g,水1 000 mL,pH自然.

1.1.3 试剂

牛肉膏、蛋白胨、琼脂糖等试剂购自生工生物工程(上海)股份有限公司,化学试剂均为国产分析纯试剂.

1.2 试验方法

1.2.1 RM菌株的培养

将RM菌株接种在牛肉膏蛋白胨液体培养基中,180 rpm震荡培养4 d后,12 000 rpm离心3 min,收集菌体备用.

1.2.2 RM菌株基因组DNA的提取

按照酵母DNA快速提取法[8],提取RM菌株的基因组DNA,进行琼脂糖凝胶电泳,对其质量进行分析.

1.2.3 RM菌株的基因组测序

将电泳鉴定合格的RM菌株基因组DNA,送至生工生物工程(上海)股份有限公司的广州测序部进行全基因组测序.采用Illumina Hiseq 2500平台对RM菌株基因组进行高通量测序,采用高通量序列数据的质量控制工具FastQC(软件版本 0.11.2)对测序的原始数据质量可视化评估;为获得相对准确的有效数据,再利用Trimmomatic(软件版本0.36)数据过滤工具对数据进行质量剪切;通过基因组测序数据的拼接软件SPAdes(软件版本3.5.0)对测序数据进行拼装,之后采用Kmer值进行组装,最终根据各Kmer值组装获得最佳的序列结果.将获得的RM菌株基因组序列提交至GenBank数据库,根据NCBI网站提供的Prokaryotic Genome Annotation Pipeline注释系统对基因功能进行预测和注释,同时也利用NCBI Blast+将基因蛋白序列与KEGG、COG、Swissprot和NR等多个数据库进行比对,进一步确定注释基因的结构与功能.

1.2.4 RM菌株分泌蛋白的确定方法

运用Bio-Edit 7.0软件对基因和蛋白质的序列组成、比对等进行分析;蛋白质编码序列的N端信号肽预测分析、筛选,通过在线程序:SignalP-4.1完成;蛋白质的亚细胞定位预测分析通过网站:http://www.cbs.dtu.dk/services/TargetP-1.1/index.php完成.蛋白质的跨膜结构域预测分析通过网站:http://www.cbs.dtu.dk/services/TMHMM/完成.

2 结果与分析

2.1 RM菌株的基因组测序结果

通过SPAdes对二代测序数据进行拼装后,获得RM菌株测序全长为4 013 522 bp,最长测序片段长度为79 609 bp,平均长度为12 088.92 bp,N50的长度为21 827 bp,GC含量为0.70,连续交叠群共有332个.将RM菌株基因组序列提交至GenBank数据库,获得登录号为QYCQ00000000.1.根据GenBank数据库的基因注释系统分析,RM菌株基因组全长为341 632 bp,共计有3 869个蛋白质编码基因,再将每个CDS编码的氨基酸序列与KEGG、COG、Swissprot和NR等数据进行比对,其中有3 820个基因序列能被同源基因注释分类.

2.2 RM菌株蛋白质的信号肽预测结果

对RM菌株全基因组预测编码的3 869条蛋白进行信号肽预测,结果表明:所有的编码蛋白质中仅439条蛋白具备典型信号肽序列,占比11.35%.而3 430条蛋白均为胞内蛋白,占比88.65%.这表明RM菌株的分泌蛋白占少数,大多数为胞内蛋白.

2.3 含有信号肽的蛋白质的氨基酸残基情况分析

439条具有信号肽的蛋白质中,氨基酸残基总数为144 145个,各种氨基酸的含量如图1.由图1可知,在20种氨基酸中,数量多的分别是丙氨酸、亮氨酸、甘氨酸、苏氨酸和缬氨酸,摩尔比分别为13.25%、9.95%、9.50%、9.19%和7.83%,总计达到49.72%.这些氨基酸残基都具有侧链基团简单、不含环状结构、分子量相对较小、占据空间结构少等特点.其含量较高的原因,可能是由于占据空间结构小,柔性相对较大,利于蛋白局部的构象改变,便于形成成熟蛋白质的构象.

图1 20种氨基酸在RM菌株信号肽蛋白中所含数量情况

含量较少的酪氨酸、色氨酸和组氨酸残基,摩尔比分别为2.77%、1.28%和1.01%,总计5.06%.酪氨酸、色氨酸和组氨酸侧链基团具有环状结构,含有较大的疏水性侧链基团,刚性较强、占据空间大,对蛋白质局部构象的柔性贡献小,这可能是含量较少的原因之一.

半胱氨酸是构成蛋白质的一种特殊氨基酸,能形成稳定的二硫键,对蛋白质结构局部构象的稳定性和刚性具有重要作用,由图1和图2可知,RM菌株产生的含信号肽的蛋白质中,不含或只含有1个半胱氨酸的蛋白共有196个,所占比例高达44.65%,即约一半含信号肽的蛋白不能形成二硫键.但也有6个蛋白质中含有10个以上的半胱氨酸,这些蛋白质可能形成多个二硫键.

图2 含有信号肽的蛋白质中的半胱氨酸数量

2.4 对含有信号肽的蛋白质的跨膜结构域和亚细胞定位分析

对439条含有信号肽的蛋白进行跨膜结构域及亚细胞定位预测可知,有321个胞外分泌蛋白质,34个亚细胞定位不明确的蛋白质,84个分泌型膜蛋白,在这些分泌性膜蛋白中65个蛋白有1个跨膜结构域,有7个蛋白有2个跨膜结构域,有3个蛋白具有3个跨膜结构域,有2个蛋白有4个跨膜结构域,有1个蛋白有5个跨膜结构域,有2个蛋白有9个跨膜结构域,有4个蛋白有12个跨膜结构域.结果表明含有信号肽的蛋白大多数为胞外分泌蛋白,占总数的摩尔比73.12%.

2.5 分泌蛋白的信号肽氨基酸残基分析

2.5.1 分泌蛋白的信号肽氨基酸残基组成

所有分泌蛋白质的信号肽共有氨基酸残基7 472个,平均每条信号肽含23个残基,最长的信号肽有38个氨基酸残基,而最短信号肽序列只含10个氨基酸残基.信号肽的氨基酸残基组成见图3.由图3可知:含量较高的氨基酸残基为亮氨酸和丙氨酸,占摩尔比分别为21.39%和21.08%,因为信号肽主要为线性结构,这两种氨基酸残基的侧链基团简单,可能更利于线性的信号肽形成.

图3 分泌蛋白的信号肽序列中20种氨基酸数量的分布情况

信号肽序列中疏水性氨基酸残基(如亮氨酸、丙氨酸、脯氨酸、缬氨酸、甲硫氨酸、异亮氨酸、苯丙氨酸和色氨酸)占摩尔比为63.65%;带正电荷的残基(如赖氨酸、精氨酸和组氨酸)占摩尔比为9.15%;带负电荷的残基(如天冬氨酸和谷氨酸)共有86个,所占摩尔比分数为1.15%.由此可见,RM菌株的信号肽残基组成情况符合信号肽构成的一般规律,疏水性氨基酸残基为主,构成主要的疏水核心区,而少量的正电荷残基和负电荷残基组成信号肽的N端和C端[9-11].

2.5.2 分泌蛋白的信号肽切割位点分析

对分泌蛋白信号肽末端4个氨基酸残基进行分析,结果见图4.以“1”为切割位点,依次向信号肽序列的N端排序,在4位点上数量最多的氨基酸残基是丙氨酸,共62个.在3点上含量最多的是丙氨酸,共212个.在2位点含量最多的氨基酸残基是谷氨酰胺,共52个.在1位点上含量最多的氨基酸是丙氨酸,共266个.由此推出RM菌株的信号肽切割位点序列主要属于X-A-X-A型,为SPI型信号肽识别位点.

图4 分泌型蛋白的信号肽切割位点分析

2.6 胞外分泌蛋白酶的信号肽序列分析

RM菌株对羽毛的降解主要是由于分泌蛋白酶对羽毛的降解作用,在胞外分泌型蛋白中,共10个蛋白酶(6种类型),1个M36金属肽酶类,1个C39肽酶类,1个木瓜蛋白酶家族半胱氨酸蛋白酶类,1个胰蛋白酶类,3个MepM肽链内切酶,3个枯草杆菌蛋白酶.6类蛋白酶信号肽序列的氨基酸残基数如图5.由图5可知,6类蛋白酶的信号肽中的各种氨基酸残基的含量基本一致,如丙氨酸和亮氨酸的含量最高,天冬氨酸和色氨酸含量最低;并且其信号肽切割位点也属于X-A-X-A型.这表明RM菌株的蛋白酶中各种氨基酸含量不因蛋白酶的种类而具有差异.

图5 6类蛋白酶信号肽中各氨基酸残基的含量情况

3 结论

本文对具有降解羽毛的优势菌株RM菌株进行了全基因组的测序,通过对该基因组编码的蛋白分析其信号肽和跨膜结构域等相关信息,得知该菌株共有439个蛋白具有信号肽序列,321个为胞外分泌蛋白,34个亚细胞定位不明确的蛋白,84个为膜蛋白.RM菌株分泌蛋白的信号肽切割位点的氨基酸残基主要序列为于X-A-X-A型,并且以疏水性的氨基酸残基为主,不同类型分泌蛋白酶的信号肽之间的序列差异较小.因此,通过本文的研究,了解了RM菌株分泌蛋白的情况,信号肽的氨基酸残基组成规律,这为对RM野生型菌株的改造,人工合成能在RM菌株中分泌表达蛋白的信号肽构建奠定了一定的基础,同时为进一步分析RM菌株对羽毛高效降解的分泌蛋白(如角蛋白酶、脂肪酶、二硫键还原酶等)的确定、功能作用奠定了基础.

猜你喜欢
信号肽残基羽毛
嵌合信号肽提高α-淀粉酶在枯草芽孢杆菌中的分泌
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
让羽毛变成“无价之宝”
华人时刊(2019年13期)2019-11-26 00:54:42
羽毛项链
吹羽毛
快乐语文(2018年12期)2018-06-15 09:11:08
运用计算机软件预测木质部寄生属信号肽
飞翔的羽毛
蛋白质二级结构序列与残基种类间关联的分析
内源信号肽DSE4介导头孢菌素C酰化酶在毕赤酵母中的分泌表达