王 霞,王廷璞,王弋博,赵天宇
(天水师范学院 生物工程与技术学院,化学工程与技术学院;甘肃 天水 741001)
肺炎克雷白杆菌(Klebsiella pneumoniae)是一种常见的革兰氏阴性致病菌,属于肠杆菌科(Entero⁃bacteriaceae)克雷白菌属(klebsiella),1882年由Frie⁃diander从患大叶性肺炎患者的肺组织中首次分离得到。[1]75%~86%克雷白菌属导致的感染是由肺炎克雷白杆菌所导致,侵袭性克雷白杆菌感染的病死率为17.5%~23.0%,[2-4]其为医院内感染的重要致病菌之一。其生物学特征为兼性厌氧型,形态粗短杆菌,无鞭毛,有较厚的荚膜。多数菌株有菌毛,具有菌体抗原(O抗原)、荚膜抗原(K抗原)、菌毛抗原等多种主要抗原成分,但是不具备运动的能力。然而目前对肺炎克雷白杆菌的致病机理的研究鲜有报道。
II型分泌系统(T2SS)广泛存在于致病菌革兰氏阴性细菌中,T2SS负责分泌从周质到细胞外环境中的折叠蛋白。[5]T2SS是由一个简单的操纵子编码的12~15个称之为Gsp(General secretory pathway)蛋白(Escherichia coli)组分组成,[6]T2SS包括四部分:一个外膜复合体,一个周质pseudopilus,一个内膜基底层和一个胞质ATP酶。外膜复合物主要由GspD蛋白组成,内膜基底层通常是由至少4个膜蛋白组成,比如GspC,GspF,GspL和GspM,周质假纤毛结构主要由GspG组成,GspE主要是胞质ATP酶的组分。[7-8]有研究表明植物病原细菌通过T2SS分泌降解植物细胞壁的酶及多种毒性因子,破坏寄主细胞,导致组织坏死。[9]此外,T2SS在细菌的致病过程中同样具有举足轻重的作用。[10-11]这就说明II型分泌系统与细菌致病性之间有着密切关系。为了揭示其致病机制打下良好基础,深入研究肺炎克雷白杆菌GspD-k的功能,我们对II型分泌系统中外膜复合物组分GspD-k进行生物信息等方面的分析研究。
数据为NCBI网站(https://www.ncbi.nlm.nih.gov/)获得肺炎克雷白杆菌的GspD-k基因及氨基酸序列(表1)。
一方面在NCBIBlast中将GspD-k和GspD序列进行比对,另一方面在Clustalw中先进行比对,再通过ESPript网站输出比对的保守氨基酸序列(表1)。
按照软件Protparam所提示的要求,将GspD-k蛋白序列输入正确的格式,点击计算,从而获得该蛋白的基本理化性质(表1)。
GspD-k信号肽序列的有无采用SignalP 4.1在线软件进行分析(Petersen etal.,2011),采用TMHMM Server v.2.0软件进行蛋白跨膜分析(韩丽珍等,2014);采用软件PSORT和TARgetP对GspDk进行细胞内定位分析(表1)。
蛋白质的结构包括α-螺旋和β-折叠、β-转角,无规卷曲和连接几种结构的延伸链。在线软件PredictProtein来预测GspD-k氨基酸序列二级结构;在线软件Phyre 2分析GspD-k氨基酸序列的三维结构模型(表1)。
表1 GspD-k生物信息分析在线软件网址
通过在NCBI网站分析发现肺炎克雷白杆菌中T2SS组分中GspE-k基因座位的为CDK79923,GspC-k的是CDK79921,GspG-k对应的基因座位为CDK77150,GspD-k对应的基因座位为CDK77145,从基因座位序列看,肺炎克雷白杆菌T2SS中GspD-k的基因座位并没有很紧密的和GspE-k紧靠在一起,研究的较为清楚的大肠杆菌中T2SS组分GspD和GspE都是紧密相邻,且与其他组份都排列在一起形成一个基因簇。这说明肺炎克雷白杆菌T2SS组分GspD-k在基因座位排列中有一定的独特性。
将GspD-k的蛋白序列输入ProtParam在线软件,分析结果显示该蛋白总共654个氨基酸,其总分子量为71132.66 Da;其等电点偏酸,达5.41.在氨基酸组成中(表2),GspD-K含有20种氨基酸,含量较为丰富的是亮氨酸(9.9%)、缬氨酸(9.5%);色氨酸的含量最少,仅为0.5%;不含吡咯赖氨酸(Pyl)和硒半胱氨酸(Sec)。对蛋白序列中的氨基酸残基带电性质进行分析表明,其中带正电荷残基(精氨酸和赖氨酸)达65,带负电荷的(天冬氨酸和谷氨酸)为75个。
表2 GspD-K蛋白氨基酸组成
目前大肠杆菌中的GspD蛋白的研究较为清楚,GspD具有474个氨基酸,如上所述肺炎克雷白杆菌GspD-k有654个氨基酸。在NCBIblast中对二者进行比对,发现二者的相似性为59%.另外,为了找到与GspD相似的保守氨基酸位点,我们在clustalw在线网站对GspD和GspD-k蛋白的氨基酸序列进行比对,最后在ESPript中做出如下所示结果图片(图1)。结果显示红色区域为一致的氨基酸,属于二者保守的序列。但还需要对其保守位点进一步做突变确定关键的氨基酸位点。
在CD Search上的分析表明GspD-K氨基酸序列有一个属于Secretin superfamily的保守结构域。进一步通过SMARTPfam domain在线网站预测结果如下图2所示,GspD-K氨基酸序列有4个保守结构域,分别是3个Secretin_N结构域,1个Secretin结构域,3个Secretin_N结构域所处氨基酸序列分别为 131aa~193aa,196aa~268aa,272aa~351aa.Secretin结构域为473-599aa.
有些蛋白质的氨基酸N端带有信号肽,一半长度为15~30个氨基酸。信号肽的预测有助于确定该蛋白的亚细胞的定位。同时还能为蛋白肝功能域的划分提供较为可靠的参考;以D-cutoff=0.450,用SignalP 4.1预测信号肽(图3),结果显示最大的Y(Max.Y) 值为 0.541,最大的 S(Max.S) 值为0.900,S的平均值(mean S)为0.783,表明GspD-k含有信号肽序列,并且信号肽序列为1~27aa.这说明GspD-k是分泌蛋白。
图1 GspD-k与大肠杆菌GspD氨基酸序列比对
图2 肺炎克雷白杆菌T2SS组分GspD-k保守结构域分析
蛋白的跨膜分析软件TMHMM Server v.2.0对该多肽生物信息预测显示(图4),其跨膜螺旋个数为0,跨膜螺旋氨基酸残基数量的期望值为1.16685(超过18个,可能含跨膜螺旋或者含有信号肽),而蛋白前60个氨基酸中跨膜螺旋的氨基酸数量的期望值0.39516,N端位于膜细胞质侧的总概率为0.05693.蛋白位于细胞膜外侧的可能性是1左右,综上所述,推测GspD-K蛋白可能位于细胞膜外,不具有跨膜螺旋。PSORT亚细胞定位软件则进一步明确该蛋白定位于外膜上(表3)。
利用ProtScale分析GspD-k蛋白的亲疏水性,结果表明(图5)疏水氨基酸所占比例为44.95%,亲水性氨基酸所占比例为53.82%.其中,疏水性最强的是第17位的丙氨酸,其值为2.856;亲水性最强的是第618位的谷氨酰胺,其值为-3.589.由于亲水性区域较大于疏水性区域,因此,我们认为GspD-k蛋白为偏亲水性蛋白。
利用PredictProtein软件分析Gsp-K蛋白的二级结构。结果表明表α-螺旋的比例是21.87%,β-折叠的比例是24.01%,无规则Loop环所占比例为54.13%(表4)。即无规则loop环是GspD-k蛋白中主要组成原件(图6)。这有利于蛋白结构的稳定。
图3 SignalP 4.1预测Gsp-k蛋白的信号肽
图4 TMHMM对GspD-k蛋白跨膜性分析
表3 PSORT对GspD-k蛋白亚细胞定位分析
图5 ProtScale预测GspD-k蛋白的亲疏水性
运用phyre2对GspD-k蛋白的三级结构进行模拟预测(图7),氨基酸序列从氨基端到羧基端以箭头表示。预测结果和c5WQ9L蛋白(II型分泌系统D蛋白)的三级机构模型相似性为47%.其模型三维分别用X,Y和Z来表示。X值为38.442,Y值为90.604,Z值为196.293.
表4 GspD-k蛋白二级结构预测
应用生物信息学的方法,对肺炎克雷白杆菌II型分泌系统组分GspD-k基因及其蛋白序列结构和功能进行分析,发现GspD-k为含有信号肽序列并存在于细胞膜上的较为稳定的外膜蛋白。此外GspD-k蛋白中的二级结构主要有三种,即α-螺旋,β-折叠和无规则Loop环,Loop环占主要比例。本研究为深入研究肺炎克雷白杆菌GspD-k的功能及其致病机制提供理论基础。
图7 phyre2预测GspD-k蛋白三级结构