范艺周,骆思羽,朱浩伟,薛 珍,艾连中,熊智强
上海理工大学健康科学与工程学院,上海食品微生物工程技术研究中心,上海 200093
嗜热链球菌(Streptococcus thermophilus)是一种革兰氏阳性菌,也是一种公认的食品安全菌株,被广泛应用于酸奶和奶酪等传统乳制品的生产过程中[1-2]。为适应乳制品发酵过程中的酸性环境,感知细胞外的信号并用信使分子来传递信号,对嗜热链球菌的生存尤为重要。第二信使分子c-di-AMP 广泛存在于细菌、古生菌尤其是厚壁菌门中,与脂肪酸代谢、钾离子稳态、渗透压调节、细胞毒力以及生物膜形成等多种生理功能密切相关[3-8]。为阐明c-di-AMP 在嗜热链球菌中的调控机制,研究c-di-AMP合成酶的结构与功能非常有必要。细菌c-di-AMP合成酶DAC 包含一个高度保守的DAC/DisA_N 结构域,可催化ATP 或ADP 合成c-di-AMP。DAC 蛋白活性与保守的DGA(Asp-Gly-Ala)和RHR(Arg-His-Arg)基序密切相关[9-12]。DAC 催化c-di-AMP 合成需要辅因子二价金属离子,用DAC 三级结构可以预测可能的辅因子和关键结合位点[13]。
本实验室在实验前期在传统乳制品中筛选出了一株高产胞外多糖的嗜热链球菌菌株S-3,并对其进行了全基因组测序[14]。结合HMMER 预测和NCBI数据库比对在嗜热链球菌S-3 基因组中预测出的c-di-AMP 合成酶(命名为StDAC),对其跨膜区和二级结构进行预测,并通过SWISS-MODEL 和Modeller 进行三级结构模拟,为后续探究StDAC 的结构与功能奠定基础。
将StDAC 氨基酸序列提交至蛋白质序列网络分析在线软件(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.plpage=/NPSA/npsa_server.html),选择其中9 个有代表性的二级结构预测方法:SOPM,HNN,MLRC,DPM,DSC,GOR Ⅰ,GOR Ⅲ,PHD,Predator 对StDAC 二级结构进行预测[15-16]。其中HNN,MLRC,DSC,GORⅢ,PHD,Predator 为三态定义法,“h”代表α-螺旋、“e”代表β-折叠、“c”代表无规则卷曲;SOPM,DPM 和GORⅠ为四态定义法,“h”代表α-螺旋、“e”代表β-折叠、“c”代表无规则卷曲、“t”代表β-转角。为统一标准采用三态定义法对二级结构进行比较分析。
将StDAC 氨基酸序列提交至SWISS-MODEL蛋白分子建模服务器(https://swissmodel.expasy.org/)进行单模板建模,返回GMQE 值小于1 且接近1、QMENA 值接近0、氨基酸同源性大于30%模板的pdb 格式。建立的模型通过Discovery studio 可视化即可模拟StDAC 三级结构[17]。建模模板来自于美国国家生物技术信息中心(National Center of Biotechnology Information,NCBI)的Structure 数据库。
将StDAC 氨基酸序列提交至Blast(https://blast.ncbi.nlm.nih.gov/Blast.cgi)、Phyre2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id =index)和HHpred(https://toolkit.tuebingen.mpg.de/tools/hhpred)在线数据库,搜索与StDAC 具有同源性的模板。将氨基酸同源性与软件评分较高的单模板依次通过脚本salign.py,align2d_mult.py 和model_mult.py 进行多模板建模,返回的pdb 文件通过Discovery studio可视化即可模拟StDAC 三级结构。
将预测的模型提交至SAVES 在线服务器(https://saves.mbi.ucla.edu/), 根据提示分别对Verify-3D,Errat 和PROCHECK 中Ramachandran 图对模型的3D 结构、晶体学和生理化学参数进行评估。
利用HMMER 预测和NCBI 数据库比对在嗜热链球菌S-3 全基因组中发现的一个编码DisA_N 结构域的c-di-AMP 合成酶基因(orf0696),将其编码的蛋白命名为StDAC。StDAC 分别与已报道的枯草芽孢杆菌c-di-AMP 合成酶CdaA 和DisA 拥有47%和33%的氨基酸序列相似性[10,18]。用PROTTER在线分析软件对StDAC 跨膜区进行预测,结果显示StDAC 的第7~52 个氨基酸为跨膜区,第1~6 个氨基酸和第53~235 个氨基酸位于膜内侧。跨膜区预测结果为StDAC 异源表达提供了借鉴,可通过切除第7~52 个氨基酸提高可溶性蛋白含量。如图1 所示。
图1 PROTTER 预测StDAC 跨膜区
二级结构预测方法通常基于统计经验算法(MLRC、DPM、GOR Ⅰ、GOR Ⅲ)、物理化学算法(SOPM、DSC、Predator)和神经网络算法(HNN、PHD),这些方法预测的α-helix 的准确性高于90%[19-20]。综合9 种预测方法得到的StDAC 二级结构有42.98%(共101 个氨基酸)为α-螺旋,15.32%(共36 个氨基酸)为β-折叠,38.30%(共90 个氨基酸)(图2)为无规则卷曲。用物理化学算法DSC 和神经网络算法PHD 预测的二级结构更接近综合预测结果。如表1所示。
表1 StDAC 不同算法二级结构预测结果
图2 StDAC 二级结构预测
SWISS-MODEL 在线服务器选择用氨基酸同源性最高和覆盖率最广的模板6hvm 对StDAC 进行单模板建模(图3A)。由于模板6hvm 的晶体结构没有跨膜区,因此SWISS-MODEL 要对含DisA_N 结构域的StDAC 从第70~228 个氨基酸序列(共158 个氨基酸)进行三维建模。利用Modeller 进行多模板建模,用NCBI、Phyre2 和HHpred 在线数据库搜索StDAC 建模模板,以氨基酸同源性高、软件评分高和氨基酸覆盖率广为标准,以6gyw、6huw 和d2fb5a1为模板对StDAC 进行多模板建模,如图3B 所示。用SWISS-MODEL 和Modeller 两种方法建立的三级结构都包含5 个α-螺旋区域和7 个β-折叠区域,但Modeller 建立的三级结构包括跨膜区域。
图3 StDAC 的SWISS-MODEL 和Modeller 建模A:SWISS-MODEL;B:Modeller
Ramachandran 图为最常见三级结构评估方法,图中的红色区域为“最适区域”,黄色区域为“允许区域”,其他区域的红点均为构象不合理的氨基酸,合理的三级结构须有90%以上的氨基酸落在红色区域[21]。用SWISSMODEL 建立的StDAC 三级结构有92.0%的氨基酸落在最适区域,8.0%的氨基酸落在允许区域。用Modeller 建立的三级结构有92.4%的氨基酸落在最适区域,7.6%的氨基酸落在允许区域。因此, 两种方法建立的三级结构在Ramachandran 图评估中都不存在氨基酸构象不合理的情况。如图4 所示。
图4 StDAC 三级结构Ramachandran 图A:SWISS-MODEL;B:Modeller
Errat 通过统计和分析0.35 nm 半径内,不同类型原子之间非键相互作用的数据,是通过晶体学方法评估蛋白质模型,软件评分大于85%的模型才具有可靠性,图中的黄线和红线越多表示三级结构的可靠性越差[22]。由SWISSMODEL 建立的StDAC 三级结构Errat 的评分为98.98%,模型通过评估。而Modeller 建立的三级结构Errat 的评分为78.28%,其中跨膜区和第180~230 个氨基酸处出现了较多的黄线和红线,构象不合理导致模型评分低,如图5所示。
图5 StDAC 三级结构Errat 评分A:SWISS-MODEL;B:Modeller
Verify-3D 是基于统计分析结果来评估蛋白三维结构与氨基酸序列的相容性的,合理的三级结构通常有80%以上氨基酸的相容性评分高于0.2[23]。由SWISSMODEL建立的StDACVerify-3D评分为84.06%,通过评估。而Modeller 建立的StDAC 三级结构Verify-3D 的评分为54.04%,没有通过评估,与Errat的评估结果相同,跨膜区和第180~230 个氨基酸结构不合理导致整体结构评分较低,如图6 所示。
图6 StDAC 三级结构Verify-3D 分析A:SWISS-MODEL;B:Modeller
通过Verify-3D、Errat 和PROCHECK 中的Ramachandran图对建立的StDAC 三级结构进行评估,评估结果表明由SWISS-MODEL 建立的StDAC三级结构通过了Ramachandran、Errat 和Verify-3D的评估,蛋白结构较为合理;由Modeller 建立的全长StDAC 三级结构仅通过了Ramachandran 评估,三级结构评分低。因此,可通过SWISS-MODEL 模拟的三级结构对StDAC 的结构与功能进行研究。
基于嗜热链球菌S-3 全基因组测序结果,结合HMMER 预测和NCBI 数据库比对筛选出c-di-AMP 合成酶StDAC。利用统计经验算法、物理化学算法和神经网络算法共9 种方法预测StDAC 的二级结构42.98%为α-螺旋、15.32%为β-折叠、38.30%为无规则卷曲。分别通过SWISS-MODEL 和Modeller 模拟StDAC 三级结构,其中SWISSMODEL 单模板建模的StDAC 三级结构在PROCHECK、Verify-3D 和Errat 三个分析软件中评分最高,为研究c-di-AMP 合成酶StDAC 的结构与功能提供了可靠的模型,并为进一步阐明嗜热链球菌中c-di-AMP 的调控机制奠定了基础。