一株牦牛源产细菌素植物乳杆菌SWUN5815全基因组测序及序列分析

2021-05-10 12:37陈德纯周晏阳杨发龙
中国农业大学学报 2021年5期
关键词:基因组测序杆菌

陈德纯 周晏阳 周 泷 杨发龙 汤 承

(西南民族大学 畜牧兽医学院,成都 610041)

乳酸菌(Lactic acid bacteria)是一种能够产生乳酸的革兰氏阳性细菌,广泛存在于自然界中,乳酸菌功能包括维持机体微生态平衡,抑制致病菌在宿主体内定植,并且能够保护肠道粘膜完整性的作用[1]乳酸菌还可以提高机体免疫,通过激活肠道黏膜免疫反应,提高机体对致病菌的反应活性[2]。乳杆菌属(LactobacillusBeijerinck)是乳酸菌中数量最多的属分类,也是目前为止人类研究最多和应用最广的一类益生菌。乳酸菌代谢过程中产生的细菌素为无毒副作用和耐药性的生物活性的多肽[3]。细菌素独特的的抗菌活性,有望在临床抗感染领域发挥一定的作用。基于乳酸杆菌的特异性功效,越来越多的研究表明,乳酸菌是一种未来的抗生素替代品[4-5]。

全基因组测序(Whole-genome sequencing,WGS)可将细菌的完整基因组序列全部测序出来的技术,通过基因组序列的分析和基因功能分析(包括GO、KEGG、COG和NR等),更好地理解同属种之间的差异。全基因组测序技术已成为了一种高效检测手段,目前该技术已经在肠道菌群、土壤和真菌[6-8]微生物群落的分析鉴定中得到了应用。在深入挖掘核心基因组、鉴定特异基因以及功能基因组学研究方面具有重要的意义,为探究未知微生物类群多样性和生物学特性的重要手段。

乳酸菌能够调节肠道菌群的平衡,在机体内起到抑制致病菌的作用,在治疗疾病方面具有代替传统抗生素的潜力。长久以来人们一直致力于寻找能够替代抗生素的益生菌。尽管很多研究表明乳杆菌在动物肠道能够起到一定抑制致病菌的作用,但其在动物肠道疾病的治疗应用上还很不成熟,并且乳杆菌在动物体内的具体作用机制仍不清楚。基于本课题组前期从牦牛粪便中分离出一株具有耐酸耐胆盐特性的植物乳杆菌SWUN5815,研究表明其具有较强的抗菌活性,可增强小鼠的肠道免疫能力[9],是一种潜在的具有抗生素替代功能的益生菌,但其具体机体作用机制尚不清楚。针对此乳酸杆菌菌株,尚未从基因组水平揭示和阐释其功能基因和代谢通路信息。因此,本研究采用PacBio RSII测序平台对乳杆菌SWUN5815进行全基因组测序分析和GO、KEGG、COG和NR数据库基因组基本功能注释,从基因组水平进一步揭示该株乳杆菌的功能关键基因和代谢通路信息,为该菌株在寻找肠道抗生素替代品和食品添加剂的开发等方面的研究提供科学指导和生产实践参考。

1 材料与方法

1.1 试验材料

1.1.1菌株

牦牛源植物乳杆菌SWUN5815为西南民族大学畜牧兽医学院临床兽医学团队从川西北牦牛粪便中分离和筛选获得[10]。

1.1.2相关试剂和仪器设备

乳酸细菌(MRS)固体培养基和MRS肉汤培养基(杭州微生物试剂有限公司),细菌基因组DNA提取试剂盒(DP302,天根生化科技(北京)有限公司)。

Pacbio测序仪(Pacbio RSII,Pacific Biosciences,USA),PCR仪(ABI GeneAmp®9700,ABI,USA),生化培养箱(上海一恒科技有限公司,中国)。

1.2 试验方法

1.2.1牦牛源植物乳杆菌SWUN5815基因组DNA的提取

冷冻保存的SWUN5815菌株在MRS固体培养基涂板进行活化复苏培养,再挑取单个菌落接种到MRS液体培养基中纯化。培养12 h后提取细菌DNA,依据天根生化试剂盒说明书进行操作。纯化的基因组DNA采用分光光度计检测进行定量。高质量的DNA(OD260/OD280在1.8~2.0,质量浓度≥20 ng/μL)用于后续的建库测序。

1.2.2文库构建及库检

测序委托北京诺禾致源科技股份有限公司完成。质检合格的菌株DNA样品经Covaris g-TUBE剪切成小片段DNA。受损的DNA经修复后用DNA黏合酶连接接头,使用AMpure PB磁珠对DNA片段进行纯化,并构建SMRT Bell文库。Buffer溶解,经片段筛BluePipin后分成固定大小片段,再次使用AMpure PB磁珠进行纯化。二次得到的文库使用Qubit进行浓度测定,Agilent 2 100对文库质量质检。采用第3代测序仪PacBioRS II对DNA进行测序。

1.2.3生物信息分析

过滤除掉低质量的reads后的clean date进行基因组组装,包含菌株的基因组基因情况的序列文件进行评价;分析菌株基因组成分,涉及编码基因(http:∥topaz.gatech.edu/GeneMark/)、重复序列及滚环(http:∥topaz.gatech.edu/GeneMark/)、tRNA(http:∥lowelab.ucsc.edu/tRNAscan-SE/)等基因成分的分析;然后对编码基因进行功能注释,包含的数据库有GO数据库(http:∥geneontology.org/)、KEGG(https:∥www.genome.jp/kegg/)、COG数据库(http:∥www.ncbi.nlm.nih.gov/COG/)、针对病原微生物的数据库(http:∥ardb.cbcb.umd.edu/)和NCBI数据库(https:∥www.ncbi.nlm.nih.gov/);Treebest(Version 1.9.2)软件构建系统发生树。从基因组和基因两层面分别比较样品与参考基因组的差异;呈现基因组组分分析结果和功能注释结果。

2 结果与分析

2.1 植物乳杆菌SWUN5815基因组组装

通过PacBio RSII测序平台,对植物乳杆菌SWUN5815进行了完成图测序,测序及预测结果如表1所示。SWUN5815染色体基因组组成为一个环状基因组,大小为3.27 Mb,GC含量为44.59%。SWUN5815存在多个质粒。GeneMarkS软件对乳杆菌的基因组进行编码基因预测,获知SWUN5815的基因组有3 258个编码基因,总长度为2 814 147 bp,平均长度864 bp,占基因组的84.13%。植物乳杆菌SWUN5815全基因组中转座子的数量为64个,总长度为5 180 bp,平均长度为91 bp。长散在重复序列有34个,总长度为2 252 bp,占基因组的0.067 3%,平均长度为71 bp。短散在重复序列有10个,总长度为627 bp,平均长度为63 bp。滚环有3个,总长度为200 bp。植物乳杆菌SWUN5815基因组中含有69个tRNA,平均长度为77 bp,总长度为5 314 bp。基因岛的数量为12个,长度为152 316 bp。

表1 植物乳杆菌SWUN5815基因组统计Table 1 Genome statistics of SWUN5815

2.2 植物乳杆菌SWUN5815基因组组分分析

由图1可以看出,SWUN5815基因组圈图最外圈是基因组序列位置坐标。自外向内分别是编码基因、基因功能注释结果(依次为COG、KEGG和GO数据库的注释结果信息)、ncRNA、基因组GC含量和基因组GC skew值分布。编码基因和基因功能注释结果包括外侧的正链和内侧的反链组成。

最外圈的编码基因显示基因总长度为2 172 224 bp;第2圈为正链和负链的CDS(编码序列)区域,不同的颜色代表不同的COG功能分类,编码基因的数量为3 258个,其中COG注释的基因为2 386个,占编码基因的73.23%,涉及的分类包括新陈代谢、信息存储与处理、细胞作用与信号传递和无明显特征4个大分类,并在22个类型上包括转录、碳水化合物运输和代谢、氨基酸转运与代谢等得到了注释;第3圈为正链和负链的CDS,不同的颜色代表不同的KEGG功能分类,1 144个基因分别在6大功能32个通路上得到功能注释;第4圈为正链和负链的CDS,不同的颜色代表不同的GO功能分类,共获得2 231个基因注释,注释得到41种功能特性;第5圈为ncRNA;第6圈为GC含量,向外的颜色代表GC含量高于全基因组平均GC含量,反之向内的颜色表示GC含量低于全基因组平均GC含量,峰值的绝对值表示两者的差异;第7圈为GC-Skew值,正值代表正链易于转录为CDS,反之,负值时负链易于转录为CDS。基因组圈图可以直观的认识菌株基因组分布。

图1 植物乳杆菌SWUN5815全基因组图谱Fig.1 Genome map of SWUN5815

2.3 植物乳杆菌SWUN5815基因功能分析

对预测得到的编码基因进行基础的功能注释,与数据库GO、KEGG、COG和NR等。SWUN5815基因组中所有基因能够注释到GO信息的基因数目为2 231个,可注释到COG信息的基因数目为2 386个,与KEGG数据库比对能够定位到具体Pathway的基因数目有1 762个。

表2 植物乳杆菌SWUN5815基因功能统计分析Table 2 Statistical function analysis of SWUN5815

2.3.1GO(GeneOntology)数据库注释

GO为基因功能描述的分类系统,包括三大类:分子功能(Molecular function,简称MF)、细胞组分(Cellular component,简称CC)和生物过程(Biological process,简称BP)。植物乳杆菌SWUN5815在GO数据库三大类统计结果如图2所示:GO分类中共有2 231个基因进行了注释,注释得到41种功能分类。其中MF中基因数量参与最多的前三位是催化活性、结合和转运活性;CC中细胞、细胞部分和高分子络合物是基因数量最多的功能注释;BP得到功能注释最多的前三位是代谢过程、细胞过程和定位。与抗氧化活性相关的基因包括GM00057、GM000185、GM000750、GM002948和GM003068。参与免疫系统过程的基因涉及GM001449和GM003206。

图2 植物乳杆菌SWUN5815基因功能注释GO功能分类Fig.2 GO function classification map of SWUN5815

2.3.2KEGG数据库注释

植物乳杆菌SWUN5815的氨基酸序列,与KEGG数据库进行比对,把目标物种的基因和其相对应的功能注释信息结合起来,得到注释结果。SWUN5815菌株在KEGG数据库中共有1 144个基因分别在细胞过程、环境信息处理、遗传信息处理、人类疾病、新陈代谢和生物体系统6大功能32个通路上得到功能注释,结果如图3所示。

注释中涉及的代谢通路总数以及参与每个代谢通路的基因组数目,分析发现在代谢途径、环境信息处理和遗传信息处理得到较多的基因功能注释。其中1 049个基因在代谢通路上得到注释,12个代谢通路中,碳水化合物代谢相关的基因为223个,占代谢通路注释基因(1 049)的21.26%。195个基因在环境信息处理层面得到注释,其中与膜运输相关的基因为136个,与信号传导相关的基因59个。

其中细菌素和免疫相关基因的Pathway通路信息及其Pathway ID如表3所示。SWUN5815基因组中包含了参与抗生素、生物降解等代谢过程基因;可调控免疫和炎症的通路(包括PPAR和RIG-I样受体通路)的组织系统通路相关基因;可调节人类疾病的金黄色葡萄球菌感染的map05150有4种相关基因,包括GM001668、GM001141、GM001666和GM000529,在感染疾病通路水平上参与拮抗金黄色葡萄球菌感染。

GM000962基因参与原核生物糖代谢调控中,作用于万古霉素类抗生素的生物合成。SWUN5815中GM000328和GM000663参与PPARs信号通路的调控。乳杆菌SWUN5815中含有1个基因GM000137参与RIG-I样受体(维甲酸诱导基因I)信号通路的调控中。

2.3.3COG数据库注释

COG蛋白数据,能够根据细菌完整基因组的编码蛋白系统进化关系分类,并将每个蛋白序列注释到相应的同源序列构成的COG簇中。

注释得知植物乳杆菌SWUN5815含有合成MFS型转运蛋白功能(Atg22 family)的序列,位于基因编号是GM002542。合成膜蛋白Yag U的功能序列(DUF1440 family),基因组编号是GM002449。还包含4个合成ABC型抗菌肽转运系统的功能序列,基因组编号分别是GM000256、GM002379、GM002450和GM002479。

图3 植物乳杆菌SWUN5815基因功能注释KEGG代谢通路Fig.3 The gene KEGG pathway classification map of SWUN5815

表3 植物乳杆菌SWUN5815基因组细菌素和免疫调控通路及其相关基因Table 3 Related genes of bacteriocins and immune regulatory pathways in SWUN5815 genome

C:能源生产和转换(119);D:细胞周期控制,细胞分裂,染色体分裂(39);E:氨基酸转运与代谢(231);F:核苷酸转运和代谢(108);G:碳水化合物运输和代谢(272);H:辅酶转运与代谢(129);I:脂质转运与代谢(101);J:翻译、核糖体结构与生物发生(204);K:转录(276);L:复制、重组和修复(107);M:细胞壁/膜/包膜生物发生(150);N:细胞运动(16);O:翻译后修饰,蛋白质转换,伴侣(83);P:无机离子转运与代谢(134);Q:次生代谢产物生物合成、运输和分解代谢(39);R:仅一般功能预测(252);S:功能未知(176);T:信号转导机制(112);U:细胞内运输、分泌和囊泡转运(17);V:防御机制(71);W:细胞外结构(3);X:运动组:原噬菌体,转座子(45);括号内数字代表匹配的基因数 C: Energy production and conversion (119); D: Cell cycle control, cell division, chromosome partitioning (39); E: Amino acid transport and metabolism (231); F: Nucleotide transport and metabolism (108); G: Carbohydrate transport and metabolism (272); H: Coenzyme transport and metabolism (129); I: Lipid transport and metabolism (101); J: Translation, ribosomal structure and biogenesis (204); K: Transcription (276); L: Replication, recombination and repair (107); M: Cell wall/membrane/envelope biogenesis (150); N: Cell motility (16); O: Posttranslational modification, protein turnover, chaperones (83); P: Inorganic ion transport and metabolism (134); Q: Secondary metabolites biosynthesis, transport and catabolism (39); R: General function prediction only (252); S: Function unknown (176); T: Signal transduction mechanisms (112); U: Intracellular trafficking, secretion, and vesicular transport (17); V: Defense mechanisms (71); W: Extracellular structures (3); X: Mobilome: prophages, transposons (45); The number in brackets represented the number of matched genes图4 植物乳杆菌SWUN5815 COG功能分类Fig.4 COG function classification chart of SWUN5815

2.3.4NR数据库注释和进化分析

NR数据库统计得到植物乳杆菌SWUN5815注释到的物种及基因数目统计结果如图5。

基于NCBI数据库已知的植物乳杆菌全基因组和植物乳杆菌SWUN5815全基因组用Treebest(Version 1.9.2)软件,采用NJ法构建系统发生树,物种之间的进化树绘制如图6植物乳杆菌SWUN5815与植物乳杆菌WCFS1进化最为相似达99.97%。

对植物乳杆菌SWUN5815潜在的细菌素基因进行挖掘,如表4,SWUN5815含有18个的II类细菌素相关编码基因。其中PlnA、PlnE、PlnF、PlnJ、PlnK、PlnN、PlnQ和PlnM合成对应的细菌素;PlnA以及PlnN属于Ⅱc类细菌素;PlnE、PlnJ、PlnK和PlnF属于Ⅱb类双肽类细菌素。

3 讨 论

本研究采用PacBio RSII 3代高通量测序技术对分离牦牛粪便的具有益生特性的植物乳杆菌SWUN5815进行全基因组测序,经序列拼接组装后,确定该菌株基因组大小为3.27 Mb,GC含量为44.59%的微生物类群,同时将整合的基因组数据与GO、KEGG、COG和NR等数据库进行注释分析,完成菌株基因组功能的注释及数据统计工作,从分子生物学的角度探究了该菌株的生物学特性以及基因组功能特性。

1:植物乳杆菌(2882);2:乳酸菌(65);3:戊糖乳杆菌(47);4:副植物乳杆菌(44);5:干酪乳杆菌(10);6:蚕豆乳杆菌(9);7:乳酸杆菌噬菌体(5);8:副干酪乳杆菌(5);9:大肠杆菌(4);10:布氏乳酸杆菌(4);11:短乳杆菌(3);12:棒状乳杆菌(3);13:戊糖球菌(3);14:酒明串珠菌(2);15:乳酸杆菌(2);16:酸性乳酸球菌(2);17:肠系膜明串珠虫(2);18:诺登斯乳杆菌(2);19:动物乳杆菌(2);20:解淀粉乳杆菌(2);括号内数字代表匹配的基因数量 1: Lactobacillus plantarum (2 882); 2: Lactobacillus (65); 3: Lactobacillus pentosus (47); 4: Lactobacillus paraplantarum (44); 5: Lactobacillus casei (10); 6: Lactobacillus fabifermentans (9); 7: Lactobacillus phage (5); 8: Lactobacillus paracasei (5); 9: Escherichia coli (4); 10: Lactobacillus buchneri (4); 11: Lactobacillus brevis (3); 12: Lactobacillus coryniformis (3); 13: Pediococcus pentosaceus (3); 14: Oenococcus oeni (2); 15: Lactobacillales (2); 16: Pediococcus acidilactici (2); 17: Leuconostoc mesenteroides (2); 18: Lactobacillus nodensis (2); 19: Lactobacillus animalis (2); 20: Lactobacillus amylolyticus (2); The number in brackets represented the number of matched genes图5 植物乳杆菌SWUN5815 NR注释图Fig.5 NR annotation diagram of SWUN5815

图6 植物乳杆菌SWUN5815物种间的系统进化树Fig.6 Phylogenetic relationship among SWUN5815 and other species

表4 植物乳杆菌SWUN5815潜在的细菌素相关基因Table 4 Potential bacteriocin related genes of SWUN5815

通过基因功能GO注释分析得知SWUN5815基因组中包括5个基因参与抗氧化活性过程,2个基因参与免疫过程。前期研究表明,牦牛源植物乳杆菌SWUN5815可促进小鼠的生长发育和肠粘膜免疫功能[9],这可能与SWUN5815中存在的抗氧化基因和免疫过程相关基因有关。KEGG数据库中有1 144个基因在32个通路得到功能注释,SWUN5815基因组中包含了抗生素和生物降解等代谢过程;可调控免疫和炎症的通路(包括PPAR和RIG-I样受体通路)的组织系统通路相关。GM000962基因参与原核生物糖代谢调控中,参与万古霉素类抗生素的生物合成。SWUN5815中有GM000328和GM000663参与PPARs信号通路的调控,该通路与能量(脂、糖)代谢、细胞分化、增殖、凋亡和炎性反应等密切相关[11]。植物乳杆菌SWUN5815菌株中基因GM000137参与RIG-I样受体(维甲酸诱导基因I)信号通路的调控中。RIG-I 样受体是一种固有免疫的模式识别受体,可识别非自身的病毒RNA,同时激活RIG-I信号通路并促成细胞因子的生成,发挥出抗病毒的功效[12]。这可能是植物乳杆菌具有抗病毒作用的原因。COG功能分类显示,植物乳杆菌SWUN5815其含有合成参与胆汁耐受基因(MFS型转运蛋白功能Atg22序列)和耐酸性基因(DUF1440 family序列)[13]。这与乳杆菌SWUN5815具有耐胆汁、耐酸的特性相吻合。植物乳杆菌SWUN5815来源于高原环境的牦牛肠道,是一株特异性的对肠道有益的功能菌。

通过基因功能注释NR分析得知SWUN5815全基因组中含有18种已知细菌素基因。细菌素有较强的抑菌活性,也被认为是未来抗生素最有效的替代物。SWUN5815全基因组中包含PlnA、PlnE、PlnF、PlnJ、PlnK、PlnN、PlnQ和PlnM合成对应的Ⅱ类细菌素,其中PlnE、PlnJ、PlnK和PlnF属于Ⅱb类双肽细菌素[14],PlnA和PlnN属于Ⅱc类环状细菌素。细菌素的抗菌机制是穿过病原菌的细胞膜,增加其渗透性,导致离子流失以及膜电位的消耗,最终导致病原菌的死亡[15]。细菌素PlnP、PlnL和PlnM功能是辅助合成细菌素免疫蛋白,可以防止菌株被自身分泌的细菌素杀灭[16];PlnB、PlnC和PlnD是编码三组分调节系统的细菌素,参与生物膜成熟过程[17-18];PlnG与ABC转运系统相关,负责将细菌素分泌到胞外;PlnN、PlnU和PlnV是与膜蛋白合成等相关的细菌素[19]。SWUN5815具有多种功能的细菌素,这与前期研究乳杆菌SWUN5815能够抑制肠道病原菌减轻腹泻[20]的结果一致。COG注释分析发现有4个合成ABC型细菌素转运系统的功能序列,是细菌素转运和分泌的必要因素,说明植物乳杆菌SWUN5815拥有一套完整的细菌素合成和运输体系,保证了菌株的抑菌特性。

综上,牦牛乳杆菌SWUN5815基因组序列的解析,为研究该菌株的功能特性基因提供了大量的依据,也为研究产生细菌素的该菌株的抗菌机理提供理论依据。为今后深入开展抗生素替代品的益生菌饲料添加剂的研究提供了重要的参考数据。

猜你喜欢
基因组测序杆菌
牛参考基因组中发现被忽视基因
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
乳杆菌属分类学地位变迁后菌种名称英解汉译检索表(二)
解淀粉芽孢杆菌Lx-11
解淀粉芽孢杆菌的作用及其产品开发
侧孢短芽孢杆菌A60
基因测序技术研究进展
基因捕获测序诊断血癌
单细胞测序技术研究进展
基因组DNA甲基化及组蛋白甲基化