比较基因组学揭示鼠李糖乳杆菌Probio-M9在种内的基因组差异

2023-03-23 06:22徐瑞波李伟程张和平
中国食品学报 2023年2期
关键词:鼠李糖基因组学分支

徐瑞波,刘 旭,李伟程,沈 馨,张和平*

(1 内蒙古农业大学 乳品生物技术与工程教育部重点实验室 呼和浩特 010018 2 内蒙古农业大学 农业农村部奶制品加工重点实验室 呼和浩特 010018 3 内蒙古农业大学 内蒙古乳业生物技术与工程重点实验室 呼和浩特 010018)

鼠李糖乳杆菌(Lactobacillus rhamnosus)是厚壁菌门乳杆菌科的一种革兰氏阳性杆状细菌。鼠李糖乳杆菌广泛存在于婴儿粪便样本以及人类母乳中[1],这些细菌通常对消化道中的条件具有耐受性(即低pH 值、胆盐、厌氧条件)[2]。国内外大量研究发现,鼠李糖乳杆菌具有调节肠道菌群[3],调节肠道免疫[4-7],抗氧化[8]、抑制生物毒素[9],抑制致病菌[10-11]和调控脂肪细胞分化[12]等功能。据报道,在新生儿中使用某些鼠李糖乳杆菌菌株,特别是鼠李糖乳杆菌GG,可促进早产和低出生体重新生儿的生长[13-14]。

前期研究[15]从40 份人初乳样品中分离出有活性的益生菌菌株——鼠李糖乳杆菌Probio-M9,该菌株在人工胃肠液中消化11 h 后的存活率为78.33%,在中国具有自主知识产权,推测更适合中国人和其他亚洲人,因此本文对该菌株做后续安全性评估、动物实验和全基因组测序等研究具有参考价值。

比较基因组学是从基因水平比较不同物种的基因组序列,从而了解其基因的功能、表达机制及物种进化的学科[16]。Sun 等[17]通过比较基因组学对213 株乳杆菌属进行分析,系统解析了乳杆菌属不同谱系的遗传进化历程,发现所有的乳杆菌都是由一个共同的祖先进化而来的。Yu 等[18]通过核心基因比对分析乳酸乳球菌、植物乳球菌等若干乳球菌属的核心基因,解析乳球菌属内的遗传进化关系,发现乳球菌属在基因组大小,基因含量和碳水化合物代谢方面具有高度多样性。孙靓[19]通过比较基因组学分析两株鼠李糖乳杆菌,结果发现鼠李糖乳杆菌基因组层面的断裂基因和转录组层面的丙酮酸代谢途径上表达的差异,可能是鼠李糖乳杆菌高产L-乳酸的原因。比较基因组学能有效分析、挖掘和利用微生物基因组各个层面信息,能够准确且快速地研究菌种的同源基因以及特有功能。

目前对来源于母乳的菌株研究较少。特别是在中国,关于从人乳中分离得到的鼠李糖乳杆菌的研究报道更少,而关于母乳分离株鼠李糖乳杆菌的比较基因组研究更是少之又少。本研究将以母乳分离株鼠李糖乳杆菌Probio-M9 结合NCBI Refseq 数据库下载的214 株鼠李糖乳杆菌基因组序列为研究对象,通过比较基因组学解析不同菌株基因特征及种内基因差异,了解其遗传进化机制,为鼠李糖乳杆菌Probio-M9 开发利用提供参考。

1 材料与方法

1.1 试验菌株

鼠李糖乳杆菌Probio-M9 由内蒙古农业大学乳酸菌菌种资源库(Lactic acid bacteria collection center,LABCC)提供。

1.2 鼠李糖乳杆菌基因组序列

截止2021年4月17日,已将NCBI(National Coalition Building Institute,https://www.ncbi.nlm.nih.gov/)Refseq 数据库中214 株鼠李糖乳杆菌基因序列以及一株暂未公开的鼠李糖乳杆菌Probio-M9 全部下载完成。

1.3 菌株培养与基因组DNA 的提取、测序

菌株鼠李糖乳杆菌Probio-M9 的培养具体操作步骤如下:将该菌接种到37 ℃的MRS 液体培养基中,无氧条件培养24 h 后进行传代,最后使用PBS 缓冲液将3 代菌泥中废弃培养基去除,然后进行全基因组DNA 的提取。全基因组DNA 提取方法参考钟智等[20]的方法。将提取的DNA 通过1%琼脂糖凝胶电泳进行完整度和纯度检测,将符合要求的高质量DNA 按照PacBio SMRT 全基因组DNA 建库流程建立10 kb 文库,建库后根据PacBio SMRT RS II 测序平台上机流程进行全基因组测序。

1.4 基因组测序和组装

将测序所得原始数据进行质量评估[21],去掉低质量测序序列和接头,使用RS_HGAP_Assembly.3 软件对鼠李糖乳杆菌Probio-M9 序列进行质控和基因组组装,并使用Circlator(V1.5.5)[22]软件对3 代数据进行环化,最后获得Probio-M9 的全基因序列。

1.5 比较基因组分析

1.5.1 泛-核心基因集构建 利用Prokka[23]软件对菌株基因组进行基因预测后,采用Roary[24]软件对核心基因集、泛基因集进行识别。

1.5.2 系统发育树构建 使用经Roary 软件分析得到的核心基因序列,通过TreeBest 软件(http://www.mybiosoftware.com/treebest)构建邻接系统发育树(Neighbor-Joining,NJ)。使用iTol 在线软件对系统发育树进行可视化(http:// https://itol.embl.de/)[25]。

1.5.3 平均核苷酸一致性(Average nucleotide identity,ANI)计算 本研究参考Jain 等[26]报道的fastANI(https://github.com/ParBLiSS/FastANI)计算215 株鼠李糖乳杆菌的菌株间ANI 值。利用TBtools[7]软件绘制ANI 聚类热图。

1.5.4 全基因组圈图和功能基因组分析 将215株鼠李糖乳杆菌核酸序列文件分别上传至RAST(Repaid Annotion using Subsystem Technology,http://rast.nmpdr.org/rast.cgi)进行注释,并下载对应的基因功能注释文件。将鼠李糖乳杆菌Probio-M9 的功能基因注释文件上传至CGView Server(http://stothard.afns.ualberta.ca/cgview_server/)进行圈图绘制。

1.5.5 碳水化合物活性酶 将组装完成的鼠李糖乳杆菌Probio-M9 全基因组序列上传至在线注释dbCAN 平台中(http://bcb.unl.edu/dbCAN2/)进行注释,下载其注释文件。统计鼠李糖乳杆菌Probio-M9 基因组信息。

2 结果和分析

2.1 鼠李糖乳杆菌基因组基本信息

对样品鼠李糖乳杆菌Probio-M9 测序数据进行评估组装后,拼接成完整的基因组圈图(图1),并统计鼠李糖乳杆菌所有菌株的基因组信息。鼠李糖乳杆菌Probio-M9 组装后,基因组大小为2 987 632 bp,GC 含量为46.76%,包含2 934 个蛋白质编码区(Coding sequence,CDS)、60 个tRNA、75 个RNA。215 株鼠李糖乳杆菌基因组大小(2.97±0.11)Mbp,GC 含量为(46.68±0.016)%,CDS为(2 671±130)个。

图1 鼠李糖乳杆菌Probio-M9 全基因组圈图Fig.1 The whole genome circle-map of L.rhamnosus Probio-M9

2.2 泛-核心基因集构建

一个物种泛基因组主要由核心基因组、非必须基因组以及特有基因组3 部分组成[28]。215 株鼠李糖乳杆菌共识别到16 915 个泛基因,247 个核心基因,并且215 株鼠李糖乳杆菌核心基因占平均CDS 为9.2%,揭示鼠李糖乳杆菌存在一个较大的泛基因组,但是拥有一个较小的核心基因组。鼠李糖乳杆菌的泛-核心基因统计结果如图2所示,核心基因随着基因组的增加整体呈现一个先下降后趋于稳定的状态而泛基因组大小整体呈现上升趋势,表明鼠李糖乳杆菌的泛基因组尚且处于一个相对开放的状态,与Kant 等[29]的研究结果基本一致。

图2 泛-核心基因集变化(a)和新基因集变化(b)趋势图Fig.2 The trend chart of the size of pan-core genes(a)and new genes(b)

2.3 核心基因构建系统发育树

系统发育树可直观反映菌株间群体结构和遗传进化关系。为了研究鼠李糖乳杆菌种内遗传进化关系,本研究基于215 株鼠李糖乳杆菌(包含模式菌株鼠李糖乳杆菌DSM20021T=鼠李糖乳杆菌NBRC3425T=鼠李糖乳杆菌JCM1136T、鼠李糖乳杆菌NRRL B-442T),采用邻接法,基于247 个核心基因通过1 000 次的引导迭代,构建系统发育树。

由图3 可知,215 株乳酸菌主要分为7 大分支,分别命名为分支Ⅰ、分支Ⅱ、分支Ⅲ、分支Ⅳ、分支Ⅴ、分支Ⅵ和分支Ⅶ。由图可知,分支Ⅱ是该树最大的分支且鼠李糖乳杆菌Probio-M9 和模式菌株均在该分支中,并且该分支各菌株之间的遗传关系近、差异很小、区分难度大。同时根据系统发育树外圈注释发现,鼠李糖乳杆菌的遗传关系与分离源和分离地相关性不明显。

图3 基于核心基因的系统发育树Fig.3 Phylogenetic tree based on core genes

2.4 ANI 分析

ANI 是通过比对基因组的同源序列以鉴定菌株亲缘关系[30]。在比较基因组学分析过程中,ANI可用于评估基因组间多态性的程度,也可基于基因组序列进行物种鉴别,一般认为ANI 值大于95%即为同一物种[31]。2018年Ciufo 等[32]将95%的阈值改为96%,并以此作为物种边界。

为解析鼠李糖乳杆菌遗传多样性,本研究对215 株鼠李糖乳杆菌进行两两之间ANI 计算,并构建聚类热图,结果如图4所示,全部菌株之间ANI 值均大于96.38%,鼠李糖乳杆菌菌株之间具有较高的总体序列同一性(>96%),这与Nissila等[33]和Arnold 等[34]的研究结果一致,提示鼠李糖乳杆菌种内的相似度较高。

图4 平均核酸一致性Fig.4 Average nucleotide identity

2.5 基因组预测与注释

由于分支Ⅱ是系统发育树最大分支且鼠李糖乳杆菌Probio-M9 和模式菌株均在该分支中,因此利用RAST 在线工具对分支Ⅱ中98 株鼠李糖乳杆菌菌株进行RAST 注释,结果如图5所示。在鼠李糖乳杆菌基因组中注释到碳水化合物代谢(Carbohydrates)、蛋 白 质 代 谢(Protein metabolism)、氨基酸及其衍生物(Amino acids and derivatives)、细胞壁和被膜(Cell wall and capsule)、DNA 代谢(DNA metabolism)、RNA 代谢(RNA metabolism)和应激反应(Stress response)等,共计26 个功能类别。其中占比最大的是“碳水化合物代谢”,其次是“蛋白质代谢”和“氨基酸及其衍生物”。根据RAST 注释发现菌株Lrh44、CRL1505、Lactobacillus rhamnosus、KF7、BIOML -A4、Lrh26、Lrh25、AMC010、1019 在硫代谢方面要显著高于鼠李糖乳杆菌Probio-M9,而其它菌株与鼠李糖乳杆菌Probio-M9 呈现一种高度相似,从RAST 注释无法找到差异。

图5 RAST 注释Fig.5 RAST annotation

2.6 基因组圈图和功能基因组分析

本文以RAST 注释中与鼠李糖乳杆菌Probio-M9 差异明显的3 株菌和一株模式菌株鼠李糖乳杆菌DSM20021T为研究对象,通过BRIG 软件进行分析,结果如图6所示,参考菌株鼠李糖乳杆菌Probio-M9 与模式菌株鼠李糖乳杆菌DSM20021T 匹配度最高为100%,最低为63.31%。约有344 bp 和293 bp 基因组片段匹配度大于等于90%,占总片段长度的22.21%;分析发现477 bp 和613 bp 基因片段匹配度小于70%,约占总片段的3.08%。鼠李糖乳杆菌Probio-M9 注释到12个特有基因(见表1),主要负责自身代谢、转录、运输等方面的调控。图中白色部分是核苷酸同一性小于50%的区域,主要包括编码应激蛋白、生物合成相关蛋白、假定蛋白和噬菌体相关蛋白等多种蛋白质的基因,而这些蛋白质小范围的插入与缺失可以使菌株基因组结构多样化[35-37]。

图6 以鼠李糖乳杆菌Probio-M9 为参考基因组的Brig 分析Fig.6 Brig analysis based on L.rhamnosus Probio-M9 as reference genome

表1 鼠李糖乳杆菌Probio-M9 特有基因Table 1 L.rhamnosus Probio-M9 specific gene

同时又选取了2 株益生菌明星菌株鼠李糖乳杆菌GG、鼠李糖乳杆菌HN001 和一株模式菌株鼠李糖乳杆菌 DSM20021 与鼠李糖乳杆菌Probio-M9 进行BRIG 分析(如图7),结果如表2所示,鼠李糖乳杆菌Probio-M9 相较于市面上的益生菌明星菌株编码更多的关于水解、还原相关酶类,同时还发现鼠李糖乳杆菌Probio-M9 编码一个特别的基因(xly),与黄原胶裂解酶相关[38],黄原胶裂解酶是一种黄原胶修饰酶,对黄原胶的改性及新型黄原胶寡糖的制备具有十分重要的意义。

表2 以鼠李糖乳杆菌Probio-M9 为参考基因组的功能基因组分析Table 2 Functional genome analysis using L.rhamnosus Probio-M9 as a reference genome

图7 以鼠李糖乳杆菌Probio-M9 为参考基因组的全基因组圈图Fig.7 Genome-wide cycle map with the reference genome of L.rhamnosus Probio-M9

2.7 益生特性相关基因分析

本研究基于Roary 软件注释到鼠李糖乳杆菌Probio-M9 含有与益生特性相关的基因,具体信息见表3。鼠李糖乳杆菌Probio-M9 含有谷胱甘肽合成(gshAB)、分泌胞外多糖(rmlA~rmlD、epsH)及核黄素合成(ribF)相关基因,同时含有耐酸基因(clpP)。研究表明[39],谷胱甘肽是细胞内调节代谢的重要物质,并且常参与肠黏膜的抗氧化机制,保护肠道免受组织损伤,提高有益菌株在胃肠道中的存活率。鼠李糖乳杆菌EPS 具有益生元、调节机体免疫功能、抗氧化效应、抑制动物脂肪生成和吸收重金属等生理功能[40-43]。本研究还发现,鼠李糖乳杆菌Probio-M9 存在提高宿主代谢能力(tagE)和产乳酸(ldh)相关的基因,可提高菌株益生特性。本研究利用比较基因组学从基因水平揭示了鼠李糖乳杆菌Probio-M9 具有多个益生特性相关基因,认为其是一株具有潜在益生功能的菌株。

表3 鼠李糖乳杆菌Probio-M9 具有的益生特性相关基因Table 3 Genes related to probiotic properties of L.rhamnosus Probio-M9

3 结论

本研究以鼠李糖乳杆菌Probio-M9 为例,结合NCBI 数据库214 株鼠李糖乳杆菌基因组序列进行比较基因组学研究。215 株鼠李糖乳杆菌通过247 个核心基因构建系统发育树发现分离源和分离地不存在明显聚类趋势。鼠李糖乳杆菌Probio-M9 处在分支最大的分支Ⅱ中,该分支各菌株之间的遗传关系近、差异很小、区分难度大。然后对分支Ⅱ中98 株鼠李糖乳杆菌进行RAST 注释分析发现,鼠李糖乳杆菌虽在功能方面整体存在高度的相似性,但其中部分菌株与鼠李糖乳杆菌Probio-M9 依然存在着一定差异,鼠李糖乳杆菌Probio-M9 相较于其它鼠李糖乳杆菌有着关于自身代谢、转录、运输等方面更强的调控能力并且含有与益生功能相关的基因,如谷胱甘肽(gshAB)、胞外多糖(rmlA~rmlD、epsH)及提高宿主代谢能力(tagE)相关基因。本文通过比较基因组学分析发现鼠李糖乳杆菌的序列与功能有着高度的相似性,并且鼠李糖乳杆菌Probio-M9 存在益生功能相关的基因,为后续鼠李糖乳杆菌Probio-M9 基因组研究及其益生功能开发奠定遗传学基础。

猜你喜欢
鼠李糖基因组学分支
基于基因组学数据分析构建肾上腺皮质癌预后模型
系统基因组学解码反刍动物的演化
鼠李糖脂发酵液驱油性能研究
巧分支与枝
生物表面活性剂鼠李糖脂研究概况
一类拟齐次多项式中心的极限环分支
铜绿假单胞菌半固态发酵生产鼠李糖脂
以甘油为底物鼠李糖脂高产菌株的诱变选育
营养基因组学——我们可以吃得更健康
生成分支q-矩阵的零流出性