益生菌基因组学在乳酸菌筛选和功能评价中的应用

2024-02-23 07:35刘文俊张和平
中国食品学报 2024年1期
关键词:益生基因组学乳酸菌

刘文俊,张和平

(内蒙古农业大学 乳品生物技术与工程教育部重点实验室 农业农村部奶制品加工重点实验室内蒙古自治区乳品生物技术与工程重点实验室 乳酸菌与发酵乳制品省部共建协同创新中心 呼和浩特 010018)

益生菌被广泛应用于乳制品、发酵食品、饮料、膳食补充剂、活菌药物、化妆品、动物微生态制剂和微生物菌肥等不同的产品中,已经发展为产值超过千亿元人民币的朝阳产业[1]。近年来,随着分子生物学的发展,益生菌促进宿主健康特性背后的分子机制也逐渐被揭示出来,这些机理、机制的发现大大增加了人们对益生菌的认识,为益生菌的应用拓宽了范围。基因组学和功能基因组学以及高通量测序技术的出现,使人们对益生菌的产业化用途和代谢特性有了广泛的了解,这有助于发现新的值得探索的益生菌应用领域和潜力。2009 年,一门名为益生菌基因组学(Probiogenomics)的新学科应运而生[2]。益生菌基因组学旨在深入了解益生菌的多样性,揭示其促进宿主健康特性的分子机制[3]。全基因组测序、基因组数据挖掘和比较基因组学为了解微生物遗传内涵、差异和相似性提供了新的见解,并为可能的基因功能挖掘提供重要线索。

近年来,乳酸菌基因组信息呈爆发式增长态势,在公共数据平台发布的乳酸菌全基因组数量已经达到8 万余个(图1),这些基因组信息对研究人员认识乳酸菌的生理特征、有益功能、工业化加工特性的分子机制具有重要作用。益生菌基因组学结合体内、外随机对照试验,对发现新的益生菌菌株和表征益生乳酸菌的新功能发挥着越来越大的作用。益生菌基因组学和计算机深度机器学习模型相结合的分析技术已应用于益生菌可视化筛选、预测[4],益生乳酸菌安全相关特征的表征(比如:毒力因子、溶血素基因、抗菌素耐药基因和可移动原件)等方面取得了重要的研究成果[5]。鉴于此,有必要及时总结乳酸菌基因组学研究的最新进展,并基于基因组分析技术了解乳酸菌的产业化相关特征。本文从基因组学的角度论述益生乳酸菌(特别是工业化应用乳酸菌)相关的益生特性、生理生化等表型差异形成的分子机制。综述乳酸菌基因组学和依托基因组大数据的深度机器学习模型,以及人工智能技术在优良乳酸菌的筛选和功能评价中的应用研究进展,以期为乳酸菌筛选,益生菌基因组和健康食品领域的研究提供新的见解。

图1 乳酸菌基因组数量统计Fig.1 Quantitative statistics of lactic acid bacteria genome

1 乳酸菌基因组学研究进展

1.1 乳酸菌的种属

乳酸菌是指发酵可利用的碳水化物形成以乳酸为主产物的一类细菌的总称,它不是一个分类学上的名称,包含大量的种属,来源广泛,存在于各种栖息环境,包括乳制品、肉制品、蔬菜、谷物和植物环境以及人和动物肠道[6]。乳酸菌种属内异质性非常丰富,在过去,乳酸菌常见属主要有:乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、双歧杆菌属(Bifidobacterium)、明串珠菌属(Leuconostoc)、片球菌属(Pediococcus)、酒球菌属(Oenococcus)、魏斯氏菌属(Weissella)、链球菌属(Streptoeoccus)、肠球菌属(Enterococcus)和肉食菌属(Caroobaelerium)等[7]。2020 年,依据基因组核心基因系统发育关系、(保守的)成对平均氨基酸一致性,分支特异性特征基因、生理生化指标和菌株的栖息地生态学等特征等将乳杆菌属重新划分为25个属[8],包括修订后的乳杆菌属、Paralactobacilus 和23 个新属。目前,原乳杆菌属已包含332 个种和亚种,如表1 所示。在过去,乳酸菌主要应用于乳制品工业和其它食品的发酵。现在,乳酸菌被广泛应用于各种饮料、酸奶或其它以特定健康益处为卖点的产品中。近年来,随着对益生菌促进人体健康作用研究的深入,乳酸菌成为食品工业创新发展的动力源泉,是食品工业研究的热点[9]。

表1 乳杆菌修订后的属包含种的数量及其模式种Table 1 The number of species in the emended genus of Lactobacillus and its type

1.2 乳酸菌群体基因组研究

基因组的概念最早是由德国汉堡大学植物学家Winkler 于上世纪20 年代提出,随着科学家对生物体基因层面研究的深入,基因组研究范围逐渐扩大,现在已经发展为一门综合性学科[10]。基因组学是以某个生物体的全部基因作为研究对象,以分子生物学为基础,通过全基因组序列分析,利用计算机、信息网络技术以及相关生物学技术等手段,研究生物系统内部结构、功能及进化的科学,包括结构基因组学、功能基因组学和比较基因组学3 个分支[11]。第1 个细菌基因组流感嗜血杆菌(Haemophilus influenzae)的序列发表于1995年,开启了微生物的基因组学研究时代[12]。乳酸乳球菌IL1403 基因组于2001 年发布,是首次报道的乳酸菌基因组序列[13]。2008 年笔者及研究团队完成了国内第1 株益生乳酸菌L.casei Zhang 的全基因组测序工作,开启了国内益生乳酸菌基因组、蛋白质组学研究的序幕[14]。2015 年,在国际上首次完成了乳杆菌属、双歧杆菌属等8 个属289个模式菌株基因组的解析,揭示乳酸菌不同物种分化伴随的功能基因进化历程,发现了乳糖代谢和蛋白水解等代谢特征与栖息环境适应性密切相关的规律,开创了乳酸菌群体基因组研究的先河[15]。自2018 年,笔者研究团队启动“乳酸菌万株基因组计划”以来,已经完成了德氏乳杆菌(Lactobacillus delbrueckii)[16]、植物乳植杆菌(Lactiplantibacillus plantarum)[17]和嗜热链球菌嗜热亚种(Streptococcus thermophilus)[18]等17 897 株乳酸菌基因组的解析,阐明了乳酸菌适应生态位发生还原性衰退的群体进化规律。基于此,建成了全球最大的乳酸菌基因组数据库(https://www.imhpc.com/iLABdb),收录81 638 个基因组序列,旨在为乳酸菌基因组的深入分析、可视化和共享提供一个可访问的平台,为乳酸菌的遗传进化、功能基因解析和代谢通路挖掘提供帮助[19]。通过基因组学研究对乳酸菌进化、分化历程有了更深入的了解。早期的微生物基因组分析表明:基因组的研究内容通常反映生物体的代谢、生理、生物合成能力以及对不同条件和环境的适应性。乳酸菌基因组学的研究彻底改变了人们对其代谢过程、生物加工能力的认识,以及了解其在人类身体健康和心理健康方面的潜在作用[20]。

1.2.1 乳酸菌比较基因组学 比较基因组学是通过比较不同物种或个体的基因组来揭示它们之间相似性和差异性的学科[21]。在乳酸菌基因组分析中,比较基因组学发挥着关键作用,为深入理解乳酸菌的生物学特性、进化、分化历程以及生态适应性提供了丰富的信息。通过比较不同乳酸菌菌株的基因组,揭示它们之间的遗传多样性,包括单核苷酸多态性(SNPs)、插入缺失(Indels)等变异类型,为研究群体内部和群体间的遗传结构、演化动态提供基础[22]。Sun 等[15]通过对乳杆菌属213 株模式株的基因组精细图谱进行测序,发现乳杆菌属基因组多样性丰富,接近于“科”的水平。比较基因组学还能够识别和注释基因组中的功能元件,如基因、蛋白质、RNA 等。通过比较乳酸菌的基因组,可以识别与代谢途径、生态适应性等相关的基因,有助于了解乳酸菌在不同环境中的适应性和代谢特征。此外,比较相关物种或不同菌株的基因组,推断它们的进化关系和演化历史,为了解乳酸菌的起源、分化以及与其它微生物的关系提供分子生物学信息。群体基因组研究发现德氏乳杆菌保加利亚亚种(Lactobacillus delbrueckii subsp.bulgaricus)群体可划分为4 个分支,且具有较高的遗传多样性和重组异质性[16]。Zhao 等[18]对嗜热链球菌嗜热亚种(Streptococcus thermophilus)进行全基因组测序,发现其遗传进化具有地域和分离源相关性。通过比较基因组分析,还可以鉴定出具有特定性状或功能的关键基因,对选择优良菌株、代谢工程或改良乳酸菌的性状具有指导意义,如:改进乳制品发酵过程,增强菌株对特定环境的适应性等。总之,比较基因组学在乳酸菌研究中的应用,提供了全面的遗传信息,推动了研究人员对乳酸菌生物学特性和应用潜力的深入了解。

1.2.2 乳酸菌功能基因组学 功能基因组学,又称后基因组学,是指以全基因组测序技术得到的基因组序列为基础,利用公共数据库进行功能基因注释,通过解析基因图谱来预测基因及其产物的功能,解析不同生态位菌种的代谢机制,将功能基因与菌株表型特性相关联[23]。近年来,随着乳酸菌资源收集保护数量的增加和基因组数据的积累,功能基因的深度挖掘也逐渐展开。Suzuki 等[24]通过对植物乳植杆菌(Lactiplantibacillus plantarum LOC1)的功能基因进行分析,发现该菌株具有与磷壁酸和脂蛋白生物合成相关的黏附因子基因,这部分基因参与菌株的免疫调节。功能基因组学不仅可以帮助人们了解不同生态位乳酸菌对其生长环境的反应,对于了解乳酸菌在自然发酵和工业化发酵中的适应性以及它们与人类宿主的相互作用具有重要意义。此外,还可以通过功能基因组学分析,实现潜在的益生乳酸菌的挖掘。2022年,Sun 等[25]对44 株植物乳植杆菌(Lactiplantibacillus plantarum)的功能基因组进行分析,发现菌株的抗氧化活性、黏附活性和在模拟胃肠道环境中的生存能力分别与抗氧化酶编码基因、细胞表面蛋白编码基因和应激反应基因密切相关。菌株中存在的功能基因的数量可能决定它们在益生菌评估中的表现。

1.3 基因组学技术在益生乳酸菌研究中的应用

我国益生菌的定义是:活的微生物,当摄入充足量时,对宿主产生健康益处[26]。益生菌要具体到“株”的水平,每个益生菌菌株都应具有相应的菌株号。特指食品范畴的有益微生物,1 个菌株,不管其来源如何,只有进行分类学上的鉴定、安全性评价及功能试验后,符合益生菌的概念,才能称为益生菌[27]。基于全基因组测序技术的平均核苷酸一致性、单核苷酸多态性、核心基因或全基因组多位点序列分型,正成为乳酸菌的精准鉴定的主要标准。菌株分类学精准鉴定是益生菌评价中最关键的环节。大多数益生菌是由乳酸菌筛选评价而来,在我国卫生健康委员会公布的《可用于食品中添加的菌株名单》 中乳杆菌和双歧杆菌是最主要的菌株。益生菌的筛选和确定的10 个标准包括:明确的益生菌定义、活菌、对菌株有充分的了解、菌株不含抗生素耐药基因、能在胃肠道存活并定殖、菌株与肠道菌群产生有益互作、菌株安全可靠[28]。益生乳酸菌对人类或动物的健康有有益的影响,近来也被证明具有预防或治疗某些疾病的能力。

1.3.1 基因组学在益生乳酸菌安全性评价中的应用 乳酸菌应用历史悠久、安全,被认为是一般安全的(Generally regarded as safe,GRAS)物种[29]。几十年来,乳酸菌在传统食品和发酵产品,比如:酸奶、泡菜、香肠和饮料等中得到广泛的应用。然而,随着益生菌乳酸菌应用范围的扩大,安全性问题日益受到关注,可能出现严重感染、耐药基因转移等不良反应。因此,工业化应用前,对所选择的菌株和发酵食品的安全性评价仍然是乳酸菌筛选和研究的一个关键任务。由于安全性是首要考虑的问题,因此菌株特性信息应集中于鉴定产品中所有细菌菌株的潜在不良特性上。除其遗传背景外,菌株特征信息应包括有关毒力因子或毒素和抗菌素抗性基因存在的详细信息[30]。目前,体外检测仍是评估乳酸菌特性的主要方法。然而,在食品安全概念不断发展的背景下,这些方法不能满足高通量快速的菌株风险评估的需要。分析完整的遗传信息,包括潜在的毒力基因和对健康有负面影响等其它决定因素,可以评估菌株在产品中的使用安全性,为此可以采用乳酸菌单菌株的全基因组测序(Whole genomics sequencing,WGS)进行研究。全基因组生物信息学分析是一种理想的,具有低成本、高效益的菌株特性评价方法,用于微生物安全风险评估。同时,该技术也可以增加人们对食品安全和益生乳酸菌特性评估的了解。全基因组测序方法能够提供菌株基因组成的全部信息,不仅针对毒力和耐药性潜力,而且还表明菌株特异性特征,包括用于专利保护的代谢和系统基因组标记等[31-32]。基因组测序技术也可以对质粒、噬菌体、整合子和转座子介导的水平基因转移潜力进行额外的评估和CRISPR 分析,为基因组稳定性提供初步证据。研究人员应将注意力转向解决编码具有安全风险的遗传因素转移到其他生物体而造成潜在安全风险的问题。因此,在益生菌筛选中应采用具有低成本、高收益的全基因组测序技术作为常规步骤,并与表型研究联合应用,作为益生菌乳酸菌安全性评估的先进的评估准则[33]。

1.3.2 基因组学在益生乳酸菌代谢产物研究中的应用 微生物细胞内、外产生的初级代谢物、信号分子激素和次级代谢物是其生理生化特征表型的直接证据,也能反映菌株对宿主代谢的影响。微生物代谢组研究不仅能阐明各种代谢途径的网络,揭示其调控和工程改造靶点,而且可以阐明微生物与宿主之间的互作机制,因此越来越受到人们的关注[34]。作为食品发酵剂或益生菌被广泛应用的乳酸菌,有机酸、小分子肽以及其它一系列次级代谢产物的研究是优良菌株筛选和体现益生特性的重要切入点[35]。基因组学和功能基因组学以及代谢组学的深入研究,使得人们对乳酸菌的工业用途和代谢特性有了广泛的了解,使得它们成为未来生物精炼中最有希望作为微生物细胞工厂的候选者[36]。作为生物精炼细胞工厂,乳酸菌是用于生产大宗和精细化学品(包括乳酸、多元醇、维生素和食品添加剂)最有前途的微生物,因为它们在环境胁迫下具有稳定性和多用途的代谢特性[37]。代谢工程策略设计乳酸菌细胞工厂主要集中在丙酮酸代谢的重构,以产生大量重要的终产物,如有机酸、甜味剂、芳香化合物,以及决定维生素和胞外多糖生产的复杂生物合成途径[32,38]。植物乳植杆菌(Lactiplantibacillus plantarum)WCFS1 的基因组分析表明,该菌株具有2 个预测山梨糖醇-6-磷酸脱氢酶基因(srlD1 和srlD2)。在缺乏L-和D-乳酸脱氢酶活性的突变菌株中,由于srlD 基因的过量表达,显著增加了果糖-6-磷酸对山梨醇的糖酵解通量,实现了山梨醇的高产[39]。Capozzi 等[40]利用有毒核黄素类似物——玫瑰黄素,从硬粒小麦粉样品中分离出2 株过量生产核黄素的植物乳杆菌。将这2 株菌用于面包和面食的制备,面包和面食中的核黄素含量分别提高了3 倍和2 倍。此外,参与乳酸菌生物合成核黄素的基因已经从几个乳酸菌中鉴定出来,比较基因组分析表明,乳酸菌生物合成核黄素的操纵子具有物种和/或菌株特异性[41]。这些结果表明,基因组学和比较基因组学结合代谢工程方法可以作为发现和提高乳酸菌工业化应用潜力的有效工具。

2 基于基因组大数据和深度机器学习的益生菌筛选技术

发现和评价乳酸菌的益生特性是一个复杂的过程,菌株从基础研究走向应用需要经历漫长的周期。传统筛选方法依赖于多次反复试验,需要大量的人力、物力和财力。益生菌基因组学分析方法在乳酸菌筛选和安全相关的遗传特征(比如:毒力因子、溶血基因、抗生素耐药基因和移动原件)的分析和预测方面具有很大的优势[42]。基因组大数据和人工智能技术的出现,不仅体现了它在噪声数据集中挖掘微生物功能基因特征的先天优势,也彰显出它在乳酸菌益生机制解析方面的良好应用前景。

2.1 益生菌菌株的筛选和确定方法

乳酸菌来源广泛,菌株之间特性差异大,从不同的栖息地和分离原获得的乳酸菌中筛选出具有优良特性的菌株,是其开发利用的第1 步。益生乳酸菌从分离、鉴定到产业化应用要进行大量的基础性工作(图2)。基于体内和体外试验研究的经典方法耗时且成本高,缺乏高通量和比较能力。目前,下一代测序(Next generation sequencing,NGS)技术因具有节省劳动力和时间、高通量能力、高丰度以及可用于广泛研究、记录遗传信息等优点而越来越受欢迎。随着测序成本的不断降低和大量的基因组数据公布,益生菌基因组学与基于随机对照试验进行的表型评价相结合,越来越广泛地应用于了解益生菌乳酸菌的特性,有助于发现未来值得探索的乳酸菌新的潜在应用领域[30]。在单菌株全基因组测序技术的支持下,迄今为止,许多益生乳酸菌菌株已被测序并公开,并且使用基因组方法定义它们的基本特征[31,43-44]。因此,与生物信息学分析相结合的益生菌基因组学可作为研究益生乳酸菌有益特性及其食品安全风险评估的一种新颖、经济的方法。

图2 益生乳酸菌筛选及功能评价流程Fig.2 Screening and functional evaluation process of probiotic lactic acid bacteria

2.2 人工智能在益生菌筛选中的应用进展

人工智能筛选技术是指利用人工智能相关的技术和方法,通过对大规模数据的处理、分析和学习,实现对特定目标、性质或特性的物质、生物体或信息的筛选。国际上,人工智能应用最成功的案例当属谷歌的AlphaFold 系统。这个系统利用卷积神经网络算法精确预测了蛋白质的三维结构,甚至可以分析X-射线晶体学很难解决的楔入细胞膜中的蛋白质结构[45]。Sabater 等[46]结合现有文献和公共数据库资源,提出了利用蔬菜废弃物和副产品靶向调控肠道微生物代谢底物的方法,建立了基于人工智能筛选蔬菜来源益生元的思维框架。目前人工智能在乳酸菌研究领域的应用取得了一些重要进展,尤其是在筛选和鉴定乳酸菌方面,包括乳酸菌的基因组数据分析、药用价值预测、代谢产物分析及微生物数据分析等方面(图3)。与此类似,McCoubrey 等[47]利用人工智能建立了精准益生菌制剂开发模型,这个模型可以有效预测浓度如何影响益生副干酪乳杆菌在肠道中的增殖情况。我国西湖大学的研究者利用人工智能在队列横断面分析中识别出II 型糖尿病的肠道微生物组特征,成功构建了一个具有识别特征的微生物组风险评估系统,可被用作糖尿病的诊断、治疗和预防[48]。中国矿业大学的研究人员通过人工智能研究健康人肠道菌群、代谢组和身体指数之间的关系,利用筛选获得的差异特征可以有效预测成人的身体指数水平[49]。华大研究院的学者首次通过大样品基因组测序探索了宿主基因组对口腔微生物的影响,发现5 个影响口腔微生物组的显著性位点,并应用人工智能探索基因组和微生物对牙周疾病的预测性能,取得了较好的结果。

图3 基于基因组学技术乳酸菌的筛选和确定Fig.3 Screening and identification of lactic acid bacteria based on genomics technology

笔者及研究团队以大量的乳酸菌基因组数据为基础,应用功能基因组学和深度机器学习方法,通过解析功能基因组特征来筛选潜在的益生乳酸菌菌株,开发了基于机器学习模型的益生菌快速筛选平台iProbiotics(http://bioinfor.imau.edu.cn/iprobiotics)。为益生菌的筛选和益生机制的研究提供了新的导向[4]。运用该平台用户可以根据自己的数据或iProbiotics 的数据进行搜索,与全部益生菌基因组序列数据进行匹配,并进行可视化结果反馈和模型预测。虽然乳酸菌功能基因组学的研究仍处于起步阶段,但是其广阔的应用前景和强劲的发展态势,已经成为益生乳酸菌筛选和机理、机制研究等方面极具应用价值的手段。

3 结语

乳酸菌在促进人类健康方面的有益作用正陆续被证实,其研究热度和应用领域正逐步扩大。理想的益生乳酸菌通常能够抵御产品加工、流通环节的胁迫环境,菌株基因组中丰富的环境应激、表面蛋白和黏附基因可以帮助它们在胃肠道转运中存活以保持高的活菌数。目前报道的几乎所有益生乳杆菌和双歧杆菌的初步筛选和特性评价都是基于应用技术稳定性的,比如加工耐受性和贮藏稳定性;或者基于容易测定的一些表型指标,比如:胆盐耐受性和人工胃肠液存活能力等。然而,益生菌产品的市场监管要求已经转向明确益生菌有益人类健康的分子机制。因此,过去关于益生乳酸菌的经典研究方法很难适应当前快速发展的益生菌产业需求和益生菌产品监管的行业标准要求。基于基因组测序和功能分析的“组学”方法对菌株的益生特性、遗传背景、生物安全和加工特性等进行表征,可能是满足未来监管要求的重要途径。

猜你喜欢
益生基因组学乳酸菌
藏羊源屎肠球菌的分离、鉴定及体外益生特性
禽用乳酸菌SR1的分离鉴定
基于基因组学数据分析构建肾上腺皮质癌预后模型
系统基因组学解码反刍动物的演化
益生菌:体内挚友,相伴“益生”
益生菌:体内挚友,相伴“益生”
自然与益生之间:道家道教生命态度比较的重要向度*
乳酸菌成乳品市场新宠 年增速近40%
营养基因组学——我们可以吃得更健康
乳饮品中耐胃酸乳酸菌的分离鉴定与筛选