人工神经网络优化大肠埃希菌摇瓶培养基

2023-11-24 08:04:04徐世友易中恒张婷婷郭济中张旭东焦磊雷清
中国生物制品学杂志 2023年11期
关键词:混料几率菌体

徐世友,易中恒,张婷婷,郭济中,张旭东,焦磊,雷清

兰州生物制品研究所有限责任公司甘肃省疫苗工程技术研究中心,甘肃兰州 730046

培养基是重组工程菌株生长和目标产物合成的基础,合理设计与优化培养基组成既可实现生物转化过程成本最小化,还可使目标产物产量最大化[1]。目前,用于培养基设计与优化的试验设计方法有单因素对比、混料设计(mixture design,MD)、正交试验设计、因子设计(Plackett-Burman 设计、全因子设计)、响应曲面设计(Box-Behnken 设计、中心复合设计)、人工神经网络(artificial neural network,ANN)、人工神经网络耦合遗传算法及误差反向传播神经网络结合遗传算法[2-11]。

大肠埃希菌(E.coli)等工程菌株培养过程中的影响因素较复杂,各因素之间可能存在交互作用,试验设计考察因素与其响应结果之间具有较强的离散性,传统正交试验设计等方法对复杂生物过程非线性关系的反映存在困难。自McCulloch-Pitts 模型报道以来,至今已开发出多种ANN 应用工具,如感知器神经网络模型、前馈神经网络模型、径向基函数神经网络模型和卷积神经网络模型等[12-17];ANN 是在人类对其大脑神经网络认识的基础上人为构建能够实现某种功能的神经网络,即一种具有分布式并行信息处理的特征抽象数学模型,模型具有并行式处理、分布式存储、容错性良好、自适应、学习能力优秀等特点[18];ANN模型建立一般采用神经网络类型,建立输入层、隐藏层和输出层,通过训练、验证及调优模型参数后获得[19-21]。ANN 可反映十分复杂的非线性关系[21-22],适用于高度非线性并含有大量噪声的生物模型[10,23]。本 研究基于MD 试验结果数据建立ANN模型,对E.coli摇瓶培养基配方进行优化,以期提高E.coli培养物的生物量和菌体活力。

1 材料与方法

1.1 菌种E.coliBL21(DE3)菌种由兰州生物制品研究所有限责任公司第四研究室保存。

1.2 主要试剂及仪器E.coli增菌培养基及PBS(pH 7.4)均由兰州生物制品研究所有限责任公司中试研究室制备;葡萄糖(glucose,Glu)购自国药集团化学试剂有限公司;酵母基础氮源(yeast nitrogen base,YNB)培养基购自美国BD公司;CM-YE系列酵母浸出物(yeast extract,YE)、酵母蛋白胨(yeast peptone,YP)及大豆蛋白胨(soy peptone,SP)均购自湖北安琪酵母股份有限公司;CCK-8试剂盒购自苏州宇恒生物科技有限公司;可见光-紫外分光光度计购自美国GE公司。

1.3E.coli的摇瓶培养 取0.2 mLE.coliBL21(DE3)菌种,接种至2 mLE.coli增菌培养基,37 ℃,200 r/min摇床培养24 h,获得第1 次扩增培养物;取2 mL 第1次扩增培养物转接至98 mLE.coli增菌培养基,37 ℃,250 r/min 培养24 h,获得2 次扩增培养物;取1 mL第2 次扩增培养物,分别转接于5 mL 后续MD 试验或验证试验培养基,继续培养20 h,获得第3 次扩增培养物。所有培养基均经0.22µm除菌过滤。

1.4 MD试验设计及ANN构建 应用Minitab(Version 20)软件进行MD 试验设计,以Glu、YE、YP、SP 和YNB 占比为MD 试验培养基的混料成分,摇床培养20 h 后所收获培养物(第3 次扩增培养物)菌体悬浮液A600(A1)、培养物湿菌重(G,g/L)和菌体活力指标值(A2,A460)为响应值进行极端顶点设计。混料分量上下限见表1,线性约束条件:YP+SP ≤0.4。MD试验表见表2,MD培养基总浓度为65 g/L,Glu+YE+YP+SP+YNB=100.000 0%,共设计33组试验,通过对MD试验数据(累计试验序执行1次)拟合进行MD分析。

表1 混料分量占比上下限(%)Tab.1 Upper and lower limits of mixture component proportions(%)

表2 MD试验设计表(占比,%)Tab.2 MD test design table(proportion,%)

应用JASP(Version 0.16.1)及JMP(Version 15)软件构建ANN,以MD 试验结果(累计试验序执行2次)为训练和验证数据样本,并选择合适的模型参数构建ANN 模型,输入变量为混料分量且约束同混料分量上下限,输出变量为MD 响应值。通过构建ANN获得优化后培养基配方,并考量MD模型拟合结果,使用蒙特卡洛模拟(Monte Carlo simulation,MCS)进一步调整培养基配方,获得最佳E.coli摇瓶培养基配方和参考值(优化与验证);对A1与G进行MCS时添加随机模拟噪音,对A3进行MCS时添加加权随机模拟噪音。

1.5 生物量测定 取E.coli培养物,6 000×g离心5 min,去上清,获得湿菌泥,用等体积PBS(pH 7.4)重悬,获得菌体悬浮液。用PBS(pH 7.4)稀释菌体悬浮液,可见光-紫外分光光度计测定菌体悬浮液A600达0.3~0.8 时,按下式计算A1。取E.coli培养物,6 000×g离心8 min,获得湿菌泥,按下式计算G。

A1=待测物A600×稀释倍数;

G(g/L)=培养物湿菌泥重量(g)/培养物体积(L)

1.6 菌体活力测定 按1.5项方法制备菌体悬浮液,待其A600达0.95~1.05 时,加入体积分数为5%的CCK-8 试剂,充分混合,37 ℃孵育4 h;6 000×g离心8 min,取上清液,用可见光-紫外分光光度计测定A460,并按下式计算A2。

A2=待测物A460×稀释倍数

1.7 最佳培养基的验证 将1.4项中获得的最佳E.coli摇瓶培养基作为验证试验培养基,摇床培养20 h,收获培养物(第3 次扩增培养物)的A1、G 和A2 为验证评价指标,进行连续10 次培养验证试验,通过单样本等价检验分析验证评价指标数据。

1.8 统计学分析 应用Minitab(Version 20)软件进行单样本等价检验,以1.4 项中获得验证参考值为检验目标值,均值偏差值为参考值×15%;若单样本等价检验中两个原假设对应两个P均<0.05,则认为检验均值与目标值等价,置信区间:95%CI。

2 结果

2.1 MD分析 A1二次项混料回归拟合结果:S=2.15,R2=74.55%;模型拟合方差分析结果:F=3.77,P=0.005,二次项P均>0.05。G完全立方逐步回归拟合结果:S=12.30,R2=72.85%;模型拟合方差分析结果:F=5.90,P<0.01,其中PYE*YNB<0.01,PYE*YP*SP=0.002,PYE*YNB*YP= 0.008,拟合过程逐步选择法候选项系数:Glu 59.35,YE 44.5,YNB-43.1,SP 70.3,YP 59.6。A2特殊立方项混料回归拟合结果:S=1.52,R2=94.35%;模型拟合方差分析结果:F=5.57,P=0.008,二次项与特殊立方项P均>0.05。

2.2 ANN优化 ANN模型参数:模型交叉验证为随机K重,模型拟合为稳健拟合,折数为7,学习率为0.05,历程数为30。ANN 结构见图1。模型训练广义R2=0.999 9,模型验证R2= 0.998 1。模型预测结果:当配方占比为:Glu 41.100 0%、YE 0、YP 0、SP 37.800 0%、YNB 21.00 0 0%,培 养20 h 获 得 培 养 物 的A1 为14.243,G为77.932 g/L,A2为11.44。取A1为14、G为77 g/L 及A2 为11 为后续优化输出变量结果参考值。调整配方占比为:Glu 40.000 0%、YE 0、YP 0、SP 40.000 0%、YNB 20.000 0%时,MCS 10 000 次结果可获得A1 ≥14 的批次几率为48.33%,G ≥77g/L的批次几率为53.03%,A2 ≥11的批次几率为56.30%。确定E.coli摇瓶培养基配方为:Glu 26 g/L、SP 26 g/L、YNB 13 g/L。

图1 ANN的结构图Fig.1 Structure of ANN

2.3 最佳培养的验证 10 个验证组中,A1 ≥14 的批次几率为60%、G ≥77 g/L 的批次几率为50%、A2 ≥11的批次几率为40%,培养验证试验数据见图2。单样本等价检验结果中,A1:P<0.05,G:P<0.05,A2:P<0.05,见表3。表明1.4 项获得的最佳E.coli摇瓶培养基作为第3 次扩增培养基,培养结果数据中A1、G 和A2 的数据均值与参考值均等价。

图2 验证数据图Fig.2 Verification data diagram

表3 单样本等价检验结果Tab.3 Results of one sample equivalence tests

3 讨论

目前,为提高微生物生物转化过程经济性及目标产物产量,需对微生物培养基进行优化,其策略包括基于试验的培养设计、适应性实验室进化技术和系统代谢工程[1,24-25]。本研究选择MD作为提高E.coli培养过程中生物量与菌体活力的优化策略。基于MD 可优化各种混料分量比例的特点,本研究选择可充分覆盖设计空间中设计点的极端顶点设计,以Glu、YE、YP、SP 和YNB 占比为混料分量,A1、G 和A2 为响应值进行极端顶点MD。A1拟合结果表明,不同混料分量无显著交互作用(P均>0.05);G 拟合结果表明,YE与YNB二者具有显著交互作用(P<0.01),YE、YP与SP 三者具有显著交互作用(P<0.01),YE、YNB与YP 三者具有显著交互作用(P<0.01);A2 拟合结果表明,不同混料分量无显著交互作用(P均>0.05)。上述MD拟合结果表明,不同混料分量对不同响应值拟合模型的影响均不相同;应用MD进行多响应值优化培养基时存在一定困难。

ANN 模型构建拟合结果显示,模型训练广义R2=0.999 9,模型验证R2=0.998 1,表明该模型拟合较好;ANN模型预测结果当配方占比为:Glu 41.100 0%、YE 0、YP 0、SP 37.800 0%、YNB 21.000 0%时,获得培养物的A1为14.243、G为77.932 g/L、A2为11.44。依据MD 分析结果,除了G 拟合中YE与YNB具有显著交互作用外(P<0.01),A1 与A2 拟合中不同混料分量无显著交互作用(P均>0.05),且YE 逐步选择法候选项系数为负数,ANN 模型预测结果表明,YE 对培养结果无影响,因此,在后续培养基配方调整中剔除YE 组分;ANN 模型预测结果表明,YP 对培养结果无影响,因此,在后续培养基配方调整中剔除YP 组分。依据MCS 模拟结果,调整并确定最佳E.coli摇瓶培养基配方为:Glu 26 g/L、SP 26 g/L、YNB 13 g/L;同时选择ANN 模型输出变量预测结果为验证试验结果参考值,即A1为14、G为77 g/L、A2为11。连续10次培养验证试验结果为:A1 ≥14 的几率为60%,G ≥77 g/L 的几率为50%,A2 ≥11的几率为40%;A1 ≥14的几率大于MCS几率,且验证组A1值数据中位数接近14;G ≥77 g/L 的几率小于MCS 几率,差距较小,且验证组G数据中位数接近77 g/L;A2 ≥11 的几率小于MCS几率,且验证组G值数据中位数接近11,但数据分布较为离散,该结果可能与菌体活力检测方法有关,微生物培养中菌体活力相关指标数据自身具有较高离散特点,需后续更多试验数据的验证支持。以参考值为单样本等价检验目标值,考虑E.coli培养批次间培养结果的不确定性和波动性,选择均值偏差值;A1:P<0.05,G:P<0.05,A2:P<0.05,A1、G 和A2 的数据均值与参考值均等价,上述培养验证结果表明,最佳E.coli摇瓶培养基具有高生物量和菌体活力的特点,且培养结果具有一定的稳健性。ANN 模型预测结果具有参考性,MD 可为ANN 模型建立提供试验设计。

综上所述,本研究设计培养基的E.coli培养物具有较高的生物量及菌体活力,为E.coli表达系统重组工程菌的培养及规模放大奠定了基础,后续将在该培养基配方基础上进行调整优化,以适应不同基因型E.coli表达株。

猜你喜欢
混料几率菌体
睡眠不好可能会增加青光眼的发病几率
菌体蛋白精养花鲢高产技术探析
当代水产(2022年1期)2022-04-26 14:35:38
东北酸菜发酵过程中菌体的分离与鉴定
一种具有混料功能的橡胶射出成型机
Finding the Extraterrestrial
Can you answer?
菌体蛋白水解液应用于谷氨酸发酵的研究
中国调味品(2017年2期)2017-03-20 16:18:21
黄芩苷对一株产NDM-1大肠埃希菌体内外抗菌作用的研究
晒后修复SOS
健康女性(2016年8期)2016-09-22 12:42:27
基于PLC的混料罐控制系统设计
电子制作(2016年21期)2016-05-17 03:52:46