基于支持向量机-遗传算法灰树花发酵模型的建立及优化

2016-11-12 06:21周丽伟郭文强张亚萍安徽大学生命科学学院安徽合肥3060安徽农业大学茶与食品科技学院安徽合肥30036
食品科学 2016年11期
关键词:胞外树花菌丝体

徐 利,周丽伟,郭文强,张亚萍,陈 彦,*(.安徽大学生命科学学院,安徽 合肥 3060;.安徽农业大学茶与食品科技学院,安徽 合肥 30036)

基于支持向量机-遗传算法灰树花发酵模型的建立及优化

徐 利1,周丽伟2,郭文强1,张亚萍1,陈 彦1,*
(1.安徽大学生命科学学院,安徽 合肥 230601;2.安徽农业大学茶与食品科技学院,安徽 合肥 230036)

对食用药用真菌灰树花发酵进行建模,获得使目标发酵产物达到最大产量的培养条件。运用支持向量机(support vector machine,SVM)方法进行非线性拟合,并采用遗传算法预测优化培养基成分,结果表明其能够较好预测灰树花发酵过程。运用此方法可在灰树花发酵生产过程中根据所需产物控制发酵条件与时间,具有较高指导意义。

支持向量机;遗传算法;发酵模型;灰树花

徐利, 周丽伟, 郭文强, 等. 基于支持向量机-遗传算法灰树花发酵模型的建立及优化[J]. 食品科学, 2016, 37(11): 143-146. DOI:10.7506/spkx1002-6630-201611025. http://www.spkx.net.cn

XU Li, ZHOU Liwei, GUO Wenqiang, et al. Establishment and optimization of a predictive model for the growth and exopolysaccharide production of Grifola frondosa based on support vector machine and genetic algorithm[J]. Food Science, 2016, 37(11): 143-146. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-201611025. http://www.spkx.net.cn

支持向量机(support vector machine,SVM)是一种机器学习方法,由于SVM非线性拟合很强,且运算时收敛到全局最优解、处理小样本时的泛化性能相对较好等优点,被广泛应用于数学建模、智能控制等领域且使这些领域取得巨大的进展[1-3]。遗传算法来源于进化论、物种选择学说和群体遗传学说,是模拟生物进化过程与机制解决极值问题的一种自组织、自适应人工智能算法[4]。其以高效、自适应及全局搜索的优势得到广泛应用。

灰树花(Grifola frondosa)是珍稀食药两用真菌[5]。灰树花多糖具有抗肿瘤等多种活性[6-10],其中灰树花多糖D组分更是被美国食品和药物管理局(Food and Drug Administration,FDA)批准直接进入二期临床。液体发酵菌丝体与子实体药用效果相当,且生产周期短、不受气候和季节的限制、产品质量稳定、便于工业化放大生产等优点而日益受到人们的重视[11-13]。目前研究多偏重单独进行培养条件优化或单独进行发酵动力学研究,利用实验数据建立指标与因素间的回归方程,但是其模型粗糙,很难说明指标与因素之间的非线性关系,误差大且不能预测发酵结果[14-17]。而本实验所用方法则能够有效克服以上缺点,使用SVM法建立模型,通过遗传算法对SVM模型进行全局训练,得到最佳方案,可以预测真菌液体发酵过程不同时间的产量,预测生物量的合成。

1 材料与方法

1.1 菌种、培养基与试剂

菌种灰树花(Grifola frondosa)购自中国普通微生物菌种保藏管理中心;马铃薯为市售。

基础培养基组成为每1 L培养基含蛋白胨5 g、葡萄糖30 g、MgSO4·7H2O 1.5 g、KH2PO43 g、VB11 mg。

葡萄糖、磷酸二氢钾、七水硫酸镁、VB1、苯酚、浓硫酸、氢氧化钠、亚硫酸钠、马铃薯淀粉、蛋白胨国药化学试剂有限公司;3,5-二硝基水杨酸 天津市光复精细化工研究所;酒石酸钾 上海埃彼化学试剂有限公司;以上试剂均为国产分析纯。

1.2 仪器与设备

MLS-3750灭菌锅 日本Sanyo公司;BCD-285WNMVS冰箱 韩国Samsung公司;电热恒温鼓风干燥箱 上海一恒科技有限公司;UV5100B紫外-可见光分光光度计 上海元析仪器有限公司;RE-52旋转蒸发器 东京理化器械公司;TE612-L电子天平 北京赛多利斯仪器系统有限公司;ZHWY-2102C摇床 上海智城分析仪器制造有限公司。

1.3 方法

1.3.1 摇瓶发酵培养

将发酵培养基装入摇瓶后灭菌备用,参考文献[18]设计UL25(56)正交试验,从液体种子摇瓶中以10%接种量接种在发酵培养基中,置于摇床中200 r/min、25 ℃条件下培养8 d,培养结束后测定胞外多糖生成量、菌丝体干质量等指标[19-20]。

1.3.2 模型测试集与模型验证集的获得

在考察因素的水平取值范围内,使用Matlab内置的随机数生成函数随机生成2 组验证实验表格,并将其转变成与UL25(56)正交试验设计表编码一致的形式。

函数调用:

按上述方法生成的Ttest与Tval安排发酵实验,用于SVM模型的测试和验证。

1.3.3 SVM模型的建立

参考杨海龙等[21]所述培养条件并稍作修改,以UL25(56)实验中马铃薯淀粉添加量、VB1添加量、葡萄糖添加量、装液量添加量的编码值,以及时间编码值的n 次幂,作为SVM的输入变量,以菌丝体干质量、胞外多糖生成量2 个实验值作为拟合目标变量Y1、Y2。使用Matlab平台下的LS-SVM工具包训练模型,n值为1~5以步长0.05变化,计算不同n值下所得模型对Ttest测试集预测的均方根误差,通过枚举寻找最优建模参数[22-23]。使均方根误差(root mean square error,RMSE)最小的n值将被选择用于模型训练。

1.3.4 优化模型的预测精度

优化结果所述n值n_jst,n_bwt,对应得到2 个优化后模型OM_JST(预测菌丝体干质量)、OM_BWT(预测胞外多糖生成量)。绘制上述2 个优化模型对验证集实验值的拟合曲线,观察模型预测效果,并比较2 种模型优化后对验证集实验值预测的均方根误差。

1.4 遗传算法优化发酵条件[24]

采用浮点编码方式对发酵过程中马铃薯淀粉添加量、VB1添加量、葡萄糖添加量、装液量、发酵时间5 个因素在其各自取值范围内进行SVM模拟推算,并以模型拟合值作为遗传算法的适应性函数,进行选择、变异、交换操作。菌丝体干质量与胞外多糖量生成量越高,则适应度越高。程序通过Matlab 7.6软件和其附带的遗传算法工具箱编写完成。

2 结果与分析

2.1 正交试验结果

表1 UL25(56)正交试验设计及结果Table 1 UL 1 UL2525(5 (56) design and corresponding experimental results

灰树花发酵是时间累积过程,在灰树花正常培养范围内,发酵时间对发酵的影响要远高于其他因素,在此处如对该正交试验(表1)进行方差分析,时间所造成的考察目标的变差将极有可能影响其他因素的显著性分析,故在变量选择中选取时间变量的n 次幂较为可行[25]。

2.2 SVM模型训练与优化

以表1中的试验数据作为SVM的训练样本,gam、sig2通过tunelssvm函数搜索获得,alpha、b通过trainlssvm函数确定,根据试验因素的个数和优化指标的个数设计SVM的结果,然后用试验数据对SVM进行训练。图1反映了n值变化时,建立的SVM模型对测试集菌丝体干质量和胞外多糖生成量这2 个试验值预测的均方根误差大小。Matlab中记录的n值最优结果为:菌丝体干质量最优n=2.10,胞外多糖生成量最优n=2.05。

图1 归一化的不同n值所得模型对测试集的RRMMSSEEFig. 1 Predicted root-mean-square error (RMSE) using the normalized models obtained from different n-values

图2 SVM模型对验证集胞外多糖生成量(a)和菌丝体干质量(b)的预测情况Fig. 2 Prediction of EPS production (a) and dry mycelial biomass (b) for validation set using SVM model

由图2可知,在n值分别为2.05与2.10时,胞外多糖生成量和菌丝体产量模型模拟结果与试验值的拟合度较好,两者之间的相对误差在5%以内,说明建立的SVM性能良好。由图2还可知,当n值取1时,与实际过程存在极大差距,当把n的权重分别增加为n=2.10、n=2.05时,预测值与实际值接近,模型对菌丝体干质量、胞外多糖生成量等的预测能力较好,经计算其RMSE分别为0.421和0.139。

2.3 遗传算法对发酵条件的优化

2.3.1 发酵周期内目标产物的日产出速率的优化

图3 发酵物平均日产出速率的遗传算法优化过程Fig. 3 Optimal generation determined using genetic algorithm for average daily production rate of mycelia and EPS

运用遗传算法如图3所示,在遗传至53 代时,得到使每日平均产出菌丝体最多的发酵条件:马铃薯淀粉添加量51.68 g/L、VB1添加量1.50 mg/L、葡萄糖添加量5.00 g/L、装液量112.80 mL、发酵时间6.28 d,菌丝体平均产出速率预测为3.67 g/(L·d)。以胞外多糖平均产出速率作为优化指标,遗传算法运算至57 代时,产出胞外多糖最大为:0.45 g/(L·d),对应发酵条件:马铃薯淀粉添加量47.41 g/L、VB1添加量1.50 mg/L、葡萄糖添加量5.00 g/L、装液量101.43 g/L、发酵培养5.54 d。

按上述2 组优化条件设置验证实验,重复3 次,最优菌丝体产出速率对应条件下菌丝体产率平均为20.27 g/L,故每天产出3.23 g/L,与预测值基本一致;最优化胞外多糖产出速率对应条件下胞外多糖产量平均值为2.45 g/L,每天平均产出量为0.44 g/L,证明运用遗传算法可以很好地优化模型条件,当SVM与遗传算法相结合使用时,则可以较好地实现对发酵条件的优化与产物的预测。

2.3.2 不同发酵时间下目标产物的优化

分别将培养时间固定在1~8 d,以最大菌丝体干质量为最优适应度函数,使用遗传算法得到了最佳培养条件,以及菌丝体最高产量,结果如表2所示。前6 d菌丝体干质量迅速积累,之后菌丝体干质量变化趋于水平,符合其生长曲线,综合考虑以培养时间为6 d最佳。

表2 不同发酵时间下菌丝体干质量的优化Table 2 Optimization of culture conditions for mycelium production at different fermentation times

分别将发酵时间固定在1~8 d,以最大胞外多糖生成量为最优适应度函数,使用遗传算法得到了最佳培养条件、以及胞外多糖最高产量,结果如表3所示。

表3 不同发酵时间下胞外多糖生成量的优化Table 3 Optimization of culture conditions for EPS production at different fermentation times

按上述各组优化条件设置验证实验,重复3 次,所得各组数据与预测值相接近,证明优化与预测结果可行,模型拟合良好,SVM-遗传算法能够在发酵控制中良好运用。

3 结 论

灰树花在液体发酵培养的过程是复杂且非线性,本实验成功运用SVM联合遗传算法预测灰树花发酵培养基与生物量的关系及得到最佳生物量的培养条件。另外,在建立SVM预测模型时,证明了采用幂函数方法对提高模型中某个因素的权重,以提高模型预测能力的方法是可行的。SVM-遗传算法不仅能有效地预测生物量,极大降低培养成本,而且可以大大减少实验工作量,缩短研究周期,与传统固定培养时间方法相比具有更明确的指导意义,同时也为建立与优化其他真菌发酵模型提供了借鉴。

[1] HEIKAMP K, BAJORATH J. Support vector machines for drug discovery[J]. Expert Opinion on Drug Discovery, 2014, 9(1): 93-104. DOI:10.1517/17460441.2014.866943.

[2] LI G Q, WEN C Y, LI Z G, et al. Model-based online learning with kernels[J]. IEEE Transactions on Neural Networks and Learning Systems, 2013, 24(3): 356-369. DOI:10.1109/TNNLS.2012.2229293.

[3] NEGRI R G, DUTRA L V, SANT’ANNA S J S. An innovative support vector machine based method for contextual image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 87: 241-248. DOI:10.1016/j.isprsjprs.2013.11.004.

[4] 张文修, 梁怡. 遗传算法的数学基础[M]. 西安: 西安交通大学出版社, 2000: 2-3.

[5] 崔凤杰. 灰树花深层发酵条件优化及其菌丝体抗肿瘤糖肽的研究[D].无锡: 江南大学, 2006.

[6] SHIH L, CHOU B W, CHEN C C, et al. Study of mycelial growth and bioactive polysaccharide production in batch and fedbatch culture of Grifola frondoa[J]. Bioresource Technology, 2008, 99(4): 785-793. DOI:10.1016/j.biortech.2007.01.030.

[7] MIZUNO T, OHSAWA K, HAGIWARA N, et al. Fractionation and characterization of antitumor polysaccharides from Maitake, Grifola frondosa[J]. Agricultural and Biological Chemistry, 1986, 50(7): 1679-1688. DOI:10.1080/00021369.1986.10867644.

[8] 李小定, 吴谋成, 曾晓波, 等. 灰树花多糖PGF-1对荷瘤小鼠免疫功能的影响[J]. 华中农业大学学报, 2002, 21(3): 261-263. DOI:10.13300/j.cnki.hnlkxb.2002.03.016.

[9] KUBO K, NANBA H. Anti-hyperliposis effect of maitake fruit body (Grifola frondosa). I[J]. Biological and Pharmaceutical Bulletin, 1997, 20(7): 781-785. DOI:10.1248/bpb.20.781.

[10] KUBO K, AOKI H, NANBA H. Anti-diabetic activity present in the fruit body of Grifola frondosa (Maitake). I[J]. Biological and Pharmaceutical Bulletin, 1994, 17(8): 1106-1110. DOI:10.1248/ bpb.17.1106.

[11] 李悦, 薛桥丽, 李世俊, 等. 响应面法优化小刺青霉16-7产纤维素酶液体发酵工艺[J]. 食品科学, 2014, 35(17): 137-145. DOI:10.7506/ spkx1002-6630-201417028.

[12] 赵俊杰. 香菇液体发酵及多糖提取工艺研究[D]. 郑州: 郑州大学, 2014.

[13] 叶文姣. 蛹虫草多糖的发酵条件优化、结构及抗氧化活性研究[D].武汉: 华中农业大学, 2014.

[14] CHIMILOVSKI J S, HABU S, TEIXEIRA R F B, et al. Antitumour activity of Grifola frondosa exopolysaccharides produced by submerged fermentation using sugar cane and soy molasses as carbon sources[J]. Food Technology and Biotechnology, 2011, 49(3): 359-363.

[15] 邓功成, 赵洪, 高礼安, 等. 灰树花菌丝体液体发酵条件优化[J]. 江苏农业科学, 2013, 41(9): 216-218. DOI:10.3969/ j.issn.1002-1302.2013.09.086.

[16] 武秋立, 安家彦. 羊肚菌胞外多糖发酵动力学模型[J]. 南开大学学报, 2005, 38(1): 44-48. DOI:10.3969/j.issn.0465-7942.2005.01.008.

[17] 方俊涛. 响应曲面方法中试验设计与模型估计的比较研究[D]. 天津: 天津大学, 2011.

[18] 卢春晓, 吴朝霞, 徐亚平, 等. 响应面法优化黑豆皮花色苷提取工艺的研究[J]. 食品研究与开发, 2012, 33(9): 69-73.

[19] 顾广州. 灰树花深层发酵多糖、提取纯化及抗氧化作用研究[D]. 扬州: 扬州大学, 2010.

[20] 张维杰. 糖复合物生化研究技术[M]. 2版. 杭州: 浙江大学出版社, 1999: 10-11.

[21] 杨海龙, 活泼, 肖彩霞, 等. 药用真菌深层发酵生产技术[M]. 北京:化学工业出版社, 2009: 140-148.

[22] 黄炜, 黄志华. 一种基于遗传算法和SVM的特征选择[J]. 计算机技术与发展, 2010, 20(6): 21-24. DOI:10.3969/j.issn.1673-629X.2010.06.006.

[23] 郭新辰. 最小二乘支持向量机算法及应用研究[D]. 吉林: 吉林大学, 2008.

[24] 雷英杰. MATLAB遗传算法工具箱及应用[M]. 西安: 西安电子科技大学出版社, 2005: 146-207.

[25] 熊伟丽, 王肖, 陈敏芳, 等. 基于加权LS-SVM的青霉素发酵过程建模[J]. 化工学报, 2012, 63(9): 2913-2919. DOI:10.3969/ j.issn.0438-1157.2012.09.038.

Establishment and Optimization of a Predictive Model for the Growth and Exopolysaccharide Production of Grifola frondosa Based on Support Vector Machine and Genetic Algorithm

XU Li1, ZHOU Liwei2, GUO Wenqiang1, ZHANG Yaping1, CHEN Yan1,*
(1. School of Life Science, Anhui University, Hefei 230601, China; 2. School of Tea and Food Science, Anhui Agricultural University, Hefei 230036, China)

To obtain the best medium constituents and culture conditions for maximum production of exopolysaccharides (EPS) by Grifola frondosa, nonlinear fitting was done using support vector machine (SVM) and the response variables, EPS production and mycelial biomass, were predicted using genetic algorithm. The results showed that the nonlinear model performed well in predicting the growth and EPS production of Grifola frondosa. The approach proposed in this study can provide a signifi cant guideline to control culture conditions and time for the production of desired products by Grifola frondosa.

support vector machine (SVM); genetic algorithm; fermentation model; Grifola frondosa

10.7506/spkx1002-6630-201611025

Q815

A

2015-05-05

安徽大学现代生物制造协同中心开放课题(20150455);安徽大学重点教学研究项目(ZLT52015038)

徐利(1990—),男,硕士研究生,研究方向为天然产物提取纯化与发酵工程。E-mail:richuriluoxl@163.com

*通信作者:陈彦(1963—),男,教授,博士,研究方向为糖分子生物学与糖工程。E-mail:chenyan600@163.com

猜你喜欢
胞外树花菌丝体
新型冠状病毒与胞外诱捕网的研究进展
感恩生活,给生命一树花开——读《花田半亩》有感
生物膜胞外聚合物研究进展
送你一树花
陌上花开文学社:播撒文学之种,静待一树花开
水华期间藻类分层胞外聚合物与重金属的相互作用机制研究
葡萄糖酸钠发酵废弃菌丝体提取壳聚糖的研究
新型环保吸声材料——菌丝体胶合秸秆
冬虫夏草发酵液和菌丝体中主要核苷类成分分析
不同环境因子对爪哇伪枝藻分泌胞外多糖的影响