范为嘉
摘 要:发酵工业受到手工操作的限制,未来将应用生物技术和方法,结合机器识别、深度学习等智能化技术,实现基于人工智能的发酵工业智能化。本文概括性地介绍机器学习算法在发酵智能化研究中的一些应用。
关键词:机器学习;发酵;神经网络;花卉授粉算法;遗传算法;支持向量机
引言[1,2]
机器学习专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能重新组织已有的知识结构使之不断改善自身的性能。发酵指人们借助微生物在有氧或无氧条件下的生命活动来制备微生物菌体本身、或者直接代谢产物或次级代谢产物的过程,在食品工业、生物和化学工业中均有广泛应用。机器学习算法在发酵中的应用已经得到各国科学家的研究。
1厌氧发酵制氢的神经网络非线性建模[2]
Ahmed El-Shafie使用梭状芽胞杆菌(ATCC13564)考查了利用人工神经网络(ANN)方法模拟和预测产氢量的可能性。他引入了一种独特的体系结构来模拟反应温度、初始介质pH值和初始底物三个输入参数之间的相互关系以预测氢气产率,并利用实验的60个数据记录建立了神经网络模型。结果表明,所提出的人工神经网络模型预测有很高的精度,最大误差为10%。此外,与传统方法Box-Wilson Design(BWD)的比较分析证明了ANN模型显著优于BWD。人工神经网络模型克服了BWD方法在记录数量上的局限性,它只是考虑氢产率随机模式的有限长度。
2利用神经网络和遗传算法研究酸奶发酵中酸化工艺的最佳温度分布[3]
E. B. Gueguim-Kana等科学家在38-44°C的最佳温度范围内研究了保加利亚乳杆菌和嗜酸链球菌在酸奶生产中的酸化行为。对于最佳酸化温度剖面研究,他们采用模块化的人工神经网络(ANN)和遗传算法(GA)的优化模型,利用不同的温度分布对14批酸奶发酵进行了评估,来训练和验证ANN子模块。人工神经网络在150个时段后的训练数据上捕捉到温度分布与酸化模式之间的非线性关系。这是遗传算法的一个评价函数,温度剖面的酸化斜率是性能指标。遗传算法子模块使用遗传算法在各代之间迭代进化出更好的温度分布,经过11代后符合停止标准。最佳剖面为0.06117,初始值为0.0127,设定点序列为43、38、44、43和39°C。对遗传算法的三个重复的评估表明,43、38、44、43和39°C时的最佳剖面平均斜率为0.04132。他们所使用的优化模型可以有效地寻找发酵过程的不同物理化学参数的最佳剖面。
3支持向量机检测葡萄酒发酵异常过程[4]
不正常发酵是早期酿酒过程中出现的主要问题之一。近年来,多变量统计和计算智能的方法被广泛应用于解决这一问题。在这项工作中,Gonzalo Hernández等人使用三种不同的核函数:线性、多项式和径向基函数的支持向量机方法来检测正常的和有问题的(缓慢、卡住)葡萄酒发酵。对于训练算法,他们使用了22种葡萄酒发酵的相同数据库,研究了大约22000个點,考虑的主要化学变量为:总糖、酒精度和密度。利用80%的数据进行模型训练,20%的数据进行测试,在48h的时间截止条件下,他们获得了发酵行为的结果。主要结果表明,基于三次多项式和径向基核的SVM方法的预测正确率分别是88%和85%。
4工业金霉素间歇发酵过程中的生物效价软传感器建模方法[5]
发酵液的效力是反映金霉素发酵产物产量和质量的关键参数之一,但到目前为止,还没有一种仪器可以在线检测金霉素的效力。所有的测试都是通过手动离线测试完成的,生产过程通常有几十个小型、大型发酵罐,而从发酵罐中取样和分析结果需要几个小时,使用分析结果控制操作量会导致严重滞后。Yu-mei Sun等人将自组织特征映射(SOM)神经网络与数据的精确分类相结合,将最小二乘支持向量机(LSSVM)算法与非线性特征的强描述相结合,建立了预测金霉素发酵效力的SOM-LSSVM全局建模方法。根据非线性金霉素发酵过程的特点,他们用实时学习递归最小二乘支持向量回归(JITL-RLSSVR)进行局部实时建模和10次折叠交叉验证,提出了一种用于金霉素发酵效力在线预测的混合软传感器建模方法(JITL-RLSS VRSOM-LSSVM)。现场实验表明,该方法可以获得更准确的效力预测值,并能满足生产工艺的要求。
5酵母发酵过程中负性规则的引入与模糊控制器的演化[6]
生物过程的控制非常具有挑战性,因为它受到各种不确定性来源的高度影响。由于这些不确定性在大多数情况下无法直接测量,总体控制要么是依靠操作员的经验而手动完成,要么是在模糊逻辑理论的基础上应用智能专家系统。专家系统控制主要是通过使用积极规则来表示的,这在决策过程的语义方面并不是直截了当的,因为这一决策过程还包括以限制或禁止的形式出现的负面经验。Stephan Birle等人提出了一种基于正负规则的酵母繁殖过程模糊逻辑控制方法,该过程是通过交互过程中的温度来引导酵母细胞浓度的参考轨迹。由于参考轨迹和系统响应的均方根误差比仅使用正规则的控制器平均降低62.8%,因此,负规则的加入使得过程的控制更加稳定和准确。
6利用花卉授粉算法动态优化间歇发酵生物过程[7]
现在有几种优化策略可以用于进料间歇发酵过程中寻找最佳进料剖面,如迭代动态规划(IDP)、遗传算法(GA)、粒子群优化(PSA)和蚁群优化(ACO)等。在Sarma Mutturi 的 研究中,以陆生开花植物授粉过程为灵感的花卉授粉算法(FPA)首次被用于寻找最佳摄食、饲料分批发酵过程中的剖面图。他选择单控制变量、双控制变量和状态变量有界问题来检验花卉授粉算法对最优控制问题的鲁棒性。结果表明,花卉授粉算法与其他随机策略相比,计算强度较小。将所得结果与其他研究结果进行比较,发现对于所研究的情形,花卉授粉算法要么收敛到较新的最优值,要么更接近所建立的全局最优值。
7 小结
专家们已经利用神经网络、花卉授粉算法、遗传算法、支持向量机等算法研究了发酵工程中的厌氧发酵制氢、乳杆菌和嗜酸链球菌最佳酸化温度、葡萄酒发酵异常、间歇发酵等问题,这对发酵工业的智能化发展将起到积极的促进作用。
参考文献:
[1]蔡自兴,蒙祖强:人工智能基础(3版)[专著]. 北京:高等教育出版社,2016.
[2]Ahmed El-Shafie: Neural network nonlinear modeling for hydrogen production using anaerobic fermentation[J]. Neural Computing and Applications volume 24, pages539–547(2014).
[3]E. B. Gueguim-Kana, J. K. Oloke, A. Lateef & M. G. Zebaze-Kana: Novel optimal temperature profile for acidification process of Lactobacillus bulgaricus and Streptococcus thermophilus in yoghurt fermentation using artificial neural network and genetic algorithm[J]. Journal of Industrial Microbiology & Biotechnology volume 34, pages 491 – 496 (2007).