曾祥燕,赵良忠,李冰,李琳
(1.邵阳学院生物与化学工程系,湖南 邵阳 422000;2.华南理工大学轻化工研究所, 广东 广州 510640)
蜡样芽孢杆菌DM423生物量的延迟神经网络软测量
曾祥燕1,赵良忠1,李冰2*,李琳2
(1.邵阳学院生物与化学工程系,湖南 邵阳 422000;2.华南理工大学轻化工研究所, 广东 广州 510640)
摘 要:为探索蜡样芽孢杆菌DM423有效的生物量在线测量方法,应用延时神经网络对分批培养过程中DM423的生物量进行软测量,构建了拓扑结构为11–20–1的延时神经网络。网络的输入量为pH、温度、溶氧量和葡萄糖浓度在t–1与t–2时的延时量以及生物量浓度在t–1、t–2和t–3时的延时量,输出量为t时刻的生物量浓度。结果表明,构建网络的泛化能力较好,测试样本的均方差为0.15×10–3,所建立的延时神经网络具有良好鲁棒性和一步预测能力,而多步预测能力不太理想。
关 键 词:延时神经网络;蜡样芽孢杆菌DM423;生物量;软测量
投稿网址:http://xb.ijournal.cn
蜡样芽孢杆菌DM423 (Bacillus cereus DM423)活菌制剂是一种新型的抗生素替代剂[1],目前已被农业部生物制品规程委员会批准列入“兽医生态剂”,用作畜牧饲料添加剂。微生物发酵过程中某些关键生物量参数难以实时在线检测,一般是通过定时取样后,在实验室通过离线分析化验获得,这样不但影响了系统的实时控制效果,而且使整个生产过程难以实现及时、准确的控制与优化。寻找可靠的生物量在线测量方法是扩大DM423生产并获得高活性菌体所亟待解决的问题。近年来,基于人工神经网络的生物量软测量[2]方法受到科研工作者的重视。黄永红等[3]采用基于“虚拟子系统”的模糊神经网络逆系统软测量方法对关键生物量参数进行在线估计。房慧等[4]采用模糊径向基函数–神经网络(RBF–NN)构建青霉素发酵的软测量模型,同时结合改进粒子群优化训练算法(PSO),建立了青霉素反应过程的软测量模型,并对发酵工艺进行了仿真试验研究,所建模型的预测值与实际测量值的拟合程度较好,训练过程满足要求。
目前,对微生物培养过程中的软测量大多采用多层静态前馈神经网络模型[5]。杨强大等[6]利用径向基(RBF)神经网络分别为发酵过程各阶段建立了软测量模型,能较好地对诺西肽发酵过程中的产物浓度和培养基浓度进行在线测量。然而,微生物培养过程本身是动态的,培养基和产物的浓度时刻都在发生变化,在培养条件发生较大波动时,所得到的稳态模型无法准确反映出输入和输出之间的关系,必须采用动态模型[7–9]才能解决此问题。延时神经网络(time-delay neural network)由Lang和Hinton[10]于1988年最先提出,是目前流行的处理动态系统的技术,其优点是能利用现有的输入和输出数据,算法成熟,网络模型收敛性好。笔者拟采用延时神经网络对DM423培养过程进行建模,并对网络的鲁棒性能及预测性能进行验证,现将结果报道如下。
1.1菌种
蜡样芽孢杆菌DM423(Baeillus cereus DM423)由华南理工大学轻工与食品学院提供。
1.2方法
采用5 L的机械式搅拌生物反应器对蜡样芽孢杆菌DM423进行分批培养。反应器的实际工作体积为 3 L。共进行16批次的培养。在每一次的分批培养中,气体通入量恒定,pH 和温度按设定值在培养过程中保持不变。pH 的设定范围为 6.7~7.2,DM423在培养过程中产生的酸性物质,可通过 pH传感器将信号传送到控制器,从而控制蠕动泵加入NaOH 进行中和。温度的设定范围为 25~40 ℃,通过反应罐体下部的夹套通入不同温度的水,对培养液进行控温。每批次共培养12 h,每隔1 h取样1次。在16个样本中,13个样本作为训练样本,剩余3个样本作为测试样本。为光滑去除数据中的测量噪声,增加数据的可信度,得到较小时间间隔的数据,保证训练集具有较广泛的覆盖面[11–12],试验运用3次样条插值法获得以0.5 h为间隔的数据。培养液中的溶氧量(DO 值)由溶氧计测定。
采用三层(输入层、隐含层和输出层)网络结果对整个发酵的动态过程进行模拟和仿真。延时神经网络在结构上也与前馈网络相似,把时域信号展成了空间信号,选用BP神经算法。隐层与输出层均为单极性“S”型函数。以pH、溶氧量(DO值)、葡萄糖浓度(S)和温度(T)的延时量以及生物量浓度(X)的延时量作为网络的输入变量,对这些变量进行组合,从而构建不同的网络结构。以当前时刻的生物量Xˆ(t)为网络的输出变量。模型训练5 000次后,记录训练误差及测试误差。
2.1DM423生物量软测量的延时神经网络模型的构建
以不同输入变量所构建的网络结构及样本的测试结果见表1。
表1 不同输入变量所构建的网络结构及样本的测试结果Table 1 MSE of testing samples and the topology of time-delay neural networks for different sets of input variables
从表1可见,第1组网络的测试误差远远大于其他网络结构的测试误差,这是因为第1组输入变量只包括了输入变量的延时量,而没有将输出的延时量引入网络。本研究中,DM423培养过程中当前时刻DM423的生长是受到前一时刻微生物生长情况的影响的,即当前时刻的生物量浓度X(t)与以前时刻生物量浓度X(t–q)是密切相关的,因而,将输出的延时量引入网络不仅是从提高网络性能的角度出发,而且从实际意义上来说也是必要的。
延时神经网络是将以前的状态参数“记忆”下来,而网络要“记住”以前多远的信息才好,这样就涉及了记忆的“深度”与“分辨率”的问题。表1中第3组和第4组、第5组和第6组的输入变量只相差一个X(t–3),即第4组及第6组的网络引入了输出参数t–3时刻的延时量,但第3组与第4组的网络测试误差相同,而第6组比第5组网络的测试误差稍大。由此可见,对延时神经网络而言并不是“记住”越远的信息就越好,当网络的分辨率有限时远离的信息就会丢失。将第5组和第6组参数分别作为输入变量,所构建的延时神经网络用测试样本进行检验时,其均方差(MSE)相差不大,2个网络的泛化能力相近。考虑到第6组参数包括了生物量浓度t–3时刻的量,所建网络所含的信息较多,而且泛化能力较好,所以,本研究中确定以第6组参数为输入变量,所构建的延时神经网络拓扑结构为11–20–1。
2.2延时神经网络的抗扰能力(鲁棒性)
为检测延时神经网络在输入参数有干扰时的抗扰能力,将高斯噪声施加于生物量浓度的测量值。
对DM423生物量质量浓度的测量值分别施加均值为0.0,标准差为0.03Xmax、0.05Xmax和0.08Xmax的高斯噪声干扰,以表1中第6组参数为输入变量构成的网络(11–20–1型)为考察对象,网络对测试样本的MSE值分别为0.16×10–3、0.29×10–3、0.75×10–3,没有施加干扰时的MSE值为0.15×10–3。由此可见,随着所施加的高斯噪声标准差的增大,测试样本的MSE也随之增大,延时神经网络的泛化能力下降。在标准差为0.03Xmax的高斯噪声干扰下,测试样本的MSE与没有施加干扰时的MSE差异不明显。可见,网络对此噪声有一定的抗扰能力。但对标准差为0.05Xmax和0.08Xmax的高斯噪声,网络的抵抗能力明显减弱。
2.3延时神经网络的预测能力
以表1中第6组的参数构成的网络(11–20–1型)为对象,考察延时神经网络的预测能力。
2.3.1一步预测
由表1可知,网络模型的输出与输入间的关系可表达为:
Xˆ(t ) =f [X(t–1),X(t–2),X(t–3),T(t–1),T(t–2),pH(t–1),pH(t–2),DO(t–1),DO(t–2),S(t–1),S(t–2)] (1)
网络的输入是生物量X在t–1、t–2和t–3时刻的实测值,以及T、pH、DO和S在t–1和t–2时刻的测量值,网络的输出是生物量当前时刻(t时刻)的估算值,所以,公式(1)得出的是对生物量质量浓度的一步预测值。网络的预测结果见图1。从图1可见,网络对生物量的一步预测值与实测值能很好的吻合,预测误差小(MSE=0.15×10–3)。
图1 延时神经网络的一步预测结果Fig. 1 One-step-ahead predictions on the testing samples from the time-delay neural network
2.3.2 多步预测
公式(1)不能用来作生物量的多步预测,因为X(t–1)、X(t–2)和X(t–3)是实际的测量值。如果要用公式(1)进行多步预测,需用网络模型输出的以前时刻生物量的预测值来代替生物量的实际测量值[13–14],即在公式(1)中以Xˆ(t–1)、Xˆ(t–2)和Xˆ(t–3)代替X(t–1)、X(t–2)和X(t–3)。网络的预测结果见图2。
由图2可见,延时神经网络的多步预测值与实际测量值相差甚远,其多步预测能力差,表明延时神经网络处理高阶次的非线性问题时,其动态处理能力有限,只能进行一步预测。因多步预测要求学习过程能反复地滚动或者以链锁作用方式进行,延时神经网络则不具备这样的学习过程,故其多步预测精度不理想。
图2 延时神经网络的多步预测结果Fig. 2 Multi-step-ahead predictions on the testing samples from the time-delay neural network
笔者采用动态的延时神经网络对DM423分批培养过程的生物量进行软测量。将输出变量t–1,t–2 及t–3时刻的状态信息引入的延时神经网络,其泛化能力强于只引入输入变量t–1时刻状态信息的延时神经网络的泛化能力,但并不是“记忆”越多以前的信息,其网络性能就越好。对生物量的测量值施加均值为0.0,而标准差不同的高斯噪声的干扰时,延时神经网络的测试误差随着高斯噪声的标准差增大而增大,在小噪声(std=0.03Xmax)下,测试误差变化很小,具有一定的抗干扰能力。延时神经网络用于多步预测时,其预测精度差。鉴于此,延时神经网络不适于用来进行多步预测。
参考文献:
[1] 张英春,韩雪,单毓娟,等.益生菌抑制致病菌作用的机制研究进展[J].微生物学通报,2012,39(9):1306–1313.
[2] Cao Pengfe,Luo Xionglin.Modeling of soft sensor for chemical process[J].CIESC Journal,2013,64(3):788–800.
[3] 黄永红,孙玉坤,王博,等.赖氨酸发酵过程关键参数的模糊神经网络逆软测量研究[J].仪器仪表学报,2010,31(4):862–867.
[4] 房慧,孙玉坤,嵇小辅.青霉素发酵过程的粒子群模糊神经网络软测量[J].自动化仪表,2011,32(5):46–52.
[5] Konstantinov K.Yoshida T1 physiological state control offermentation processes[J].Biotechnology and Bioengineering,1989,33(9):1145–1156.
[6] 杨强大,侯新宇.诺西肽发酵过程中的分阶段软测量建模[J].化工学报,2011,62(6):1612–1619.
[7] 周勇,郑毅,宋利丹.人工神经网络与遗传算法耦合法优化辅酶Q10发酵培养基 [J].中国生物工程杂志,2013,33(9):73–78.
[8] Bochereau L,Bourgine P,Bouyer F,et al.Using recurrent multiplayer neural networks for simulating batch reactors[J].IEEE International Joint Conference on Neural Networks,1991,2:1512–1517.
[9] Barrera-Cortes J,Baruch I,Vazques C V,et al.Neural model of Cry1A(c) protein produced from a Bt.fed batch fermentation[J].IEEE International Joint Conference on Neural Networks,2001,2:1302–1306.
[10] Lang K J,Hinton G E.The development of the timedelay neural network architecture for speed recognition,Technical report CMU–CS–88–152[D].Pittsburgh:Carnegie-Mellon University,1988.
[11] 刘瑞兰.软测量技术若干问题的研究及工业应用[D].杭州:浙江大学,2004.
[12] 吴孟达,李志祥,宋松和.数学分析[M].长沙:国防科技大学,2003.
[13] 李冰,郭祀远,李琳.DM423摇瓶培养过程生物量的BP神经网络软测量[J].华南理工大学学报(自然科学版),2004,32(12):11–15.
[14] Zhang D,Sun L,Cao J.Modeling of temperature–humidity for wood drying based on time–delay neural network[J].Journal of Forestry Research,2006,17(2):141–144.
责任编辑:苏爱华英文编辑:梁 和
Time-delayed neural network-based soft sensor for Baeillus cereus DM423 biomass during batch cultivation
Zeng Xiangyan1,Zhao Liangzhong1,Li Bing2*,Li Lin2
(1.Department of Biology and Chemical Engineering,Shaoyang University, Shaoyang, Hunan 422000, China; 2.Institute of Light Industry & Chemical Engineering, South China University of Technology, Guangzhou 510640, China)
Abstract:Baeillus cereus DM423 is a new replacement of antibody in stock breeding. In this paper, the biomass of Baeillus cereus DM423 during batch cultivation was measured by the soft sensor of time-delayed neural network, which was constructed with the topology of 11-20-1, the input variables was delays of pH, temperature, dissolved oxygen, glucose concentration at t–1 and t–2 and delays of biomass concentration at t–1, t–2 and t–3, and the output variable was biomass concentration at present time. The result showed that the constructed network had good generalization with the mean square error of 0.15 ×10–3for the testing samples and good robustness and prediction ability.
Keywords:time-delayed neural network; Baeillus cereus DM423; biomass; soft sensor
中图分类号:TS202.3; TP183
文献标志码:A
文章编号:1007−1032(2016)02−0208−04
收稿日期:2014–09–23 修回日期:2016–02–28
基金项目:国家自然科学基金项目(29876013)
作者简介:曾祥燕(1974—),男,湖南邵阳人,硕士,副教授,主要从事食品科学研究,zengxiangyan8@163.co;*通信作者,李冰,博士,教授,主要从事生物与食品化工研究,bli@scut.edu.cn