海洋生物酶发酵过程关键生物参数的软测量*

2018-09-11 02:12孙丽娜黄永红丁慎平
传感器与微系统 2018年9期
关键词:正则贝叶斯权值

孙丽娜, 黄永红, 丁慎平, 刘 骏

(1.苏州工业园区职业技术学院 机电工程系,江苏 苏州 215123; 2.江苏大学 电气信息工程学院,江苏 镇江 212013)

0 引 言

海洋生物酶[1~3]发酵过程具有非线性、时变性、强耦合和不确定性等特点。许多关键生物参数,如菌体浓度、基质浓度及产物浓度等,还没有成熟实用的在线测量仪器,给整个发酵过程的在线控制和实时优化带来很大困难,软测量技术是解决上述难题的有效方法[4~6]。目前应用最广泛的误差反向传播算法神经网络存在过拟合和预测推广性不强的缺点,基于其他算法如动量法、共轭梯度学习算法以及Levenberg-Marquardt(LM)优化算法等[7~9]的神经网络的泛化能力在海洋生物酶发酵过程关键生物参数软测量中并没有达到理想效果。

针对以上算法的神经网络不足之处,本文提出了利用贝叶斯正则化神经网络[10,11]对海洋蛋白酶(典型的海洋生物酶)发酵过程关键生物参数进行软测量。结果表明:相同条件下,采用贝叶斯正则化算法比其他改进算法网络泛化能力好,预测精度高。

1 贝叶斯正则化神经网络

1.1 正则化方法

一般情况下,神经网络的性能函数取误差平方和

(1)

式中n为训练样本总数,ti为样本输出,ai为神经网络的输出。为了克服网络学习过程中的过拟合问题,以正则化方法改进式(1),性能函数变为F=βED+αEW,其中,EW为网络权值的平方和;α和β的大小决定着网络训练目标,本文采用贝叶斯方法选择α和β。

1.2 神经网络的贝叶斯学习

在贝叶斯框架中,认为网络的权值是随机变量,给定数据集后,根据贝叶斯规则调整密度函数的权值有

(2)

式中D为数据集,M为神经网络模型,w为网络权向量,ZD(β)=(π/β)n/2,ZW(α)=(π/α)N/2,N为网络中参数的总数目。

在贝叶斯框架下,最优权值应该极大化后验概率P(w|D,α,β,M),并等价极小化目标函数F(w)=βED+αEW,F(w)取最小值时,对应的权值wMP处的α和β的最优值为

(3)

贝叶斯优化正则化参数时需要计算F(w)在最小点wMP处的Hessian矩阵。为了提高计算速度,采用LM优化算法来定位最小点, Gauss-Newton近似计算Hessian矩阵。

1.3 贝叶斯正则化神经网络训练步骤

1)初始化α,β和权值,设置α=0,β=1,并用Nguyen-Widrow方法初始化权值;

2)用LM算法训练网络使F(w)=βED+αEW达到最小;

4)由式(3)计算α和β的新估计值;

5)重复步骤(2)~步骤(4)直至收敛。

2 基于贝叶斯正则化神经网络的软测量建模

2.1 确定网络的输入和输出

以海洋蛋白酶发酵过程为例,其发酵过程中,菌体浓度、基质浓度、以及酶活还不能实时在线测量(菌丝浓度采用菌丝干重法测定,基质浓度采用斐林试剂法测定;酶活采用Folin-酚试剂法测定)给整个发酵过程的在线控制和实时优化带来很大影响。为此,本文建立了基于贝叶斯正则化神经网络的软测量模型,在建模过程中,菌体浓度X、基质浓度S、相对酶活P(为了更好地显示酶活的变化幅度)作为软测量模型的输出变量。通过对海洋蛋白酶发酵过程进行机理分析,利用一致关联度算法[12]确定软测量模型的输入变量为基质进给速率u、溶解氧浓度(DO),CO2浓度,pH值。

在海洋蛋白酶发酵过程中,共采集10个发酵批次的数据,每个发酵批次时间跨度为50 h,其中,前9个批次用于软测量模型误差的最小训练,第10个批次的数据作为测试样本集对软测量模型进行验证。另外,由于采集到的样本数据变化范围较大,归一化采用MATLAB中的premnmx函数进行[-1,1]归一化。

2.2 网络模型建立

本文建立的神经网络模型包含1个输入层、1个隐含层和1个输出层。在MATLAB环境下,用newff函数建立网络。主要参数设置:隐含层神经元传递函数设置为S型正切函数tansig,输出层神经元传递函数设置为线性函数purelin,训练函数采用贝叶斯正则化算法trainbr函数。设置最大训练次数为1 000,训练误差为0.000 1。通过结合隐含层节点选择的原则以及试验凑试法,寻找最佳隐含层节点数,最终确定隐含层节点数为20,网络结构为4—20—3。

图1为网络训练过程误差变化曲线,可以看出当训练迭代至517步时,达到设定训练误差(网络输出与期望输出的均方误差能得到10-4精度),网络训练收敛。

图1 网络训练误差变化

利用plotregression函数对训练样本和测试样本的神经网络输出与期望输出进行线性回归(包含基质浓度(g/L)、菌体浓度(g/L)、相对酶活(%)),如图2和图3所示。由图2可以看出,相关系数R=1,所有输出点均处于斜线以上,说明期望输出和神经网络输出值完全重合,网络训练比较充分,训练效果很好。

图2 训练样本期望输出和神经网络输出的线性回归

图3 测试样本期望输出和神经网络输出的线性回归

2.3 模型验证与分析

为了验证模型的有效性,利用测试样本集对建好的模型进行测试,实验结果如图3、图4所示。由图3可以看出相关系数R=0.999 99。结合图2和图3可以说明贝叶斯正则化很好地平衡了神经网络对训练数据的拟合程度和模型的复杂度,从而显著地提高了网络模型的泛化能力。

图4为软测量值(预测值)和离线化验值(实际值)曲线,可以看出,对于基质浓度、菌体浓度和相对酶活,基于贝叶斯正则化神经网络的软测量建模输出的预测值均能够很好跟踪实际值。

图4 实际值与预测值曲线

为了更直观地说明贝叶斯正则化神经网络的预测性能,文中将贝叶斯正则化神经网络与LM算法[13,14]的神经网络进行了对比,采用平均绝对误差和均方根误差和最大绝对误差3个预测性能的评价指标反映模型的预测效果,结果如表1所示。表中2种算法的神经网络采用了相同的训练数据、测试数据和网络参数。可以看出LM算法的神经网络预测误差要比前者大得多。结合图4和表1可以看出贝叶斯正则化神经网络具有较高的预测精度。

3 结束语

本文针对海洋生物酶发酵过程关键生物参数在线测量问题,提出一种贝叶斯正则化神经网络软测量建模方法,将该方法应用于海洋蛋白酶发酵过程中,分别验证了其泛化能力和预测精度,并与LM算法的神经网络进行了比较。结果说明贝叶斯正则化神经网络在海洋生物酶发酵样本软测量中作用显著。

表1 软测量误差对比

猜你喜欢
正则贝叶斯权值
一种融合时间权值和用户行为序列的电影推荐模型
J-正则模与J-正则环
π-正则半群的全π-正则子半群格
Virtually正则模
基于贝叶斯解释回应被告人讲述的故事
CONTENTS
剩余有限Minimax可解群的4阶正则自同构
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
基于贝叶斯估计的轨道占用识别方法