融入先验知识的径向基神经网络软测量建模

2017-04-24 12:00肖红军黄道平刘乙奇
自动化仪表 2017年4期
关键词:先验权值污水处理

肖红军,黄道平,刘乙奇

(1.佛山科学技术学院自动化学院,广东 佛山 528000;2.华南理工大学自动化科学与工程学院,广东 广州 510640)

融入先验知识的径向基神经网络软测量建模

肖红军1,黄道平2,刘乙奇2

(1.佛山科学技术学院自动化学院,广东 佛山 528000;2.华南理工大学自动化科学与工程学院,广东 广州 510640)

针对神经网络软测量建模过程中有效信息丢失的情况,在传统3层径向基神经网络(RBFNN)模型的输入层和隐含层之间引入先验层。先验层与输入层之间的权值可直接表征通过机理、统计或者人工智能算法分析得到的先验知识,即各个输入变量的重要程度信息,该权值的变化可以改变RBFNN聚类的空间形状,使得样本在训练过程中的聚类更为合理,从而提高了RBFNN软测量模型的预测精度。RBFNN模型在污水处理过程的生化需氧量(BOD)预测中得到了验证。仿真结果表明,相比传统3层RBFNN网络,融入先验知识的4层RBFNN软测量模型具有更优异的拟合能力。

污水处理; 人工智能; 神经网络; 软测量; 先验知识; 预测

0 引言

在污水处理过程中,由于测量设备昂贵、测量滞后以及容易受到极端工作环境的干扰等原因,通常难以实现过程变量的在线测量。为实现监测甚至控制化工过程的目的[1],软测量技术得到了广泛的应用。目前,主要的软测量方法分为基于机理的软测量模型和数据驱动型软测量模型,而数据驱动型模型又可分为统计模型和人工智能模型。为了减少模型的计算量、保证模型的精度、提高模型的泛化能力和自适应能力,很多学者采用混合建模的方法进行软测量。

在软测量建模中,神经网络由于具有很强的非线性映射能力、自学习能力和鲁棒性,而且不依赖于数学模型,是目前软测量领域中最为活跃的研究分支[2]。 Qi Haiyu等提出了一种机理模型和神经网络串联的混合建模方法[3],该方法以机理模型为主导,以神经网络识别出的辅助参数作为机理模型的输入,因此,该方法要求对过程机理有比较深入的研究。张勇等提出了将主元分析(principal componeut analysis,PCA)-径向基(radial basis function,RBF)神经网络的软测量模型用于浮选过程预测[4],首先对输入过程变量进行数据预处理,然后利用PCA众多的过程变量降维解耦,最后将贡献率较大的主元作为神经网络的输入量,减少了神经元数量,也减小了模型的计算量,但该软测量模型丢失了由主元分析得到的各主元贡献率这个重要信息。刘瑞兰等研究了模糊神经网络的混合控制软测量模型[5],由于没有在神经网络算法中找到一种简单合适、描述各个过程变量重要程度的指标,所以对所有输入变量模糊化,再进行模糊推理,得出模糊推理层的若干规则。当输入向量维数较大时,可能出现模糊规则爆炸现象。本文将机理、统计或者是经过人工智能算法分析得到的各个过程变量的重要程度信息(即先验知识)融入到径向基神经网络(radial basis function neural network,RBFNN)中,以充分发挥RBFNN的逼近能力,提高软测量模型预测的准确率。

1 RBFNN软测量模型

RBFNN具有很强的非线性函数逼近能力和较快的学习速度,隐含层神经元个数可在网络训练过程中由算法确定,因此,在对实时性要求不是特别高的污水处理过程中,适合进行在线训练。融入先验知识集的RBFNN软测量模型结构如图1所示。

图1 RBFNN软测量模型结构图

图1中,虚线框内即为经典的RBFNN结构。RBFNN将低维输入向量空间扩展到高维隐含层空间再进行分类,大大减少了局部极小点,其输出层的输出值则为各个隐含层的线性加权。输入输出的映射关系为[6]:

(1)

图1展示的4层网络结构融入了先验知识集,在4层网络结构中,原3层网络的输入层变为先验层。输入层和先验层之间的权值ω由先验知识集确定,ω=[w1,…,wn]T。先验知识可以来自于机理、统计分析或者人工智能算法,如:通过机理分析得知某个或者多个过程变量对模型影响较大,通过统计分析得出某个或者多个输入量的贡献率,通过比较输入输出的误差,由模糊逻辑确定权值等。

r=‖Xi-ci‖2

(2)

式中:Xi为第i个样本;ci为第i个聚类中心,即训练样本的其中一个输入向量。

以二维输入变量加权前后RBFNN聚类的形状变化为例,设第k个训练样本Xk为聚类中心,则加权后聚类中心ck=[ω1xk1,ω2xk2]T,测试样本Xi加权后为[ω1xi1,ω2xi2]T。 图2为二维输入变量加权前后RBFNN聚类的形状变化示意图。示例中取r=1,Xk=[5,5]T,第一个变量为主要输入变量,第二个变量为次要变量,权值ω=[0.8,0.2]T,则有:‖Xi-ci‖2=[ω1(xi1-xk1)]2+[ω2(xi2-xk2)]2= 0.64(xi1-5)2+0.04(xi2-5)2

(3)

图2 RBFNN聚类示意图

图2(a)对应的是3层网络结构的聚类示意图,图2(b)是4层网络结构即先验层加权输入后的聚类示意图。从图2可以看出,加权后的聚类形状由加权前的圆形变为了椭圆形,表明第一主要输入变量对聚类的影响比第二次要输入变量大。需要说明的是,图2仅为示意图,其形状大小并不表示真实的聚类范围。因为3层网络和4层网络的聚类中心不同,其对应的方差σi也不同,会影响激活函数的输出,也即影响示意图中聚类空间。

2 生化需氧量预测

2.1 污水处理工艺

活性污泥污水处理(waste water treatment plant,WWTP)主要用来分解污水中的有机物并脱氮降磷,主要监测指标是反映水中可降解有机物参数的生化需氧量(biochemical oxygen demand,BOD)。污水处理的生化反应过程极其复杂,微生物数量与种类受污水浓度、进水速率、天气、季节等因素的影响较大,且在线分析检测周期较长等原因,使用在线分析仪器检测BOD的效果并不理想[7]。本节利用前面所述模型来预测BOD,数据来源于加州大学数据库(UCI)。

活性污泥污水处理流程包括预处理、初沉、曝气、二沉这4个部分,经过预处理和初沉池处理后,污水进入曝气池,经过好氧和厌氧生物的生化反应分解污水中的有机物,同时进行脱氮降磷处理。然后曝气池的混合出水流入二沉池,经固液分离处理后,适合排放的澄清水从二沉池流出。二沉池的污泥一部分回流到曝气池以维持曝气池微生物数量在一合适水平,剩余的污泥则被净化后再利用。该厂日均处理污水流量为35 000 m3/d,检测了38个与有机物和微生物相关的变量,记录了526天,即共有38×526个在线检测数据。

2.2 数据预处理

由于过程变量较多,采用Kohonen自组织映射的自动聚类算法,去除了一些冗余或不相关的变量数据。为了便于输出处理和避免不同过程变量的量纲影响,将过程变量进行归一化处理。最终选用的19个辅助变量如表1所示。

表1 辅助变量表

BOD与污水处理工艺的诸多过程变化相关,而且随着工业技术的不断进步,仪表精度和采样频率不断提高,使得现场数据呈爆炸式的增长。PCA是一种常用的高维数据线性降维和特征提取方法,通过对输入变量的线性变换,由输入变量互相关矩阵的主要特征值确定坐标变换和变量压缩,从而在数据空间中找出一组正交矢量,最大可能地表示数据方差,以便将数据从原始高维空间映射到正交矢量构成的子空间实现降维,得到相应的主特征矢量以及输入数据的内部拓扑结构[8]。记归一化处理后得到的过程变量向量为Z∈Rn×m,PCA将多变量的输入数据矩阵进行奇异值分解后得到主元和特征向量:

(4)

式中:xn∈Rn为得分向量,即矩阵Z的主元;pm∈Rm为负荷向量;ε为残差矩阵,它包含了系统数据的主要噪声;X=[x1,x2,…,xn]和P=[p1,p2,…,pm]分别为得分向量矩阵和负荷向量矩阵。经过PCA变换,特征向量根据特征值λi降序的方式排列,以此获得比较重要的特征值、特征向量和主元,而忽视无关紧要的变量。同时,原始数据间的耦合性也得到了消除。

2.3 RBFNN软测量建模

对RBFNN的输入变量即主元的选择,根据方差贡献率ηi的大小来确定。

(5)

(6)

2.4 仿真结果与分析

取400个样本作为训练样本,126个样本作为测试样本,使用操作系统为Windows 7 Home Basic、处理器为Intel Core i7-4500U、内存容量为8 GB的计算机进行仿真,参数设定MSE=3,测试性能如表2所示。其中,Spread为RBF扩展系数,计算时间则包括归一化处理、PCA降维、网络训练和样本测试等时间,相对平均误差为:

(7)

从表2的RAE和RMSE两个指标可以看出,在增加少量神经元的情况下,提出的4层网络拟合效果明显优于3层网络,这是因为4层网络加入权值后,其聚

类方式能体现出原始数据的更多信息,输入量权值不同表示其对输出的影响不同,使其分类更合理。从程序运行时间来看,在Spread参数合适时,整个软测量模型的计算时间(包括训练时间)小于3 s,完全适用于对实时性要求不是很高的污水处理过程监测,甚至可以采用在线训练方式进行实时控制。此外,表2还反映出当Spread参数设定大于2时,网络3层网络和4层网络受其变化的影响不大,且4层网络的影响略小,这也给在线训练提供了条件。

表2 3层RBFNN和4层RBFNN性能比较

BOD浓度预测值和预测误差曲线如图3所示。

图3 BOD浓度预测和预测误差曲线

由图3可知,4层网络模型拟合效果较好,仅有一个预测序列的绝对误差较大为7.6,说明提出的模型具有较高的逼近精度。值得一提的是,在测试指标相同时,4层网络模型的隐含层数量并不一定比3层网络的要多,反而可能更少。加入权值对网络模型最主要的作用是改变了聚类形状,而非聚类宽度。

3 结束语

本文提出了一种融入先验知识的4层RBFNN软测量模型,并应用于BOD参数预测。仿真数据表明,4层RBFNN网络的逼近能力强,由于体现了原始数据的更多信息,使得聚类更能体现原始数据特征,所有其预测精度明显优于3层网络。文中的4层RBFNN污水处理软测量仅仅展示了一个基于统计分析获取权值的示例,但并不局限于此,它还可以融入机理、经验以及智能算法获得的权值信息。

[1] HIROMASA K,KIMITO F.Moving window and iust-in-time soft sensor model based on time differences considering a small number of measurements [J].Industrial & Engineering Chemistry Research,2015,54(2):700-704.

[2] 于霜,刘国海,梅从立,等.生物发酵过程中VIP优化神经网络逆系统的软测量方法 [J].南京理工大学学报,2015,39(4):447-451.

[3] QI H Y,ZHOU X G,LIU L H,et al.A hybrid neural network-first principle model for fixed-bed reactor[J].Chemical Engineering Science,1999,54(13-14):2521-2526.

[4] 张勇,王介生.基于PCA-RBF神经网络的浮选过程软测量建模[J].南京航空航天大学学报,2006,38(7):116-119.

[5] 刘瑞兰,苏宏业,褚健.模糊神经网络的混合学习算法及其软测量建模[J].系统仿真学报,2005,17(12):2878-2881.

[6] 王小川,史峰,郁磊,等.Matlab神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

[7] 乔俊飞,郭楠,韩红桂.基于神经网络的BOD参数软测量仪表旳设计[J].计算机与应用化学,2013,30(10):1219-1222.

[8] 肖红军,刘乙奇,伍俊.一种自确认软测量方法的研究与应用[J].中山大学学报(自然科学版),2014,53(4):45-51.

RBF Neural Network Modeling Integrated with Priori Knowledge for Soft-Sensing

XIAO Hongjun1,HUANG Daoping2,LIU Yiqi2

(1.School of Automation,Foshan University,Foshan 528000,China;2.School of Automation Science and Engineering,South China University of Technology,Guangzhou 510640,China)

In soft sensing modeling process,effective information loss may occur;in order to solve this problem,a Priori layer is introduced between the input layer and the implicit layer of the traditional three-layer RBF neural network (RBFNN).The weights between the input layers and the Priori layer can directly characterize the Priori knowledge which is obtained by mechanism,statistics,or artificial intelligence algorithm,and it is information about importance of each input variables.The variation of the weights can change clustering shape of RBFNN,which makes the cluster of sample in training process more reasonable,and improves the prediction accuracy of the RBFNN soft sensing model.The proposed model is verified in the biochemical oxygen demand(BOD) prediction of sewage treatment process.Simulation results demonstrate that the soft sensing model of four-layer RBFNN with Priori knowledge offers better fitting capability than the three-layer RBFNN.

Sewage treatment; Artificial intelligence; Neural network; Soft-sensing; Priori knowledge; Prediction

国家自然科学基金资助项目(61403142)、广东省科技计划基金资助项目(2015B090901025、2013B011304005)、佛山市科技创新专项基金资助项目(2014AG10018)

肖红军(1979—),男,博士,副教授,主要从事智能检测与智能控制方向的研究。E-mail:jinsery@163.com。 黄道平(通信作者),男,博士,教授,主要从事控制科学与工程学科的科研与教学工作。E-mail:audhuang@scut.edu.cn。

TH-3;TP3

A

10.16086/j.cnki.issn1000-0380.201704002

修改稿收到日期:2016-01-07

猜你喜欢
先验权值污水处理
二进制张量分解法简化神经网络推理计算①
一种融合时间权值和用户行为序列的电影推荐模型
BOP2试验设计方法的先验敏感性分析研究*
我国乡镇污水处理模式的探讨
农村黑臭水体治理和污水处理浅探
太原市61个村要建污水处理设施严禁直排入河
一种考虑先验信息可靠性的新算法
强规划的最小期望权值求解算法∗
程序属性的检测与程序属性的分类
油田污水处理药剂的选用