胡文博,李春青,任淑霞
(天津工业大学计算机科学与软件学院,天津 300387)
Adaboost-BP在MBR膜污染中的应用研究
胡文博1,李春青2,任淑霞2
(天津工业大学计算机科学与软件学院,天津 300387)
研究MBR膜通量进行膜污染预测是当今污水处理研究领域的重要课题之一,膜污染直接导致的结果是膜通量的下降。由于传统BP神经网络预测MBR膜通量存在局部极小值及模型的泛化能力较差的缺点,本文利用AdaBoost算法优化传统的BP神经网络,建立了AdaBoost-BP预测模型,并将该模型运用到MBR膜通量的预测中。通过预测数据和实验数据的对比,得出该模型的可行性,同时将其对比传统的BP神经网络模型,说明AdaBoost-BP预测模型具有更高的预测精度。
MBR;膜通量;AdaBoost-BP;BP神经网络
本文著录格式:胡文博,李春青,任淑霞. Adaboost-BP在MBR膜污染中的应用研究[J]. 软件,2016,37(12):21-25
膜生物反应器(MBR)是将膜分离技术和生物处理单元相结合的一种新型污水处理工艺,它是利用微生物对反应基质进行生物转化,同时利用膜组件分离反应产物并截留生物体[1]。目前研究MBR模拟仿真系统模型的热点之一是通过利用膜通量影响因素,结合智能仿真模型来预测膜通量。现阶段,对MBR膜通量仿真预测的方法有很多种,例如:数学模型、自回归、BP神经网络、支持向量机等。然而,这些传统的方法预测效果并不是很理想。AdaBoost-BP模型是将BP神经网络作为弱分类器,通过AdaBoost算法将其升级,使之成为强分类器模型,进而更好对实验数据进行预测[2]。
目前,传统的BP神经网络应用已非常广泛,它能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它采用最速下降法来学习,按误差逆传播算法来训练,在开始训练前,初始化各层的连接权值及阈值为[0,1]之间的随机数。为使网络的误差平方和最小,它会不断的调整权值和阈值。然而这种随机设定的初值,很难把控算法的收敛速度,且训练出来的最终结果可能为局部最优解,而非全局最优解。其网络结构如图1所示。
图1 BP神经网络结构Fig.1 BP neural network structure
2.1 基本思路
AdaBoost算法是一种迭代算法,它训练同一个基本分类器(本文采用的是传统的BP神经网络),但每次的训练集却不相同,而不同的训练集是通过改变样本的权重得到的[3],最终得出的强分类器是通过一定的方式加权基分类器而来的。理论可以证明,只要弱分类器的分类能力大于二分之一时,强分类器的错误率会随着弱分类器个数的无穷增大而趋于零。起初,每个训练样本的权重为样本总数的倒数,即均匀分布。在此基础上训练出一个基分类器,然后计算出G1(x)错分的样本和正确的样本,并按照一定的规则增加错分样本的权重值而减小其正确样本的权重值。同时,给基分类器G1(x)一个权重,这样不仅重新改变了训练样本的重要程度,也给基分类器确定了一个重要程度指标。然后,根据新的样本分布训练得到基分类器G2(x)和其权重。依次类推,可以得到M个基分类器和M个相应的权重。最后得到的强分类器就是按权重累加求和这M个基分类器[4]。
2.2 AdaBoost-BP预测模型算法
AdaBoost-BP预测模型算法流程如图2所示,算法过程如下:
输出:最终分类器G(x)。
过程:
(2)对于m=1,2,…,M,
a. 使用具有权值分布Dm的训练数据集进行学习(任意选一种模型都可以,这里选用BP神经网络,并且每一轮迭代都可以用不同的模型),得到一个弱分类器;
d. 更新训练数据的权值分布;
这里,Zm是规范化因子
将M个基本分类器进行线性组合
得到最终分类器
训练误差分析:
图2 AdaBoost-BP预测模型算法流程Fig.2 AdaBoost-BP prediction model algorithm flow
即训练误差的上界会随M的增加而指数减小。
MBR膜污染主要是指在泥水分离过程中,活性污泥混合液中的细小微粒、胶体颗粒、溶质大分子等物质与膜存在物理的、化学的和机械的作用,从而引起膜面或膜孔内吸附、沉积,最终造成膜孔径变小甚至膜孔堵塞[5]。膜通量的大小受多种因素的综合影响,归纳起来主要有MLSS、温度、操作压力、总阻力、COD等。采用主成分分析法(PCA)可得,对MBR膜通量起决定作用的因素有:生物动力学参数(混合液悬浮固体MLSS)、操作条件参数(总阻力和操作压力)[6]。本文将以上三个主要影响因子作为预测模型的输入条件,膜通量作为输出。其AdaBoost-BP模型示意图与MBR膜通量预测模型如3和图4。
图3 AdaBoost-BP模型示意图Fig.3 AdaBoost-BP model diagram
图4 MBR膜通量预测模型Fig.4 MBR membrane flux prediction model
我们通过实验得到70组数据,将MLSS、总阻力、操作压力作为预测模型的输入,MBR膜通量作为预测模型的输出。为了更好的验证该预测模型的有效性,将前60组数据作为训练样本,后10组样本作为测试样本,建立AdaBoost-BP的MBR膜通量预测模型,通过训练样本确定MBR膜通量与其影响因子之间的非线性关系。本文实验通过Matlab来实现。
4.1 实验条件
本文采用Matlab语言编写程序,先将样本数据按(式12)做归一化处理,使其值分布在[-1,1]之间,然后调用Matlab神经网络工具箱建立起传统的BP神经网络预测模型和AdaBoost-BP预测模型。其中,BP神经网络采用3-8-1的结构,神经网络的其它参数采用默认值,而AdaBoost-BP模型采用10个BP神经网络作为弱预测器。
4.2 实验结果与分析
首先,将10组测试数据作为传统BP预测模型的输入值,得出10个样本数据的BP预测结果,并算出每个样本的预测相对误差,然后,再将这10组测试数据带入到AdaBoost-BP预测模型中,得到10个样本的AdaBoost-BP预测值,同时也算出每个测试样本在AdaBoost-BP预测模型下的相对误差。其结果见图5,数据分析结果见表1,每个弱分类器的权重见表2。最后,根据表一的结果计算出传统BP模型预测的平均绝对误差为0.9488,平均相对误差为3.35%,同理,计算得到AdaBoost-BP预测模型平均绝对误差为0.4556,平均相对误差为1.19%,其中,两个预测模型的误差比较图如图6。可以看出,实验取得了良好的预测效果,且本文采用的AdaBoost-BP预测模型比传统的BP预测模型具有更好的预测能力。
图5 模型预测结果对比Fig.5 comparison of prediction results
表1 预测模型测试结果Tab.1 test results of prediction model
表2 预测模型测试结果Tab.2 weak classifier weights
图6 绝对误差结果对比Fig.6 comparison of absolute error results
从表1的数据可以发现,整体上,传统BP预测模型预测的结果误差较大,而采用AdaBoost算法改进后,建立的AdaBoost-BP预测模型能将预测精度优化许多。另外,从图5和图6的对比中也可以发现,对于10组测试样本,其中有9组预测数据都是AdaBoost-BP模型更精确些,这也充分体现了该模型的正确性和精准性。从而可以得出本文提出的AdaBoost-BP预测模型具有很好的适用性。此外,AdaBoost算法本身就具备很好的泛化能力[7],且无参数调整,编码也很简单,它排除一些不必要的训练数据特征[8],将其引入到MBR膜污染模拟仿真中,对MBR膜通量的预测提供了一种全新的方法和思路。
[1] Zuthi, M. F. R. Ngo, H. H.; Guo, W. S. Modelling bioprocesses and membrane fouling in membrane bioreactor (MBR): A review towards finding an integrated model framework. BIORESOURCE TECHNOLOGY[J]. 2012, 10(122): 119-129.
[2] YU Jiayuan. The application of BP-AdaBoost strong class-ifier to acquire knowledge of student creativity. Computer Science and Service System (CSSS), 2011International Conference on. 2011.
[3] Gaber T, Tharwat A, Hassanien A E, et al. Biometric cattle identification approach based on Weber’s Local Descriptor and AdaBoost classifier[J]. Computers & Electronics in Agriculture, 2016, 122(12): 55-66.
[4] 刘冲, 张均东, 曾鸿, 等. 基于支持向量机的无穷维Ada-Boost算法及其应用[J]. 仪器仪表学报, 2010, 04: 764-769. Liu Chong, Zhang Jundong, Zeng Hong, Ren Guang, Ji Yulong. Advanced AdaBoost Algorithm Based on Support Vector Machine and Its Application[J]. Journal of Instrumentation, 2010, 04: 764-769.
[5] 闫宏英, 李春青. MBR膜污染的智能模拟预测方法研究[J].计算机测量与控制, 2013, 08期(08). YAN Hong-ying, LI Chun-qing. Study on intelligent simulation and prediction of MBR membrane fouling[J]. Computer Measurement & Control, 2013, 08(08).
[6] 孟凡刚. 膜生物反应器膜污染行为的识别与表征[D]. 大连理工大学, 2007. Meng FANG. Membrane bioreactor membrane fouling behavior identification and characterization[D]. Dalian University of Technology, 2007.
[7] 胡德华, 郑东健, 付浩雁. AdaBoost-BP模型在大坝变形预测中的应用[J]. 三峡大学学报(自然科学版), 2015, 05: 5-8. Hu Dehua, Zheng Dongjian, Fu Haoyan. Application of AdaBoost-BP model in dam deformation prediction[J]. Journal of Three Gorges University (Natural Sciences), 2015, 05: 5-8.
[8] 高静. Adaboost-BP方法在企业信用评级中的应用研究兰州商学院, 2012. Gao Jing. Adaboost-BP method in the application of enterprise credit rating[D]. Lanzhou Business School, 2012.
The Research of Prediction Model Based on AdaBoost-BP in MBR Membrane Fouling
HU Wen-bo1, LI Chun-qing2, REN Shu-xia2
(School of Computer Science and Software Technology, Tianjin Polytechnic University, Tianjin, China, 300387)
Membrane flux prediction is one of the most important topics in wastewater treatment research. Membrane fouling is a direct result of membrane flux decline. Because traditional BP neural network has its own local minimum in predicting the MBR membrane flux and the generalization ability of the model is poor, in this paper, we use AdaBoost algorithm to optimize the traditional BP neural network and establish the AdaBoost-BP prediction model, then apply this model to predict the MBR membrane flux. By comparing the predicted results and experimental results, we can obtain that the model is feasible .At the same time, it is compared with the ordinary BP model, and the results show that the AdaBoost-BP prediction model has higher prediction accuracy.
MBR; Membrane flux; AdaBoost-BP; BP neural network
TP389.1
A
10.3969/j.issn.1003-6970.2016.12.005
受国家自然科学基金项目(51378350);国家自然科学基金项目(50808130)资助
胡文博(1992-),男,硕士生,主要研究方向:MBR计算机模拟仿真,大数据与云计算。
李春青,博士,教授,主要研究方向:MBR计算机模拟仿真,大数据与云计算;任淑霞,女,博士,副教授,主要研究方向:3D片网,大数据分析,大数据可视化数据挖掘。