MBR 中膜污染的人工神经网络预测研究进展

2022-07-26 05:39张浩良洪乾坤王侃鸣王红宇
工业水处理 2022年7期
关键词:混合液人工神经网络通量

张浩良,刘 聪,洪乾坤,王侃鸣,王红宇

(浙江工业大学环境学院,浙江杭州 310014)

膜生物反应器(Membrane bioreactor,MBR)是一种将活性污泥法与膜分离技术相结合的废水处理技术,具有出水水质好、负荷高和占地面积小等优点〔1-2〕。目前,大型(10 000 m3/d)和超大型(100 000 m3/d)MBR 污水处理厂在包括中国、美国和欧洲等世界各地相继建成并投入使用。据预测,中国的大型MBR 污水处理厂将超过300 座,总污水处理规模可达1 500 万t/d〔2〕。但是,膜污染会导致跨膜压差(Transmembrane pressure,TMP)的上升和膜通量的下降,增加MBR 的运行成本,成为限制MBR 广泛应用的瓶颈性问题〔3〕。

机器学习(Machine learning,ML)是一种基于以往经验或数据进行分类与回归的技术,不仅被运用于农业、气候、安全、教育、医学等行业〔4〕,也被广泛运用于污水处理领域。人工神经网络(Artificial neural network,ANN)作为一种机器学习模型,不仅具有参数少、预测性能好、泛化能力强等优点〔5〕,而且具有极强的非线性映射能力、学习能力和黑箱建模能力。因此,应用ANN 模型进行膜污染预测无需考虑复杂的膜污染中间过程,只需考虑与膜污染相关的指标即可。石宝强等〔6〕早在2006 年就综述了ANN 在MBR 膜污染预测中的应用研究,但是随着对MBR 膜污染机理的深入研究和ANN 模型理论与技术的发展,亟需新的综述对近年来的研究进行总结。而F. SCHMITT 等〔7-8〕虽然综述了人工智能用于预测膜污染的研究,但是欠缺对传统数学模型与神经网络模型差异的深入分析。基于此,笔者简述了影响膜污染的因素,对比了传统数学模型与人工神经网络模型的差异与优劣,总结了近年来ANN 模型在膜污染预测中的应用及优缺点,并对其未来的发展进行了展望。

1 膜污染的影响因素

膜材料、反应器操作条件和污泥混合液特性是与膜污染密切相关的主要因素〔9〕,其涉及到的具体参数见图1。

图1 影响膜污染的参数Fig.1 Parameters affecting membrane fouling

由图1 可知,膜污染的影响因素众多且相互影响,因此很难厘清各自的具体作用。例如,进水水质、污泥停留时间(Sludge retention time,SRT)和水力停留时间(Hydraulic retention time,HRT)等操作条件的改变不仅会直接影响膜污染,而且会导致污泥混合液特性发生变化,进而改变膜污染速率〔10〕。

早期研究人员建立了关于操作条件、膜通量、过滤滤阻等参数的数学模型〔11-15〕。此后,有研究建立了表达污泥混合液特性〔例如混合液悬浮固体浓度(Mixed liquid suspend solids,MLSS)、颗粒粒径(Particle size distribution,PSD)、溶 解 性 微 生 物 产 物(Soluble microbial products,SMP)等〕与膜污染关系的数学模型〔16-18〕。但是,这些传统的数学模型一般为指数式经验模型,往往需要通过诸多假设来简化计算,且各参数物理意义不明确,存在预测精度低和通用性差等问题〔6-7〕。因此,开发能够更加精准预测膜污染的模型对膜污染控制及其机理研究有重要意义。

膜污染模型的构建需要选择合适的影响因子作为输入变量,并寻找变量与膜污染之间的关系。因此,厘清各膜污染因素之间的相互作用及其对膜污染的影响是构建膜污染预测模型的前提条件。

1.1 膜材料性质

膜材料的性质包括膜的材质、亲疏水性和粗糙程度等〔19〕,这些性质均会对污染物在膜表面的迁移转化产生显著影响,进而影响膜污染。例如,Y.JEONG 等〔20〕比较了Al2O3陶瓷膜与聚偏氟乙烯(Polyvinylidene fluoride,PVDF)膜污染状况,结果发现陶瓷膜具有更低的膜污染速率。膜的亲疏水性也与膜污染密切相关,大量研究通过表面改性和共混改性法提高了膜表面的亲水性能,从而减缓了膜污染〔21〕。此外,膜表面粗糙程度也与膜污染有关,例如有学者发现粗糙的膜表面有利于胶体颗粒在膜上的积聚,引发膜孔堵塞,从而导致严重的膜污染〔19〕。

1.2 操作参数

不同的MBR 系统操作条件也会影响膜污染,主要包括进水水质、运行温度、SRT、HRT、错流流速和曝气强度等。SRT 与HRT 是影响MBR 处理效能、污泥混合液特性和膜污染的重要因素。一般认为SRT的增加会降低污泥活性和絮体大小,此外较长的SRT 促进了内源性衰变和细胞裂解,导致SMP 的增加〔22〕。例 如,在 厌 氧MBR 的 研 究 中,Zhi HUANG等〔23〕比较了不同SRT(30 d、60 d、∞)对膜污染的影响,结果表明在较长的SRT 下厌氧MBR 中会积累较多的蛋白质与多糖,MLSS 增加,从而增加了膜污染速率。对于HRT 而言,较短的HRT 会导致有机负荷的增加,从而导致微生物分泌更多的胞外聚合物(Extracellular polymeric substances,EPS)和SMP,从而提升膜污染速率。例如,N. FALLAH 等〔24〕比较了不同HRT 对膜污染的影响,结果表明随着HRT 的降低,EPS 和SMP 显著增加,污泥混合液的黏度也显著增加,导致了较高的膜污染速率。此外,通过在膜表面增加错流流速和曝气强度等物理剪切方式,减少颗粒物在膜表面的沉积也是减缓膜污染的常见方法。Yingyu AN 等〔25〕在厌氧MBR 中发现,一定范围内增加含甲烷生物气曝气强度能够减缓膜污染,但是过高的曝气强度会破坏污泥絮体,导致污泥颗粒平均粒径降低,从而更易形成致密的膜污染层,同时膜污染速率也会提高。

1.3 污泥混合液特性

对膜污染存在影响的污泥混合液特性主要包括MLSS、EPS 和SMP 等。尽管MLSS 并不是 影 响膜污染的主要因素,但是过高的MLSS(>15 g/L)会增加混合液的黏度,导致膜污染速率的提高,过低的MLSS(<6 g/L)则会降低SRT 并增加食物微生物比率,同样导致较高的膜污染速率〔26〕。EPS 和SMP 主要是由微生物生长代谢和衰败过程中所释放的蛋白质、多糖、核酸、脂类物质以及腐殖酸等有机物组成,其也被证明与膜污染密切相关,有研究表明EPS 中多糖和蛋白质的含量与膜污染速率呈正相关关系〔27〕。此外,SMP 不仅可以吸附在膜表面,而且可以堵塞膜孔,从而降低膜面积并提高膜污染速率。

2 膜污染预测模型的相关研究

2.1 经典数学模型

在过去几十年里,研究人员相继构建了表达污泥混合液特性和运行条件等与膜污染关系的经验公式,并建立了经典数学模型,其部分代表性成果见表1。

取生产系统中除铁后液,将酸化后的氧化铋倒入除铁后液中,并进行搅拌,搅拌30 min左右,此时溶液呈酸性,为降低铋的损失,考察终点pH值对铋的损失的影响,进行了不同终点pH值的试验,其结果见表3。

表1 几种经典预测膜污染数学模型Table 1 Several classical mathematical models for predicting membrane fouling

经典串联阻力模型是一种使用达西定律来描述不同膜污染层的过滤滤阻模型,数十年来被广泛用于膜通量的预测〔11〕。基于该模型,B. TANSEL 等〔12〕构建了通量模型,在死端过滤与错流过滤初期成功地预测了通量下降到60%所需的时间。S. CHANG等〔13〕结合达西定律与Hagen-Poisenille 公式〔14〕构建了膜纤维半径与膜通量关系的模型,描述了中空纤维膜中的膜污染情况。J. HERMIA 等〔15〕基于膜通量下降的孔隙阻塞机制,根据膜孔堵塞情况选取不同n 值(n=0,1,1.5,2),建立了通量预测模型以解释膜通量与膜污染间的关系。

研究人员还构建了污泥混合液特性与膜污染间的数学模型。例如M.F.R.ZUTHI 等〔16〕以滤饼层模型与阻塞模型为基础,构建了SMP 与膜污染间的半经验数学模型,对TMP 的变化进行了精准的预测。T.SATO等〔17〕建立了MLSS、COD 与过滤滤阻之间的关系公式,其预测误差为±24%。此外,Fangang MENG 等〔18〕基于MLSS、PSD 和EPS,构建了膜污染预测模型,用以阐明污泥混合液特性与膜污染的关系。

尽管经典数学模型在膜污染预测方面取得了一定的成果,但是膜污染是一个受进水特性、微生物活动、过滤模式等多因素影响的复杂动态过程,这些经典数学模型往往为了简化仅考虑部分影响因素或在建立模型过程中设置诸多假设,例如,基于串联阻力定律的预测模型虽然有广泛的应用,但并没有考虑生物膜的生长和不可逆污染物的形成等作用对膜污染的影响〔28〕,因而在实际应用中不可避免会存在一定的误差。

2.2 机器学习常见算法

机器学习能从大量历史数据中挖掘其隐藏的规律,并做出分类或回归预测。机器学习常见算法及优缺点见表2〔29-33〕。

表2 机器学习常见算法及优缺点Table 2 Typical machine learning algorithms and their advantages and disadvantages

由表2 可知,机器学习能够弥补传统的数学模型预测精度低、实际应用效果差等缺点〔29-33〕。目前机器学习已被运用到MBR 膜污染的研究中,不少学者使用随机森林、SVM 和多元回归等来建立与膜污染相关的预测模型。随机森林是一种以决策树为基学习器的集成算法,李威威等〔31〕采用随机森林算法预测膜通量,通过模型计算得到的预测值与真实值的平均误差仅3.98%。SVM 具有的核函数可以解决非线性问题,梁楷〔32〕基于SVM 建立的膜污染预测模型有效地预测了膜通量,平均误差仅为2.63%。多元回归能选取自变量的最优组合共同预测因变量,Zhan WANG 等〔33〕通过多元回归建立了化学清洗模型,通过模型预测通量恢复率,对减缓膜污染起到了指导性作用。尽管以上机器学习算法能够在膜污染预测方面获得较高的预测精度,但是仍然存在一定的局限性,例如,虽然随机森林对数据集的适应能力很强并具有较快的运算速度,但其往往忽略数据集之间的相关性,导致预测精度下降。

鉴于膜污染过程的复杂性和非线性,简单的机器学习只能粗略表示变量之间的关系,无法取得较高的预测精度。近年来,由于ANN 能够通过学习非线性的复杂关系来构建数学模型,并且具有较强的泛化能力,对未知数据具有较好的预测效果,因此,部分学者逐渐将其应用于膜污染的预测。对Web of Science 上2006 年至2020 年运用ANN 算法研究膜污染的文献数量进行统计,结果见图2。

由图2 可知,从2016 年开始,关于ANN 在膜污染方面研究的文献数量迅速增加,可见ANN 已经成为研究膜污染预测及控制的重要工具。

图2 2006—2020 年Web of Science 上ANN-膜污染文献数量Fig.2 Numbers of ANN-membrane fouling papers on Web of Science(2006—2020)

2.3 人工神经网络算法

图3 ANN 简单拓扑图Fig.3 ANN simple topology diagram

如图3 所示,ANN 信息处理功能的实现主要依靠神经节点的输入输出、神经元的阈值及连接权值大小的调整。ANN 的预测性能可以通过均方根误差(Root mean square error,RMSE)、决定系数R2、相对误差Error 等参数来评估,其计算分别见公式(1)~(3)。

公式(1)~(3)中,yt(i)、y(i)分别表示第i 个预测和输出值,y 表示所有n 个数据所预测的平均值。RMSE 被用来衡量模型预测值与真实值的偏离程度,其值越接近于0 则表示预测值越接近真实值,决定系数R2越接近于1 则表示模型的拟合效果越好。

人工神经网络在MBR 的应用中具有诸多功能,其中一种功能是对MBR 中水质进行预测。例如,Yuhang CAI 等〔34〕运用小波神经网络(Wavelet neural networks,WNN)对船舶废水COD 与氨氮去除率进行模拟,其R2分别为0.999 与0.997,可为反应器的运行与调控提供良好的参考。此外,A.R.PENDASHTEH 等〔35〕成功构建了一种处理含油高盐废水的水质预测模型,采用该模型对水质进行预测,结果表明,废水中COD、总有机碳(Total organic carbon,TOC)和油脂的预测值与真实值较为接近,R2达到0.982。

ANN 预测模型的另一个功能是预测膜污染并运用敏感性分析来识别影响膜污染的关键因素。例如A. R. ALKMIM 等〔36〕运 用 多 层 感 知 器 神 经 网 络(Mutilayer perception neural networks,MLPNN)对膜透水率进行预测,R2可以达到0.964,且计算得出混合液挥发性悬浮固体浓度(Mixed liquid volatile suspended solids,MLVSS)对膜透水率的变化贡献最大。H. HAZRATI 等〔37〕利 用 反 向 传 播 神 经 网 络(Back propagation neural networks,BPNN)模型对TMP 进行预测,其R2=0.999,且发现MLSS、HRT 和运行时间3 个变量均对TMP 具有较大的影响。

2.4 人工神经网络算法的分类及在膜污染中的应用

对图2 所统计的运用ANN 算法研究膜污染的文献进行分类并统计,结果见图4。

图4(a)根据不同用法将ANN 算法划分为简单人工神经网络、结合优化算法的神经网络和深度学习神经网络(Deep learning neural networks,DLNN)3 类。图4(b)展示了不同神经网络文献占比。由图4(b)可知,在统计的82 篇文献中,82.93%的研究采用简单神经网络构建输入变量与目标参数的模型,另有13.41%的研究采用了结合优化算法的神经网络,而基于深度学习神经网络的研究所占比例较小,不到5%。

笔者汇总了2016—2020 年在MBR 中运用不同人工神经网络算法模拟膜污染的部分研究〔36-43〕,结果见表3。

图4 人工神经网络分类及占比Fig.4 Classification and percentage of artificial neural network

目前在MBR 膜污染预测中常用的简单人工神经网络主要有MLPNN、BPNN 和径向基函数神经网络(Radical basis function neural networks,RBFNN)等。这些简单神经网络均包括输入层、隐藏层、输出层,但是又各具特点。MLPNN 的不同层之间采用全连接的方式传递结果;BPNN 的输出结构采用前向传播方式,误差采用反向传播方式进行;RBFNN 则采用径向基函数作为激活函数,它的输出是输入的径向基函数和神经元参数的线性组合。大量研究证明基于简单ANN 的预测模型具有较高的预测精度,例 如F. SCHMITT 等〔39〕在AO-MBR 中 利 用MLPNN预测TMP,并构建进水水质(总氮、总磷、硝酸盐)与TMP 的模型关系,其R2为0.850。尽管简单人工神经网络在膜污染预测方面具有较高的精度,但是仍存在拟合时间长、参数众多且无法解决某些最优化问题等缺点。

表3 2016—2020 年ANNs 在膜生物反应器膜污染模拟的应用Table 3 Application of ANNs in membrane fouling simulation of membrane bioreactor(2016—2020)

在简单神经网络基础上结合优化算法,能够通过改善训练方式来最小/最大化损失函数,具有加快神经网络训练速度、快速寻找参数最优值以及提高模型预测精度等优点。应用于膜污染预测的常见优化算法包括遗传算法(Genetic algorithm,GA)和粒子群算法(Particle swarm optimization,PSO)等。其中,GA 是基于生物体进化规律模型化问题的求解过程,具有优越的优化性能,被广泛运用于机器学习和信号 处 理 等 领 域〔44〕。S. A. MIRBAGHERI 等〔45〕采 用MLPNN 预测TMP 及膜透水率,并用GA 算法对权值进行优化,结果证实优化后的模型具有更高的预测精度。PSO 则是一种基于智能体的仿生优化算法,在求解全局最优解方面具有较大的优势,可以完成神经网络连接权值的训练、结构设计和特征选择等。刘志峰等〔46〕研究了一种PSO-BPNN,用粒子群算法代替传统的梯度下降算法,结果表明优化后的模型具有更高的预测准确度,平均误差从2.35%下降至0.83%。但是,结合优化算法模型的建立与参数优化过程需要耗费大量的时间,限制了其的广泛应用。

此外,简单ANN 和结合优化算法的ANN 的预测性能高度依赖于样本量,并且在训练过程中往往会陷入局部最优状态,从而导致模型的预测稳定性较差。近年来,DLNN 由于能够有效弥补简单ANN和结合优化算法ANN 的不足,并挖掘数据的深度信息而被广泛研究,其主要包括深度置信网络(Deep belief network,DBN)、卷积神经网络(Convolutional neural networks,CNN)、堆叠式自动编码器(Stacked auto-encoders,SAE)网络等。通常,DLNN 是一种可以有效而灵活地表达高度变化的非线性的算法,具有强大的学习能力和非线性映射能力〔47〕。Honggui HAN 等〔43〕开发了一种基于自组织深度置信网络(Self-organizing deep belief network,SDBN)的膜透水率的预测方法,这种方法可以通过调整模型结构及参数提高模型预测精度,与简单ANN 相比,该模型具有更高的精度(RMSE 为0.872)。在一些情况下,深度神经网络的预测效果可能比结合优化算法的ANN 更佳。Shuai SHI 等〔48〕基于堆叠降噪 自动编码器(Stacked denoising auto-encoders,SDAE)深度学习神经网络建立了MBR 的性能预测模型,结果发现与GA-BPNN 模型相比,其具有更高的R2及更低的均方误差(Mean square error,MSE)。尽管深度学习神经网络具有更高的预测精度,但是目前使用深度神经网络在MBR 中进行建模的研究相对较少,其原因可能是一方面深度学习神经网络的复杂性较高,模型构建的时间远超简单ANN,另一方面使用简单ANN 已经可以满足大多数的研究任务。

综上所述,目前在MBR 膜污染预测模型中,简单神经网络因高预测精度与高效性,在短时间内仍然是研究人员运用的主流工具。但是,随着优化算法的运用以及深度神经网络的开发,结合优化算法的ANN 与深度学习ANN 在面对更复杂环境下更具优势,有望替代简单神经网络成为未来研究膜污染预测模型的主要工具。

2.5 ANN 在中试MBR 膜污染预测中的应用

虽然研究已经证实ANN 在MBR 膜污染预测上具有较高的性能,但是由于技术设备规模与废水特性的差异,实验室小试规模反应器的操作参数往往与实际的大规模反应器有明显的区别,因此,推动ANN 在中试规模MBR 膜污染中的预测研究意义重大。Y. J. CHOI 等〔49〕收集了中试规模的浸没式MBR的长期运行数据,并构建了膜化学清洗后的通量、膜过滤时间及进水水质与膜透水率间的ANN 模型,该模型R2可达0.950,实现了在中试规模下对MBR 膜污染的精准预测。尽管如此,目前相关研究仍大多停留于小试阶段,在针对实际废水的中试MBR 以及污水处理厂中应用依然较少。因此亟需根据中试及实际污水处理厂长期运行的数据建立ANN 膜污染预测模型,从而更加精准地预测实际污水处理中MBR 的膜污染状况。

3 结论与展望

目前,膜污染仍然是阻碍MBR 广泛应用的瓶颈性问题,近年来,ANN 模型因变量简单、预测精度高等优点被用于MBR 膜污染的预测。但是研究表明,ANN 模型用于MBR 膜污染预测研究仍存在以下缺陷,是未来研究的重要方向:

(1)ANN 本质上属于“黑箱”模型,目前由于神经网络结构的特殊性难以对中间过程进行解释。因此,未来的研究可以侧重于通过解析神经网络的复杂结构来厘清影响因子对膜污染的具体作用。

(2)ANN 模型存在权值多、建模过程长等缺陷。因此未来膜污染预测模型的发展趋势是优先使用更多优化的线性和非线性数据分析方法对数据进行降维或特征提取,从而减少数据的复杂程度,进而提高模型预测的精度并减少建模时间。

(3)目前ANN 模型应用于中试和工业化规模的MBR 膜污染预测较少,亟需基于长期实际运行的数据建立ANN 膜污染预测模型,构建完备的预测体系,为调整污水处理厂运行操作条件提供技术支持,进而提高其运行效率、减缓膜污染并降低污水处理成本。

猜你喜欢
混合液人工神经网络通量
月季生态培育方法新尝试
渤海湾连片开发对湾内水沙通量的影响研究
冬小麦田N2O通量研究
重庆山地通量观测及其不同时间尺度变化特征分析
垃圾渗滤液处理调试期间NF膜通量下降原因及优化
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
基于改进人工神经网络的航天器电信号分类方法
胆汁胰液混合液溶解颈动脉粥样硬化斑块的体外实验研究
基于人工神经网络的经济预测模型