面向污水处理的数据驱动故障诊断及预测方法综述*
黄道平邱禹†刘乙奇李艳
(华南理工大学 自动化科学与工程学院, 广东 广州 510640)
摘要:在污水处理过程中,存在着强非线性、多变量耦合、参数时变、大滞后、内外干扰频繁等问题,因此如何及时发现系统的异常从而保证过程设备的可靠性和稳定性显得尤为重要.文中根据污水生化处理的特点,综述了基于数据驱动的故障诊断方法在污水处理领域的研究现状、存在的问题以及解决方案,探讨了故障预测在污水处理中的研究前景,指出了基于数据驱动的故障诊断方法研究在污水处理中存在的问题和未来的发展方向.
关键词:污水处理;故障诊断;故障预测;数据驱动方法
中图分类号:TP277
doi:10.3969/j.issn.1000-565X.2015.03.017
文章编号:1000-565X(2015)03-0130-07
收稿日期:2014-09-23
基金项目:* 国家水体污染控制与治理科技重大专项(2014ZX07406002)
作者简介:张彦灼(1987-),男,博士生,主要从事污水处理理论与技术研究. E-mail: 83995983@qq.com
文章编号:1000-565X(2015)03-0121-09
收稿日期:2014-05-06
基金项目:* 现代农业产业技术体系建设专项(nycytx-49-13);清华大学水沙科学与水利水电工程国家重点实验室开放研究基金资助项目(sklhse-2013-B-02);国家自然科学基金资助项目(50979118);华南理工大学中央高校基本科研业务费专项资金资助项目(2013ZZ0027)
作者简介:程香菊(1974-),女,博士,教授,主要从事湖泊、水库、河流、河口、水产养殖池塘等的水力与水环境相关研究. E-mail: chengxiangju@scut.edu.cn
污水处理过程是一个外界干扰强烈、时变性强、耦合性强、非线性的复杂动态生物化学过程,因此控制系统的可靠性和稳定性显得尤其重要.为确保过程运行状况满足规定的运行指标,设计合理的过程控制器(如比例-积分-微分(PID)控制器等)来补偿过程中产生的干扰或变化的影响成为了一种常用的手段,但对于过程中出现的很多异常变化(故障),控制器往往无能为力.Isermann等[1]根据IFACSAFEPROCESS技术委员会的讨论将故障定义为至少一个系统特征或者变量出现了不被允许的偏差.关于故障的类型,一直都有不同的分法,Frank[2]从故障诊断的角度将故障分为3类:执行器故障、元件故障和传感器故障.而Kesavan等[3]将基于模型的多变量控制系统产生的故障分为:过程参数的变化、干扰参数的变化、执行机构和传感器的问题以及执行器的饱和.无论哪种分法,都是基于故障产生的机理原因所作出的结论.由于污水处理系统的工作连续性和不可替代性,一旦发生故障,就会造成严重影响.如福建紫金矿业所属的紫金山铜矿湿法厂污水池于2010年7月因防渗膜垫层被撕裂发生酸性含铜污水渗漏事故,造成大量污水外渗引发汀江流域污染,直接赔偿金额高达2270万元,间接经济损失近4亿元;2013年1月大连市污水处理厂水下处污设备运行时出现故障,造成大连市30万人的生活污水无法得到及时处理,损失和影响甚大.因此,确保污水处理过程中所产生的故障能够得到及时地发现与处理,最大程度地减少故障带来的消极影响,故障诊断是必不可少的一环.
污水处理的最终目的是使净化后的出水水质满足规定指标,为此,需要在污水处理的过程中测量一大类参数,以用于水质的监控,与此同时,产生并存储着大量的过程数据,这些数据隐含着工艺变动和设备运行等信息,如何有效利用这些离线和在线数据来提高系统可靠性成为了亟待解决的问题,也正因此,基于数据驱动的故障诊断方法体现了其独特的优越性.
文中首先简单总结了故障诊断的方法与分类,然后综述了基于数据驱动的故障诊断方法在污水生化处理过程的研究现状,以及存在的问题和相应的解决方案;最后,文中还简述和探讨了故障诊断的扩展领域——故障预测在污水处理中的研究前景,并指出了数据驱动故障诊断方法研究在污水处理中存在的问题和未来的发展方向.
1故障诊断方法与分类
故障诊断是对系统中出现的故障进行检测、分离和识别,包括种类、大小、位置和时间的测定[1].最早起源于采用硬件冗余方法的人工诊断.1971年,Beard[4]和Mehra等[5]率先提出通过比较观测器的输出得到系统故障信息的思想,标志着解析冗余故障诊断技术的开端.文中所提及的故障诊断技术都以此为主.
20世纪90年代,Frank[2]将故障诊断方法划分为三大类,分别是基于信号的方法、基于解析模型的方法和基于知识的方法,这是之前经典的归类与分法;周东华等[6]在此基础上,将故障诊断方法进一步细分.
但是近年来,随着故障诊断方法的理论研究不断深入,以及相关学科领域的发展,各种新理念的诊断方法层出不穷,之前的分类方法已经跟不上学科发展的脚步,因此有必要对现有的故障诊断方法进行重新认识.
国外的Venkatasubramanian等[7-9]基于先验知识的应用将故障诊断方法从整体上划分为三大类:基于定量模型的方法、基于定性模型的方法和基于过程历史数据的方法,如图1所示.这种分类方式涵盖了大多数故障诊断方法,也获得了业内的广泛认可.
图1 故障诊断方法分类 Fig.1 Classification of diagnostic methods
国内的周东华等[10]将故障诊断方法整体分为两大类:定性分析的方法和定量分析的方法,对现有的方法在此框架下进行了划分.但与Venkatasubramanian等[7-9]的分类方法在总体上大同小异.
尽管故障诊断方法繁多,但由于污水处理过程复杂,涉及了生化反应、物理化学反应、相变过程及物质和能量的转化和传递过程,从控制的角度分析,是一个典型的非线性、高维性、多变量、大滞后、非平稳的时变系统,各种水质参数之间存在强烈的耦合和关联,用单一的参数不可能描述其过程变化的规律.因此,需从宏观结构方面对污水处理的过程进行分析,以找寻适用的方法.其中,数据驱动方法和专家系统是两个很重要的方面,因为这两类方法都无需对系统的微观结构、知识进行详解,这对于具有微观知识不完备性的污水处理过程是合适的.但是,污水处理过程相较于其他工业过程起步较晚,相关经验也相对较少,应用专家系统存在诊断不确定性的风险,而数据驱动方法的有效性取决于数据本身,这对于数据比较充分的污水处理过程是适用的.因此,文中在分析了污水处理的过程特点的基础上,综述了基于数据驱动的故障诊断方法.
2基于数据驱动的故障诊断方法在污水处理中的研究现状2.1研究背景及描述
污水处理过程不仅涉及了机理复杂的生化反应,也涉及了众多的机械设备、电气设备、自动化仪表,是典型的复杂系统.图2所示为活性污泥处理工艺,主要包括了预处理、初沉、曝气、二沉和污泥回流5个部分,是一种利用在曝气池内悬浮、流动的微生物群体的凝聚、吸附、氧化分解等作用来去除污水中有机物的方法.原生污水通过预处理进入初沉池,经过初步沉淀后出水进入曝气池,在活性污泥的作用下进行好氧和厌氧生物降解,将污水中的有机物分解并进行脱氮除磷反应;曝气池的混合出水进入二沉池进行固液分离,上部澄清水排入受纳水体.活性污泥法会产生大量的污泥,其中一部分除了回流外,剩余污泥和初沉池的污泥混合,进行消化、脱水等处理.
图2 活性污泥污水处理流程 Fig.2 Activated sludge wastewater treatment process
为保证出水水质达到或优于排放标准,在每一部分处理工艺中都需要测量一大类难以测量或不易在线测量的参数,比如氨氮、磷酸盐、毒性物质浓度等,这些变量对于出水指标的控制以及过程的优化非常重要.对于这些变量,除了寻求新的测量方法外,在硬件层面上,对测量仪表的要求也越来越高.仪器越精密,结构也就越复杂,出现故障的概率也就越大.污水处理过程恶劣的工作环境更是加剧了故障发生的概率,其中最直接的影响是有些传感器或执行器经不起长期恶劣环境的考验,腐蚀、损坏严重,经常发生瘫痪状态,由此引起输出信号的偏差、冲击、漂移或输出恒定值等.除此之外,因用水量、天气等原因导致的进水水质和水量的波动,会对活性污泥造成冲击,出现异常现象,如污泥膨胀、污泥上涨以及泡沫等,这些异常现象会导致处理效果大打折扣.
以上所述种种问题的出现,会最终导致排水水质的恶化,影响污水处理厂的正常运行.因此,在污水处理运行过程中,需要对这些故障进行及时和准确的诊断,以防止因故障造成的损害扩大化.
2.2研究现状
污水处理过程是一种典型的复杂动态生物化学反应工程系统,具有非线性、时变性、随机性和不确定性等特点,对其难以建立精确的数学模型.由国际水协会(IWA)推出的活性污泥数学模型系列(如表1所示)较为经典,也应用广泛,但模型都存在很多理想化的假设,而且复杂,不适合实际应用[16].因此,通过解析模型对其进行故障诊断是不太实际的.而专家系统的建立需要依赖于知识库,而知识库中的知识的获取并不容易,知识的质量与数量都严重依赖于专家自身的经验知识,这就有可能造成诊断的不确定性[17].数据驱动方法建立在大量的数据基础上,这对于经验知识缺乏、数据比较充分的污水处理过程而言,是比较适合的.
表1国际水协会模型Table1ModelfromIAW
模型年份文献ASM11986[11]ASM21995[12]ASM31999[13]模型年份文献BSM12001[14]BSM22007[14-15]
污水处理系统在运行过程中,为了保证出水水质达标,过程数据必须得到实时的监控,丰富的数据是数据驱动故障诊断方法的前提条件.文献[10]将数据驱动故障诊断方法定义为在不需知道系统精确解析模型的情况下对系统运行过程数据进行分析处理从而完成系统的故障诊断,并将方法分为机器学习类、多元统计分析类、信号处理类、信息融合类和粗糙集等多种类型;文献[18]将基于数据驱动的故障诊断方法分为统计分析、信号分析和定量知识三大类.虽然分类方法不一样,分类数目不尽相同,但都是基于无需对系统进行解析建模的情况下,利用系统运行过程中产生的数据进行故障诊断.目前在污水处理领域,数据驱动故障诊断方法的研究多以机器学习和多元统计为主,这主要是因为这两类方法相对而言,在算法上较为简便,能充分快速地利用数据内在的信息,这对于多故障频发及具有实时性检测要求的污水处理尤为适用,且其他数据驱动方法或多或少都以其为基础进行延伸,或者适用范围小,比如信息融合类方法,基于信息融合的故障诊断方法主要有决策层融合和特征层融合,其中决策层融合方法需要建立在经过不同方法得出的故障诊断结果上;而特征层融合诊断方法则是主要利用神经网络或支持向量机等机器学习算法对故障特征进行融合,进而用于诊断.
2.2.1机器学习
机器学习是人工智能领域的一个分支,是研究如何使机器获得类似于人类的学习能力,通过自学获取知识,不断改善性能,实现自我完善的方法.机器学习的核心在于学习,围绕着该核心,出现了很多优秀的学习算法,比如人工神经网络、遗传算法、贝叶斯、支持向量机等.基于机器学习的故障诊断方法的研究思路是利用系统在正常和各种故障情况下的历史数据训练机器学习算法,然后基于现场数据再区分正常数据和故障数据从而达到故障诊断的目的.在污水处理领域,主要以人工神经网络(ANN)和支持向量机(SVM)为主.
人工神经网络,简称为神经网络,是一种模拟人脑结构及其功能的信息处理系统,具有强大的非线性映射特征、良好的容错性与联想记忆特性、自适应自学习特性和高度并行处理及综合信息的特性,因此对于体现知识复杂性和微观认识不完备性的污水处理领域,ANN方法展现出了广阔的应用前景.
神经网络在故障诊断任务中所发挥的作用主要有:残差产生的神经网络方法、残差评估的神经网络方法、用神经网络进行模式分类的故障诊断推理和用神经元网络作自适应误差补偿[19].而具体到污水处理领域,相关研究工作多是集中于污水处理过程的模拟及控制[20]、对特定参数现象进行预测[21]、优化计算[22]和软测量[23]等,具体单纯专注于污水处理过程的故障诊断相对比较少.近年来,出现了很多将神经网络与其他方法相结合的故障诊断方法.文献[24]提出了一种故障检测与诊断方法,该方法结合了在线参数估计、BP神经网络和改进Hägglund算法.这种混合方法不仅鲁棒性高,而且应用到实际污水处理厂的检验结果显示出很好的可靠性.文献[25]建立了一种基于人工神经网络的故障诊断专家系统,结合了神经网络和专家系统的优点,不仅能很好地实现专家系统的基本功能,模仿人类专家的逻辑思维方式进行推理决策和问题求解,还具有神经网络所特有的学习能力、自适应能力、并行推理能力和联想记忆能力,在污水处理领域具有应用前景.
神经网络发展至今,尽管出现了很多算法和技术,但是都无法从根本上解决其自身的缺陷,这是因为神经网络属于模式识别方法的一种,而现有模式识别方法共同的重要理论基础之一是统计学,传统的统计学是以样本数目趋于无穷大时的渐进理论作为研究内容,在实际问题中,样本数是有限的,这样就会导致一些方法比如神经网络在实际表现中不尽如人意.此外,传统神经网络容易陷入局部极小值问题,而计算量较大也是不可回避的问题.与神经网络不同,支持向量机是建立在统计学习理论的VC维理论和结构风险最小化原理基础上的机器学习方法,它在解决小样本、非线性和高维情况具有优势.文献[26]介绍了支持向量机和人工神经网络的基本原理,并对二者进行了非线性函数逼近能力方面的比较,结果显示出支持向量机具有较强的逼近能力和较好的泛化能力;文献[27]通过对传统故障诊断方法原理的分析,提出了基于支持向量机的故障诊断方法,并通过一组实验验证了该方法的有效性.文献[28]针对污水处理厂运行时故障数据不平衡性和代价敏感等特点,通过构造风险泛函来改进支持向量机,并用遗传算法对风险泛函求全局最优,在故障数据分类率上具有优势.
2.2.2多元统计
多元统计是统计过程控制(SPC)[29-30]在现代过程工业中发展形成的一种方法,是相对单变量统计方法而言的,传统的单变量统计过程控制只考虑单一变量的变化,不涉及多个变量之间的相互关系,它采用典型的控制图,比如Shewwhart图或其改进图法,对单一变量进行监控.在早期的控制系统,由于系统结构简单,功能单一,需要监控的变量少,因此这种方法是可行的,但是随着系统的大型化、复杂化,这种单变量统计方法在面对有上百个监控变量的多变量系统时,结果就很不理想了,这是因为当一个故障在运行过程中发生时,多个单变量统计图几乎会同时响起警报,这种情况源自于过程变量之间存在的相关性.就污水生化处理工艺过程来看,从管网流入的污水经过预处理后,要在工艺构筑物内停留一段时间以进行工艺处理,在这段时间内,各过程参数存在事实上的相关性,因此,单变量统计方法在面对过程变量具有很强相关性的污水生化处理系统时,往往无能为力,它仅适用于监控某一采样时刻某一个过程变量的情况.而多元统计方法能很好地解决这个问题[31].多元统计是研究多个随机变量之间相互依赖关系以及内在统计规律性的学科.基于多元统计分析的故障诊断方法是利用过程多个变量之间的相关性对过程进行故障诊断[10].这类方法是利用多元投影方法将过程多变量高维数据投影到相对独立的低维空间,然后在低维空间中构造能够反映空间变化的统计量对数据进行分析.比如主元分析法(PCA)[32-35],偏最小二乘法(PLS)[36]和独立成分分析法(ICA)[37-38]等,这些多元投影方法在污水生化处理领域得到了很好的研究.它们将原始历史数据投影到能够准确表征过程状态的低维空间,结合相应的统计量进行故障检测,比如T2统计量、Q统计量、I2统计量等,文献[39]给出了用于故障检测已有的统计量的统一表达式.
传统的PCA与ICA方法都隐含假设观察数据是在统计独立,即不考虑数据中序列相关性的前提下对数据进行分解降维,属于静态方法.在实际的工业过程中,这种假设只对长采样间隔有效(比如2~12h)[40].而对于大部分污水处理过程,采样间隔较短,这间接表明需要一种考虑到数据中序列相关性的方法,所以出现了动态主元分析法(DPCA)[41]和动态独立成分分析法(DICA)[42-43].此外,PCA方法是建立在观测数据遵循高斯分布的前提下,且与之相关的统计量Hotelling’sT2和SPE图表的阈值也是基于潜在变量遵循高斯分布的假设而开发,而ICA方法并没有这种限制条件;由于在污水生化处理过程中,故障源多具有非高斯特性,因此在过程监控中,ICA方法更具有优势.但是基于ICA模型的过程监控方法存在提取独立元数目不确定及排序等缺点,文献[44]提出了一种改良独立成分分析法(MICA),该方法优化了ICA算法,避免了因提取独立元过多导致的计算负荷过重的情况,考虑了提取独立元的次序以及给出了算法统一的解决方案,但该方法并没有进一步研究如何确定独立元的数量以及存在故障识别能力不足的问题.
但是,无论如何,上述所提及的方法或其衍生方法都属于线性降维技术,忽略了过程数据中可能存在的非线性,鉴于污水处理的强非线性特性,采用以上方法是值得商榷的.在多元统计方法中,为解决观察数据的非线性问题,出现了大量的研究文献;具体到污水处理领域,文献[45]将神经网络与PCA整合,利用神经网络拟合过程的非线性与动态特性,然后用PCA进行故障检测与分离,并与传统PCA方法进行了比较,取得了不错的效果.除此之外,近年来,基于核理论方法的研究越来越多地出现在非线性化工过程中,比如核主元分析法(KPCA)[46-47],核偏最小二乘法(KPLS)[47]和核独立成分分析法(KICA)[48-49]等基于核的非线性降维技术都有被应用到非线性过程监控和故障检测中.在污水生化处理领域,文献[50]将KPCA应用到序批式反应器(SBR)工艺污水处理过程的故障诊断中;文献[51]提出了一种用于非线性动态过程监控的动态核主元分析法(DKPCA),并与PCA、DPCA、KPCA在误报、错报率和检测延迟上进行了比较.文献[52]基于文献[53]中的KernelICA方法开发了一种故障检测方法,用于监控暴雨与下雨情况下污水处理过程中来自外界的干扰,与基于ICA、KICA方法的故障检测相比,在效率、可靠性和准确度方面更有优势;文献[54]整合了KICA与支持向量机,结合了文献[55]与文献[44]中的方法,改进了KICA算法,通过提取反映非线性过程全部信息的主要成分,避免了计算量过大的情况,并利用SVM,解决了因非线性映射函数未知导致的KICA无法对非线性过程进行故障诊断的问题,成功应用到了污水处理过程中,但没有明确解决确定独立元数量的问题.
在模式分类文献中,存在一种广泛研究的降维技术——费舍尔判别分析(FDA).FDA是一种线性降维技术,就故障诊断而言,首先从发生故障的设备采集数据,然后将数据进行分类,每一类包含有表示某一个特定故障的数据;即使数据在原空间已很好地被分类,但在投影至低维空间时,也有可能会发生严重的重叠现象,FDA在降维的同时,能最大程度地分离各个类,在这点是最优的.
基于FDA的故障诊断方法是对故障发生期间所收集的数据进行降维,在降维的过程中,实现了各个故障类数据之间最大程度地分离,然后应用模式分类系统中的判别函数对降维后的数据进行最大值选择、分类,实现故障的诊断.给定一训练集,有n个观测值,m个过程变量,写成如式(1)的形式:
(1)
定义p为故障类的个数,nj是第j类中观测值的个数,xi为第i个观测值的测量变量向量.根据FDA方法的概念,在降维的同时实现各个类的最大分离,定义数据类间离散度矩阵Sb、数据类内离散度矩阵Sw和总离散度矩阵St.Sb、Sw、St之间的关系有
St=Sb+Sw
(2)
利用Sb、Sw和St可确定一系列线性变换向量,这些向量按照最大化类间离散度、同时最小化类内离散度的准则进行排列,并作为列定义矩阵Wp∈Rma .这样从m维原始空间到a维投影空间(a (3) 与PCA方法相比,FDA在确定更低维度的表达式时,考虑了各类之间的信息,这样判别函数使用类信息的程度比PCA使用类信息的程度大得多,因此,在多类别的故障诊断方面FDA方法比PCA更具优势[56].但是,该方法需要针对各种故障分类数据,这对于多层次、多尺度、多范围的污水处理系统不是那么容易满足. FDA在模式分类文献中,已经研究得很成熟了,但是在化工过程数据的分析上,直至近几年才逐渐开展[57-59],而具体到与污水处理紧密结合的例子,还鲜有报道.文献[60]结合了PCA与FDA,用PCA进行故障检测,FDA用于故障诊断. 3故障预测在污水处理中的研究现状 故障预测是指根据所能获取的系统过去和现在的运行状态,预测故障发生的时间或者判断系统将来某个时刻是否会发生故障[10,61-62].与故障诊断的区别主要在于研究对象上,故障诊断研究的是已经发生的确定性事件,而故障预测的研究对象则是未知的不确定事件,因此,相对于故障诊断,故障预测所面临的挑战更大.目前,针对故障预测方法的研究虽进展缓慢,但也出现了不少成果[63-64],而具体到能与污水处理紧密结合的报道还不多见,相关的研究文献也寥寥无几. 故障预测在污水处理领域具有潜在的研究与应用价值.比如,目前污水处理领域主要采用污水生物处理法,其中又以活性污泥法为主或以其为基础,而在活性污泥法废水处理系统中,污泥膨胀一直是最常见又最难解决的异常问题之一.污泥膨胀是由丝状菌的过量增殖所引起的慢性变化过程现象,一旦发生,将导致污泥不易沉淀,影响污水处理效果.如果能在活性污泥发生变化之前,通过测定某些信号从而预知活性污泥的变化情况,就可以防止污泥膨胀给系统性能带来恶劣影响.目前,有关的研究还处于浅层地带.文献[65]提出一种污泥体积指数(SVI)预测装置,SVI能反映活性污泥的松散程度和凝聚、沉降性能,是量化污泥膨胀的一个重要指标.该装置基于分层径向基函数(HRBF)神经网络来预测污水处理过程中的SVI值,并采用扩展极端学习机(EELM)训练策略对HRBF权值进行训练.文献[66]根据污泥膨胀的复杂非线性及时变性特征,提出了一种改进型的模糊递归神经网络(HRFNN)来预测污泥体积指数的变化,通过在网络第三层加入了含有内部变量的反馈连接来实现输出信息的反馈,使得网络的学习能力得到了增强,能更充分地反映污水处理系统的动态特性.文献[67]在分析了污水处理过程特点的基础上,结合了文献[68]多路的概念和文献[69]非高斯的概念,提出了一种应用于周期性、连续污水生化处理过程的在线预测监控方法,该方法结合了多路独立主元分析法(MICA)和统计量I2、SPE,采用离、在线两种模型对污水生化处理过程进行故障检测和诊断.在传感器故障方面,为避免因故障导致的测量数据值的缺失或漂移而引起的误警报、误诊断,甚至更严重的损失,故障预测也是完全有必要且重要的.文献[70]提出了一种基于故障树分析的故障预测方法,该方法考虑了过程设备中特定传感器的无输出故障和输出不稳定故障的情况. 对系统安全性和可靠性要求的提高,以及相关领域理论的发展,会逐步促进故障预测在污水处理中的研究进展.由于故障预测能在识别早期故障征兆的基础上,预测将要发生的故障,以便能及时进行处理,从而减小故障的发生率,提高系统的运行效率,这对于具有工作连续性的污水处理系统而言是重要且必要的.因此,故障预测技术在污水处理领域具有很好的发展前景. 4总结与展望 文中在总结了故障诊断方法的基础上,对基于数据驱动的故障诊断方法在污水生化处理领域的研究现状进行了较全面的综述,并对故障预测在污水处理中的研究前景和现状进行了分析与介绍.故障诊断研究经过了几十年的发展,在理论和应用上都取得了大量的成果,但在污水处理领域,由于起步较晚以及污水处理系统的复杂性,研究主要集中在数据驱动方法上,而在已有成果中,对单故障诊断问题研究的较多,而对多故障诊断问题研究的较少;对线性化问题研究的较多,而对非线性问题研究的较少;此外,在故障诊断的鲁棒性、自适应性等问题上的研究也较为滞后,这些都有待于进一步的研究. 数据驱动故障诊断方法在污水处理中的研究还在不断完善和向前发展中,下面给出一些未来的研究方向: (1)在多变量耦合、强非线性、参数时变、大滞后、多扰动等情况下,如何处理故障诊断建模所用到的数据存在缺失值的问题,从而实现数据缺失等种种不确定因素下数据驱动故障诊断的模型的研究.污水处理是以过程变量为指标进行监控,产生并存储大量的过程数据,但因工作环境的恶劣、外在环境的影响及设备的耐用性、保养等问题,会时常导致测量数据的缺失,虽然基于数据驱动的方法比如PCA、PLS等在过程监控领域已经被广泛应用,但这些方法在数据缺失的情况下,很难达到原先的效果.因此,为解决此问题,相关研究工作也在着手进行,其中基于变分贝叶斯的方法为解决此类问题提供了一种可能性,比如变分主元分析法(VBPCA)、变分独立成分分析法(VBICA)等,已有相关文献报道,该类方法在处理含有缺失值的高维数据时,具有不错的结果,但多应用在数据重构和图像处理,在故障诊断方面还鲜有报道.因此,如何将此类方法进行拓展以应用在数据缺失环境的故障诊断中,是一个可行的研究方向.此外,基于FDA方法在故障诊断方面的优越性,如何对其进行处理使其能在数据缺失的情况下,发挥其原有或更胜者的效果也是一个值得期待的研究方向. (2)在基于数据驱动的故障诊断方法中,数据的可靠性决定了数据模型的可靠性,所以有必要进行适当的数据预处理,比如离群点处理、动态特性考量以及标准化等. (3)工艺的不同对基于数据驱动故障诊断方法提出了更高的要求.为适配不同的处理工艺,比如膜处理、人工湿地处理等有别于传统活性污泥法的工艺方法,对数据驱动故障诊断方法的深入研究是不可避免的. (4)基于数据驱动分布式故障诊断的研究.复杂系统的故障存在层次性、传播性、相关性和放射性等特点,一个故障源可能会引起链式反应,催生更多、更大的故障.这对于规模性大、系统构成复杂、各处理单元关联密切的污水处理系统更是如此.因此,采用各种相互独立的诊断系统,已经不能满足实际的诊断需求,全厂的分布式故障诊断方法,甚至可扩展至管网,这是未来污水处理系统故障诊断方法的一个可行的研究方向. (5)面向污水处理故障预测的研究.针对污水处理过程的数据驱动故障诊断方法的研究已经取得了不小的进展,但相比之下,故障预测方法的研究却显得非常不足,尤其是面向污水处理的故障预测方法的研究更少之又少.近几年出现的深度学习为故障预测的发展提供一种可能性.故障预测是根据系统过去和现在的运行状态,预测故障发生的时间或者判断系统将来是否会发生故障,因此需要对系统的状态指标进行监控,但有些状态指标,由于技术或经济上的原因,直接或连续地测量存在着一些问题,尤其在污水处理过程中,存在着多变量耦合、强非线性、参数时变、大滞后等特点,面对这些特点,传统传感器无法得到有效的应用,特别是存在一大类难以测量或不易在线测量的参数,如氨氮、磷酸盐、微生物浓度、毒性物质浓度等等,针对这个问题,软测量技术提供了一个很好的解决方案,因此,在故障预测中引入软测量技术是一个可行的方案.深度学习是指用于学习深层人工神经网络的一种机器学习方法,源于人工神经网络的研究.当前多数神经网络学习方法为浅层结构算法,比如反向传播算法(BP)等,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定的制约,深度学习可通过学习一种深层非线性网络结构,实现复杂函数的逼近,表征输入数据分布式表示,并展现强大的从少数样本集中学习数据集本质特征的能力,其实质是通过构建具有多隐层的机器学习模型来学习更有用的特征,从而最终提升分类或预测的准确性.所以,在软测量技术中引入深度学习,构建多步预测结构,从而深化故障预测的预处理工作是一个值得期待的研究方向. 参考文献: [1]IsermannR,BalléP.Trendsintheapplicationofmodel-basedfaultdetectionanddiagnosisoftechnicalprocesses[J].ControlEngineeringPractice,1997,5(5):709-719. [2]FrankPM.Analyticalandqualitativemodel-basedfaultdiagnosis—asurveyandsomenewresults[J].EuropeanJournalofControl,1996,2(1):6-28. [3]KesavanP,LeeJH.Diagnostictoolsformultivariablemodel-basedcontrolsystems[J].IndustrialandEngineeringChemistryResearch,1997,36(7):2725-2738. [4]BeardRV.Failureaccommodationinlinearsystemsthroughself-reorganization[D].Cambridge:MassachusettsInstituteofTechnology,1971. [5]MehraRK,PeschonJ.Aninnovationapproachtofaultdetectionanddiagnosisindynamicsystems[J].Automatica,1971,7(5):637-640. [6]周东华,王桂增.第五讲 故障诊断技术综述[J].化工自动化及仪表,1998,25(1):58-62. ZhouDong-hua,WangGui-zeng.Fifthlecture:faultdiagnosistechniques[J].ControlandInstrumentsinChemicalIndustry,1998,25(1):58-62. [7]VenkatasubramanianV,RengaswamyR,YinK,etal.AreviewofprocessfaultdetectionanddiagnosispartI:quantitativemodel-basedmethods[J].ComputersandChemicalEngineering,2003,27(3):293-311. [8]VenkatasubramanianV,RengaswamyR,KavuriSN.AreviewofprocessfaultdetectionanddiagnosispartII:qua-litativemodelsandsearchstrategies[J].ComputersandChemicalEngineering,2003,27(3):313-326. [9]VenkatasubramanianV,RengaswamyR,KavuriSN,etal.AreviewofprocessfaultdetectionanddiagnosispartIII:processhistorybasedmethods[J].ComputersandChemicalEngineering,2003,27(3):327-346. [10]周东华,胡艳艳.动态系统的故障诊断技术[J].自动化学报,2009,35(6):748-758. ZhouDong-hua,HuYan-yan.Faultdiagnosistechniquesfordynamicsystems[J].ActaAutomaticaSinica,2009,35(6):748-758. [11]InternalAssociationonWaterQuality.ActivatedsludgemodelNo.1,IAWCscientificandtechnicalreportNo.1[R].London:IAWQ,1987. [12]InternalAssociationonWaterQuality.ActivatedsludgemodelNo.2,scientificandtechnicalreportNo.3[R].London:IAWQ,1995. [13]GujerW,HenzeM,MinoT,etal.Activatedsludgemo-delNo.3[J].WaterScienceandTechnology,1999,39(1):183-193. [14]JeppssonU,PonsM-N,NopensI,etal.BenchmarksimulationmodelNo2:genaralprotocolandexploratorycasestudies[J].WaterScienceandTechnology,2007,56(8):67-78. [15]CorriouJean-Pierre,PonsMarie-No⊇lle.Modelpredictivecontrolofwastewatertreatmentplants:applicationtotheBSM1benchmark[J].ComputerAidedChemicalEngineering,2004,18(14):625-630. [16]李茹莹,季民,任智勇,等.活性污泥数学模型的研究应用进展与问题讨论[J].工业用水与废水,2002,33(4):4-6. LiRu-ying,JiMin,RenZhi-yong,etal.Approachestothedevelopmentandproblemsofresearchandapplicationofactivatedsludgemodel[J].IndustrialWaterandWastewater,2002,33(4):4-6. [17]王道平,冯振声,何海燕.故障诊断专家系统中不确定性问题[J].计算机工程与应用,1998,34(12):33-35. WangDao-ping,FengZhen-sheng,HeHai-yan.Theuncertaintyinfaultdiagnosticexpertsystem[J].Compu-terEngineeringandApplications,1998,34(12):33-35. [18]李晗,萧德云.基于数据驱动的故障诊断方法综述[J].控制与决策,2011,26(1):1-9,16. LiHan,XiaoDe-yun.Surveyondatadrivenfaultdiagnosismethods[J].ControlandDecision,2011,26(1):1-9,16. [19]闻新,周露.神经网络故障诊断技术的可实现性[J].导弹与航天运载技术,2000 (2):17-22. WenXin,ZhouLu.RealityforNNfaultdiagnosistechnology[J].MissilesandSpaceVehicles,2000 (2):17-22. [20]张文艺,钟梅英,蔡建安.活性污泥法系统人工神经网络模型[J].给水排水,2002,28(6):12-15. ZhangWen-yi,ZhongMei-ying,CaiJian-an.Modelingstudyofactivatedsludgeprocessbasedonartificialneuralnetwork[J].WaterandWastewaterEngineering,2002,28(6):12-15. [21]ZhuJiabao,ZurcherJim,RaoMing,etal.Anon-linewastewaterqualitypredicationsystembasedonatime-delayneuralnetwork[J].EngineeringApplicationsofArtificialIntelligence,1998,11(6):747-758. [22]KaramaA,BernardO,GouzéJL,etal.Hybridneuralmodellingofananaerobicdigesterwithrespecttobiolo-gicalconstraints[J].WaterScienceandTechnology,2001,43(7):1-8. [23]ZhaoLijie,ChaiTianyou.WastewaterBODforecastingmodelforoptimaloperationusingrobusttime-delayneuralnetwork[J].LectureNotesinComputerScience,2005,3498(III):1028-1033. [24]FuenteMJ,VegaP.Neuralnetworksappliedtofaultdetectionofabiotechnologicalprocess[J].EngineeringApplicationsofArtificialIntelligence,1999,12(5):569-584. [25]张杰,高宪军,姚劲勃,等.基于神经网络与专家系统的故障诊断技术[J].吉林大学学报:信息科学版,2009,27(3):319-323. ZhangJie,GaoXian-jun,YaoJing-bo,etal.Technologyofexpertsystembasedonneuralnetwork[J].JournalofJilinUniversity:InformationScienceEdition,2009,27(3):319-323. [26]艾娜,吴作伟,任江华.支持向量机与人工神经网络[J].山东理工大学学报:自然科学版,2005,19(5):45-49. AiNa,WuZuo-wei,RenJiang-hua.Supportvectormachineandartificialneuralnetwork[J].JournalofShandongUniversityofTechnology:NaturalScienceEdition,2005,19(5):45-49. [27]王华忠,张雪申,俞金寿.基于支持向量机的故障诊断方法[J].华东理工大学学报:自然科学版,2004,30(2):179-182. WangHua-zhong,ZhangXue-shen,YuJin-shou.Faultdiagnosisbasedonsupportvectormachine[J].JournalofEastChinaUniversityofScienceandTechnology:Natu-ralScienceEdition,2004,30(2):179-182. [28]李晓东,曾光明,蒋茹,等.改进支持向量机对污水处理厂运行状况的故障诊断[J].湖南大学学报:自然科学版,2007,34(12):68-71. LiXiao-dong,ZengGuang-ming,JiangRu,etal.FaultdiagnosisofWWTPbasedonimprovedsupportvectormachines[J].JournalofHunanUniversity:NaturalSciences,2007,34(12):68-71. [29]田学民,曹玉苹.统计过程控制的研究现状及展望[J].中国石油大学学报:自然科学版,2008,32(5):175-180. TianXue-min,CaoYu-ping.Situationandperspectivesofstatisticalprocesscontrol[J].JournalofChinaUniversityofPetroleum,2008,32(5):175-180. [30]郭振华.面向统计过程控制的成分提取技术研究与应用[D].武汉:华中科技大学机械科学与工程学院,2005. [31]MacGregorJF,KourtiT.Statisticalprocesscontrolofmultivariateprocesses[J].ControlEngineeringPractice,1995,3(3):403-414. [32]LiuYiqi,HuangDaoping,LiYan.AdaptivestatisticprocessmonitoringwithamodifiedPCA[C]∥Proceedingsof2011IEEEInternationalConferenceonComputerScienceandAutomationEngineering.Shanghai:IEEE,2011:713-716. [33]RuizM,SinG,BerjagaX,etal.Multivariateprincipalcomponentanalysisandcase-basedreasoningformonitoring,faultdetectionanddiagnosisinaWWTP[J].WaterScienceandTechnology,2011,64(8):1661-1667. [34]LeeDaeSung,VanrolleghemPA.Adaptiveconsensusprincipalcomponentanalysisforon-linebatchprocessmonitoring[J].EnvironmentalMonitoringandAssessment,2004,92(1/2/3):119-135. [35]LeeDaeSung,ParkJM,VanrolleghemPA.Adaptivemultiscaleprincipalcomponentanalysisforon-linemonitoringofasequencingbatchreactor[J].JournalofBiotechnology,2005,116(2):195-210. [36]LeeDaeSung,VanrolleghemPA,ParkJM.Parallelhybridmodelingmethodsforafull-scalecokeswastewatertreatmentplant[J].JournalofBiotechnology,2005,115(3):317-328. [37]LeeJong-Min,YooChangKyoo,LeeIn-Beum.Statisticalprocessmonitoringwithindependentcomponentanalysis[J].JournalofProcessControl,2004,14(5):467-485. [38]LeeJ-M,YooC-K,LeeIB.NewmonitoringtechniquewithanICAalgorithminthewastewatertreatmentprocesses[J].WaterScienceandTechnology,2003,47(12):49-56. [39]QinSJ.Statisticalprocessmonitoring:basicsandbeyond[J].JournalofChemometrics,2003,17(8/9):480-502. [40]蒋浩天,拉塞尔EL,布拉茨RD.工业系统的故障检测与诊断[M].段建民,译.北京:机械工业出版社,2003:48. [41]YooChangKyoo,ChoiSangWook,LeeIn-Beum.DynamicmonitoringmethodformultiscalefaultdetectionanddiagnosisinMSPC[J].IndustrialandEngineeringChemistryResearch,2002,41(17):4303-4317. [42]VillegasT,FuenteMJ,Sainz-PalmeroGI.Faultdiagnosisinawastewatertreatmentplantusingdynamicindependentcomponentanalysis[C]∥Proceedingsof18thMediterraneanConferenceonControlandAutomation.Marrakech:IEEE,2010:874-879.T,FuenteMJ,Sainz-PalmeroGI.Faultdiagnosisinawastewatertreatmentplantusingdynamicindependentcomponentanalysis[C]∥Proceedingsof18thMediterraneanConferenceonControlandAutomation.Marrakech:IEEE,2010:874-879. [43]YooChangKyoo,LeeJ-M,LeeI-B,etal.Dynamicmonitoringsystemforfull-scalewastewatertreatmentplants[J].WaterScienceandTechnology,2004,50(11):163-171. [44]LeeJong-Min,QinSJ,LeeIn-Beum.Faultdetectionanddiagnosisbasedonmodifiedindependentcomponentanalysis[J].AIChEJournal,2006,52(10):3501-3514. [45]FuenteMJ,Garcia-AlvarezD,Sainz-PalmeroGI,etal.FaultdetectioninawastewatertreatmentplantbasedonneuralnetworksandPCA[C]∥Proceedingsof2012 20thMediterraneanConferenceonControlandAutomation.Barcelona:IEEE,2012:758-763. [46]LeeJong-Min,YooChangKyoo,ChoiSangWook,etal.Nonlinearprocessmonitoringusingkernelprincipalcomponentanalysis[J].ChemicalEngineeringScience,2004,59(1):223-234. [47]LeeDaeSung,LeeMinWoo,WooSeungHan,etal.Multivariateonlinemonitoringofafull-scalebiologicalanaerobicfilterprocessusingkernel-basedalgorithms[J].IndustrialandEngineeringChemistryResearch,2006,45(12):4335-4344. [48]LeeJong-Min,QinSJ,LeeIn-Beum.Faultdetectionofnon-linearprocessesusingkernelindependentcomponentanalysis[J].CanadianJournalofChemicalEngineering,2007,84(4):526-536. [49]ZhangYingwei,QinSJ.Faultdetectionofnonlinearprocessesusingmultiwaykernelindependentcomponentanalysis[J].IndustrialandEngineeringChemistryResearch,2007,46(23):7780-7787. [50]JunBH,ParkJH,LeeSI,etal.KernelPCAbasedfaultsdiagnosisforwastewatertreatmentsystem[C]∥Proceedingsof3thInternationalSymposiumonNeuralNetworks.Chengdu:Springer,2006:426-431. [51]ChoiSW,LeeIn-Beum.NonlineardynamicprocessmonitoringbasedondynamickernelPCA[J].ChemicalEngineeringScience,2004,59(24):5897-5908. [52]WangLi,ShiHongbo.Multivariatestatisticalprocessmonitoringusinganimprovedindependentcomponentanaly-sis[J].ChemicalEngineeringResearchandDesign,2010,88(4):403-414. [53]BachFR,JordanMI.Kernelindependentcomponentanalysis[J].JournalofMachineLearningResearch,2003,3(1):1-48. [54]ZhangYingwei.Faultdetectionanddiagnosisofnonlinearprocessesusingimprovedkernelindependentcomponentanalysis(KICA)andsupportvectormachine(SVM)[J].IndustrialandEngineeringChemistryResearch,2008,47(18):6961-6971. [55]YangJian,GaoXiumei,ZhangDavid,etal.KernelICA:analternativeformulationanditsapplicationtofacereco-gnition[J].PatternRecognition,2005,38(10):1784-1787. [56]ChiangLH,RussellEL,BraatzRD.FaultdiagnosisinchemicalprocessesusingFisherdiscriminantanalysis,discriminantpartialleastsquares,andprincipalcomponentanalysis[J].ChemometricsandIntelligentLaboratorySystems,2000,50(2):243-252. [57]蒋浩天,拉塞尔EL,布拉茨RD.工业系统的故障检测与诊断[M].段建民,译.北京:机械工业出版社,2003:52-66. [58]HeQP,QinSJ,WangJ.AnewfaultdiagnosismethodusingfaultdirectionsinFisherdiscriminantanalysis[J].AIChEJournal,2005,51(2):555-571. [59]RongGang,LiuSu-yu,ShaoJi-dong.Faultdiagnosisbylocalitypreservingdiscriminantanalysisanditskernelvariation[J].ComputersandChemicalEngineering,2013,49:105-113. [60]Garcia-AlvarezD,FuenteMJ,VegaP,etal.Faultdetectionanddiagnosisusingmultivariatestatisticaltechniquesinawastewatertreatmentplant[J].IFACProceedingsVolumes(IFAC-PapersOnline),2009,7(PART1):952-957. [61]孙强,岳继光.基于不确定性的故障预测方法综述[J].控制与决策,2014,29(5):769-778. SunQiang,YueJi-guang.Reviewonfaultprognosticmethodsbasedonuncertainty[J].ControlandDecision,2014,29(5):769-778. [62]艾红,周东华.动态系统的故障预测方法[J].华中科技大学学报:自然科学版,2009,37(增刊I):222-225. AiHong,ZhouDong-hua.Faultpredictionapproachfordynamicsystem[J].JournalofHuazhongUniversityofScienceandTechnology:NaturalScienceEdition,2009,37(SupplI):222-225. [63]陆宁云,何克磊,姜斌,等.一种基于贝叶斯网络的故障预测方法[J].东南大学学报:自然科学版,2012,42(增刊I):87-91. LuNing-yun,HeKe-lei,JiangBin,etal.AfaultprognosismethodusingBayesiannetwork[J].JournalofSoutheastUniversity:NaturalScienceEdition,2012,42(增刊I):87-91. [64]TianWende,HuMinggang,LiChuankun.Faultpredictionbasedondynamicmodelandgreytimeseriesmodelinchemicalprocesses[J].ChineseJournalofChemicalEngineering,2014,22(6):643-650. [65]HanHonggui,QiaoJunfei.Hierarchicalneuralnetworkmodelingapproachtopredictsludgevolumeindexofwastewatertreatmentprocess[J].IEEETransactionsonControlSystemsTechnology,2013,21(6):2423-2431. [66]许少鹏,韩红桂,乔俊飞.基于模糊递归神经网络的污泥容积指数预测模型[J].化工学报,2013,64(12):4550-4556. XuShao-peng,HanHong-gui,QiaoJun-fei.Predictionofactivatedsludgebulkingbasedonrecurrentfuzzyneuralnetwork[J].CIESCJournal,2013,64(12):4550-4556. [67]YooChangkyoo,KimMinhan,HwangSunjin,etal.Onlinepredictivemonitoringandpredictionmodelforaperiodicprocessthroughmultiwaynon-Gaussianmodeling[J].ChineseJournalofChemicalEngineering,2008,16(1):48-51. [68]NomikosP,MacGregorJF.Monitoringbatchprocessesusingmultiwayprincipalcomponentanalysis[J].AIChEJournal,1994,40(8):1361-1373. [69]YooChangkyoo,LeeJong-Min,VanrolleghemPA,etal.On-linemonitoringofbatchprocessesusingmultiwayindependentcomponentanalysis[J].ChemometricsandIntelligentLaboratorySystems,2004,71(2):151-163. [70]YangZongxiao,YuanXiaobo,FengZhiqiang,etal.Afaultpredictionapproachforprocessplantsusingfaulttreeanalysisinsensormalfunction[C]∥Proceedingsofthe2006IEEEInternationalConferenceonMechatronicsandAutomation.Luoyang:IEEE,2006:2415-2420. ReviewofData-DrivenFaultDiagnosisandPrognosisforWastewater Treatment Huang Dao-pingQiu YuLiu Yi-qiLi Yan (SchoolofAutomationScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510640,Guangdong,China) Abstract:There exists significant nonlinearity, multi-variable coupling, time-variant parameter, large time delay and frequent inside or outside interferences in the process of wastewater treatment, so that it is essential to find out the abnormalities of wastewater treatment system in time and further to ensure the reliability and stability of treatment equipment. This paper, by taking into consideration the characteristics of biochemical wastewater treatment, reviews the research status, existing problems and corresponding solutions of data-driven fault diagnosis methods in the field of wastewater treatment, discusses the research prospect of fault prognosis in wastewater treatment, and points out some problems and development trends of the research on data-driven fault diagnosis. Keywords:wastewatertreatment;faultdiagnosis;faultprognosis;data-drivenmethod Foundationitem:SupportedbytheNationalWaterPollutionControlandTreatmentScienceandTechnologyMajorProject(2014ZX07406002) †通信作者: 李军(1964-),男,教授,博士生导师,主要从事污水处理理论与技术研究.E-mail:jglijun@bjut.edu.cn Foundationitems:SupportedbytheEarmarkedFundforModernAgro-IndustryTechnologyResearchSystem(nycytx-49-13),theOpenResearchFundProgramofStateKeyLaboratoryofHydroscienceandEngineering(sklhse-2013-B-02)andtheNationalNaturalScienceFoundationofChina(NSFC)(50979118)