基于多元统计时间序列模型的间歇过程故障预测方法研究

2015-06-10 10:50项亚南
仪表技术与传感器 2015年6期
关键词:阶数间歇预测

项亚南,潘 丰

(轻工过程先进控制教育部重点实验室,江南大学,江苏无锡 214122)



基于多元统计时间序列模型的间歇过程故障预测方法研究

项亚南,潘 丰

(轻工过程先进控制教育部重点实验室,江南大学,江苏无锡 214122)

青霉素发酵过程是一个典型的间歇过程并且生产过程伴随着非线性,多阶段,动态性能等特点,一旦过程中发生故障,发酵底物可能会被破坏,造成巨大的财产损失,因此提前预测间歇过程的故障是非常有意义的。针对间歇过程多元统计(MPCA)故障诊断的研究方法,文中提出一种时间序列模型与MPCA相结合的方法来预测缓变故障,在建立和SPE统计量的自回归模型之后,再与各自建立的控制限对比,判断是否超限来预测渐变故障。文中采用的是Pensim 2.0仿真平台对该方法进行仿真研究,仿真结果验证了该方法的有效性。

青霉素发酵;间歇过程;多元统计;故障诊断;时间序列模型;控制限

0 引言

青霉素发酵是一个典型的间歇过程,由于初始条件(如菌体浓度、初始底物的浓度、菌体的初始活性等)和操作条件(例如补料的数量、速率)的不同,各批次之间的过程变量往往表现出不同的特性。另外即使在相同批次发酵过程的各个阶段(菌体生长阶段、产物合成阶段)之间,过程变量的自身特性和变量之间的相关关系也都会变化[1-2],发酵过程中一旦发生故障将产生很严重的后果,但是如果可以根据在线的数据,对未来一段时间的故障作出早期的预测,将给操作员争取更多的时间来排除故障,保证安全生产。在以往的故障预测研究中:基于模型的卡尔曼滤波器方法[3]需要建立间歇过程的数学模型,间歇过程复杂的机理很难建立准确的模型;神经网络的故障诊断适用于有大量生产的经验和专家知识的场合[4],而间歇过程在这方面的知识和专家知识是有限的。

通过上述分析,考虑到前后数据的相关性关系,本文提出以当前时段变量的变化趋势为基础的间歇过程监控方法,采用时间序列(ARMA)与多元统计方法MPCA[5]相结合的方法来预测间歇过程的缓变故障。

1 时间序列预测方法与MPCA

1.1 ARMA与MPCA

ARMA是在20世纪70年代提出的[6],开始是用于对市场经济的预测,随着研究的不断深入,广泛的应用在各个不同的领域之中。

过程的数据看做是一个随机的序列,但是相邻的数据具有相关性和依赖性,根据输入输出数据,建立相互之间的映射关系,以线性自回归滑动平均模型为基础建立数据的模型,按照时间建立一个随时间变化变量之间的相关关系,借以预测下一个时间段或者以后若干时间内数据可能达到的水平。

间歇过程与连续生产过程不同在于特殊的运行机制和工业要求,并且产品质量更易受到环境、投放的材料、设备运行的状况等因素的影响。针对间歇过程的特点,本文采用的是基于数据的主元分析方法来分析,这种监控方法不需要建立过程的数学模型,通过挖掘输入输出数据中的信息以此来建立过程的统计量指标,就可以进行故障诊断。

MPCA方法在间歇生产中得到了较为广泛的研究与应用[7-9],它的基本原理是:

X=I·J·K

式中:I表示批次;J表示变量个数;K表示采样时刻序列。

首先把正常的三维数据按照一个维度分解为二维的空间,再用一般的PCA进行主元分析,分解为主元空间和残差空间。在正常的工况数据下分别建立T2统计量和平方预测误差SPE (Squared prediction error)统计量控制限,其中T2是根据主元空间建立的,表示的某时刻主元模型描述原模型的程度,SPE是根据残差空间建立的,表示的是某时刻数据在残差空间偏离主元模型的程度。

基于MPCA的时间序列的预测方法来预测故障,即是预测下一批次数据的T2统计量与SPE统计量是否在控制限之内。

采集到数据之后,把过程的数据均值化处理之后再转化为一组平稳的时间序列数据。利用当前的数据预测未来的趋势,首先选择合适的拟合模型,即确定模型的阶数和辨识出未知的参数,检验预测。

1.2 时间序列模型模型的确定

时间序列模型,首先是要确定选用AR、MA或ARMA模型,本文利用的是自相关系数和偏自相关系数来确定模型的类型。

ARMA是一种由AR(自回归模型)、MA(滑动平均模型)相结合的模型预测方法,预测模型的表达式如下:

(1)

式中:p、q表示的分别是自回归和滑动平均的阶数,简记为ARMA(p,q);φi为自回归系数;θj为滑动平均系数,这两项是待定系数。

当p=0时,模型为MA模型,当q=0时模型为AR模型。对于ARMA,要找到与其拟合最好的模型。

1.2.1 模型阶数的确定

对时间序列{xt|t=1,2,…,n},其中统计分析如下

均值:

(2)

方差:

(3)

协方差:

(4)

自相关系数ACF(ρk):

(5)

偏相关系数PACF(φkk)就是在已知序列值的情况下,对未知序列的一种量度:

φ11=ρ1

(6)

(7)

φki=φk-1,i-φkkφk-1,k-1;i=1,2…

(8)

模型类别的判断依据是:对于AR模型偏相关系数φkk是截尾的,即若偏相关系数在n>p后,φkk=0即可判断AR模型的阶数p=n-1,对于MA模型,自相关系数ρk是截尾的,当m>p时,求得ρk=0时,即可判断MA模型的阶数是q=m-1。

对于ARMA模型,采用的是准则函数方法来确定模型的阶数。采用一种最小AIC准则函数作为定阶方法[10],即可以利用其数据的自相关函数来判断阶数,AIC的表达式为:

(9)

从低阶到高阶分别对p,q取值分别建立模型,在进行参数估计,比较各模型的AIC值,当AIC取得极小值的时对应的p,q确定为最佳的模型参数。

1.2.2 参数的估计

在确定了模型的阶数之后,接下来的问题是确定未知的参数,文中采用的是最小二乘的方法来辨识未知的参数。

采用模型预测的算法流程总结如下,流程图如图1所示。

(1) 零均值化处理,0-1均值化处理;

(2) 平稳信号处理,ARMA要求时间序列是平稳的信号,既非平稳信号做差分处理;

(3) 分别计算在不同p和q取值下自相关系数和偏相关系数,确定模型的阶数p和q,选择合适的ARMA模型;

(4) 采用最小二乘的方法辨识参数φi和θj;

(5) 白噪声对模型进行测试,并对模型不断地改进与优化,重复步骤(3)直到满足要求;

(6) 在线应用,对将来某一时刻的数据作出预测。

图1 时间序列建模流程图

2 基于统计量T2和SPE时间序列模型对故障的预测

根据正常数据分别建立T2统计量与SPE统计量的控制限,再根据在线预测出两个统计量的的未来值,若两个统计量都在在控制限范围内认为过程是正常的,当任一统计量超过控制限时,就判断过程发生了故障。

利用Pensim2.0仿真平台得到30批次正常工况下的数据,前24组用来建立预测模型,后6组用来检测预测模型,在青霉素发酵18个变量中选取10个起主要作用的变量,共80个样本,选择的数据样本是X(30×10×80),利用MPCA方法沿着采样时刻方向分解为二维矩阵X(30×800),建立正常数据的T2和SPE统计量控制限。

利用AIC准则函数和最小二乘的方法步骤,分别计算出自相关系数ACF(ρk):和偏相关系数PACF(φffkk),发现偏相关系数是截尾的,而自相关系数是没有截尾的,下面分别测试3阶、4阶5阶和6阶预测模型并计算出对应的AIC值。

表1 T2的ARMA模型阶数和AIC值

由表1可知,由AIC最小值原则,选择模型的阶数为4阶。那么通过时间序列模型建立的T2的表达式为

Tt=0.523Tt-1+0.296Tt-2+0.127Tt-3+0.054Tt-4

(10)

通过上述的模型表达式,用正常数据后6组的数据对模型进行测试,实际值和预测值如表2所示。

表2 T2实际值和预测值

如图2所示,T2的时间序列模型得到的预测值对现场的实际值有很好的拟合效果。

图2 T2实际值与预测值

同样的方法建立SPE的数据模型,按照上面类似的做法,这里选择的依然是AR模型,分别采用2阶、3阶、4阶和5阶做测试,各参数如表3所示。

表3 SPE的ARMA模型阶数和AIC值

表3可知,当阶数选为5阶时,AIC的值取最小值此时得到SPE统计量的时间序列模型表达式为

SPEt=0.425SPEt-1+0.317SPEt-2+0.205SPEt-3+0.037SPEt-4+0.016SPEt-5

(11)

类似的,把正常数据和SPE的时间序列模型预测的数据作比较,实际值和预测值如表4所示。

表4 SPE统计量实际值和预测值

同样的,如图3所示,统计量SPE的时间序列模型,对实际值有很好的预测的效果,拟合的效果较好。

图3 SPE实际值与预测值

3 仿真研究

采用青霉素发酵Pensim2.0仿真平台对该方法仿真,在建立合适的ARMA和SPE的时间序列模型之后,为了验证该方法在整个过程中的有效性,再选取30个批次,10个变量,125个采样时刻的数据,组成X(30×10×125),在80 h的时候加入一个底物流加速度+5%的阶跃扰动作为测试。和SPE仿真预测图,如图4、图5所示。

图4 T2仿真预测图

图5 SPE仿真预测图

在第80个采样时刻的时刻发生故障,有图4、图5的仿真图可知,T2到95个采样时刻的时候超过控制限,此时检测出故障发生,延时15 h左右,预测的模型的预测值才有变化,故障的预测值越来越大,SPE在90 h左右检测出发生了故障。故障的发生有延时的,这是因为底物是菌体生长和产物合成所必须的物质,但是它造成的影响是间接的,通过如培养基的体积,氧气含量,CO2的浓度等表现出来。符合实际的生产情况,达到了故障检测的效果。

4 结论

本文基于ARMA时间序列预测模型,结合MPCA建立间歇过程的和SPE统计量的预测模型来预测缓变故障的发生,采用青霉素发酵Pensim2.0仿真平台对该方法进行验证,仿真结果表明该方法是有效的,对实际的生产具有很好的指导作用。

[1] SEBASTIEN R,ANDREI D,JACKY D.Detection and characterization of physiological states in bioprocesses based on holder exponent.Knowledge-Based Systems,2008,21(1):70-79.

[2] WEI S N,YAN M G,AHMET P ,et al.A method for multiphase batch process monitoring based on auto phase identification .Journal of Process Control,2011,21(8):627-638.

[3] 韩冰洁,缑林峰.,基于卡尔曼滤波器组的执行机构故障诊断方法.计算机仿真,2013,30(2):293-296.

[4] WANG H Q,CHEN P.Intelligent diagnosis method for rolling element bearing faults using possibility theory and neural network .Computers&IndustrialEngineering,2011,60(4),511-518.

[5] NOMIKOS P,MACGREGOR J F.Monitoring batch process using multi—way principle component analysis.American Institute of Chemical Engineers,1994,40(8):136-1375.

[6] BOX G E,JENKINS G M.Time Series Analysis Forecasting and Contro(academic thesis)l.San Francisco:Holden-Day Inc,1970.

[7] 张成,李元.基于统计模量分析间歇过程故障检测方法研究.仪器仪表学报,2013,9(6):2103-2110.

[8] CHUANG W L ,CHEN C H,YEN J Y,et al.Using MPCA of spectra model for fault detection in a hot strip mill.Journal of Materials Processing Technology,2009,209(8):4162-4168.

[9] 汪志锋,袁景淇.动态MPCA在发酵过程监测与故障诊断中的应用.生物工程学报,2006,22(3):483-488.

[10] EKONOMOU S P L,KARAMOUSANTAS D C,CHATZARAKIS G E,et al.Liatsis.Electricity demand loads modeling using AutoRegressive Moving Average (ARMA) models.Energy,2008,33(9):1353-1360.

Batch Processes Fault Prediction Method Research Based onMultivariate Statistical Analysis Time Series Model

XIANG Ya-nan,PAN Feng

(Key Laboratory of Advanced Process Control for Light Industry,Jiangnan University,Wuxi 214122,China)

Penicillin fermentation process is a typical batch process along with nonlinear,multi-stage,dynamic performance and other characters.If a fault occurs in the process of fermentation,substrate will be destroyed,which will lead to a huge property loss .So it is meaningful to predict the faults during the batch process.This article put forward a kind of time series model with MPCA to predict graded fault,and compared with the control limit of each statistic after establishing predict autoregressive model of T2 and SPE.This article simulated the method on Pensim 2.0 penicillin fermentation platform.The results confirm the effectiveness of this method.

penicillin fermentation;batch process;MPCA;fault diagnosis;time series mode;control limit

李世兴(1986—),博士研究生,主要研究领域为工业自动化和物联网。E-mail:lisx@sia.cn 王宏(1963—),研究员,硕士,主要研究领域为嵌入式系统和计算机网络。E-mail:wang@sia.cn

国家自然科学基金资助项目(61273131);江苏省产学研联合创新资金项目(BY2013015-39)

2014-06-19 收修改稿日期:2015-03-06

TP273

A

1002-1841(2015)06-0135-03

猜你喜欢
阶数间歇预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
间歇供暖在散热器供暖房间的应用
选修2—2期中考试预测卷(A卷)
确定有限级数解的阶数上界的一种n阶展开方法
15相感应电机槽配合研究
复变函数中孤立奇点的判别
管群间歇散热的土壤温度响应与恢复特性
间歇导尿配合温和灸治疗脊髓损伤后尿潴留30例