基于LTSA和联合指标的非高斯过程监控方法及应用

2015-08-20 07:31杨正永王昕王振雷
化工学报 2015年4期
关键词:裂解炉高斯建模

杨正永,王昕,王振雷

(1 化工过程先进控制和优化技术教育部重点实验室(华东理工大学),上海 200237;2 上海交通大学电工与电子技术中心,上海 200240)

引 言

现代化工、冶金等工业生产系统正逐渐向大型化、复杂化等方向发展。这类系统一旦发生故障,不但会造成大量的人员伤亡和巨大的财产损失,而且可能对生态环境造成毁灭性的破坏[1]。所以建立实时的过程监控系统,及早地检测并排除故障,对确保生产装置的平稳运行具有很重大的意义。随着计算机控制系统和智能仪表在生产中的应用,大量数据被保存下来。通过对数据的统计分析来监控系统的运行状态,已成为近年来的热门研究领域[2]。多变量统计过程监控(multivariate statistical process monitor,MSPM)是一种很重要的基于数据驱动的监控方法,它是从正常工况下的数据中提取过程信息,利用数理统计方法建立统计模型实现对生产过程的监控[3]。

以主元分析(principal component analysis,PCA)、偏最小二乘(partial least squares,PLS)为代表的经典多元统计过程监控方法得到了广泛的应用。作为PCA 的扩展,主要用于解决数据非高斯分布问题的独立元分析(independent component analysis,ICA)方法逐渐被大家所熟知并取得很好的应用发展。文献[4]引进PSO 算法来处理ICA 在求取解混矩阵W时容易陷入局部最优的问题,该方法可以有效地防止矩阵W的次优解的出现。对于原始ICA 方法的独立元排序的问题,Cao 等[5]利用最小均方误差对独立元进行排序,选取前n个主要独立元来构建统计量。文献[6]结合ICA 和规范变量分析(canonical variate analysis,CVA)的优点,提出一种用来解决 TE 过程中故障 3 的检测方法CV-ICA。文献[7]在ICA 的基础上,结合近年来提出的局部离群因子(local outlier factor,LOF)方法提出了一种新的流程工业监控方法,该方法不考虑过程数据的分布特性,而且新构建的统计量更有效地降低了漏报率。Jiang 等[8]认为ICA 方法故障信息和某些独立元没有一定的映射关系而且过程数据中的有用信息有可能被埋没,为此提出一种加权ICA(weighted ICA,WICA)。WICA 给不同的独立元赋予不同的权值,凸显有用独立元的地位,实现统计量信息的有效提取。文献[9]提出的ICA 改进方法可以处理带有周期性扰动的非高斯过程监控问题,该方法利用平均移动累积和消除扰动信息,再利用ICA 对消除扰动后的残差进行统计建模并实现过程监控。然而Ge 等[10]认为过多的方法引入会影响算法的执行效率,而且PCA、ICA 等MSPM 方法在实际应用中的监控效果不理想,根本原因不在于方法本身,而在于最后统计量的构建以及统计监控限的选取。

实际生产过程通常包括机理复杂的物理及化学反应过程,另外原料成分的改变、现场噪声和设备老化等因素都导致现场采集到的数据通常具有非线性关系,并伴有非高斯与高斯混合分布的特征。LTSA 算法[11]考虑数据间的邻域信息,在充分保留数据局部结构的前提下实现数据降维,可以很好地解决非线性问题并可以减少后续的分析计算时间。同时发现,文献[4]到文献[9]提出的方法利用ICA对过程非高斯信息进行统计分析,之后就在残差空间计算SPE 统计量,文献[12]认为对非高斯信息进行分析后,应该对ICA 提取后的残差信息再进行分析以实现对过程信息的分析以提高监控性能。此外,大多数方法都采用多个统计量指标进行过程监控。多个指标分散了过程信息,也增加了诊断工作量,不利于实际现场的过程监控。

为此,针对实际工业过程数据是非高斯分布和高斯分布的混合体的情况,本文提出了一种基于LTSA 和联合指标的非高斯过程监控方法。首先采用局部切空间排列(local tangent space alignment,LTSA)算法在充分保留数据的局部结构的前提下,对正常样本进行非线性降维来提取出低维流形结构,然后利用非高斯策略对低维流形结构进行统计分析并计算出非高斯统计量,之后利用高斯策略对非高斯建模后剩余的残差进行统计建模并计算出高斯统计量。为避免多个指标容易分散故障信息,对这两个统计量进行加权获取新的统计指标并估计统计监控限,从而实现对工业过程的在线监控。最后,TE平台仿真以及应用仿真说明了所提方法的有效性。

1 局部切空间排列(LTSA)算法

复杂工业过程中有大量的过程数据,它们具有维度高的特点,例如一台工业裂解炉包括200 多个过程变量,而且由于放热反应过程的存在,很多变量间呈现非线性关系。因此,采用LTSA 算法在充分保留数据的局部结构的前提下实现过程数据的低维流形提取,主要步骤如下。

(1)局部信息提取:用K近邻方法为原始数据集m是样本维数,N是样本个数)中的每一个数据点寻找k个近邻点,得近邻矩阵Ki

其中,kik代表样本点i与样本点k之间的距离。需要说明的是,当选定邻域个数k后,使用K近邻方法是要找出与每一个样本点离得最近的k个样本点来构成近邻矩阵。即使用K近邻方法计算出欧式距离后,再对其进行排列,找出距离最小的k个值构成近邻矩阵Ki。

(2)局部坐标计算:先将Ki中心化,得再对Ki-ki,mid1k进行奇异值分解

其中,1k为k维的全1 向量,Σi是奇异值按降序排列的对角阵,Qi、Vi分别对应m1个最大奇异值的左、右奇异向量构成的矩阵,所以局部切空间中样本点的投影坐标矩阵为

(3)局部坐标排列:不同的样本点都有一个局部坐标系统Θi,将这些局部坐标排列起来即可得到全局坐标系统T,记为

局部坐标经过线性仿射变换排列后可得到全局坐标

其中,τ,midi表示样本点xi低维嵌入的对应邻域点坐标的中心,Li表示坐标之间的仿射变换,而ε(i)j表示局部坐标的重建误差。记Ti=[τi1,… ,τik],那么式(5)就被转化成矩阵形式

所以重构误差Ei就可以写成

通过极小化重构误差Ei以保证局部坐标的低维特征

对T进行中心标准化来保证唯一解,所以

其中,Θi+表示为iΘ的伪逆,为排列矩阵。

(4)提取低维子流形:对矩阵φ进行特征值分解并升序排列,选取从第2 小到第(m1+1)小的特征值所对应的特征向量构成低维嵌入矩阵。

经过上述4 步可以实现高维空间向低维空间的映射。然而LTSA 是种非线性维数约减算法,无法得到一个解析形式的映射函数,所以对新样本点需要重新学习才能实现低维映射。为解决这个问题,通过学习出映射空间的基向量来实现新样本点从高维空间到低维空间的映射。

2 非高斯-高斯统计建模

2.1 ICA 非高斯统计建模

在对原始数据集进行非线性降维得到低维流形X1后,基于文献[12]提出的方法对X1进行两步统计建模分析。ICA[13]是一种揭示变量间潜在因素的方法,将数据矩阵做如下的组合分解

其中,X1∈是X∈Rm×N经LTSA 降维后的测量变量矩阵,S∈Rp×N是独立成分矩阵,A∈RN×p是混合矩阵,m1、N、p分别是变量个数、样本个数和独立成分个数。ICA 旨在求取解混矩阵W来重构S。

重构独立成分S的方法有负熵最大化、互信息最小化等,计算前先用PCA 对数据集X1进行白化处理,这样可以提高计算效率。下面先对X1的协方差矩阵进行特征值分解,即

对数据进行白化

其中,白化矩阵Q=Λ-1/2UT,白化后的数据为

其中,B=QA为单位正交矩阵,那么重构的独立成分可以表示为

本文采用FastICA[13]算法进行B的求解,解混矩阵W=BTQ。采用ICA 方法进行监控时,选取W中行向量二范数较大的d行作为Wd,剩下的作为We。所以相关统计量Id2、Ie2为(残差E将用于高斯统计分析)

以上两个指标中,Id2用于检测主要独立成分的变化,即系统性变化;Ie2用于检测次要独立成分的变化,即非系统变化[14]。因此本文将这两个指标合二为一计算出新的非高斯监控指标,即

其中,和分别为统计量和的统计监控限。统计监控限的选取可参考文献[15]的方法,在计算出正常数据的、后,分别对其升序排列,本文取第98%高的或的统计量的值作为统 计限。

2.2 PCA 高斯统计建模

PCA 认为正常数据集可以由较低维的主要变量空间和残差空间表示,具体分解成如式(18)形式

现对2.1 节中ICA 提取后的残差E建立PCA过程统计模型,得

其中,E∈Rm1×N,m1是变量个数,N是样本个数;pi是载荷向量,ti是相应的得分向量。取前k维的主元空间代替原来的1m维数据空间,即

此时,构造HotellingT2和SPE 统计量

根据以上两个指标是否超限进而判断过程是否处于故障状态,存在:①T2超限,SPE 超限;②T2超限,SPE 不超限;③T2不超限,SPE 超限;④T2不超限,SPE 不超限这4 种情况。通常认为①和②已经发生故障,③可能未发生故障。为此结合文献[16]将残差分析后的T2和SPE两个指标合二为一得到新的高斯监控指标,即

2.3 新的联合指标的建立

在实际工业过程中,当几个统计指标同时报警时,多次的故障诊断增加了工作量。文献[14]在文献[16]的基础上提出了ICA 的联合指标,但并未对残差信息继续进行分析。本文在利用LTSA 处理数据得到低维流形后,结合两步策略对其进行分析得到非高斯统计量和高斯统计量。考虑到过程数据是一个高斯分布和非高斯分布混合的整体,根据文献[14]的加权公式对新建立的非高斯统计量D2non-Gaussian和高斯统计量D2Gaussian进行加权得到新的统计量D2new,具体描述为

3 基于LTSA 和联合指标的过程监控

本文采用LTSA 算法,基于非高斯-高斯两步策略提出新的联合指标进行过程监控。基本思想是将建模数据预处理后,利用LTSA 算法进行非线性降维,之后基于非高斯-高斯两步策略进行统计分析得到相应的统计量D2non-Gaussian和D2Gaussian,再利用加权得到新的联合指标D2new。对于待检测的过程数据进行同样的数据处理后,利用相应的统计量与统计监控限的关系,判断系统的运行状态。该监控方法可分为以下两个阶段。

(1)离线建模

①从TE 平台采集正常工况下的样本数据集X∈Rm×N,对样本数据进行均值中心化以及标准化的数据处理;

②运用LTSA 算法对标准化后的数据集进行降维处理,得到降维后的数据集X1∈Rm1×N;

③利用非高斯-高斯两步策略建立统计模型得到相应监控统计量D2non-Gaussian和D2Gaussian;

④对非高斯统计量和高斯统计量进行加权得到新的联合指标D2new。根据文献[15]提供的方法设定统计监控限。离线建模流程如图1所示。

(2)在线监控

①在线获取实时数据,进行数据均值中心化及标准化的数据处理;

②对标准化后的数据进行降维处理,得到低维 空间的嵌入坐标;

图1 离线建模流程Fig.1 Flow chart of offline modeling

图2 在线监控流程Fig.2 Flow chart of online monitoring

③计算出统计量,实施加权后得到新的联合指标,判断是否超限。在线监控流程如图2所示。

4 TE 过程仿真实验

TE 模型是由美国Eastman 化学公司的过程控制小组的Downs 等[19]提出的,来自于一个真实工业过程,提出的目的是为评价过程控制和监控方法提供一个现实的工业过程。这个案例很适合过程控制和监控技术的研究,为学术界所广泛使用,已成为被广泛认可的“标准测试”平台。TE 过程包括5个主要操作单元,共4 个反应,生成2 种产物,包括12 个操纵变量和41 个测量变量(包括22 个连续测量变量和19 个成分测量值),有6 种运行模式。人为对其设定21 种故障工况,前7 种故障与过程变量的阶跃变化有关,故障8~故障12 与某些变量的可变性增大有关,故障13 是反应动力学中的缓慢漂移,故障14 和故障15 与黏滞阀有关,剩余故障为未知类型[1]。TE 过程的详细描述可参考文献[20]。TE 的基本控制方案如图3所示。

图3 TE 过程流程Fig.3 Flow chart of TE benchmark process

离线建模时,选取52 维的960 组正常数据进行标准化处理,之后采用LTSA 算法对52 维数据进行降维处理。根据经验,LTSA 算法的近邻个数k=51,降维后的空间维数d=33。再利用非高斯-高斯两步策略进行统计建模计算出相应的非高斯统计量和高斯统计量,最后运用加权方法计算得到新统计指标并估计出统计监控限。

在线监控时,选用960 组过程数据进行仿真,故障是在第161 个数据时刻引入的。先采用LTSA算法对标准化后的待检测数据进行降维处理,再利用非高斯-高斯两步策略算出统计量并计算得到最后的联合指标,判断其是否超限。是则报警,否则继续采集检测。经多次实验,得到与其他方法的检测率对比,如表1所示。

需要说明的是,故障5 是由于冷凝器冷却水入口温度的阶跃变化引起的气液分离器的温度和冷却水出口温度的变化,大多数统计量在故障发生后能够及时检测到,但在约350 个采样时刻后受到控制回路的补偿影响便无法做出准确监控。结合表1及图4可以看出,本文提出的方法在故障5 发生时可以及时地检测到,并一直监控故障的存在,显示故障并未排除。在监控故障10 这类某一过程变量增大的故障时,本文提出的方法取得的监控效果也要优于文献[21]提出的监控方法以及文献[12]提出的原始两步策略方法,而且本文提出的单个联合指标也要比3 个指标直观(图5)。在对故障20 进行监控时,较PCA 方法、LTSA-FSSVDD 方法以及原始两步策略监控方法而言,提高了故障检测率(图6)。

表1 TE 过程故障1、5、10、11、16、18、19、20、21 的检测率对比Table 1 Detection rate comparison of fault 1,5,10,11,16,18,19,20 & 21 of TE process/%

图4 TE 过程故障5 的监控图对比Fig.4 Comparison of monitoring fault 5 of TE process

图5 TE 过程故障10 的监控图对比Fig.5 Comparison of monitoring fault 10 of TE process

5 乙烯裂解炉应用

以某石化企业大型裂解炉为例,将本文方法应用到乙烯裂解炉过程监控中。乙烯裂解炉的具体结构如图7所示,它是乙烯生产中的龙头设备,裂解原料(石脑油、乙烷等)在裂解炉中通过复杂的高温裂解反应,裂解为乙烯、丙烯、丁二烯等化工基础原料。

选择对裂解炉运行影响较大的33 个变量,其中包括6 组炉管的进料流量,6 组炉管的稀释蒸汽流量,裂解炉底部燃料气流量,侧壁燃料气流量,6组炉管的出口温度,6 组炉管的横跨段温度,6 组炉管的出口压力等。裂解炉运行中常见故障如表2所示。

当现场进行安全平稳生产时,监控系统出现图8(a)所示的监控画面。当裂解炉的第1 根炉管辐射段出口压力发生波动时,监控系统得到图8(b)所示的监控画面。当第3 根炉管横跨段出现温度跳变时,监控画面如图8(c)所示。而当第6 根炉管的温度传感器发生故障时,得到了图8(d)所示的监控画面。

图6 TE 过程故障20 的监控图对比Fig.6 Comparison of monitoring fault 20 of TE process

图7 乙烯裂解炉结构Fig.7 Structure of ethylene cracking furnace

在应用仿真中,从图8可以看出,本文提出的方法在对乙烯裂解炉进行监控时,取得了很好的监控效果。图8(a)是对裂解炉的正常平稳运行时的监控图,当实际现场存在多个统计量连续超限时才会 给出故障的呼报,所以本文的方法不会做出误判,做到了准确监控。图8(b)是对第1 根炉管的辐射段的出口压力的波动故障进行监控,在故障发生后,统计指标反映出了数据的波动变化,对这类随机波动故障做出了有效监控。图8(c)、(d)是对第3 根炉管的温度跳变故障及第6 根炉管的传感器增益故障的监控,所提的联合指标也反映阶跃变化,表现出了优秀的检测性能。

表2 乙烯裂解炉3 种故障Table 2 Three kinds of ethylene cracking furnace’s fault

6 结 论

为解决过程数据中高斯和非高斯混合分布的问题,实现有效的过程监控,本文提出了一种基于LTSA 和联合指标的非高斯过程监控方法。首先采用LTSA 算法提取低维流形,然后采取非高斯策略对低维流形进行分析计算得到非高斯统计量,再利用高斯策略对非高斯策略提取后的残差E进行分析计算得到高斯统计量,最后再将其加权得到新的联合指标。最后通过TE 平台证明了该方法的有效性,对实际工业乙烯裂解炉的应用仿真也说明了该方法具有的指导意义。

图8 乙烯裂解炉正常工况、故障1、故障2、故障3 的监控结果Fig.8 Monitoring results of ethylene cracking furnace of normal mode,fault 1,fault 2 and fault 3

[1]Ma Yuxin (马玉鑫),Wang Mengling (王梦灵),Shi Hongbo (侍洪波).Fault detection for chemical process based on locally linear embedding [J].CIESC Journal(化工学报),2012,63 (7):2121-2127

[2]Li Han (李晗),Xiao Deyun (萧德云).Survey on data fault diagnosis methods [J].Control and Decision(控制与决策),2011,26 (1):1-9,16

[3]Zhao Chunhui,Wang Fuli,Mao Zhizhong,Lu Ningyun,Jia Mingxing.Improved batch process monitoring and quality prediction based on multiphase statistical analysis [J].Industrial and Engineering Chemistry Research,2008,47 (3):835-849

[4]Zhang Yingwei,Zhang Yang.Fault detection of non-Gaussian processes based on modified independent component analysis [J].Chemical Engineering Science,2010,65 (16):4630-4639

[5]Wang Jingcheng,Zhang Yanbin,Cao Hui,Zhu Wenzhi.Dimension reduction method of independent component analysis for process monitoring based on minimum mean square error [J].Journal of Process Control,2012,22 (2):477-487

[6]Yang Yinghua,Chen Yonglu,Chen Xiaobo,Liu Xiaozhi.Multivariate industrial process monitoring based on the integration method of canonical variate analysis and independent component analysis [J].Chemometrics and Intelligent Laboratory Systems,2012,116:94-101

[7]Lee Jaeshin,Kang Bokyoung,Kang Suk-Ho.Integrating independent component analysis and local outlier factor for plant-wide process monitoring [J].Journal of Process Control,2011,21 (7):1011-1021

[8]Jiang Qingchao,Yan Xuefeng.Non-Gaussian chemical process monitoring with adaptively weighted independent component analysis and its applications [J].Journal of Process Control,2013,23 (9):1320-1331

[9]Tian Ying,Du Wenli,Qiao Feng.Fault detection and diagnosis for non-gaussian processes with periodic disturbance based on AMRA-ICA [J].Industrial & Engineering Chemistry Research,2013,52 (34):12082-12107

[10]Ge Zhiqiang,Song Zhihuan.A distribution-free method for process monitoring [J].Expert Systems with Applications,2011,38 (8):9821-9829

[11]Zhang Zhenyue,Zha Hongyuan.Principal manifolds and nonlinear dimension reductionvialocal tangent space alignment [J].SLAM Journal of Scientific Computing,2004,26 (1):313-338

[12]Ge Z Q,Song Z H.Process monitoring based on independent component analysis-principal component analysis (ICA-PCA) and similarity factors [J].Ind.Eng.Chem.Res.,2007,46:2054-2063

[13]Hyväarinen A,Oja E.Independent component analysis:algorithms and applications [J].Neural Networks,2000,13 (4/5):411-430

[14]Fan Jicong (樊继聪),Wang Youqing (王友清),Qin S Joe (秦泗钊).Combined indices for ICA and their applications to multivariate process fault diagnosis [J].Acta Automatica Sinica(自动化学报),2013,39 (5):494-501

[15]Cai Lianfang,Tian Xuemin,Chen Sheng.A process monitoring method based on noisy independent component analysis [J].Neurocomputing,2014,127:231-246

[16]Yue H H,Qin S J.Reconstruction-based fault identification using a combined index [J].Industrial and Engineering Chemistry Research,2001,40 (20):4403-4414

[17]Ge Zhiqiang (葛志强).Statistical process monitoring research of complex states [D].Hangzhou:Zhejiang University,2009

[18]Ge Zhiqiang,Song Zhihuan.Multivariate Statistical Process Control:Process Monitoring Methods and Applications [M].Springer,2013

[19]Downs J J,Vogel E F.A plant-wide industrial process control problem [J].Computers and Chemical Engineering,1993,17 (3):245-255

[20]Chiang L H,Russell E L,Braatz R D.Fault Detection and Diagnosis in Industrial Systems [M].Springer,2001

[21]Zhang Shaojie (张少捷),Wang Zhenlei (王振雷),Qian Feng (钱锋).FS-SVDD based on LTSA and its application to chemical process monitoring [J].CIESC Journal(化工学报),2010,61 (8):1894-1900

猜你喜欢
裂解炉高斯建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
数学王子高斯
天才数学家——高斯
裂解炉低氮烧嘴改造后存在问题分析及对策
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
裂解炉炉管高压水清洗技术研发与应用
乙烯裂解炉测温新技术研究与应用
从自卑到自信 瑞恩·高斯林
乙烯裂解炉先进控制系统开发及工业应用