李琳琳 李莎莎 DING Steven Xianchun 彭 鑫 彭开香
随着现代工业复杂化程度的不断提升,各级生产环节的关联也越来越密切,导致系统变量间相互关联、相互耦合,一旦某个环节发生性能衰退就可能随着链式反应在系统中传播,进而导致整个系统瘫痪,造成不可挽回的损失.为保障产品生产的质量和生产效率,提高工业生产过程的安全性和可靠性,需要对工业生产过程或运行设备进行实时监测.因此过程监测与故障诊断在研究和工业应用领域都受到了极大的关注[1-6],成为自动控制领域中的一个研究热点,对保障工业过程安全性、可靠性具有重要意义.
由于现代工业过程对系统性能、效率和可靠性要求的不断提高,控制性能监测技术也得到了广泛关注[7-8].系统控制性能监测的核心思想是将系统实际运行状况与根据系统设计的基准进行对比,判定当前系统是否运行良好.目前为止研究的控制性能监测方法主要集中在对控制器的性能进行评价,指出其与最优控制性能之间的差距[7-10].近年来,涌现了不少控制性能监测的改进算法.具体而言,基于关键性能指标预测的控制性能监测方法得到了广泛关注[11-13];Li 等[14]提出了基于稳定性能衰退评估的故障诊断方法;Tao 等[15]建立一个集成性能评估、故障检测和诊断的框架,最大限度地利用现有监测数据来解决性能评估问题;Li 等[16]借助数据驱动技术提出了基于性能衰退预测的反馈控制系统的性能监测与故障诊断方法.一般而言,控制性能指标可分为确定性指标、鲁棒性指标、随机性指标.确定性指标包含了调节时间、衰减率等传统意义上的控制回路动态品质指标,鲁棒性指标衡量模型失配下的系统稳定性和控制品质,随机性指标则是一种统计意义下的指标,可以用来衡量系统的动态变化.在随机性能评价领域,专家学者们做出了巨大贡献,提出了基于历史数据的基准、最小方差基准、广义最小方差等准则的性能监测方法[17-20].目前大多数控制性能监测方法主要集中于系统部件故障的诊断,而很少关注基于系统性能衰退程度的诊断.这些性能衰退不仅可能由系统部件故障引起,也可能由系统控制参数不匹配引起.另一方面,目前的控制性能监测的方法很少对系统的运行性能进行预测.而基于系统性能预测的诊断可以及时地发现可能发生的问题,进而为系统性能修复提供时间.因此,本文研究基于性能衰退预测的性能监测方法,旨在实现实时性能诊断.
在故障诊断领域,距离度量可有效地根据待测数据集和无故障运行数据集之间的相似程度来诊断故障的发生.距离度量是一种空间属性,选取不同的度量函数,可以将数据集映射到不同的空间中,直接关系到故障诊断结果.因此,度量函数的研究在故障诊断领域逐渐发展起来.常见的距离度量有:欧氏距离[21-23]、马氏距离[24-27]等.近年来,随着流形研究的飞速发展,黎曼度量作为流形曲面上的测地线距离,越来越受到人们的关注[28-29],专家学者们也开始将黎曼度量应用于故障诊断中.An 等[30]提出了一种基于黎曼度量和一维卷积神经网络的端到端无监督域自适应轴承故障诊断方法,该方法具有较强的故障识别能力和领域不变性,适用于频繁变化的工作环境.周美含等[31]提出了一种基于黎曼度量的单基地雷达目标检测新方法,通过计算噪声协方差矩阵的黎曼均值,将其与接收信号协方差矩阵之间的黎曼度量作为检测统计量,实现故障诊断.与传统的基于欧氏度量的检测方法相比,基于黎曼度量的方法显著提高了低信噪比和单快拍下的目标检测性能.由于黎曼度量适用于变量间高度耦合的情况,因此故障诊断领域内越来越多的专家学者开始采用黎曼度量作为工具度量数据间的距离[32-34].然而,目前基于黎曼度量的故障诊断研究多针对静态系统数据展开,而很少有将黎曼度量用于动态系统的性能监测与诊断中.
本文从性能预测角度出发,针对一类带有反馈控制环节的动态系统,提出一种基于黎曼度量的性能预测与评估指标,并基于该指标实现系统性能监测与诊断.由于在实际工业过程中,系统的模型结构与内部参数往往存在着一些不确定的因素,例如参数摄动、不确定性以及测量仪器精度造成的误差和模型线性化引起的不确定性等,因此本文针对含不确定性的反馈控制系统展开研究.
本文结构如下: 第1 节介绍具有模型不确定性的动态系统,并引入黎曼度量,提出基于黎曼度量的系统变化检测的基本思路;第2 节提出动态系统在反馈控制下的性能衰退预测指标,并研究基于模型和数据驱动的性能预测指标的辨识方法,然后给出基于黎曼度量的控制性能监测方法;第3 节基于黎曼度量提出对引发系统性能衰退的故障进行定位的方案;第4 节采用三容水箱系统对本文所提出的性能监测与故障定位方案进行验证;最后总结本文.与现有的诊断方法相比,本文具有如下创新性:
1)提出了反馈控制系统的性能衰退预测方法并给出了对应的在线辨识方案;
2)基于黎曼度量实现了动态系统的控制性能实时监测与诊断.与现有的基于黎曼度量的故障检测方法直接利用采集的测量数据形成正定矩阵不同,本文通过在线辨识的性能预测矩阵来监测系统性能的衰退程度.因此,本文所提出的方法可用于动态系统的性能监测与诊断.
本节首先介绍论文中考虑的反馈控制系统与基于黎曼度量的系统变化检测方法,在此基础上提出本文拟解决的问题.
考虑如下线性时不变系统
其中,x(k)∈Rn表示系统的状态变量,u(k)∈Rm表示控制输入.被控输出y(k)∈Rp可描述为
在式(1)和式(2)中,w(k),η(k)分别表示零均值的系统过程与测量噪声,满足
在式(3)中,Σw,Ση,Π0为已知的正定矩阵.A,B,C,D表示随不确定性参数变化的系统矩阵,即
本文考虑如下反馈控制
其中,K为反馈控制器,v(k)∈Rm为可由式(6)和式(7)表示的参考输入
其中,r(k)∈表示常数参考信号,xv(k)∈表示对应的状态,Av,Bv,Cv表示相应的矩阵.
本节介绍黎曼度量和基于黎曼度量的变化检测方法.
定义P(m)为所有m×m维的对称正定矩阵P所组成的集合.该集合形成了m(m+1)/2 维的黎曼流形.黎曼度量表示两点在流形曲面上的最短距离(测地线距离)[28-29,35].给定集合P中的任意两个矩阵P1,P2,其黎曼度量定义为
假设矩阵P1,P2是m(m+1)/2 维流形上的点,而黎曼度量可以有效地刻画两个正定矩阵之间的差异.因此,正定矩阵的黎曼度量可作为监测量用于检测系统可能发生的变化.假设在理想或系统未发生变化的状态下,过程数据集 Ωi,i=1,···,M0被记录下来,其中,M0为数据集的个数.提取数据集Ωi对应的正定特征矩阵Pi,则可计算不同数据集间的黎曼度量.
在介绍基于黎曼度量的系统变化检测方法之前,首先引入如下黎曼均值的概念[36-38]
即离流形上所有点Pi,i=1,···,M0的黎曼度量和最小的点就表示该流形的黎曼均值.
本文中将流形上任一点Pi与黎曼均值Pz之间的黎曼度量(Pi,Pz)作为监测量用于变化检测,并设定如下阈值
当采集到实时的系统数据后,可提取新数据集的特征矩阵Pnew.考虑到Pnew可以表征系统发生的变化,因此可借助黎曼度量
通过如下决策逻辑实现系统变化检测(如图1 所示)
图1 基于黎曼度量的变化检测Fig.1 Riemannian metric based change detection
从式(8)和式(11)可知,基于黎曼度量的变化检测方法可以有效地监测正定矩阵在方向和幅值方面的变化[38].对于反馈控制系统而言,这些变化体现在由参数变化或乘性故障引起的系统动态特性的改变.目前的过程监测方法多采用二次型性能指标,这些性能指标为标量,对参数变化或乘性故障引起的系统动态变化不够灵敏.因此,本文采用黎曼度量来实现反馈控制系统的性能监测.
一般而言,反馈控制律的设计用于保证系统具有理想的性能(如能耗、时间、控制性能等).不失一般性,本文引入如下的性能指标来衡量系统的控制性能
其中,Q≥0,R>0 为加权矩阵,可根据系统对性能的要求进行选取.E表示信号的均值.0<γ <1表示衰减因子.
很显然对于给定的控制律,性能指标(13)都对应一个给定的值.从应用的角度而言,我们通常要保证系统的运行满足需求的性能.然而实际中,系统操作点或参数的改变、系统部件的老化、控制参数的不匹配等都可能引发系统性能衰退,从而改变性能指标(13)的值.因此,需要设计合适的方法来预测系统性能的变化并将它应用于控制性能监测.本文的目标是研究基于黎曼度量的系统控制性能监测与诊断方法.具体而言,本文主要进行以下工作:
1)选择合适的性能指标函数来预测系统性能;
2)基于性能预测指标,运用黎曼度量对系统性能进行在线监测;
3)建立故障模态数据库,对所发生系统性能衰退的类型进行识别.
基于黎曼度量的控制监测方法包括系统控制性能衰退预测、基于随机算法的阈值设定以及基于黎曼度量的控制性能监测.
为了实现控制性能衰退预测,首先证明如下定理.
定理 1.考虑系统(2),给定反馈控制律(6),则性能指标(13)可表示成如下参数化形式
证明.对于性能指标(13)而言,可以得到如下递推方程,即Bellman 方程
考虑到闭环系统的状态空间可描述为
则瞬时性能指标可表示为
将式(14)代入式(17),可得
由定理1 可知,指标
可预测当前控制器在时间段 [k,∞)内的控制性能.当系统的模型可以精确获取时,可通过求解式(15)和式(16)来计算系统控制性能预测矩阵P和c.
当系统参数发生变化或控制器参数不匹配时,相应的控制性能和对应的性能预测矩阵P也会随之改变.由于变化后的系统模型未知,使得基于模型的计算方法不再适用于P的计算.随着控制系统和各种智能化仪表及现场总线技术在工业过程中的广泛应用,大量的过程数据被采集并存储下来,因此本文在不辨识系统模型的前提下利用采集的过程数据对系统性能预测矩阵进行直接辨识.
为了达到上述目的,首先令
则闭环系统的状态空间方程可表示为
考虑到性能预测矩阵P可以等效地表示为
由此可知
综合Bellman 方程,可得
由式(27)可得
显然,P2可由参数P0,P1求得.因此,只需要辨识参数P0,P1即可得到P2和性能预测矩阵P,这样可以减少要辨识参数的个数,从而提高辨识精度.
为了采用数据驱动方法辨识P0,P1,用(k)代替其均值,则
其中,⊗表示Kronecker 积.hvec(P0)表示由对称矩阵P0的上三角矩阵的列叠加而成的向量,表示待辨识的 (n+kv)(n+kv+1)/2 个参数,且满足
Dn+kv称为重复矩阵[39].vec(P1)表示由对称矩阵P1的列叠加而成的向量.令
则Bellman 方程可等效表示为
上式等价于
则P可由算法1 求得.实际应用中也可借助递推最小二乘法利用在线采集的数据对θ和矩阵P进行实时更新.总的来说,对反馈控制系统而言,系统的性能指标可用关键指标P来预测.
算法1.P 的在线辨识
值得注意的是,系统参数矩阵A,B,C,D与控制器参数的改变都会引起性能预测矩阵P0的变化.为了更好地阐述P0的变化与系统动态特性变化之间的关系,首先考虑Lyapunov 等式(25)的一种简单形式
式(29)表示了系统无噪声时γ选为 1 的特殊情况.由文献[38]可知,矩阵P0可以表示为如下形式
显然,系统矩阵A,B,C,D与控制器参数的变化都体现在性能预测矩阵P0的变化中.因此,本文主要关注矩阵P0的变化,并借助矩阵P0来实现系统控制性能监测与诊断.
由上述可知,性能预测矩阵P0包含了系统在正常操作状态、故障模态、不确定性等情况下的系统性能衰退与改变的信息.由于该矩阵P0∈Rn×n具有对称、正定的结构属性,这种特殊结构属于正定对称矩阵的n×(n+1)/2 维黎曼流形.由于黎曼度量可以有效地衡量流形曲面上两个正定矩阵在方向和幅值方面的变化,因此本文利用黎曼度量来衡量P0矩阵的实时变化,进而实现系统控制性能监测与诊断.
由于系统存在不确定性,不同的不确定性参数对应不同的性能预测矩阵.为了利用黎曼度量来实现性能监测,首先需要确认含有随机不确定性的系统中心(黎曼均值)并设定阈值.从式(9)和式(10)可知,这需要知道所有可能的P0才能实现.然而,由于参数δi在区间内变化,使得P0有无数种可能,为阈值的设定带来困难.近年来,随机算法(Randomized algorithm,RA)为随机框架下极值的估计提供了有效的工具[40-41].因此,本文基于RA 算法来实现阈值设定.为了上述目的,首先引入定理 2.
定理 2[40,42].给定α∈(0,1),ϵ∈(0,1),令
根据随机变量w的概率密度函数D(w)和支持度Dw生成N个独立同分布的变量wi,i=1,···,N,则
的置信度大于 1-ϵ,其中,Θ (w)是关于随机变量w的函数.
则δ为区间 [,] 内分布的随机变量.由定理2 可知,算法2 可用于实现阈值Jth的设定.
算法2.基于RA 算法的阈值设定
5)设定阈值
算法2 保证在无故障情况下 ,评估函数
大于阈值的概率
的置信度大于 1-ϵ.
在故障诊断中,
通常称为误报率(False alarm rate,FAR)[2].也就是说,通过算法2 实现的性能监测方法的误报率小于α的置信度大于 1-ϵ.
在性能预测与RA 算法的基础上,本文提出了基于黎曼度量的控制性能监测方案.该方案分为离线建模与在线检测两部分.
离线建模过程为:
1)利用RA 算法生成N个随机不确定性系统模型(1);
2)利用算法2 确定黎曼均值Pz和阈值Jth.
在线检测过程为:
1)采集现场数据,通过算法1 对实时的系统性能预测矩阵Pnew进行辨识;
2)计算实时性能矩阵Pnew与黎曼均值Pz的黎曼度量,并将其作为检测指标J
3)运行性能监测逻辑
总结而言,基于黎曼度量的控制性能监测流程如图2 所示.
图2 基于黎曼度量的控制性能监测流程图Fig.2 Flow chart of Riemannian metric based control performance monitoring
值得注意的是,本文所提出的基于黎曼度量的控制性能监测方法无需辨识发生性能衰退后系统的模型,仅通过在线识别其性能预测矩阵Pnew就能实现对系统性能衰退程度的监测.尽管系统性能预测矩阵Pnew的辨识需要用到状态变量,但Pnew仅取决于系统与控制器参数的变化,对状态变量的变化具有不变性.另外,由于Bellman 方程的在线求解对控制策略的在线优化至关重要[43],因此该性能预测矩阵也可以用于有效地指导容错控制器的设计和优化.
在文献[42]中,Ding 等利用随机算法给出了故障诊断系统的阈值设定与诊断性能评估方法,该方法主要借助基于观测器的残差发生器所生成的残差信号进行故障诊断.而本文主要针对带有反馈控制环节的动态系统,提出一种系统性能的实时预测指标,并通过黎曼度量衡量实时性能预测指标的退化程度来实现系统性能监测与诊断.与文献[42]相比,本文具有如下的创新性:
1)提出了反馈控制系统的性能衰退预测方法并给出了对应的在线辨识方案;
2)利用黎曼度量实现了控制性能监测与诊断.
当检测到系统发生性能衰退后,紧接着需要进行的就是对引发系统性能衰退的故障进行隔离,判断当前性能衰退的类型,并根据故障类型及时采取相应措施.对于加性故障而言,通常根据不同的故障类型设计对应的残差发生器,然后利用残差评估函数和决策逻辑实现故障分离.这类方法的应用关键在于: 1)对要分离的故障进行聚类;2)设计一系列残差发生器保证每一个残差发生器只对其中一类故障敏感;3)针对每一个残差发生器设计对应的阈值[5].目前对乘性故障隔离的研究相对较少,因此本节设计基于黎曼度量的乘性故障的隔离方法.
假设系统有M个故障模态,对于每一个类型的故障对应一个性能预测矩阵的集合Pi,i=1,···,M.该集合中的性能预测矩阵可通过故障和不确定性模型求得.为了实现故障分离,首先需要求取每一个集合Pi的黎曼均值和对应的阈值.假设集合Pi中性能预测矩阵为Pi,n,n=1,···,Ni,其中Ni为集合Pi中的性能预测矩阵个数.则其黎曼均值可通过求解式(38)得到
本文将这个黎曼均值称为该故障模态的中心.所有矩阵与故障模态中心的黎曼度量中的最大值为
则以Pz,i为中心、γi为半径,可定义如下故障簇
本文中假设任一故障仅属于一个故障簇.当在线检测到故障时,可通过辨识的故障系统的性能预测矩阵Pnew,利用如下决策逻辑实现故障隔离
等价于故障i发生.
本节利用三容水箱的实验平台(DTS200)对所提出的算法进行验证.
三容水箱具有化工过程中常用到的储罐、管道和泵,是典型的过程控制实验设备,如图3 所示.三容水箱既可以用来模拟工业生产过程中的液位控制,也能够模拟各种实际应用中的典型故障,如传感器失效、执行器失效、水箱漏水、连通阀阻塞等,因此在故障检测研究中也得到了广泛应用.
图3 三容水箱示意图Fig.3 The schematic of the three-tank system
三容水箱可用如下数学模型描述
其中,xi(t)=hi(t),i=1,2,3 表示每个水箱的水位,A表示水箱面积,Ainv=1/A且s13=s23=s0=sn.u1,u2分别表示水泵1 和水泵2 的进水量.模型参数通过实际实验平台测量得到,如表1 所示.三容水箱在操作点h1=25 cm,h2=20 cm,h3=22.5 cm附近工作,水箱数据的采样周期为 2 s.此时水箱的系统模型可用式(1)进行描述,其中
表1 水箱DTS200 的参数Table 1 Parameters of tank DTS200
这里,采用如下反馈控制器
由于水箱参数a1,a3往往无法精确确定,可能在一定范围内波动,如a1∈[0.35,0.55],a3∈[0.35,0.55].因此不可避免地会给线性模型带来不确定性,这个不确定性可以用凸多面体不确定性来描述,其中
对三容水箱而言,液位高度是衡量水箱运行状态的关键.因此在性能指标中,液位高度的加权比重选得比较大,具体为Q=500,R=1.给定故障误报率α=0.01,置信度的显著性水平δ=10-7,利用RA 算法可得N应该不小于 1604.运行算法2可得阈值Jth=0.0524,对应的黎曼均值为
在水箱的长期操作中,由于存在水垢等的影响,管道可能会具有一定程度的堵塞.管道的堵塞是导致三容水箱性能衰退的其中一个关键因素.因此,本文主要针对三容水箱的管道堵塞引发的控制性能衰退展开性能监测与诊断的实验验证.在第2000个采样点,管道1 发生堵塞,从而导致水流系数变为a1=0.25.采集过程数据,利用迭代最小二乘算法(算法1 的迭代实现)对性能预测矩阵进行在线辨识.其对应的性能监测效果如图4 所示,显然故障发生后,评估函数很快高于阈值.也就是说,借助黎曼度量可以及时诊断出故障.类似地,可得到管道2 和管道3 发生堵塞(水流系数分别变为a2=0.3 和a3=0.25)的诊断结果分别如图5 和图6 所示.另一方面,当控制参数发生不匹配时,如控制器增益在第 2000 个采样点变为原来的两倍,其对应的性能诊断结果如图7 所示.显然,所提出的方法不仅能诊断故障引起的性能衰退,也可诊断控制参数变化引发的性能退化.
图4 管道1 发生堵塞时诊断效果图Fig.4 Detection performance of plugging in Pipe 1
图5 管道2 发生堵塞时诊断效果图Fig.5 Detection performance of plugging in Pipe 2
图6 管道3 发生堵塞时诊断效果图Fig.6 Detection performance of plugging in Pipe 3
图7 控制参数不匹配时诊断效果图Fig.7 Detection performance of controller parameter unmatch
基于性能衰退预测的故障诊断是近年来针对反馈控制系统的一个新的研究课题,由文献[16]首次提出.该方法的优点是将性能衰退预测的信息用于过程监测,对由参数变化或乘性故障引起的系统性能衰退的实时检测与控制补偿非常有效.因此,本节将本文所提出的方法与文献[16]中提出的基于系统性能退化指标(Indicator for the system performance degradation,ISPD)的性能监测方法进行比较.在基于ISPD 的性能监测算法中,(k)Pz(k)用于对标称系统的性能进行预测,(k)Pnew(k)用于对实时系统性能进行预测,而两者的比值
作为ISPD 用于对系统性能衰退程度进行监测.在式(41)中,Pnew表示利用算法1 的迭代算法辨识的实时性能预测矩阵.通过RA 算法设定对应的阈值JISPD,th,则可通过如下检测逻辑实现性能监测.
当管道2 发生堵塞时(水流系数变为a2=0.3),基于ISPD 的性能监测结果如图8 所示.与图5 比较可知,基于黎曼度量的性能监测方法对系统性能衰退的检测能力更强.
图8 基于ISPD 的性能检测结果[16]Fig.8 ISPD based performance detection results[16]
实际上,基于ISPD 的性能监测方法和本文所提出的方法都基于性能预测指标来实现性能监测.两者的不同之处在于基于ISPD 的方法监测的是二次型性能指标(k)Pz(k)与(k)Pnew(k)这两个标量的比值,而本文通过衡量两个性能预测指标矩阵之间的黎曼距离来实现性能监测.与标量相比,黎曼距离能更好地反映性能预测矩阵在方向和幅值方面的改变,因此可以更有效地检测系统性能的变化,进而实现性能监测与故障隔离.这也是基于黎曼度量的性能监测方法与基于ISPD 方法相比,具有更高的可检测性的原因.
当检测到系统性能衰退后,需要对系统性能衰退的类型进行隔离,判断故障种类,以便采取相应措施消除故障.本节将故障分为3 类: 管道1 堵塞、管道2 堵塞、管道3 堵塞.利用提出的故障隔离算法,借助RA 算法可得到每一个故障簇的中心
对应的故障半径分别为
本节分别利用5 个堵塞故障a1=0.30,a2=0.35,a3=0.28,a1=0.27,a2=0.40 来验证所提出的故障隔离算法.对应的故障隔离结果如表2 所示.
表2 水箱堵塞故障隔离Table 2 Isolation of pipe plugging
由表2 可以看出,当管道1 发生堵塞时,可得
显然,该故障属于第1 个故障簇.类似地,可以对其余4 个故障进行隔离,从表2 可知,对这4 个故障进行隔离的结果与真实的故障类型相符,这也验证了所提出的基于系统性能衰退预测与黎曼度量的故障隔离方案的有效性.
值得注意的是,当三容水箱处于不同工况时,其性能预测矩阵也会不同.因此,可将不同的工况作为相应的性能变化或衰退模态考虑到分类中.通过训练不同工况下可能的性能预测矩阵的均值和半径,进而借助所提出的故障定位方法可实现对不同工况和不同类型的性能变化或衰退情况的区分.因此,本文所提出的方法不仅适用于系统老化、故障、控制器参数变化等因素引发的性能衰退,也可用于系统不同工况的判定.
针对一类带有反馈控制环节的动态系统,本文提出了一种基于黎曼度量与控制性能衰退预测的性能监测与诊断方法.首先,提出了一个性能衰退的预测指标,并给出该性能指标的离线与在线计算方法;其次,基于黎曼度量提出了系统性能衰退程度的监测方法,并基于随机算法给出了对应的黎曼均值与阈值的设定方法,进而实现性能监测;最后,通过分析各类故障的数据构建各类故障模态性能库并设计对应的阈值,进而实现故障的实时定位.通过三容水箱系统仿真验证了所提出故障诊断方法的有效性.所提出的基于黎曼度量的性能监测与诊断方法既可以实现系统性能衰退监测,又可识别故障位置,在处理反馈控制系统的性能监测中显示出优秀的监测性能.
本文提出的性能监测与诊断方法面向线性系统.但在该设计框架内,可借助机器学习技术实现复杂工业非线性系统的性能衰退预测与故障诊断.同时,近年来基于性能的容错控制方法也受到越来越多的关注,如何基于性能衰退预测的指标实现系统性能修复值得进一步研究.另外,目前工业系统结构复杂,多呈现多子系统互联耦合的形式[44],如何实现分布式性能衰退监测与容错控制,也是值得研究的课题.