刘丰年
(三门峡职业技术学院,河南 三门峡 472000)
基于粗糙集的工业过程故障监测方法研究
刘丰年
(三门峡职业技术学院,河南 三门峡 472000)
针对传统故障监测方法模型建立难、误报率高的问题,结合工业过程的非线性特点,提出了一种基于粗糙集的工业过程故障监测方法.该方法将基于概率分布的混合决策表离散化方法及基于分明矩阵和约简树的增量式属性约简方法应用于工业过程状态监测中,阐述了工业过程知识获取、状态监测和监测性能评价方法.这种监测方法在一定程度上提高了工业过程状态监测的效率和精度,具有一定的实际应用价值.
粗糙集;工业过程;故障监测
伴随着工业4.0时代的到来,工业系统的智能化、复杂化程度越来越高,其故障率也随之越来越高.因此,人们把注意力更多地放到了工业系统的稳定性和可靠性上.为了保持系统的运行比较稳定,一些能够对工业系统实时监测的可靠有效的措施应该被采取,以便第一时间发现故障并进行修复.但由于复杂工业过程的故障多种多样,这就要求我们一定要分清故障类型,从而有针对性地选择合适的监测方法.
常用的故障监测方法有3种,它们分别是基于解析模型、基于信号及基于知识推理的故障监测方法[1]11-18.如果对系统运行机理比较熟悉,数学解析模型可以准确地被建立,我们就可以利用基于解析模型的方法来监测系统运行中可能出现的故障,但一般情况下,系统的数学模型很难建立,因此这种基于解析模型的方法很难在复杂工业过程中实施.当我们可以及时准确地采集到各部件的信号时,就可以使用基于信号的故障监测方法,该方法在监测系统故障时主要利用2项技术,一是信息融合技术;二是信号处理技术.要想通过基于信号的故障监测方法准确找到故障点和信号之间的关系,就必须详细了解系统的运行机理[2]541-545.基于知识推理的故障监测方法虽然不需要建立数学解析模型,但是要依据专家经验,并且要用机器学习和知识推理工具,进而达到人工诊断的目的.那些非线性动态复杂系统的故障监测通常要采用该方法.但是此方法也存在故障特征提取困难,相关数据处理复杂等问题[3]11-16.
针对上述各种故障监测方法存在的问题,结合现代复杂工业过程的特点,本研究将基于概率分布的混合决策表离散化方法[4]175-178及基于分明矩阵和约简树的增量式属性约简方法[5]125-129用在复杂工业过程状态监测中,阐述了知识获取、状态监测和监测性能评价方法.这种监测方法在一定程度上提高了复杂工业过程状态监测的效率和精度.
为了便于知识获取和故障监测,本文做如下设定:假设系统正常运转,信号样本用U=(x1,x2,…,xn)表示,系统运行的某个状态用qi表示,那么系统运行状态集合可记为Q=(q1,q2,…,qn).假设系统有m个故障源,用pi表示第i个故障源信号,那么用P=(p1,p2,…,pm)表示该系统故障源信号的集合.
为准确监测复杂工业过程的故障点,就必须实时准确的监视工业过程的运行状况.基于粗糙集的相关理论,可以按照下面的步骤进行工业过程的信息采集和知识获取:
1) 构造故障监测决策表,决策表构造后,其中的条件信号是故障源信号,系统运行状态信号作为决策属性,然后采用基于概率分布的混合决策表离散化算法进行离散化处理,表1为处理后的决策表.
2) 去除决策表1中的不相容及冗余样本.
3) 对表1中的冗余属性进行约简处理,去除冗余属性的方法利用的是基于分明矩阵和约简树的增量式属性约简算法.
4) 进行样本值约简处理,决策表的离散化直接决定着知识获取的准确度和精度,它是基础性的工作,因此离散化处理不但要减少属性个数,而且要尽可能减少有用信息的丢失.为了便于推理判断,决策规则必须采用逻辑语言的形式进行表示.
表1 故障监测决策表
一般情况下,有2种得到工业过程故障点知识的方法,分别为单点和多点故障的知识获取法.具体要采用哪种方法,还要根据实际工业过程的实际状况来合理确定.
1)单点故障
表2为单点故障源的故障监测表,其中用Di={pi}表示一个故障源的决策属性集,剩下的信号和系统状态信号Ci={p1,p2,…,pi-1,pi+1,…,pm,q1,q2,…,qn}表示决策表的条件属性.依据表2的形式,将由DCS机随机采集到的原始状态数据组成m个决策表,同时依据基于分明矩阵和约简树的增量式属性约简算法对m个决策表进行知识获取,就会得到单点故障源的监测规则.采用基于分明矩阵和约简树的增量式属性约简算法对每个决策表约简之后都可以得到故障源pi的一组故障监测正向规则集.依此规则集,可以观察到故障源pi的状态和其他故障源工作状况信号的关系.所以,判断某个样本是否存在故障的方法为:拿某个样本与该故障监测规则进行比对,若与该点的某条监测规则矛盾,则证明这个点是故障点,同时依据矛盾的规则判断出现故障点的原因是什么,如果和这个点的所有监测规则都差不多,则表明该点工作正常,没有故障发生.
表2 故障源信号pi的故障监测决策表
2) 多点故障
目前,现代工业过程更加复杂,系统在运行中,通常会出现多点故障.可以利用构造单源故障决策表的方法来构造多点故障源决策表.假设同时考虑信号源pi和pj的工作状况,则选择条件属性Cij={p1,p2,…,pi-1,pi+1,…,pj-1,pj+1,…,pm,q1,q2,…,qn},决策属性为Dij={pi,pj},就可以构造出联合故障监测决策表(见表3).
为了获得故障点知识,可以把混合故障源信号进行分解,因此对混合故障源信号知识的获取方法同单点故障源信号知识获取的方法相同.
表3 故障源信号pi和pj的联合故障监测决策表
上述故障监测规则是指在正常情况下故障信号和系统工作情况信号间的对应关系,即给出某一个故障点在其他故障信号及系统工作状况信号的某种“状态组合”下该点的信号值.由于总可以将故障决策表的各决策属性组合成为一个决策属性,因此笔者仅讨论对某一个复杂系统运行状况进行监测的情况.
根据复杂工业过程的运行状况和DCS机采集到的数据,构造故障监测的信息系统决策表.用S=(U,R,V,f)表示信息系统决策表,R=C∪D,C∩D=Φ,C={p1,p2,…,pm}是故障源信号组成的条件属性集,D={q}是复杂工业过程运行状态信号组成的决策属性集.采用合理的属性约简算法对S=(U,R,V,f)进行属性约简处理,最终可以得到故障监测决策规则θc→ψd,其中:θc=(p1,vp1)∧(p2,vp2)∧…∧(pm,vpm),ψd=(q,vq).
因故障监测决策规则有协调性的特点,则复杂工业过程运行状态信号的一个取值和系统故障源信号的某个状态组合的对应关系表示一条决策规则,反过来,几个系统故障源的某种状态组合代表着一个系统运行状态信号的取值.由此可见,监测规则分为正向监测规则和反向监测规则2种.正向监测规则:假设在k种状态信号下,用vq表示信号q的取值,则有(θ1∨θ2∨…∨θk)→ψd就变成了正向监测规则.反向监测规则:监测决策表的约简告诉我们在监测规则获取中ψd→(θ1∨θ2∨…∨θk)也是成立的,这种规则称为反向故障监测规则.正向故障监测规则和反向故障监测规则都可以被用作故障监测,这和决策逻辑中的正向和反向推理是相对的.
决策逻辑是在粗糙集知识获取以后进行具体应用的体现,它是采用知识进行推理,进而得到结论,从而进行结果判断和控制推理.依据推理方法不同,逻辑推理有下面3种:正向推理、反向推理、混合推理.
正向推理:所谓正向推理,其实是一种用数据驱动的推理方式,依据原本的事实,把它和规则库中的规则进行比较,如果满足某种规则,就会执行这条规则的结论;如果出现了新的事实,就会利用一样的方法对新事实和原来的事实进行推理.为了抑制循环现象的发生,此过程可利用一些控制策略.
反向推理:所谓反向推理,其实是目标驱动的一种推理方法,此过程主要是找到那些证明不需要采用规则的事实.具体方法是:随机确定一个目标,接着找到和目标结论有关系的规则,然后进行规则的验证,但是这之前需要看能否满足有关的规则,如果满足,则目标就被证明.为了抑制循环现象的发生,此过程可利用一些控制策略.
混合推理:混合推理吸取了正向和反向推理的优点,其实是一种正向和反向推理的循环和混合方法.从而避免了数据的盲目采集.
利用决策规则进行监测的步骤是:
1) 在复杂工业系统运行故障监测决策表时,当样本x|=(θ1∨θ2∨…∨θk),但x|=~ψd时,即可初步判定系统存在故障.如果对系统运行状况取值进行各种假设之后还可能导致某些样本和故障监测规则矛盾的话,就进行步骤2,否则,诊断结果就认为系统有故障发生.
2) 在各故障源pi的故障监测决策表中,当x|=ψd,且x|=~(θ1∨θ2∨…∨θk)时,即可初步判定系统在故障源pi上有故障出现,先对pi的取值进行各种假设之后,若还是不符合工业系统运行状况的故障监测规则,就直接跳至步骤3进行处理,否则就说明故障源pi为此工业过程的故障点.
3) 在各故障源pi的故障监测决策表中,从其他故障源中找到使ψd∧(~(θ1∨θ2∨…∨θk))成立的信号,同时判断那些点是否有故障.先对那些点的取值进行各种假设后,若还不符合工业系统运行状况的故障监测规则,就直接跳至步骤4进行处理,否则就说明这些点为此工业过程的故障点.
4) 在复杂工业系统运行故障监测决策表的故障源信号里找到使(θ1∨θ2∨…∨θk)∧~ψd成立的故障源信号点,同时判定这些点是否有故障.步骤3与步骤4构成了混合推理.
可以利用故障监测的正确率和误报率来定量分析故障监测决策规则中各信号源之间影响程度的大小.
设在∑中,信号源pi共有k种状态,与故障监测决策规则中关于决策j的规则相匹配的对象为Oij,则正确率有如下表达式:
则误报率为:1-γpi.
需要注意的是,这里的正确率仅表示故障监测时正确分类的一种可能性,是一种对监测效果的估计,并不代表实际工业过程中监测的正确率.监测的误报率主要是由状态空间模型的不完备性、不一致性引起的,但若事先对不一致性进行补充就可以将正确率最终提高到1.
本文结合工业过程的非线性化特点,把基于概率分布的混合决策表离散化方法及基于分明矩阵和约简树的增量式属性约简方法应用到工业过程状态监测中,阐述了工业过程知识获取、状态监测和监测性能评价方法.这种监测方法在一定程度上提高了复杂工业过程状态监测的效率和精度,具有一定的理论价值和实际应用价值.
[1] 马玉鑫.流程工业过程故障检测的特征提取方法研究[D].上海:华东理工大学,2014.
[2] 王冬梅,王继成.基于粗糙集的机车电线路故障诊断方法[J].长春工业大学学报(自然科学版),2008,29(05).
[3] 张德齐.基于粗糙集理论的电机故障诊断方法研究[D].锦州:渤海大学,2015.
[4] 黄景涛.基于粗集和概率分布的混合决策表离散化算法[J].计算机工程与应用,2009,45(07).
[5] 侯 枫.基于分明矩阵和约简树的增量式属性约简算法[J].计算机工程与应用,2011,46(11).
[责任编辑 梧桐雨]
Fault Monitoring Methods of Industrial Processes Based on Rough Set
LIU Fengnian
(SanmenxiaPolytechnic,Sanmenxia472000,China)
In order to deal with the problem of difficulty to establish model and high rate of false positives about traditional method of failure monitoring, according to the nonlinearity characteristics of the industrial process, a method for industrial process status monitoring was presented in this thesis. With this method, incremental algorithms for attribute reduction based on discernibility matrix and reduction tree and novel algorithm for discretization of mixed decision table based on probability distribution are applied to industrial process condition monitoring. This paper expounds the method of industrial process of knowledge acquisition and condition monitoring and performance evaluation. This kind of monitoring method improved the efficiency and precision of the industrial process condition monitoring, and it has certain value of practical application.
rough set; industrial processes; fault monitoring
2016-11-21
刘丰年(1982- ),男,河南三门峡人,三门峡职业技术学院讲师,硕士,主要从事模式识别与智能系统研究。
TP277
A
1671-8127(2017)02-0080-04