一种基于灰色理论-隐马尔科夫模型的装备故障预测方法∗

2018-08-28 02:50杨金宝曹现宪
舰船电子工程 2018年8期
关键词:马尔科夫灰色概率

杨金宝 梁 勇 曹现宪

(1.海军工程大学信息安全系 武汉 430033)(2.91878部队 湛江 524000)(3.92916部队 三亚 572425)

1 引言

隐马尔科夫(HMM)模型是一种描述随机过程统计特性的概率模型,是由马尔可夫链演变发展而来[1]。马尔科夫链是一个离散变量的随机过程,其一系列状态之间的联系,通过一个状态转移概率矩阵来描述。状态之间转变具有相应的转移概率,并且状态转移概率仅仅依赖于当前的状态,与过去的状态无关。与马尔科夫链不同,HMM是一个双重的随机过程,一个随机过程是具有有限状态的马尔科夫链,描述状态的转移;另一个随机过程描述每个状态和观察值之间的统计对应关系[2]。不仅状态之间的转移是随机的,而且每个状态的观察值也是随机的,站在观察者的角度只能看到观察值,不能直接看到状态,而是通过一个随机过程去感知状态的存在及其特性。因此对观察者而言,实际的状态序列不能直接观察,而被隐藏起来,因此称为隐马尔科夫模型。

灰色理论认为任何随机过程都是在一定幅值范围和一定时区变化的灰色量,并把随机过程看作灰色过程。该理论认为尽管客观系统数据表现离乱,但它总是有整体功能的,因此必然蕴含某种内在规律。灰色系统是通过对原始数据的整理来寻求其变化规律即称为灰色序列生成[3]。一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。因此本文尝试将灰色理论与HMM模型结合,用于某型装备的状态监测与故障预测研究。

2 基本理论

灰色系统是通过对原始数据的整理来寻求其变化规律即称为灰色序列生成。理论上一切随机过程,不管其系统原始测量数据表现有多离乱,但它总是有某种内在规律性,关键在于如何选择适当的方式去挖掘,弱化其随机性,显现其规律性。而这个显现规律性的过程称为“变白”[16]。

2.1 灰色序列生成

灰色系统在建模时常用以下几种序列缓冲算子对原始数据进行生成处理,使生成的数据序列具有一定规律。也就是逐步由灰变白的基本方法。

l)累加生成

累加生成[43]是使灰色过程由灰变白的一种方法,通过数据累加来弱化数据信息的随机性,显示出数据中蕴涵的规律,从而建立系统预测模型。对于非负序列,累加生成次数越多,数列的随机性就弱化得越多,在GM模型中一般只对数据作一次累加生成。

称D为X(0)的一次累加生成算子,记为1-AGO(Accumulating Generation Operation,AGO),称 r阶算子Dr为 X(0)的r次累加生成算子r-AGO,习惯上记为

非负序列经过上述累加生成后都会减少随机性,呈现出近似的指数增长规律。原始序列越光滑,生成后的指数规律也越明显。

2)累减生成

累减生成[43]是在获取增量信息时常用的生成,与累加生成是一对互逆的序列算子,设有原始序列为序列算子

称D为X(0)的一次累减生成算子,r阶算子Dr为X(0)的r次累减生成算子记为

3)均值生成

由于一些不可预知的外界因素有时会导致数据序列出现空缺,或数据虽完整但某个点的数据为明显异常数据,删除该数据也会导致原有数据序列出现空缺,均值生成成为填补空缺数据的有效方法。设序列 X=(x(1),x(2),…,x(n)),若x*(k)=0.5x(k)+0.5x(k-1)则称x*(k)为紧邻信息的均值生成,由紧邻均值生成数构成的序列称为紧邻均值生成序列。

2.2 灰色模型的建立

由上述灰色序列生成方法,我们采用累加生成来构建灰色模型。

计算GM(1,l)模型的背景值:

2.3 HMM预测的基本原理

HMM作为一种信号动态时间序列统计模型,非常适合处理连续动态信号,并且它具有学习功能、自适应能力,能够通过训练获取知识来监测系统的状态[4]。隐马尔可夫模型在工业过程性能监控和故障分类领域,都获得不错的效果。

1)HMM的基本参数

HMM根据观测信号的性质分为两类:连续隐马尔可夫模型(CHMM)和离散隐马尔可夫模型(DHMM)。HMM包括具有状态转移概率阵A的Markov链和输出观测值的随机过程,其状态是不确定或不可见的(即隐藏的),只有通过观测序列的随机过程才能表现出来(即通过观测概率矩阵B相联系)[6]。一个HMM可以由下列参数描述[23]:

N:模型中马尔可夫链的状态数目。记N个状态为S1,S2,…SN,记t时刻马尔科夫链所处的状态为 q 且

M:每个状态对应的可能的观测值数目。记M个观测值为O1,O2,…OM,记t时刻的观测值为Oj且

式(7)中q1,表示初始时刻1的状态;

对于连续HMM,B是一组观测值概率函数即:

故一个HMM可记为:λ=(N,M,π,A,B),简写为:λ=(A,B,π)。

预测就是确定方法来调整模型参数λ=(A,B,π),使得出现某一个给定的观察序列的概率最大。用解方程的方法来求解是行不通的。对给定一个有限的观察序列作为学习集,估计模型参数的最好的方法并不存在。但是我们可以找出参数 λ=(A,B,π)使得 P(O|λ)局部最大化[7]。

首先确定在给出模型参数和观察序列的前提下,t时刻为状态qi,j时刻为状态Sj的概率,即:

从前向及后向变量的定义,可以将ξt(i,j)写成以下形式:

如果将γt(i)关于t求和,则可得从状态Si转出的次数期望,即除了t=T时刻外,从状态Si中转出的次数的期望。类似的,将关于t从1到T-1求和,则可得从状态Si到状态Sj转移的次数的期望[8],用式子表示如下:=从状态Si转出的次数的期望=从状态Si转到 Sj的次数的期望

3 基于GM(1,1)-马尔科夫预测模型处理方法

3.1 GM(1,1)模型的建立

设原始序列为

式中:x0(k)≥0;k=0,1,…,n。

对x0作一阶累加处理,有

对x1作紧邻均值生成,生成后的数列为

作最小二乘估计,计算GM(1,1)的模型参数a,u。

则GM(1,1)模型 x0(k)+az1(k)=b的最小二乘估计参数列满足:

通过时间响应式得到估计值序列为

3.2 GM(1,1)模型的检验

灰色模型的检验主要有四种检验方法:平均相对误差检验、关联度检验、均方差比值检验、小误差概率检验。上述四种检验方法都是通过残差对模型的精度进行判断,其中平均相对精度误差、均方差检验都要求值越小检验结果越好,关联度检验、小误差概率要求值越大检验结果越好。常用的等级标准见表1。

表1 精度检验等级参照表

对 于 p0≤0.70,C≤0.65,ε0≤0.70,Δ≥0.10 的模型,一般被认为是不合格的模型。如果建立模型的平均相对误差、关联度、均方差比值或小误差概率中有两个或两个以上在允许的范围内,则认为模型是合理的。如果全部不合格,则需要进行修正。

4 基于GM(1,1)-马尔科夫模型的装备故障预测

本文提出的基于马尔科夫和灰色理论的装备故障预测流程如下。

首先用灰色预测模型GM(1,1)得出的预测值与实际值比较,得出误差,形成一个残差数列,然后对该数列再进行马尔科夫预测,增加模型的预测精度。运用马尔科夫预测法进行预测,主要工作就是马尔科夫预测模型的构建,即利用初始状态的概率向量和状态转移矩阵来推测预测对象未来某一时间所处的状态。

用Pij(k)表示预测对象由状态θi经过k次转移至状态θj的概率,即k步转移概率:

式中:Mij(k)为自由状态θ经过k次转移至状态θj的原始数据样本数;Mi为处于状态θi的原始数据样本数。Pij(k)构成的矩阵为

P(k)称为k步转移概率矩阵。

马尔科夫预测的步骤如下:

1)划分预测对象的状态。为了构建状态转移概率矩阵,首先要进行状态划分,即将数据序列分成若干状态。对GM(1,1)模型预测后的残差序列进行状态划分,其任一状态θi可以表达为:。对于 θi的含义、状态划分数目n和灰

计算后得出状态转移矩阵P(k)。

4)建立模型进行预测。通过一步转移概率矩阵,确定了系统未来的转移状态后,也就确定了灰元 θ1i,θ2i,即 确 定 了 预 测 值 的 变 动 区 间 为预测值可由下式计算:元θ1i,θ2i的确定,可以根据研究对象和原始数据来确定。

2)统计状态转移情况,即统计Mij(k)。它表示状态在θi,经过k次转移至状态θj的原始数据样本数。该模型中k的取值为1,表示一步转移。

3)计算转移概率和状态转移概率矩阵。计算公式为

5 算例与分析

我们通过“某装备远程维修支援系统”以及相关调研活动获取并整理得某样本区域2008年至2016年的某型装备故障发生率(见表2)。

表2 某样本区域某型装备故障发生率(%)

由式(13)~(18)计算得预测结果(见表3)。

表3 某样本区域某型装备故障发生率预测过程及结果(%)

由式(5)~(12)计算得预测误差(见表4)。

选取具有代表性的相对误差检验和均方差比值检验两种方法进行检验,精度都达到了一级标准。分别选取2015年和2016年的故障发生率估计值用马尔科夫进行残差修正,得新的估计值、相对误差和未修正之前对比见表5。由表5看到,灰色模型经过马尔科夫链修改过后,精度明显提高[16]。

对2017年该样本区域某型装备故障发生率进行预测。从2008年t为0算起,此时t=9。计算得:

表4 某样本区域某型装备故障发生率预测误差(%)

表5 马尔科夫修正后误差对比(%)

该样本区域某型装备故障发生率预测结果为

利用灰色预测模型计算出2017年在该样本区域某型装备故障发生率的预测值与实际值存在误差,将误差值构成新的数列。由于这些数据的单位过大,为保证预测精确度和计算的方便性,结合几年来该样本区域某型装备故障发生率的具体情况,将数据序列划分为五个状态,这些状态界限都是上界限包含在区间内,下界限不包含在区间内,具体见表6。

表6 状态划分表

通过对2015年和2016年某样本区域某型装备故障发生率的预测的马尔科夫修正可以看出GM(1,1)模型和马尔科夫预测的科学性和合理。同时,根据历史数据可以得出2017年该样本区域某型装备故障发生率预测值为12.605%。

6 结语

针对复杂电子装备由于系统复杂性、故障关联性以及监测信息不完备而引起的系统故障树或多信号模型很难建立的情况,提出利用HMM作为分类器,实现对早期故障因素模式的识别,并对HMM的类型、结构和相关参数的选择进行了分析[15]。在此基础上提出了基于马尔科夫模型(HMM)与灰色理论相结合的某电子装备故障发生率的预测方法,通过详细分析其、故障发生率、故障类型与潜在故障因素之间的统计关系和特点,对预测模型的参数进行优化,从而建立其符合该型装备故障发生率的灰色-马尔科夫预测模型,通过实例验证了该预测模型具有一定的状态预测精度。由于各种条件限制,预测模型还存在不足,一是数据采集量还很小,数据质量不够高;二是对于故障模式的识别算法在数据有限的情况下,分析和识别准确度偏低,还难以达到很高的精度。下一步将继续深入地研究基于HMM的模式识别模型,实现在不同数据量情况下的参数优化。同时研究基于多传感器的装备状态监控和信息采集技术,弥补人工信息采集的局限,建设标准化、通用化的故障信息数据库,以进一步提高预测精度。

猜你喜欢
马尔科夫灰色概率
基于三维马尔科夫模型的5G物联网数据传输协议研究
概率统计中的决策问题
概率统计解答题易错点透视
马尔科夫链驱动的带停时的超前倒向随机微分方程的适应解
基于叠加马尔科夫链的边坡位移预测研究
概率与统计(1)
概率与统计(2)
浅灰色的小猪
马尔科夫链在企业沙盘模拟教学质量评价中的应用
马尔科夫链在企业沙盘模拟教学质量评价中的应用