基于FCM-ARIMA的多阶段退化设备寿命预测研究

2021-11-17 06:35李潇瀛李昌均
计算机仿真 2021年8期
关键词:监测数据拐点聚类

李潇瀛,方 鸽,李昌均

(1.西安工业大学新生院,陕西 西安710038;2.93140部队,广东 广州 510052;3.空军工程大学研究生院,陕西 西安 710038)

1 引言

随着设备的复杂性和其自身价值的提高,在设备运行过程中对其进行信号的监测,进而评估设备健康状态并对设备寿命进行预测成为一种通用做法。设备寿命预测是进行维修决策,降低设备使用寿命周期费用的基本前提,也是预测与健康管理(Prognostics and Health Management,PHM)最为关键的部分[1,2]。对设备进行寿命预测的方法可以主要分为基于物理失效模型的方法和基于机器学习的寿命预测方法,基于物理失效模型的方法通过分析设备工作机理得出其退化函数,进一步通过估计设备当前状态得出寿命预测;基于机器学习的寿命预测方法主要利用设备退化数据,由算法学习设备退化规律,从而对设备的寿命进行在线或离线的预测[3],由于其对监测数据自动处理的优势得到了越来越多的应用。

近期发表的一些研究表明,相当一部分设备和部件的退化呈现出明显的多阶段特性[4],此外,对于间歇性工作的设备来说,即使其退化过程为线性过程,由于其寿命过程为休眠状态与工作状态交替,其退化过程也呈现出多阶段退化的特点[5]。为了实现对多阶段退化设备进行准确的寿命预测,在文献[6]中,作者使用聚类的方法对系统的不同退化阶段进行估计,得到拐点之后,针对不同退化阶段特点采取对应的维修策略。文献[7]利用同类设备退化特性对设备退化拐点进行估计,进而用支持向量回归机对设备寿命进行预测,文献[8]利用纯机器学习的方法对设备退化信号进行特征选择,确定特征与标签的关联度后对设备退化进行分析。此外,文献[9]在考虑多阶段的基础上,同时对随机跳跃的退化现象进行了分析建模。

现阶段,机器学习的方法主要将其重点放在了模型的构建以及对参数的优化[10],其实质是在未充分设备退化基本机理的情况下,通过设备退化过程中收集到的数据,对于多阶段的很难仅仅通过机器学习的方法进行学习。针对多阶段退化设备特点,本文提出一种模糊C均值-差分整合移动平均自回归(Fuzzy C-Means Clustering-AutoRegressiveIntegratedMovingAverageFCM-ARIMA)的算法,将系统的多阶段退化作为先验知识,将设备的退化过程进行划分,首先通过FCM确定设备退化过程中的拐点,确定设备所处的退化状态,针对不同的设备退化阶段,分别用ARIMA方法进行状态估计与寿命预测,从而避免直接在无先验知识的情况下直接使用机器学习的方式对多阶段退化设备进行寿命预测,最后通过一个多阶段退化设备实例对本文提出方法的有效性进行了验证。

2 多阶段退化设备寿命预测

2.1 多阶段退化设备描述

多阶段退化设备的退化过程呈现比较明显的阶段性[11,12],在本文中,将退化过程分为正常退化状态、轻度退化状态、中度退化状态和接近失效退化状态。如果状态评估不及时或不准确,当设备退化到一定阶段后,任何工作时间都可能发生系统功能失效,对多阶段退化设备进行准确的寿命预测,是对设备实现预防性维修,避免因失效带来事故的必要前提。

一个典型的多阶段退化系统如图1所示,在设备到达一定的退化量门限值后即认为设备失效。从图中可以看出,设备在整个工作寿命周期内呈现出比较明显的多阶段退化特性,这种特性可能是由于设备本身物理机理导致,也有可能是在使用过程中环境变化或使用强度的变化所导致的。

图1 多阶段退化设备退化量随工作寿命变化曲线

2.2 设备退化拐点分析

由于多阶段退化设备分段的特性,使用单一的寿命函数对退化过程描述具有局限性,无法同时表征不同阶段退化的特点,在本文中将采用分段描述的方式来进行设备寿命预测。而建立设备的分段描述函数,首先需要通过数学方法对设备分段拐点进行估计,进而将监测数据分配到与其退化特性相匹配的阶段。

由以上分析可知对于多阶段退化的设备,先验知识只有设备退化所呈现的阶段数量,基于退化量的量化来分配退化阶段是比较简单的一种方法,但这种方法忽视了设备之间本身的差异性。因此,对于设备退化拐点的估计应使用无监督的学习方法,通过个体设备退化特性,评估每一个监测数据对于不同类群的隶属度,并设定相应的目标函数,使得类间的距离尽量大,而类内的差异尽量小,即可得出设备退化监测数据的拐点,进而将退化过程划分为几个阶段。

2.3 设备寿命预测

由于对设备退化物理模型的精确刻画存在一定的困难,目前在有一定监测数据的条件下主要采用基于数据驱动的方法对设备剩余寿命进行预测,而此类方法包括统计模型、设备可靠性函数和人工智能等方法。如前文所述,随着人工智能和机器学习算法的发展,此类方法在处理设备剩余寿命预测和回归问题得到了越来越广泛的应用,但在没有先验知识的情况下,直接对多阶段退化的设备监测数据进行回归分析结果往往并不理想。本文将在使用机器学习算法进行回归之前,通过拐点估计得出多阶段退化设备的分段,进一步的,再对分段后的检测数据利用人工智能的方法进行处理和分析。

3 FCM-ARIMA算法拐点估计与寿命预测

3.1 FCM算法拐点估计

在本小节中,将介绍通过使用FCM实现监测数据聚类的过程。传统的聚类方法(如C-均值聚类)中,每个监测数据被分配到一个聚类中心。然而,对于散落在聚类边界上的数据,由于其对聚类中心的隶属度存在一定的模糊性,将其分配到一个聚类中心是不合理的。此外,在传统的聚类方法中,数据只属于一个聚类,具有100%的确定性。但这种假设在实际应用中并不合理。因此,本文采用FCM方法,引入模糊隶属度来更好地表示不确定性。

在实际应用中,仅靠主观信息不能直接获得设备退化的实时状态,首先设定4个退化状态的中心是V={v1,v2,…,vc},vi⊂Rp,监测到的设备退化数据为X={x1,x2,…,xn},xj⊂Rp,其中xj表示监测到的第j个无标签数据。因此,为了评估设备退化过程并选择不同状态之间的拐点,必须将无标签的数据标记为不同的退化状态。vi表示第i个退化状态的聚类中心,设U为n个监测数据对c个退化状态聚类中心的隶属度矩阵

(1)

采用欧氏距离度量第j个监测数据到第i个聚类中心的相似度。距离定义为

(2)

通过聚类,可以得到每个监测数据对不同聚类中心的聚类的结果。为了评价被监测数据所处的退化状态,本文以监测数据到聚类的模糊隶属度加权距离最小为目标。因此,目标函数可以表示为

(3)

将拉格朗日函数对V求梯度归零可得

(4)

将拉格朗日函数对U求梯度归零可得

(5)

(6)

对于大多数设备或部件来说,拐点的估计并不能通过直观的方式得到。因此,对于这类时间序列,可以通过隶属度矩阵求出其拐点。在本文中,考虑到处理对象的是连续监测的退化数据而不是随机分散的数据,假设每个被监测的数据只能被分配到两个相邻的状态。因此,将绝对隶属度差值小于0.1的两个相邻退化态的数据作为两个相邻退化态的拐点,即

uij-ui(j+1)≤εm(∀i=1,…c,j=1,…n)

(7)

3.2 ARIMA算法

ARIMA算法是时间序列预测分析方法之一。它的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。对于以时间为基准的监测数据可以较好的进行预测。

自回归模型是利用当前值和历史值之间的关系,用变量自身的历史数据对自身进行预测。p阶自回归过程表示第n个数据与第n-i的关系,γi为自相关系数,为要求解的参数。p阶自回归过程的公式定义为

(8)

移动平均过程可以作为自回归过程的补充,解决自回归方差中白噪声的求解问题,它具有滞后性,其模型形式为

(9)

自回归移动平均模型由两部分组成:自回归部分和移动平均部分,因此包含两个阶数,可以表示为ARMA(p,q),p是自回归阶数,q为移动平均阶数,回归方程表示为

(10)

ARIMA模型能够用于齐次非平稳时间序列的分析,这里的齐次指的是原本不平稳的时间序列经过d次差分后成为平稳时间序列。

本文所提出的FCM-ARIMA算法针对多阶段退化设备特性,首先由FCM对监测退化数据进行拐点估计,之后通过拐点将退化过程分为几个不同阶段,之后由ARIMA算法分别对各阶段的监测数据进行回归分行,进而对设备寿命进行预测。

4 多阶段退化设备寿命预测验证

本节将对图1中的多阶段设备退化数据进行实验验证,首先通过FCM算法,分析数据退化不同阶段拐点,利用RF算法对退化各阶段数据进行分析与寿命预测。

4.1 退化设备监测数据拐点估计

聚类迭代过程目标函数度量随迭代次数变化如图2所示,可以看出,在聚类中心进行大约15次迭代后,目标函数度量下降到0附近,表明此后聚类中心不再后大的调整。

图2 聚类迭代过程目标函数度量

对退化监测数据的聚类结果如图3所示,以可比较直观的看出,通过聚类过程,设备的退化过程被4个聚类中心分成了4个阶段,不同阶段之间的退化速率有较大区别,如第二阶段和第三阶段相比,后者退化速率明显要高于前者,将此过程进行分阶段处理结于后续分阶段进行寿命预测比较合理。

图3 多阶段退化设备监测数据聚类结果

监测数据对于不同聚类中心的隶属度如图4所示,可以看出,相比于传统的C均值聚类,FCM算法可以允许数据同时隶属于不同聚类中心,对于拐点估计来说,可以对更加准确的对拐点隶属度进行度量。

图4 监测数据对于不同聚类中心隶属度

通过以上聚类过程,设备退化的3个拐点分别为51、104和160。

3.2 退化设备分阶段寿命预测

寿命预测部分实验首先仅使用ARIMA方法,在未进行拐点选择的条件下,在输入60%的监测数据后,对剩余40%退化数据进行预测,预测结果如图5中红线所示:

图5 ARIMA方法寿命预测结果

从图5的结果可以看出由于设备退化存在多阶段特性,在开始时仅用ARIMA方法,预测结果与实际退化量符合较好,但当退化进入下一阶段时,方法的预测结果逐渐偏离实际值。

使用本文提出的方法预测结果如图6中红线所示,在FCM方法估计拐点后,将设备退化的过程分为4个阶段,在每个阶段输入60%数据对剩余40%进行预测。可以看出,预测结果比较好的符合了退化的阶段特性,结果优于图5中结果。

图6 FCM-ARIMA方法寿命预测结果

5 结束语

本文针对多阶段退化设备特性,提出了一种FCM-ARIMA的拐点估计与寿命预测方法,首先分析了多阶段退化设备寿命预测的特点和准确性影响因素,将FCM与ARIMA相结合,实现了多阶段退化设备拐点估计以及基于拐点分段的寿命预测,并通过实例与未进行拐点估计的方法相比较,验证了所提出方法的有效性。

猜你喜欢
监测数据拐点聚类
饲料涨近1000元/吨,鱼价大幅下滑,2022年草鱼盈利拐点在哪?
一种傅里叶域海量数据高速谱聚类方法
水产动保临行业“拐点”,众多江苏动保企业今日集聚,欲实现弯道超车
基于知识图谱的k-modes文本聚类研究
一种改进K-means聚类的近邻传播最大最小距离算法
基于模糊聚类和支持向量回归的成绩预测
拐点
《廉洁拐点》
浅谈环境监测垂直管理的优势
环保验收监测异常数据的分析与处理探讨