梁寒玉, 刘成瑞 *, 徐赫屿, 刘文静, 王淑一
1. 北京控制工程研究所, 北京 100094
2. 空间智能控制技术国防全国重点实验室, 北京 100094
航天器作为重要的国家战略资源,在军事侦查、气象观测、地质勘探和定位导航等领域发挥着重要作用,因此各国都对航天器的安全可靠稳定运行能力提出了迫切需求[1-2].然而,航天器工作环境恶劣,各种随机干扰极易造成其异常和故障,从而造成航天器部件、设备的性能随时间发生退化,阻碍在轨任务的完成,甚至导致航天器完全失效[3-5].伴随航天技术与空间探测任务需求的迅猛发展,星上系统不断高度集成化、智能化,系统结构复杂度也愈渐增加,在轨故障率显著提升,星上部件性能退化将直接影响到整个控制系统的稳定性与安全性.因此,航天器部件健康状态的合理预测与评估,成为当前航天器在轨管理的研究热点之一.
根据航天器在轨运行不易更换故障部件等特点,航天器通常采用故障预测与健康管理(PHM)技术对星上部件进行状态监测,结合设备结构、专家知识以及监测数据等多源信息,监测设备与过程异常,评估退化状态,从而预测设备从退化到失效的演变过程.文献[6]中采用堆叠去噪自编码器(SDAE)和自组织映射网络(SOM)对轴承退化健康因子进行提取并融合,实现风机和电机的健康状态监测,并为后续轴承寿命预测提供训练样本.张玉杰[7]考虑自变量系数不稳定以及最优自变量子集难以确定的问题,分别提出基于机理模型分析和基于数据驱动的性能退化特征提取方法,构建健康因子,然后面对突变间接健康因子和缓变间接健康因子的不同适配问题,分别提出基于自适应维纳过程和基于Copula函数的健康状态在线估计方法,实现飞机机电系统部件健康状态的在线估计.文献[8]中针对锂离子电池容量提出一种基于等效电路模型参数与充电电压曲线分析的健康因子提取方法,以提高后续SOH的预测精度.WANG等[9]针对旋转机械设备,提出机理模型与数据混合驱动的剩余寿命预测方法.文献[10]以陀螺仪与动量轮为对象,研究退化模型,并开发了寿命预测和可靠性分析软件.为解决运行和环境扰动引起的不确定性问题,ELSHEIKH等[11]对LSTM的结构进行改进,提出基于双向LSTM的剩余寿命预测方法.YU等[12]建立多个基于LSTM网络的退化量预测模型,并引入Bayesian模型平均方法,估计剩余寿命预测值和预测置信区间,有效提高剩余寿命预测精度的同时以置信区间的形式表示预测不确定性.陈娟等[13]面对航天器配电系统真实故障数据少等问题,建立配电机单机机理模型,以注入故障仿真的方式分析其退化过程,从而构建航天器健康状态仿真分析评估体系.文献[14]中针对卫星在轨条件下耗电负载工作特点,考虑深度放电与浅度放电2种不同情况,建立一套在轨环境下的卫星锂离子电池健康预测方法框架,从而实现卫星电池在轨健康预测.文献[15]针对现有纯数据驱动的航天器健康监测技术不能覆盖非测控弧段、遥测数据有限等问题,提出一种模型和数据混合驱动的航天器健康监测系统架构,通过遥测数据与模型的融合,实现对航天器全时间段、连续可靠的状态监控及状态预示.
航天器遥测数据复杂,多维参数之间相互耦合,而且关键部件的退化过程往往存在多个阶段,需要识别不同的退化阶段并建立相应的模型来进行健康状态预测.针对航天器部件的上述特点,本文提出一种基于无监督聚类与LSTM网络的航天器关键部件健康状态预测方法,利用航天器的多维遥测数据,合理提取并融合航天器部件的健康因子(HI),结合无监督聚类算法识别出不同退化阶段,并采用LSTM网络分别对各退化阶段构建健康状态预测模型,实现对航天器关键部件的健康状态预测.
健康状态演化规律可以直接反映出航天器关键部件由正常到退化乃至失效的全过程,是实现智能化状态识别的关键.不同关键部件的健康状态演化规律也不尽相同,其演化过程均反映在遥测数据中,因此有必要基于在轨遥测数据构建健康状态演化模型.
为了监测航天器的在轨运行状态,一般在关键部件上设置多个测点,测点采集的数据通过遥测方式下传到地面[16],遥测数据通常以时序数据为主.关键部件的遥测数据具有以下几个特点:
(1)数据复杂
关键部件往往组成、结构复杂,为全面监测运行状态,及时发现异常,一般会设置多种测点以监测其不同的部位,因此遥测数据呈现出维度高、数据量大和耦合性强的特点.
(2)样本不均衡
关键部件属于典型的高可靠性产品,在轨运行期间故障样本少,在轨数据一般呈长尾分布,这意味着正常样本比例远高于异常样本,对基于数据驱动的故障诊断与寿命评估带来极大挑战.
(3)易受干扰
航天器工作于外层空间,星上传感器易受到空间辐射干扰,而且遥测信号在传输过程中也会受到电离层不均匀闪烁干扰等影响[17].因此,遥测数据常包含干扰数据和野值.
由于关键部件在轨数据易受干扰,首先要对其剔野处理,以提升数据质量.对于遥测数据采集以及传输过程中所造成的干扰项,本文将采用插值补偿、数据平滑等方式,消除在轨数据的系统误差与随机误差,以保证数据处理方面的性能[18].此外,综合工程经验与实际应用,本文还将采用莱特准则(即3σ准则)进行在轨数据的野值剔除.
由于关键部件在轨数据复杂,其异常状态往往隐含在信号特征中,因此需要对在轨数据进行特征提取,得到能够反映运行状态的关键特征.
假设一段时间区间内的在轨数据为x=[x1x2…xm]T,本文通过表1所示处理获取具有显著物理含义、能够反映运行状态的关键特征.
表1 在轨数据特征提取Tab.1 On-orbit data feature extraction
考虑在轨数据的耦合性,要保证故障演化规律推演的准确性,仅凭航天部件的单一测量参数或者某参数的单个特征是不充分的,需要综合多维参数的多个时域特征,方可全面提取关键部件演化的退化特征.但是对于由多维参数的多个特征组成的高维特征,很难从中提取健康状态的演化规律,对此,本文考虑星载计算机运算能力和存储能力等约束条件,采用主成分分析法(PCA)融合关键部件的高维特征.
主成分分析是通过正交变换,将一组具有相关性的随机变量转化为线性独立的新随机变量.转化后的变量即为主成分,每个主成分都能够反映原始变量的大部分信息,且线性无关.设备性能的退化趋势通常是通过一条随时间演变的性能演化曲线表示,利用主成分分析法的降维原理,提取航天器部件多维参数多个特征中最具代表性的特征,即第一主成分,选取其作为关键部件的健康因子,反映部件的健康状态.
(1)
航天器关键部件的性能退化过程一般会经历多个不同阶段,例如磨合阶段、正常工作阶段、缓慢退化阶段和快速退化阶段等.在不同退化阶段中,其演化机理均是不同的,且在运行环境不同的情况下部件的退化阶段也有差异.因此,对于航天器部件性能退化阶段的划分并没有一个统一的界定.所以,需要对健康状态演化模型进行智能化的性能退化阶段识别.对此,本文考虑了基于密度的噪声应用空间聚类(DBSCAN)算法的优点,即无需提前设定簇群数量、自动根据数据样本密度划分簇群、对异常点不敏感以及具备一定抗噪能力等,研究了基于DBSCAN的性能退化阶段识别方法.
DBSCAN是一种典型的无监督式聚类算法,从样本密度的角度来考察样本之间的可连接性,并基于可连接样本不断扩展聚类簇以获得最终的聚类结果.DBSCAN以数据分布密度为划分依据推测聚类数目[19],其核心是将簇定义为密度相连的点的最大集合,并将密度较高的区域划分到一个簇群内[20].取1.2节PCA处理后的航天器关键部件健康因子HI=[HI1HI2…HIn]T为待分类数据集,则DBSCAN算法具体步骤如图1所示.
图1 DBSCAN算法流程图Fig.1 The algorithm flow chart of DBSCAN
然后,根据DBSCAN对健康因子HI的聚类结果,确定各簇群对应的时间点,对退化阶段进行划分,获取对智能化航天器部件性能退化的识别.
基于第1节,可以得到航天部件全寿命周期的健康因子,需要进一步建立多维遥测数据与健康因子的复杂映射关系,进而实现对健康因子的估计和预测.对于不同的退化阶段,本文采用多个深层长短时记忆网络(LSTM)对航天器健康状态演化过程进行建模和预测.深层LSTM网络结构如图2所示.
图2 LSTM网络结构Fig.2 The network structure of LSTM
it=σ(Wt·[ht-1,xt]+bt)
(2)
(3)
ft=σ(Wf·[ht-1,xt]+bf)
(4)
(5)
ot=σ(Wo·[ht-1,xt]+bo)
(6)
ht=ot⊙tanh(Ct)
(7)
其中,σ(·)表示sigmoid激活函数,W*和b*是各门控单元的权重和偏置.
考虑星上任务所需要的快速应对能力与准确性,为高效完成上述预测任务,本文将采用Adam优化器进行网络参数的优化,通过历史梯度的一阶动量和二阶动量的使用,有效控制学习率的步长与梯度方向,缓解梯度振荡和鞍点静止的问题.Adam优化器优化公式如式(8)~(10)所示.式(8)和(9)是根据历史梯度分别计算一阶动量和二阶动量,式(10)为权值更新公式.
mt=β1mt-1+(1-β1)gt
(8)
(9)
(10)
其中:β*是Adam优化器的固有参数,一般取经验值;gt为待更新参数的梯度;α为学习率.
此外,针对本文的寿命评估问题,上述神经网络中选取的精度指标是均方误差(mean square error,MSE),如式(11)所示
(11)
综合上述多种算法,本文提出的航天器部件健康状态预测方法具体流程如图3所示.首先,该方法以某特定故障模式下单航天部件的多维在轨遥测数据为输入,经插值补偿、野值剔除和切除停机数据等多项预处理,获取多维遥测数据的完整生命周期趋势.其次,对处理后的趋势数据进行时域特征提取,获取各维遥测数据的高维时域特征,利用PCA算法对高维特征进行降维处理,然后对降维后的融合数据进行无监督性能退化阶段识别,得到不同退化阶段和切分点,结合退化阶段辨识结果,采用最小二乘法对降维后的健康状态演化曲线进行拟合,得到健康因子估计值.最后,结合深层LSTM网络结构,构建基于多LSTM的健康状态演化预测模型,从而实现对航天器单部件不同退化阶段健康因子的评估与预测.本文算法具有一定的通用性,适用于动量轮、控制力矩陀螺等航天器关键机电部件,但由于不同部件的组成、配置、运行环境和退化模式等差异,针对不同的部件、工况和故障模式,需要利用本文方法分别进行退化阶段分析和建立预测模型,形成特定故障模式下的航天器单部件健康预测模型.
图3 航天器单部件健康状态预测流程图Fig.3 The flow chart of health status prediction of a single component in spacecraft
在航天器姿态控制中,控制力矩陀螺(CMG)仅消耗电能即可输出连续光滑的控制力矩,并且有较快的动态响应能力和较高的控制效率,是一类关键的执行机构,目前已在遥感卫星、空间站等航天器中广泛应用[21].但由于CMG关键部件长期保持高速运转,容易发生故障,根据其在轨运行数据合理预测与评估健康状态,对航天器的安全稳定运行具有重要意义.本文以CMG为例,针对其低轨运行环境下的阻力矩增大故障模式,利用实际在轨数据对上述方法进行验证.
CMG主要包括机构和线路2部分.机构主要由3部分构成:高速组件(高速转子)、低速组件和连接支架(框架),如图4所示.其中,高速组件的作用是通过高速转子产生角动量;低速组件则通过驱动低速框架转动带动安装在连接支架上的高速组件旋转,通过改变高速组件角动量的矢量方向输出控制力矩.
图4 CMG本体组成框图Fig.4 The block diagram of CMG composition
本文整理了某型卫星中CMG的在轨数据,这段数据涵盖该CMG从正常到退化再到失效的全过程,共含有CMG的9个测点,包含高速组件和低速组件关键部位的测量信息.考虑到遥测信号特点以及后续演化曲线建模的准确性,采用1.1节的预处理方法对数据进行野值剔除.由于演化模型主要考虑CMG工作阶段的性能退化演变过程,对CMG失效后的数据以高速转子转速为基准(CMG故障后转子转速快速下降到0)进行切除,仅保留故障时刻之前的数据,处理后的数据集共计47万余条.图5~7给出处理后的高速转子转速、高速电机电流、低速轴承温度和低速电机电流的数据曲线,这些曲线截止到故障前的时刻.由图5~7可知,在CMG失效前,显然低速轴承温度、低速电机电流和高速电机电流的幅值均从在轨运行的280 000时间点左右开始出现增大趋势,说明在该CMG完全失效前,系统已经出现缓变性能退化趋势.
图5 高速转子转速与低速轴承温度退化数据Fig.5 The degradation data of high speed rotor speed and low speed bearing temperature
图6 高速转子转速与低速电机电流退化数据Fig.6 The degradation data of high speed rotor speed and low speed motor current
图7 高速转子转速与高速电机电流退化数据Fig.7 The degradation data of high speed rotor speed and high speed motor current
由于航天器采样密集,数据量在十万级左右,并不利于后续趋势分析.因此,在特征提取阶段,对数据采用滑窗处理,取滑窗大小为500;并对9个测量参数提取平均值、整流平均值、方差、均方根、方根幅值、峭度、偏度、波形因子、峰值因子和脉冲因子共10个时域特征值,从而获得9维参数的时域特征矩阵,共90维,部分数据特征图像如图8所示.然后,采用PCA算法将90维参数特征矩阵融合成一维健康因子,并将其归一化至0到1区间内,如图9所示.健康因子走势成单调递减,前半部分平缓,后半部分快速下降,符合CMG性能退化实际情况.
图8 部分参数的部分时域特征图像Fig.8 Part of time-domain feature images of partial parameters
由于曲线演化趋势存在明显区别,需要对CMG的退化阶段进行辨识,获得合理退化阶段切分点,再在此基础上分段对健康因子进行拟合.本文采用2种无监督聚类算法,一种是Kmeans方法,另一种是1.3节提出的方法,2种算法的基本参数如表2所示,可获得如图10所示的划分结果.
图10 退化阶段无监督辨识结果Fig.10 Unsupervised identification results of degradation stage
表2 无监督聚类算法参数设置Tab.2 The parameter setting of unsupervised clustering algorithm
由于Kmeans算法需要人为选择簇群个数,聚类结果较为主观.从图10(a)来看,Kmeans算法识别的退化阶段将缓慢退化阶段切分为二,与实际退化过程的物理意义并不相符.DBSCAN算法相比较之下缓慢退化阶段与快速退化阶段的切分点划分得更切合实际.为保证预测算法的简洁性与实用性,本节选取DBSCAN算法的识别结果作为划分依据.根据算法对数据特征的分类结果,对应到分类交界处的时间点,选取图10(b)中2大阶段交界处(圈出区域)阶段分界中点676作为此类故障模式下的退化阶段切分点,并整合退化末期的多个退化阶段,对健康状态演化曲线进行预测.
为获得单调性和趋势性较好的健康因子曲线,运用1.2节中介绍的健康因子估计方法,对上述健康因子曲线进行拟合,构建健康状态演化模型.根据性能退化阶段辨识结果,以676为切分点,对HI曲线进行分段拟合,获得如图11的拟合结果.其中,缓慢退化阶段的拟合函数如式(12)所示,快速退化阶段的拟合函数如式(13)所示
图11 健康状态演化模型Fig.11 Health state evolution model
HIn=-1.848 +e(1.948-t0.104)0.003
(12)
HId=-2.929×t3+ 7.082×10-5×t2-5.762×10-5×t+16.197
(13)
其中,t为时间点,HIn为缓慢退化阶段的健康因子拟合值,HId为快速退化阶段的健康因子拟合值.
考虑到航天器运行工况的不同,需要构建普适性的性能随时间推演的预测模型,以实现从部件已知测量参数特征融合的健康因子合理拟合出其健康状态演化模型.采用第2节方法分别对缓慢退化阶段和快速退化阶段的健康因子演化模型搭建LSTM网络,以全连接层输出为健康因子预测结果,获得如图12所示的预测结果.其中,各阶段预测网络的参数设置,如表3所示,按照蒙特卡洛法搜索获得的最佳神经元个数设定.
图12 健康状态演化模型预测结果Fig.12 The predicting results of health state evolution model
表3 健康状态演化预测模型各阶段网络参数Tab.3 The each stage network parameter setting of health status evolution predication model
由于缓慢退化阶段的序列较长,训练过程可能存在梯度损失,其预测曲线存在较大振荡,但后期下降趋势能够完美跟随,该阶段的预测模型学习精度可达到0.004 5左右.相比而言,快速退化阶段序列较短且趋势简单,符合单调下降的特点,预测模型跟随效果较好,学习精度MSE可低至0.000 5.试验表明,本文的健康状态预测模型对各阶段可以实现较好的趋势预测,预测结果与该CMG的健康状态演化曲线一致,满足现实工程预测需求.
面向航天器机电类关键部件健康状态预测的迫切需求,提出一种基于无监督聚类与LSTM网络的航天器健康状态预测方法.
针对航天器单部件多维遥测数据复杂、耦合的情况,给出数据预处理和特征提取方法,并基于高维特征降维后的融合曲线分别建立无监督的退化阶段辨识方法和健康因子估计方法.在此基础上,针对不同的退化阶段,采用多个深层长短时记忆网络(LSTM)对航天器单部件健康状态演化过程进行建模,得到多维遥测数据到健康因子的复杂映射关系,从而实现航天器单部件健康状态预测.
以CMG这一关键部件为例,利用其在轨实际退化数据对提出的方法进行验证.结果表明,提出的无监督退化阶段辨识方法对CMG的退化过程分析合理,建立的健康状态预测模型能够准确预测CMG的健康状态演化曲线,验证了方法的有效性.