周雪霁陆正亮张 翔廖文和
(南京理工大学机械工程学院,江苏 南京 210014)
航天器姿态确定与控制系统(下称ADCS)的故障诊断技术是保障航天器安全、平稳运行的核心技术和重要手段。通常来说,由于航天器具有高可靠性和高安全性的设计原则,故障样本少,故障标签稀缺,并且初期故障往往微小而不易察觉,因此对故障诊断的敏感性和实时性提出了很高的要求。
阈值判定法最初是基于专家系统而提出的一种故障诊断方法[1],原理简单易于理解,但是依赖于丰富的专家经验和领域先验知识,检测精度低,可扩展性差,使得这种方法很难在日益复杂的航天器系统上得到进一步的应用。在此基础上,基于模型的故障诊断方法应运而生。其中,基于观测器和卡尔曼滤波的研究一直很热门,无论是在线性系统上[2-3],抑或是在非线性系统上[4-6],前人已经做了很多工作。这种方法的优点是能够比较清晰地展示系统变量之间的相互关系,故障传播路径一目了然,缺点是故障诊断精度依赖于模型的精度,并且建模时存在很多难以量化的因素,亟待学者研究解决。
随着机器学习的兴起,基于神经网络的故障诊断技术发展迅速。与基于模型的故障诊断方法相比,这种方法不依赖于建模,所以不需要根据研究对象增删模型参数,只是通过学习数据特征来获得估计值。文献[7]将神经网络与支持向量机(Supported Vector Machine,SVM)相结合,通过神经网络学习故障数据的残差特征,为SVM提供分类的依据,实现对卫星ADCS的有监督式故障诊断;文献[8]采用随机森林(Random Forest,RF),学习故障数据的特征,实现对卫星不同故障的分类与辨识。这种有监督式故障诊断方法的前提条件是故障标签充足,专家经验丰富,也就是对于已知故障的诊断效果很好,但是对于未知故障的诊断效果一般。
航天器ADCS的特点之一就是故障标签稀缺,存在很多未知故障,所以无监督式故障诊断方法应运而生。文献[9]结合多源信息融合与统计学等知识,基于长短时记忆网络(Long Short-term Memory,LSTM)对通信卫星高维遥测数据进行预测与故障检测;文献[10]设计了一种基于卷积神经网络(Convolutional Neural Network,CNN)与LSTM的传感器数据流异常检测方法,并利用K-Means聚类使检测结果更加稳定;文献[11]利用深度置信网络(Deep Belief Networks,DBN)为飞机建立动态特性观测器,从而预测航空传感器的输出。
然而,前人关于输出预测的研究只是获得预测残差,从而识别故障,没有考虑传感器本身的故障特性,容易导致虚警率过高,并且用于输出预测的模型本身存在泛化性和实时性等方面的缺陷。针对这些不足之处,本文提出了基于GRU-AE模型的故障识别方法,同时考虑传感器的故障程度,利用DBSCAN聚类对故障进行定位,实现对航天器姿态敏感器的故障诊断。
本文讨论的传感器故障,是指由于各种原因而导致的传感器输出数据异常,包括短路、断路、漂移、偏差等。当发生短路和断路时,由于特征明显,不需要训练模型来完成故障识别,只需作为一条判断的规则写入模型即可。因此,本文主要研究传感器的漂移和偏差。从建模和仿真的角度出发,漂移是乘性故障,偏差是加性故障[12],可以统一用一个线性模型来表达:
式中:α是恒增益系数,用于描述传感器的漂移,Δy是恒偏差系数,用于描述传感器的偏差,s(t)是随机噪声,默认符合高斯分布,T为故障发生的时刻。
传感器故障具有硬故障和软故障两种,漂移和偏差均属于后者,可以通过算法予以补偿。也就是说,即使传感器在一定程度上存在漂移和偏差,只要不超过某个特定的阈值,或者故障总时长不超过某个特定的上限,传感器就依然算是正常工作,此时不能判断传感器存在故障,否则就会导致虚警率过高。
航天器姿态的确定依赖于姿态敏感器,例如陀螺仪、磁强计等。通常用姿态四元数来描述姿态,运动学方程为:
式中:q bo=[q0,q1,q2,q3]T表示从轨道系到航天器本体系的姿态四元数,可以由姿态角φ转换获得,也可以由星敏感器直接测量获得;“⊗”表示四元数乘法,ωbo=[ω1,ω2,ω3]T表示航天器本体系相对于轨道系的三轴姿态角速度。
假设航天器ADCS以飞轮作为执行器,不考虑执行器和敏感器的安装误差,则姿态动力学方程可以表示为:
式中:M q表示执行器的输出,不考虑执行器故障时,可以看作是控制力矩M c与干扰力矩M d的和,即M q=M c+M d。
ADCS工作时,首先通过M q反解获得角速度增量˙ω,进而获得姿态角速度ω,从而根据运动学方程获得姿态四元数q。由于M c是由敏感器的测量值决定的,所以当敏感器发生故障时,会影响执行器的输出,从而影响到姿态的解算。
以X表示敏感器的输出,假设:
式中:φ是解算获得的航天器本体系相对于参考系的三轴姿态角,ω是陀螺仪返回的三轴姿态角速度,m是磁强计返回的地磁场强度,L为数据集的长度。这样表示的好处是可以根据任务需求增删姿态敏感器的种类和数量,只需修改x i即可,而不必重新设计模型。
门控循环单元(Gated Recurrent Unit,GRU)[13]是Kyunghyun Cho等人提出的一种基于LSTM的改进型循环神经网络(Recurrent Neural Network,RNN)。RNN学习数据特征的过程,就是隐状态根据门控信号不断更新的过程,GRU的隐状态具有重置门(reset)和更新门(update)两个门控信号,其更新公式为:
式中:σ通常选择sigmoid函数或者tanh函数,用于约束门控信号,使之落在0~1区间内。如果不约束,则一次更新的耗时过长,不利于提高模型的实时性。
上一时刻的隐状态与当前时刻的数据输入模型之后,首先通过重置门“重置”获得候选隐状态,再经由更新门“更新”获得当前时刻的隐状态,并作为下一时刻的隐状态输入。其过程如图1所示。
图1 GRU内部结构示意图
该过程的公式表达为:
与LSTM相比,GRU减少了两个门控信号,降低了计算复杂度,实时性得以提高。不过,GRU并没有针对模型的泛化性问题进行改进,预测性能与LSTM相差无几。
GRU-AE模型是在Nitish Srivastava等人的LSTM-AE模型[14]基础上进行改进,对输入数据进行回归预测,其模型结构如图2所示。GRU-AE模型的本质是一个自编码器(AutoEncoder),只是编码器(Encoder)和解码器(Decoder)由普通的神经网络替换为GRU网络。引入AE的作用是将输入的数据解构再重构,加强模型对数据特征的学习能力。编码器负责解构,即压缩数据,提取数据特征;解码器负责重构,即根据数据特征解压出原数据。正常数据和异常数据在隐藏层上表现出来的特征不同,经过解构后的异常数据无法得到有效重构,即重构后的数据与原数据之间存在较大的残差,这就是GRU-AE模型进行故障识别的原理。
图2 GRU-AE模型结构示意图
以Y表示GRU-AE模型的输出,则:
模型可以接受任意维度的输入向量,意味着它适用于具有不同ADCS的航天器。以正常敏感器的实际输出作为模型的输入,通过对数据的解构和重构,学习数据的正常值范围与变化趋势,输出模型对敏感器输出的预测值。计算预测值与正常值之间的残差,以此作为故障识别的阈值。当应用在测试集上时,如果实际值与预测值之间的残差超过了阈值,则标记该数据,进入故障定位环节。
DBSCAN聚类[15]是聚类算法中比较常见的算法之一,其原理是以核心点为中心,不断向密度可达的邻域扩张,最后获得一个包括核心点和边界点的最大化区域。DBSCAN聚类能够发现空间中任意一个簇的形状与规模,不需要提前指定簇的数量,并且对噪声和异常点不敏感,不需要担心极端值对聚类结果的影响。
具有相似故障的情况下,其数据特征也具有相似性,这是基于聚类算法进行故障诊断的理论依据。由第3节获得标记数据后,建立一个新的数据集,在新的数据集中进行DBSCAN聚类,获得若干个具有不同特征的簇。考虑到传感器的软故障特征,并非所有被标记的数据都要定性为故障,可以根据残差对阈值的偏离程度,判断发生故障的程度。
DBSCAN算法的伪代码描述如下。
本文设计的故障诊断方法流程描述如下。①训练集输入模型。数据进行L2范数的正则化处理,模型权重进行Xavier初始化。②模型输出预测值。计算预测值与真实值之间的残差,获得阈值。③测试集输入模型。数据预处理与权重初始化同上。④根据阈值识别异常数据并标记,建立新的数据集。⑤在新的数据集中进行DBSCAN聚类,定位并诊断故障。⑥输出故障诊断结果。
算法:DBSCAN聚类算法
整个流程如图3所示。
图3 故障诊断模型示意图
为了确保GRU-AE模型可获得合理的阈值,模型的训练在某微纳卫星的正常姿态仿真数据集上进行,而用于故障诊断的测试集既包含正常数据,也包含异常数据。为了量化模型的预测性能,参考文献[16]提出的预测残差,实验中采用的预测残差计算公式为:
式中:y i表示测试集中敏感器的实际输出值,^y i表示测试集中模型的预测输出值。理想情况下,r=0,实际上r受到模型泛化能力、超参数、训练集质量等因素的影响,只会无限趋近于0而不会等于0。
在其他因素相同的情况下,采用经典的LSTM模型和GRU模型作为检验GRU-AE模型预测性能的参考模型,图4和图5分别展示了三个模型在测试集中对姿态角和姿态角速度的预测结果。定性来看,GRU-AE模型的预测值与真实值最为接近,说明GRU-AE模型的预测性能优于其他两个模型;定量来看,GRU-AE模型的预测残差是0.529,而LSTM模型为0.577,GRU模型为0.601,与其他两个模型相比,GRU-AE模型的预测性能分别提高了8.32%和11.98%。
图4 姿态角预测结果(局部)
图5 姿态角速度预测结果(局部)
根据GRU-AE模型在正常数据集中的预测残差,设置用于故障识别的阈值。考虑到模型在新的数据集中可能存在的泛化性问题,为减少模型的虚警率,增加参考系数k=0.2,则最终确定阈值为:
由于本文采用的是无监督式故障诊断方法,针对的是敏感器发生未知故障的情况,此时故障诊断的目的是发现故障的位置,以及判断故障的程度。当敏感器发生故障时,其输出值与模型预测值之间会产生较大的残差。如图6所示,可以看到此时模型对磁强计y轴的输出预测出现了较大的预测残差,说明磁强计内部的相关部组件可能出现了未知故障。
图6 磁强计故障时模型预测结果(局部)
此时,模型关于磁强计的预测残差如图7所示,超过阈值的部分即视为故障,并进行进一步的诊断。
图7 磁强计预测残差(局部)
对被标记数据进行DBSCAN聚类,判断故障程度。如图8所示,簇1和簇2都是由被标记数据的隐藏层特征组成,一个簇就代表了一种相似的特征。簇的规模越大,偏离原点程度越高,说明在采样周期内该特征存在的时间越长,故障程度也越高。可以看到该故障会同时影响磁强计对y轴和z轴的输出,而簇1在y轴上偏离原点的程度更高,说明仍然是y轴受到该故障的影响更大。当簇的规模膨胀到一定程度时,说明故障已经很严重,需要更换敏感器,具体到什么程度,考虑到软故障本身的特性,可以根据不同任务的需求而随时变化,在保证系统稳定运行的情况下最大限度地节约成本和发挥系统本身的容错能力。
图8 被标记数据聚类结果
姿态敏感器的故障识别与诊断是保障航天器安全、平稳运行的重要手段之一,及时、准确地识别潜在的微小渐变故障是航天器健康管理的重要方法。由于故障标签稀缺而无法直接采用二分类或者多分类解决问题的场合,可以采用聚类来解决问题。本文基于GRU-AE模型,对航天器姿态敏感器正常状态下的输出进行预测,并利用DBSCAN聚类实现故障定位,完成对姿态敏感器故障的初步诊断。实验证明,该模型具有较好的预测性能,能够帮助人们更好地确认航天器ADCS的工作状态,对于各类传感器的故障诊断具有一定的指导意义。