基于差分隐私的航空发动机喘振故障检测

2022-10-02 01:14郑德生
燃气涡轮试验与研究 2022年1期
关键词:差分卷积梯度

岑 鹏,郑德生,陆 超

(1.西南石油大学计算机科学学院网络空间安全研究中心,成都 610500;2.中国航发四川燃气涡轮研究院高空模拟技术重点实验室,四川绵阳 621000)

1 引言

航空发动机喘振故障是一种常见的发动机故障,会导致发动机部件剧烈振动和热端超温,影响发动机性能,甚至造成发动机严重损坏,是发动机所有故障中最具危险性的一种。因此,在发动机喘振初期被及时检测出从而采取消喘措施,能有效避免因喘振引发的飞行事故。

目前关于喘振故障预测方法的研究呈现出多样化的趋势。刘林刚等提出一种基于支持向量机的航空发动机振动预测模型,将故障检测与机器学习算法结合起来提升诊断率。曹惠玲等提出一种基于最小二乘支持向量机回归模型的航空发动机喘振故障诊断方法,对发动机进行状态监控,根据模型监控低压压气机转速、压比和燃油流量预测值与真实值的相对误差率来分析喘振故障。为解决传统机器学习方法准确率低的问题,Luo等提出了基于长短时记忆(LSTM)时间序列的故障检测模型,不需要手动提取数据特征,模型准确率达93.6%。

随着机器学习模型在各个领域的广泛应用,研究人员往往在追求模型效果时忽略了对训练数据的保护。差分隐私是由Dwork于2006年提出的一种为个人隐私提供保护的方法。它是一种密码学的手段,旨在提供一种当从统计数据库中查询时,在保证数据查询准确性的同时,最大限度地减少识别其记录的机会。航空发动机数据与传统的数据集不同,其具有极高的敏感性与隐私性。利用具有差分隐私的随机梯度下降算法来训练卷积神经网络,能够极大地保护数据隐私。基于此,本文提出了具有差分隐私技术的卷积神经网络模型(DP-CNN模型),在提高航空发动机喘振故障检测性能的同时,能保护神经网络模型,最大程度保证数据安全。

2 理论基础

2.1 卷积神经网络

卷积神经网络是一类包含卷积运算且具有深度结构的神经网络,由卷积层、池化层及全连接层组成。卷积层的目的是学习输入的特征表示,负责对输入对象的每一个特征进行局部感知和挖掘,然后在更高层次上对局部特征信息进行综合操作,如图1左半部分所示,从而得到全局信息,因此其主要用于对输入对象特征的深度挖掘。卷积运算计算公式为:

图1 卷积神经网络示意图[10]Fig.1 Schematic diagram of convolutional neural network

式中:Wb分别表示第层网络卷积核权重和偏置,X为第层神经元的输入,Z为第层卷积操作的输出。

在卷积运算后加入激活函数来解决神经网络的非线性问题,能很好地弥补线性模型的表达能力,将激活的神经元特征保留映射到下一层网络,如公式(2)所示。

池化层主要负责对卷积层挖掘的特征做下采样操作,也就是对特征做降维操作,通过降低特征图的维度来实现平移不变性。池化层通常放在两个卷积层之间,其计算公式为:

前述方法为神经网络的前向传播过程,损失函数反应了预测值和真实值的偏离程度。本文采用的损失函数为交叉熵损失函数,其定义为:

最小化损失函数来提高模型的准确率,常用的方法是随机梯度算法。每次迭代过程中随机选取一个批量样本来计算梯度,并沿着梯度最小的方向更新权重。

2.2 差分隐私技术

差分隐私算法以相邻数据集为基础,而相邻数据集是指两个数据集之间只相差一条记录。在此基础上,如果在相邻数据集上的查询结果相近,那么相差的一条记录的隐私就得到了保护。相邻数据集的查询结果越相似,则隐私保护力度越大。差分隐私的相关定义为:

定义1 对于一个随机映射函数,、是两个相邻数据集,且函数的输出∈,若算法满足式(5)条件,则称映射机制满足(,)差分隐私。

式中:为差分隐私预算成本,代表隐私保护程度;为隐私被破坏的概率。越小表示隐私保护程度越高,实际运用时其取值要结合具体需求来达到输出结果安全性与可用性的平衡。在神经网络中实现差分隐私的方法是在训练过程中添加高斯噪声。

定义2 衡量算法对添加噪声的敏感程度,算法的全局敏感度定义如下:

定义3 高斯机制在于向算法中添加符合高斯分布的噪声,定义如下:

差分隐私的组合性质使得差分隐私可以用于神经网络模型:

(1) 并行组合性质

如果有个算法,,…,k分别作用于数据集,,…,D且都满足差分隐私,那么组合以后的算法也满足差分隐私。

(2) 串行组合性质

如果有个算法,,…,k都作用于一个数据集,且皆在数据集上满足差分隐私,那么在执行这些算法以后满足相加的差分隐私。

3 喘振检测模型设计

3.1 数据预处理

使用的数据集来自于发动机在不同场景(失速,畸变,起动等)下通过实验收集到的传感器数据。传感器分布在发动机核心部位,对所有传感器数据取6个关键参数。结合发动机喘振的生成机理和实际数据分析,在表示人为控制发动机油门杆状态的传感器平稳的情况下,压气机出口总压传感器数据曲线出现突变和剧烈抖动的这段区间为故障区间。依据这一规则,完成故障点和正常点的收集。由于传感器数据的性质不同,通常具有不同的量纲和数量级。当各数值间的水平相差很大时,如果直接用原始指标值进行分析,就会造成梯度爆炸。为此,采用了-sc ore标准化,标准化公式如下:

式中:为标准化后的值,为原始数据,为数据均值,∂为方差。

3.2 差分隐私随机梯度算法

为了在神经网络中实现差分隐私技术,常用的方法是在随机梯度下降算法中加入扰动。本文采用Abadi等提出的一种差分隐私随机梯度下降算法。该算法是在神经网络的反向传播过程中更新参数时添加噪声来达到隐私保护的目的,最终计算出差分隐私预算成本。计算梯度之后进行梯度裁剪,是为了防止由于神经网络深度过深而引起梯度爆炸的操作,将每次迭代过程中的梯度限制在阈值内可以解决这种情况。梯度裁剪后加入符合高斯分布的噪声使得算法具有隐私保护,接着进行梯度更新。算法过程如表1所示。

表1 差分隐私随机梯度下降算法Table 1 Differential privacy stochastic gradient descent algorithm

3.3 评估指标

为了评估分类模型性能,使用准确率、召回率、1-sc ore和差分隐私预算成本等评估指标,对故障检测模型的整体能力进行评估。

式中:表示将正类预测为正类的个数,即预测喘振故障正确的个数;表示将负类预测为正类的个数,即预测正常状态错误的个数;表示将正类预测为负类的个数,即预测喘振故障错误的个数;为准确率,表示模型能够准确检测故障的能力;re cal l 为召回率,表示能够将样本中所有喘振故障样本全部找出来的能力;1-sc ore表示模型性能的综合能力。为评估模型的隐私保护程度,使用作为评价指标,采用Mironov提出的时刻会计方法计算。

4 实验

4.1 实验环境与数据集

采用开源框架Tensorflow2.0,Python版本为3.7,搭建在Windows10 操作系统下。处理器型号为Intel i5,显卡型号为GTX1060Ti。

在数据集方面,以不同航空发动机在失速、畸变、起动等多个场景下通过实验获得的51组总共30万条左右的传感器数据作为本文模型的实验数据。在数据预处理之后,将实验数据按训练集、测试集比例分为7∶3。运用上文提到的DP-CNN 模型对发动机喘振故障进行诊断。

4.2 实验结果分析

分别采用=1,2,3的隐私保护程度进行准确率对比,选择出准确率和隐私保护程度较高的参数,结果如图2 所示。从图中可看出,随着隐私保护程度的下降,准确率呈上升趋势。=1 时,准确率为85.6%;=2 时,准确率为95.7%;=3 时,准确率为96.0%。但实际运用时,应当在模型的准确率和隐私保护程度上进行平衡。据此可以得出=2时模型在隐私保护程度和准确率上平衡效果较好,因此=2 为最佳参数。下面采用=2 的DP-CNN 模型与其他模型进行对比。

图2 不同隐私保护程度下的准确率Fig.2 Accuracy under different levels of privacy protection

为整体评估DP-CNN 模型,将该模型与目前几种主流的故障检测模型(支持向量机(SVM),长短时记忆网络(LSTM),多层感知器(MLP))在准确率、召回率和1-sc ore上进行对比,结果如表2所示。可见,DP-CNN 模型在准确率、召回率和1-sc ore指标上分别达到了95.3%,94.6%,96.5%,比其他几种故障检测模型的准确率更高,泛化能力更好,并且该模型同时具有=2的隐私保护程度。该模型在对航空发动机喘振故障诊断的有效性十分突出,并且具备良好的安全性。

表2 不同故障检测模型结果比较Table 2 Comparison of results of different fault detection models

5 结论

针对航空发动机数据具有敏感的特性,提出了具有差分隐私技术的卷积神经网络模型。在航空发动机真实数据集上对该模型进行的多方位验证表明,此模型在准确率、召回率和1-sc ore指标上,均优于主流的支持向量机、长短时记忆网络、多层感知器等故障检测模型。另外,该模型具有=2 的隐私保护程度,能很好地保护模型,即使攻击者知道了数据集中的其他数据也无法推出剩余数据,在实际部署中具有很好的实用价值。

猜你喜欢
差分卷积梯度
基于全卷积神经网络的猪背膘厚快速准确测定
一类分数阶q-差分方程正解的存在性与不存在性(英文)
基于图像处理与卷积神经网络的零件识别
一个求非线性差分方程所有多项式解的算法(英)
基于深度卷积网络与空洞卷积融合的人群计数
一个具梯度项的p-Laplace 方程弱解的存在性
内容、形式与表达——有梯度的语言教学策略研究
航磁梯度数据实测与计算对比研究
一类caputo分数阶差分方程依赖于参数的正解存在和不存在性
卷积神经网络概述