基于SE-TCN 网络模型的太阳电池阵温度异常检测

2021-11-08 12:47何利健陈文卿
上海航天 2021年5期
关键词:遥测卷积电池

何利健,张 锐,陈文卿

(1.中国科学院 微小卫星创新研究院,上海 201203;2.中国科学院大学,北京 100049)

0 引言

太阳能电池阵是卫星的能源供应系统,其性能的好坏直接决定在轨卫星能否正常稳定运行。电池阵温度作为表征电池阵工作状态的一个重要指标,温度异常势必会对电池阵能源系统产生不利影响。因此,为确保卫星健康运行,根据电池阵历史温度遥测数据的变化规律,预测电池阵温度变化趋势,并根据预测结果评估电池阵性能状态。

目前,传统的时序数据预测技术已相对成熟,有自回归移动平均(Auto Regressive Moving Average,ARMA)[1]、自回归综合移动平均(Auto Regressive Integrated Moving Average,ARIMA)[2-3]、卡尔曼滤波[4-5]、支持向量机(Support Vector Machine,SVM)[6]、最小二 乘支持 向量机(Least Squares Support Vector Machine,LS-SVM)[7-8]和经验模态分解(Empirical Mode Decomposition,EMD)[9]等方法。这些方法研究时间长,理论成熟完善,在很多领域的时序数据预测场景中已得到实际应用。但这些方法只能处理短期自相关任务,难以对时间序列的长期依赖进行建模。

近年来深度学习快速发展,基于深度学习相关理论的时序预测方法已经得到相关学者的高度关注,并对此做了大量研究。文献[10]使用长短期记忆网络(Long Short-Term Memory,LSTM)作为卫星遥测数据预测模型进行单步预测,并提出一个自适应阈值算法来获取最佳阈值,最终达到遥测数据异常检测的目的。文献[11]提出一种结合双通道卷积神经网络(Convolutional Neural Networks,CNN)和LSTM 的模型,并使用此模型对短期光伏功率进行预测,取得了良好效果。文献[12]对通信卫星多维遥测数据分别建立LSTM 模型,并以最大化相关系数与F1分数的方式,为多维遥测数据的故障判定合适的阈值。

时序数据预测分为单步预测和多步预测,上述方法大部分是基于单步预测的解决方案,但单步预测在一些场景下无法满足实际应用需求。当卫星入境时,短期时间内地面测控站只能获取实时遥测数据,需在入境检测实时遥测数据是否异常。但实时遥测数据仅为工程遥测数据中某一小部分时间区间的数据,单步预测无法满足该任务需求,因此需对遥测数据做中长期的多步预测。目前对多步预测主要采用两种策略[13]:一种策略是采用递归单步预测方式进行多步预测[14-15],该方法的主要缺点是递归过程会造成误差迅速累积,导致预测精度低;另一种策略是直接预测出后续多个数据点[16-17],以向量形式输出,该方法可能会导致预测距离远的点难收敛,产生发散。考虑到太阳能电池阵温度遥测数据具有较好周期性,且数据没有高频动态波动,本文选用直接预测多个数据点的多步预测方案。

目前深度学习在时序预测领域应用研究中,LSTM 网络是使用最广泛的方法之一,但LSTM 在长期依赖建模中,存在模型训练困难、模型训练时间长、梯度不稳定等缺点。时间卷积网络(Temporal Convolutional Network,TCN)[18]是一种一维卷积神经网络,研究表明基于卷积网络的方法已在音频合成[19]、单词语言建模[20-21]、机器翻译[22]等领域取得优良效果。相比于LSTM,TCN 具有更稳定的梯度、灵活的感受野和训练时间短等优点,因此本文选用TCN 作为特征提取网络。另外考虑到TCN 网络在多步预测任务中,存在数据变化程度高处模型特征表征能力不足的问题,本文采用SENet[23]中的通道注意力机制对TCN 进行改进,以增强TCN 网络的特征提取能力。

1 基础理论

1.1 太阳能电池阵温度遥测信号

本文研究对象为卫星太阳能电池阵温度遥测信号。因卫星上的温度传感器埋点位置不同,不同卫星上的温度遥测信号存在一定差异。如图1(a)所示为2 颗卫星上的4 组温度延时遥测数据。从图中可知,4 组温度数据都具有周期性且总体趋势一致,但不同温度数据的幅值大小及变化规律各有不同。因为神经网络具有一定的泛化能力,能高效地对同类问题进行处理,可通过神经网络模型对温度遥测数据进行特征提取,而不用对每组温度遥测数据进行单独建模。

本文选用的温度遥测数据包含部分噪声以及异常值,如图1(b)所示。因此,本文采用结合箱型法、多项式拟合及高斯窗函数滤波3 种方法对遥测数据进行预处理,得到温度遥测数据的主要变化趋势,预处理结果如图1(c)所示。根据文献[24]表述的电池阵物理模型及仿真结果可知,本文对电池阵遥测数据进行预处理而导致轻微信息丢失,对本文任务无明显影响。

图1 数据清洗结果Fig.1 Data cleaning results

1.2 TCN 网络原理

TCN 是一种一维卷积神经网络,可应用于时序数据预测领域。TCN 网络结构主要包含4 个部分,分别为因果卷积、膨胀卷积、残差模块、一维全卷积。

1.2.1 因果卷积

因果卷积是一种严格的时间约束模型,TCN 使用因果卷积来使输入和输出保持因果关系,保证不会出现未来信息泄漏的现象。设模型输入为x={x0,x1,x2,…,xt,…,xT-2,xT-1,xT},输出为y={y0,y1,y2,…,yt,…yT-2,yT-1,yT},因果卷积使t时刻的输出yt仅与xt及其之前时刻数据有关,与xt之后数据无关,因果卷积如图2 所示。

图2 因果膨胀卷积Fig.2 Dilated causal convolution

1.2.2 膨胀卷积

对于一维时序数据输入x,滤波器为f:{0,1,…,k-1} →R,空洞卷积在t时刻的卷积结果为

式中:d为膨胀因子;K为滤波器大小。

膨胀因子的引入相当于滤波器对数据进行了等间隔采样,膨胀卷积如图2 所示。

每层卷积层的感受野计算公式为

由式(2)可知,感受野的大小可通过改变膨胀因子d和滤波器大小K的值来调整,可灵活扩大感受野来延长时序数据建模长度,通常第i层的膨胀因子大小为

1.2.3 残差模块

1 个残差模块包含2 层因果膨胀卷积层和非线性变换层,并使用正则化技术来降低过拟合风险。为防止网络过深导致出现梯度消失现象,TCN 在残差块中引入残差连接[25],跨层连接的恒等映射使网络能以跨层的方式传递信息,使网络能够进行深层扩展。

1.2.4 一维全卷积

TCN 使用一维全卷积[26]结构来约束隐藏层,使其产生与输入层等长的序列,使模型能够保留输入序列的所有信息,有利于构建长期记忆,提高预测性能。

1.3 SE 注意力机制模块原理

SENet是计算机视觉中的一种网络模型,其中包含1 个通道注意力模块,即Sequeeze-and-Excitation模块(SE 模块)。SE 模块可学习特征通道之间的相关性,对每个特征通道赋予一个权重,使模型更加关注那些具有关键特征的通道,抑制那些具有非关键特征的通道,这样有利于提高模型特征提取能力。SE 模块计算量小,很适合嵌入到各类网络中。SE 模块作为一种注意力机制,主要包含3 个步骤:Sequeeze 过 程、Excitation 过程和Reweight 过程。

Sequeeze 过程指对通道进行全局池化,将整个空间特征编码为1 个全局特征。Excitation 过程指通过全连接神经网络的非线性变换功能,学习特征通道间的相关性,以获取各通道的重要性权重系数。Reweight 过程是将权重系数加权到对应特征通道上,完成对不同通道重要性的重标定。

2 SE-TCN 模型异常检测方法

2.1 SE-TCN 网络模型

由1.1 节可知,太阳能电池阵温度遥测数据的主要趋势具有较严格的周期性,每个周期在温度较高处变化平缓,且周期间的温度变化略有差异,同时每个周期存在2 个温度变化迅速的边沿,形态变化较大。

TCN 网络在温度信号从平缓变化转换到快速上升或者快速下降的过程中,存在模型表征能力不足现象,导致模型预测过程中出现信号波动起伏,最终影响预测的准确性。鉴于该问题,本文引入SENet 中的通道注意力机制,对TCN 进行改进,使模型在信号形态变化较大处,能有选择性地关注具有关键信息的通道,加强模型的特征表达能力。

TCN 网络是由多个残差块叠加构成,本文对每层残差块后引入SE 模块作为该残差块的注意力机制。由于温度遥测数据上下幅值差值较大,且在信号边沿变化迅速,本文在原有SE 模块中仅使用全局平均池化的基础上加入全局最大池化,通过全局最大池化提取出全局最大信号特征,有利于模型获取信号的最值,加强SE 模块对全局特征的表达能力,SE-TCN 残差块如图3 所示。

图3 SE-TCN 残差块Fig.3 SE-TCN residual block

SE 模块通道注意力机制工作流程如下:

随着SE-TCN 残差块的叠加,最后1 个残差块的输出包含了最符合输入信号特征信息的特征通道,使模型的特征表达能力得到加强。SE-TCN 预测模型结构如图4 所示。

图4 SE-TCN 网络模型Fig.4 SE-TCN network model

2.2 卫星太阳电池阵温度遥测数据异常检测流程

对太阳能电池阵温度的遥测数据进行异常检测,分为2 个过程,分别为离线训练过程和在线异常检测过程,过程的流程图如图5所示。

图5 SE-TCN 模型异常检测Fig.5 Anomaly detection of SE-TCN model

离线训练过程:1)对历史遥测数据进行异常值剔除和滤波,获取温度信号的主要变化趋势;2)对预处理后的太阳能电池阵温度遥测数据降采样处理;3)使用滑窗法生成模型所需的输入输出数据,构建数据集;4)使用训练数据集对SE-TCN 网络做离线训练。

在线异常检测过程:1)加载离线训练阶段训练好的SE-TCN 网络模型;2)使用昨天测控弧段遥测数据作为模型输入,使用模型外推至当前入境时的数据作为理想数据;3)对信号做插值处理恢复到原始采样频率;4)依据太阳能电池阵温度数据滤波前后方差,及预测值与原始值之间的方差确定异常点检测阈值,并以预测值变化趋势确定趋势异常检测阈值;5)使用阈值法对实时遥测数据进行异常点检测及趋势异常检测。

2.3 阈值生成

复杂的太空环境及传感器硬件性能带来的影响,使遥测数据会带有一定的噪声。同时考虑到预处理过程中,会使遥测数据损失小部分对主要趋势无明显影响的信息,因此阈值需对此部分信息做冗余处理。对太阳能电池阵温度遥测数据采用滑动窗口方法获取,窗口大小为信号周期长度,计算出窗口内数据滤波前后方差大小,结果如图6(a)所示。从图中可看出,滤波前后方差较小,最大值在1.3 左右,均值为0.5。

在时序数据多步预测任务中,模型预测值和真实值间会存在一定误差,同时由于本文任务中多步预测值过多,出现模型发散,导致预测值和真实值间产生相位差。鉴于该问题对温度遥测数据异常检测的影响,本文采用加窗的计算误差方式取代传统一一对应计算误差方式,统计误差方差大小如图6(b)所示。从图中以看出,预测值和真实值之间的方差主要集中在0.5~0.7 之间。

图6 数据方差统计图Fig.6 Statistical chart of data variance

令σ1为滤波前后方差,σ2为预测值与真实值之间方差,参数κ1控制σ1倍数,参数κ2控制σ2倍数,则异常点检测门限上限TU(t)和下限TL(t)分别为

判断原始遥测序列s(t)的单个数据点异常与否的条件是:预测值与实际值的偏差是否在异常检测门限的上下限内,若不在上下限限定的门限值内即为异常值,即

温度信号变化趋势是温度遥测数据的一个重要特征,趋势异常是电池阵温度信号产生异常的表现形式之一。本文采用2.4 节3 个评价指标作为太阳能电池阵温度遥测数据趋势异常检测的标准。当地面测控站获取到实时遥测数据时,在对应时间段内分别计算出预测值和实时遥测值的3 个指标数值,并按照如下公式作为趋势异常检测判定标准:

2.4 模型评价指标

为评价SE-TCN 模型的性能,本文引入回归任务中常用评价指标,分别为平均绝对误差MAE、均方根误差RMSE 和相关系数R。本文多步预测的预测点过多,导致模型出现发散现象,因此对评价指标做相应修改以消除因模型发散出现的相位差影响:

式中:EMA为平均绝对误差MAE;ERMS为均方根误差RMSE;yˆt、yt分别为t时刻的预测值和真实值;k为窗口大小;N为测试集样本大小。其中,EMA和ERMS越小代表模型性能越好,R越大代表模型性能越好。

3 实验与分析

本实验是基于Windows 操作系统,深度学习框架选用Keras 计算框架,CPU为Intel I5-4200 H,2.80 GHz,Tensor flow为1.13.1 版本,Keras为2.3.1版本。本实验采用CPU 进行模型训练和测试。

本文选用的太阳能电池阵温度遥测信号的采样频率为0.125 Hz,经过预处理后得到数据的主要趋势频率为采样频率的1 000 倍。根据采样定理,可以对其进行20 倍的降采样,降采样后可以有效降低输入数据的长度,进而降低网络深度,加快训练速度。

3.1 网络参数设置

根据温度遥测数据特点及本文研究背景,对SE-TCN 网络模型部分参数设置见表1。序列输入长度500,设置膨胀因子2,本文通过多次实验发现滤波器大小为5 时效果最好。根据1.1 节感受野计算公式可知,需要7 层SE-TCN 残差块网络深度对温度信号时序长度进行建模。

表1 模型参数Tab.1 Model parameters

3.2 实验结果分析

SE-TCN 网络模型和传统TCN 网络模型的预测结果对比情况见表2。表中可见,SE-TCN 网络相对于TCN 网络在3 个评价指标上有不同程度的提升,其中EMA降低了7.7%,ERMS降低了5.2%,R提高了0.4%。SE 模块是1 个轻量级模块,SE-TCN网络相对于TCN 网络,其参数只增加了828 个,增加量占比约0.025%,增加的计算量极其微小,因此SE 模块的计算开销相对于总计算开销可忽略不计。但SE-TCN 网络在增加极小计算量的情况下取得了较大的性能提升,因为SE 模块能通过非线性变换,从特征通道中筛选出具有关键信息的通道,加大其对预测结果影响所占权重,实现提高模型的特征提取能力。该结果证明了SE 模块在TCN 上作用的有效性,可提高模型预测精度。

表2 模型对比Tab 2 Comparison of models

一次预测结果如图7 所示。从图中曲线可以看出,SE-TCN 网络模型的预测效果更接近实际值,且每个周期的数据变化处更加平滑,数据波动比TCN网络预测模型结果更小,具有更小的数据偏差,该结果再次体现出SE 模块发挥了良好作用。但随着预测步长的增加,TCN 网络和SE-TCN 网络都出现了发散现象,预测值和实际值相比较出现了相位偏差,但相位差较小且数据趋势依旧和原始数据保持一致,该预测结果对于卫星入境时温度遥测数据的趋势异常检测仍具有很大的指导意义,可通过判断信号变化趋势来判断是否发生趋势异常。

图7 预测结果图Fig.7 Forecast result chart

本文按照2.3 节方法设定阈值,根据方差统计结果取σ1=0.8,σ2=0.8,令κ1=κ2=3,由式(8)和式(9)确定异常点检测上下阈值大小,如图8 所示。当卫星入境时,可快速定位对应时间点,将对应时间段内的实时遥测数据与阈值比较,按照式(10)对遥测数据进行异常点检测。对实时遥测数据及对应时间段内的预测值计算EMA、ERMS和R3 个指标,并按照式(11)对太阳能电池阵温度遥测数据进行趋势异常检测,当计算结果符合式(11)时,视为趋势正常,反之则为趋势异常。

图8 上下阈值图Fig.8 Upper and lower threshold graph

4 结束语

太阳能电池阵温度异常检测是卫星健康管理中的一个重要环节,针对卫星入境时太阳能电池阵温度遥测信号无法快速进行异常检测的问题,本文提出了一种SE-TCN 网络模型。实验结果表明,在本任务中,加入通道注意力机制后的SE-TCN 网络相比于传统TCN 网络,在平均绝对误差、均方根误差和相关系数3 个评价指标上均有不同程度的提升。太阳能电池阵温度受多方面因素影响,后续研究将考虑引入其他遥测参量来辅助模型对温度遥测数据的预测推断,提高模型的预测精度,同时该方法可推广到其他具有周期性的卫星遥测数据的异常检测任务中。

猜你喜欢
遥测卷积电池
电池很冤
基于全卷积神经网络的猪背膘厚快速准确测定
“一粒盐电池”
遥测定位信息网络传输间断问题的解决方法
自修复电池技术可延长电池寿命并提高EV性能
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
高层次综合技术在遥测地面站数据处理中的应用
基于MicroBlaze的测控终端数据处理模块的设计与实现