马玉猛
(1.滨州学院 航空工程学院;2.滨州学院 山东省航空材料与器件工程技术研究中心;3.滨州学院 滨州市航空光电材料与器件重点实验室,山东 滨州 256603)
飞机燃油流量是对航空发动机进行状态监控的一个重要参数,燃油流量能够很好地体现发动机的健康状况,进而影响飞机的性能[1]。对燃油流量进行研究与预测,能够很好地对飞行进行规划,从而降低运行成本,提高燃油使用效率。同时,对燃油流量进行有效地预测及控制,能够减少温室气体排放,尤其是在目前的形势下,国家提出碳中和、碳达峰等要求,对燃油的预测能够对环境保护起到重要的作用[2]。
燃油流量预测已经成为研究热点,然而对航空燃油流量的预测主要集中在运输飞机上。邹迎欢等[3]采用3层BP神经网络对空客A320燃油数据进行了预测;陈聪等[4]基于QAR数据采用Elman神经网络对波音737飞机的燃油流量做了预测。罗杰等[5]采用了线性回归的方法对飞机燃油流量进行了预测, 詹韧等[6]采用基于主成分分析法(PCA)优化的Elman神经网络对飞机燃油消耗进行了预测,王淑玲等[7]采用随机森林算法对空军某型飞机进行了燃油流量预测。本文利用经验模态分解(EMD)与基于粒子群优化算法(PSO)的支持微量机支持向量机(SVM)组合模型对通用航空飞机燃油流量进行预测。
1998年,Huang[8]提出了经验模态分解的概念,开创性地提出了一种新的信号分析方法,与傅立叶变换、小波变换不同的是该方法不需要基函数,排除了基函数选择过程中人为因素的干扰[9]。EMD可以根据信号的时频特征进行自适应分解,而且经验模态分解适合处理非线性的波动信号,经过分解后得到若干相对平稳的信号,燃油流量是典型的非线性波动信号,采用EMD分解具有很好的现实意义。
EMD原理是将非线性波动信号分解为若干近似正余弦的窄带宽平稳信号,称为本征模态函数(IMF),将这些本征模态函数叠加会得到原始信号。本文对燃油流量时间序列进行分解,分解过程如下。
(1)确定燃油流量序列X(n)的上下包络线。基本方法是求出序列的所有极值点,包括极大值和极小值,然后采用样条插值方法平滑时间序列并连接所有的极大值与极小值,形成序列的上包络线yh(n)和下包络线yl(n)。
(3)对得到的新序列进行判断,是否进行下一步分解,可进行下一步分解的条件是:新序列穿过x轴的点和极值点的个数必须相等或差值为0;新序列形成的上下包络线均值为0,如果满足条件可视为一条IMF,可进行下一步分解。
重复步骤(1)~(3),得到其余IMF分量。直到Y(n)不符合分解的调节,结束分解过程,记最后的Y(n)为r(n),称之为残余分量。经上分解,原燃油流量序列被分解为若干个本征模态函数与残余分量之和。
SVM最初是由模式识别领域演化而来的分类器,Vapnik等从1963年就开始了相关研究[10],SVM最初被用来进行线性分类,然而很多情况下是无法通过线性进行完全分类的,通过核函数可以将训练样本映射到高维空间,构造回归函数可以实现分类,同时也可以实现数据的预测。现在支持向量机已经被广泛应用于预测预报、模式识别等领域[11]。
对于线性支持向量机,就是要找到回归函数y(x)=ωTx+b的最优ω和b,使样本点距离回归函数曲线最近的点能够最远,对于线性不可分样本,可以通过核函数将其映射到高维空间,则映射后的回归函数可以表示为y(x)=ωTφ(x)+b。根据上面的要求,问题转化为带约束条件的极值问题,可表示为
松弛因子以及惩罚因子是需要人为设置的参数,参数的设置以及求解将直接影响结果的准确性,为了更加高效有效地求解松弛因子与惩罚因子,引入了粒子群优化算法PSO[12]。粒子群模拟鸟类觅食过程中,个体信息共享,然后不断改变本身的飞行速度与方向,最终得到最优位置,具有效率高,易于实现,计算时间快等优点,适合工程应用。
在SVM中,PSO的应用过程首先对种群进行初始化,包括学习因子、惯性权重、迭代次数等,由SVM的惩罚因子C与核参数g产生初始粒子。然后计算每个粒子的适应度值。本文选取的适应度函数为K重交叉验证的平均分类精度。最后更新粒子的最优位置。根据上式与适应值大小来更新粒子的最优位置达到最大迭代次数后则停止迭代,并找出最优位置,得到最优参数C与g。
目前通用航空飞机普遍采用G1000航电系统,该系统可以将飞行数据保存在SD卡上,方便地面人员获取。选取飞机正常飞行训练的一组数据,G1000系统每秒采集一次飞行数据,包括飞行高度、飞行速度、燃油流量、气缸温度等参数以.csv的格式保存在SD卡上。本文选取通航飞机正常训练的一段飞行数据作为训练样本,总计12 992个样本数据,其中80%作为训练样本,20%作为测试样本。采用Python3.8工具箱对模型进行验证仿真。
在获取的数据中,会发现有一些值存在缺失现象,导致数据不连续,这将会降低模型的预测精度,因此需要对这些值做插值处理,目前常见的插值方法有拉格朗日插值法、牛顿插值、三次样条插值、最小二乘法插值等。根据验证本文采用基于最小二乘法的滑动多项式插值方法效果较好。基本原理是,燃油流量可以看作X(n)的时间序列,在某一时间段内,燃油流量可以描述为X(n)=α(n)X(n)+α(n-1)X(n-1)+…+α(1)X(1)+α(0)。其中,α为待定系数,根据现有的数据,求出最佳系数,使多项式尽量贴合原数据,然后用得到的多项式来求出缺失值。
预测模型的流程图如图1所示。
图1 模型流程图
根据模型设计,首先利用EMD技术对预处理后的数据进行分解,得到16个IMF分量和1个残余分量,部分分量如图2所示。
图2 部分IMF分量与残余分量
然后分别搭建线性回归模型、单一SVM、EMD+SVM以及EMD+PSO+SVM模型,对数据进行预测,预测结果如图3所示。
图3 4种模型预测值与实际值对比
由图3可以看出,结合了EMD与PSO算法的SVM预测效果大大提升,其预测效果明显高于传统的线性回归模型以及单一SVM,为了量化验证所采用方法的效果,采用三个指标进行衡量[15]。分别为:最大误差(ME), 均相对误差绝对值(MAPE),均方误差(MSE)。
预测结果如表1所示,可以看出,结合了EMD与PSO算法的SVM,MSE能够达到0.254,其准确率远远高于线性回归模型以及单一SVM模型。
表1 各模型预测结果对比
本文采用了基于EMD分解的SVM来预测航空燃油流量,采用EMD分解技术,将其燃油流量序列进行分解,然后对IMF分量以及残余分量分别应用基于PSO的SVM技术进行预测,组合输出,通过采用飞机实际数据进行验证,表明提出的基于EMD和PSO的SVM模型能够有效提高燃油流量的预测精度,为航空燃油流量的预测提供了一种新方法。