高超声速飞行器热环境快速预测方法

2022-01-19 05:08华一畅姚卫星
机械设计与制造工程 2021年12期
关键词:训练样本壁面预测值

华一畅,黄 杰,姚卫星,3

(1.上海机电工程研究所,上海 201109) (2.南京航空航天大学机械结构力学及控制国家重点实验室,江苏 南京 210016) (3.南京航空航天大学飞行器先进设计技术国防重点学科实验室,江苏 南京 210016)

随着军事技术的不断发展,飞行器飞行马赫数越来越高。高超声速飞行器由于具有远距离巡航、高空高速等特点以及快速反应、有效拦截和打击目标的能力,越来越受到各军事大国的重视。高超声速飞行器在稠密大气层内飞行时,空气受到强烈压缩和剧烈摩擦,飞行器大部分动能转化为热能,致使壁面温度急剧升高[1],因此对防热技术的要求很高。热环境计算是结构热防护的出发点,因此对高超声速飞行器进行热环境分析具有重要意义。

高超声速飞行器热环境分析是一个典型的多学科问题,目前研究方法主要包括数值方法和工程方法。数值方法直接求解N-S方程或者其近似形式,对网格质量、计算方法有很高要求,计算量大[2]。工程方法计算效率高,但是仅适用于简单结构,难以拓展到复杂外形[3]。因此有必要构建一个基于已有试验数据的预测模型,在给定飞行参数时能对飞行器壁面热环境进行快速评估。

本文以深度学习为基础[4-5],采用tensorflow的kerasAPI构建一个深度神经网络(deep neural networks,DNN)的回归预测模型,提出了一种基于反向传播算法的模型训练方法。

1 预测模型与训练方法

1.1 深度神经网络的基本结构

深度神经网络是通过模拟信号在生物神经元之间的传递构建的,可以用来反映人脑的思维方式。按不同层的位置划分,DNN内部的神经网络层可以分为3类:输入层、隐藏层和输出层,基本结构如图1所示。输入层接受输入数据x,中间隐藏层对输入数据进行处理,输出层产生输出数据y。神经网络的复杂程度以及表达能力取决于隐藏层的层数和每层的节点数。DNN相邻层之间是全连接的,对于一个隐藏层总层数为L的神经网络,第l层的任意一个神经元一定与第(l-1)层的任意一个神经元相连,用Wl表示第l层和第(l-1)层各神经元之间的权重系数矩阵,bl表示第l层神经元输入对应的偏置向量,第l层神经元的输入zl和第(l-1)层神经元的输出al-1之间存在线性关系(zl=Wlal-1+bl)。第l层神经元通过激活函数σ对该层的输入zl和输出al进行变换,即al=σ(zl)。激活函数向神经网络中引入非线性,提高了神经网络对于复杂问题的表达能力,激活函数的选择一般根据实际问题的性质确定。

图1 深度神经网络的基本结构

本文选择线性整流函数(rectified linear unit,ReLU)作为激活函数,其表达式为σ(x)=max(0,x),其中的x为本层神经网络的输入向量。相比于传统的神经网络激活函数,线性整流函数计算过程简单,在训练中梯度下降以及反向传播更加高效,同时可以避免梯度爆炸和梯度消失的问题[6]。

1.2 DNN反向传播算法

对于k个训练样本{(x1,y1),(x2,y2),…,(xk,yk)},样本的输入输出分别为x,y。通过反向传播算法训练DNN模型,目的是找到合适的隐藏层对应的权重系数矩阵W和偏置向量b,让所有训练样本的预测值尽可能接近真实值。

损失函数用来计算模型预测值与样本真实值之间的误差,本文采用最常见的均方误差来度量损失,对于一个输出参数,定义其损失函数J为:

(1)

通过反向传播算法逐层求出损失函数对各层神经元Wl,bl的偏导数,构成损失函数对Wl和bl的梯度,作为修改权重的依据。神经网络的学习在权重修改过程中完成。误差达到所期望值时,神经网络学习结束。通过以下4个公式可以完整地更新每一层Wl和bl的对应梯度:

(2)

δl=(Wl+1)Tδl+1*σ′(zl)

(3)

(4)

(5)

1.3 随机梯度下降

梯度下降是迭代法的一种,可以用于求解最小二乘问题。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(gradient descent)是最常采用的方法之一。梯度下降的本质是逐步逼近最优,其迭代公式为:

θi=θi-1-ηJ(θi-1)

(6)

(7)

式中:θi代表第i次学习时模型系数W,b,其梯度可以通过式(2)~式(5)计算;η为学习律;Jr为第r个训练样本的损失函数;R为训练样本总数。

传统梯度下降方法使用所有训练样本计算梯度,每次学习都使用整个训练集。使用所有训练样本计算梯度,其优点是梯度下降的方向会稳定朝着极值方向并收敛,不容易受噪声影响。但是因为考虑了所有样本所以收敛慢,同时容易陷入局部最优。由于每次更新参数都需要计算所有训练样本的损失函数,随着输入样本数的增加,每次更新计算量都会大幅增加。

随机梯度下降(stochastic gradient descent,SGD)算法每次只随机抽取一个样本做梯度下降,训练后按梯度更新一次,然后再抽取一组,再更新一次,在样本量大的情况下,不用训练完所有样本就可以获得一个损失值在可接受范围之内的模型。在每轮迭代中随机优化某一条训练数据上的损失函数,参数的更新速度都会大大加快。此外,随机梯度下降每次更新可能并不会按照极值方向进行,因此会带来优化波动,这个波动可能会使得损失函数从当前局部极小值点跳到另一个更优的局部极小值点,对于非凸函数,可能最终收敛于一个较优的局部极小值点,甚至全局极小值点[7]。SGD算法更新规则如下:

θi=θi-1-ηJr(θi-1)

(8)

SGD算法的一个关键参数是学习率,学习率太小会导致收敛速度非常缓慢,而学习率太大会阻碍收敛,容易引起权重在最优解附近震荡,甚至可能引起发散[8-9]。在实际计算时,随着迭代次数的增加,通常需逐渐降低学习率。学习率可以通过试验来选取。

随机梯度下降学习过程有时会很慢,使用动量方法可以加快学习速度,特别是处理高曲率、小但一致的梯度时[10]。动量方法每次学习的步长不仅取决于学习率,还取决于梯度序列的大小和顺序。动量方法引入变量vi代表第i次迭代时参数在参数空间移动的方向和速率,动量参数α∈(0,1]决定前一次训练梯度对本次训练的影响。动量方法中,更新规则如下:

vi=αvi-1-ηJr(θi-1)

(9)

θi=θi-1+vi

(10)

2 程序结构

本文基于Python平台构建一个深度神经网络的训练和预测程序,该程序能够对一组多输入、多输出的训练样本进行学习,生成预测模型。在预测程序中加载模型,接受输入参数并进行预测。程序的主要流程如下:

1)读入训练样本,计算各参数的最小值与极差,将训练参数归一化。随机选择80%的样本作为训练集,用于参数的训练,另外20%的样本作为测试集,不参加训练,用于测试训练情况。

2)建立一个具有3个隐藏层,每层32个单元的深度神经网络预测模型,模型的激活函数采用ReLU函数。

3)初始化神经网络,随机给预测模型中的权重系数矩阵W和偏置向量b赋予一组较小的非零数值。

4)构建随机梯度下降优化器,学习率为0.01,学习衰减率为1×10-6,动量参数为0.9,选取均方误差函数作为损失函数。

5)开始训练预测模型,输入训练样本,得到模型的预测值,与真实值进行比较,根据反向传播算法,计算模型的损失函数以及隐藏层权重系数矩阵W和偏置向量b的梯度。

6)采用随机梯度下降优化器,修正网络权重,完成一次训练过程。

7)重复步骤5)、6),对权重系数矩阵W和偏置向量b进行反复迭代,若训练次数或者均方误差满足要求,则结束训练。

8)使用测试集检验模型预测精度,确保无过拟合现象的发生。预测程序通过调用训练结果完成预测。

3 算例分析

为验证程序的有效性以及预测精度,以典型高超声速飞行器飞行过程中时间、马赫数、攻角、高度作为输入参数,对应的壁面热流和壁面温度峰值作为输出参数。在3 851—6 194 s,以间隔3 s的方式选取782个样本数据进行训练。随机划分80%的样本数据为训练集,20%的样本数据为测试集。测试集用于在完成神经网络训练过程后,客观评价模型对于新样本的预测能力。

图2和图3给出了部分测试集的预测精度。图中数据点近似分布于对角线上,测试集的预测值和真实值相对误差很小。经计算,测试集壁面热流峰值和温度峰值的平均误差分别为3.16%和2.02%。表明该模型对于给定训练数据之外的点泛化能力较好,无明显的过拟合。

图2 测试集壁面热流峰值预测值与真实值比较

图3 测试集壁面温度峰值预测值与真实值比较

图4和图5为整个飞行过程中壁面热流峰值1温度峰值的预测值和真实值的对比曲线。壁面热流峰值和温度峰值的平均误差分别为3.03%和1.86%。预测值和真实值在5 500 s前输出参数变化相对平缓的区域拟合效果较好,5 500 s后壁面热流峰值和温度峰值变化十分剧烈,预测精度有所下降。图4中预测值最大值比真实值小5.93%,图5中预测值最大值比真实值大2.56%。

图4 壁面热流峰值预测值与真实值比较

图5 壁面温度峰值预测值与真实值比较

4 结束语

本文构建了一个由输入层、隐藏层和输出层组成的深度神经网络预测模型,采用深度神经网络反向传播算法以及随机梯度下降方法,以损失函数最小为训练目标,形成一种机器学习的训练方法。对该模型进行的算例分析表明,该模型预测精度高、非线性能力强、训练方法快速高效,达到了工程中预测热环境参数的要求。

猜你喜欢
训练样本壁面预测值
二维有限长度柔性壁面上T-S波演化的数值研究
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
法电再次修订2020年核发电量预测值
人工智能
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
壁面温度对微型内燃机燃烧特性的影响
颗粒—壁面碰撞建模与数据处理