融合物理的神经网络方法在流场重建中的应用

2022-11-09 04:24尧少波何伟峰陈丽华吴昌聚陈伟芳
空气动力学学报 2022年5期
关键词:流场神经网络方程

尧少波,何伟峰,陈丽华,吴昌聚,陈伟芳

(浙江大学 航空航天学院,杭州 310027)

0 引 言

流体力学研究方法随研究工具的发展不断创新和变革,计算机的发展促使流体力学的研究方法从最开始的理论推导和实验模拟逐渐转向借助计算机对流体力学问题进行数值建模,这一转变直接导致计算流体力学(computational fluid dynamics, CFD)这一学科的出现。人工智能(artificial intelligence, AI)被称为第四次工业革命的催化剂,是21 世纪被广泛提及的一个名词。AI 依靠大数据和优秀的算法不断为传统领域赋能,突破传统领域的技术壁垒。流体力学作为经典学科,AI 能否为其带来新的活力?2019 年以来,流体力学智能化这个名词逐渐在会议和文章中被提及,越来越多的研究人员开始关注流体力学智能化这一领域。张伟伟[1]对流体力学智能化问题进行了系统性地归纳和总结,将其主要内容分为三部分:1)流体力学理论和方法的智能化,探索融合经典流体力学理论和人工智能算法的新理论,以解决经典方法存在的问题和不足;2)流动信息特征提取与融合的智能化,流体力学数据繁多复杂,人类大脑难以从这么庞大的数据信息中发掘一些有价值的信息,相反人工智能算法恰恰非常适合处理大数据问题,因此使用基于人工智能的算法可以挖掘和融合不同来源的流体数据信息;3)多学科、多场耦合模型的智能化,人工智能可以充当一种粘合剂将经典流体力学、计算机和自动控制学科紧密地联系起来,从而做到多学科之间的相互交融和协作。对此,国内外研究者们在近期开展了广泛的研究与探索,如应用人工智能技术研究湍流模型[2-7],以及在飞行器设计中的应用研究[8]。

流体力学智能化需要在经典流体力学研究方法和成果的基础上结合人工智能技术,流体力学大数据小样本的学科特点和背景是机器学习建模时需要考虑的客观问题。当前流体力学智能化的核心内容或许是提升人工智能赋能流体力学的可解释性,探索流体力学新的物理内涵和认知。因此,人工智能给流体力学的发展提供新的研究范式,流体力学为人工智能的发展提供足够复杂的研究对象,使传统学科和新型学科交叉融合相互促进。

物理问题尤其是流体力学问题其数据之间的隐含规律复杂多变,这导致传统机器学习模型在发掘数据之间的隐含规律时其表现往往差强人意。但是流体力学中的数据往往存在控制方程形式的约束,因此如何充分利用数据的约束方程作为机器学习模型的先验知识是改善机器学习解决物理问题的重点。融合物理先验知识的神经网络方法(physical-informed neural network, PINN)算法自Karniadakis[9]提出以来就受到广泛的关注和探索。作为一种融合物理方程信息的神经网络模型,它既拥有神经网络的强大学习能力,又能结合学科背景使其网络模型具备可解释性。本文结合课题组近期工作,以三维超声速可压缩槽流和不可压缩圆柱绕流为例,介绍PINN 算法的原理及其在求解N-S 方程、预测流动参数、确定方程待定系数的机理和可行性。

1 PINN 原理

神经网络属于参数模型(图1),使用多层神经网络构建输入特征 (x,y,t)和 输出特征u的 函数关系gNN:

图1 传统神经网络模型Fig. 1 Traditional neural network

并通过最小化输出的预测值和真实值之间的均方误差Loss 指导自身的训练:

传统神经网络算法从数据中发掘隐含的相关关系,当数据量有限时,使用梯度下降计算网络参数ω时极有可能陷入局部最优的困境。而针对物理信息的学习,多数场景都有已知的控制方程约束,因此训练时通过添加约束神经网络输入和输出之间的控制方程关系可以赋予神经网络数据之间的先验知识。PINN 网络便是这样一种融合偏微分方程的特殊神经网络模型,其结构如图2 所示。

图2 PINN 网络结构Fig. 2 Physical-informed neural network

首先,PINN 与传统神经网络相比,增加了将网络输出作为输入附加约束的偏微分方程的步骤。偏微分方程的形式复杂多样,考虑偏微分方程的一般形式:

PINN 假设存在函数f:

综上,通过对比图1 和图2 所示网络结构、损失函数Loss 和网络参数 ω的优化过程发现:PINN 并未比传统神经网络额外增加需要学习的网络参数,因此如果把PINN 学习到的参数组合复制给传统神经网络后,两者的预测结果将一致,似乎表明传统神经网络也能达到和PINN 一样的预测结果。但实验证实PINN 方法的预测结果要优于传统神经网络模型预测结果,究其原因是PINN 方法通过增加控制方程约束降低了网络参数 ω陷入局部最优的可能性,从而获得更好的神经网络模型参数组合。

2 PINN 方法的应用

由于PINN 融合神经网络和偏微分方程,发掘样本数据之间的潜在规律,因此PINN 方法的应用前景十分广泛。结合笔者近期的研究工作,对其目前主要应用进行介绍。

2.1 PINN 解偏微分方程

神经网络方法求解偏微分方程的核心思想是:利用神经网络和符合偏微分性质的样本数据逼近数据所在区域偏微分方程的显式形式。偏微分方程可以用来描述系统状态随时间和空间的变化规律,因此物理问题的大多数控制方程是以偏微分方程形式存在。偏微分方程由于多变量耦合,常常难以获得精确的数学显式解,因此偏微分方程解的存在性和偏微分方程的求解一直是数学领域的热点[10-12]。

虽然一般情况下偏微分方程难以获得精确解,但是借助数值方法可以求解离散网格上变量状态,借此可以获得大量符合偏微分性质的网格点上的数据。接着利用这些数据进行机器学习训练,从而能够获得满足偏微分形式表征物理量隐含关系的机器学习模型。神经网络作为一种强大的数据分析算法,在发掘数据之间隐含的函数关系问题上发挥巨大的作用,理论证明多层非线性激活函数组成的神经网络能够逼近任意的函数关系[13]。近年来用深度神经网络等机器学习方法构造有效的物理模型一直是研究热点[14],在PINN 之前,主要是用约束神经网络求解偏微分方程,采用数值微分的方式[9]。与之不同的是,PINN 的特点是用误差的形式将物理控制方程融合入神经网络,某种程度上与迭代 Krylov 线性解算器相似,其主要优点是采用自动微分的方式求解微分方程[15-16]。PINN 求解偏微分方程模型结构如图3[17]。

图3 PINN 求解偏微分方程模型结构[17]Fig. 3 PINN model structure for solving partial differential equations[17]

将时空坐标输入神经网络,经过神经网络计算输出控制方程物理量。将输出的物理量与训练样本的标签物理量分别带入偏微分方程、边界条件(boundary condition,BC)约束以及初始条件(initial condition,IC)约束,并通过两者之间的差异构建损失函数,通过最小化损失函数调节神经网络中每个神经元之间的连接权重以达到训练收敛。

由于偏微分方程在其定义域与值域的关系数量是无限的,在整个域上进行训练约束是不现实的,所以只能取定义域与值域上离散的映射关系(训练数据)进行训练。训练样本的选取关系到模型的泛化性能,选取的样本分布尽可能地涵盖所研究的偏微分方程在其定义域与值域映射关系中所有关系特征,可以大大提升模型的泛化能力。

同理,边界条件的泛化性能也应考虑对不同边界条件函数的映射关系的特征分布进行训练样本选取,例如壁面上不同区域的时空坐标与物理量值的映射关系的特征选取。

2.2 PINN 在流场重建中的应用

流场重建指充分利用流场的已知信息或可观测信息挖掘流场未知信息或不可观测信息。实验是解决CFD 和理论分析无法解决的流体力学问题的最后手段,但是实验通常只能获得有限的、可观测的数据样本,因此想要获取全流场的流动信息进行更细致地研究就需要涉及到流场重建,包括:1)基于流场快照的速度场构建;2)基于流场速度场的其他流动信息构建,比如压力场;3)基于稀疏流场和噪声流场的信息重建等。如何有效解决这些问题是获得高精度实验结果必须解决的难题。

针对特定流场重建已发展出各种算法,例如利用图像信号处理方法对原始流场图像进行图像增强和去噪后获得高质量图像;运用相关法和光流法从PIV(particle image velocity,PIV)流场快照中提取出速度场信息后,有限容积法、直接积分法和泊松公式能结合不可压缩流动的速度场重建压力场[18];本征正交分解(POD)方法对稀疏流场进行模态分解后重组模态基完成稀疏流场的重建等。这些方法都各有优势和局限,相关法和光流法其原理基于图像信号,缺乏流体力学先验信息约束,因此对实验图像质量要求苛刻。有限容积法、直接积分法和泊松法通过处理不可压缩N-S 方程后,求解压力梯度获得流场的压力场,这要求高精度的速度场,并且存在误差积累的问题。此外,现有流场重建问题根据其背景不同,适用的算法也完全不同,算法之间难以相互联系和发展。而人工智能具备在大数据的基础上发掘数据之间的隐含规律这一特性,因此探索通过人工智能赋能流场重建,挖掘大量流场数据之间的隐含信息,从而可以构建流场变量和时空坐标之间的函数关系。直接使用传统机器学习模型回归数据样本的函数关系因缺乏物理信息的先验知识而不能获得较好的结果,而PINN 方法通过对神经网络增加流场物理变量之间的N-S 方程约束,使人工智能赋能流场重建变得可能。

本文使用张朋[19]计算的可压缩充分发展槽道湍流直接数值模拟(DNS) Case2 的结果作为训练和测试数据。计算条件为来流马赫数Ma=1.5,来流雷诺数Re=6 000 , 等温壁面Tw=288.15;流向和展向为周期性边界条件,法向壁面为无滑移边界条件。DNS 计算域和训练区域如表1 所示。受限于计算机的能力,截取了半槽道的部分空间和时间作为PINN 训练区域:x方向网格区域为[50, 150],y方向为[1, 90],z方向为[150, 220],从总DNS 计算时刻中随机抽取100 个时刻的数据文件,形成(Nt,Nx,Ny,Nz)=(100,101,90,71)的实验数据集,再从中随机采样25 个离散时刻的流场作为训练数据集,余下作为测试数据集。训练中对于偏微分方程约束采用自动微分求解,方程的边界条件由训练数据确定。

表1 计算和训练区域设置Table 1 The domain Setup for DNS & PINN

训练曲线如图4 所示。从图中可知,方程约束项Equation_loss 的波动要大于输入特征项Label_loss,两者的数值大小接近,这反映流场重建结果同时受数据样本和方程信息约束。

图4 PINN 重建Re = 6 000 槽道的LossFig. 4 Reconstruction of loss of Re = 6 000 channel based on PINN

图5 为从训练空间截取的t= 0 时刻、z= 2.38 流向x-y平面的DNS 和PINN 重建的瞬时物理量等值图对比,包括流向速度u、法向速度v、展向速度w、压力p、密度ρ、温度T等。从图中可知,u、v、w、p、ρ、T在不同时刻的PINN 重建结果与DNS 结果十分接近。数据分析显示在其余时刻、以及不同平面包括展向y-z平面和法向x-y平面的物理量的等值线对比也显示了相近的结果。

图5 流向平面DNS 和PINN 的瞬时物理量对比 (t = 0, x, y, z = 2.38)Fig. 5 Comparison of instantaneous physical quantities between DNS and PINN in streamwise plane (t = 0, x, y, z = 2.38)

图6(a)为从预测结果中随机选取的第40 个时刻法向x-z平面((1-|y|)/H= 0.176,H为半槽高)上的流向脉动速度u′i=ui-<ui>等值云图,可以清晰看出脉动流场的结构细节。同时,应用Ω判据[20]计算该法向平面上的涡结构也验证了该条状流动特征,说明PINN 可重建湍流流动特征。

图6 PINN 重建流场瞬时量分布Fig. 6 Instantaneous flowfield by PINN

图7 对比了PINN 预测结果和所选区域的DNS结果的平均量,结果显示雷诺时均流向速度<u>、密度<ρ>、温度<T>沿发现法向分布均与DNS 的统计平均值吻合良好,证明添加了物理先验知识约束后的神经网络具有良好的数据回归和流场重建能力。图8 记录了瞬时物理量的PINN 重建结果与对应时刻测试数据DNS 数据的相对误差,横坐标t表示25 个离散时刻,并显示u、p、ρ、T的重建结果优于v、w的 重建结果,其相对误差RE 低于1%以下,v、w作为充分发展槽流中的脉动速度具有随机性,数量级也远小于其他物理量,预测结果的相对误差反而较大。

图7 PINN 方法和DNS 的统计平均物理量的对比Fig. 7 Comparison of mean profiles between PINN and DNS

图8 PINN 重建结果的相对误差Fig. 8 The relative error of the reconstruction result of the PINN

上述内容验证了PINN 重建流场的可行性,根据结果我们可以发现PINN 的训练拟合的结果精度较高。

为了验证PINN 的预测能力,采用同流场不同分布数据集进行训练并预测,从流场中抽取半槽道结果作为实验数据集:x方向网格区域为[50, 150],y方向网格区域为[2, 90],z方向网格区域为[150, 220]。采样共100 个离散时刻的流场,采集的样本数据量为(Nt,Nx,Ny,Nz)=(100,101,89,71)。训练测试数据如表2。预测的瞬时流场如图9,统计平均量如图10。流场训练结果如表3,流场预测结果如表4。结果显示,对于同一流场不同分布的训练集,PINN的预测性能较为可观,多数物理量的预测效果较好,但由于物理量v、w的量级与其他变量的量级相差太大,预测性能较为一般,可采用加大Loss 函数中对于v、w的损失权重以改善其预测效果。

表2 训练测试样本算例Table 2 Example of training and test samples

图9 预测的瞬时流场Fig. 9 Training and prediction of instantaneous flow field

图10 PINN 方法和DNS 的统计平均物理量的对比Fig. 10 Comparison of mean profiles between PINN and DNS

表3 流场训练结果Table 3 Results of flow field training

表4 流场预测结果Table 4 Results of flow field prediction

由于预先融入了物理信息的约束,PINN 相比普通的神经网络的拟合速度更快,效果也更好,效率更高。PINN 对于同一特征流场的预测性能较好,但是由于其输入特征为时空坐标,以至于输入模型的信息量有限,导致其泛化性能较为一般。增加有效输入特征以及减少损失函数中关于特定流动的特征约束可以一定情况下提升PINN 的泛化性能。对于高Re的非定常流动,流动的随机性大大提升,相比全连接网络,可以尝试采用时序、卷积等结构的神经网络模型,在一定情况下可以改善对于高Re非定常流动中的特征捕捉能力。

PINN 在流场重建中具有实际应用价值。PINN可用于PIV 流场重建,利用实验的流场数据,探索一种能够以较高精度重建流场变量连续状态变化的方法具有一定工程意义,以及PINN 对于流场数据缺失复原的应用也具有较大的可行性。

2.3 PINN 在参数重建中的应用

模型的系数重建问题是一类较为重要的工程问题,其中渐近性原则常被用于解决此类问题。渐近性原则的思想是模型预测的方程输出结果应当和实验结果一致,本质是数据拟合。研究人员常使用渐近性原则来确定模型方程中的待定系数,其方法是在逼近模型系数时,率先确定对精度影响大的方程项的系数,再逐步确定其他系数,进而逐一确定系数。这一方式可以降低小项的影响,但难以同时获得最优的系数组合解。不同于传统做法,PINN 具备结合样本数据反推方程属性的能力[21],可以同时确定方程中的待定系数组合,因此PINN 方法可以在参数重建领域发挥巨大的作用。

如图11 所示,建立PINN 模型来说明PINN 的参数重建。具体为针对二维不可压缩绕圆柱流动,设置N-S 约束方程系数 λ1、λ2为可训练参数并给定初值 λ1,0、λ2,0,采用不可压缩圆柱绕流DNS 结果作为训练数据(其对应的真实 λ1=1,λ2=1/Re=0.01)[22]。训 练过 程 中对 λ1、λ2不 断 调整,设 置 λ1、λ2不同 的初值所对应的训练过程中其收敛曲线如图12 所示。观察图12 发现不同初始值下的 λ1、λ2在训练过程中不断跳出局部最优值,达到全局最优值即真实值。

图11 待定系数的PINN 模型Fig. 11 PINN model with undetermined coefficients

图12 不同初始值 λ1、λ2 随着训练次数的变化趋势Fig. 12 Different initial values λ1、 λ2 with the change of training times

表5 为最终收敛值和对应的相对误差。从表5中可知,使用PINN 重建流场时,PINN 可以将N- S 约束方程的系数当作自身的可训练参数,使其随着训练收敛至真实值。

表5 不同初始值λ1、λ2 的重构结果Table 5 The reconstruction results of λ1、λ2 with different initial values

此外,我们进一步尝试了通过2.2 节中三维可压缩槽道流DNS 数据对三维可压缩N-S 方程中的体积力项f进行重建,分别设置体积力项f初始值为f0=1与f0=-1, 训练的过程中,体积力f与方程损失Equation- loss 收敛曲线如图13 所示。

由图13 可知不同初始值下,体积力f分别在f=0.003 05与 0.002 88附近收敛。在三维可压缩槽道DNS 算例中,体积力平衡壁面剪切摩擦力,因此可以通过DNS 结果计算得到壁面剪切摩擦力来验证模型收敛得到的体积力。DNS 数据平均后得到的壁面剪切摩擦力 τw=-0.003 3,与本文预测值的偏差分别为7.9%和-12.7%。通过体积力项的预测,说明了应用高精度DNS 数据不仅可以预测待定系数,还可以预测方程中的组成项,这为后续利用DNS 数据耦合平均流方程来预测雷诺应力提供了解决思路,验证了该方法有可能适用于更广泛的模型构建场景,这与Callaham[23]所做的聚类分析工作有着异曲同工之处。

图13 体积力与方程损失收敛曲线Fig. 13 Convergence curve of volume force and equation loss

3 结 论

PINN 作为融合人工智能和以数学方程表示的物理先验知识的一种新方法,其未来应用的方式还有更多可能,本文阐述了该方法并结合具体工作举例说明了其可适用场景:

1)PINN 用于求解偏微分方程:应用神经网络来逼近高维复杂偏微分方程是人工智能目前重要研究方向之一,PINN 将偏微分方程融入误差网络,结合自动微分方法提高了求解的效率和精度。

2)PINN 用于流场信息重建:通过在损失函数中添加偏微分方程约束并利用自动微分技术,结合DNS 训练数据集应用于可压缩槽道流动,可以重构瞬时湍流流场,并通过对预测参数的统计分析与DNS 数据对照分析,验证了预测模型有效性及其用于更多流动场景的可能性。

3)PINN 用于方程参数重建:结合不可压缩圆柱绕流与三维可压缩槽道流的控制方程和DNS 数据训练集,通过训练可以获得方程中的待定系数与待定项,验证了该方法可以进一步应用于更广泛的模型构建场景。

但是在研究中也发现了PINN 方法目前的泛化性欠佳,极大限制了其使用范围和能力,是急需克服的难点。

致谢: 感谢浙江大学夏振华教授在本文研究工作开展中提出的各种有益讨论和建议。

猜你喜欢
流场神经网络方程
方程的再认识
方程(组)的由来
圆的方程
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于HYCOM的斯里兰卡南部海域温、盐、流场统计分析
基于神经网络的拉矫机控制模型建立
天窗开启状态流场分析
基于瞬态流场计算的滑动轴承静平衡位置求解
基于国外两款吸扫式清扫车的流场性能分析