基于时程深度学习的流场特征分析方法1)

2022-04-07 06:57战庆亮白春锦葛耀君

力学学报 2022年3期

战庆亮白春锦葛耀君

* (大连海事大学交通运输工程学院,辽宁大连 116026)

† (同济大学土木工程防灾国家重点实验室,上海 200092)

引言

流动特征的识别是一类复杂的数学物理问题,是流体力学研究中亟待解决的难点[1].非定常流场降阶模型(reduced-order model,ROM)是一种重要的研究方法,能够对实验或计算样本数据建立提取模型,实现系统辨识[2]及流场的特征提取[3]等.

传统的流场降阶模型研究对象,均针对实验或计算的快照(snapshot)开展研究,建立一系列不同时刻的样本数据集,进行流场特征的分离与提取.然而这类方法在数据采集、特征提取和分析等方面存在着诸多困难,尤其是实验中流场快照的获取极为困难.例如在风洞和水洞试验中,为了确定流场的形态需要采用显示技术进行流场显示,如烟流法[4]、氢气泡法[5]等,虽然通过观察能够得到剪切层和卡门涡等流动现象[6],但是无法获取定量的流场数据.再如激光多普勒测速仪(laser doppler anemometer,LDA)[7]、PIV[8]等方法利用示踪粒子的散射特性计算流场的速度分布,然而粒子类方法大多针对流场中固定切面进行,容积内全场三维测量仍难实现.

随着计算机和大数据方法的发展,深度学习在流体力学问题的研究中得到了越来越多的应用[9-10],如计算网格的生成[11]、基于神经网络模型的雷诺应力模型[12-13]、涡激振动的流动控制[14]、尾流状态的流动控制[15]、高精度流场预测方法[16]、流场状态的自动识别[17]等.同时,深度学习也为流场特征识别提供了新的思路.如Murata 等[18]用深度学习方法对瞬态流场进行模态分解,得到了比传统模态分解精度更高的结果.Omata和Shirayama[19]提出了基于自编码模型的瞬态流固耦合分析方法,同样采用数据驱动的方案得到了流场的低维表示.Fukami 等[20]提出了基于卷积神经网络的自动编码器,进行流场的非线性自动编码模式提取特征,同时保持不同特征的能量关系.

上述的流场特征识别研究都基于瞬态的全场流场快照开展,对多个时间序列的瞬态数据进行处理,从矩阵理论出发得到流场的模态特征.这些方法所采用的数据有着共同的不足:其空间维度的分辨率远远高于时间维度的分辨率.这些方法在处理复杂湍流等问题仍有很多不足[21-22],很大一部分原因是其难以实现更高时间分辨率的数据处理,而这恰恰是复杂湍流特征研究中的关键.

针对上述难点和问题,本文提出了流场特征识别的新方法:基于一点处流场物理量的时程为特征提取对象,采用基于卷积自编码方法的深度学习模型进行时程数据的抽象特征提取,获得降维后的原始时程的表征编码,对编码进行聚类分析从而得到具有不同特征状态的流场分布规律,实现流场特征分析.并利用本方法进行了低雷诺数圆柱绕流流场特征的自动分类,进行基于一点时程信息的流动状态的特征分析.

1 流场特征深度学习分析方法

流场中不同位置处的流动特征既相关又不同,传统特征工程等研究方法难以从复杂系统中识别并区分其中的关键流动特征.本文方法的整体流程如图1 所示,通过基于流场时程自动编码(flow time history auto encoder,FTH-AE)的方法对流场系统进行特征提取与降维,以流场中不同位置处测点的时程作为研究对象,提取出不同位置处时程关键特征的低维表征[23],并实现基于不同特征的流场区域识别与分类.

图1 流场特征分析方法Fig.1 Methodology of flow feature analysis

FTH-AE 模型的具体实现原理如图2 所示,模型包含输入层、卷积编码层、特征代码层、卷积解码层、输出层和分类器共6 部分组成.输入层输入流场中不同位置处的时程数据x,通过编码器进行特征提取与压缩,得到低维空间中的特征代码λ;特征代码通过卷积解码器对代码进行还原,使得输出与输入的时程信号x′相同.

图2 流场特征分析方法及FTH-AE 模型结构示意图Fig.2 Structure of FTH-AE model

根据FTH-AE 模型的计算原理,在训练过程中是无监督的训练方式,即不需要输入流场样本所属类型或者特征,因此适用于任意复杂的流动问题.进而时程分类器对低维空间中的特征代码进行聚类(K-Means)运算,得到低维空间中样本的分类标签,完成输入流场时程的特征分类.

为保证时程特征分类的准确性,FTH-AE 模型设计中要满足以下条件(1)根据流场及其样本特征,选择合适的卷积编码器结构(2) 为保证特征代码λ能够准确表征输入x的特征,编码器与解码器需满足下式的变换

其中Fe表示编码部分,Fd表示解码部分,x为输入的流场时程数据,λ为流场时程的特征编码.由FTHAE 模型结构可知,其输入与输出数据类型是相同的,模型无监督学习的目标是使得输入与输出尽量保持相同.如果模型在训练后满足式(1),那么模型的编码层与解码层中就自动提取得到了训练数据的关键特征,也即整个流场域内流场样本的特征,并将这些特征对应到了模型的特征代码空间中,可以针对降维后的模型编码进行进一步的特征分类计算.卷积层中对输入数据的计算过程为

其中T为输入数据的长度,l为卷积核的大小,K为当前层的卷积通道个数.在计算过程中,各通道采用了“共用权值参数w”的方法,减少了模型参数个数,同时共享了偏置矩阵bn.

为保证输入数据的特征的准确表征,模型中采用全卷积形式进行数据的压缩与还原.如果模型已成功训练到输出数据与输入数据近似相等,表明高维数据已成功映射到低维特征向量λ中.

2 流场时程数据提取

本文以低雷诺数圆柱绕流场为例验证方法的可行性与准确性,数据采用数值模拟方法[24]获取,计算域如图3 所示,雷诺数ReD=200.圆柱的直径D=1,圆心为坐标原点.计算域顺流长度为44D,上、下游长度均为22D;横向长48D,上下均为24D.圆柱周围矩形区域内使用较密集的非结构化三角形网格,距离圆柱较远的区域的网格划分比较稀疏.左侧入口边界为速度入口,右侧出口处的边界为压力出口,其余为对称边界.

图3 整体及局部的网格划分Fig.3 Global and local meshes

在圆柱绕流模拟中,圆柱壁面附近及尾流区域的流场受到干扰,流场特征丰富,适于选做研究对象.在圆柱周围选取了7122 个测点随机均匀分布在网格密集的矩形区域内,捕获该范围内流场的时程数据,测点分布如图4.

图4 测点位置示意图Fig.4 Location of sampling points

考虑到所选测点较多覆盖范围较大,样本所包含的特征各不相同.为了直观展示样本集中数据特征的多样性与复杂性,在圆柱周围的流场中随机选取6 条流向速度时程曲线进行展示,如图5 所示.图中时程曲线的振幅、频谱分布等特征均不相同,这表明流场中不同位置的时程曲线所包含的流场特征存在差异.

图5 典型测点的流场流向速度时程Fig.5 Time history of flow field x-velocity at typical measuring points

图5 典型测点的流场流向速度时程(续)Fig.5 Time history of flow field x-velocity at typical measuring points(continued)

3 模型参数及其训练

为了有效提取流场中不同位置的时序特征,本文的“FTH-AE”模型结合一维卷积进行时程信号的特征提取.其中“Encoder”可以对数据进行压缩,利用一维卷积在保留数据原始特征的同时对数据进行降维,得到原始数据的低维度特征.使用“Flatten”层对降维后的数据进行拼接,再通过“Dense”层将数据输出为所需的维度.“Decoder”可以根据压缩后的低维度特征将数据还原成原始数据,其输入为“Encoder”的输出再使用一维反卷积层实现数据的解码还原.具体参数如表1 所示,其中“Conv”表示卷积层,Conv_T 表示反卷积层,激活函数采用ReLU 函数表示自动编码特征分类模型参数.

表1 FTH-AE 模型参数Table 1 FTH-AE model parameters

模型中所有卷积核的尺寸均为9 的偏大尺寸的卷积核,获得较大范围的局部时程信息,有利于模型的收敛.卷积层的卷积核个数分别为32,16 与10,经过系列卷积变换的输出尺寸为1000 × 10,为了保留卷积权重与时程序列之间的对应关系,本文使用“Flatten”层附加10 层全连接层进行降维,最终将单个时程样本压缩为10 维空间中的一点.模型的解码部分各参数与编码部分相对应,顺序相反.

本模型训练采用的是无监督训练模式,数据集中没有指定的标签,且所有数据都为训练集.采用ADAM 方法加速模型收敛,参数选为1.0×10-4.训练的批量大小(Batch_size)为8,输入与输出之间的差异用MSE 损失函数(loss)来衡量,训练次数设置为500 次.同时设置“Earlystopping”为40,即在训练过程中若损失值在40 步内无下降则网络自动停止训练.经过计算得到了迭代过程中损失函数曲线如图6所示,模型的最终损失值为1.0×10-4.

图6 自动编码特征分类网络损失值Fig.6 Loss of FTH-AE with respect to epoches

4 结果与分析

4.1 特征编码的准确性验证

自编码模型结构为无监督学习模型没有测试集,残差值即为输入数据被模型编码与解码前后的差异,损失值越小说明网络对输入数据特征提取得越精准.为了验证模型的准确性,选取了6 个测点处顺流速度U的原始样本及深度学习模型的还原曲线进行比较,如图7 所示.由图中原始时程与模型结果比较可知,原始数据与根据低维编码还原的时程曲线差异很小,两条曲线几乎重合说明模型可以准确的提取到流场中各个测点处数据的低维度特征.因此,模型的中间的特征编码层包含了所训练数据的降维后的特征,且可根据编码准确还原出原始曲线的特征,因此可利用这些低维空间中的编码进行原始曲线的特征区分与识别.

图7 原始时程与FTH-AE 模拟的时程Fig.7 Original samples and FTH-AE result

4.2 基于降阶编码的流动特征分类

对FTH-AE 模型所得到的低维空间中的编码特征进行K-Means 计算,即对整个流场的低维表征进行自动分类,可以得到流场中不同特征时程的分类结果,进一步将分类结果按照流场测点的位置进行显示,所得结果如图8 所示.其中图8(a)表示不考虑流场均值的特征分类结果,可见根据深度学习模型所提取的测点的特征,可以将整个流场分为3 类区域:绿色区域、蓝色区域和橙色区域.图8(b)为对应的不考虑流场均值的模态分解结果,比较两图可以发现深度学习模型成功得到了流场的主要模态,即流场的最重要的“特征”.不同的是,DMD 方法基于矩阵理论进行了特征提取与分解,而本文则直接根据流动特征进行了自动的特征提取与识别.

图8 尾流特征识别结果Fig.8 Feature recognition of wake

为了明确流场特征分类的物理意义,阐述“深度学习究竟学习到了流场的哪种特征”,进一步对不同分类区域内的流场测点处时程进行了举例分析,结果列于图9.

图9 不同类型的时程特征分析Fig.9 Feature analysis of different class

为方便结果分析,定义绿色区域内的流场时程为第1 类特征,蓝色区域内的流场时程为第2 类特征,橙色区域内为第3 类特征.分别在3 类特征的测点中选择6 个测点,测点位置见图9(a),图9(c)和图9(e),对应位置处的顺流速度时程见图9(b),图9(d)和图9(f).通过观察,可以发现3 类时程的明显特征差异:第1 类特征的曲线振幅都偏小,这些测点位于涡脱区域外部;第2 类曲线与第3 类曲线振幅均较大,但是相位相反,即第2 类曲线达到极大值的时刻对应的第3 类曲线均位于极小值,这些测点均位于尾流中的对称涡脱区.由于本算例所研究的流场简单,因此对应特征容易通过人为观察发现其中的规律,同时也可验证本文的模型自动识别结果是准确的.

5 结论

本文提出了基于时程数据的自编码流场特征识别方法,通过对流场时程进行特征提取,得到复杂流动数据的低维表征,并对低维编码聚类分析获得不同特征的流场分布.作为研究算例,对低雷诺数圆柱绕流流场进行了验证,结果表明模型能够准确还原空间不同位置处的时程曲线,验证了模型的准确性.进一步,对低维的模型编码进行了聚类分析,得到具有不同特征的流场区域分布,与模态分析方法得到了一致的流动特征识别结果,同时对深度学习分类的结果进行了物理解释.本方法从流动的时程特征角度实现了流动特征识别,是一种全新的流场分析方法.虽本文研究的计算算例流场特征相对较简单,但本方法同样适用于复杂流场特征的自动识别研究,借助深度学习强大的特征提取能力,可实现复杂流场的深度特征分析.