宫思吟,俞晓东,2,葛思涵,陈艳琳,钟汉斌,2(通信作者)
(1 西安石油大学化学化工学院 陕西 西安 710065)
(2 西安石油大学西安市高碳资源低碳化利用重点实验室 陕西 西安 710065)
反应器内部存在复杂的流场传递行为,准确预测反应器中复杂的流体力学特征、传热过程以及各种瞬态行为,是化工领域的重点目标之一。 计算流体力学(computational fluid dynamics,CFD) 可以利用电子计算机对复杂物理现象进行计算和预测,更精确地研究流体流动、传热传质和化学反应的基本规律。 然而,CFD 模拟方法涉及到大量的物理方程和反应机理,这些方程和机理往往非常复杂,计算量巨大。 特别是在模拟具有复杂几何形状和多相流等特殊流体现象的反应器时,需要更长的计算时间。 这不仅影响了模拟结果的实时性,而且也限制了模拟的规模和深度。 为了解决这一问题,研究者们开始将机器学习方法应用于反应器模拟中。 机器学习技术可以通过对已有历史数据的分析和挖掘来建立反应器的预测模型,跳过了繁杂的方程计算,加速计算速度并提高模拟精度。 本文总结了一些经典的机器学习方法和通用建模过程,并依据多篇文献,阐述了机器学习方法在反应器内建模的应用进展。 重点关注反应器内流场的重建工作,以及从机器学习的视角来看有着相同原理的涡轮流场重建工作。
机器学习方法可以按照训练数据是否有标记信息分为监督学习、无监督学习和半监督学习三种。 监督学习的数据集中包含了已有标记的数据,通过建立模型学习明确的输出关系,就可以预测新的数据。 监督学习的典型应用包括分类和回归问题。 分类问题是指将输入数据划分到事先定义好的类别中,如图像分类、垃圾邮件过滤等;而回归问题则是指预测一个连续值,如股票价格预测、房价预测等。 非监督学习的任务是在没有标记数据的情况下,对数据进行建模和分析,寻找数据中的结构和模式。 非监督学习的典型应用包括聚类、异常检测和降维等。 聚类是指将数据按照某种相似度度量的方法分成若干组,每组内部数据的相似度要尽量高,组间的相似度尽量低。 异常检测则是指在数据集中找出与其他数据不同的样本。 而降维则是指将高维度数据映射到低维空间中,但要尽量保留数据中的关键特征和信息。 半监督学习则介于监督学习和非监督学习之间,其任务是在部分数据有标签、部分数据没有标签的情况下,通过学习已知标签的数据,为未标注的数据建立模型。
图1 展示了Brunton 等[1]总结的三种类别中各自包含的主要的方法。 其中,神经网络模型是目前最为强大的机器学习算法之一。 它模仿了人脑的神经元结构,通过构建多层的神经网络来实现对输入数据的处理和预测。 这里简单介绍一下神经网络中的一些基本的概念。 神经元是神经网络中的基本单元,它接收一个输入并产生输出。 神经元接收到的输入与其对应的权重进行乘积之和,作为神经元的激活值,再通过激活函数进行非线性转换,以实现对复杂数据的建模。 多个神经元按照一定规则组合成的层,可以用来提取输入数据的不同特征。 神经网络从输入开始进行前向传播,依次经过多个层,直到输出结果。 损失函数可以衡量模型预测结果与真实结果之间的差异,作为模型训练的目标函数。 通过计算输出结果与真实结果的误差,将误差反向传播回神经网络,更新权重,以提高模型的预测准确率。 常见的神经网络模型包括多层感知机(multilayer perceptron,MLP)、卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)等。 其中,MLP 是最基本的神经网络模型,由多个全连接层组成,可用于分类和回归等任务;CNN 适用于处理图像数据,通过卷积层和池化层提取图像的空间特征;RNN 则适用于处理序列数据,如自然语言或天气数据。
图1 常用机器学习方法分类
当使用机器学习方法解决某一问题时,通常需要经历一些通用的建模步骤:收集数据、数据预处理、特征工程、模型选择、训练模型、模型评估和模型优化等。 首先需要根据研究的问题收集和整理相关的历史数据。 数据通常需要经过清洗和预处理才能用于模型的训练。 一般情况下,预处理包括对原始数据的清洗、转换和归一化[2]等操作,以保证数据的质量和完整性。 清洗的重点是消除噪声、缺失值和异常值等可能对数据造成影响的数据。 归一化则是为了避免不同量纲对模型产生的影响。 不同的特征往往具有不同的量纲和取值范围,如果不对特征进行归一化,那么量纲大的特征会对模型产生较大的影响,而量纲小的特征则会被忽略掉,从而影响模型的精度。 特征工程会寻找和提取与目标变量相关的有效特征,从输入信息的角度精益求精。 它不是必须的步骤,但它能够提高模型的准确性和泛化能力。 常见的特征工程方法包括特征选择、特征变换、特征组合等。 将处理好的数据输入到模型中,通过不断地迭代来最小化预测误差,让模型逐渐优化。通过验证数据集对训练出的模型的性能进行评估,可以使用常见的指标如均方误差、准确率、召回率、精确度等。 当模型评估通过后,就可以将其部署到实际生产环境中,进行实时预测。 训练和评估所使用的数据均是总数据集中不相交的子集,这也意味着建立模型之前必须对数据集进行划分。 通常将原始数据集划分为训练集、验证集和测试集。 训练集用于模型的训练,验证集用于模型的选择和调整,测试集用于评估模型的泛化性能。
对瞬态流场图像预测任务进行深度学习建模,一个客观的经验是从卷积神经网络入手,因为它在处理图像数据方面的表现非常出色。 在流场预测方向上,CNN 可以用于提取流场数据的空间特征,如涡旋、湍流结构等,并且另一方面,CNN 在处理大量数据时具有良好的泛化能力,这使得它们能够在训练数据之外的数据上产生准确的预测。这对于流场预测是非常重要的,因为该任务往往需要在不同的操作条件下预测流场的行为。 通常情况下,单纯使用CNN 的模型,即特征提取部分和流场重建(生成)部分均选择CNN 的模型,其架构一般多采用自编码器。 自编码器由编码器和解码器两部分组成。 编码器将原始数据映射到一个低维空间,该空间被称为编码空间;解码器将编码空间的数据重构回原始空间或生成新的数据。
机器学习已经成为一个备受关注的技术,它在各个领域中都有广泛的应用。 一些研究者们也开始将机器学习应用于化学化工领域,以期加速化学研究的进程,提高化工产品的效率和品质。 程全中等[3]从萃取、精馏、结晶、流态化等单元操作的应用角度出发,综述了机器学习与化工结合的研究进展。 朱礼涛等[4]则讨论了机器学习在多相流设备(尤其是多相反应器)中流动、传递及反应特性的研究现状。
Bazai 等[5]建立了一个自编码器模型,其内部堆叠了多个CNN,并基于CFD 中的数值模拟结果进行训练。 训练后的模型能够预测流化床的瞬态体积分数分布。 该研究表明,基于深度学习的模型在预测流化床瞬时流动行为的速度比CFD 更快。 这是因为深度学习模型无需求解任何传输方程,计算量更小。 在完成训练过程后,该模型可以独立于CFD 进行预测,即不需要再由CFD 提前进行模拟计算以提供数据。 An 等[6]基于U-Net[7]网络构建了一个名为CFDNN 的深度学习求解器,用来预测空腔内湍流燃烧的流场和燃烧场。 通过使用不同入口速度下的空腔火焰数据对模型进行训练,并用训练集范围内不包含的入口速度进行测试,证明了模型预测结果的可行性。 CFDNN预测结果的空间分布和时间分布与OpenFoam 的模拟结果非常吻合。 Jeon 等[8]在MLP 中引入了基于物理信息的损失函数和有限体积法,仅用先前两个时间分布的流场就可以预测未来十帧的流场。 在传统的机器学习中,损失函数通常是根据训练数据和期望输出定义的。 在化工领域的许多应用场景下,还有一些关于控制问题或物理定律的额外条件。 如果它们能够被有效地纳入模型中,就会约束假设空间(模型所属的函数的集合)的范围,模型就可以在更小的数据集上进行训练。 物理信息损失函数通过惩罚与已知物理定律的偏差,将物理约束纳入模型。 这在可用数据有限、有噪声或不完整的问题中有明显效果。
涡轮尾迹流场的预测是传统CFD 模拟的另一个常见的应用场景。 涡轮尾迹是涡轮机在工作时形成的空气流动的尾迹,其流场结构非常复杂,与反应器内的流场一样受到多种不确定因素的影响。 一些研究者已经开始探索使用深度学习模型来预测和模拟涡轮尾迹流场。 Zhang等[9]利用六层CNN 的组合建立了一个编码器模型,用以生成风力涡轮机尾流的时间平均流场。 建立模型前先利用大涡模拟(large-eddy simulations,LES)生成CNN 编码器模型的训练和验证数据。 模型的每个输入样本由五个瞬时速度场构成,以反映湍流结构的时间平均变化。 这项研究中详细测试了CNN 模型重建风力涡轮机周围的时间平均流场的能力以及预测涡轮机功率输出的能力。 预测的流场清楚地反映了LES 得到的涡轮尾迹的主要特征。CNN 预测得到的速度剖面与LES 时间平均结果吻合良好,总体相对误差不超过3%。 同时,该研究利用数据增强技术有效地解决了CNN 的位置敏感性问题。 在时间上,该研究所提出的总成本比LES 减少了88%。
CFD 和机器学习都是化工领域不同的工具,在化工领域中有各自的应用场景和优劣势。 CFD 作为一种基于物理学原理的建模方法,能够提供更精细和准确的流场预测。 而机器学习可以通过学习历史数据中的行为模式来预测新的结果,跳过了计算数值方程组的步骤,大大节省了预测时间,但由于缺乏可解释性,它暂时还无法替代CFD 模拟。 将机器学习和CFD 结合起来可以实现更准确和高效的流场预测。 因此,机器学习和CFD 在化工领域中将会有更多的应用,并且这两个领域也将会相互促进。