化工过程的智能混合建模方法及应用

2021-04-20 10:31张梦轩刘洪辰王敏蓝兴英石孝刚高金森
化工进展 2021年4期
关键词:串联机理建模

张梦轩,刘洪辰,王敏,蓝兴英,石孝刚,高金森

(中国石油大学(北京)重质油国家重点实验室,北京102249)

化学工业作为中国制造业的重要的组成部分之一,既是经济社会发展的支柱产业,也是实体经济的重要基石[1],根据2018年末统计结果显示,化学工业占国内规模工业总份额的12.7%,同比增长12.4%[2-3],其对国内经济、工业、民生的重要性不言而喻。为应对传统炼化行业中存在的产能过剩、成本上升、效益下滑、资源环境约束等问题[4],近年国家制订了《新一代人工智能发展规划》、《智能制造发展规划》等纲领性文件,结合先进控制系统、建模与仿真技术、人工智能理论、核心软硬件的快速发展,将智能炼化相关研究与建设提上了“快车道”[5-8]。智能化研究与建设的主要应用场景包括大至炼厂全厂,小至单元设备的模拟、监测、优化、预测等,并对解决问题的速度、精度、敏捷性等提出了更高的要求,对研究对象建立合适的数学物理模型是实现上述应用场景的基础,国内外学者围绕化工过程建模展开了大量研究,并取得了一定的成果[9-11]。

目前根据建模过程对系统知识和过程数据的需求关系,化工过程模型可以分为机理模型、数据驱动模型、混合模型三大类。机理模型,也被称作第一性原理模型(first principle model,FPM),主要是依据三大守恒定律、热力学、动力学、流体和颗粒性质等推导出的过程模型,能有效地反映工艺特点及规律,具有很好的可解释性和外推性,并可以用于指导实际过程的设计。由于化工过程普遍体量庞大且复杂[12],具有时空多尺度特性[13-14],各部分高度耦合,建立完整机理模型的难度巨大,且由于人类对机理知识仍处于部分掌握的状态,模型中会引入大量的假设和经验,使其性能的有效范围受限[15-16]。机理模型的最终形式一般是偏微分或常微分方程组[9],求解速度较为缓慢。

数据驱动模型(data-driven model, DM)是基于大量过程数据以及机器学习算法的过程模型,得益于石化企业生产过程执行系统(manufacturing execution system, MES) 和实验室信息管理系统(laboratory information management system,LIMS)带来的海量过程数据和实验分析数据,使得通过机器学习算法深度挖掘数据建立过程模型变得可行。数据驱动模型在训练阶段需要较少的过程机理,在使用阶段具有计算量小、求解速度快、在模型建立的数据范围内准确度高等优点,在各类过程建模任务中取得了良好的效果,获得学者的广泛关注。但是化工过程的强非线性[17-19]、时滞性[20-21]以及高维度[22]等特性都对建模过程和模型性能带来一定的不利影响,且数据驱动模型较低的可解释性和物理意义、外推性等也被广泛认为是其主要缺点。

对于化工过程建模,无论是机理模型还是数据驱动模型都有难以解决的问题,混合模型(hybrid models, HMs)是一种基于“扬弃”哲学思想,结合多个机理模型和数据驱动模型而成的过程模型[11],其根本目的在于发挥不同类型子模型的优势,获得更好的模型性能[23]。因此结构合理,性能优良的混合模型可以兼顾机理模型和数据驱动模型二者的优点,并能在一定程度上弥补二者的缺点。如何使建立的混合模型具有“扬长补短”的效果,需要建模者对过程机理有较为深入的理解以及充足、合适的过程数据。自混合建模方法第一次在实际问题成功引入并实施之后[24],混合模型得到了越来越多的研究和应用[10,25],在化工过程建模领域中,混合模型被广泛用于研究复杂的反应、传热以及流动系统。与机理模型相比,混合模型更易建立,即使过程某部分机理未知或者非常复杂,仍然可以通过过程数据形成局部数据驱动模型从而完成整体建模。通过替换部分机理模型可以有效地加快模型的计算速度,更适用于在线任务;相比于数据驱动模型,混合模型可以为模型的结构和参数带来一定的物理意义,有助于作出有意义的基于过程知识的控制决策。在模型建立过程中需要的过程数据更少,在获得过程数据前即可以量化部分过程的趋势变化,模型的参数维度也会有所降低。当有新的过程数据可用时,更容易校准模型,这能有效提高模型的适用性。三种模型的特点和性能对比如图1所示。

本文从混合模型的结构和应用的角度出发,对近年来化工过程中的混合建模研究展开综述,着重讨论了混合模型的结构(串联、并联、混联)、主要应用以及两者间的联系。一般地,模型结构的选择主要取决于机理模型建立的难度,如果采用并联结构还需要考虑过程数据是否充足,而混联结构则是以一种串联或并联结构为基础扩展而成的,在模型结构设计上有着明确的目的性。文章最后对混合建模当前研究中存在的问题进行了总结,并对混合建模技术未来在化工过程中可能的发展方向进行了展望。

图1 三种模型特点、性能、关系示意图

1 混合模型的结构

本文中讨论的混合模型是指同时含有FPM 和DM 的混合模型,其中DM 部分往往包含一个或多个机器学习算法作为核心,如人工神经网络(artificial neural network,ANN)、支 持 向 量 机(support vector machine,SVM)、模糊逻辑(fuzzy logics,FL)、偏最小二乘法(partial least squares,PLS)、遗传算法(genetic algorithm,GA)等。混合模型的结构要视具体的研究对象、目标问题以及系统整体特点而定[11],通常以FPM的性能强弱以及开发成本作为主要选择依据[26-27]。根据FPM 和DM结合的方式,可以将混合模型的结构分为三种,即串联结构、并联结构以及混联结构,其中串联结构分为DM-FPM型和FPM-DM型两种,见图2。混合模型的结构设计需要建模人员具有扎实的化工背景知识,在恰当位置结合适宜的DM 以达到预期效果。

1.1 串联结构

DM-FPM型串联结构[28-33]的模型结构如图2(a)所示,DM通常被用来获取FPM的未知参数或者未知函数表达式,形式上作为FPM 的一部分,整体以FPM为核心,可以最大程度保留FPM的物理意义。该种混合结构主要用于反映化工过程中的动态行为,模型性能主要取决于FPM 中先验知识的准确性。FPM-DM 型串联结构[34-36]的模型结构如图2(b)所示,当系统中某一部分的先验知识不完备,或建立FPM 的难度过大时应优先选用该种混合结构。该种结构中以DM替代一部分过程机理,并以FPM的计算结果作为DM的训练数据输入,和目标数据建立映射关系。当FPM 的结果较为准确时,该种混合结构往往表现出令人满意的性能[37-38]。

图2 常见的串/并联混合模型结构示意图

罗雷涛等[39]以工业催化重整装置为研究对象,对脱氯前氢气纯度建立了DM-FPM 型混合模型,其中FPM为包含了H2、C1~5、C5+三个虚拟组分的三集总动力学模型,DM为最小二乘支持向量机,用于求解集总动力学模型中的活度系数γM,在模型验证阶段使用了工业重整装置的数据,并与单独使用DM的结果进行对比,结果表明建立的混合模型具有更高的精度。Azarpour 等[31]对固定床催化反应器(fixed-bed catalytic reactor,FBCR) 建 立 了DM-FPM 型混合模型,FPM 为催化剂失活模型,DM为ANN,用于预测催化剂失活中的的动力学常数γa,避免了常规方法中该部分的复杂、低精度计算过程,验证阶段采用了工业对苯二甲酸加氢纯化过程以及工业甲醇过程,成功预测了两个过程中的催化剂寿命以及装置操作参数对反应产物的影响。值得注意的是,在该混合模型构建过程中没有引入特定催化剂的性质参数,表明其在FBCR建模问题中具有一定的泛用性。华丰等[40]以工业乙烯裂解炉为研究对象,设计构造了一种裂解炉辐射段传热与反应的FPM-DM 型混合模型,其中FPM 是基于过程机理建立的管外分区传热模型以及管内传质模型,以沿炉管方向的特征温度与装置操作参数作为输入,炉管方向的3次热通量曲线参数作为输出训练了ANN,并将管外传热模型和管内传质模型进行耦合,模型验证结果表明该混合模型可以准确的预测裂解炉的产物分布,模型收敛速度比FPM快6倍。Khazraee 等[34]以间歇反应精馏装置为研究对象,建立了FPM-DM 型混合模型,其中FPM 为塔内逐板传热、传质模型,DM 为4 个并行的自适应神经模糊推理系统,以塔盘温度作为输入,对塔板上的组分浓度进行预测,取得了良好的效果,为实际间歇反应精馏装置的组分控制提供有效的指导。Hosen 等[32]以苯乙烯聚合过程为研究对象,建立了FPM-DM 型混合模型,构建过程中首先根据质量、热量守恒方程等过程机理构建了反应器的FPM,并推算了聚合反应的动力学常数,用装置操作参数和动力学数据作为输入,产物分布作为输出训练ANN,最后将ANN 整合到FPM 中,最终以装置实验数据对模型性能进行验证,结果表明该混合模型相比单独建立FPM具有更高的准确性。

1.2 并联结构

并联结构混合模型的结构如图2(c)所示,以一定方式将多个FPM和DM的输出叠加,作为混合模型的总输出[41-50],是一种基于集成学习的建模方式[51]。其中FPM是该种混合结构的核心,用于反映过程内部的动态行为,DM 则作为FPM 的残差项,或者作为离散形式FPM 参数的校正系数,对FPM的输出误差进行补正。相比单独使用DM,并联结构混合模型能有效减少模型参数的维度,一方面可以降低模型训练的成本,另一方面可以降低因大量模型参数带来的过拟合风险[45,52]。但并联混合模型性能受限于训练数据的有效范围,超出有效范围的数据无法获得可靠的输出,模型外推性较差[53]。

Su等[46]以聚合物反应器为对象,设计了一种并联混合模型,通过ANN 对机理子模型的预测误差进行补偿,取得了良好的效果。Khoukhi 等[47]结合状态方程与两种ANN、SVR 建立了原油黏度、气/油比(GOR)与压力-体积-温度(PVT)特性的预测混合模型,结果与实际测定的原油性质曲线趋势一致。Xiong等[45]开发了基于通用模型控制(GMC)算法的并联型混合模型的控制策略,并在连续搅拌釜式反应器(continuous stirred tank reactor, CSTR)上进行了应用和评价,混合模型中以CSTR机理子模型为核心,用ANN 修正FPM 预测值与实验测量值之间的偏差,实验结果表明该混合模型形成的GMC 控制器的性能优于传统的STPID、GMV 控制器,能准确描述CSTR中的温度分布。在并联结构混合模型中,输出结果的叠加方式对模型性能有很大的影响。在DM仅作为FPM残差项的情况下,通常采用单纯的相加,在DM 用于校正FPM 的参数时,可以依据过程原理和特点对系数进行加权等方法[48,54],还有学者训练了专门的DM 用来确定子模型对最终输出的贡献[55-56]。此外,朱鹏飞等[50]基于最优估计的Kalman 滤波算法递推框架,依据子模型预测精度对其输出进行动态融合,实验结果表明该融合策略要优于加权系数法。目前并联结构中子模型的融合策略尚未引起足够的重视,相关研究尚少。

1.3 混联结构

混联结构是以串联、并联结构为基础形成的更为复杂的嵌套型结构[57-59],每个子模型的引入都有明确的目的,如预处理[60-61]、优化[50,62]、形成闭环回路[63-66]等。混联结构的设计规律仍以基本的串联、并联混合模型结构为基础,根据具体过程和目标任务的需求进行合理设计,可以丰富模型功能和提高性能,常见的两种混联结构基本模式如图3所示。

Bhutani 等[63]以工业加氢裂化装置为研究对象,建立了混联结构的混合模型对产物分布进行预测,其中由一个ANN 确定FPM 的参数,和FPM 一并形成DM-FPM 型串联结构,由另一个ANN 对整体模型输出与装置测量值间的误差值进行修正,形成并联结构,整个混合模型的结构如图4(a)所示。该作者使用工业加氢裂化装置数据对两种单独使用的FPM(FPMdef、FPMopt)、DM(DBM)以及多种结构混合模型(series、parallel、hybrid)的性能进行了对比如图4(b)所示。结果表明混联结构的混合模型性能略次于单独使用的DM,通过对操作参数进行优化可使目标产物收率提高4%~16%,对工业加氢裂化装置的过程控制有指导意义。

图3 两种常见的混联结构示意图

图4 加氢裂化过程混联模型结构与不同模型结果对比

Peroni 等[65]以连续冷却结晶塔为研究对象,开发了一种自适应混合模型,DM部分使用了模糊自适应共振映射网络,旨在消除FPM 的预测偏差,这种偏差主要是由塔内结晶器冷却盘管表面结垢现象引起的,并设置了自学习系统(self-learning system,SLS)实时采样塔内DCS数据并对模型参数进行校正,结果表明了该混联模型的有效性。You等[67]以工业MIP-FCC 装置为研究对象,建立了装置的8 集总动力学模型,使用龙格库塔法和GA 对47 个动力学参数进行求解和优化,以并联形式的ANN 对动力学模型进行修正,建立混合模型在工业MIP-FCC 数据上表现出了良好的性能。Plehiers等[59]以烃类热裂解过程为研究对象,构建了4个结构不同且高度耦合的深度神经网络,以原料油的PIONA 作为模型初始输入,对潜在的过程性质如基于虚拟组分划分的详细PIONA、密度、蒸气压、沸点进行了预测,并以该部分输出结合装置过程变量进一步构建了对出装置产物的详尽数据的预测网络,模型整体框架基于烃类热裂解的机理知识设计而成,可解释性强,在热裂解模拟数据的验证中取得了十分准确的结果,MAE 质量分数最高仅为0.19%。

1.4 模型结构小结

串联结构混合模型的性能主要取决于FPM 的精度,尤其是DM-FPM 型混合模型。在化工过程中,DM-FPM 型串联结构被广泛应用,因为目前有很多被认为是第一性原理的定理本身仍是以经验相关性模型(empirical models,EM)的形式建立的,包括菲克定律、傅里叶热传导定律、达西多孔介质流动定律和理想气体定律等,在使用过程需要对其中的参数进行估计,如反应动力学常数、热力学常数、活度系数等,此时DM 主要是作为FPM 参数的预测器。在FPM-DM 型串联结构中,DM 是作为FPM 的一部分而存在的,通过建立DM 等效替代部分FPM 的功能,以减轻建模过程中对第一性原理的需求,降低建模的难度和成本。

当FPM 性能不佳,或在FPM 建立过程中存在大量假设时,并联混合模型通过引入额外的DM对FPM的输出进行修正,可以有效提高模型性能[63,68],因此当FPM 的性能良好时,并联混合模型的性能往往不及串联混合模型[63],这是因为并联结构混合模型的主体仍是FPM,需要FPM 本身具有相当的准确性和适用性;同时并联混合模型的DM需要从大量大范围数据中学习,以实现和FPM 协同准确描述系统动态特性的目的。相较之下串联结构的混合模型具有更好的外推性能[53]和灵活性,通过串联多个DM即可添加对应的功能,如对数据进行一定的处理(包括分解、聚类、降噪等),使之更适用于后续DM的构建。

混联结构都是以一种串联、并联结构为基础扩展而成的,结构设计和功能紧密相关。其主要优势在于充分利用过程数据的基础上引入更多的过程机理,这有利于工程师将高度复杂的问题简化,在机理层即可大幅降低问题的维度,并使建立的模型有更好的可解释性。通过结合分布式建模策略将大的目标分解为多个小目标,可以进一步提高混联结构混合模型的外推性,降低工况变化时的再训练难度和成本,使之适用于大规模复杂过程的建模[69-70],在化工过程智能化建设中具有重要的地位。但其结构复杂、子模型数量较多,也为建模过程带来了更高的成本和难度。

2 混合模型的应用

化工过程模型化技术最早在20 世纪50 年代得到应用,经过近七十年的发展已成为化工过程开发、设计、生产的重要手段[71],是实现监控、优化、控制、预测等任务的关键一步。模型化技术在化工智能化建设中具有重要的地位,在建模过程中协同使用FPM和DM是必要的,形成的混合模型可以结合FPM和DM的优势从而成为数据与计算的高保真模型[72]。对于化工智能化建设中不同的应用场景以及问题特点,适用的模型结构和数学方法总是不尽相同,本节将对化工过程中主要的应用场景,使用混合建模方法的文献进行综述和总结。

2.1 过程监控

作为确保装置单元、大型设备、管路等处于良好运行状态的一种有效方法,过程监控在过去的几十年中得到了快速的发展[69-70]。构建过程监控模型的资源主要是数学模型、专家知识以及过程数据,化工过程的复杂性、高维度、强非线性、时滞性等特点都为建立过程监控模型带来了挑战。由于DM在特征抽提、模式识别等任务上具有较高的精度和速度,基于DM的过程监控模型早已得到了广泛研究和应用。用于过程监控的混合模型往往是以FPM-DM 串联结构为基础的,通过FPM 接收过程数据并进行初步分析,并由DM给出最终结果,在保证精度和速度的同时兼顾了模型物理意义[73-74]。Zaranezhad 等[75]收集了某化工厂十二年内1000起事故的数据,首先根据专家知识分析并建立了事故因果模型,确定了各事故的关键变量和辅助变量,然后结合因果模型和模糊推理系统(fuzzy inference system,FIS)建立了ANN-FIS-GA/ACO 串联混合监控模型,模型中采用元启发算法训练模糊神经网络并确定了最优模型,使用遗传算法/蚁群算法对模糊神将网络的聚类半径进行优化,确定了if-then规则的最佳数量和结构,建立的混合模型根据实际事故数据的预测精度、灵敏度、特异性进行了评价,取得了良好的效果。Ge 等[69]提出了一种用于化工过程全厂范围过程监控的分布式建模框架,基于过程机理将完整的厂级过程分解为多个相互联结的区块,对每个区分别建立用于监控的DM,并使用决策融合算法将每个区块的监控结果进行集成,这种分布式监控混合模型具有很高的灵活性,可以针对不同区块的过程特点以及数据特点单独开发模型,在TE 过程的应用结果证明了这种监控模型结构的有效性。Bavekar 等[76]认为基于贝叶斯网络的监控模型中的噪声在时域上具有一定的相关性,为分离该部分由已知物理源引发的结构型扰动并提高模型性能,开发了一种结合具有时序的物理学、动力学原理与不具有时序的DM结合的串联混合监控模型,其中DM 部分使用实验、工业数据进行训练,该混合监控模型在加热混合器的应用中取得了较好的效果,且分离的噪声信息和实际噪声信息相一致。Pulido 等[77]针对复杂工业过程监控问题,提出了一种基于状态空间神经网络和模型分解的分布式混联混合监控模型,其中DM 包含5 个串联的ANN,中心网络用于表征系统的动态行为,次外层网络用于对系统非线性行为建模,最外层网络用于提供输入到输出的线性变换,使用蒸发过程工业装置数据对模型性能进行验证,结果表明提出的分布式混合监控模型可以有效的预测过程状态和故障,仅有少量误报发生。

可以看到,以化工过程监控为目标的建模过程中,直接进行FPM 建模是不易甚至不能实现的,一般会首先考虑将过程分解以降低监控任务的复杂度,同时也利于定位事件发生位置,分解过程可以是机理的也可以是数据驱动的。DM接收FPM传递的过程信息,给出对当前运行状态的判断。以FPM-DM 为基础的混合模型可以有效降低建模过程的难度和成本,且无需完备的过程机理,并能准确描述系统各部分的主要行为。在保留模型物理意义的同时,实现快速准确建立过程监控模型的目的具有良好的应用前景。

2.2 过程优化

在化工过程中,过程优化是一项非常经典且重要的任务,主要包括了过程中性能、成本、利润、安全性和可靠性、操作条件、控制策略、单元结构设计、输运网络、计划与排产等诸多方面[78],在学术界和工业界中均有学者进行了大量实践。化工过程的优化任务往往具有多个优化目标,这类任务被称为多目标优化(multi-objective optimization,MOO)。因需要同时解决多个优化目标在众多决策变量和约束条件下的复杂优化设计问题而具有较大的难度,以进化演化算法为核心的DM在优化任务中具有巨大优势。在优化任务中引入FPM 可以扩展DM的边界条件,形成以DM-FPM串联结构为基础的混合优化模型,一方面可以大幅提高优化算法的运行速度,减少陷入局部最优的概率;同时该种混合结构也更容易实现过程的动态优化,形成控制闭环。目前混合建模在优化算法和工程应用中都已得到了较大进步[79]。Simon 等[80]对工业规模间歇反应器(batch reactor,BR)的模拟过程建立了串联混合模型。其中FPM 部分用于描述以固体状态进入反应器的一种反应物反应及溶解的过程,DM部分用于描述三相反应系统的反应动力学,修正由实验室规模反应器到工业规模反应器这一过程中的模型参数偏差以及确定BR 运行过程的最优参数。使用反应器数据验证结果显示,该模型能够对反应过程中反应器内各物质的浓度变化进行较好的预测,并能确定BR 的最优运行参数。Zendehboudi 等[81]针对工业尿素生产过程建立了混联混合模型以对装置进行建模及操作条件优化,研究中首先建立了包含建模对象反应框架及其复杂汽液平衡关系的FPM,以基于ANN 的二氧化碳转化量与产物温度关系的预测模型对FPM 进行修正。结果表明,相较于单独使用FPM,混合模型可以更好地预测产物的性质,在此预测混合模型基础上,另外使用一个ANN 对反应温度、装置压力以及进料比例等参数进行优化,结果表明,反应温度191℃、装置压力13.8MPa、氨/二氧化碳摩尔比2.7 为该尿素生产装置的最优操作条件。Mahalec 等[36]建立了一种结合FPM 与偏最小二乘法(partial least squares,PLS)的混联混合模型,用于某工业原油精馏塔的预测及优化。该混合模型由两部分组成,第一部分模型包含由能量守恒及质量守恒方程组成的FPM 以及基于操作参数和原料油性质获取精馏塔蒸馏曲线的PLS模型;第二部分主要包含一个PLS模型,用于确定蒸馏曲线与塔板温度间的关系。实验阶段将该混合模型应用于原油精馏塔的操作条件优化任务中,并将优化结果与AspenPlus 的优化结果进行对比,结果表明该混合模型的优化效果优于AspenPlus,文中还基于优化后的操作参数进行了严格的流程仿真,验证了模型优化结果的可行性。

直接使用优化算法进行最优化求解的过程是一个全局搜索过程,具有一定的盲目性,且化工过程复杂度高,各部分优化结果的组合并不等于整体的最优结果。而过程机理的加入一方面可以限制搜索区域,加快求解速度,使最优解更符合系统知识,另一方面也可以降低对过程数据数量和质量的需求。从上述文献的结果可以看到,相比于直接使用优化算法,混合模型在化工过程优化问题中有着比单独建立的FPM或DM有着更好的效果,同时混联混合模型良好的可扩展性使其得到了广泛应用。

2.3 预测控制

化工过程通常表现出受I/O 约束的非线性多变量反应动力学,预测控制(model predictive control,MPC)经过几十年的发展和研究,已广泛用于化工、化学、制药等领域的过程控制中,成为传统比例-积分-微分(proportional-integral-derivative,PID)控制的补充方案。实现预测控制的第一步是建立准确描述过程I/O 关系的模型[82],因此预测控制中一般会包含以FPM-DM 串联结构或并联结构为基础的预测模型,相比于单独使用FPM或DM,混合模型可以降低对过程机理和数据有效范围的依赖;在控制过程中,可以通过形成DM-FPM 串联结构提高控制过程的准确度和速度,通过结合两种基本模型的优势,能够保证较高预测精度的同时使模型具有较强的外推性与泛化性,这一特点使混合建模方法在各领域MPC 任务中得到了广泛应用。Chen 等[35]设计了用于CSTR 预测控制的FPM-DM 型混合模型,其中FPM使用了一种简化的线性的CSTR质量平衡方程替代了原非线性反应体系中的主要部分,DM 使用一个ANN 对剩余的非线性部分进行描述。模型测试结果表明,该混合模型有效降低了模型的输入变量维度,简化了模型结构,且具有良好的可解释性。在某工业精馏塔的在线内模控制(internal model control,IMC)的应用结果表明,该模型同时具有良好的泛化性能。Xiong 等[45]对实验室规模BR 建立了一种并联结构混合模型。其中FPM 部分用于对研究对象的线性部分进行描述,DM部分用于分析FPM预测结果与真实数据间的误差。基于该混合模型,该作者讨论了通用模型控制的发展及其在离散系统与时滞系统中的应用情况,并以某实验室规模放热反应间歇反应器为研究对象进行模型应用测试。结果显示,该模型可以较好地实现对物流温度的控制。Cubillos 等[83]以某含噪工业环境中运行的半工业振动干燥器为研究对象,建立了DM-FPM型混合模型,其中DM使用一个ANN求取无法通过第一性原理计算的操作参数。采用装置运行历史数据对ANN 进行训练和测试,结果显示该混合模型在困难环境下可以保持较高的精度和鲁棒性。该作者将该混合模型与单步预测控制策略进行结合构成研究对象的测控系统,该系统在面对设定值和扰动变化时,具有较好的适应性、可预测性及可控制性。Zahedi等[84]对二氧化碳加氢制甲醇填充床反应器建立了DM-FPM 型混合模型,其中DM部分使用一个ANN估计该非线性反应体系的反应动力学参数,赋予了网络结构局部响应特性,并对反应器出口处产物分布进行预测,FPM 部分主要包括质能守恒方程以及压降变化的表达式,基于ANN的输出参数可以计算出口物流的温度和压力,使用工业数据对模型性能进行验证,结果表明了该混合模型的有效性。

与建立过程监控模型类似,对于预测控制任务来讲,根据守恒方程和本构方程等对大规模化工过程构建FPM 都是极其昂贵和难以实现的,而完全根据过程数据建立DM的精度与模型适用范围也难以得到保障,这两点恰是评价MPC 模型性能的两项主要标准[85]。从文献的结果中可以看到,结构合理的混合模型可以为上述两大问题提供行之有效的解决方案,混合预测控制模型的响应速度和控制精度相比于单独使用的FPM、DM有更大的优势[84-85]。

2.4 软测量

化工过程中存在着大量难以直接测量或者以现有技术无法直接测量的参数,如物流的元素组分含量、反应动力学参数、多相流中的相间作用力等。除通过实验、数值模拟等方法建立精确FPM 获取此类参数外,应用DM对目标变量进行软测量也是一种行之有效的方法,但往往训练DM的数据不易获得,需要借助FPM与DM进行混合求解。在软测量任务中,既可以通过FPM-DM 串联结构实现对复杂FPM 的补完或简化,也可形成DM-FPM 串联结构求解FPM 中不易获得的参数,还可以直接建立并联结构,深度利用过程数据来修正现有的FPM,以实现直接提高FPM 性能的目的。目前结合FPM与DM形成混合模型的软测量方法已得到广泛应用。

Bellos 等[86]建立了一种DM-FPM 串联混合模型对工业加氢脱硫反应器进行模拟,其中DM包含三个独立的多层感知神经网络,用于估计加氢脱硫反应速率常数及反应焓等参数,FPM 部分包含加氢脱硫反应速率表达式及反应器各物质的质量平衡方程等,结合DM输出的参数,整个混合模型可以对反应器内部的动态行为进行预测。在三种不同加氢处理装置上分别建立混合模型进行测试,结果表明该混合模型可以对不同运行状态下的反应器动态行为和催化剂活性水平进行有效预测。Davoody 等[87]建立了一种用于预测超临界流体萃取过程中萃取物质量的DM-FPM串联混合模型,其中DM为模糊神经网络,用于估计舍伍德数计算公式中的传质系数k',并将该系数传入基于质量平衡方程建立的FPM中。用实验数据对单独建立的FPM 和混合模型的预测性能进行对比,对比结果显示建立的混合模型可以显著提高模型性能。朱鹏飞[88]以聚乙烯聚合过程为研究对象,建立了预测氯乙烯聚合速率、转化率以及聚合物粒径分布的FPM-DM 串联混合模型,其中FPM 包括聚合反应的动力学、热力学以及粒径分布模型等,DM使用了改进的Kalman滤波算法对基于混合核函数的主成分分析/片最小二乘-神经网络(K2PCA/K2PLS-ANN)两个模型进行混合,用实验数据对模型性能进行验证,结果表明提出的混合模型可以准确地预测聚合反应速率、转化率和聚氯乙烯颗粒粒径分布,对实际生产过程具有指导作用。Prada 等[89]建立了一种用于动力学过程模拟的FPM-DM 串联混合模型,该模型基于已知的专家知识建立FPM,并基于历史数据以及混合整数优化算法识别确认模型其余部分的结构和参数,通过减少建模假设从而获得更多的模型自由度,并提高求解速度。以建立的混合模型对丙烯-丁醇-乙醇发酵过程的底物浓度、产物浓度、生长速率进行了预测,对比验证结果显示,混合模型的准确率要高于单独使用的FPM和DM,并且大幅降低了响应时间和测试成本。Plehiers 等[90]对三维CFD 求解过程中的质量源项R的计算方法进行了研究,使用物流浓度、压力、温度作为输入,物流浓度随时间的变化为输出,对神经网络进行了训练,替代求解CFD模型方程中的质量源项R,形成了DM-FPM混合CFD模型。其中ANN 的训练数据来自Cantera 软件的模拟结果,并使用烃类蒸汽裂解的工业数据对ANN 部分进行了单独验证。模型验证阶段使用基于OpenFOAM 的活塞流反应器模拟数据混合CFD模型性能进行了验证,回归系数为0.9997,求解速度是使用刚性化学求解器的2.65倍。

以ANN为代表的DM本身具有强大的拟合和回归能力[91],一般可以有效利用过程数据建立目标变量的软测量模型,但直接建立DM软测量模型过于依赖过程数据的数量和质量,且当工况发生变化时,模型不具有外推性。在DM中引入过程机理可用于指导该过程中相关变量的选择,一方面可以降低DM建立过程中对数据的需求,提高模型整体预测性能;另一方面可以有效扩大软测量模型的适用参数区间,为模型提供更强的外推性能,使之更具工业应用潜力。

3 结语与展望

本文综述了近年来化工过程中混合模型的建模方法和应用场景。混合建模由于结合了机理模型和数据驱动模型的优势,能在一定程度上解决单独使用机理建模或数据驱动建模方法过程中出现的成本过高、速度过慢、资源不足等问题,在过去的二十多年受到了学者的广泛关注和研究。可以看到,结构经过合理设计并结合了人工智能算法的混合模型在解决化工过程模拟、监测、优化和预测等问题中都有着良好的表现,保证模型具有物理意义的同时具有更好的可靠性、准确性、可扩展性,形式灵活,目的明确,并在化工过程智能化建设的推进中起到了积极的作用[92-94]。现阶段混合模型的建立和应用中也存在着一些限制,主要有如下几点。

(1)机理模型的性能,无论采用何种混合模型结构,当机理模型足够准确时混合模型的性能就得到了保障,而化工过程涉及的机理模型种类繁多,包括多种形式的质量、热量、动量传递,往往还伴随着相态变化和化学反应的发生;多个单元模块间具有复杂的相互作用,且具有显著的多尺度特征和时滞性。未来有待学者对化工过程各尺度层面的机理进行进一步的研究,将高维度、非线性、多尺度的化工过程解耦,以及扰动在大规模过程中的传递机制,逐步完善现有知识库,推动多学科协同发展。

(2)高质量、宽范围数据的获取,数据驱动模型在混合模型中起到补完、扩充的作用,其性能主要取决于建模数据的数量和质量,更多工况的数据意味着更强的模型泛化性。如何快速获得关键位置的高质量数据,并对数据进行必要的筛选和处理,有待现有传感技术和数据算法的提高和突破。

(3)深化对化工过程的理解,目前的混合建模研究中没有统一的建模范式,在先前的研究中几乎针对每个问题都有着不同的建模方案,这对于混合建模技术的发展和推广是不利的。随着对过程理解的深入,有望以传统建模流程为基础,以数据驱动模型实现某种具体功能,或是提高部分结构的性能,最终形成模块化的混合建模方案。此外,如何如通过整合现有零散的过程模型,打通传统数字化系统各层次间的通路也是智能化建设中的重要课题。混合建模在集成性、可扩展性上的优势使具有着巨大的应用潜力,有待学者进行进一步挖掘,如深度利用先进的机器学习算法,开发更有效、更泛用的子模型混合策略,推动集成学习、深入学习、强化学习等热门人工智能技术在智能化过程中心有效应用。

总而言之,混合建模技术是化工智能化建设中的强力工具,其结构易于扩展的特性更适用于解决工业实际问题,在智能化建设中有着无可取代的地位。在可预见的未来,随着软硬件水平、多学科知识的进一步发展,混合模型的性能还会提高,模型应用场景会进一步扩大。目前我国仍处在实现“智能制造”的前半场,对混合建模方法的研究可以强化学科、领域及技术间的合作,为智能化建设打下坚实基础。

猜你喜欢
串联机理建模
基于FLUENT的下击暴流三维风场建模
隔热纤维材料的隔热机理及其应用
周礼与儒学的机理
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
求距求值方程建模
基于PSS/E的风电场建模与动态分析
金属切削中切屑的形成机理
金属切削中切屑的形成机理
运动性血红蛋白降低的机理及营养防治
轮滑苦与乐