深入探索智能算法与反应网络研究的融合

2022-06-24 07:56毕可鑫邱彤

化工进展 2022年6期

毕可鑫，邱彤

（1 清华大学化学工程系，北京 100084；2 清华大学工业大数据系统与应用北京市重点实验室，北京 100084）

在国家“十四五”规划的开局之际，智能制造战略在我国工业迈向4.0 智能化阶段的步伐中，起到关键指引作用。以信息技术为龙头的新一轮科技革命，引起了各国政府的高度重视，进而催化了工业互联网的概念形成与初步平台搭建，加速了产业变革步伐。随着大数据时代的来临，人工智能技术作为计算机信息技术新的发展方向，与工业互联网深度融合，助力各行业企业的数字化、智能化转型，为工程科学的学科研究和工业发展带来新的机遇与挑战。尤其对于化学工业的智能制造而言，复杂的流程设计和过程机理难以进行过程的数字化、可视化。因此化学工业智能化的进程更需要人工智能算法的助力。

复杂化工过程建模、模拟与分析的基础是化工中特有的第一性原理，即“三传一反”，其中最核心的要素是过程的反应机理。在化工过程智能化发展的过程中，提出利用智能化的手段更清晰地表达反应机理，实现物质转化过程的“透明工程”。所谓物质转化的“透明工程”，是指充分利用人工智能技术在结构化表达、特征提取、关系推演、高效计算等方面的优势，实现物质转化过程中反应机理的表达结构化、过程可视化、耦合反应机理可剖析解释、动态转化趋势可揭示表征；同时，既能在微观层面做到关键步骤的局部放大研究，又能在工业应用中实现物质转化过程的准确预测。描述物质转化过程的前提是构建准确的反应网络，对其进行机理分析可以分为三大类。

第一类是基于化学机理的分析方法。对于化学反应体系，基于化学机理的分析方法主要用于提取关键中间体和反应。拟稳态近似（quasi steadystate approximation, QSSA）是一种广泛使用的化学假设，通过将某些物质浓度的时间偏导数赋值为0，使这些物质的生成速率和消耗速率相等，简化为代数方程进行计算。基于化学机理的分析方法深入探索反应的热力学和动力学性质，利用专业知识简化反应网络，得到仅由少量反应组成的符合化学理论的反应网络。

第二类是基于数学机理的分析方法。利用分析浓度对速率系数的偏导数矩阵细化反应网络动力学，尤其强调在参数不精确的情况下处理反应网络不确定性的能力。常用的数学方法包括主成分分析法（principal component analysis, PCA）、灵敏度扰动分析法、有向关系图分析法和计算奇异值摄动算法（computational singular perturbation,CSP）。基于数学机理的分析方法主要利用线性代数的理论分析反应网络，在缺乏化学知识的情况下容易实现自动化。

第三类是机理数值化方法。该方法在近几年提出，为反应网络的结构化、数字化以及反应机理的整合和简化提供了新的思路。该方法可以嵌入网络拓扑特征和物质流信息等先验知识，通过反应网络数据结构化和特征分析为研究反应网络提供了一个化学机理可视化的视角。类似于自然语言的反应方程和反应规则通过数据结构化（如向量和矩阵）表示，可用于进一步的数学简化操作。简化后的反应网络具有更好的解释性和预测模拟适用性。

为了实现物质转化过程的“透明工程”，对于复杂反应网络，在机理数值化方法的基础上，可以进一步融合智能算法，逐步实现对反应过程的深入分析。第一步，构建反应过程的佩特里网（Petrinet），实现反应网络的数据结构化，分析反映其特点的结构统计指标；第二步，结合社交网络分析的经典算法，得到网络内物质、反应的重要度排序，从而进一步智能地优化反应动力学模型，并实现物质转化机理的可视化和透明化分析，揭示关键反应和物质间的相互作用关系和动态转化趋势；第三步，将第二步得到的反应网络特征，融入过程的智能建模中，使用机器学习方法全面提升预测效果。

本文结合物质转化过程“透明工程”的概念，深入探索智能算法与反应网络研究的融合应用，提出一套复杂网络结构化、可视化、具有可解释性的方法，并对研究成果的迁移应用做出展望。

1 反应网络结构化与网络特征分析

复杂化工过程建模的反应机理常用自由基反应网络描述，该网络的构建需要基于化学物质库，根据链式反应规则，自动生成物质间相互反应的关系，并为反应添加相应的动力学参数，组合成的反应网络可转化为有“语法规则”的可读文本，便于通过计算机程序进行读取。自由基反应网络的生成目前已经可以使用成熟的软件或工艺包完成，例如麻省理工学院开发的RMG、明尼苏达大学开发的RING等。为对反应网络进一步展开机理数值化分析，需要首先将生成的准结构化反应网络文本文件基于Petri-net进行向量化、矩阵化。反应网络的Petri-net 转化过程如图1所示，将具体的反应和物质设置为网络中的节点，将反应速率与物质流设置为网络中节点连接的权重。

图1 复杂反应网络的Petri-net形式转化

图1中，具体反应被设置为transition节点，而物质被设置为place 节点，构建起Petri-net 形式的结构有向图。再将有向图中的权重对应填写到由反应和物质组成的转移矩阵（transfer matrix）中，完成网络矩阵化过程。在生成网络结构后，可以对网络进行结构统计指标分析。适用于反应网络特征分析的网络结构统计指标包括度分布、边介数分布、网络直径、平均路径长度、平均聚类系数、模块度等。Fang 等对乙烯裂解过程的物质网络进行了结构统计指标分析，其中的度分布分析结果如图2所示。

图2 乙烯裂解网络的节点度分布

虽然乙烯裂解网络与随机网络具有相近的平均聚类系数和平均路径长度，但其节点度分布极不均匀，集中在2～9，且节点的聚集程度很高。整个网络具有模块社区化的特征，节点存在密集连接，有助于信息快速传递，具有明显的小世界网络的特征，说明乙烯裂解网络中存在部分关键物质节点。

反应网络结构化过程，将复杂网络转化为计算机可读性高、后续计算方便的矩阵化形式，提高了数据中信息和知识的集成程度，为后续反应网络与智能算法的深度融合提供可行性。矩阵中明确写出的反应输入输出的格式，支撑了机理的透明化表达，为网络拓扑结构的透明工程打下坚实基础。在此基础上的复杂网络结构统计指标分析，揭示了炼化过程反应网络模块社区化、小世界网络的特征，为后续的智能算法应用提供理论支持。

2 反应网络智能优化、反应速率动态演化分析

在完成Petri-net 形式反应网络构建的基础上，为了深入认识反应网络的拓扑结构特征，并结合网络节点性质分析结果进行智能优化与关键信息提取，研究者们创新性地提出了一种将反应网络比作大型社交网络的思路。通过过程机理模型和反应动力学数据提供的过程数据，结合经典的社交网络分析算法，如网页排名（PageRank）算法、子图提取算法等进行网络流分析，并使用可视化方法将矩阵化的网络转化为网络流图的形式，如图3所示。

反应网络Petri-net表达形式为引入社交网络分析方法提供了便利。图3所示的第一条路径是引入PageRank 算法，使用原料输入的组成作为PageRank 算法的物质权重初值向量，进行迭代计算，即可得到每个物质的PageRank 值，即物质在反应网络中的权重。在此基础上，Fang等利用得到的权重值对反应网络进行智能优化，如图4所示。

图3 复杂反应网络的PageRank分析与可视化

图4(a)中，在基于自由基机理生成的反应网络的基础上，根据网络节点的PageRank 值排序，调整重要反应的动力学参数，以获得更高的动力学模拟精度，获得改进的反应网络。随后将改进的反应网络输入到图4(b)的流程中，再利用网络中反应节点的PageRank 值排序，删除重要度低于阈值的反应，获得反应网络的智能优化结果。在工业实际案例的研究中发现，删掉重要度低的反应对动力学模拟精度的影响很低，简化前后计算得到的产物分布几乎不变。总体而言，使用依据PageRank 算法的反应网络智能优化，以物质和反应的重要度排序合理简化和优化复杂反应网络，实现过程可解释性强，且使用智能网络流分析算法提高了计算效率。

图4 基于PageRank值排序结果对反应网络进行智能优化

图3 中，Petri-net 形式的反应网络在PageRank分析的基础上，通过第二条路径，可以对由物质和反应组成的整个反应网络进行子网重构，提取反应特征，回溯定位得到关键的反应信息，进行反应速率动态演化分析。图中矩阵化反应网络的左上角黄色方块的子矩阵中每个元素代表网络中两种物质的物质流速率，其余部分则代表具体物质间进行的化学反应。Bi等基于子图挖掘的思路，结合矩阵化反应网络的意义，逐步聚焦物质间关键相互作用的变化趋势，并利用反应网络权重矩阵的性质回溯得到关键反应速率的变化趋势，如图5所示。

在图5所示的子网重构算法中，首先使用重排布算法，将由物质和反应组成的整个反应网络转化为仅由物质组成的子网络，再使用自动聚焦算法，提取得到只与某一物质相关的子网络，利用专注精炼算法，得到其中的关键物质互作关系，完成子网络提取过程。对于得到的关键物质互作关系，根据权重矩阵的性质，还可以进行关键反应信息的回溯，追踪得到具体的反应速率变化规律。

图5 基于子网重构的关键反应信息智能提取算法

将以上算法应用在乙烷-石脑油共裂解实际工业过程中，具体说明基于子网重构的关键反应信息智能提取算法进行物质转化过程的“透明工程”的结果。图6 展示了主产物混炼时的收率变化（product yield deviation,PYD）、子网络中产物的重要度排序值（re-iterated PageRank value,RPRV）随乙烷进料摩尔比的变化。

从图6 中可以看出，对于6 个热裂解过程的主产物而言，PYD 值和RPRV 值具有相似的变化趋势。结合PYD值和RPRV值的意义，PYD值代表混合裂解时反应网络中生成特定产物的倾向，RPRV值代表物质网络中某一物质节点累积的质量，二者变化趋势的相似性说明，基于裂解机理反应的过程模拟和子网重构分析结果可以相互验证。在此基础上，该工作进一步进行了乙烷进料比例变化时，反应速率的动态演化分析，并从自由基反应速率变化的角度给出了产物收率变化的解释，为蒸汽热裂解过程的分储分炼思想提供了理论支撑。相比于其他的网络流分析算法，基于化学机理的算法缺乏对网络拓扑结构的考虑，使得算法不能实现机理可视化、透明化，而基于数学机理的算法缺乏化学知识的融入，使得算法无法在模拟中保持高保真性。使用子网重构的机理数值化方法，结合化学反应机理和反应网络的拓扑结构特征，通过关键反应信息提取实现不同条件下反应过程的动态演化分析，为实际生产提供切实可行的建议。

图6 PYD值和RPRV值随乙烷进料物质的量分数的变化趋势

针对程序开发者、过程系统工程相关研究者、工艺工程师、企业决策者等多类用户，反应网络的智能优化和分析在多个化工工艺过程中也有各具特色的推广应用。纪晔等对催化重整、柴油加氢、催化裂化等过程采用基于结构导向集总方法的反应网络构建，并结合汽油调和模型，实现分子级炼油过程全厂模拟和优化。Billa等基于成熟的反应网络构建工具包，构建石脑油连续催化重整过程的反应网络，并在此基础上编译了反应网络可视化工具和反应网络编辑分析工具，方便各类用户使用。

在结构化的反应网络数据的基础上，智能优化、智能信息挖掘等算法与复杂反应网络的融合，完成了基于机理的保真性强、可靠性高、可解释性强的过程分析，并结合可视化技术表达物质转化的机理，真正实现了机理的透明化，贯彻了物质转化“透明工程”的研究理念。对于实际工业过程而言，过程系统工程师使用智能技术与反应网络的融合，帮助化学工艺工程师突破人类视觉认知的极限，更深入地理解反应过程，提取关键的反应规律，助力生产过程全方位的转型升级。

3 反应特征智能迁移学习算法

新建、扩建的生产装置，或更换关键反应部件的装置，为实现过程先进控制和实时优化，需要大量的预测模型。实际工厂中，新建装置投运初期往往缺乏精细表征的过程数据，不得不面临建模过程数据建模的“冷启动”问题。为此，Bi等提出了基于图卷积神经网络的反应特征智能迁移学习建模方法，如图7所示。

图7中的反应特征智能迁移学习算法的整体思路，是从整个反应网络的拓扑结构出发，首先利用Hua等提出的基序探测和图卷积技术，得到反应网络的特征结构矩阵，再结合反应器的操作条件进行机器学习建模，最后基于其他相似设备已经建立的机器学习模型，利用反应器、反应网络的相似性，在新的工业设备上进行模型迁移。在机理模型与网络拓扑结构通过基序探测和图卷积技术生成的数据集1上，使用机器学习方法建立的模型可分为两个部分：一是使用网络结构特征矩阵为输入，主要由图卷积过程实现的反应网络特征提取部分（reaction network part）；二是使用上一步提取的反应特征，结合操作条件为输入，主要由全连接网络构成的产物收率预测部分（product prediction part）。在训练得到第一阶段模型后，使用新设备的工业数据集2利用迁移学习进行过程建模。由于相似设备和新设备对应的数据集中的数据均为有标签数据，因此可以采用层迁移技术进行模型的迁移。对反应网路特征提取部分，保留原机器学习模型中的参数不变，对产物收率预测部分，以原模型中的数据为初值，使用工业新数据集上的少量数据进行参数的再学习、再训练，完成模型的迁移过程。在后续模型性能的验证中，基于迁移学习过程的代理模型对乙烯主产物的收率预测误差在1.5%以内，对丙烯主产物收率预测误差在2.5%以内，对其他主产物的收率预测误差在±5%的范围内，满足工业实际应用的要求。基于不同计算平台下模型的计算性能评价的结果显示，在保证误差相近的前提下，迁移学习建模过程的训练时间远远小于传统机器学习建模的训练时间。使用基于GPU 硬件的计算平台，迁移学习建模过程的训练时间控制在30 分钟以内。基于少量工业数据，实现快速建模与准确预测，为后续控制优化过程提供可行性。

图7 反应特征智能迁移学习算法结构框图

反应特征智能迁移学习算法，充分挖掘利用了反应网络智能分析中得到的特征结构，将反应特征信息与设备操作信息整合代入到代理模型中，完成反应过程的智能预测。实际工业过程数据集，在精细表征数据量少的不利条件下，结合先进的迁移学习理念，充分发挥反应网络的相似性，进行信息、知识在模型间的迁移，完成高效快速的建模过程。反应网络与机器学习智能建模过程的融合，克服了代理模型机理缺失、可解释性差的缺点，通过机理-数据混合驱动的模式，将分子尺度的过程机理引入到机器学习模型的结构中，最终在过程预测层面，实现了物质转化过程的透明工程。

4 结语

创新性的人工智能算法与反应网络研究的融合，正在突破人类大脑性能和人类视觉认知的极限，深入了解认识过程机理，挖掘生产过程中的关键化学知识与信息，实现过程机理的可视化，完成整个生产过程的物质转化透明工程。本文主要介绍机理数值化的反应网络智能简化方法、反应网络关键信息的智能提取算法、基于图卷积神经网络的反应特征智能迁移学习算法，从反应网络图的本征拓扑结构出发，逐步深入研究，提出一套由非结构化的反应机理出发，进行可解释性的过程分析和过程建模的智能化过程。

在未来的研究中，上述所提出的智能算法有望与新的反应过程或技术相结合。例如分子炼油技术框架下的新炼油过程，可以利用前期研究中总结的反应知识，改进并迁移所提出的人工智能技术，实现分子炼油过程全流程物质转化的“透明工程”。过程机理的可视化、透明化不仅可以为决策者提供实际工业过程的生产建议，还可以为后续控制优化过程提供高效可靠的模型，实现进一步的过程智能化，帮助化学工业完成智能化转型。