基于神经网络算法对DCC装置的大数据高阶优化

2020-08-24 12:56李传真王国庆邹丽

当代化工 2020年6期

李传真　王国庆　邹丽

摘要：结合集团公司提出的加快建设数字化工厂的设想，利用过程工业大数据高阶优化对DCC装置进行诊断分析，搭建软件模型，论述现有数据建模方法，提升潜力并优化工艺控制，达到降本增效的目的。最后，探讨过程工业大数据高阶优化的特点和挑战，实现业务价值的提升。

关键词：大数据;神经网络;过程工业;高阶优化

中图分类号：TE319 文献标识码： A 文章编号： 1671-0460（2020）06-1162-04

High-order Optimization of Big Data in DCC Device Based on Neural Network Algorithm

LI Chuan-zhen， WANG Guo-qing， ZOU Li

（CNOOC Dongfang Petrochemical Co.， Ltd.， Dongfang Hainan 572600， China）

Abstract： Combined with the idea of accelerating the construction of a digital factory proposed by the group company， high-order optimization of process industry big data was used to diagnose and analyze DCC devices， and a software model was built， existing data modeling methods were discussed to reduce costs and increase efficiency. Finally， the characteristics and challenges of high-level optimization of process industry big data were analyzed in order to realize the improvement of business value.

Key words： Big data; Neural network; Process industry; High-order optimization

當今社会信息技术飞速发展，衍生出A（artificial intelligence）、B（blockchain）、C（cloud Computing）、D（big Data）4大热门专业。在过去十几年，自动化及石油化工领域的专家学者已经开发出适用于石油化工的排产软件，用来优化全厂加工流程，判断产品结构的影响，进而提高企业经济效益。原有排产软件一般都基于线性算法，适用于分析全厂简单、清晰的流程。本课题尝试通过使用Python3.0编程，利用神经网络算法处理过程工业大规模数据，将计算机学科和大数据学科融合，继而从海量数据中挖掘实际业务潜在问题，并通过建立优化模型，找到现存问题突破口，实现业务价值提升。

1 项目背景和实现目标

1.1 项目背景

某公司设计以海南岛周边原油、凝析油和天然气资源为依托，按照循环经济、清洁生产和绿色低碳的原则，采用催化裂解（DCC）技术生产乙烯、丙烯和碳四等重要化工原料，坚持走精细化工道路，下游延伸发展高技术含量、高附加值的化工新材料和高端精细化学品。一期为炼油装置，二期为化工装置，但由于二期工程丙烯腈工艺包转让受阻，二期项目仅有乙苯、苯乙烯装置建成投产。现有流程是围绕以DCC装置为核心的燃油-化工型炼厂，炼油规模偏小，下游产业链延伸不够，油品比重偏大，后续又新建两套产品质量升级项目，造成了成本能耗进一步上升，抗风险能力不强。在丙烯腈项目建成投产前如何取得最大经济效益为公司急需解决的根本问题。

1.2 预期实现目标

经对全厂的经济利润进行了分析，通过测算，汽柴油产品亏损严重，而提升经济效益主要依靠丙烯、苯乙烯和MTBE产品，能否提高丙烯、苯乙烯和MTBE 3种高价值产品的产量，主要取决全厂的核心——DCC装置。DCC为国内首套增强型催化裂解（DCC-plus）装置，采用北京石油化工研究院开发的多产丙烯的专利技术（Deep Catalytic Cracking），是以重质烃为原料、以丙烯为主产品、轻芳烃为副产品的化工型炼油工艺技术。与常规催化裂化最大的不同就是采取较高反应深度，使得乙烯、丙烯和异丁烯类高附加值产品收率大幅升高，最大限度地减少汽柴油产品产量，研究DCC装置低碳烯烃产品收率的影响因素是项目的关键点。

1.3 效益可行性分析

在保证装置负荷相同，同时原油成本没有增加的前提下，分别将干气中乙烯、液化气中丙烯质量分数以提高1%为单位目标进行效益分析。通过化验分析，目前干气中乙烯质量分数平均为35%，液化气中丙烯含量平均为44%，提高1%后分别约为36%、45%。当前DCC装置进料量约3 300 t·d^-1，干气产量约为300 t·d^-1，乙烯产量约105 t·d^-1;液化气产量约为1 300 t·d^-1，丙烯产量约573 t·d^-1。在保证进料量相同的前提下，提升收率后乙烯理论产量应达到300×36%=108 t·d^-1，丙烯产量应达到1 300×45%=585 t·d^-1;丙烯每吨可盈利为1 000元，增加效益为（585-573）×1 000=12 000元·d^-1。每吨乙烯可以生产乙苯约3.5 t，乙苯为中间产品后续继续加工生产苯乙烯，每吨苯乙烯可盈利1 500元，苯乙烯增加效益约为3.5×（108-105）×94%×1 500=14 800元·d^-1。全年总计盈利（12 000 + 14 800）×360=9 648 000元。

2 神经网络机器算法的大数据高阶优化原理

在机器学习和认知科学领域，神经网络（neural network）是一种模仿人的大脑结构和功能的数学模型或计算模型，用于对函数进行估计或近似。其方法是将使用大量的神经元构成神经网络，模拟思考。图1、图2为感知器和反应器感知器模拟示意图

图1、图2的圆圈就代表一个感知器。它接受多个输入（x₁，x₂，x₃...），生成输出（output），如同人体神经末梢感受各种外部环境的变化进而产生电信号，达到控制相应的身体组织器官的效果。

基于本课题的研究，可以将干气中乙烯、液化气中丙烯含量建立一个神经网络运算，其神经元就是影响其收率的各项操作指标。

为了简化模型，我们约定每种输入只有两种可能：1 或 0。如果所有输入可满足干气乙烯、液化气丙烯质量分数达到36%、45%，表示各种条件都成立，输出就是1;如果所有输入为0，则表示条件不成立，输出就是0。

除上述影响收率的各项操作指标外，其产品还会受到一些因素的影响，例如催化剂活性、催化剂加注量、原油成分改变等。这些因素对产品收率都或多或少产生影响，但影响程度各不相同。某些因素是决定性因素，另一些因素是次要因素。因此，可以给这些因素指定权重（weight），代表它们不同的重要性。

如：催化剂活性权重为4，催化剂加注量权重为2，原油成分权重为2。

3个权重总和即为4+4+2=10。

这时，还需要指定一个阈值（threshold）。阈值的高低代表了影响的强烈，阈值越低就表示收率越低，越高表示就收率越高。

上面的决策过程，使用数学表达如下：

式中，x表示各种外部因素，w表示对应的权重。

单个的感知器构成了一个简单的决策模型，已经可以拿来用了。石油化工加工过程中，实际的决策模型则要复杂得多，是由多个感知器组成的多层网络图3。

图3中，左侧底层感知器首先接收外部输入信号，做出计算判断后，传递给上层感知器作为输入信号，上层感知器继续计算判断，直至得到最后的结果。

為了方便后面的讨论，需要对上面的模型进行一些数学处理。

外部因素x₁、x₂、x₃写成矢量<x₁， x₂， x₃>，简写为x。

权重w₁、w₂、w₃ 也写成矢量（w₁， w₂， w₃），简写为w。

定义运算w?x = ∑wx，即w和x的点运算，等于因素与权重的乘积之和。

定义b等于负的阈值b = -threshold，

感知器模型就变成了下面这样：

其中，最困难的部分就是确定权重（w）和阈值（b）。目前为止，这两个值都是主观给出的，但现实中很难估计它们的值，必须有一种方法，可以找出答案。

这种方法就是试错法。其他参数都不变，w（或b）的微小变动，记作Δw（或Δb），然后观察输出有什么变化。不断重复这个过程，直至得到对应最精确输出的那组w和b^[1]，这个过程称为模型的训练。而最终训练出达到我们所需的输出值（output）的各项输入项（inputs），就是我们期望得到的生产工况图4。

3 工业大数据高阶优化

3.1 数据基础和来源

工业大数据的高阶优化工作基础是收集数据，石油化工企业都会部署了集散控制系统（DCS）、实验室管理系统（LIMS）、制造执行系统（MES）等系统，这些系统配备了历史数据服务器，储存了至少一个生产运行周期的工况数据，足以提供大量的数据供进行分析计算。我们通过收集包括DCS装置位点数据、LIMS化验数据、调度生产数据等相关历史数据，以干气乙烯、液化气丙烯质量分数达到36%、45%为目标，实际生产工况数据为主，辅以流程数据、实验室数据、业务数据。清理原始数据，按工况将不同来源数据进行匹配整合。初步分析数据，发现、诊断装置现存问题。

3.2 分析建模

建模阶段工作围绕搭建符合某公司DCC实际运行工况和进料性质的大数据高阶分析预测和优化模型，以尽量准确拟合DCC装置产率并寻找以目标优化为导向的参数调优方案。持续对项目准备阶段所收集到的装置及物料历史数据进行深入研究和分析，探讨生产环境所受各项限制条件对目标产率的影响，识别关键参数。搭建可行的收率预测的高阶模型，利用神经网络机器算法搭建装置感知器、权重和阈值。基于大数据模型寻优结果，初步验证方案可行性与调优效果。在准确度达标的情况下，初步实施优化模型，并评估优化效果。

3.3 模型评价与优化

模型评价是指对于已经建立的一个或多个模型，根据其模型的类别，使用不同的指标评价其性能优劣的过程。模型的优化则是指模型性能在经过模型评价后已经达到了要求，但在实际生产环境应用过程中，发现模型的性能并不理想，继而对模型进行重构与优化的过程^[2]。

模型评价和优化阶段工作旨在持续优化大数据高阶分析预测和优化模型的调优能力，并完成产品化。基于初步实施阶段结果，进一步与DCC装置的生产、技术、设备、工艺等专家共同探讨过程中的各类问题，设计并进行一系列参数调优试验，并将新生成数据投入到模型优化和迭代过程中，由此不断提高模型预测准确性与优化能力。最终将根据实际模型使用员工的操作和应用需求设计软件系统操作界面，并针对后续使用及维护过程编写操作手册，并提供对应的培训。

4 大数据高阶优化的特点及挑战

4.1 大数据高阶优化的特点

4.1.1 数据分析工具的选择

本课题大数据高阶分析预测和优化模型选择使用Python3.0编写。编程脚本使用Python自带的标准库与众多第三方库。Python3.0软件和标本库可从互联网上免费获得和正常使用，不会造成模型开发与维护的额外成本。Python是一种广泛使用的解释型、跨平台的通用型高级编程语言，拥有动态类型系统和垃圾回收功能，能够自动管理内存使用，并且支持多种编程范式，且拥有一个巨大而广泛的标准库。Python解释器本身几乎可以在所有的操作系统中运行。

4.1.2 使用过程工业大数据

目前互联网公司的大数据技术，基本通过很简单的统计分析即可揭示部分信息。而工业大数据建模是面向过程工业决策、优化、故障诊断、控制等应用，解决相对复杂数据建模问题，需要更深入的数据建模方法^[3]。

4.1.3 更适宜工业生产挖潜增效

与传统数据建模的排产软件相比，排产软件一般应用于全厂加工、效益测算、产品分布的粗略线性计算，这种计算完全属于自动化学科，针对的是小变量规模、短时间段的规则采样数据。而大数据高阶优化使用非线性运算的神经网络算法融合计算机学科和自动化学科，采样数据范围更大，测算精度更为严格，可应用于单装置的生产优化，更适宜企业挖潜增效。

4.2 大数据高阶优化带来的挑战

4.2.1 基于大數据高阶优化的主动预测

本课题主要利用过程工业大数据在生产运行时产生的数据更好地改进过程运行、提高高价值产品收率，在后续的研究中，期望能通过数据的分析，实现大数据的主动预测，进而实现快速分析及执行，降低错误决策的后果^[4]。

4.2.2 多种算法建设和评估模型

考虑到石油化工生产属于高危工业控制，如能从多种数学模型进行计算并验证，将极大保证生产的安全性和平稳性。目前除本课题使用的神经网络算法外，还有梯度提升回归决策树、随机森林等多种机器算法。但除建模需要针对性的分析研究外，庞大的数据分析量对计算机配置的要求也要求很高。传统的CPU不能满足计算需求，必须使用专门为机器学习定制的GPU来计算。

5 结束语

麦肯锡全球研究院发布的Big data：the next frontier for innovation，competition，and productivity指出过程工业可以从大数据分析和应用中提高生产力、降低功耗。以工业大数据为价值源，到2020年的总体价值将近1.3万亿美元^[5]。随着工业控制与信息技术的不断发展，各类工业控制系统与信息技术不断结合，存储收集数据的能力大幅提高，如何管理和利用，使计算机学科和自动化学科有效融合，将收集到的繁杂数据去离群、去缺失，提高工业生产模型的准确性，进而研究大数据高阶优化的发展规律及预测趋势走向，帮助企业生产管理人员提高收益、降低风险，将是未来过程工业大数据高阶优化的趋势和潮流。

参考文献：

[1]韩淼. 基于高斯过程的钱塘江涌潮预报算法研究[D]. 杭州：杭州电子科技大学，2018.

[2]翟高粤. 基于Python的数据分析概述[J].信息技术，2018（11）：5-8.

[3]刘强，秦泗钊. 过程工业大数据建模研究展望[J]. 自动化学报，2016 （2）：161-171.

[4]GE智能平台. 工业大数据云利用大数据推动创新、竞争和增长[J].自动化博览，2012（12）：40-42.

[5]秦明，陈凯.工业大数据集成应用综述[J]. 软件导刊，2017（7）：213-215.