肖婷婷
南京信息工程大学
目前国内多数化工企业生产工艺依赖于业务专家的领域经验调整用料配比,以满足生产需要,而人对生产环境的感知灵敏度有限,难以及时捕获时间、环境、设备、催化物等因素变化对生产带来的影响,同时也无法把握时间跨度较大的产量、质量变化趋势。要想在工艺提升方面有所突破,必须借助更先进的信息技术。化工企业受其所接触技术的先进性、成熟度、跨行业融通能力限制,信息化水平相对较低。部分企业通过外部上游化工行业巨头进行数据分析,很多时候只能知道数据结果,中间数据缺失,同时也容易失去数据的自主性。数据的完整性、安全性不足和信息技术相对落后,一直困扰着化工行业信息化技术变革。
虽然大数据技术的发展,让基于海量数据进行数据分析成为可能,但大部分化工行业中的系统都是孤立建设,数据一般都是以孤岛的形式存在,加上数据安全、管理要求等因素,导致无法有效地融合、融通使用。本研究实践利用云计算、大数据、人工智能等领域信息技术,以助力化工企业向新型智能化工生产发展为目标,打破数据壁垒,实现化工企业联合实践并获得初步效果。
本研究所描述的智能系统软件能够打造以企业内化工生产数据为支撑、感知和深度学习平台为核心的智能中枢,为生产业务智能化改造提供引擎。该智能系统在提供高效的模型训练服务的同时,还能为生产业务提供稳定可靠的模型服务,保证高并发实时数据情况下的性能要求,并具备良好的可扩展性。
根据市场调研结果,很多国内化工企业使用外部生产设备,为满足生产所需,需要定期向外部厂商发送生产数据和设备数据进行分析,以确认生产工艺关键参数值是否处于正常范围内。如果出现偏差则进行调整以便适应,避免造成生产损失。虽然很多化工企业在积极探索自主优化生产工艺,通过人工调整设备参数以降低生产过程中的原材料配比、触媒损耗程度等关键因素造成的产能损失,但长期以来收效甚微。
经初步评估分析,本研究实践所涉及的化工企业在运营过程中存在以下问题:
(1)数据安全差
企业核心数据被外企掌控,很多企业由于生产设备为外部采购,本地生产数据必须发给外部厂商,经由外部厂商内部分析系统进行数据分析,以掌握设备运行健康状况、产品质量和原料转化率等主要信息,这对企业产量、产能、造价、出货量等商密泄露埋下隐患。
(2)分析效率低
因为数据非实时处理,出现生产问题不能及时掌控,很多外部设备厂商分析结果需要一个多月才能反馈到企业本地,时效性极低,企业往往错失最佳的问题解决与故障修复时机。
(3)企业成本高
部分化工企业核心技术被外部企业把控,数据处理分析费用不断提高,同时还存在掌握核心技术的外企逐步缩减和中断和国内企业合作的风险。此外,企业在信息化建设过程中还需要执行市场调研、选型、采购、实施等一系列工作,无法准确评估信息化部分的持续性投入,耗时耗力。
1.2.1 生产工艺AI 模型建立
以典型的环氧乙烷生产过程为案例,采用氧气氧化法制作,工艺流程如图1 所示,分析现有工艺制作流程后得出不同原料配比的变化可能性,以变化因子为变量,可通过人工智能平台进行虚拟模型重构。
图1 采用氧气氧化法制作环氧乙烷工艺流程图
经过对生产工艺的分析,可从以下三个方面入手构建工艺AI 模型:
(1)基于传感器数据,利用交互式人工智能平台,快速构建符合化学生产工艺原理的人工智能模型,预测环氧乙烷占比(EFF=EO/CO2)。
(2)基于人工智能预测模型优化整个生产流程,根据常用操作参数推荐用料配置,保持环氧乙烷产量稳定。
(3)深度学习与训练,将以上两方面所得数据与历史经验值进行比对,同步对异常情况进行修正,得出正常值与异常环境下的多维度数据模型建议。
在模型的基础上,进行海量生产数据训练,生成AI 模型,自动化指导生产效能提升,在生产工艺各流程环节进行相应的控制,包括不同气体的用量、加工处理时间,保证输出产品的质量。
1.2.2 业务流程设计
本化工边缘云应用主要包括三个部分:预测催化剂选择性、智能调控提供最佳控制参数建议、人工协助智能操控。
(1)预测(核心功能):预测目标变量及约束变量,基于历史数据训练模型,预测关键变量的未来变化趋势。
(2)调控指导:针对调控变量,为操作员提供调控指导,以实现最优的目标变量,使催化剂选择性最大化。
(3)智能操控:在设备满足各项稳定运行的前提下,根据控制设备状况和化工企业生产实际情况,在生产主管的监督配合下,将调控变量的推荐值直接写入到控制系统,实现人工监控的闭环智能控制。
对生产过程进行深度分析后,整体智能系统业务主流程设计如图2 所示。
图2 整体智能系统业务主流程图
具体每个流程的工作设计如下:
(1)数据采集阶段
化工企业信息化数据来源相对单一,主要为接入现有生产数据库进行数据采集。数据采集完成后,通过消息总线分发给业务推理引擎,由推理引擎调用数据模型进行分析优化。优化过后的数据将通过数据同步模块上传到云端,为模型训练和定时模型迭代提供数据支撑。
(2)模型训练阶段
将数据从边缘端推理引擎同步到云端训练引擎,对预设的预测模型进行定期训练,从而达到持续优化的效果,来保证预测模型的实效性。优化后的模型版本,将会自动上架模型仓库,然后再将此版本模型下推到边缘推理引擎。
(3)时序分析阶段
完成前期模型优化训练后,经试运行通过测试,即可进入生产环境进行时序分析预测。通过对历史数据和实时数据的分析给出预测数据,预测数据再实时与生产数据进行对比验证,若预测结果满足约束标准则进入下一阶段。若预测结果与真实值偏差过大时则给出提示,此时应由生产业务人员和技术人员协同进行问题排查,重新优化改进模型。
此阶段根据预测模型进行最优化,生成可调参数,为下一阶段提供数据支撑。
(4)智能调控指导
通过定制化的用户界面展示推理计算出的可调参数,根据生产工艺经验判断是直接采用推荐参数值,或采用人工输入参数值。
(5)监控告警阶段
除预测和调控指导阶段,在常态化生产过程中,还应提供监控告警功能。在用户端的数据监控大盘中,提供实时数据监控展示,并可以针对某些特定指标进行配置,设置告警规则与告警阈值,一旦数据偏离告警阈值,或出现各种操作提示时,系统将会实时发出风险告警消息,并可根据告警等级发出不同的警告声音。
1.2.3 构建云边一体联邦系统
在进行网络设计时,充分考虑云边一体,实现云边协同,“云”是生产中心云计算,“边”是边缘云计算。云边一体主要是针对为用户提供的应用而言,在云化集中的前提下,通过异构部署边缘节点资源为用户提供就近的计算服务。相较传统的单纯云计算集中部署模式,通过边缘计算可有效解决汇聚流量带宽大、通信时延长等问题,为高带宽和低时延的业务提供了更好的支持,充分考虑了效率与投资的平衡。
在进行方案构建时,利用联邦学习(Federated Learning)的分布式机器学习,在多个数据源之间进行分布式模型训练,构建基于虚拟融合数据下的全局模型,既能实现数据隐私保护又能完成数据共享。基于云边融合的模型训练流程如下:(1)在化工企业内网部署边缘计算节点,通过网关接入已有生产系统数据;(2)将生产系统数据经本地计算脱敏后,送至部署在云数据中心的人工智能联邦学习平台进行模型训练;(3)训练好的模型版本自动上架模型仓库,并再次下推到边缘推理引擎覆盖原有边缘AI 模型。
过程如图3 所示,使用新的下发至边缘节点的AI 模型在生产过程中调整推荐控制参数,从而达到持续优化、持续提效的良性闭合循环。
云边融合并非简单的公有云和私有云的网络打通,而是使用边缘云作为公有云的有机延伸。在研究实践讨论的案例中,基于联邦学习平台的能力,边缘云在重算力、重隐私、轻存储、轻资产,满足企业核心业务需求的前提下,可以最大程度降低IT 设施建设成本和运维成本。
(1)边缘端数据采集与推理引擎部署于企业内网本地IDC 机房,确保生产数据安全性和实时数据交互效率;(2)云端模型管理引擎部署于公有云服务器中,降低硬件设备采购成本和运维成本,且便于集中进行后续模型训练。
通过定义的产品功能模型接入不同协议、不同数据格式的设备,可以提供安全可靠、低延时、低成本、易扩展的边缘计算服务。同时云端可连通所有边缘节点,管理边缘节点的服务,云边融合企业应用架构如图4 所示。
图4 云边融合企业应用架构图
生产过程数据采集完成后,通过消息总线分发给业务推理引擎,由推理引擎调用数据模型进行分析优化,优化过后的数据将通过数据同步模块上传到云端,为模型训练和定时模型迭代提供数据支撑。
(1)完成前期模型优化训练,试运行测试后,即可进入生产环境进行时序分析预测。(2)系统内嵌预测模型通过对历史数据和实时数据的分析给出预测数据,预测数据实时与生产数据进行对比验证,适时调整优化改进模型。(3)由预测模型生成可调参数,为生产工艺优化提供数据支撑。
历史数据分析和实时数据流分析流程如图5、图6 所示。
图5 历史数据分析
图6 实时数据流分析
历史数据分析为实时数据分析提供了更多参考,相应的数据沉淀、数据逻辑关联关系等为AI 输出更加精准的结果提供了条件。
除了具备算力来处理数据以外,算法是AI 中的关键内容,为便于推广与规模应用,建议算法训练平台应支持Caffe(卷积神经网络)、MXNet(亚马逊深度学习库)、PyTorch(开源的Python 机器学习库)、OpenCV(跨平台计算机视觉库)等多种框架,需支持复杂GPU虚拟化调度,支持超大数据量的模型训练来提高算法精准度。在具备Notebook 编辑功能的算法平台中,同时具备在线编辑调试能力与复杂神经网络构建能力。
基于算法训练平台通过系统提供的算子来自动地进行数据探索、数据预处理、特征工程、算法选择以及参数调优等工作。通过自动建模,用户可得出初始精度相对较高的模型,同时能够不断进行下一步的建模迭代。也可使用推荐式建模模式,通过推荐式建模可以选择下一步可能需要的算子,从而来降低建模的门槛。
使用历史数据和实时数据进行智能预测和智能规约,提出控制参数建议。在半自动化模式下,通过可定制化的用户页面展示由边缘端AI 模型实时推理出的建议参数,由现场操作人员判断是否采用,正式写入参数前,由操作人员二次确认输入值,并通过系统预测模型验证预期的有效性。在全自动化模式中,可直接由系统自动向PLC 写入建议控制参数。
由于此方案覆盖了模型生产、训练优化到业务上线的全流程,同时考虑到生产环境对高可用的需求,可通过物理主备以及“蓝绿式”部署,来增强系统的整体可靠性。具体在进行部署时,至少一台物理机在线提供服务(物理主备);模型通过线上验证后才能上线(蓝绿部署)。
云端训练服务器可依据实际生产环境对可用性的需求来确定是否需要做高可用部署。
系统部署方案拓扑图如图7 所示。
图7 系统部署方案拓扑图
通过云端+边缘端组合,能够帮助化工企业管理员自动完成数据采集、时序分析、业务模型迭代,从而实现趋势预测、智能调控指导和数据监控告警的主体诉求。
本地的推理引擎建议采用主备模式部署,这种模式的特点在于当模型进行更新迭代时不会影响生产环境的推理模型正常运转,能够保证至少一台物理机在线提供服务,并且新的模型是通过线上验证后才能上线的,确保新上模型的科学性和合理性。
本研究实践立足于一站式多模型大数据管理平台和交互式人工智能联邦学习平台,实践应用中可充分采用化工企业众多一线业务专家经验,构建化工生产工艺AI 的基础模型,通过物联网终端不断地向模型群输入海量数据,进行实时训练,基于AI 大脑以“数据+算法+算力”推动生产工艺不断改良提升。
联邦学习平台的云端训练引擎持续对模型进行训练,以适应生产数据的不断变化,边缘计算模块部署在企业边缘云以保障智能管理的时效性,这样企业生产数据可做到“内部处理”。依托先进的云边融合联邦学习平台,可以保障数据安全,提升系统可扩展性,最大程度降低企业运营成本。通过预测,实践方案可大幅提升化工生产综合数据分析支撑效率,数据交由外部设备厂商分析通常需一个月时间,采用本实践方案后降低到小时级。在生产工艺调整优化效果方面,以项目EOG触媒效率优化指标为例,使用本实践方案达到0.4%,远超0.2%的行业平均水平,提升幅度达100%。
目前国内外使用此类核心技术较少,市场上针对化工行业核心业务的数智化升级解决方案大多停留在理论阶段,难以行之有效地解决生产提效等难题。本研究实践的应用充分践行了技术赋能生产、数据创造价值的理念,帮助化工企业强化竞争力,迈上更高的平台。
化工产品的开发需要满足人们的各种需求,因此化工生产工艺种类繁多并且复杂,改变传统依赖领域经验人工调整用料配比的做法,通过云、数、智等技术在化工行业的应用,基于化工共性预测AI 模板能够快速构建多品类模型群,实现生产流程信息化,本研究实践描述的技术方案在化工行业具备较大的推广价值和意义,能够帮助化工企业独立自主地提升化工工艺和生产效率,同时还能降低企业生产能耗,响应国家“十四五”规划中提出的加快推动绿色低碳发展的号召。另外,本文描述的技术方案在类似的工业互联网场景如制造信息化中亦可参考使用。