乙苯/苯乙烯生产过程操作优化知识库设计

2023-07-19 03:51严耀西陈伏兵王昕
化工自动化及仪表 2023年3期
关键词:乙苯苯乙烯知识库

严耀西 陈伏兵 王昕

摘 要 结合乙苯/苯乙烯实际生产工艺特点和需求,将引入本体、知识规则推理、专家经验和贝叶斯概率算法的智能优化方法应用到乙苯/苯乙烯操作优化知识库中。该知识库系统整合知识本体层、解析存储层、算法层、应用层等相关技术,实现了乙苯/苯乙烯生产过程操作优化知识库系统。在实际工业应用中,初步验证了该知识库能够提高乙苯/苯乙烯生产过程的产品收率、降低原材料和动力能源消耗。

关键词 知识库 本体 贝叶斯概率算法 操作优化系统 乙苯/苯乙烯

中图分类号 TP391   文献标识码 B   文章编号 1000?3932(2023)03?0336?07

基金项目:2021年第二批产学合作协同育人项目(202102326010)。

作者简介:严耀西(1990-),助教,从事机器学习和知识图谱的研究,yxyan@hytc.edu.cn。

引用本文:严耀西,陈伏兵,王昕.乙苯/苯乙烯生产过程操作优化知识库设计[J].化工自动化及仪表,2023,50(3):336-342.

乙苯/苯乙烯生产是石油化工领域的支柱产业,但在能源消耗和环境污染方面却对我国经济具有不利影响[1],因此,石油化工领域迫切需要借助智能化技术突破其发展局限。传统信息检索方法尽管信息丰富但缺乏知识表达和知识推理,随着大数据时代的到来,急需对海量信息进行语义处理和发掘隐性知识。基于本体智能化知识库的推理检索方法能够有效进行自动推理、语义揭示和发掘隐性知识[2],知识表示是智能化知识库的核心部分,本体具有信息共享、传递和重用性的优点,因此在推理和数据挖掘方面有着广泛应用[3,4]。

乙苯/苯乙烯生产过程中普遍存在产品方案调整频繁、反应机理复杂、加工工艺参数时变等问题[5],导致乙苯/苯乙烯生产数据没有得到充分有效的复用。乙苯/苯乙烯生产过程的操作参数与现场实际工况有着密切联系,因此,如何运用知识表达、历史生产数据和专家知识来推荐优化工况方案,提高乙苯/苯乙烯工艺产能和降低能耗已成为该领域研究的焦点。

笔者将机理模型、知识规则推理、专家经验等智能优化方法应用到乙苯/苯乙烯操作优化知识库中,通过构建乙苯/苯乙烯知识库以实现生产数据的有效复用,提高生产效率。

1 知识库的架构设计

基于知识库的操作优化系统(图1)包含知识层、解析存储层、算法层和应用层。知识系统框架各层之间采用自底向上结构,每一层都为上一层提供技术支撑,该架构设计具有良好的结构性和可扩展性。

知识层。利用Protégé软件工具,对乙苯/苯乙烯装置的参数变量构建乙苯/苯乙烯参数本体库,利用参数变量之间的共性和相互的依赖关系,建立具有逻辑关系的规则库。

解析存储层。系统数据库是知识库系统的核心,将已建立的乙苯/苯乙烯本体库和规则库解析上传到系统数据库,专家领域知识、工厂实时DCS數据、模型数据上传到系统数据库,为算法层提供数据支持。

算法层。设计基于贝叶斯概率的匹配算法,通过对训练的样本集合进行统计,计算每个类别出现的概率和后验概率,通过数据样本训练得到贝叶斯概率的模型分类器,然后用分类器的概率结果对操作优化参数进行排序。

应用层。运用JavaWeb技术,前端使用JSP编写,系统后台主要基于Servlet和JavaBean编写[6],通过前、后端开发技术为用户提供数据输入搜索功能并将优化结果返回界面中,保证系统具有良好的交互性。

2 乙苯/苯乙烯生产过程知识本体构建

2.1 本体知识库

本体知识库主要由概念、属性、关系和实例组成。本体是构建知识库系统的基础,本体优劣取决于本体构建方法,目前较为成熟的主流构建方法有TOVE法、METHONTOLOGY法、循环获取法、骨架法及七步法等[7]。其中七步法最具有代表性,七步法构建包括类层、属性层和实例层,但是七步法缺乏本体更新维护和本体评价两个阶段,传统七步法缺乏系统的全面性。因此笔者采用刘树明提出的三阶六步法[8]。三阶六步法是指本体构建3个阶段6个步骤,其具体描述如图2所示[6]。第1个阶段是本体规划设计阶段,该阶段是构建本体的前期准备工作,主要包含确定本体设计目标范围、是否复用现有本体两个步骤。第2个阶段是本体构建阶段,也是构建整个本体的核心阶段,该阶段包含获取核心领域本体术语和创建本体类、属性、实例两个步骤。第3个阶段是本体评价更新阶段,该阶段需要专家全程参与和指导,主要包含本体评价和本体更新两个步骤,其中本体评价包括机器评价(即本体一致性检验)和专家评价,本体更新包含知识更新和需求更新。三阶六步法的优点在于降低了本体构建难度,缩短了本体构建时间,丰富了实例层构建,保证了本体的准确性和专业性。

2.2 乙苯/苯乙烯操作优化本体类构建

基于三阶六步法,乙苯/苯乙烯操作优化本体概念层构建采用重构方式扩展构建,在杨宇和马建新已建立的S?ESKBS本体库[9]之上进行完善和补充,将其设备选型本体添加和完善到乙苯/苯乙烯操作优化本体库中,从而快速高效构建乙苯/苯乙烯操作优化本体概念层模型。

构建乙苯/苯乙烯操作优化本体概念层,首先需明确乙苯/苯乙烯操作优化本体概念层构建的目标,通过查找相关文献和已有本体知识体系寻找乙苯/苯乙烯生产过程操作优化描述内容。乙苯/苯乙烯生产过程操作优化描述[10,11]可分为5部分:设备信息、物料信息、单元操作信息、操作条件信息、上下游关系信息。设备信息包含设备名称、设备设计温度、设备设计压力等,物料信息包含物料熔点、物料沸点等,单元操作信息包含操作温度、操作压力、进料量等,上下游关系信息包含前后设备生产流程关系等。

本体依靠专家和完备资料做支撑,根据不同需求调整、补充、完善本体知识库,从而为后续的乙苯/苯乙烯操作优化本体知识库实例层构建提供应用基础。

2.3 本体知识库规则

知识表示以知识具体化结果为目的,产生式知识表示法、语义表示法和一阶谓词逻辑表示法等都是常用的知识表示方法。本体使用语义网规则语言SWRL,它是一种产生式知识表示法[12],采用if…then…的表达方式,这种表达方式与日常习惯推理方式类似,容易被理解和接受。本体规则库是一种逻辑规则方法,通过本体规则库可以推理本体隐含知识和挖掘潜在知识。推理规则构建完成后,底层本体知识库需要推理机将隐含知识和数据推理到本体中,Protégé4.1内置有pellet推理机[13],其作用是对已建立本体库进行一致性检验和对隐含知识发现推理。由于本体库推理和应用不利于在客户端展示和搜索查询[14],因此需要将本体解析到MySQL数据库中[15]。

3 基于贝葉斯乙苯/苯乙烯的操作优化算法

3.1 监督式机器学习算法

目前,经典的监督式机器学习技术[16]包括支持向量机、贝叶斯算法[17]、决策树算法及人工神经网络算法等。其中,贝叶斯算法是一种运用概率分类的方法,其核心是算法利用有限的训练样本集的先验概率p(c)和类条件概率p(x|c)尽可能准确地估计出后验概率p(c|x)。贝叶斯算法与其他监督式机器学习算法相比有4方面的优势:

a. 朴素贝叶斯分类算法是以贝叶斯定理为基础的概率分类算法,具有坚实、完善的理论体系,并且分类准确性高;

b. 该算法对待处理数据的类型没有严格限制,可以用来分析各种类型的数据集,对新数据集也有很强的适应能力;

c. 该算法在结构上是较为清晰简单的星形结构,使得其计算效率高,可以在开销较低的前提下处理数据量较大的集合;

d. 朴素贝叶斯在一定程度上可以被视为一种动态分类模型,随着原数据集中新数据的加入,训练过程可以增量进行。

3.2 基于贝叶斯机器学习算法的思想

朴素贝叶斯分类器[18]适用于含有较多变量的大数据集,并且可以处理连续数据。除了离散化的方法外,处理连续的属性主要有参数化方法、非参数估计方法、半参数估计法和连续属性离散化方法。

本课题采用参数化方法中较为高效的概率密度函数方法,即基于高斯分布概率密度函数方法的连续属性朴素贝叶斯分类器,它基于属性的独立性假设-属性间的相互独立,简化了联合概率密度的计算,虽然减少了计算量、提高了效率,但损失了属性间的依赖信息,其结构如图3所示。

3.3 基于贝叶斯乙苯/苯乙烯的操作优化算法

经典朴素贝叶斯机器学习算法分为3个阶段[20]:准备工作阶段、分类器训练阶段、应用阶段。其优点在于:通过生成式模型,计算概率来进行分类,可以用来处理多分类问题;分类过程中时间、空间开销小;适合增量式训练,高效且易于实现;算法性能稳定,对于不同的数据特点其分类性能差别不大。但也存在一定的缺陷,如算法缺乏健全性,没有具体评估验证方案;算法未检测分类器的准确率;对输入数据的表达形式很敏感。基于贝叶斯操作优化的匹配算法包括以下6个步骤。

Step1 筛选设定阶段

工业生产中有大量繁杂的工业数据,获得有效的数据是处理数据的第一步。因此首先筛选需要研究的乙苯/苯乙烯生产过程操作变量和目标变量DCS数据,接着根据数据各属性度量的量纲进行处理使之符合工业生产单位标准,剔除掉异常的工业数据。然后选取若干组数组作为数据样本集。筛选出数据样本集之后,根据各个属性特征提取划分各序列的结果,并进行类别标注,构成后续的训练样本集。不同的划分类别样本集有不同的判定结果。因此该阶段需要专家参与和讨论来设定优化值。

Step2 训练阶段

该阶段的任务是生成分类器的数学模型,计算估计类先验概率p(c)和高斯分布最大似然估计参数μ和σ2。

Step3 分类阶段

运用朴素贝叶斯决策表达式对训练的样本集合进行统计计算,得到每个类别的出现概率和后验概率,从而获得模型分类器。

Step4 测试阶段

将已经学习得到的分类器用于测试集,对测试集中未知类别的数据进行分类和预测,并同时测试其分类的准确性。

Step5 评估阶段

分类学习方法的泛化性涉及它在测试数据上的预测能力。评价指标(表1)[21]是评估阶段直观快速地得出误差的计算方法。

正确率是评价指标之一,表示被分类器分对的比重,即正确率越高,分类器越好。正确率计算式为:

精度是表示被分类器分为正例中实际为正例的比重,它是精确度的量度,其计算式为:

Step6 算法排序阶段

系统数据库中存在大量的数据信息,面对大量的、不确定的模型信息,如何快速寻找到生产工艺需要的信息,其中最重要的也是最困难的问题就是排序,为此笔者提出了一种基于贝叶斯方法的排序算法,该算法运用测试阶段贝叶斯判定准则方法,将训练集和测试集中特定分类结果进行逐个计算,最终对计算概率密度值进行由大到小的排序。

4 乙苯/苯乙烯生产过程知识库系统应用与案例分析

4.1 知识库应用

笔者以某石化项目为依托,开发了一整套基于知识库乙苯/苯乙烯生产过程全流程操作优化知识库软件。乙苯/苯乙烯生产过程操作优化知识库结构如图4所示,首先用户登录后进入知识库主界面,该软件包含两个流程4个单元:乙苯生产工艺流程有100#制乙苯单元和200#乙苯精馏单元,苯乙烯生产工艺流程有300#乙苯脱氢单元和400#苯乙烯精馏单元。每个单元包含6个功能模块,分别是工艺流程(图5)、设备信息、关键参数灵敏度显示(图6)、操作优化(图7、8)、专家知识和诊断异常处理。

4.2 案例分析

基于知识库的乙苯/苯乙烯生产过程操作优化系统操作优化模块共有4种优化方式,分别是贝叶斯优化、产量能耗优化、产量优化、能耗优化。表2是分别利用这4种方式得到的现场优化对比数据。

从表2可以看出,产量优化中,100#单元装置粗乙苯产量增加了2.03 t/h,但装置单耗增加了3.99 kg(标油)/t。能耗优化中,100#单元装置单耗减少了4.53 kg(标油)/t,但粗乙苯产量却减少了1.03 t/h。产量能耗优化与产量优化相比,基本没有较为明显的优化效果。在贝叶斯优化中,从全流程效果来看,整体优化目标明显优于其他3种优化方式。贝叶斯优化中,尽管产量和能耗都没有实现最大优化,但由于专家设定优化类别既考虑了产量、装置能耗又兼顾了纯度综合指标,因而在综合优化上具有优越性。

5 结束语

笔者以乙苯/苯乙烯实际生产过程为背景,将本体知识库、监督式贝叶斯算法引入乙苯/苯乙烯操作优化知识库系统中,通过JavaWeb开发前后台管理技术,实现了知识库系统界面(包含工艺流程实时监控、关键参数灵敏度分析、操作优化和工况预测、专家知识录入和查询、故障诊断异常处理等),为现有生产装置进行工况预测和优化推荐提供了乙苯/苯乙烯生产的智能推荐方案。后续将在深度研究贝叶斯网以及贝叶斯网属性依赖关系方面开展下一步工作。

参 考 文 献

[1]   曹骏.智能化控制阀在石油化工中的应用设计探究[J].价值工程,2022,41(13):47-49.

[2]   周琦.基于本体的智能化信息检索研究[J].农业网络信息,2013(5):24-25.

[3]   肖宇,郑翔文,宋伟,等.新型冠状病毒肺炎领域本体构建及应用[J].军事医学,2022,46(4):263-268.

[4]   吴明明,马溪骏,彭张林.基于本体的智能化知识检索模型[J].微计算机信息,2012,28(2):159-161.

[5]   张峰,郭学云,王磊,等.一种乙苯脱氢制苯乙烯的尾气处理装置:CN212818969U[P].2021-03-30.

[6]   YANG D Z,ZHU S F,ZHOU S L,et al.The Design and Implement of Web MIS of Students Based on Servlet+JDBC[C]//2009 First International Workshop on Education Technology and Computer Science.IEEE,2009.DOI:10.1109/ETCS.2009.233.

[7]   TENGKU ADIL TENGKU IZHAR,TORAB TORABI,ISHAQ BHATTI M,et al.Recent developments in the organization goals conformance using ontology[J].Expert Systems with Application,2013,40(10):4252-4267.

[8]   刘树明.苯乙烯设备选型知识库系统构建研究[D].上海:华东理工大学,2017.

[9]   杨宇,马建新.乙醇水蒸气重整制氢反应条件的优化[J].华东理工大学学报(自然科学版),2006,32(9):1081-1085.

[10]   李嘉锐.本体知识库构建研究——以水稻领域为例[D].北京:中国农业科学院,2015.

[11]   邓涛.石油化工行业节能策略及在间歇式本体法聚丙烯工艺中的应用[J].广东化工,2011,38(5):22-23.

[12]   ZHAO W,LIU J K.OWL/SWRL representation meth?odology for EXPRESS?driven product information model:Part Ⅰ.Implementation methodology[J].Compu?ters in Industry,2008,59(6):580-589.

[13]   GRAU B C.Pellet:A Practical OWL DL Reasoner[J].Journal of Web Semantics,2007,5:51-53.

[14]   KO Y M,SONG M S,LEE S J.Construction of the structural definition?based terminology ontology system and semantic search evaluation[J].Library Hi Tech,2016,34(4):705-732.

[15]   GIACOMO M D.MySQL:Lessons Learned on a Digi?tal Library[J].IEEE Software,2005,22(3):10-13.

[16]   FRIEDL M A,BRODLEY C E.Decision tree classifi?cation of land cover from remotely sensed data[J].Remote Sensing of Environment,1997,61(3):399-409.

[17]   DOMINGOS P,PAZZANI M.On the Optimality of the Simple Bayesian Classifier under Zero?One Loss[J].Machine Learning,1997,29(2?3):103-130.

[18]   胡学钢,郭亚光.一种基于粗糙集的朴素贝叶斯分类算法[J].合肥工业大学学报(自然科学版),2006,29(2):169-172.

[19]   周志华.机器学习[M].北京:清华大学出版社,2016.

[20]   EL HINDI K,ALSALMAN H,QASEM S,et al.Build?ing an ensemble of fine?tuned naive Bayesian classi?fiers for text classification[J].Entropy,2018,20(11):857.

[21]   ZHANG Y Y,YANG S S,DONG P.The construction of index system and comprehensive evaluation model based on improved genetic algorithm and fuzzy neural network[J].Applied Mechanics & Materials,2010,20?23:1229-1235.

(收稿日期:2022-09-30,修回日期:2023-02-14)

Knowledge Base  Design for the  Optimization of Ethylbenzene/Styrene Production

YAN Yao?xia,b, CHEN Fu?binga,b, WANG Xina,b

(a. School of Computer Science and Technology; b. Huaian Key Laboratory of Big Data Intelligent Computing and Analysis, Huaiyin Normal University)

Abstract   Considering the characteristics and requirements of the actual production process of ethylbenzene/styrene, an intelligent optimization method was proposed, in which, the ontology, knowledge rule inference, expert experience and Bayesian probability algorithm were applied to the knowledge base of ethylbenzene/styrene operation optimization. The knowledge base system integrates relevant technologies of knowledge ontology layer, analytic storage layer, algorithm layer and application layer to realize the knowledge base system of the ethylbenzene/styrene production optimization. The industrial application verifies that this knowledge base can improve the product yield of ethylbenzene/yrene production, reduce the consumption of raw materials and power energy.

Key words   knowledge base, ontology, Bayesian probability algorithm, operating system optimization,ethylbenzene/styrene

猜你喜欢
乙苯苯乙烯知识库
均三乙苯的合成研究
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
苯乙烯装置塔系热集成
中国8月苯乙烯进口量26万t,为16个月以来最低
对二乙苯生产技术评述
制何首乌中二苯乙烯苷对光和热的不稳定性
Aspen Plus在苯乙烯制备过程优化中的应用
乙苯/苯乙烯生产过程的优化运行研究