仇登可,张 弢,侯士超,崔 鹏,刘 锋
(1.昆仑数智科技有限责任公司,北京 102206;2.中国石油天然气股份有限公司石油化工研究院,北京 102206)
当今世界国际环境错综复杂,石化企业创新是一个国家创新战略的重要组成部分,要实现由石化大国向石化强国的跨越,创新是首要的关键要素。因此,着眼于人工智能技术研发相关软件产品,对提升石化产业的整体水平有着重要意义。人工智能(Artificial Intelligence,简称AI)诞生于1956 年,是一门全新的研究开发扩展人类智能的理论技术[1],AI 技术试图通过模仿人类智能,让机器拥有更高的智慧,从而使机器能够承担一些当前只有人类完成的复杂工作。
在现代社会中,工业发展已经成为推动中国社会和经济走向更高水平的重要推手和支撑力量,工业自动化对一个国家发展起着重要作用。在依据工程人员经验的传统凑试方法仍是PID 参数整定主要方法的前提下,研究应用AI技术算法自动整定PID 的参数具有重要意义。相较于费时费力、计算结果准确度低的传统凑试法而言,AI 技术更为便捷且具有较高的准确度。
工业大数据是指工业设备高速运转时产生的大量数据,对应着不同时间、不同状态下的设备信息。如果能将这些数据信息有效地分析利用,能够提高工业生产效率和经济效益。工业大数据除了具有大数据所共有的海量性、多样性、高速性和易变性,还拥有设备大型化、生产连续化、参数复杂化的特点[2]。具体来说具有以下特征:
1)海量性。工业大数据的数据体量非常庞大,大量生产装置的数据信息不断涌入,在带来潜在价值的同时,也对大数据的处理技术提出更高要求,即从海量数据中筛选提取出有用信息。
2)多样性。工业大数据类型多样,来源广泛,分布于生产管理、工艺管理、设备管理等各个环节中,数据与数据之间不仅关联复杂,也会产生新的关联数据。
3)高速性。由于工业生产效率影响经济效益,必须具有能够高速获得并处理的特点,装置生产现场的数据分析处理时间要求达到秒级甚至毫秒级。
4)易变性。影响工业生产的因素多种多样,时刻发生变化,导致工业大数据的易变性,需要更加注重提取对现有工艺或设备有效的数据,提高生产效率和推动个性化发展,而非专注于数据本身。
5)强关联性。工业生产全过程的数据之间都具有一定的关联性,如石油化工行业中上游装置的出料时刻影响着下游装置的进料,包括产品组分、进料流量等。
6)准确性。工业大数据不仅要求数据真实可靠,也要求数据的处理方法科学可靠,仅通过数据的统计无法获得工业大数据更深层次的价值,因此要通过建立物理模型和数学模型等方式,深度挖掘数据价值。
7)闭环性。工业生产与每个步骤息息相关,如石油化工装置的控制回路需要在闭环状态下对其进行调整优化。
工业大数据若要得到有效应用,需要通过数据存储、数据处理、数据分析等技术发现数据之间隐藏的关联性和其他有效信息,以便更好地提高工业效率和产品质量[3]。在石油化工行业,工业大数据包括了从用户需求、工艺设计、设备采购、装置生产、产品销售到售后服务全生命周期产生的数据信息。通过工业大数据技术,挖掘产品全生命周期数据中蕴含的价值,对其进行规划处理和分析计算,从庞大且复杂的数据集中获取新的理论方法或技术,以此推动企业的改革创新,提升产品质量和生产效率,最终实现高经济效益的提高。若要更好地服务于石化生产,还需深入研究装置现场的实际情况,形成有效、便于实施的解决方案。
在石油化工产品生产过程中,存在大量的控制系统,这些控制系统若要具有良好的控制效果,就需建立贴合实际的数据模型,并对装置被控对象的数据模型进行系统辨识。模型的建立往往依赖于已有的工艺流程、生产环境等相关信息,这些信息被称为先验知识,先验知识对模型结构的选择以及辨识方法的确定都有重要作用。AI 模型建立后,即可进行系统辨识,AI 模型对象辨识的最终目的是能够对被控对象未来的变化进行预测和控制,通过测量系统的输入和输出预测其变化趋势,提前做出应对措施,提高系统的控制质量。
结合AI 技术研究并实现非线性、闭环对象辨识,如采样周期、信号幅度等如何设置,将按照工程化,结合现场实用的目标设计,应用的AI 技术主要包括非线性回归分析、神经网络算法和遗传算法等[4]。
回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式。非线性回归,是回归函数关于未知回归系数具有非线性结构的回归[5],常用的处理方法有回归函数的线性迭代法、分段回归法、迭代最小二乘法等。应避免模型的过拟合和欠拟合,因为欠拟合会导致总体上较差的性能和较高的预测误差,而过拟合会导致较差的泛化和较高的模型复杂性。
神经网络算法是模拟人类智能的一种计算机处理算法,要先仿照人类神经系统搭建神经网络。神经网络由大量的神经元构成,每个神经元仅具有简单的功能和结构,但当大量的神经元互相连接组成一个系统时,就可以产生复杂的行为或进行复杂问题的计算。神经网络不是按照一定的方法流程执行计算,而是自身通过学习适应环境,总结规律,从而达到完成指定运算的目的。因此,要先对神经网络进行学习训练,使其能够对已经学习过的内容做出准确迅速的判断,进而深化学习,提高神经网络的自适应能力和自组织能力,可以发展知识甚至超过设计者原有的知识水平[6]。
遗传算法是通过模拟自然界中生物体的繁衍过程而开发设计发展起来的随机搜索算法[7]。研究学者通过模拟自然界中生物的进化过程建立数学模型求问题的最优解,用数学的计算手段,把问题的求解计算过程方式转换成基于染色体各个基因之间的自然交叉基因变异的计算过程。相较于传统的数据优化分析算法,遗传算法能快速解决复杂的系统优化问题,可以快速得到更加准确的优化结果。
遗传算法应用步骤如下[8]:
1)确定一种编码方式表示可行解的染色体,通过随机方式产生初始种群。
2)在确定个体适应度函数后,通过计算个体的适应度函数值保留适应的个体。
3)根据需要设计选择算子、交叉算子和遗传算子,通过对优秀基因的遗传操作形成新的种群,直到达到最大迭代次数。
4)输出种群中适应度最高的值作为最优解,作为遗传算法的执行结果。
生产装置平稳运行是炼化企业安全生产的重要条件。炼化企业生产装置普遍具有数量多,分布范围广,流程复杂等特点[3],运行过程时刻伴随着各种报警信息,类型繁多,数量庞大,大型装置24h 内或有上万条报警信息,加上过程变量之间极为复杂的关联性,操作人员经常不能第一时间找出症结所在,从而耽误最佳调整时间[9]。
目前绝大部分报警系统设计都是针对某一变量的报警,预先设定好该变量的上下限值,如果变量值处于正常区间内就不会触发报警,如果变量值高于上限或者低于下限,则会触发报警。但是,石油化工装置生产过程是连续的、相关联的,单个变量的报警虽然可以及时提醒操作人员生产过程出现异常,但操作人员很难第一时间得知异常发生的具体位置,并在第一时间做出最佳响应[10]。这种传统的报警监测技术已经难以满足不断提高的安全生产标准和要求,亟需一种新的先进报警管理优化技术,实现装置的预警和报警原因的自动定位。
石化装置连续不间断的生产过程,装置与装置之间,控制系统与控制系统之间,很明显具有或强或弱的关联性。如图1 所示,按照单变量报警设置的正常工作区域如虚线区域所示,是一个规则的矩形。但实际上,变量之间或多或少都会存在一定的关联,正常工作区域应当如多边形区域所示,这就导致设定的正常工作区域和实际的正常工作区域存在一定差异。若设定的正常工作区域覆盖而实际未覆盖,如实线三角形区域所示,则会导致漏报;若实际的正常工作区域覆盖而设定未覆盖,如实线圆形区域所示,则会导致误报。漏报有可能会遗漏重要的报警信息,危及石化生产过程的安全;误报会增加错误报警信息的数量,加剧报警泛滥的情况。因此,深度挖掘变量之间的关联性,优化装置报警技术,对提高生产过程的安全性有着重要作用。
图1 报警相关性Fig.1 Alarm correlation
Apriori 算法由R. AGRAWA L 等人提出,反映了事物之间的相互依赖性或关联性,是第一个经典且活跃的关联规则挖掘算法[11]。其关联规则的方法是通过逐层搜索,找出庞大数据库中项集的关系。其中,项集的频率是指包含项集的事务数,频繁项集是指支持度大于最小支持度的项集,简称频集。Apriori 算法需要挖掘频繁项集有两个阶段:一是候选集生成,二是情节的向下封闭检测,算法简单,容易实现。因此,Apriori 算法目前已经被广泛应用到各行各业。但算法的简单也会带来一些难以忽视的弊端,如频繁扫描数据库产生大量的数据信息、大量的中间项集,算法能够适应的领域狭窄,需要对Apriori 算法进行改进,使其发挥更大作用。
对炼化企业生产装置的报警来说,传统的Apriori 算法并没有考虑到数据项的重复性,而重复报警在流程工业报警数据中是大量存在的。因此,在报警数据关联性挖掘应用Apriori 算法之前,需要过滤掉重复报警等无效报警。AI报警优化技术,就是在传统Apriori 算法关联规则法的基础上进行改进,设计并实现适用于炼化装置报警优化的改进型Apriori 算法。效果如图2 所示。
图2 报警AI关联图Fig.2 Alarm AI correlation diagram
项目实施的AI 报警优化技术,首先能够抑制大量无效报警,及时发现设备故障隐患,预防潜在的生产事故,提高生产效率,使得报警数量大大降低,以便真正重要的异常报警能够被及时发现和处理;其次,可以帮助优化报警分级设计,对报警优先级进行合理化处理。参照报警管理标准进行重新分级,以便给操作人员提供更加明确的、清晰的报警信息,以便于操作人员对生产装置运行过程进行更好的控制。
当前,信息化技术日新月异,使用新技术监控装置运行情况,评估装置运行问题,给出合理的优化参数的功能,是非常符合工业管理人员期望的。由于装置的控制信息化程度提高,但是监控和管理系统没有同水平提高的问题,过程工业的管理人员迫切地希望有一个便利程度较高的管理工具。基于工业大数据的AI 装置优化技术能够及时发现装置问题,并给出建议的优化参数,将会为检维修人员提供很大的帮助。
基于工业大数据的AI 装置优化技术不局限于某一回路或某一工艺过程,本算法针对PID 优化及流程工业报警相关性开发,对一般采用PID 进行控制的流程工业控制系统有通用性。
石油化工行业生产装置运行的管理正朝着自动化、智能化的方向发展,基于工业大数据的AI 装置优化技术,利用大数据的特性挖掘数据价值,利用人工智能理论算法和技术不断对装置控制进行优化,实现装置的平稳运行和高效生产。