沈大农
上海华谊信息技术有限公司 (上海 200025)
多喷嘴水煤浆气化炉具有大型化、高效率等技术优势,目前在全国范围内有着广泛的应用。同时,气化生产系统目前还存在气化产品产量不稳定的问题,并且面临着亟待实现的降低生产能耗、降本增效、提高智能化水平的考验。气化生产的稳定性已越来越成为整个化工生产系统能否保持良好运行的关键。然而,通过传统方法或利用现有的局限于气化生产内部数据的专家系统改进生产工艺,已经经过了多年的尝试,并没有找到有效解决问题的方法。
随着大数据和智能化等技术的发展,化工产业正在尝试建立“以数据为驱动”的生产优化模型和成本控制模型,从数据分析挖掘和智能模型的角度提升生产过程的稳定性和效率,逐步向智能化的目标发展。本文以多喷嘴水煤浆气化炉的炉温软测量为例,阐述大数据在气化炉工艺优化中的应用。
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系在一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百甚至数千的电脑分配工作。随着前所未有的巨量数据信息的聚集,“大数据”已经成为国家的战略资源。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些具有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
大力投入信息化建设,实现工业化与信息化的“两化”融合,成为能源化工行业实现转型升级的重要推动力。随着管理层思想的转变,以及全球化经济危机的压力,很多企业都在积极转型,目前大多数企业的信息化建设已初具规模。随着能化企业信息化程度的不断提高,产生了海量的数据,对这些数据的获取、管理、分析与提炼的能力,将直接决定企业能否在激烈的市场竞争中保持领先优势。
能化企业往常大多通过人工经验来进行决策,但是如今不单单只能通过人工经验来进行精益生产了。科学决策不能脱离数据的支持,从原材料采购到生产组织,从销售策略到库存优化,从资金使用到财务平衡等,企业运行的许多重大问题都需要科学准确的量化决策来实现。从大量的数据中获得的有用的规则,可以为决策服务提供关键的特征、预警和预测。随着计算机技术和网络技术的发展,能化行业积累的数据量越来越大。20世纪90年代兴起的大数据、云计算和人工智能等技术代表着信息存储和信息分析技术的重大进展,已成为人类处理和分析海量信息的有力工具。目前能化行业的生产分析一般采用人工经验或通过传统的统计分析方法来实现,较难满足实际业务的需要;如何依靠大数据技术来帮助企业实现科学生产,将多种不同类型的数据放在一起进行分析提炼,找出它们之间的关系,以图、表或文宇的形式展现挖掘结果,为业务人员提供决策辅助,是能化行业面临的共同问题。
上海华谊能化公司与经营、生产有关的应用系统很多,各种数据库及数据类型各异,所有这些基础数据必须经过梳理、整合、清洗等,导入到华谊工业大数据分析平台。
从华谊工业大数据分析平台的应用层考虑,数据的分布主要受以下因素的影响:
(1)数据需要尽量均匀地分布到集群中各节点,以保持负载均衡;
(2)Hadoop集群中节点故障被视为一种常态,优化数据分布时需要考虑节点失效问题;
(3)为保证数据的可靠性及查询处理效率,需要采取多副本冗余方案;
(4)Hadoop运行环境下,网络传输及磁盘I/O操作是影响整体性能的重要因素,如果能减少数据的通信量,将会有效减少数据处理时间。
目前华谊工业大数据平台采用的方式是将同一设备的数据尽量存储在相同节点上,并且在映射阶段完成连接操作,省去约减阶段的数据通信,从而使整体执行效率得到提高。
在进行数据读取时,名字节点(NameNode)会根据数据节点与客户端(Client)之间的距离对多个数据节点进行排序后返回给客户端,以便从最近的节点读取数据。Hadoop中网络节点呈树状结构,其中每棵子树的根节点通常是连接计算机的交换节点(交换机),两个节点之间的距离定义为一个节点到达另一个节点所经过的跳数。Hadoop的默认配置认为所有的节点均在一个机架中,因此需要根据实际集群的配置情况,将集群节点的网络拓扑传递给Hadoop,才能使Hadoop调度器选择合理的数据节点进行数据读取和写入。
在华谊工业大数据平台的数据架构中,Hadoop是处理复杂数据流的核心。数据往往是从许多分散的系统中收集而来,并导入Hadoop分布式文件系统(HDFS)中,然后通过 MapReduce或者其他基于MapReduce封装的语言(如Hive,Pig和 Cascading等)进行处理,最后将这些已经过滤、转换和聚合的结果导出到一个或多个外部系统中,具体流程如图1所示。
图1 Hadoop数据处理流程
在水煤浆的气化生产中,气化炉的炉温是表征气化炉运行状况、影响相关控制操作、关系到合成效率和生产安全稳定性的重要指标。目前,炉温的实时监控测量主要依赖于高温热电偶;然而,在现场高温高压、强腐蚀强气流的作用下,热电偶的工作寿命很短。受限于生产现场复杂的工况与环境,热电偶在损耗后,难以频繁更换,仅在大修期间有更换的机会。在实际生产中,炉膛温度一般保持在煤渣熔融温度的-50~100℃范围内。若温度低于该范围,将直接影响气化炉的排渣容畅度,导致可能出现堵塞现象;若温度高于该范围,则会导致耐火砖寿命下降,合成气体中有效气比率下降。综上所述,生产中气化炉的炉膛温度必须保持在一定范围内,这就对炉膛温度的实时监测提出了较高要求。
在实际的生产经验中,安装的热电偶的读数仅在气化炉开车初期是有效的,而在热电偶读数失效后,需要使用软件模型代替传统意义上的传感器。选取相关的辅助变量建立模型,根据模型变量的样本观测数据求出样本估计式,进而根据该式推算出该变量的值,这是炉温软测量的基本思想。侍洪波等采用基于神经网络等方法建立了气化炉炉温软测量模型并应用于工程实现,取得了较好的现场生产运行效果。然而,神经网络等黑箱算法的可解释性较差,并且不同气化炉的工艺和实际运行工况相差较大,需要针对具体的气化炉建立相对应的软测量模型。
炉温软测量是大数据技术在气化炉工艺优化领域落地实现的应用之一,一般认为炉膛内壁的温度分布较均匀,因此,建立炉温软测量模型的具体步骤包括数据采集与预处理、模型拟合与模型验证。
炉膛温度为模型的因变量,所以要采集热电偶运行较为可靠稳定的时间范围内的数据。本文以某化工企业的多喷嘴水煤浆气化炉在2017年9月的分钟级数据为取值范围,采集处理与炉膛温度有关联的数据。与炉膛温度相关的数据有很多,包括煤浆浓度、氧气量、氢气含量、甲烷含量、一氧化碳含量等几十个自变量参数,涉及水煤浆制备、气化反应等多个环节。在取值后,需要将这几十个参数进行筛选降维,以提高模型的可靠性。
相关系数法是变量选择较为常用的方法,该方法通过相关系数计算获得两个变量之间的相关性,从而得出与目标变量相关性较大的操作变量。相关系数可以分为弱相关性、显著相关性、高强度相关性三个等级。在工业实际生产中:采集工业装置历史操作数据如煤浆浓度、氧气流量等作为操作变量,炉膛温度历史数据作为目标变量,分别计算它们的相关系数,然后以设定的阈值初步筛选出操作变量;考虑到自变量之间存在的自相关问题,结合业务逻辑,将自相关系数较高的几套系数降维,仅保留其中最具代表性的特征参数,经此步骤后,模型的自变量参数可降至数个。
模型的目标变量为气化炉在正常测温期间的高温热电偶数据,模型的自变量为该期间内的经上一步骤筛选过后的数个相关变量。以时间为标准,将采集数据的中前部(约80%)作为训练集,以拟合炉温软测量模型。将采集数据中剩余的部分(约20%)作为验证集,对拟合出的炉温软测量模型进行验证。若精度满足预定标准要求,则说明模型有较高的指导意义。
经过不同的算法模型(例如回归分析、神经网络等)测试,并比较其精度,本文选取多元线性回归算法进行了炉温软测量模型的建模工作。多元线性回归模型是指用多个影响因素作为自变量来线性地解释因变量的变化。设 Y 为因变量,X1,X2,...,Xn为自变量,则多元线性回归模型为:
其中:c 为常数项,b1,b2...,bn为回归系数。
运用训练集中的数据,通过回归模型拟合,计算出了炉温软测量模型的常数项与回归系数。
将上一步骤所获得的回归模型应用于验证集中的数据,通过比较热电偶实际读数与炉温软测量模型的预测值(见图2),可对软测量模型的效果进行评价。
图2 热电偶读数与炉温软测量模型预测值比较
由图2可知,基于多元线性回归方法的气化炉炉温软测量模型拟合精度较好,其回归模型的输出值与热电偶读数真实值之间的相对误差较小,趋势跟踪较为吻合,基本能够满足实际工业生产要求。
从满足工艺要求的模型,到可以实时显示现场操作人员能直观理解的操作参数、操作建议和实际运行效果,需要借助于一个直观的展示平台。
随着大数据和智能化等技术的发展,化工产业正在尝试建立“以数据为驱动”的生产优化模型和成本控制模型。从数据分析挖掘和智能模型的角度提升生产过程的稳定性和效率,逐步向智能化的目标发展。华谊工业大数据分析平台主要包含煤浆优化、炉温预测、有效气优化三大模块,更加直观地展示工业大数据经过建模处理后的效果。
5.2.1 煤浆优化模块——煤浆实际浓度图
煤浆实际浓度图所展示的内容为各类煤浆的实际浓度值,如图3所示,数据主要来源于生产检验数据库。图形下方滚动条可以自由缩放,以方便数据的检查和校验。图形右边的按钮可以实现图形形态的转换和下载。
图3 煤浆实际浓度图
5.2.2 炉温软测量模块——炉温软测量效果图
通过对实时数据库系统的相关数据进行分析,可通过模型计算出炉温的软测量数值,效果如图4所示。图中线条分别为从数据库读取的炉温实际值与经过模型计算分析处理后得出的炉温软测量值,可以看出计算值与实际值的拟合程度较高,说明模型计算效果明显。图形下方滚动条可以自由缩放,方便数据的检查和校验。图形右边的按钮可以实现图形形态的转换和下载。
5.2.3 有效气优化模块——有效气产量值
有效气的产量值是通过一系列的相关性指标计算得到的,如图5所示。图形下方滚动条可以自由缩放,方便数据的检查和校验。图形右边的按钮可以实现图形形态的转换和下载,展示更加灵活。
图4 炉温预测效果图
图5 有效气产量值
借助大数据技术能够快速处理生产数据,并利用历史生产、实验数据对气化生产工艺中产生的数据进行分析建模,最终建立炉温软测量模型。大数据技术在气化工艺中的实现是一项先进技术与传统工艺结合的应用,该项目对生产实践具有明显的指导作用,它以科学的算法计算结果代替操作人员的经验,可以降低相关人员的工作强度,提高生产的安全性。利用算法与大数据的优势可以稳定生产、提高产量,实现数据化管理。
参考文献(略)