邓久宁,张婷暄,汪洁,孙怀宇
数据相关性分析在干燥器研究中的应用
邓久宁,张婷暄,汪洁,孙怀宇*
(沈阳化工大学 化学工程学院,辽宁 沈阳 110142)
通过流化床干燥器对固体颗粒进行干燥,从实际生产过程中得到了干燥器运行过程中的监测数据,以此为样本进行了数据分析。使用基本统计方法、相关性分析,分析了各变量之间的关系。应用带时间差的相关性分析算法,对于变量之间变化的时间间隔进行了分析。
流化床干燥器;数据分析;相关性分析
化工过程中会产生大量的数据,这些数据本来是用于过程的监视及自动控制的,但这些数据也同时体现了化工过程中各种参数的变化及化工过程的特性。通过分析这些数据,将能对化工过程有更深入的了解。由于化工过程的复杂性及非线性等特点,所以完全基于机理对过程进行模拟比较困难。而应用大数据分析算法,通过数据分析,得到对化工过程研究及优化有意义的参数,也是一个有益的尝试。
流化床干燥器是一种化工设备,其原理是指将湿物料加热并使其湿组分蒸发,从而得到要求的湿含量固体成品的过程。干燥操作在化工、轻工、能源等领域中有极其广泛的应用。本文以实际生产过程中获得的DCS运行数据为样本,应用基本的数据统计算法及相关性分析算法对生产过程进行了辅助分析[1-5]。
实际PVC生产中的干燥流程如下:从聚合釜来的PVC浆状物料通过离心机脱除水分后,由螺杆泵打入干燥器内。使用由蒸汽加热的空气从下方流入使颗粒流化。干燥器分为并列的3段,热空气分别流入干燥器的各段。干燥后的物料从右方流出干燥器,去产品仓。空气从上方流出干燥器,经过旋风分离器分离固体颗粒后排空[6]。为了提高干燥效果,使用干燥器内置的换热器对空气进行了进一步的加热。
在生产过程中,主要通过控制空气流入的温度及流量对于物料的含水量进行控制,但由于干燥过程的复杂性,难于准确对于含水量进行控制。往往因参数的设置过度严格,造成被干燥物料的含水量较低,进而增加了生产成本,消耗了不必要的能量。
从某厂PVC工段得到的干燥过程DCS数据为连续10天的实际运行数据,包括了83个与干燥相关的主要工位,共120个参数值,采样时间为1 s。原数据为CSV格式,为方便数据的获得和分析,建立了MYSQL数据库保存数据,并使用C#.net语言开发了程序,可以完成数据导入导出的功能。支持选择时间范围后,将数据按指定的时间间隔导出到文件中。
在干燥设备的操作过程中,含水量是干燥过程最重要的产品指标,将作为目标变量进行分析。设备中各点的温度往往存在波动。而在干燥过程中,温度及分布对于干燥过程有重要的影响,所以本论文中选择了空气流入流出温度、干燥器内的温度分布为重要参数进行研究。干燥工段主要参数示意图如图1所示。
根据化工的流程,可以选择如下工位的参数进行重点研究。加热的空气分为两股流入干燥器的一床及二床中。使用T2224、T2225、T2226监视一床一室中的温度;使用T2234及T2235监视一床二室中的温度;使用T2228及T2229监视二床中的温度。使用T2249监视干燥器的气体出口温度,使用T2232对于加湿器的温度进行监视。
图1 干燥工段主要参数示意图
对于指定时间段的运行数据采样,对于每个工位参数进行基本的统计分析,计算的内容包括均值及方差[7]。
均值计算公式:
方差计算公式为:
通过绘制各点数值随时间变化的曲线,初步得出各变量的变化情况及之间的关系。
由于所有的工位及参数处于一个大的系统中,所以其中必定存在一些相关的关系。分析变量之间数值的关系,可以了解变量之间的相关性及关联性,对于深入了解系统的特性及规律是十分重要的。
两个变量相关系数的计算公式如下[8]:
式中:(,)—与的协方差;
[]—的方差;
[]为的方差。
相关系数为正说明变量之间为正相关,为负则说明变量之间为负相关。绝对值越大,说明两变量之间的相关性越强。
化工过程中存在物料的流动过程,所以会存在变量与变量先后变化的情况。通过时间序列的分析方式,可以得到基于时间差的变量之间关系。
本文中使用的方式是,将一个变量作为目标变量,使用不同的时间间隔,计算其他变量与此变量之间的相关。能够得到不同时间间隔下的相关性大小,就能够初步分析出两者之间在时间上的相关性,从而得到物料流过设备过程中的停留时间等重要信息。
可以看出,在D比较小时,系统可以较快地达到稳定,但当D超过某个值后,稳定时间迅速上升,以致达不到稳定状态。由于微分控制参数表达的是数据变化速度对于控制量的影响,是一种预测的方式,但预测过量的情况下,就有可能不易达到稳定调节。通过模拟D=7时的控制曲线得出,当D的值过大时,调节迅速,但会带来调节的过冲,使控制值难于达到稳定的状态。
取生产运行数据中的20 h的数据为样本,绘制出了重要参数的曲线,如图2所示。并对温度变化数据进行基本的统计,结果如表1所示。
图2 主要参数值随时间的变化
从图2中可以看出,入干燥器的气体温度平均较高,而在干燥器中的温度则降低到了60 ℃及以下。从数据曲线的波动来看,在生产过程中存在温度的波动,原因可能是蒸汽压力的波动、物料含水量的波动、自动控制引起的波动及其他条件的变化等。
表1中的数据也说明了各点温度变化的情况。通过分析可以看到,在实际生产过程中,一些参数还存在比较大的波动。而且有一些波动有一定的模式,可能以后通过数据分析的算法得到变量的变化规律及变量之间的关系。
表1 主要温度点的统计数据
通过相关性算法的计算,得到了各主要变量之间的关系描述,并绘制了相关性关系图如图3所示。
图3 各温度点之间的相关系数
从图3中可以看到,在流程上有明确前后关系的点,相关系数比较高,如分别测量热空气两个支管的T2227与T2230;距离较近的测量点也有较高的相关系数,如T2225与T2226;而距离较远的点,相关系数往往较低。而T2232是单独的设备,与其他点的相关性均很小。根据变量之间关系的分析结果,就可以确定变量之间的关系。这些关系可能用于优化测量点的布置,并对生产过程进行监控,还可及时发现某些仪表的异常或生产过程的异常。
由于含水率是本设备的重要指标,本文还对各温度点与含水量的相关系数进行了分析,绘制图形如图4所示。
图4 产品含水量与其他变量之间的相关性
图4中与含水量正相关性最大的变量为T2249,从流程图上看,T2249为干燥器顶经旋风分离器后的温度。正相关说明当此点温度升高时,产品的含水量也相应上升。从热量衡算的角度分析,在入干燥器的空气温度及流量基本不变的情况下,如果出口温度上升,则说明空气可能未与颗粒充分换热进行干燥,造成产品中含水量的增加。
与含水量负相关性最大的变量为T2229,从流程图上看,此点为干燥器二床中的下部温度。负相关说明当此点温度升高时,产品的含水量将相应下降。从流程分析,此点温度较高,说明在二床中蒸发的水分较少,颗粒离开干燥器时的水分含量较低。而T2224与T2227等第一段中的温度变量,与最终含水量的相关性较低,这并不说明这些点的温度对于干燥效果不重要,原因可能是颗粒经过一床,需经过二床后才形成产品,而计算中使用的是相同时间下的数据,所以这些变量与最终含水量的直接关联相对较小。
从上面分析能看出,通过分析变量之间的相关性,可以得到变量之间正相关或负相关的关系。以此为基础,可以使用相关密切的点对过程进行更多的监控。而且也有可能应用相对较灵敏准确的温度测量仪表补充较不敏感的含水量测量仪表。
通过对于参数之间时间上相关性的分析,可以得出各变量之间变化的先后次序及时间间隔,可能计算出物料在设备中的停留时间等参数。T2225与T2235的时间相关性如图5所示,T2224与TI2228的时间相关性如图6所示。
由图5可知,其中d为T2225向后平移的时间差。T2225与T2235分别为一床一室内的温度及一床二室内的温度,分析这两者的时间相关性,可以分析出物料由第一室流动到第二室所需要的时间。从图5中可以看出,两个变量之间在25 s左右有一个最高的相关性,说明T2225点的温度波动情况与25 s后的T2235点温度的相关性较强。这可以说明物料从第一段的测温点流动到第二段的测温点需要约25 s的时间。
图5 T2225与T2235的时间相关性
图6 T2224与TI2228的时间相关性
由图6可知,T2224与T2228分别为一床干燥器一室内的温度及二床干燥器内的温度,分析这两者的时间相关性,能够分析出物料由一床一室流动到二床所需要的时间。从图6中可以看出,两个变量之间在70 s左右有一个最高的相关性,可以说明物料流经这段的时间需要大约70 s的时间。
1)使用数据的基本统计分析发现,在实际生产过程中,各参数存在着一定的波动。
2)通过参数相关性分析,分析了各主要点温度及产品含水量之间的相关性。相关性揭示了各变量之间变化的关系与流程之间的关系。
3)应用基于时间差的数据相关性分析,得到了物料在干燥器内流动的时延参数等。
应用数据分析算法,探索了运行数据与流程之间的关系,能够对化工设备的建模、仿真、控制、优化等提供支持。下一步的工作中计划应用更多的算法对数据实施深入分析,并结合分析的结果推进化工设备的分析和研究。
[1]王纪文. 流化床干燥器运行过程中影响流化的因素分析[J]. 中国化工贸易,2004,13(7):127-127.
[2]薛付英.离心流化床干燥器干燥特性的研究[D]. 大连:大连理工大学,2001.
[3]SHIN Y S, KIM H C, CHUN H S. Drying of water treatment process sludge in a fluidized bed dryer[J]., 2000, 17(1):22-26.
[4]王成军,张宝诚,高泰荫. 流化床干燥过程的数学模型及其应用[J]. 机械设计与制造2009,7(6):56-57.
[5]ZAKARIA J H, ZAID M H H M, BATCHA M F M, et al. Feasibility study on pliant media drying using fluidized bed dryer[J].,2015, 27(11):446-449.
[6] 黄友良,周永高.干燥过程中PVC树脂水含量的控制[J]. 聚氯乙烯,2008,10(6):16-19.
[7]黄才胜. 数据分析技术在化工检测工作中的应用[J]. 化工管理, 2018(31):69-70.
[8]易军,李太福,张元涛,等. 基于混合Copula模型的铝电解槽多参数相关性分析[J]. 化工学报,2014,8(4):189-194.
[9] LAROSE D T, LAROSE C D.数据挖掘与预测分析(第2版)[M]. (译者:王念滨,宋敏,裴大茗)北京:清华大学出版社,2017.
[10]HOLGER K.非线性时间序列分析[M]. 北京:清华大学出版社,2005.
[11]刘昱明,刘武,李浩,等.基于吸收塔动态模型的PID控制模拟研究[J].辽宁化工,2020,49(6):679-682.
[12]刘武,李浩,于秀明,等.吸收塔动态模型的建立及应用研究[J].辽宁化工,2018,47(2):159-162.
[13]李浩,唐成驰,刘武,等.套管式换热器动态数学模型的建立及仿真研究[J].辽宁化工,2018,47(7):651-654.
[14]方黄峰,刘瑶瑶,张文彪.基于LSTM神经网络的流化床干燥器内生物质颗粒湿度预测[J].化工学报,2020,71(S1):307-314.
[15]陈聪聪. 卧式多室流化床隔板结构对大颗粒停留时间的影响[D].杭州:浙江工业大学,2019.
[16]陈祁,刘慧慧,汪大千,等.小型流化床干燥器气固流动和干燥的CPFD数值模拟[J].中国矿业大学学报,2019,48(2):415-421.
[17]赵虎. 流化床中不同粒径颗粒停留时间及其分布的调控研究[D].北京:中国科学院大学(中国科学院过程工程研究所),2017.
[18]葛传龙.高密度聚乙烯装置流化床干燥器运行周期短的原因分析及建议[J].当代化工,2020,49(9):2075-2078.
Application of Data Correlation Analysis in Dryer Research
,,,*
(School of Chemical Engineering, Shenyang University of Chemical Technology, Shenyang Liaoning 110142, China)
A fluidized bed dryer was used to dry the solid particles, and the monitoring data during the operation of the dryer were obtained from the actual production process. These data were usedas samples for data analysis. Using basic statistical methods and correlation analysis, the relationship between the variables was analyzed. The correlation analysis algorithm with time difference was applied to analyze the time interval of the change between variables.
Fluidized bed dryer; Data analysis; Correlation analysis
2021-06-10
邓久宁(1997-),男,辽宁省盘锦市人,硕士研究生,研究方向:化工数据分析与机器学习在化工中应用。
孙怀宇(1972-),男,副教授,研究生导师,研究方向:化工产品过程工程技术。
TQ015.9
A
1004-0935(2021)12-1900-04