林炜国 (大庆油田有限责任公司中油电能基建管理中心)
随着我国国民经济的发展,原油、成品油管道的建设迎来了高峰期。我国原油具有高含蜡、高黏度、高凝点的物性,直接进行管输其水力摩阻非常大,因此采用加压、加热的输送方式,其目的是提高原油温度、降低黏度,克服流动过程中的高程损失和沿程摩阻[1-2]。我国每年输油管道电耗约占总运行成本的1/2 以上,因此运行电耗的管理水平直接关系管道的经济效益[3]。
目前,有关管道能耗的预测方法有工艺计算法和统计预测法[4-6],前者多通过现场监测数据,利用Pipesim、OLGA、SPS 等商业模拟软件,实现电耗的核算,但管道电耗受多种因素影响,针对现有的自动化水平,很多参数的选取并不科学;后者通过收集和挖掘管道多年的历史数据,在近似模型的基础上实现电耗预测,但对样本质量要求较高,当样本数量较少时容易出现过拟合。此外,每条输油管道的运行状况不同,受地势起伏、站间距离、站内工艺和管理水平的影响,不同因素影响管道电耗的程度也有所不同,故还需对输入变量实施特征选择,以反映变量间的非线性关系[7]。基于此,以某油田两条输油管道为例,在收集原始数据的基础上,根据水力学原理对变量进行扩充,结合K近邻互信息估计和支持向量机(SVM)实现小样本信息的回归预测。研究结果可为原油生产和节能开泵方案的制定提供理论依据。
数据来源于某油田两条输油管道,管道A 投产于2014 年,管径为323.9 mm×7.1 mm,长度为21.66 km,设计输量为330×104t/a,实际输量为215×104t/a; 管道B 投产于2012 年, 管径为219 mm×6 mm,长度为11.55 km,设计输量为72×104t/a,实际输量为43.9×104t/a。因老油田原油产量降低,现两条管道的负荷率均不足70%。
每条管道的运行报表共有125 组数据,包括管道运行、油品物性、站场特性和环境特性等方面的信息,管道特征信息见表1。根据达西公式,水力摩阻系数与雷诺数Re和管壁相对当量粗糙度ε 有关,不同流态区对应的Re有所不同。根据苏霍夫公式,总传热系数K和参数a与管道沿线的热损失相关,摩阻损失与热损失之间是相互关联的,一般油温越高,黏度越低,摩阻损失越小,动能损失和电能消耗越小,而热能消耗就大[8-9]。最终,共得到29 个输入特征,按照4∶1 的比例抽取训练集和测试集,采用分层抽样替代简单的随机抽样,避免抽样误差和样本不均衡的现象。计算公式为:
表1 管道特征信息Tab.1 Pipeline characteristic information
式中:Re为雷诺数;ρ为油品密度,kg/m3;v为流速,m/s;d为管道内径,m;μ为动力黏度,Pa·s;K为总传热系数,W/(m2·℃);G为油品质量流量,kg/s;c为油品比热容,J/(kg·℃);D为管道外径,m;L为热油管道输送距离,m;TR、TZ分别为出站温度和进站温度,℃;T0为地温,℃。
对于上述筛选的29 个特征,不同特征间具有明显的非线性特征,如日输量增加,会增大泵输出功率,导致出站压力和下站进压增大,泵机组供能偏大;进出站温度变化会影响油品的黏度和密度,进而影响水力摩阻系数和日耗电。考虑到皮尔逊相关系数需满足数据正态性和线性相关的条件,故在此采用K近邻互信息估计对变量进行特征选择。
设数据集为D={X1,X2,X3,…X29} ,每个特征下的数据量为Xi={xi1,xi2,xi3,…xi125} ,管道日耗电定为Y,将特征Xi和Y组成一个向量空间,此时Zij为特征Xi和Y之间的点,通过X和Y方向上的最大欧式距离作为最近邻的标准,某点Z与其他点Z′的距离为:
在定义了K值后,将Zij到最近K个邻居的距离记为ε(i,j) ,投影到X和Y方向上,统计出距离小于ε(i,j)的点个数,分别记为nX和nY,随后利用下式得到特征Xi和Y的互信息值:
式中:N为随机点的个数;ψ为伽马函数。互信息值越大,特征间的相关性就越强。
由此计算不同K值下的互信息值,见表2。虽然K值差异带来了分类结果和泛化性能的不一致,但两条管道在前6 个特征的排名基本固定,依次为日输量、雷诺数、进出站压差、出站压力、进站压力、进出站温差等。以A 管道为例,对比不同特征与日耗电之间的关系,绘制散点图见图1。
图1 不同特征与日耗电的散点图Fig.1 Scatter plot of different characteristics and daily power consumption
表2 不同K 值下的互信息值Tab.2 Mutual information values under different K values
日输量的变化会影响泵的扬程和效率,进而影响管道日耗电,现场人员通常根据日耗电制定月度和季度输送计划,从而获知油品输量。日耗电与衡量流动状态的雷诺数相关性较强,而与衡量传热能力的总传热系数、参数a值的相关性较小,说明决定管道电耗水平的主控因素是原油流动状态。根据达西公式,雷诺数与水力摩阻系数呈负相关,而水力摩阻系数与日耗电呈负相关,故雷诺数与日耗电呈正相关,两者均受介质流速的影响。进出站压差的重要性强于出站压力和进站压力,说明离心泵提供的压能越大,日耗电越多,单一参数具有随机性,相关性较弱。进出站温差只与加热炉的热效率、节流损失率、过量空气系数和排烟温度等有关,其最高加热温度不能超过原油初馏点,且管输过程中油品物性变化很小,不能决定管道运行电耗[10-12]。此外,油品物性和环境特性与日耗电的相关性均较弱,这是由于日耗电通过日报表数据统计,可以反映当日特征波动的信息有限,且温度特征不能直接反映管道电耗水平。
综上,K近邻互信息估计不仅可以实现特征选择和数据降维,还能通过特征间的变化反映运行电耗变化情况。
SVM 模型通过非线性映射将所有数据转化至高维空间,在有限的数据样本中寻找输入变量和输出变量之间的交叉复杂关系,以获得最好的预测精度。回归公式为:
式中:Y为样本预测值;αi、为拉格朗日乘子;K为核函数;m,mi分别为样本的输入变量和第i个输入变量;b为偏置。
针对两条输油管道建立8 个预测模型,将表2中与日耗电相关性较强的特征依次递增作为SVM 的输入变量,将日耗电作为输出变量,形成1#~6#模型;将未进行特征选择的29 个原始特征作为SVM的输入变量,形成7#模型;将通过皮尔逊相关系数进行特征选择的前7 个特征作为SVM 的输入变量,形成8#模型。通过网格搜索和穷举法确认SVM 模型中的惩罚参数和不敏感损失参数,隐含层固定为1层,节点数固定为3。不同模型的输入特征子集见表3,不同模型的预测误差见表4。
表3 不同模型的输入特征子集Tab.3 Input feature subsets of different models
表4 不同模型的预测误差Tab.4 Prediction errors of different models
采用平均绝对百分比误差(MAPE)、均方根误差(RMSE)和决定系数(R2)来衡量模型的精度和泛化能力。其中,1#模型的预测效果较差,虽然从散点图中可知日输量与日耗电的相关性较大,但单一特征并不能完全反映日耗电变化的非平稳特性,这也说明了输油管道电耗影响因素的复杂性。从1#~8#模型预测结果可知:平均绝对百误差和均方根误差数值先降低后升高,预测准确度先升高后降低,管道A 和管道B 分别在输入特征数5 和4 时的预测效果最好,这说明了不同输油管道的运行状态不一致,特征变量的选取上有差异,同时后加入的特征与电耗的相关性较弱,导致干扰信息对结果的影响逐渐减少。7#模型将所有的特征作为输入变量,其预测效果甚至劣于只考虑单一“日输量”特征时的预测效果,进一步说明了特征选择和聚合的重要性。对比8#模型与其余模型可知,皮尔逊相关系数的特征筛选结果并不可靠,该相关系数更适合做线性相关的数据分析,且筛选结果中包含了多种热力学参数,温度变化对日耗电的影响有限。
不同模型的相对误差箱线图见图2,该图可反映不同模型误差的分布情况。从图2 可以看出,管道A 和管道B 分布在5#模型和4#模型上的相对误差范围最小,模型的泛化能力最强。
图2 不同模型的相对误差箱线图Fig.2 Box plots of relative errors of different models
利用上述电耗预测方法,在管道月运行电耗预测的基础上,对管道首站的开泵方案(主要为调转速和叶轮切割)进行调整。以管道A 为例,首站共有DY25-30×4 型离心泵4 台,DYT30-50×6 型离心泵3 台,常规方案是将流量区间分为4 个,随着管输流量的增加,逐级启动泵;对启停泵+调速+改变叶轮直径的方案进行能耗优化。虽然流量区间未发生改变,但受变频调速和叶轮直径的影响,各泵流量均在性能曲线的范围内变化,分配流量随输量的变化也在不断变化,启停泵的台数和方案越来越多,DY25-30×4 型离心泵虽然扬程和功率较小,但该泵的利用率较高,首站的设备负荷率有所提升。以管道A 在4 800~5 000 t/d 的流量区间为例,虽然优化后开泵数、开泵型号和叶轮直径没有改变,但转速升高可提高泵的功率区间和可输送流量区间,进而提高泵的能量利用率,降低电耗;以管道B 在1 000~1 400 t/d 的流量区间为例,虽然优化后开泵数、开泵型号和转速没有改变,但叶轮直径增大可提高泵功率,同时对扬程的影响不大,可综合提高泵效。依次类推,两条管道的开泵方案优化效果对比见表5。管道A 每月可节约电耗0.26×104~0.67×104kWh,管道B 每月可节约电耗0.14×104kWh。今后可在该文模型的基础上对管道运行电耗进行预测,优先替换淘汰型电动机(见工信部关于[高耗能落后机电设备(产品)淘汰目录(第三批)]中所列设备),对于不符合GB18613—2020《电动机能效限定值及能效等级》标准中能效限定值要求,建议更换电动机;同时对比可实施的开泵方案,尽量将泵的流量和扬程控制在铭牌标注的范围内,调整转速和叶轮直径,保证泵机组在最高效率点运转,获得最大的节能效果。
表5 开泵方案优化效果对比Tab.5 Comparison of optimization results of opening pump schemes
1)通过整理和收集管道运行、油品物性、站场特性、环境特性等方面的信息,结合水力学原理对变量进行扩充,共得到29 个与管道电耗相关的特征,包括雷诺数、总传热系数和参数a等变量。
2)通过互信息值分析,得到日输量、进出站压差、雷诺数等因素对电耗的影响较大,其中日输量、雷诺数、进出站压差、出站压力、进出站温差与电耗呈正相关,进站压力与电耗呈负相关。
3) 采用SVM 模型对管道日耗电进行长期预测,预测结果的相对误差范围最小,模型的泛化能力较强,可结合预测结果制定现场计划耗电量,完成对开泵数、转速及叶轮直径等参数的优化,节电效果显著。