王若琳
(中石化(大连)石油化工研究院有限公司,辽宁大连 116045)
成品油二次物流是指油品从油库到加油站的运输组织过程,是成品油物流过程中的重要一环。实现加油站未来销量的准确预测,可以有效提高二次物流的运输调度精确性,帮助企业实现库存管理与配送计划编制,提升运行效率。然而,加油站的销量受多种因素影响,销量数值波动性较强且无显著规律。因此,实现加油站销量的准确预测有一定的难度。
由于销量预测任务的数据通常为时间序列形式,因此当前大多使用时间序列模型,主要方法包括线性回归、指数平滑[1]、整合移动平均自回归模型[2]、机器学习[3-5]、深度学习等。支持向量机[6]、决策树、迭代算法[7]等模型同样可用于预测任务,但在处理时间序列数据时,由于时间序列特性引起的高维度,存在消耗资源大、效率低等问题。随着深度学习的不断发展,研究者提出了循环神经网络及其衍生方法:长短期记忆网络(LSTM)[8]和门控循环单元[9],2种衍生方法对于时间序列数据的处理和预测具有较好的效果[10-12]。部分学者将注意力机制[13-14]与深度网络结合,使网络更加关注重要的部分。然而,由于加油站销量的时间序列具有较强的非线性特征,现有的模型精度仍有待提升。
加油站销量受到多种因素的影响,存在较大的波动性。将加油站销量影响因素分为特殊日期因素和长短时因素两大类,通过对比不同加油站的实际销量数据,分析不同因素对加油站销量的影响程度。
加油站销量可能会受到某些特殊日期的影响,包括油价调整、节假日、特殊天气等。以某市一典型加油站全年真实数据为例进行分析。
1)油价调整
通过绘制加油站实际销量随时间的变化图(见图1),可以发现,当油价宣布即将上涨时,调价前的销量会有所上升,调价后的销量会有所下降;反之同理。销量的变化幅度与调价幅度有关。当油价调整幅度较大时,油品销量的变化也较为明显,反映出市场预期和价格信号机制在成品油市场发挥着一定作用。油价对销量的影响主要集中在油价调整日期的前后2 天内,影响的时间范围不会过长,反映出市场对价格的反应速度较快,成品油市场机制较为健全有效。
图1 油价对加油站销量的影响注:图中红点表示当日油价上调,绿点表示当日油价下调,单位为元/t
2)节假日
通过绘制加油站实际销量随时间的变化图,并在图中标出部分典型节假日节点(见图2),可以发现,节假日对于加油站销量的影响较为明显,表现为:节假日前1 ~2 天,加油站销量出现明显的上升,在节假日前1天或节假日当天达到峰值;节假日期间,销量呈现下降趋势;节假日后1 ~2天,销量逐渐上升至正常水平。其中,春节期间销量的激增与激降情况最为明显,反映出我国成品油消费体现着明显的节日效应。
图2 节假日对加油站销量的影响
3)特殊天气
通过绘制加油站实际销量随时间的变化图,并在图中标出特殊天气节点(见图3),可以发现,相较于其他因素,天气对加油站销量的影响较小。通过对数据的梳理,将天气情况分为3类。一是,晴、阴、多云、小雨、霾等一般天气:加油站销量基本不受天气影响,可以保持正常水平。二是,中雨、小雪、雨夹雪、中雪等恶劣天气:天气对加油站销量产生一定影响,部分加油站销量会出现小幅下降(但天气因素影响较小,遇国庆假期销量仍然上升)。三是,暴雨、大雨、大雪、暴雪等极端天气:天气对加油站销量会产生较为明显的影响,部分加油站销量会出现一定程度的下降,反映出成品油市场与不良天气因素的关联效应。
图3 天气对加油站销量的影响
加油站销量还可能与各类长短时因素有关,包括月份、星期、一天中的不同时间段等。选取某市A、B、C、D 4个典型加油站2022年真实销量数据进行分析。
1)月份
绘制2022 年4 个典型加油站月销量变化情况(见图4),可以看出,加油站销量与月份有一定的关联。1月和7月整体销量较高,2月和11月销量偏低。
图4 不同加油站月销量情况
2)星期
为消除季节等其他因素的影响,以周一为例,将全年所有周一的日销量求和作为当前的周一销量,并依此得到不同加油站一周7 天的销量变化情况(见图5),可以看出,不同加油站一周7 天的销量变化趋势相近,相对而言,周五的销量相对偏高,周末期间会有所下降。
图5 不同加油站一周销量变化情况
3)时间段
将2022年所有某时刻的销量求和作为该时刻总销量,绘制得到不同加油站一天24小时的销量变化情况(见图6),可以看出,加油站销量在凌晨期间普遍较低,早晚出行高峰期间会出现销量的急剧增加。
图6 不同加油站单日分时段销量变化情况
将LSTM 模型引入加油站销量预测问题,模型的输入变量为前1 天或多天的加油站销量分布情况,即24×n 个小时的销量数据;输出变量为后1 天或多天的加油站销量分布,即加油站未来逐小时的销量需求情况。为进一步提升模型预测准确性,在LSTM模型基础上引入关键因素特征,与历史销量数据一同输入模型进行训练,帮助模型更好地学习加油站销量的变化特点,丰富模型的可学习内容。
根据对销量影响因素的分析,利用特征数值量化的方法建立合理的关键因素特征,使模型输出的预测数据可以对相关因素作出有效反馈,提升模型的预测准确性。
2.2.1 特殊日期特征
特殊日期因素可以通过对历史销量数据的分析,获得较为明确的销量变化趋势,因此对其特征的量化公式设定为f=A×10n的形式。其中A用于调整特征值的幅度,n 用于调整特征值的数量级,以保证特征数值与训练数据中的加油站销量处于同一数量级;f为特殊日期因素的特征量化表示。
1)油价特征
根据国家油品调价政策得到调价日期及调价幅度,油价特征的量化采用分段函数的形式。以油价上调为例,对于调价当天,油价调整一般于当日24时进行,在油价上涨前2天,消费者会进行储油准备,销量有所上升,此时油价特征为正值(A=m>0),且上涨幅度越大,特征值A越大;对于调价前1天,调价对于隔天销量的影响减弱,此时为油价特征赋较小的正值(A=m/2);对于调价后1天,此时价格已经上涨,销量会有所下降,此时为油价特征赋负值(A=-m);对于调价后2天油价调整影响减弱,此时为油价特征赋绝对值较小的负值(A= -m/2)。
2)节假日特征
相较于普通节假日,春节期间销量的波动程度更大,因此,将普通节假日与春节进行区分,春节期间的特征幅度A大于普通节假日。
节假日开始的前1天以及结束的后1天,销量呈上升趋势,特征值为正值;节假日期间,销量下降,特征为负值。
3)天气特征
天气对销量影响较小,特征幅度A小于其他特征。一般天气时,A=0;恶劣天气时,A=-0.5;极端天气时,A=-1。
2.2.2 长短时因素特征
此类因素较难通过历史数据分析获得明确的销量变化趋势,因此其特征设定方式是将历史数据中,不同时间范围全年销量之和占全年总销量的比值作为特征值。即若为月份特征,则特征值为该月销量占全年总销量的比重;若为星期特征,则特征值为全年所有该星期日销量占全年总销量的比重;若为时间段特征,则特征值为全年所有天数该时刻的销量总和占全年总销量的比重。
选择2018年12月至2023年6月某市多个典型加油站的历史销量数据作为模型数据集。数据反映为加油站各个油罐逐小时的液位情况。对数据进行处理后,得到模型的可用数据,将其按照7∶3的比例划分为训练集和测试集,并选择均方误差作为损失函数。
将基础模型与引入特征后的模型预测效果对比可知,LSTM 基础模型的预测情况与真实值之间存在较大误差。以某典型加油站为例,基础LSTM的预测误差约为21.1%;引入长短时因素特征后模型预测情况有所提升,预测曲线更接近真实值,模型预测误差降低至18.3%,但对于特殊情况(节假日、油品调价)销量的突然变化,预测效果依然不理想;最后引入特殊日期特征,模型对于油价调整、节假日期间销量的急剧波动,均可以做出较为正确的预测,模型预测准确性明显提升,预测误差降低至13.6%(见图7)。
图7 引入特殊因素特征后的预测效果
将模型应用于不同加油站的不同油品,计算平均预测误差(见表1),可以看出,模型中引入影响因素特征对模型预测效果有较大提升;模型对于加油站的汽油销量预测结果平均误差小于15%,柴油预测结果平均误差小于18%,能够满足应用需求。模型具有较好的通用性和鲁棒性,在不同加油站中均有较好的预测表现。
表1 2 种模型对不同加油站汽、柴油的平均预测误差 %
通过将预测模型与市场销售特点相结合,引入销量影响因素特征,为加油站销量预测提供了方法和思路,为成品油二次物流的运输调度提供准确依据,便于工作人员实现加油站油品的主动配送及库存管理,具有一定的实际借鉴意义。