基于ARIMA模型的山东气煤价格研究

2021-03-11 06:44张开幸李子辰
中国煤炭 2021年2期
关键词:阶数残差差分

许 佳,张开幸,李子辰,张 园

(兖州煤业股份有限公司营销中心,山东省邹城市,273500)

山东省是煤炭生产和消费大省,煤炭资源分布广,据公开资料显示,山东省已探明煤炭储量中,烟煤占比超过80%,其中又以气煤、肥煤为主[1]。准确把握山东气煤价格的变动规律,可以为相关政府部门及省内煤炭生产和经营企业提供决策依据。

就现有的煤炭价格预测模型而言,国内针对煤炭价格进行预测的研究日益增多,归纳起来主要有两大类,分别是影响因素分析法和技术分析法。影响因素分析法是建立基于供求框架的数学模型,通过分析供给与需求的变动来预测价格[2-3],但随着市场信息的发展,为了在理论构造和解释精度上趋于完善,模式往往很复杂,同时由于市场的不完全性,往往无法有效分离不同时间段内对价格产生影响的具体因素,也不能确定各类因素对价格变化的作用。技术分析法是利用煤炭价格的历史数据进行趋势分析来预测市场价格的变化方向,其中应用最广泛的是时间序列分析[4-5]。技术分析法对市场短期变化反应快,在宏观经济较为稳定的环境中,短期预测精度较高,虽然无法估计政策及市场突然因素的影响,但这些因素发生频率低,笔者认为使用时间序列分析把握煤炭价格规律具有很好的适用性和可靠性。

数据集上,笔者选取了2015年1月-2020年8月的山东省气煤价格,见图1,数据来源为CCTD中国煤炭市场网煤炭数据库。考虑到此类价格往往是非平稳的,因此选择ARIMA模型进行建模。

图1 2015-2020年山东气煤价格

1 差分自回归模型

自回归滑动平均模型(ARMA),可以表述为式(1),简记为ARMA(p,q)模型。

(1)

式中:Yt——需要预测的本期值;

Yt-1到Yt-p——往期观测值;

et到et-p——一组独立同分布的随机变量序列;

t——观测序列的一系列时刻;

p——自回归项的阶数;

q——移动平均项的阶数;

φ1到φp——自回归项的待估参数;

θ1到θq——移动平均项的待估参数。

如果一个时间序列{Yt}的d次差分是平稳的ARMA过程,则称{Yt}是ARIMA(p,d,q)过程[6]。

2 山东气煤价格的ARIMA模型确立

笔者使用2015-2019年山东省气煤周度价格为训练数据集构建模型,模型的建立与预测都在Python中完成。

2.1 数据平稳性处理

由于煤炭价格具有一定的周期性和季节性,同时对山东气煤价格序列的单位根分析也表明其不是平稳的。为获得平稳序列,笔者对原始序列进行差分处理,一阶差分序列见图2,二阶差分序列见图3。可以看到,一阶差分序列已经接近平稳序列,为避免过度差分,在后面的过程中选择一阶差分序列进行建模。

2.2 模型定阶

一般地,我们可以通过观察自相关函数ACF和偏自相关函数PACF观察其拖尾和截尾特征来确定p和q的阶数,但通过拖尾和截尾对模型进行定阶的方法往往具有很强的主观性。对混合时间序列而言,采用最小BIC信息准则来定阶更合适,结果见表1。从分析结果看(AR(3),MA(1))的BIC信息准则最小,因此可以认为阶数p=3,q=1的模型是最好的,后面的章节采用ARIMA(3,1,1)模型对山东气煤价格进行模拟。

图2 山东气煤价格的一阶差分序列

图3 山东气煤价格的二阶差分序列

2.3 模型参数估计

表1 山东气煤价格的BIC信息准则分析结果

在定阶确定模型架构后,下一步需要对模型进行参数估计,结果如表2所示。模型的AR和MA项系数的P值均小于0.05,模型参数估计结果显著。

2.4 模型的残差检验

表2 模型参数估计结果

为了评价模型的效果及准确性,还需要判断模型残差是否存在明显的自相关。模型的残差序列见图4,可以看出其残差序列在0附近上下波动。

然后基于模型残差的自相关函数ACF和偏自相关函数PACF进行残差分析,见图5。可以看出ACF和PACF都在置信区间内,说明残差具有随机性。可以接受残差无自相关的原假设,ARIMA(3,1,1)模型通过检验。

图4 ARIMA(3,1,1)模型的残差序列

图5 残差的自相关函数和偏自相关函数

3 ARIMA模型在山东气煤价格预测中的应用

为了检验模型在样本外的预测效果,笔者使用前面建立的模型对2020年山东气煤价格进行预测,并与实际结果进行比较,见图6。整体上,预测价格与山东气煤实际价格走势保持一致,但整体上预测值偏高,1月份受春节因素影响预测误差偏大,这也是特殊因素对时间序列模型预测带来的干扰。在实际运用中,考虑到时间序列模型预测的时效性,应以最近日期数据为预测起点,减少预测偏差。

图6 2020年1-8月山东气煤价格与模型预测价格比较

4 结语

笔者根据山东气煤价格的历史数据,经过平稳性检验、差分处理后,采用最小BIC信息准则,选择了ARIMA(3,1,1)模型对价格进行预测。结果表明,ARIMA(3,1,1)模型的预测结果是有效的,且中短期来看预测精度也达到较高水准,其结果对山东气煤市场参与者把握市场形势有一定借鉴意义。在稳定的市场环境中,ARIMA模型能够取得较好的预测效果。然而煤炭市场在特殊阶段受极个别或突发因素影响较大,会降低预测模型的有效性和稳定性。

猜你喜欢
阶数残差差分
RLW-KdV方程的紧致有限差分格式
基于双向GRU与残差拟合的车辆跟驰建模
数列与差分
确定有限级数解的阶数上界的一种n阶展开方法
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
复变函数中孤立奇点的判别
平稳自相关过程的残差累积和控制图
基于差分隐私的大数据隐私保护
一种新的多址信道有效阶数估计算法*