何文琪
[摘 要] 煤炭是国民经济发展的基础,对煤炭价格进行预测将有利于企业对将来的发展做出判断,同时有利于国家做出调控。文章使用Eviews软件对2006-2020年每周的煤炭价格使用ARIMA(3,1,0)模型进行时间序列预测。为综合考虑其他因素如原煤产量、原油进口量等对煤炭价格的影响,使用线性回归模型进行拟合,再使用预测误差平方和倒数法得到组合模型。最终的预测结果误差为0.977%,预测效果较好,可为煤炭市场的经营和管理提供一定的理论依据。
[关键词] 煤炭价格;预测;ARIMA;线性回归
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2021. 01. 077
[中图分类号] F713.54 [文献标识码] A [文章编号] 1673 - 0194(2021)01- 0187- 02
0 引 言
煤炭一直是我国重要的能源,其消费量占比相比于石油和天然气长期处于领先地位。煤炭的市场价格不仅反映了煤炭市场的状况,也体现了我国的经济发展状况。对煤炭价格进行精准预测能够帮助企业预估成本,做出决策,同时也为煤炭市场的平稳发展奠定了基础。
1 研究现状
目前国内已有许多学者对煤炭价格的预测做出了研究。向超[1]对煤炭价格进行了ARIMA和SVR组合模型的预测,并比较各组合模型预测的精度,得到变权组合模型由于等权组合模型和单预测模型的结论。孙福玉[2]对影响煤炭价格的因素使用层次分析法进行排序,并使用季节时间序列预测模型结合干预分析对煤炭价格进行综合预测。宁晖[3]对从研究煤炭价格序列自身变化规律的角度,提出基于滚动时间窗的预测模型,将此模型应用于秦皇岛港5 500 kcal混煤价格的预测,分别得到1期、3期、6期、9期及12期的价格预测,达到预测结果的平均误差值不超过3%的良好效果。金林 等[4]综合考慮宏观经济、能源价格、气候环境和国际市场四方面因素,对市场中的煤炭交易价格建立指标体系,之后对广州煤炭交易市场价格使用BP神经网络进行预测。
2 ARIMA模型预测
2.1 ARIMA模型
时间序列预测是指用历史已有的数据对未来进行预测,ARIMA模型是一种著名的时间序列预测方法。ARIMA模型是差分整合移动平均自回归模型(Autoregressive Integrated Moving Average Model)的简称,目前在卫生、能源和经济等领域的短期预测中有较常运用。
ARIMA模型是自回归模型AR模型和移动平均模型MA模型的整合模型。ARIMA模型的一般形式如下:
yt=β0 +β1yt-1+…+βpyt-p+εt+θ1εt-1+…+θpεt-p
其中,{yt}为需进行预测的时间序列,β和θ为待估参数,p为自回归阶数,q为滑动平均阶数,{εt}为白噪声序列。
在实际应用中,需先判定时间序列是否平稳,若时间序列为非平稳序列,需进行差分处理。经过d阶差分处理后的平稳时间序列即可使用自回归积分滑动平均时间序列,即ARIMA(p,d,q)进行预测。
2.2 评价指标
为测量最终的预测结果,本文使用MAPE(平均绝对百分误差)指标进行衡量。MAPE考虑了预测值与真实值的误差相比于真实值的比例,可以很好地体现预测结果的优劣。
2.3 数据说明
煤炭的种类有很多,本文选取秦皇岛动力煤作为预测对象,以其平仓价的数据为样本。由于本文采用ARIMA模型进行预测,因此考虑选择2006年7月到2020年4月每周的平均价格进行拟合。共收集到671个样本数据,选取后17个为训练样本即2020年1月至4月的数据,数据均来源于中国煤炭市场网。
2.4 煤炭价格预测
基于ARIMA模型的预测步骤,将数据导入Eviews中并绘制周度平均价格时间序列图和自相关图和偏自相关图,可以看出近几年煤炭价格呈先涨再跌再涨的趋势,初步判定此时间序列为非平稳序列。
为了更加准确的判断此时间序列的平稳性,对其进行ADF检验,得到原假设为序列存在单位根,在1%、5%和10%的显著性水平下,ADF test result值为-2.214 034,大于其临界值-3.441 695、-2.866 437、-2.569 437,单根的t检验统计量值为0.201 6,大于0.05,说明接受原假设,即原序列是非平稳的序列,需要对序列进行差分处理。对时间序列进行一阶差分后,再次进行ADF检验,得到ADF test result值为-7.740 856,小于其临界值-3.991 656、-3.426 191、-3.136 301,单根的t检验统计量值小于0.05,说明经过一阶差分后的序列是平稳序列。确定拟合模型为ARIMA(3,1,0)。
通过此模型计算以往数据的预测值,并与真实值进行对比,进行模型检验,得到图1,可以看出该模型预测效果较好,计算得该模型平均绝对百分比误差值为1.01%,可以接受。
3 线性回归模型
基于实际情况和相关文献阅读,煤炭价格主要受原煤产量、原煤进口量、原油进口量、原油价格、天然气进口量和GDP六个因素的影响,由国家统计局和美国能源信息署收集相关数据。为方便预测,对所有数据使用Eviews进行转频处理,使其单位为周。之后使用Eviews对样本数据进行拟合,计算得MAPE值为2.43%,拟合结果可以接受。
4 组合模型预测
为提高预测精度,并考虑其他因素对煤炭价格的影响,采用预测误差平方和倒数法进行模型组合。各模型预测精度不同,若该模型预测误差平方和较大,说明该模型预测精度较差,应降低权重。
其中Wi为各模型的权重,E-1为各模型的预测误差平方和倒数。
经计算,ARIMA模型的权重为0.935,线性规划模型的权重为0.065,扩充ARIMA模型和线性回归模型的样本区间至2020年1月至4月,得到最终预测结果,如表1所示。
5 结 论
本文通过ARIMA模型对2020年1月至4月的煤炭价格进行了预测。首先将样本序列进行差分处理,使其平稳化,之后使用ARIMA(3,1,0)模型对样本数据进行预测,经检验该模型的平均绝对百分误差为1.01%,预测效果较好,并使用该模型对训练样本进行预测。为综合考虑其他因素对煤炭价格的影响,使用预测误差平方和倒数法将线性回归模型与ARIMA模型组合,得到最终预测结果。
主要参考文献
[1]向超.基于ARIMA-SVR组合模型的动力煤价格预测与实证研究[D].北京:对外经济贸易大学,2019.
[2]孙福玉.基于AHP-SARIMA的煤炭价格预测研究[J].现代经济信息,2020(7):175-176.
[3]宁晖,周文文.基于滚动时间窗的ε-SVR煤炭价格预测模型研究[J].煤炭经济研究,2020,40(3):12-18.
[4]金林,马忠芸,王红红.基于灰色BP神经网络碳排放交易价格预测[J].河北环境工程学院学报,2020,30(1):27-32,41.