曲禧龙 宋莹娇 魏衍行
摘要:为实现煤炭价格的合理预测,对选取的影响秦皇岛动力煤价格十大影响因素进行研究,借助主成因分析判定华南动力煤指导价格、火电比例、广州港进口动力煤价格和中国煤炭价格指数为影响秦皇岛动力煤5500k价格的核心影响因素。依托2019年7月至2020年6月核心影响因素的相关数据,借助平滑指数时间序列实现对核心影响因素未来十周的预测,利用神经网络建立价格预测模型,借助测试集对模型进行验证。在预测误差仅为1%的条件下,通过代入核心影响因素预测值,实现对秦皇岛动力煤5500k的价格预测。
关键词:神经网络;主成分分析法;平滑指数时间序列;价格综合预测模型
一、前言
作为电力、建材等国民经济基础行业的上游产业,煤炭资源状况及价格水平会对国民经济产生直接影响,对煤炭资源的进一步开采使用,促使其重要性日渐凸显。寻找煤炭价格的影响因素是为了对煤炭价格变动有一个更深入的了解,对我国煤炭价格进行有效预测则是为行业建设及相关部门科学决策提供有效依据。
张建英(2015)利用VAR模型得出影响煤炭价格的因素除自身价格变动外还有大宗商品价格、宏观经济景气指数及煤炭产量;王文,李国栋(2016)从微观、宏观、行业、国际市场四个层面分析煤炭价格的影响因素……本文以此为基础确定影响秦皇岛动力煤价格的十大基础影响因素面板数据,在要素筛选的基础上利用神经网络构建价格综合预测模型,实现对煤炭价格走势的理性判断。
二、要素选择
(一)确立基础因素
综合考量微观、宏观、行业、国际市场四层面,结合秦皇岛煤炭行业具体发展实况,确定华南动力煤指导价格、火电比例、煤炭进口量、全国煤炭产量、广州港进口动力煤价格、非制造业指数、制造业指数、钢材社会库存、中国煤炭价格指数、全国铁路煤炭发运量价格为影响秦皇岛动力煤5500大卡价格的十大基础因素。
(二)提取核心因素
為使价格预测结果更为精确,特对十大基础因素面板数据进行主成分分析,分析步骤如下:
1. 数据插值及0-1标准化
利用线性插值、临近点均值插值等插值方法弥补基础数据缺陷。
随后,对基础数据进行0-1标准化处理得到标准化阵X。
2. 主成分分析
主成分分析是一种降维统计方法,可提取足以反映整体信息的少数综合变量,基本步骤如下:
对标准化阵X求相关系数矩阵R.
解煤炭样本相关矩阵R的特征方程|R-λIP|=0,得10个特征值,确定主成分。
根据贡献率直方图及matlab运算,可知主成分1、2、3、4的贡献率之和为93.71695%,按照≥0.9确定m=4。随后对每个λj,j=1,2,…,m,解方程组Rb=λjb得单位特征向量b。
将标准化后的指标变量转换为主成分,Uij=zb,j=1,2,…,m。
其中,Up称为第P主成分。
U1=-0.33021x1-0.30904x2+0.39149x3+0.371224x4-0.45505x5+0.250967x6+0.253491x7-0.1523x8-0.39925x9-0.05231x10
U2=-0.32221x1-0.45548x2-0.44807x3-0.32368x4-0.10696x5-0.26258x6-0.17854x7+0.229384x8-0.29544x9-0.36159x10
U3=0.0471x1-0.06373x2-0.57584x3-0.03193x4-0.14729x5+0.128809x6-0.02267x7-0.60791x8-0.15157x9-0.479363x10
U4=-0.04899x1-0.20132x2-0.42522x3+0.502869x4-0.449567x5+0.239736x6+0.427067x7+0.271967x8+0.078635x9-0.03558x10
对4个主成分进行加权求和,得到最终评价值U,权数为每个主成分的方差贡献率。
U=
根据计算,可得出各影响因素对煤炭价格的影响能力得分,如表1:
以得分绝对值大于0.2,该因素对秦皇岛煤炭价格影响能力较强为标准,筛选华南动力煤指导价格、火电比例、广州港进口动力煤均价、中国煤炭价格指数为核心影响因素。
三、煤炭价格预测
神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,适合处理需同时考虑许多因素、模糊的信息处理问题。因此,本文选择利用神经网络对核心指标进行预测,并建立价格模型。为便利操作,GPSC以代替华南动力煤指导价格、TRP代替火电比例、GCAP代替广州港进口动力煤均价、CCPI代替中国煤炭价格指数,以QTCAP代表秦皇岛动力煤5500大卡均价。
(一)价格模型构建
利用R语言读取数据集,对数据进行归一化处理以降低误差,于原数据集中抽取3/4的数据作为训练集,1/4的数据作为测试集,运用neuralnet函数建立神经网络模型,并绘制出如下图像2,将测试集带入价格模型实现模型检测,绘制散点图3。
借助R语言计算绝对平均误差和绝对误差平均律:其中,s=s为绝对平均误差,r为真实值,p为预测值。
s1=其中,为绝对平均误差率,μ为测试集真实值平均值。最终求得,s=5.667,=1.02%,误差水平较低,模型预测能力良好。
(二)核心指标预测
在借助SPSS实现核心要素数据读取,利用平滑指数时间序列实现核心指标预测,指数平滑法进一步加强了对近期观察值与预测值的观察作用,使观察值能迅速反映市场实际变化。
本文使用SPSS中的平滑指数时间序列对核心影响因素未来十周的参数值进行预测,并绘制了相关图像:
预测结果如表2所示:
(三)煤炭价格预测
将核心因素预测值0-1标准化后,带入神经网络预测模型中,可实现价格预测。
煤炭价格预测结果如表3:
四、模型说明
(一)模型应用
本文模型主要是借助神经网络实现对煤炭价格的估计,神经网络突出的自学习、联想储存、高效寻求优化解的能力使其能轻松解决此类问题,解决此类问题的思路也能一定程度上运用至其它神经网络问题的思考,但其的预测结果会受到数据特征的影响。经过验证,此模型逻辑脉络清晰,可操作性强,强调近期市场的作用,预测秦皇岛动力煤5500大卡价格趋势完全可行,可用于煤炭价格及其相关的数据研究。
(二)突发因素
本模型以普通市场为基础,未考虑突发情况对价格的影响。在发生金融危机或经济环境变化时,此模型会失去一定的预测能力。
参考文献:
[1]张建英.我国煤炭价格影响因素的VAR模型分析[J].经济问题,2016(01):108-112.
[2]王文,李国栋.基于层次分析法的我国煤炭价格影响因素研究[J].经营与管理,2016(12):87-90.
[3](美)朱塞佩·查博罗(Giuseppe Ciaburro),巴拉伊·温卡特斯瓦兰(Balaji Ven-kateswaran).神经网络:R语言实现[M].李洪成,译.北京:机械工业出版社,2018.
[4]张智勇,李宏军,杨鹏,李冬武.动力煤期货价格预测模型[J].中国煤炭,2014,40(06):9-12+17.
(作者单位:曲禧龙,山东理工大学数学与统计学院;宋莹娇,山东理工大学经济学院;魏衍行,山东理工大学交通与车辆工程学院)