基于多元逐步回归的煤炭价格预测研究

2020-11-16 06:06周紫祥孙英楠
科学与财富 2020年26期

周紫祥 孙英楠

摘要:本文主要针对煤炭价格的主要因素综合预测的研究,利用spss对煤炭价格相关数据的平稳性检验等处理分析,建立了基于定性和定量相结合研究的多元线性逐步回归模型、基于BP神经网络的煤炭价格预测模型以及采用AMRA时间序列的干预分析综合预测模型,从而为我国煤炭市场的平稳发展提供了较为合理的指导建议。首先我们根据有关文献的查阅,通过定性与定量相结合的方式,并对其进行相关性分析以验证合理性,进而建立初始回归模型。其次查找候选变量的相关数据,为避免伪回归,我们采用ADF检验法对数据进行平稳性检验及差分处理。最后我们运用spss进行向后淘汰逐步回归来筛选出主要因素,并对相关参数进行检验以验证模型的可行性,进而我们确定了影响煤炭价格的5 个主要因素:煤炭生产量、下游行业的煤炭需求量、煤炭进口量、煤炭出口量以及国际石油价格。

关键词:多元逐步回归;定性与定量;ADF

引言

随着的工业化和城镇化快速发展,煤炭价格是煤炭市场上的重要指标,不仅可以直接反映煤炭市场的供需状况,也间接作用着资源配置,影响着人们的生产和生活。所以,在我国的供给侧改革和促进产业结构升级的重要时期,研究煤炭价格的各个影响因素就显得尤为重要。同时,煤炭价格受到产能问题,供需关系,能源的革命性政策,气候变化、市场结构等多方面因素的影响,具有一定的波动性。因此,在变幻莫测的环境中,分析中国煤炭价格的影响因素,把握煤炭行业的发展方向,预测未来煤炭的价格来调整企业结构,明确我国煤炭行业优势及短处,对当前中国的煤炭革命战略顺利实施和市场经济的平稳运行更为重要。

1、问题分析

收集国内外煤炭产品以及秦皇岛当地煤炭产业的相关数据,建立数学模型量化分析影响煤炭的价格的主要因素,并在此基础上以秦皇岛的动力煤价格为例,比较各因素的影响大小。得到的各主要因素与煤炭价格的映射关系,并对各个因素进行预测,将预测数据带入建立的煤炭价格预测模型,得到未来31日、35周以及36月的煤炭价格。综合考虑未来的突发状况对于煤炭价格的影响因素的作用,进而作用于煤炭价格。这需要我们思考可以会产生哪些情况,对自变量如何影响,如何量化影响,从而建立煤炭价格的综合预测模型,以实现更有效的预测。针对未来的突发状况带来的影响,提供有效的建议,以便政府部门进行决策。

2、模型的建立

我们建立模型来量化分析影响煤炭价格的主要因素,并在此基础上针对实例比較因素的影响大小。中国煤炭价格是多种因素共同作用的结果,我们希望从中挑选出影响显著的自变量,这就涉及到变量选择的问题,于是我们想到利用多元逐步回归分析法。查找候选变量的相关数据,为避免伪回归,我们先对数据进行平稳性检验和差分处理。然后,我们运用spss进行逐步回归来筛选出显著因素,通过对结果进行检验与分析比较,我们发现向后淘汰回归分析法结果更合理,煤炭价格主要受市场条件下供求关系的影响,此处,我们不考虑特异性冲击如国家政策的强制干预等因素的影响。根据题目提示及有关文献[6]的综合分析,结合经济理论,我们初步确定的煤炭价格影响因素及其可视化替代变量如图。我们通过中国煤炭市场网和国家统计局等相关网站,查找有关定性分析出的影响因素的数据,考虑到煤炭价格的众多影响因素之间关系复杂,单一的时间序列分析法难以更好地处理各个变量之间的非线性特征[11],所以我们建立BP神经网络模型来对煤炭价格进行非线性研究,从而提高所建立的模型的预测精度,为企业的生产经营提供科学有效的参考依据。

3、模型的求解

在利用已知的煤炭价格数据构建模型之前,我们需要对煤炭价格及其重要影响因素的数据用MATLAB进行标准化处理,以降低数据不同量纲之间影响。然后进行模型的建立。根据煤炭价格的影响因素,我们将问题一得到五个重要影响因素作为输入向量,以煤炭预测价格作为输出向量,得到输入层单元数为5,输出层单元数为1.相关研究表明,在隐节点足够多的条件下,一个隐层的神经网络足以以任意精度逼近一个非线性函数。所以我们采用的是含有一个隐层的三层BP神经网络。同时,隐层神经元的数目也同为重要。隐层神经元数目过多会导致学习时间过长,且易形成过度拟合;隐层神经元数目过少会降低学习能力,达不到预期的效果。所以参照经验公式[12]估计隐层神经元数目。

其中m为输入层单元数,n为输出层单元数,l为隐层神经元数目。我们选取了双曲型函数和对数S型函数分别作为隐含层和输出层的传递函数,以便更好地为神经元网络定义一个倍数放大的线性结构。神经网络的训练函数为trainscg函数,具有时间较短、学习速度较快,适合大型学习网络的特点。我们建立的BP神经元网络为:输入层单元数为5;隐含层单元数为10;输出层单元数为1;隐含层传递函数为双曲型函数;输出层的传递函数为对数S型函数;网络训练函数为trainscg函数;训练的最大迭代次数为2600;设置的学习率为0.25;目标误差为e-4。我们对各个影响因素进行预测,考虑到各影响因素的时序性,我们建立了ARMA时间序列模型,来探究各个影响因素与时间的关系,从而达到预测效果。

结论

面对今年疫情所导致的煤炭企业的不平衡发展和共需关系严重失调的局势。政府应该调整供给方的结构来应对产能过剩的问题,有效得抑制煤价上涨。一方面,疫情导致的国民对煤炭的需求不足;另一方面,供给方的供给侧结构性改革使得共需矛盾突出。就目前的形势,五月煤炭供应十分充足,库存过剩,经济受疫情影响未恢复正常。国家管控实行“三去一降一补”的政策,应加强对煤炭产量的的有效调控,注重煤炭开采的质量而非数量,合理得淘汰清退落后产能,从而控制价格的波动,保证煤炭产业的平稳发展。到目前为止,煤炭贸易正在逐渐有效的恢复中,我国国内疫情稳定后,煤炭的出口量明显增加,虽然没有能回到正常水平。

参考文献:

[1]   雷强,国内外煤炭价格的非线性特征研究,[J],资源科学,2013(10):1968-1976

[2]   高大启,有教师的线性基本函数前向三层神经网络结构研究,[J],计算机学报,1998,21(1):80-85

[3]   许晴,秦皇岛煤炭价格预测研究,[J]价格理论与实践,2,2014

[4]   江显群,陈武奋,逐步回归分析与时间序列模型在大坝变形预测中的应用,[J]排灌机械工程学报,2019.10.16