基于ARIMA模型的云南进口矿产质量问题预测研究

2020-05-07 05:39刘汗青
科技和产业 2020年4期
关键词:二阶差分矿产

窦 斌, 李 晶, 刘汗青

(1.昆明理工大学 管理与经济学院, 昆明 650093; 2.昆明海关技术中心, 昆明 650200)

矿产品是大宗资源性商品,也是高值产品,矿产资源不足一直是我国工业生产中不可回避的问题。由于我国人口基数庞大,所以在一定程度上导致了我国大宗或重要矿产资源的人均拥有量大幅低于世界人均水平。据统计,国内矿产资源供应能力的严重不足,使我国对外依存度超过50%的矿种超过10种,再加上我国一些重要矿产资源品质不佳,使得国内供应能力受市场影响较大。云南省作为进口矿产的重要关口,昆明海关承担着对进口矿产严格把关的重任。近年来,随着矿产进口量的增加,云南周边国家矿产质量问题也暴露了出来。同时,昆明海关各隶属海关对有毒有害元素的检测能力参差不齐,部分检测项目需要外送检验,加之偏远地区口岸基础设施建设滞后,制约了海关查验工作的开展和推进。在这种情况下,为了做好相应的预案或者准备措施、合理利用好资源配置、提高检验效率,减少因矿产质量问题而导致的损失,本文以2007至2018年云南省进口矿产品检验不合格数据作为依据,对未来云南进口矿产不合格的情况进行预测。分析预测结果,对昆明海关提出相关政策建议。

1 研究地区及研究方法

1.1 研究地区

昆明海关,下辖瑞丽海关、孟定海关、大理海关、西双版纳海关、河口海关、天保海关、昆明机场海关、畹町海关、芒市海关、腾冲海关等共计26个海关关口。大部分分布在云南省与老挝、越南、缅甸三个国家的交界处,是进口矿产检疫检验的一道有力的屏障。据统计,每年从云南各口岸进口到我国的矿产种类有十多种之多,包括精矿、原矿、毛料、稀土矿等多种矿产。2017年云南全年进口矿产量达到750万吨,因检验不合格遭退运的矿产量达到61万吨之多,由此可见,进口矿质量问题严峻。再加之国际形势、国家政策的导向,进口矿产质量必须严格把关,保证质量安全。

1.2 研究方法

本文在研究方法上选择的是ARIMA(Autoregressive Integrated Moving Average model)即差分整合移动平均自回归模型,进行预测时,所用序列必须是平稳的序列,如果是非平稳化的序列,就需将其转化为平稳化的序列[1]。这里使用差分的方法,对原始的时间序列进行n阶差分。差分过后,观察n阶差分的时序图,从图中观察其平稳性,也可以根据n阶差分序列的自相关图(ACF)和偏自相关图(PACF)来判断其平稳性[2-3]。其中,差分次数n就是ARIMA模型中的d。确定了d参数之后,再对原始序列建立ARIMA(p,d,q)模型,这里通常建立几种不同参数的模型,经过对比和比较,对拟合出来的图像进行分析,确定出最为合适的参数模型进行预测。模型特征表可以判断适用于ARIMA模型,模型特征表如表1所示。

表1 模型特征表

2 模型构建

2.1 数据处理

以云南省2007—2018年进口矿产质量检验不合格重量数据作为本次分析样本,2007—2016年每一个季度的检验不合格矿产重量作为一个样本点,用SPSS绘制出2007—2016年进口矿产质量检验不合格重量序列图如图1所示。

图1 2007—2016年不合格矿产重量序列

得到矿产量时间序列图之后,观察平稳性。2007—2011年检验不合格矿产量较少,且波动不大,较为平稳,这是因为2007—2011年期间云南省进口矿产总量较少,且持续稳定。2011年检验不合格矿产量有较大的波动,这是因为随着我国经济的发展,国内市场需求增加,而我国矿资源却相对匮乏,导致了国内企业对进口矿资源的依赖。并且我国对加工困难、耗能大的矿产的需求也越来越大,以铝土矿为例,我国一二级品位的(铝硅比分别大于12和9)的铝土矿比重不足20%。并且其熔出温度较高(一般达260度以上,有的达350度),而进口的铝土矿则品位相对较高,熔出温度仅有160~170度,这就决定了我国氧化铝工业具有加工难度大,污染重,耗电高的特点,因此从节约资源能源和保护环境的角度出发,我国也鼓励进口加工困难、耗能大、污染重的矿产。到了2012年,全球经济放缓,矿产运费升高,全球范围内出现矿产资源稀缺的情况,因此进口矿产的价格有所提升,这也导致了该年云南省进口矿产总量减少。2013年随着经济的恢复,中国进入高速发展时代,国内供给已经远远不能满足发展的需求,所以云南省进口矿产量创下新高。自2013年以后,随着“海上丝绸之路”的开辟,国内供应能力的提高,作为内陆省份的云南省在进口矿产量方面整体趋于下降趋势。

该序列2011、2013年波动较大,从图像中可以看出,该序列不是平稳序列。因此,需要对其进行相应的数据处理。

在确定该序列不是平稳序列之后,下面对其进行差法,首先进行一阶差分。用SPSS绘制出该时间序列一阶差分时序图,如图2所示。在图中,可以观察到该数据的一阶差分序列逐渐趋于0,说明该序列的一阶差分是平稳的,进而进行一阶差分的自相关(ACF)和偏自相关(PACF)验证,如图3、图4所示。

图2 检验不合格矿产重量一阶差分平稳化序列

图3 一阶差分自相关

图4 一阶差分偏自相关

该序列的一阶差分自相关为拖尾,而一阶差分偏自相关为截尾,根据模型选用表,要想使用ARIMA模型,其差分序列的自相关和偏自相关必须都是拖尾,故在一阶差分的前提下不能使用ARIMA模型,然后考虑对原始序列进行二阶差分,如图5所示。

图5 二阶差分序列

根据SPSS中的二阶差分时序图可以发现,矿产品重量的二阶差分序列是平稳的。进而进行二阶差分的自相关(ACF)和偏自相关(PACF)验证[4],如图6、图7所示。二阶差分后数据序列的自相关系数在显著性水平为5%的默认条件下趋于0,而二阶差分后的偏自相关系数也趋于0,均表现为拖尾现象。

图6 二阶差分自相关

图7 二阶差分的偏自相关

2.2 参数选择

在观察了二阶差分序列以后,下面进行二阶差分的自相关和偏自相关的检验,根据二阶差分序列的自相关图和偏自相关图均表现为拖尾现象以及模型特征表可以判断适用于ARIMA模型,且ARIMA模型参数d取值为2。

其中确定d为2,从偏自相关图中可见在5%的显著水平下,自相关呈现拖尾现象,取阶数为1,故判断q值取1,得到模型MA(1)。从偏自相关图中可看出在5%的显著水平下,偏自相关呈现拖尾现象,取阶数为1或4,故判断P值取1或4,得到AR(1)或AR(4)。

根据模型特征表确定选用合适的模型,利用SPSS建立ARIMA模型,经过前期的预测对比分析,并根据SPSS中输出的模型统计量表格中的BlC值可以确定最佳模型[5]。

一般来讲,选取BIC达到最小的模型为最佳模型。经过前期数据处理与分析,模型可初定为ARIMA (1,2,1)、ARIMA(1,2,4)两种。用SPSS软件作拟合图比较两种模型拟合,检验选择模型的准确性。根据BIC定阶准则选出最优模型。两种模型的参数对比如表2、表3所示。

用SPSS软件作拟合图比较两种模型拟合(如图8 a-b),检验选择模型的准确性。ARIMA(1,2,1)模型中与实际情况贴合度比较高,而ARIMA(1,2,4)模型中在2013、2015年有些许波动,偏离了实际情况,综合对比,ARIMA(1,2,1)相对而言比较准确。所以可以使用该模型进行后面年限的预测。

BIC值表示的是模型对数据的解释度,BIC值越小,该模型对数据解释力越强。因此BIC越小,越能用该模型解释数据。对比两个模型的BIC值,可知模型ARIMA(1,2,1)BIC值最小,其值为35.951。因此,在参数的选择上,使用ARIMA(1,2,1)模型。

表2 ARIMA(1,2,1) 模型参数

表3 ARIMA(1,2,4) 模型参数

图8 ARIMA模型

表4 两种模型BIC比较

从图像中分析,ARIMA(1,2,1)的拟合值和实测值较为接近,其拟合的趋势与观实测值的走势基本一致,而ARIMA(1,2,4)模型的拟合趋势偏离了实测值的走势,所以ARIMA(1,2,1)的拟合效果最好。同时,ARIMA(1,2,1)模型的BIC值最小,因此可选取此模型作为最后的预测模型。下面对残差序列进行白噪声检验,根据SPSS中输出的模型统计量表来看,ARIMA(1,2,1)模型的LjungBox统计量Q=10.161。p值为0.681显著大于0.05的检验水平,即接受Ljung-Box的原假设:所有数据之间相互独立,可认为残差序列为白噪声序列[6]。(得到白噪声序列,就说明时间序列中有用的信息已经被提取完毕了,剩下的全是随机扰动,是无法预测和使用的,残差序列如果通过了白噪声检验,则建模就可以终止了,因为没有信息可以继续提取)。模型残差序列的自相关系数与偏自相关系数的分布在以0为中心的范围内,并且自相关系数与偏自相关系数的绝对值均小于0.3(如图9),认为此残差序列之间是相互独立的,意味着残差序列是白噪声的。模型涵盖了所有的信息,说明此模型效果较好[7]。

图9 残差ACF和残差PACF

3 预测结果与分析

本次模型选择了ARIMA(1,2,1),根据云南进口矿产2007年第三季度到2016年第四季度检验不合格矿产量的数据,对该地区2017年第一季度到2018年第二季度的检验不合格矿产重量进行预测并做出拟合图,之后将预测值与实际值进行比对,进而判断该模型的准确性[8],如表5、图10 所示。

表5 ARIMA预测值与实际值统计单位:KG

图10 预测图

从图10中可以看出,ARIMA模型预测周期为6个个案。表5中2017年第一季度到第四季度的季度平均相对误差为5.05%,预测精度控制在10%以内;基本符合实际预测的效果,说明模型的构建比较准确[9]。2018年第一季度到第二季度的平均相对误差在5%~10%以内,也基本是准确的。也就是说ARIMA模型在未来6个个案的预测当中比较准确。据此,利用2007—2018年矿产品检验不合格矿产量数据作为依据,对2018年第三季度到2019年第四季度检验不合格矿产量进行预测。并做出拟合图,如图11所示。

图11 预测图

从图中可以看出,截至到2019年第四季度,云南省进口矿产质量问题有所加重,并呈现出一定的上升趋势。说明在未来一段时间内,企业进口矿产的质量形势不容乐观,需要海关加大执法力度,严格控制把关进口矿的质量问题。出台合适的政策去积极应对,预测数据如表6所示。

表6 ARIMA预测值统计 单位:KG

4 结语

用ARIMA模型对云南进口矿产检验不合格重量未来六个季度进行预测,其结果显示未来六个季度的矿产品重量分别为81 975 723、91 499 033、101 201 605、111 182 004、121 412 257、131 881 033(单位:KG)说明未来几个季度内云南省进口矿产量检验不合格情况呈现一定的上升趋势,在某些年份更是显著增加,由此可见,境外矿产质量问题越来越严峻,需要严加防范和采取应对措施,但总体来说,比较稳定。据此,本文对提出相应的建议如下:

合理配置资源,协调发展,对于实验室硬件设施落后的隶属海关应大力扶持,对现有设备进行更新换代,以提高检测准确性和通关效率。加强分类指导,因地制宜的推进海关特殊监察区域的申报、 建设和发展。增强海关特殊监管区域发展的内生动力,深化改革,强化监管。适应国内外经济形势变化,充分发挥海关特殊监管区域在统筹国际国内两个市场、两种资源中的作用,提高依法行政能力,加强监管,防范风险。

猜你喜欢
二阶差分矿产
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
《矿产综合利用》征稿启事
二阶整线性递归数列的性质及应用
数列与差分
《矿产综合利用》征稿启事
盘点2020国内矿产新发现(一)
盘点2020国内矿产新发现(二)
一类二阶中立随机偏微分方程的吸引集和拟不变集
二次函数图像与二阶等差数列