基于三种时间序列模型的矿井涌水量预测

2022-05-20 08:04刘晓丹潘国营
矿业安全与环保 2022年2期
关键词:涌水量差分矿井

刘晓丹,潘国营

(河南理工大学 资源环境学院,河南 焦作 454000)

矿井涌水量是煤炭开采过程中的一个重要技术指标[1],与煤矿采掘方案和排水能力设计有直接的关系,因此对其进行准确的预测具有重要意义。国内外常用的矿井涌水量预测方法有很多,如解析法[2]、均衡法[3]、数值法[4]、水文地质比拟法[5]、相关分析法[6]、灰色理论[7]、神经网络[8]等方法。但因矿井涌水量受矿区气候、水文特征、地形地貌、地层岩性及断裂构造等多种因素的影响[9],水文地质参数确定较为复杂,因此有学者开始应用时间序列分析来预测矿井涌水量。在使用该方法预测时,开采煤层应为同一煤层,且含水层富水性变化均一,无大的构造等。曲兴玥等[10]运用乘法分解模型对青龙煤矿月最大涌水量进行了预测;贾伦[11]建立了ARIMA(1,1,1)模型,对陕西某矿的涌水量进行了预测,模型拟合趋势与实际趋势基本一致;王猛等[12]建立了SARIMA(2,1,1)×(1,1,1)12模型,对矿井涌水量进行预测,预测结果与实测结果最大误差为3.43%,预测效果较好。

鹤壁八矿位于河南省北部的鹤壁—安阳太行山山前地带,开采二叠系山西组二1煤,矿区煤层形态整体为一向东倾伏的单斜构造。对矿井有充水作用的含水层有奥陶系灰岩岩溶水含水层,太原组二层、八层灰岩岩溶水含水层,二1煤顶底板砂岩裂隙水含水层,新近系砾岩孔隙水含水层。其中新近系砾岩孔隙水含水层直接覆盖于矿区煤系地层之上,裂隙及孔洞发育,富水性强,接受大气降水和地表水补给,涌水量大,对矿区开采有重要充水作用。笔者根据鹤壁八矿2009—2019年的月度涌水量数据,分别建立X12季节调整模型、ARIMA模型和SARIMA模型,比较3种模型预测结果的误差,以探讨鹤壁八矿矿井涌水量预测的最优模型,为煤矿安全生产提供理论依据。模型计算已嵌入Eviews9.0软件中,简化了繁琐的计算过程,易于操作。

1 资料与方法

1.1 资料来源

选取鹤壁八矿2009—2019年的月度涌水量数据,涌水量序列如图1所示。

图1 鹤壁八矿2009—2019年涌水量序列图

从图1可以看出,涌水量序列存在季节性波动,在一年之中呈现先增加再减少的趋势,在 7—10月出现峰值。2009年涌水量的波动变化较大,且观察期内的最大值和最小值均出现在2009年,最大值为475 m3/h,最小值为273 m3/h。在2017—2019年中,涌水量变化趋于平缓,波动较小。用2009—2018年的月度涌水量数据建立时间序列模型,将2019年1—12月的数据作为对比数据,检验预测效果。

1.2 研究方法

1.2.1 X12季节调整模型

X12季节调整模型是美国商务部人口普查局提出的季节调整方法,是对X11模型的优化和补充[13]。该模型将原始时间序列分解为趋势循环要素、季节要素和随机要素3个部分,各要素之间的关系模型包括加法模型、乘法模型、伪加法模型和对数加法模型等[14]。

1.2.2 ARIMA及其衍生SARIMA模型

ARIMA模型全称为差分自回归移动平均模型,即ARIMA(p,d,q)[15],其中p、q分别为自回归和移动平均阶数,d为差分次数。ARIMA模型是在ARMA模型(自回归移动平均模型)上发展而来的,由于ARMA模型只适用于平稳序列,对于非平稳序列,应先进行差分处理使其变为平稳序列,再进行建模,即ARIMA模型,故ARMA模型是ARIMA模型的一个特例。对于平稳化处理后的序列,其模型结构如下:

Xt=c+φ1Xt-1+φ2Xt-2+…+φpXt-p+et-θ1et-1-

θ2et-2-…-θqet-q

(1)

式中:Xt为平稳化处理的时间序列;c为常数;φp、θq分别为自回归和移动平均系数;et为白噪声序列。

SARIMA模型全称为季节性自回归移动平均模型,即SARIMA(p,d,q)×(P,D,Q)S,其中P、Q分别为季节自回归和移动平均阶数,D为季节差分次数,S为季节周期。模型结构如下[16]:

(2)

模型建立过程:

1)建立ARIMA和SARIMA模型,首先需要对原始序列进行平稳性检验,可采用普通差分或者季节差分进行平稳化处理。

2)通过观察平稳化处理后序列的自相关和偏自相关图,根据其截尾与拖尾性质确定模型的大致阶数p和q[17]。利用赤池信息准则、施瓦茨准则来确定最优阶数。

3)对未知参数进行估计,验证各参数t统计量是否通过检验。

4)采用对残差序列白噪声检验的方法对模型进行误差检验。

5)使用建立好的模型对未来数据进行预测和评价。

1.2.3 模型评价指标

通过平均绝对误差、均方根误差、平均绝对百分比误差来评价模型拟合效果,3个量值越小,说明拟合效果越好。

2 实例应用分析

2.1 X12季节调整模型

使用Eviews9.0软件中的Seasonal Adjustment模块对矿井涌水量序列进行分解,分解结果如图2所示。

图2 矿井涌水量序列分解结果图

从图2可以看出,趋势循环要素显示在2009年和2014年涌水量有明显的峰值,2015年之后涌水量基本保持稳定,无明显的增加或减少趋势。对于趋势循环要素,使用GM(1,1)模型,此种模型预测方法的相关文献很多[18],在此不再作阐述。

由季节要素可以发现涌水量的季节性规律十分明显,每年的季节性低点出现在2月至4月,季节性高点出现在7月至10月。按“近大远小”的原则对历史季节因子要素同期值赋予一定的权值并求和[19],将其值作为当月涌水量的季节因子,即:

XSi,j=αXSi-1,j+α(α-1)XSi-2,j+…+

α(α-1)n-1XSi-n,j

(3)

式中:XSi,j为第i年第j月的涌水量季节因子;α为加权系数,当季节要素波动不大时,α为0.1~0.5,若有迅速且明显的变动趋向,α为0.6~0.8[20],α取0.4。

根据随机要素序列可以发现随机要素没有明显的上升或下降趋势,围绕着1.0上下波动,且无规律性。采用对历史同期值取平均值的方法来求随机分量,即:

(4)

式中XIi,j为第i年第j月的涌水量随机分量。

将计算出的趋势循环要素的预测值、季节要素预测值、随机要素预测值列于表1中;根据X12季节调整乘法模型,可以计算得到模型的涌水量预测值,结果如表1所示。

表1 各要素及其涌水量预测值

2.2 ARIMA及其衍生SARIMA模型的建立

2.2.1 ARIMA建模

观察2009—2018年矿井月度涌水量数据,发现该时间序列基本平稳。进行ADF单位根检验,t检验统计量值为-4.027 8,小于Eviews9.0给出的1%水平的临界值;概率P为0.18%,小于5%,检验结果表明序列已平稳。将序列进行自相关和偏自相关检验,检验结果如图3所示。

图3 原序列自相关和偏自相关图

从图3可以看出,概率P均远小于5%,说明序列具有相关性,可以建立模型。自相关系数(AC)和偏自相关系数(PAC)都呈现出拖尾现象,故应选择ARIMA模型。为了确定最优的模型参数,p、q从0逐步迭代,利用赤池信息准则、施瓦茨准则来进行准确定阶。当模型为ARIMA(2,0,2)时,赤池信息准则的值最小;当模型为ARIMA(2,0,1)时,施瓦茨准则的值最小。

对ARIMA(2,0,2)和ARIMA(2,0,1)模型进行参数估计,结果如表2所示。

表2 模型参数估计结果

从表2可以看出,当模型为ARIMA(2,0,2)时,θ2系数概率为17.37%,超过允许概率5%,故该模型不符合条件要求。而ARIMA(2,0,1)模型的系数均符合概率要求,故选择ARIMA(2,0,1)模型进行预测研究,模型的表达式如下:

Xt=392.939 5+1.591 4Xt-1-0.764 1Xt-2+et+

0.665 7et-1

(5)

对ARIMA(2,0,1)模型进行误差检验,残差序列的自相关和偏自相关分析如图4所示。

图4 ARIMA(2,0,1)模型残差的自相关和偏自相关图

从图4可以看出,残差序列自相关系数(AC)全部落入2倍标准差范围以内,且P值都大于5%,即各序列值之间相互独立,无相关性。说明该残差序列是白噪声序列,模型符合要求,可以用来预测矿井涌水量。使用ARIMA(2,0,1)模型对2019年矿井涌水量进行预测,预测结果如表3所示。

表3 ARIMA(2,0,1)模型2019年矿井涌水量预测结果

2.2.2 SARIMA建模

观察矿井月度涌水量数据,可以发现序列具有明显的季节性波动,涌水量序列自相关系数呈明显的正弦波动轨迹,也验证了该序列具有以年为单位的季节波动。对涌水量数据进行12步季节差分以消除季节周期性,差分后序列在0附近波动,初步认为差分运算后的序列平稳。进行ADF单位根检验,t检验统计量值为-4.164 4,小于Eviews9.0给出的1%水平的临界值,且概率P为0.11%,小于5%,检验结果表明差分后的序列已平稳。之后建模步骤与ARIMA模型相同,最后确定模型为SARIMA(2,0,1)×(0,1,1)12。对SARIMA模型进行诊断检验,残差序列是白噪声序列,模型提取比较充分,该模型可以用来预测矿井涌水量。预测模型的表达式如下:

(6)

使用SARIMA(2,0,1)×(0,1,1)12模型对2019年矿井涌水量进行预测,预测结果如表4所示。

表4 SARIMA(2,0,1)×(0,1,1)12模型2019年矿井涌水量预测结果

3 预测结果对比与分析

采用X12季节调整模型、ARIMA(2,0,1)模型、SARIMA(2,0,1)×(0,1,1)12模型对鹤壁八矿2019年涌水量进行拟合,用于比较模型在涌水量预测中的准确性。3种模型均通过了模型检验,均可用于涌水量的外推预测。3种模型的平均绝对误差、均方根误差、平均绝对百分比误差如表5 所示。

表5 矿井涌水量预测评价结果

从表5可以看出,3种模型的平均绝对百分比误差均小于10%,说明模型的预测精度较高。在3种评价指标中,ARIMA(2,0,1)模型的值均要小于其他2种模型,说明该模型预测精度要优于其他2种模型,SARIMA(2,0,1)×(0,1,1)12模型次之,X12季节调整模型略差。

X12季节调整模型可以有效地预测矿井涌水量。尽管矿井涌水量受诸多因素影响,但X12季节调整模型可通过分析序列本身变化特征,将其分解为趋势循环要素、季节要素、随机要素,从不同方面描述序列的变化情况。由于各要素存在不同的组合方式,在应用该模型时要选择合适的要素组合方式,同时对各个要素预测时要选择合适的预测方式,否则会导致预测结果误差偏大。

ARIMA及其衍生SARIMA模型建立过程需要注意,当序列非平稳时,需要进行平稳化处理,对差分阶数、差分步数的选择尤为重要。当差分阶数、差分步数较大时不仅会增加模型复杂度,而且会导致过度差分,损失一定的数据信息,导致预测结果的误差偏大。在模型定阶过程中,通过序列自相关和偏自相关图确定模型阶数往往存在主观性,可以根据赤池信息准则、施瓦茨准则等确定最优模型阶数,可减小模型预测中的误差。在ARIMA建模时应注意,要求原始时间序列至少需要50个或 7~8个周期的数据,且ARIMA模型建成之后并不是一劳永逸的,还应及时对数据进行更新,调整模型参数以确保预测精度。

4 结论

1)基于鹤壁八矿矿井涌水量数据,运用时间序列分析软件EViews9.0建立了合适的X12季节调整、ARIMA(2,0,1)、SARIMA(2,0,1)×(0,1,1)12模型。3种模型对原始序列的拟合效果整体较好,可用于矿井涌水量的预测,并可为矿井涌水量预报和水害防治工作提供依据。

2)将3种模型预测值与实际数据进行了对比分析,从平均绝对误差、均方根误差、平均绝对百分比误差方面来评价预测结果,ARIMA(2,0,1)模型最优,SARIMA(2,0,1)×(0,1,1)12模型次之,X12季节调整模型略差。但X12季节调整模型可以预测出序列的趋势循环要素、季节要素、随机要素,其具有独特的优势。

3)X12季节调整模型在应用的过程中应注意模型的选择,以及对各要素的预测。SARIMA模型在应用过程中应注意差分阶数、差分步数的选择,可采用最小信息准则来确定模型阶数以提高预测精度,减小模型误差。

4)运用时间序列分析软件Eviews9.0可较快实现涌水量时间序列的建模,并快速预测矿井涌水量,为矿井生产提供理论依据,应用潜力较大。

猜你喜欢
涌水量差分矿井
一类分数阶q-差分方程正解的存在性与不存在性(英文)
赵各庄矿矿井涌水量预测方法分析
突出矿井大采高综采工作面过断层风险管控研究
矿井建设中的现场施工管理
一个求非线性差分方程所有多项式解的算法(英)
山西平遥县兴盛佛殿沟煤业有限公司
一类caputo分数阶差分方程依赖于参数的正解存在和不存在性
废弃矿井变成主题公园
基于差分隐私的数据匿名化隐私保护方法
隧道衬砌结构水作用概述