刘素兵,赵志辉,吴聪伟
(第二炮兵工程大学 数学与军事运筹教研究,陕西 西安 710054)
目前矿山安全事故预测常用的方法主要有灰色预测法、回归预测法、马尔可夫链预测法、平滑指数法等[1-2].由于矿山安全事故受多随机性、有限样本性等多种因素的影响,单一预测模型难以达到理想的预测精度.针对此情况,需将灰色预测理论与支持向量机结合起进行综合考虑.灰色预测具有弱化数据随机波动性、少数据、贫信息的建模特点.支持向量机在解决小样本、局部极小点、非线性等方面具有突出表现[3].因此,为了更好地对矿山安全事故进行预测,提高矿山安全事故预测的可靠性、有效性,建立了灰色支持向量机组合预测模型(简称G-SVM).仿真结果表明,该模型比单一的预测方法具有更高的预测精度.
灰色问题建模使用最多的是GM(1,1)模型[4].
1) 数列选择.设X(0)为原始数据数列
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}.
2) 生成1-AGO数据序列X(1)={x(1)(1),x(1)(2),…,x(1)(n)},
3) 建立灰色预测模型.紧邻均值生成序列为:Z(1)=(z(1)(2),z(1)(3),…,z(1)(n)),
其中,背景值
GM(1,1)模型:
x(0)(k)+az(1)(k)=b,
(1)
由最小二乘估计得(2)中参数列 [a,b]T=(BTB)-1BTY,且
灰微分方程的白化方程为:
(2)
取x(1)(1)=x(0)(1),模型的响应时间序列为:
(3)
(4)
支持向量机的基本思想如下[5-7]: 设训练样本集:D={(x1,y1),(x2,y2),…,(xn,yn)},其中,输入xi∈Rn(i=1,2,…,n),输出值yi∈R.
回归模型:
y(x)=ωT·φ(x)+b,
(5)
式(5)中,ω为加权向量;φ(x)为从输入空间到高维特征空间的非线性映射,通过在高维空间中进行线性回归,以达到在低维空间中作非线性回归的效果;b为常值偏差.
SVM采用Vapnik的ε不敏感损失函数度量风险,即
(6)
为训练ω,b,极小化下式的泛函
(7)
式(7)中,第1项为经验风险;第2项为结构风险最小化原则得到的正则化部分,主要控制模型的复杂度;c为正规化常数,用来平衡经验风险项和正则化项.
由于式(7)中,特征空间的维数高且目标函数不可微,因此不能对其直接求解.通过引入核函数K(xi,x),利用Wolfe对偶技巧,上述问题转化为对偶问题:
(8)
则式(5)的回归函数表达式可写为:
(9)
本文选择Guass径向基RBF核
(10)
首先采用GM(1,1)对矿山安全事故次数进行预测,预测其趋势变化规律,然后采用SVM对GM(1,1)的残差进行修正,建立残差序列的SVM模型,将SVM的预测结果与GM(1,1)的结果进行相加,从而实现对矿山安全事故次数的预测,其预测流程图如图1所示.
利用我国2007年1至2月—2010年11至12月的实际矿业安全事故数据为样本进行实证分析,并与GM(1,1)模型、支持向量机模型的预测精度进行比较.利用2007年1至2月—2010年3至4月数据作为训练学习样本,分别建立GM(1,1)模型、支持向量机模型和G-SVM组合模型,并以2010年5至6月—2010年11至12月的4个数据用于检测样本,对各模型的预测精度进行检验.
对于G-SVM模型,选择具有较好统计性能的径向基核函数.根据以往经验,采用交叉验证法来选择不敏感损失参数和核函数,基于样本选择的惩罚因子C=50,核参数σ2= 0.04,不敏感损失参数ε=0.15.预测结果见图2.将组合模型G-SVM和单项预测模型GM(1,1)、SVM的预测结果进行比较,以验证模型的有效性.各模型的矿山安全事故次数的预测如图2所示.由图2可看出,采用G-SVM的组合模型比其它2种模型更接近真实值,说明本文建立的G-SVM的组合模型具有较高的预测精度,取得了较好的预测效果.
选取平均绝对误差、平均相对误差、均方误差对3种模型的预测性能进行评价,结果见表1.
表1 不同模型的误差比较
由表1可知,GM(1,1)和SVM的MAE(平均绝对误差)、MPE(平均相对误差)和MPE(均方误差)的值较大,而G-SVM的相应的3个指标值明显减小,分别为0.85, 0.05,1.04.以上结果表明本文所提出的灰色支持向量机组合模型,在随机性较强、小样本条件下具有独特的优越性,其预测精度较高,明显优于GM(1,1)和SVM.
本文针对随机性、小样本条件下的矿山安全事故预测问题,建立了一种灰色支持向量机组合预测模型.该模型结合了灰色预测和支持向量机的优点,提高了预测的精度.试验结果表明,灰色支持向量机模型的预测误差明显小于其它2种单一预测模型,组合模型比单一的GM(1,1)模型和SVM模型具有更高的预测精度,证明了模型的可行性、有效性.该模型为矿业的安全管理、安全控制措施的制定提供了理论依据,从而以最大限度地减少矿山安全事故的发生.
参考文献:
[1] 程平亮. 伤亡事故统计分析信息管理系统的开发[J]. 工业安全与环保,2007,33(3):56-57.
[2] 朱庆明,张浩. 三次指数平滑法在煤矿事故预测中的应用研究[J].中国安全生产科学技术,2012,8(4):103-106.
[3] MOHANDES M A, HALAWANI T O, REHMAN S,et al. Support vector machines for wind speed prediction[J]. Renewable Energy, 2004,29(6):939-935.
[4] 刘思峰,党耀国,方志耕,等. 灰色系统理论及其应用[M].5版.北京:科学出版社,2010:146-168.
[5] 白鹏,张喜斌,张斌,等. 支持向量机理论及工程应用实例[M].西安:西安电子科技大学出版社,2008.
[6] VAPNIK V. The nature of statistical learning theory[M].New York:Springer,1999
[7] 吴钰,王杰. 综合最优灰色支持向量机模型在季节型电力负荷预测中的应用[J].华东电力,2012,40(1):18-22.