种族鱼群优化支持向量机序列理论监测尾矿坝*

2016-06-17 01:24胡军王凯凯葛凯华袁永涛
工业安全与环保 2016年5期
关键词:鱼群种族尾矿

胡军 王凯凯 葛凯华 袁永涛

(1.辽宁科技大学土木工程学院 辽宁鞍山 114051; 2.平泉小寺沟矿业有限公司 河北承德 067512;3.新疆哈密英格玛煤电投资有限责任公司 新疆哈密 839000)



种族鱼群优化支持向量机序列理论监测尾矿坝*

胡军1王凯凯1葛凯华2袁永涛3

(1.辽宁科技大学土木工程学院辽宁鞍山 114051;2.平泉小寺沟矿业有限公司河北承德 067512;3.新疆哈密英格玛煤电投资有限责任公司新疆哈密 839000)

摘要为监测预警尾矿坝的变形位移,提出基于结构风险最小化理论的支持向量机进行学习预测。通过采集有效数据,对时间序列数据进行归一化序列处理,然后采取种族鱼群选择向量机参数,对处理后的数据进行支持向量机回归预测。将该理论应用到某尾矿坝监测系统,得到了较为准确的预测结果,表明该理论充分利用了数据的统计特性,精度和泛化能力都得到了明显提高,可作为尾矿坝监测系统的有效指导。

关键词尾矿坝支持向量回归机归一化序列种族鱼群协调行为

0引言

支持向量机是一种渐渐兴起的基于统计学理论和最优化理论的机器学习方法。由于其在数据学习模拟预测方面表现出良好的通用性、鲁棒性和有效性,越来越得到学者的青睐。随着支持向量机的深入研究,它也表现出了一些实际应用上的不足,如向量机参数随机性高等问题。本文借助以往论文的研究,提出对序列数据归一化处理,利用改进的鱼群算法优化参数,并对尾矿坝的位移数据进行训练学习,取得了较为准确的拟合效果。

1归一化序列理论

目前,尾矿坝的安全监测问题,多数学者主要通过分析现场监测的数据和资料,采用统计学理论寻找规律,建立学习模型,来预测未来数据或无法观测的数据,及时掌握坝体的安全状态。具有时间序列的数据,多转换成以时间为自变量,以监测结果作为因变量的某种拟合模型进行学习预测。从现场数据分析,由于监测数据往往并不存在直接的线性关系,且时间变化量较小,而基数较大,直接利用原始数据进行回归拟合的效果并不理想。

从统计思想出发,可把数据的因变量与自变量归一化到利于研究的区间,如区间[0,1]或[-1,1]等,提高泛化能力。对于具有l个样本数据{xi},i=1,2,…,l,xi∈R归一化到区间[0,1],采用如下的归一化映射[1]:

(1)

式中,x=(x1,x2,…,xl)为原始数据,y=(y1,y2,…,yl)为对应于x的归一化结果,且yi∈[0,1],i=1,2,…,l;min(x),max(x)分别为样本x的最小值和最大值;R,Rn分别表示为1维和n维实数集。本文对时间序列数据都进行了区间[0,1]的归一化处理。

2支持向量机

支持向量机(Support Vector Machine,SVM)作为统计学习理论最年轻的部分,是1995年由Vapnik和Corinna Cortes首先提出的,类似于神经网络的形式,在小样本、非线性及高维模式等问题表现出特有的优势。它主要通过构造一个分类超平面的决策曲面,使得正例和反例之间的隔离边缘被最大化;支持向量回归机也是应用了最大间隔算法,非线性函数可利用一个非线性映射将训练数据集非线性映射到一个高维特征空间,通过高维特征空间中的线性学习算法获得,是结构风险最小化的近似实现。

支持向量回归机的数学模型[2]为:设样本数据{xi,yi},i=1,2,…,l,其中,l为样本个数,xi∈Rn为输入变量,yi∈R为输出变量,则回归估计问题简化为下式:

(2)

(3)

式中,w为权值矢量,b为偏执量,ε为不敏感损失函数,其定义如下:

(4)

f(x)=(w·x)+b,w,x∈Rn,b∈R

(5)

上式中,ε表示算法精度;R,Rn分别表示1维和n维实数集;f为线性函数集合中向量机的最优决策函数[3];f(x)为对应于x的实值函数。回归估计问题[4]的求解目的是要寻找w和b,使得对于样本以外的输入x,满足,|f(x)-(w·x)-b|≤ε,求解上式的参数等价于求解在式(3)约束下求式(2)的最小值的优化问题。

对于非线性函数的回归问题,需利用核函数k(x,x′)代替点积,把式(5)改为

f(x)=(w·k(x,x′))+b

(6)

式中,k(x,x′)为回归向量机核函数。常用的核函数类型[5]t主要有3种,分别是多项式函数、径向基函数和Sigmoid函数;回归SVM模型设置类型s主要有核支持向量机和ε-支持向量机;涉及支持向量机的主要参数还有惩罚参数c和核函数参数g。

支持向量机的样本训练,实际上是一个二次最优化问题。对于训练过程中的惩罚参数c和核函数参数g,一般是任意给定的或凭测试经验给定的,需要遍历网格内的所有参数点,来寻求全局最优解,效率低下。由于参数选择的随机性较大,借助进化思想[6],并考虑人工鱼群算法良好的启发式寻优特性,本论文采用改进的人工鱼群算法进行惩罚参数c和核函数参数g的寻优获得。

3种族人工鱼群算法

人工鱼群算法是通过模拟鱼群行为来达到试验目的的群智能算法。作为一种新型的寻优模式,由于其并行性、简单性、能很快跳出极值、寻优快的特点,越来越多地应用到实际的寻优问题中,且表现出了强大的优越性。

3.1标准的人工鱼群算法

标准的人工鱼群算法,借助于面向对象的分析方法,对虚拟人工鱼[7]总结了4种基本行为:觅食行为,聚群行为,追尾行为和随机行为。具体寻优过程描述为:假设虚拟的人工鱼当前状态为X,在其视野范围Visual内,在某时刻视点所在的位置状态Xv,若该位置的状态优于当前状态,则考虑向该位置方向前进一步,即达到状态Xnext;若状态Xv不比当前状态更优,则继续巡视视野内的其他位置,此为觅食行为[8];当搜索到其视野范围内的伙伴数目nf及中心位置Xc优于当前位置且不太拥挤,即满足Yc/nf>δYi,则考虑向该位置方向前进一步,即达到状态Xnext,此为聚群行为;当搜索到附近最优的个体优于当前状态且不太拥挤,即满足Yj/nf>δYi,则考虑向该位置前进一步,达到状态Xnext,此为追尾行为;而人工鱼在视野内随机移动一个方向,就是随机行为。该过程[7]可表示为

Xv=X+Visual·Rand()

(7)

(8)

式中,状态X=(x1,x2,…,xn),状态Xv=(x1v,x2v,…, xnv),Step为移动步长,Rand()为介于0和1之间的随机数。

3.2种族人工鱼群算法

经过人工鱼群算法[9-10]的深入发展研究,如文献[3]所提供的标准人工鱼群随着迭代的增加会出现以下问题:①寻优后期,可能由于参数的固化,后期收敛速度变慢,搜索范围缩小;②当寻优空间加大时导致存储空间扩大,影响寻优效率。

考虑到遗传算法[11]自然进化、可扩展性和启发式随机搜索的特性,本研究在标准鱼群算法的基础上添加了交叉变异的思想,结合两者的优势,提出了种族人工鱼群算法。把人工鱼群分成几个种类,分别执行鱼群寻优,并进行交叉变异操作,增加解的多样性。

由于增加了鱼群的种类,为了增加寻优效率,本文添加了协调行为[12],即在各种类人工鱼进行基本行为寻优时,会遇到附近其他种类的人工鱼,此时原始鱼会考虑附近较优鱼的影响,进行信息交流,来调整自己的前进方向或自身属性变量等,以达到更快的进化学习。

具体操作如下:①初始化种族鱼群的基本参数,如人工鱼数目N,步长Step,视野Visual,尝试次数Try_number、拥挤度因子δ等;②划分人工鱼种类,一般分成偶数个,各个种类设置不同的参数,记录当前最优值到公示牌;③各种类执行人工鱼基本寻优行为,同时执行协调行为,记录下最优值到公示牌;④各种类采取最优保留策略直接选取部分最优鱼准备进入下一次迭代,剩下的鱼类进行遗传操作;⑤判断迭代条件,达到条件则公示牌中的最优值即为最优解;⑥不满足条件时,则对遗传操作的人工鱼重新洗牌,执行步骤②,继续寻优操作。

4基于种族鱼群优化的支持向量机

由于支持向量回归机的学习模型性能很大程度上依赖于参数的选择,结合序列数据归一化思想,以及种族鱼群算法的启发式搜索的特性,采用三者结合的学习模型进行数据回归模拟。应用Libsvm工具箱进行SVM操作学习,具体步骤如下:

(1)根据实际问题,结合模型假设,选定数据的自变量和因变量;

(2)时间序列数据归一化处理,对自变量和因变量数据都进行区间[0,1]归一化处理;

(3)选择合适的核函数;

(4)选择向量机参数,即采用种族鱼群算法参数寻优选择惩罚参数c和核函数参数g;

(5)样本学习训练并预测实验值。

5工程实例

以文献[13]中某尾矿坝在线监测系统的竖向位移为例,取该尾矿坝第2断面的竖向位移从2011年4月8日至2011年8月30日的40组数据作为研究对象,按时间顺序依次编号(t=1,2,…,40),取前20个数据作为训练样本,训练数据及结果见表1,后20个数据作为预测样本,预测数据及结果见表2。

本实例种族鱼群算法设置参数为:划分为2层鱼群种类,各种类15个人工鱼个体。交叉概率Pc=0.8,变异概率Pm=0.2。具体参数见表3。寻优变量为惩罚函数c(取值范围(0,200))和核函数参数g(取值范围(0,200)),适应度函数取为支持向量机训练结果的均方误差。最终获得支持向量回归机的参数为:SVM模型类型s=4(nu-SupportVectorRegression),核函数t=2(高斯RBF核函数),惩罚函数c=174.27,核函数参数g=5.584 3,均方误差为1.077 9×10-7。种族鱼群的寻优曲线见图1。

图1 人工鱼群算法寻优曲线

时间序列竖向位移实测值/m竖向位移训练值/m绝对误差/m相对误差/%1128.36128.330.030.02342128.42128.350.070.05453128.19128.370.180.14044128.03128.390.360.28145127.92128.400.480.37526129.14128.410.730.56537128.36128.430.070.05458129.33128.430.90.69599129.53128.441.090.841510129.44128.450.990.764811128.42128.450.030.023412128.44128.450.010.007813125.47128.452.982.375114125.47128.442.972.367115125.48128.442.962.358916128.36128.430.070.054517128.83128.420.410.318218129.19128.400.790.611519129.28128.390.890.688420128.44128.370.070.0545

表2 预测样本集及结果

表3 种族鱼群算法参数

6结论

(1)实例中,运用改进的支持向量机序列理论模型,其预测结果的相对误差控制在0.2%之内,拟合度较高,表明了支持向量机在贮灰监测预警系统中具有良好的拟合效果,可以形成经验数据库,作为监测系统的知识储备。

(2)本例采用时间序列数据归一化处理,提高了数据拟合的准确率。同时,种族鱼群算法添加了交叉变异的思想和协调行为,克服了标准鱼群参数固化的局限性,缩短了支持向量机参数选择的时间,提高了支持向量回归机预测的效率。今后可多进行有效的鱼群算法研究,提高其寻优效率。

参考文献

[1]王小川,史峰,郁磊,等.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013:102-176.

[2]李长龙,潘伟强,胡盛龙.基于均匀设计的支持向量机参数优化方法[J].计算机工程与科学,2014,36(4):702-706.

[3]邱志刚.基于蚁群优化支持向量机的公路隧道围岩变形预测模型及应用[J].隧道建设,2014,34(1):13-18.

[4]田景文,高美娟.人工神经网络算法研究及应用[M].北京:北京理工大学出版社,2006:247-248.

[5]张颖璐.基于遗传算法优化支持向量机的网络流量测量[J].计算机科学,2008,35(5):177-179.

[6]Ilhan I,Tezel G. A genetic algorithm-support vector machine method with parameter optimization for selecting the tag SNPs[J].Journal of Biomedical Informatics,2013,46:328-340.

[7]江铭言,袁东风.人工鱼群算法及其应用[M].北京:科学出版社,2012:20-95.

[8]李丽娟,彭懿.粒子群-鱼群混合算法在桁架结构优化设计中的应用[J].空间结构,2012,18(4):45-48.

[9]Wang Cuiru, Zhou Chun lei, Ma Jianwei. An improved artificial fish-swarm algorithm and its application in feed-forward neural networks [A]. 2005 International Conference on Machine Learning and Cybernetics, ICMLC 2005[C]. Guangzhou, China, 2005:2890-2894.

[10]郭童,林峰.基于混合遗传鱼群算法的贝叶斯网络结构学习[J].浙江大学学报(工学版),2014, 48(1):130-135.

[11]周明,孙树栋.遗传算法原理及应用[M].北京:国防工业出版社,1999:41-60.

[12]李晓磊,钱积新.基于分解协调的人工鱼群优化算法研究[J].电路与系统学报,2003,8(1):1-6.

[13]宋传旺,王彦磊,于广明,等.分形理论在尾矿坝监测预警中的应用[J].辽宁工程技术大学学报,2013,32(9):1191-1194.

Monitoring Tailings Dam Based on Support Vector Machine Sequence Theory Optimized by Racial Fish

HU Jun1WANG Kaikai1GE Kaihua2YUAN Yongtao3

(1.CivilEngineeringCollege,UniversityofScienceandTechnologyLiaoningAnshan,Liaoning114051)

AbstractTo monitor and early warn tailings dam deformation, it is put forward the theory of support vector machine (SVM) based on structural risk minimization to study forecasts. Through effective data, first of all, time sequence data is processed, then the racial fish is adopted to choose vector machine parameters and finally the support vector machine (SVM) is applied to regress and predict the processed data. This theory is applied in the monitoring system of one tailings dam, the accurate prediction results are obtained, indicating that the theory makes full use of the statistical properties of the data, the precision and generalization ability has obviously been improved, effectively directive to tailings dam monitoring system.

Key Wordstailings damsupport vector regression machinenormalized sequencesracial fishcoordination behavior

*基金项目:国家自然科学基金(51274053)。

作者简介胡军,男,1977年生,博士,教授,主要从事尾矿库自动化安全监测及预警、边坡稳定分析等研究工作。

(收稿日期:2015-05-20)

猜你喜欢
鱼群种族尾矿
煅烧高镁磷尾矿制备硫氧镁胶凝材料
说起1776年那些事,就不能不提种族和蓄奴问题 精读
《固体矿产尾矿分类》等3项行业标准于2021年6月1日起实施
某金矿重选尾矿回收金、铜的工艺研究
人工鱼群算法在雷达探测器射频端电路设计中的应用
论埃里森文化批评中的种族政治观
铁尾矿资源的研究与应用
找出调皮鬼
跟踪导练(一)3
鱼群漩涡