基于GWO-SVM模型的水质评价

2020-03-08 02:29朱露露卢敏严刘伟
河南科技 2020年35期
关键词:水质评价支持向量机

朱露露 卢敏 严刘伟

摘 要:基于支持向量机在处理小样本数据中的优势,本文选用支持向量机对水质进行评价,并选择灰狼算法对支持向量机的两个参数(核函数参数g和惩罚因子c)进行优化,选取实例数据,以分类的准确率为评价标准,建立GWO-SVM水质评价模型,然后将其结果与GA-SVM模型、标准SVM模型的评价结果相比较。结果显示,GWO-SVM模型评价结果更好。

关键词:水质评价;灰狼算法;支持向量机

中图分类号:X824文献标识码:A文章编号:1003-5168(2020)35-0036-03

Abstract: Based on support vector machine (SVM) in the treatment of the advantages of small sample data, this paper selected the SVM to evaluate the water quality, and chose gray wolf algorithm to optimize the two parameters (kernel function parameter g and penalty factor c) of SVM, and selected the instance data, and used the classification accuracy as the evaluation standard to establish the GWO - SVM water quality evaluation model, and then compared the results with the evaluation results of the GA-SVM model and the standard SVM model. The results showed that the GWO-SVM model evaluation results were better.

Keywords: water quality evaluation;gray wolf algorithm;support vector machine

水环境质量评价的主要目的是对水体的质量和利用价值做出评定[1],评价结果可以反映当前水体的污染程度和质量[2]。

常见的水质评价方法有模糊数学评价法、人工神经网络法、灰色评价法等[2]。但是,这些方法都有其不足之处。人工神经网络法需要的样本数据大,而且原理和计算复杂,灰色评价法存在均值化问题,模糊评价法仅适用于水质评价因子超标情况接近的情况[2-3]。支持向量机在处理小样本数据方面有优势,但由于支持向量机的参数选择具有盲目性,所以本文选用灰狼算法来优化支持向量机模型,然后对水质进行评价,并与其他模型进行对比分析。

1 支持向量机

支持向量机的基本原理是:对于线性问题,通过寻找一个最优超平面,在分开两类样本的同时,使分类的间隔最大化;对于非线性问题,将样本点从低维空间映射到高维空间,然后寻找一个超平面将不同的样本数据分开,实现样本的划分,并且使样本集到最优超平面的距离最大[4-11]。

假设样本数据为[xi],[i]=1,2,3…[m],支持向量机的特征函数为:

式中,[ω]为权重矩阵;[b]为误差。

本文选用的核函数是径向基核函数(RBF),即

式中,[g]为核函数参数。

2 灰狼算法

支持向量機的参数选择具有主观性,参数的优化能够提高算法的有效性。目前,支持向量机的参数优化方法有很多种,传统的算法有网格搜索算法、交叉验证法以及一些智能优化算法,如遗传算法、人工蜂群算法、粒子群优化算法和蚁群算法等[12-17]。但这些智能算法依然存在一些缺陷,如在寻优过程中易过早收敛、会陷入局部极值等[7]。相较于其他算法,灰狼算法能提供更有竞争力的结果,在探索性和竞争性方面具有一定优势。解宏伟等人[16]利用GWO-SVM算法对矿山边坡变形进行预测,陈颖等人[17]将GWO-SVR算法应用在镉元素含量的预测上,其预测精度都相对提高。

本文选用灰狼算法来优化支持向量机的两个参数,即惩罚因子[c]和核函数参数[g],以提高模型的预测性能。整个狼群分为四个等级:α狼、β狼、δ狼和ω狼。

首先是包围猎物,其数学模型如下:

以α狼、β狼、δ狼为最优解,ω狼根据α、β和δ狼更新自己的位置,即

确认位置后,狼群开始狩猎,即得到最优解。

3 实例分析

根据《地表水环境质量标准》(GB 3838—2002),依据水域的功能和保护目标,将地表水划分成五类:Ⅰ类、Ⅱ类、Ⅲ类、Ⅳ类和Ⅴ类水。部分评价因子的取值范围如表1所示。

本文选取了滇池流域观音山断面2013—2014年共104组水质数据进行评价分析,试验数据来源于中国环境监测总站,将其中的84组数据作为训练集、20组数据组为测试集,将水质指标pH、DO、高锰酸盐指数、NH3-N作为输入变量,水质评价结果作为输出变量。本文分别建立GWO-SVM水质评价模型、GA-SVM水质评价模型和SVM水质评价模型进行对比分析,结果如图1、图2和图3所示。

由表2可以看出,GWO-SVM模型的分类正确率是90%,GA-SVM模型的分类正确率是85%,SVM模型的分类正确率是75%。在三种方法中,GWO-SVM模型的评价效果最好,其次是GA-SVM模型。

4 结论

本文选取滇池流域观音山断面2013—2014年的水质数据进行评价分析,利用灰狼算法优化支持向量机的两个参数,即惩罚因子[c]和核函数参数[g],然后建立GWO-SVM水质评价模型,并与GA-SVM水质评价模型、SVM水质评价模型进行对比分析。由评价结果对比分析可知,GWO-SVM模型的分类结果更好,准确率更高,可以为水质评估提供一种新方法和思路。

参考文献:

[1]王维,纪枚,苏亚楠.水质评价研究进展及水质评价方法综述[J].科技情报开发与经济,2012(13):129-131.

[2]李茜,张建辉,林兰钰,等.水环境质量评价方法综述[J].现代农业科技,2011(19):285-287.

[3]郭美叶.基于SVM的洋河张家口段水质评价[J].水利科技与经济,2018(1):8-12.

[4]Vapnik V.The Nature of Statistical Learning Theory[M].Heidelberg:Springer,1995:22-23.

[5]陈曦,仇蕾,黄泽元.最小二乘支持向量机在太湖流域水质评价中的应用[J].水生态学杂志,2013(6):16-21.

[6]聂笃宪,魏伟康,庄泽鸿,等.基于PSO和GA混合优化SVM的水质评价[J].水科学与工程技术,2019(3):1-4.

[7]李代华.基于改进布谷鸟搜索算法优化的SVM月径流预测[J].中国农村水利水电,2020(8):171-176.

[8]王静.基于混合数学模型的巢湖水质预测与评价[D].兰州:兰州大学,2018:18-19.

[9]姜雯,吴陈.基于改进粒子群算法的支持向量机遥感影像分类[J].江苏科技大学学报(自然科学版),2020(5):66-72.

[10]晋健,刘育,王琴慧,等.基于小波去噪和FA-SVM的中长期径流预报[J].人民长江,2020(9):67-72.

[11]陈慧.基于SVM算法的服务器性能分析与预测研究[D].南昌:南昌大学,2019:23-24.

[12]崔丽洁,程换新,刘军亮,等.群智能优化算法优化支持向量机的方法及应用[J].电子测量技术,2019(7):44-48.

[13]Mirjalili S,Mirjalili S M,Lewis A.Grey wolf optimizer[J].Advances in Engineering Software,2014(3):46-61.

[14]张晓凤,王秀英.灰狼优化算法研究綜述[J].计算机科学,2019(3):30-38.

[15]孔令刚,焦相萌,陈光武,等.基于Mallat小波分解与改进GWO-SVM的道岔故障诊断[J].铁道科学与工程学报,2020(5):1070-1079.

[16]解洪伟,朱东丽.基于PCA-GWO-SVM的矿山边坡变形预测[J].矿山测量,2020(1):63-66.

[17]陈颖,张灿,肖春艳,等.基于GWO-SVR的土壤镉元素含量含水率校正预测模型研究[J].光学学报,2020(10):180-187.

猜你喜欢
水质评价支持向量机
宿州市河流水化学特征及水质评价
阿什河哈尔滨段水质评价
不同评价方法对水库水质评价的适应性
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
济南流域夏季大型底栖动物群落结构调查及水质评价