基于SVM和雷达回波反射率的雹云模型识别研究

2016-10-13 11:57李硕王雪徐文霞李国东
东莞理工学院学报 2016年3期
关键词:冰雹中位数反射率

李硕 王雪 徐文霞 李国东,3

(1. 新疆财经大学 应用数学学院,乌鲁木齐 830012;2. 新疆维吾尔自治区 气象局人工影响天气办公室,乌鲁木齐 830002;3.新疆财经大学 新疆社会经济统计研究中心,乌鲁木齐 830012)



基于SVM和雷达回波反射率的雹云模型识别研究

李硕1王雪1徐文霞2李国东1,3

(1. 新疆财经大学应用数学学院,乌鲁木齐830012;2. 新疆维吾尔自治区气象局人工影响天气办公室,乌鲁木齐830002;3.新疆财经大学新疆社会经济统计研究中心,乌鲁木齐830012)

为了提高基于支持向量机(Support Vector Machine,SVM)的大雨、冰雹模型的分类准确率,利用SVM分类方法与雷达回波反射率图像相结合的方法建立模型。提取雹云图像与大雨图像的的特征数据进行筛选,分别求出它们的和、中位数与方差,组成的三维识别向量作为SVM模型判别的变量数据训练模型。利用该模型对已有样本进行测试,可得雹云判别模型的识别率较高,且判别误差率较低。结果表明,通过气象雷达反射率图像的回波强度数据与SVM分类模型相结合构造的雹云判别模型,具有较好的效果。

支持向量机(SVM);雷达回波反射率;大雨、冰雹分类;特征提取

冰雹是一种强对流天气,来势猛烈、强度大,给农牧业、工矿企业、电讯、交通运输及人民生命财产造成的损失较大,是一种严重的灾害性天气,及时准确的预报冰雹是科研人员的重点研究项目。针对强对流天气基于雷达回波的预报,国外从二十世纪中期就开始进行研究。目前,Johnson、Pamela[1]等人在强对流天气的回波识别的阈值上的研究取得了很大的进展,该方法在美国的实地测试过程中取得了较好的效果。国内对该项问题研究起步较晚,但近年来取得了很大的进展,刘黎平[2]等提出以面积较大的回波块图像为研究对象,通过计算等高面中的面积、强度来识别风暴的云图;王萍[3]等研究发现,基于升维思想的支持向量机(Support Vector Machine,SVM)方法对来自实际气候系统的非平稳过程存在稳定的预测能力,可用来实现冰雹和暴雨分类识别;范文等通过建立聚类评分的暴雨/冰雹分类模型[4]和SVM分类可信度的暴雨/冰雹分类模型[5],分别采用K均值聚类评分的办法确定具有高分类性的主成分和对雹云进行二次分类的方法,设计分类器对暴雨和冰雹进行区分。杨淑华[6]等研究发现春季冰雹在预报上具有更大的难度,预报时应着眼于三体散射现象及速度场特征,当出现三体散射现象且速度场出现速度辐合、逆风区和切变等特征时应启动冰雹预警。夏季冰雹特征为三体散射现象对冰雹的预警具有大约40 min的提前量;速度场出现辐合、逆风区、中气旋、大风区和切变等特征,一般在20~30 min左右出现冰雹。蓝渝[7]等研究发现在掌握背景环境的前提下,综合分析红外图像中对流系统的发展演变、水汽图像暗带和暗区变化等信息对冰雹的监测和预警有一定的参考价值。路志英[8]等通过图像处理方法,采用粗未选集理论数据挖掘方法对相关特征数据进行处理,建立了自动识别冰雹天气的客观模型。胡胜[9]等研究发现大冰雹风暴单体发展均非常旺盛,最大反射因子多超过65 dBZ,对应高度几乎都达到5 km。除受周围大范围雷达回波影响外,大冰雹风暴单体均观测到了三体散射或旁瓣回波特征,并具有一定的预报提前量;在0 ℃到20 ℃温度层层高度上的最大反射率因子均超过54 dBZ。大冰雹风暴单体与非冰雹风暴单体相比,低层回波迅速增加,强核心区垂直伸展更深厚,回波垂直递减率更小。

由于冰雹的形成与地理环境有密切的联系,国外所建立的雹云预报系统对于国内的预报出现较大的偏差,国内的研究大多集中在雷达所返回的数据如:温度、云高、厚度,忽略了图像本身所蕴含的信息。所以,以雷达反射率所成图像,并以图像中各强度的面积为基础,测定图像中各强度的和、中位数与方差,以它们组成的三维向量为变量,训练并检验SVM雹云判别模型,对雹云图像与大雨图像进行有效的区分,可以为冰雹预报提供参考。

1 大雨、冰雹的SVM分类模型

1.1SVM简介

Vapnik等人在统计学习理论基础上对线性分类器提出了另一种设计准则[5],原理是从线性可分,扩展到线性不可分的情况,甚至扩展到使用非线性函数,这种分类器被称为支持向量机(Support Vector Machine,简称SVM),SVM是借助最优化方法来解决问题的机器学习方法,对于解决二分类问题非常有效。

SVM方法通过一个非线性映射p,将样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使原来的样本空间中非线性可分问题转化为特征空间中的线性可分问题。一般情况下这会增加计算的复杂性,甚至会引起“维数灾难”,但SVM方法巧妙地解决了该难题:应用核函数的展开定理,则不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”。

1.2SVM分类模型算法

假定大小l为的训练样本集{(xi,yi),i=1,2,...,l},由二类别组成,如果xi∈R(N)属于第1类,则标记为正(yi=1),如果属于第二类,则标记为负(yi=-1)。学习的目标是构造一个决策函数,将测试数据尽可能正确地分类。

1)选择核函数K和惩罚参数C,构造并求解最优化问题。

(1)

其中K(xi,xj)=φ(xi)φ(xj)称为核函数。

2)决策函数和参数b分别为:

(2)

(3)

其中NNSV为标准支持向量数,JN为标准支持向量的集合,J为支持向量的集合。

2 雷达回波反射率图像的强度特征

图1 雷达反射率图像及基本反射率

雷达反射率是空间单位体积中的大气物质对雷达发射的微波的总后向散射截面。在雷达探测降水体或云体的情况下,后向散射主要由云雨粒子所造成的,反射率等于单位体积中各个水汽凝结体的后向散射截面之总和,即

η=∑σ ,

(4)

其中η为反射率,σ为单个粒子的后向散射截面,∑表示对单位空间体积中的所有粒子求和。气象雷达发射的电磁波遇到大气中的粒子时会发生散射,其中一部分能量散射回雷达,形成雷达回波反射率图,图中像素点的颜色值表示雷达回波强度,单位为dBZ。“dBZ”可用来估算降雨和降雪强度及预测诸如冰雹、大风等灾害性天气出现的可能性。一般地说,它的值越大降雨、降雪可能性越大,强度也越强,当它的值大于或等于40 dBZ时,出现雷雨天气的可能性较大,当它的值在45 dBZ或以上时,出现暴雨、冰雹、大风等强对流天气的可能性较大(所用气象图像由新疆自治区气象局提供)。

雷达反射率图像是基于 RGB 彩色空间的,以基本反射率因子图的图例为基础,利用 RGB彩色空间的成色原理,读取回波反射图[10]。即将反射率为-35~94 dBZ,分为17种相应的量级。其中不同量级所对应的 RGB 值如图所示,由 RGB 与灰度值的换算关系式(5),可知对应的灰度值。

Gray=R×0.299+G×0.587+B×0.114 .

(5)

表1 反射率与RGB 值、灰度值对应关系

雷达回波反射率图像上的不同颜色代表的是不同的反射强度,即可以通过统计不同颜色在图像中所占的面积的比例,体现图像中回波强度的特征。假设一幅规格为A×B的图像,含有A×B个像素,反射率强度分为17个量级,这不同量级在图像中所占的面积的比重为:

(6)

其中,ni为第i个量级的颜色在图像上的像素个数。

3 大雨、冰雹分类模型

3.1数据的筛选与处理

根据气象学的理论可知,强对流的极端天气,只可能出现在反射强度大于 45 dBZ 的区域。故本文只选取量级为11~17的面积比例作为实验数据。分别计算各个雹云图像和非雹云图像中量级为11~17的面积比例的和、中位数和方差,组成三维的识别向量,作为SVM模型判别的变量数据,训练模型。

中位数:是有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,则中位数不唯一,通常取最中间的两个数值的平均数作为中位数。

方差:是反应各个强度与均值的偏离程度。

(7)

3.2训练及检验SVM分类模型[11]

选取 2009~2010 年新疆阿克苏地区的降雹云和降雨云各47幅图像(部分样本图如图2)。

图2 反射率图像

随机选取其中的各30幅图像作为训练样本,对SVM进行训练(部分训练样本数据如表2)。

表2 部分训练样本数据

将剩余的34幅图像作为检测样本。进行实验,并对模型进行检验,得到的结果如表3。

表3 34幅图像对SVM模型的检测结果

由表3可知,在17幅雹云图像和17幅非雹云图像中,有个别雹云图被判为非雹云,也有个别非雹云被判为雹云。据统计在34幅图中,有五幅图被误判,检测的准确率约为85 %。准确率较高,说明具有一定的判别效果。

3.3实验结果分析

为了凸显文章研究的有效性,现将研究结果与近年的已有成果[4-5,8]对雹云识别的准确率进行对比(如表4所示)。

表4 研究结果与近年的已有成果对雹云识别准确率对比表 %

由表(4)可知所用的方法对雹云的识别具有一定的有效性。

3.4误差分析

1)由于训练样本和判别样本的容量小,故对SVM分类模型的判别造成一定程度的局限性,从而模型判定的准确性有提高的可能性;

2)由于样本图像是由原雷达图像截取获得,截取时存在误差,会对模型的准确率造成影响;

3)模型本身核函数k的选取也存在一定的误差。

从以上三个方面加以改进,此SVM模型的准确率将会更为完善。

4 结语

通过新疆自治区气象局提供的 2009~2010 年阿克苏地区的气象雷达反射率图像中,选取图象素材,利用颜色空间转换公式,由 RGB 转换到灰度空间,计算出各强度的面积所占比例,求得各强度的和、中位数与方差,组成三维的识别向量,作为SVM模型判别的变量数据,训练模型。利用此模型对已有样本进行测试,检验结果表明:雹云判别模型识别率较高,可利用反射率图像对雹云进行识别。但是由于样本容量有限等因素,可能存在误判。因此,判别样本库的建立是提高判别准确率的有效途径,且方法对气象预报方法具有一定的参考价值。

[1]Johnson J T. The storm cell identification and tracking algorithm:an enhanced WSR-88D Algorithm[J]. WeaForecasting, 1998, 13:263-276.[2]刘黎平,王致君,张鸿发,等. 用双线偏振雷达识别冰雹区[J]. 高原气象, 1993, 12(3):333-337.

[3]王萍,潘跃.基于显著性特征的大冰雹识别模型[J]. 物理学报,2013,62(6):069202.

[4]范文,王萍,孙红跃.基于聚类评分的暴雨/冰雹分类模型[J].天津大学学报:自然科学版,2014(7):608-612.

[5]范文, 王萍, 袁悦, 等.基于SVM分类可信度的暴雨冰雹分类模型[J].北京工业大学学报,2015, 41(3):361-365.

[6]杨淑华,梁进秋,张玉芳,等.冰雹天气的多普勒雷达特征统计分析[J].自然灾害学报,2014,23(3):101-106.

[7]蓝渝,郑永光,毛冬艳,等.华北区域冰雹天气分型及云系特征[J].应用气象学报,2014,25(5):538-549.

[8]路志英,朱俊秀,田硕,等.雷达回波反射率垂直剖面图的冰雹识别方法[J].天津大学学报:自然科学版,2015,48(8):742-749.

[9]胡胜,罗聪,张羽,等. 广东大冰雹风暴单体的多普勒天气雷达特征[J].应用气象学报,2015,26(1):57-65.

[10]杨玉峰. 基于雷达回波反射率图的冰雹识别系统的研究[D].天津:天津大学,2005.

[11]张海燕,蓝集明. 基于粗糙集和支持向量机的肿瘤图像识别[J].四川理工学院学报:自然科学版,2014,27(6):38-42.

On the Identification of Hail Cloud Model Based on SVM and Radar Echo Reflectivity

LI Shuo1WANG Xue1XU Wenxia2LI Guodong1,3

(1. School of Applied Mathematics, Xinjiang University of Finance and Economics, Urumq 830012, China;2. Weather Modification Office, Weather Bureau of Xinjiang, Urumq 830012, China;3. Research Center of Xinjiang Social and Economic Statistics, Xinjiang University of Finance and Economics, Urumq 830012, China)

In order to improve classification accuracy of distinguishing between heavy rain and hail by support vector machine (SVM), this paper describes a model by means of combining the SVM classification and the echo intensity of radar echo reflectivity images. It gets the characteristic data of the hail cloud image and rain image, sorts out the data to get their sum, the median and variance, and then constitutes a three-dimensional recognition vector as variable data of the SVM model, a training model. The sample test by use of this model shows that the hail cloud discriminant model has a high recognition rate and judgment has lower error rate. The results show that this model has good effects.

support vector machine (SVM); radar echo reflectivity; heavy rain, hail classification; feature extraction

2015-12-20

国家教育部人文社会科学基金(13YJAZH040);国家社科基金(14BTJ021);国家自然科学基金(11461063);气象局人影办青年基金(RY1403);新疆自治区气象局吐哈空中水资源项目(TUHA201514)。

李硕(1988—),男,河北保定人,硕士生,主要从事数据挖掘与图像处理方向研究。

O183.1;TN957.53

A

1009-0312(2016)03-0011-05

猜你喜欢
冰雹中位数反射率
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
冰雹是冰的,却为何出现在夏天
具有颜色恒常性的光谱反射率重建
冰雹的优点
中位数计算公式及数学性质的新认识
夏日冰雹
快跑啊,下冰雹了
炼焦原料煤镜质组的反射率及分布
导学案不能沦落为“习题单”:以“中位数和众数”的导学案为例