基于贝叶斯分类的雾天和雨天两类天气图像自动识别*

2016-10-25 07:21王孝通徐冠雷
舰船电子工程 2016年9期
关键词:雾天天气现象贝叶斯

于 浩 王孝通 徐冠雷

(海军大连舰艇学院 大连 116018)



基于贝叶斯分类的雾天和雨天两类天气图像自动识别*

于浩王孝通徐冠雷

(海军大连舰艇学院大连116018)

为实现天气现象的自动观测,论文提出了一种基于贝叶斯分类的室外图像的天气现象识别方法,该方法通过提取图像的色相、饱和度和亮度等特征,采用贝叶斯分类,对雨天和雾天两类天气现象进行判断,但所选特征不能对雾天和雨天进行准确判断。

天气现象识别;图像处理;贝叶斯分类

Class NumberTP391

1 研究目的和现状

最近随着图像理解与智能视频技术的不断发展,对室外环境下各种天气现象,尤其是恶劣天气现象的自动检测与识别提供了必要条件。但是,目前天气现象的观测仍然主要依靠人工观测,天气现象信息的采集耗费了大量的人力和物力,而且人工观测受外界环境和地域条件影响较大,观测数据较少且不连续,因此近年来基于室外图像与视频数据的天气现象自动识别研究受到了较为广泛的关注[7]。

目前,人们在不同方向对各种天气现象进行分析并建模,取得了一定的成果。本文提出了一种通过提取的图像特征进行贝叶斯分类的天气现象识别与分类方法。该方法通过提取图像的色相、饱和度和亮度等特征,采用贝叶斯分类,对雨天和雾天两类天气现象进行判断。该方法可以进行连续观测,且能快速准确地识别天气现象。

2 贝叶斯理论和方法

Pearl通过结合专家系统,发展出贝叶斯理论的高级应用模型贝叶斯网络,并指出贝叶斯网络或许是概率推理中最普及的模型[12]。贝叶斯理论经过长期的发展与运用,其理论被很多学者运用到各行各业,是统计学中一支重要的理论。

贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法。该方法的核心为贝叶斯公式[11],其基本形式如下

式中,P(w)代表对w拥有的初始概率,即w的先验概率,它反映了关于w是一正确假设的机会的背景知识。P(x)代表将要观察的集合x的全概率,即在没有确定某一假设成立时x的概率。P(x|w)代表假设w成立的情形下观察到集合x的概率,即条件概率。P(w|x)代表给定集合x时w成立的概率,即w的后验概率,它反映了在看到集合x后w成立的置信度。

3 朴素贝叶斯模型的建立

在许多场合下研究贝叶斯的重点落在修订其后验概率的工作上。为了寻找给定集合x时可能性最大的假设w∈W(W为候选假设集合)。这种具有最大可能性的假设被称为极大后验假设,简记为wmap。即

wmap=arg·maxP(wn|xm)

(1)

应用到贝叶斯公式得到:

(2)

因为P(xm)是一个不依赖于wn的常量,去掉它可得到:

wmap=arg·maxP(xm|wn)P(wn)

(3)

为做好几种天气图像的识别,我们需要将实际问题与贝叶斯原理进行紧密的结合。实际上,图像的识别通常与饱和度、色相等要素有着密切的关联,即给定一组因子,对因子进行合理的分类和数据挖掘,就可以得到显著的相关关系,从而进行概率的优化与完善。我们可以将天气图像识别与朴素贝叶斯分类器结构相结合,以自变量表示图像的饱和度等要素,以因变量表示研究对象及图像所属的天气种类。显然,分类问题就可以直接用MAP假设来解决。

应用MAP假设分类,x的目标是在给定集合〈x1,x2,x3,…xm〉的情况下,得到最可能的w(x)的值。应用式(3)得到

w(x)map=arg·maxP(x1,x2,x3,…,xm|wn)P(wn)

(4)

现在要做的就是基于总集合估计上式中的两个概率值。估计每个P(wn)值很容易,只要计算每个wn出现在集合W中的频率就可以。然而,估计每个P(x1,x2,x3,…,xm|wn)的值不太可行,原因在于:首先,完整估计P(x1,x2,x3,…,xm|wn)值的时候复杂程度相当于学习一个贝叶斯网络,是一个比较难的问题。因此,为获得合理的估计,引入朴素贝叶斯分类器机构,假定:在给定自变量时其属性值之间是相互条件独立的。也就是说,在给定自变量集合的情况下,观察到的联合概率正好是每个单独属性值概率的乘积。

具体数学表达式如下:

(5)

将其带入式(4)可得到朴素贝叶斯分类器的分类公式:

(6)

式中,xj为预报因子x的第j个属性、概率P(wn)和P(xj|wn)可以通过计算集合中不同种类和属性值组合的出现频率来简单计算,计算公式如下

(7)

(8)

式中,n为集合的总个数,wi为集合中第i个要素,xij为第i个预报因子的第j个属性,δ(wi,wn)为一个二值函数,当wi=wn时为1,否则为0。

在大多数情况下,上述这种基于频率比例的方法是对概率的一个良好估计,但当接近零频率属性值出现的时候,就会导致这种概率估计产生一个有偏的过低估计概率。更极端的是,当零频率属性值出现时,就会使得某概率值为0,进而致使式(6)为0。为了避免此类问题的出现,Laplace估计常常被用来平滑上述所得概率,修改式(7)和(8)可得:

(9)

(10)

式中,nw为因变量种类的个数,nj为该预报因子属性的种类个数。

4 朴素贝叶斯模型的应用

运用朴素贝叶斯分类器来解决天气图像识别问题:根据图像的要素来判断图像中的天气属于哪一类。从试验数据中筛选一组数据集合(部分内容见表1),可以将因变量划分为两类:雾天WN和雨天WQ。

可以从原始数据中选取合适的自变量:色相均值X1、饱和度均值X2、亮度均值X3。其中每一类自变量可以将其划分为三种属性:

色相均值X1:X11∈[0,0.3);X12∈[0.3,0.6);X13∈[0.6,1];

饱和度均值X2:X21∈[0,0.3);X22∈[0.3,0.6);X23∈[0.6,1];

亮度均值X3:X31∈[0,0.3);X32∈[0.3,0.6);X33∈[0.6,1]。

表1 试验数据集合(部分)

现在给定一组自变量数值X:(X1=0.3367;X2=0.0699;X3=0.4849)来判断图像中的天气是雾天还是雨天。

显然,我们的任务是判断图像中的天气情况,确定所选图像天气情况W取值(WN或WQ)。为此,拿出图像中天气的一类情况进行考虑(其他类别同此分析),构建朴素贝叶斯网络分类器。因变量W的类别是WN,其他三个自变量X1、X2、X3分别代表色相均值、饱和度均值、亮度均值。根据朴素贝叶斯假设子结点之间没有任何的依赖关系,即自变量之间相互独立。wn(xij)map=arg·maxP(x1j|wn)P(x2j|wn)P(x3j|wn)其中j属于自变量的属性,根据给定的一组自变量数据和之前我们对自变量的属性分类,可以将上式改写为

wn(xij)map=arg·maxp(wn)p(x12|wn)

p(x22|wn)p(x33|wn)

为计算WN的值,需要从表1所示的集合中估计出概率:P(WN)、P(x12|WN)、P(x21|WN)、P(x32|WN)、P(WQ)、P(x12|WQ)、P(x21|WQ)、P(x32|WQ)等。

其中部分算法如下:

p(wn)=(50+1)/(100+2)=0.5

p(wQ)=(50+1)/(100+2)=0.5

P(x12/wN)=(39+1)/(50+3)=0.7547

P(x21/wN)=(48+1)/(50+3)=0.9245

P(x32/wN)=(31+1)/(50+3)=0.6038

P(x12/WQ)=(40+1)/(50+3)=0.7736

P(x21/WQ)=(40+1)/(50+3)=0.7736

P(x32/WQ)=(30+1)/(50+3)=0.5849

可以将处理后的所有条件概率汇总于表2、表3。

表2 雾WN条件下自变量各属性的条件概率

表3 雨WQ条件下自变量各属性的条件概率

所以有:

wN=arg·maxp(wN)p(x12|wN)

p(x21/wN)p(x32|wN)=0.2106

wQ=arg·maxp(wQ)p(x12|wQ)

p(x21|wQ)p(x32|wQ)=0.1750

可见,朴素贝叶斯分类器将该图像的天气现象归为雨WQ类。将上述概率进行归一化,可得到朴素贝叶斯分类器对该图像天气现象的识别概率:

上述概率即为修订后的后验概率,当然它们彼此之间没有可比性,因为历史资料告诉我们它们各自出现的概率本来就不是平均的。所以再引入增长率ζ,它表示后验概率在其对应的先验概率的基础上的增量。此时再结合增长率之间的大小就可以对该天的天气现象做出相应的预报。

如天气现象预报情况为:最有可能出现雾WN,且出现的概率为PQ=54.62%。而所选图像为雨天气,这与我们所得结果不吻合。通过计算得出的识别概率也可以发现,雾天和雨天的识别概率相差很小,不足以对两类天气进行区分,说明所选特征不适用于区分雾天和雨天。若想进一步区分两类天气,需要另外选取显著特征。

5 结语

本文提出了一种基于贝叶斯分类方法的天气图像自动识别方法。主要是对雨天和雾天两种天气图像进行识别分类,通过数字图像处理提取图像的色相、饱和度和亮度等特征,采用贝叶斯分类,建立贝叶斯分类模型,通过仿真验证了该模型的有效性,但是准确性不高,若想准确区分雾天和雨天,需选取雾天和雨天存在的不同的显著特征进行判断。

[1]蒋良孝.朴素贝叶斯分类器及其改进算法研究[D].武汉:中国地质大学(武汉),2009.

[2]张红艳,李茵茵,万伟.改进K近邻和支持向量机相融合的天气识别[J].计算机工程与应用,2014,14:148-151,167.

[3]彭丽玲.基于图像灰度的天气变化机理及应用初步研究[D].昆明:昆明理工大学,2013.

[4]段晶.朴素贝叶斯分类及其应用研究[D].大连:大连海事大学,2011.

[5]董立岩,苑森淼,刘光远,等.基于贝叶斯分类器的图像分类[J].吉林大学学报(理学版),2007(2):249-253.

[6]陈爱霞,杜友福,陈中举.图像识别的应用现状和研究方向[J].中国科技信息,2015(16):1-2.

[7]李骞,范茵,张璟,等.基于室外图像的天气现象识别方法[J].计算机应用,2011(6):1624-1627.

[8]Xu Guanlei,Wang Xiaotong,Xu Xiaogang.Improved Bi-Dimensional Empirical Mode Decomposition based on 2D Assisted Signals Analysis and Application[J].IET Image Processing,2011,5(3):205-221.

[9]徐冠雷,王孝通,徐晓刚等.基于限邻域EMD的图像增强[J].电子学报,2006,34(9):1635-1639.

[10]陈法敬,矫梅燕.亚高斯贝叶斯预报处理器及其初步试验[J].气象学报,2011,69(5):872-882.

[11]张洁.基于图像识别的农作物害虫诊断技术研究与应用[D].合肥:中国科学技术大学,2014.

[12]徐峰.基于数据库的叶片识别系统[J].产业与科技论坛,2015(12):42-43.

[13]张志斌,赵帅领,罗锡文,等.基于SURF算法的绿色作物特征提取与图像匹配方法[J].农业工程学报,2015(14):172-178.

[14]Bayes T.R..An Essay Towards Solving a Problem in the Doctrine of Chances[J].Pholosoph.Transaction of the Royal Soc.,London,1763,53:370-418.

[15]Pearl J.Probabilistic Reasoning Intelligent sysyems:Networks of Plausible Infrence[J].Morgan Kaufmmann,San Mateo,California,1998(15):235-238.

[16]Gonzalez R C,Woods R E..Digital Image Processing Second Edition[M].北京:电子工业出版社,2007:3-8.

[17]H.Katsura,J.Miura,M.Hild,and Y.Shirai.A view based outdoor navigation using object recognition robust to changes of weather and seasons[C]//IROS,2003.

[18]M.Roser and F.Moosmann.Classification of weather situations on single color images[C]//IEEE Intelligent Vehicles Symposium,2008.

[19]X.Yan,Y.Luo,and X.Zheng.Weather recognition based on images captured by vision system in vehicle[C]//CVPR,2009.

Automatic Recognition of Two Different Weathers of Foggy and Rainy Based on Bayesian Classification

YU HaoWANG XiaotongXU Guanlei

(Dalian Naval Academy,Dalian116018)

To achieve the automatic observation of weather situations,a method based on Bayesion classification to recognize weather situations in outdoor images is presented.It extracted such parameters as hue,saturation and brightness as features to judge the weather situations of foggy and rainy with Bayesian classification.But the judgement is not accurate with the selected features.

automatic identification of the weather,image processing,Bayesian classification

2016年3月11日,

2016年4月21日

国家自然科学基金项目(编号:61002052,61471412,61250006)资助。

于浩,男,硕士研究生,研究方向:图像处理与识别。王孝通,男,博士后,教授,研究方向:导航、电子海图和图像处理与识别。徐冠雷,博士,讲师,研究方向:物理海洋与气象,图像处理与识别。

TP391DOI:10.3969/j.issn.1672-9730.2016.09.019

猜你喜欢
雾天天气现象贝叶斯
《奇怪的天气:关于天气的50个秘密》
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
为什么在雾天不适宜进行晨练
与龙卷风共舞
新巴尔虎左旗常见天气现象分析
雾天尽量减少室外运动
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
天气现象的隐喻化方式分析