张建伟,雷 霖,陈二阳,赵永鑫
(成都大学电子信息工程学院,四川 成都 610106)
降雨量贝叶斯分类器的泥石流预测研究
张建伟,雷 霖,陈二阳,赵永鑫
(成都大学电子信息工程学院,四川 成都 610106)
泥石流是一种危害程度很高的地质自然灾害,其预测的准确性有着极其重要的现实意义.为了能够更有效地对泥石流进行预测,提出了一种基于降雨量贝叶斯分类器的泥石流预测方法.首先根据某地域历年来的降雨量和泥石流数据进行学习和训练,然后对贝叶斯分类器的参数进行确定,最后用该分类器对某地近几年的降雨量和泥石流数据进行计算和验证.实验表明,该贝叶斯分类器可以有效地通过降雨量数据来实现对该地域泥石流发生的预测,通过数据库比对确定其正确率达到85%.
降雨量;泥石流;贝叶斯;分类器
四川地区由于地形复杂多变,涵盖高原、盆地、山脉、丘陵等各种地形,是我国的一个地质灾害多发的区域[1].泥石流是一种山区中常见的固、液二相输移现象,其中固、液主要是指泥沙、石块等[2],泥石流的形成与多种因素相关,例如地形、土壤、植被、降雨量等[3].本研究通过对某区域地质、植被等条件相对固定的前提下的降雨量分析来实现对泥石流的预测,并从信号与信息处理的角度,将模式识别的分类器[4]引入到灾害数据分析中,通过对历史的数据进行学习和训练,以达到预测未来泥石流发生的可能情况.
预测泥石流的前提就是要采集预测所需要的数据,而这些数据中,最重要的、最多变的就是降雨量,为了更方便地得到更准确的降雨量数据并为后期的预测做好基础,本研究采用了基于ZigBee[5]无线传输的方式采集方案.为了能够形成“自组织"通信网络,其控制内核仍然采用具有 ZigBee通信的CC2431芯片进行控制,该芯片能够与雨量监测终端兼容,形成统一无线传感网络.与此同时,雨量终端和环境数据采集终端可相互实现其监测信息的路由传输和无线通信.图1为ZigBee检测终端框架示意图.
图1 ZigBee检测终端框架示意图
贝叶斯分类器作为分类器中最为经典的分类器,基于贝叶斯的分类器按照其风险决策的选择分为:基于最小错误率的贝叶斯决策、基于最小风险的贝叶斯决策、最小最大决策等.针对本研究的特点,选择基于最小错误率的贝叶斯决策.
在基于最小错误率的贝叶斯决策中,主要考虑的就是分类错误率最小,不同的应用中有不同的物理含义.以基于降雨量的泥石流决策为例,其决策的2个类结果就是发生泥石流和不发生泥石流,由于百分之百的决策是不可能的,因此这里只能将错误的分类概率降到最低.在普通的决策中,最常用到的一个量就是先验概率,对于泥石流来说在一年中降雨就发生泥石流的概率为P(ω1),降雨未发生的概率为P(ω2),仅仅依靠先验概率2个值来决策的话,就可以认为如果P(ω1)>P(ω2),那么就会发生泥石流,否则就不会发生.但这样的信息量太少,做出的决策错误率太高,几乎不能实际应用.为了提高贝叶斯分类决策的实际可应用性,本研究将后验概率的概念引进决策中.所谓后验概率,即是通过引入观测量后所得到的概率,观测量可以由多维向量组成.这里假设观测量只有一个,日降雨量为d,其后验概率就可以表示为P(ωi/d),也就是在d出现的情况下发生泥石流或不发生泥石流的概率.按照贝叶斯公式,
其中,P(d/ωi)为后验概率密度.
这样,最终进行分类决策就不仅仅是依靠先验概率那么简单,而是有了更多的后验信息,
本研究所设计的分类器是以一个区域中多年的降雨量与泥石流发生数据作为样本进行训练的,在这种情况下,其他的数据都可以看成为定值.在本研究中,数据来源于川南攀东与云南交界地区的泥石流与降雨量资料.
在贝叶斯分类器设计中,使用VC++中的MFC进行软件的界面设计,该软件可以读取来自网络传输到计算机中的降雨量数据信息.贝叶斯分类器的先验概率和类概率密度函数很容易根据前几年该地区的实际数据训练后得到,降雨量本身也包含了很多参数量,例如月降雨量、10日降雨量、单日降雨量以及 10 min 降雨量(也称为雨强)[6-8],从地质灾害学来看,单日降雨量对泥石流的影响权重最高,往日的降雨量也起到很大的作用.因此,本研究按照近2日的平均降雨量作为一维观测量进行贝叶斯分类器设计,并设ω1表示发生泥石流,ω2表示未发生泥石流,P(ω1)表示发生泥石流的先验概率,P(ω2)表示未发生泥石流的先验概率,p(x/ωj)表示发生或未发生泥石流的类条件概率密度,P(ωj/d)为发生或未发生泥石流的后验概率.根据公式(1)可以得到以下贝叶斯分类器的决策规则.
规则 若P(ω1/d)>P(ω2/d),则决策结果为发生泥石流,反之,P(ω1/d)<P(ω2/d),则决策结果为不发生泥石流.
根据2001~2003年,川南攀东与云南交界地区的泥石流和降雨量实际数据,该区域共发生330次日降雨,发生泥石流的次数为32次,由此可得到发生泥石流的先验概率为0.096,未发生的概率为0.904.同样,可以按照后验概率的定义统计得到日降雨量分类器的每种降雨量后验概率.此时,可以通过统计直接得到后验概率而不通过条件概率密度,使用这些参数就可以建立基于最小错误概率的贝叶斯分类器.
为了验证该分类器的效果,本研究采该区域2010年全年的泥石流与其最近2日降雨量的数据进行检测,结果如表1所示.
表1 2010年某地泥石流数据
为了简化繁多的数据,实际发生泥石流及其预测的情况如表2所示.
表2 2010年泥石流数据预测对比
由表2可以看出,2010年该地区共发生了6次泥石流,其中2次预测错误,第一次是7月23~24日的5.2 mm降雨量时发生了泥石流,而贝叶斯分类器预测未发生;第二次是8月4~5日的2.7 mm降雨量时发生了泥石流.对于未列出的发生了降雨而未发生泥石流的情况共46次,有6次预测为发生而实际未发生.从得到的泥石流总流量数据来看,降雨量小的时候泥石流的总流量也相对较小.因此,从风险控制的角度来讲,预测错误的风险还是相对较小的.综合来看,52次降雨,8次预测错误,预测的准确率为85%.
对于发生预测失误的原因,从降雨量的数据分析可见,表中2次实际发生预测为未发生的失误是由于预测时间之前2~3日都出现了较大的降雨;在6次实际未发生却预测为发生的失误是由于预测时间之前2~3日甚至4~5日都几乎没有任何降雨.因此,降雨量的持续影响在本分类器中并未体现.但本方法并不需要考虑降雨量以外的其他因素[9-10],简化了预测的复杂度,因此具有一定的研究与实际应用价值.
基于最小错误概率的贝叶斯分类器可以在不同的地区通过其历史数据自动建立泥石流预测模型,而不过分依赖于其他如地质、地形等因素,适应性较好.从实验验证结果也可以看出,基于最小错误概率的贝叶斯分类器用于通过降雨量来预测泥石流发生的思路,在降雨量大的时候预测较为准确,而在降雨量小的时候其预测结果准确度不够,对于风险控制来说,已经达到最小,且从总体上看,效果较好.需说明的是,由于本研究得到的实际数据有限,用现有的验证数据其准确率已达到了85%,并且一维的观测量信息量有限还会造成一定的误判.因此,通过采用更多维的观测量来提高本方法预测的准确率是下一步研究工作的方向.
[1]苏鹏程,刘希林,郭洁.四川泥石流灾害与降雨关系的初步探讨[J].自然灾害学报,2006,15(4):19 -23.
[2]白永峰.成昆线暴雨泥石流预报量化方法的探讨[J].土壤侵蚀与水土保持学报,1998,4(3):67-72.
[3]李大鸣,吕会娇.山区暴雨泥石流预报数学模型的研究[J].中国农村水利水电,2011,53(6):24 -28.
[4]边肇祺.模式识别[M].北京:清华大学出版社,1999.
[5]庞泳,李光明.基于ZigBee的智能家居系统改进研究[J].计算机工程与设计,2014,36(5):1547 -1550.
[6]孙伟,高峰.暴雨型泥石流预报中的降水因子[J].安徽农业科学,2010,38(12):6287 -6288.
[7]倪化勇,王德伟.基于雨强条件的泥石流预测预报研究现状、问题与建议[J].灾害学,2010,25(1):124 -128.
[8]田冰,王裕宜,洪勇.泥石流预报中前期降水量与始发H降水量的权重关系——以云南省蒋家沟为例[J].水土保持学报,2008,28(2):71 -78.
[9]李大鸣,吕会娇.山区暴雨泥石流预报数学模型的研究[J].中国农村水利水电,2011,6(1):24 -28.
[10]康志成,李焯芬,马蔼乃,等.中国泥石流研究[M].北京:科学出版社,2004.
Debris Flow Prediction Based on Rainfall Bayes Classifier
ZHANG Jianwei,LEI Lin,CHEN Eryang,ZHAO Yongxin
(School of Electronic and Information Engineering,Chengdu University,Chengdu 610106,China)
Debris flow is very detrimental natural disaster with serious destructiveness.The precise prediction of debris flow plays quite important role.In order to predict debris flow effectively,this paper proposes an prediction method based on rainfall Bayes classifier.First of all,training and learning are made by the debris flow and rainfall data of certain area.Then,the parameters of the Bayes classifier are determined.At last,the latest data of debris flow and rainfall are computed and verified by this classifier.The experimental results show that the Bayes classifier can predict the debris flow status by the rainfall data effectively,and the correction ratio reaches 85%by database comparison.
rainfall;debris flow;Bayes;classifier
P642.23
A
1004-5422(2015)01-0094-03
2015-01-09.
四川省科技厅科技支撑计划(13ZC1371)资助项目.
张建伟(1980—),男,博士,讲师,从事计算机图像处理与模式识别研究.