基于小波核双重加权SVM模型的蓝藻水华识别与变化检测

2013-12-11 04:02
上海国土资源 2013年4期
关键词:淀山湖水华蓝藻

潘 琛

(上海市测绘院,上海 200063)

工业化与城市化的快速发展,使大量废水流入湖泊,造成水体富营养化[1,2],容易导致蓝藻水华暴发,严重破坏水体景观,产生藻毒素,直接威胁生态系统安全[3~5]。我国湖泊河流众多,水环境污染问题尤为显著[6,7]。据统计,我国66%以上的湖泊和水库已处于富营养化水平,其中22%属于重富营养和超富营养。而藻类水华的暴发则是水体营养化污染的代表之一,为此治理并预防蓝藻水华刻不容缓。监测蓝藻水华的时空动态特性及规律,并找出影响其分布的主要因素,对蓝藻水华的预警与有效防治,具有十分重要的意义。

从国内外富营养化及蓝藻水华的监测工作来看,叶绿素在藻类物质中所占的比例比较稳定,且易于在实验室定量测量,因此叶绿素浓度常作为反映水体营养化程度的一个重要参数。传统的人工实时实地的调查方法可精确测定某一位置上的表面叶绿素浓度,但成本高、耗时长,并很难对大面积湖泊的藻类的时空动态分布和变化做出全面的调查,具有一定的局限性。近年来蓝藻水华的卫星遥感研究取得了较大进展[8~10],主要体现在应用各种不同的卫星遥感数据进行蓝藻的遥感监测方面。蓝藻覆盖区的光谱特征与水面有着较为明显的差异,这种光谱特征被卫星的探测器记录下来,通过对卫星遥感数据的分析、处理,能够快速、有效地识别蓝藻及其空间分布和分析蓝藻暴发的动态过程[11]。

本文以淀山湖为研究区,利用2000年和2009年夏季的四期遥感影像,在分析蓝藻和其它典型地物影像光谱曲线及其特征的基础上,试图构建一种适合于对大面积水域蓝藻控制关键区域进行地物识别的技术,实现水华空间分布格局的识别与检测,以此为淀山湖蓝藻水华的防治和水生生态系统的保护提供科学依据。

1 研究区概况

图1 淀山湖所在地理位置Fig.1 Geographical location of Dianshanhu Lake

淀山湖位于江浙沪交界,地理位置为 120˚54'~121˚01'E、30˚02'~31˚04'N,总面积约62km2(图1),是上海境内最大的天然淡水湖泊,也是黄浦江上游的重要水源保护区和主要航道。淀山湖水质的好坏,直接影响上海市民的饮用水质量。但近十几年来,水体质量不断下降,综合水质标准由过去的以ΙΙ类为主下降到目前的ΙV~V类[12,13]。据相关统计,最近几年,淀山湖区域每年均发生以微囊藻为主的蓝藻水华暴发,大规模暴发达28次,计59天。

2 研究方法

2.1 蓝藻水华识别方法

在研究区域,利用Landsat系列遥感影像,在大气层顶表观反射率反演的基础上,构建了归一化蓝藻指数,结合波段组合和Gabor滤波器构建多特征空间,并基于变精度粗糙集和灰色关联决策相结合的方法进行特征空间的优化。在此基础上,采用小波核双重加权SVM分类模型,得到研究区蓝藻水华空间分布格局的识别与变化检测结果,最后根据实地采样数据检核和分析了遥感影像的识别与检测结果。技术路线如图2所示:

图2 蓝藻水华识别技术路线Fig.2 Technical approach for detection of cyanobacteria bloom

2.2 遥感影像处理

(1)遥感影像预处理

本文选取2000 年8月1日和9月2日获取的Landsat7 ETM+影像、2009年7月17日和8月25日获取的Landsat5 TM影像,空间分辨率30 m,选用6个波段(1~5和7波段),成像质量和成像时的天气状况都比较理想。在进行指数提取与蓝藻覆盖区识别之前,对各期影像进行大气层顶表观反射率反演,就是将数字图像中的DN(Digital Number)值转化为大气层顶表观反射率,以近似取代需要大气校正之后得到的地表反射率,用于以下实验的特征提取和蓝藻检测,如图3为研究区反射率反演后的假彩色影像。

图3 研究区反射率假彩色影像(RBG-543)Fig.3 Color images of the research area (RGB-543)

(2)基于影像光谱分析的归一化蓝藻指数(NDΙ_CB)构建

综合考虑3~5三个波段,如果分别将波段4与波段3、波段5与波段4进行差值处理,发现蓝藻水华和浑浊水体的趋势截然相反,并且当蓝藻浓度很低时,这种趋势依然显著。因此,综合考虑此三个波段的谱间关系,构建了归一化蓝藻指数(normalized difference cyanobacteria bloom index,NDΙ_CB),具体方法与分析见文献[14],计算方法如式(1)~(3):

式中,B3、B4、B5分别表示波段3、4、5的光谱值(亮度值或是反射率)。

(3)多特征空间优化

本实验的多特征空间由光谱维特征集与纹理维特征集构成,提出变精度粗糙集(VPRS)[15]和灰色关联决策(GΙD)[16]相结合的特征优化模型(VPRS_GΙD)对特征空间进行优化,其详细过程参见文献[17]。

优化后的多特征空间共包含10个特征,分别为:

①影像波段组合:对影像光谱分析,发现3、4、5波段有利于蓝藻提取,因此选择这三个波段的组合。

②归一化蓝藻指数(NDΙ_CB)[14]。

③最佳指数特征组合:建立适于蓝藻或水体提取的归一化差值植被指数(NDVΙ)、比值植被指数(RVΙ)、归一化差异水体指数(NDWΙ)、改进型归一化差异水体指数(MNDWΙ)和新型水体指数(NWΙ)等5种指数特征[18]。然后利用灰色关联决策(GΙD)方法选择最佳特征组合(组合数为3),每期影像的最佳指数特征组合见表1。

表1 最佳指数特征组合Table 1 The best combination of index features

表2 最佳Gabor滤波器纹理特征组合Table 2 The best combination of Gabor textural features

(4)样本选取

蓝藻在湖泊中有时漂浮于水面以下,因此很难获取蓝藻暴发的清晰影像,这对于选择样本提取蓝藻也带来了很大困难。2009年进行了频繁的淀山湖生态调查,结合7月16日~20日、8月25日~30日的实际调查资料,7月17日影像选取70个蓝藻样本、489个湖泊水体样本,8月25日影像选取60个蓝藻样本、261个湖泊水体样本。2000年没有地面调查数据,但是影像中的蓝藻较为清晰,考虑到地物的光谱结构和特征,结合生态学分析数据,8月1日影像选取100个蓝藻样本、421个湖泊水体样本,9月2日影像选取80个蓝藻样本、435个湖泊水体样本。

3 基于小波核双重加权SVM蓝藻识别模型的识别与检测

3.1 基于小波核的双重加权SVM蓝藻识别模型

核函数的构建和选择在某种程度上决定了SVM决策的复杂度和准确性,也可以说,在支持向量机理论中,模型的选择就是核函数的选择[19,20]。加权能进一步提高SVM算法的泛化能力和分类性能,目前对传统SVM进行加权的方式主要有三种:(1)对不同类别赋以权重;(2)对每个样本赋以权值;(3)对每个特征属性赋以权重。本实验选择第(1)和第(3)两种方式对SVM进行加权,提出了一种类别样本数差异与特征重要性差异相结合的双重加权方法。

基于类别样本数差异加权的支持向量机优化问题可描述为:

式中λyi为类别权重,由式(5)给定:

式中,li为类别yi的样本数。

对于数量大的类别,通过赋予小的权值,使其错分率上界增大;而对于数量小的类别,通过赋予大的权值,使其错分率上界下降,从而起到平衡作用。

在特征加权中,权重向量ω的求取是关键。特征权重的计算通常是根据某种度量方法来度量特征的重要性,从而量化特征与给定类别之间的相关性。本文采用基于信息增益(比)率的评价函数[21]进行特征相关分析,计算公式如下:

式中, 表示特征A中包含的信息熵;表示利用A对集合划分所获得的信息增益。

在此基础上,本文提出的基于小波核[22]的双重加权SVM模型,将小波核函数和以上双重加权方式相结合,既利用了小波分析在影像细节方面具有的良好表现能力,又平衡了不同样本类别分类的正确率,并能有效避免被弱相关或不相关特征所支配[23,24]。基于小波核的双重加权SVM分类模型可描述为:

3.2 蓝藻空间格局的识别与检测结果

基于上节中建立的小波核双重加权SVM分类模型得到蓝藻识别结果,并在此基础上分别检测出两个年份内的蓝藻暴发、漂移、消减等变化情况,如图4和图5所示。

图4 2000年淀山湖蓝藻识别与检测结果Fig.4 Classif i cation and detection results of Dianshanhu Lake cyanobacteria bloom in 2000 year

图5 2009年淀山湖蓝藻识别与检测结果Fig.5 Classif i cation and detection results of Dianshanhu Lake cyanobacteria bloom in 2009 year

选择蓝藻较为明显的2000年8月1日影像进行误差矩阵统计,见表3所示。

从上表可以看出,本文使用的基于小波核双重加权SVM分类模型能够有效地利用多特征空间数据,准确地识别出蓝藻覆盖区(包括较低浓度蓝藻覆盖区),满足环境调查的要求。

根据图5(c)的2009年蓝藻空间格局变化检测结果,计算得到淀山湖未变化蓝藻区域、增加的蓝藻区域和减少的蓝藻区域面积分别为:5.3208km2、7.4142km2和3.7503km2。其中增加的蓝藻区域面积最大,说明由于温度、风向等气象因素,2009年8月为淀山湖蓝藻水华暴发的严重时间段,形成了大量的蓝藻堆积区域。

表3 误差矩阵(2000年8月1日)Table 3 Error matrix (August 1,2000)

4 结论

基于以上蓝藻识别实验与分析,得出以下结论:

(1)本文构建的用于分类后变化检测的分类模型,主要由小波核函数和双重加权方式两个重要部分组成。该模型既利用了小波分析在影像细节方面具有的良好表现能力,又平衡了不同样本类别分类的正确率,并能有效避免被弱相关或不相关特征所支配,因此在实际环境问题的变化监测中具有很好的应用效果。

(2)通过观察变化检测结果可以发现,七八月的蓝藻生物量显著增加区域主要发生在湖西北部(近各入湖河道处)。而现场调查显示,这段时间内受到季风区主导风向影响,加上上游水量增加,导致上游各湖泊中的蓝藻大量下泄进入淀山湖。因此检测数据显著地反映出了这一特点。

笔者认为,蓝藻水华的识别多是基于反射率光谱特征进行的。而对于混浊水体而言,由于其光谱特征复杂,不同时间、地点水体中藻的成分、比例不同,光谱特征也就存在差异,要提高识别和检测的精度,还需加强对混合藻水体光谱特征的研究。另一方面,要准确获取水体的光谱特征,需要传感器具有较高的光谱分辨率、空间分辨率和时间分辨率。目前受数据源限制,还不能详尽获得蓝藻水华暴发期高频率的空间格局变化信息,因此深化研究受到一定局限。

References)

[1]张宏仁. 中国的淡水资源问题[J]. 上海地质,2001,22(3):1-9.

Zhang H R. The problems of freshwater resources in China[J].Shanghai Geology, 2001,22(3):1-9.

[2]中国科学院院士林学钰教授接受本刊专访. 水土环境质量保护是国土资源管理的重要内容[J]. 上海国土资源,2011,32(1):1-7.

Lin X Y. Soil and water quality protection is the important part of land and resources management[J]. Shanghai Land & Resources,2011,32(1):1-7.

[3]任致远. 关于城市生态文明建设的拙见[J]. 上海城市规划, 2013,(1):68-74.

Ren Z Y. Views on the Construction of Urban Ecological Civilization[J]. Shanghai Urban Planning Review, 2013,(1):68-74.

[4]王祥荣,凌焕然,黄舰,等. 全球气候变化与河口城市气候脆弱性生态区划研究—以上海为例[J]. 上海城市规划,2012,(6):1-6.

Wang X R, Ling H R, Huang J, et al. Global climate change and strategy of eco-zoning for climate vulnerability of estuary city:A case study of Shanghai[J]. Shanghai Urban Planning Review,2012,(6):1-6.

[5]苏晶文,姜月华,李云峰,等. 区域地质环境功能区划方法研究[J].上海国土资源,2013,34(1):10-13,18.

Su J W, Jiang Y H, Li Y F, et al. Geological environment function zoning[J]. Shanghai Land & Resources, 2013,34(1):10-13,18.

[6]肖裕生,钟华平,谢石连. 浅谈太湖流域饮用水安全与地下水保护[J]. 上海地质,2008,29(1):18-20,43.

Xiao Y S, Zhong H P, Xie S L. Safety of drinking water and groundwater protection in Taihu Lake basin[J]. Shanghai Geology,2008,29(1):18-20,43.

[7]华解明. 城市应急供水水源地建设的意义—由太湖水污染的思考[J]. 上海地质,2008,29(1):5-7,17.

Hua J M. The significance of city emergency supply water:Thinking of water pollution in Taihu Lake[J]. Shanghai Geology,2008,29(1):5-7,17.

[8]陈基伟,李俊祥. 特大城市地表水遥感信息系统研究[J]. 上海地质,2004,25(4):7-10.

Chen J W, Li J X. Research on metropolitan surface water GΙS using remote sensing technology[J]. Shanghai Geology,2004,25(4):7-10.

[9]陆佩华,沈清基. 基于RS和GΙS的城市生态敏感区研究[J]. 上海城市规划,2012,(6):7-13.

Lu P H, Shen Q J. RS and GΙS based approach to the study of ecologically sensitive area[J]. Shanghai Urban Planning Review,2012,(6):7-13.

[10]房浩,何庆成,戚琦. 基于GΙS应用DATUW模型评价地下水环境脆弱性[J]. 上海国土资源,2012,33(1):62-66,70.

Fang H, He Q C, Qi Q. Assessing the vulnerability of groundwater environments using the DATUW model and GΙS[J]. Shanghai Land & Resources, 2012,33(1):62-66,70.

[11]刘建萍,张玉超,钱新,等. 太湖蓝藻水华的遥感监测研究[J]. 环境污染与防治,2009,(8):79-83.

Liu J P, Zhang Y C, Qian X, et al. Review of cyanobacteria remote sensing in Taihu Lake[J]. Environmental Pollution & Control,2009,(8):79-83.

[12]王张峤,彭松. 上海市水环境变化初步研究[J]. 上海地质,2002,23(4):31-36.

Wang Z Q, Peng S. A primary investigation of water environment of Shanghai in recent 15 years[J]. Shanghai Geology, 2002,23(4):31-36.

[13]王洁华. 上海市废水排放与处理的现状及对策研究[J]. 上海地质,2010,31(1):38-41.

Wang J H. The present situation and countermeasures study for discharge and dispose of waste water in Shanghai[J]. Shanghai Geology, 2010,31(1):38-41.

[14]林怡,潘琛,陈映鹰,等. 基于遥感影像光谱分析的蓝藻水华识别方法[J]. 同济大学学报(自然科学版),2011,39(8):1247-1252.

Lin Y, Pan C, Chen Y Y, et al. Recognition of cyanobacteria bloom based on spectral analysis of remote sensing imagery[J]. Journal of Tongji University (Natural Science),2011,39(8): 1247-1252.

[15]谢锋. 粗糙集在遥感影像专题信息提取中的应用研究[D]. 上海:同济大学,2008.

Xie F. Research on thematic information extraction from remote sensing image based on rough sets[D]. Shanghai: Tongji University,2008.

[16]袁林山,杜培军,王莉,等. 基于灰色绝对关联度边缘检测的多源遥感影像加权HΙS融合[J]. 地理与地理信息科学,2008,24(3):11-15.

Yuan L S, Du P J, Wang L, et al. Weighted HΙS fusion of multi-source remotely-sensed image based on edge detection using grey absolute correlation degree[J]. Geography and Geo-Information Science,2008,24(3):11-15.

[17]潘琛. 面向环境空间格局的遥感影像变化检测技术研究[D]. 上海:同济大学,2011.

Pan C. Research of change detection technology using remotely sensed imagery oriented to environmental spatial patterns[D].Shanghai: Tongji University, 2011.

[18]曹宇,陈辉,欧阳华,等. 基于多项植被指数的景观生态类型遥感解译与分类[J]. 自然资源学报,2006,21(3):481-488.

Cao Y, Chen H, Ouyang H, et al. Landscape ecological classification using vegetation indices based on remote sensing data: a case study of ejin natural oasis landscape[J]. Journal of Natural Resources,2006,21(3):481-488.

[19]Vapnik V N. Statistical Learning Theory[M]. New York: Springer,1998.

[20]Scholkopf B, Smola A, Bartlett P L. New support vector algorithms[J]. Neural Computation, 2000,12(5):1207-1245.

[21]汪廷华,田盛丰,黄厚宽. 特征加权支持向量机[J]. 电子与信息学报,2009,31(3):514-518.

Wang T H, Tian S F, Huang H K. Feature weighted support vector machine[J]. Journal of Electronics & Information Technology,2009,31(3):514-518.

[22]李元诚,方廷健. 小波支持向量机[J]. 模式识别与人工智能,2004,17(2):167-172.

Li Y C, Fang T J. Wavelet support vector machines[J]. Pattem Recognition and Aitif i cial Intelligence, 2004,17(2):167-172.

[23]Haralik R. M.. Statistical and structural approaches to texture[J].Proceedings of the ΙEEE, 1975,67(5):786-804.

[24]Scholkopf B, Burges C, Smola A. Advances in Kernel Methods:Support Vector Learning[M]. Cambridge, MA, USA: MΙT Press,1999: 373.

猜你喜欢
淀山湖水华蓝藻
藻类水华控制技术及应用
南美白对虾养殖池塘蓝藻水华处理举措
南美白对虾养殖池塘蓝藻水华处理举措
针对八月高温蓝藻爆发的有效处理方案
芦苇在淀山湖是站不稳的〔外一首〕
淀山湖水环境综合治理工作的实践与思考
可怕的蓝藻
昆山市淀山湖镇河道水体生态修复分析研究
油酸酰胺去除蓝藻水华的野外围隔原位试验
淀山湖夏秋季浮游植物优势种生态特征分析