李 瑶,张立福,黄长平,王晋年,岑 奕
1.中国科学院遥感与数字地球研究所,遥感科学国家重点实验室,北京 100101 2.中国科学院大学,北京 100049
基于MODIS植被指数时间谱的太湖2001年—2013年蓝藻爆发监测
李 瑶1, 2,张立福1*,黄长平1,王晋年1,岑 奕1
1.中国科学院遥感与数字地球研究所,遥感科学国家重点实验室,北京 100101 2.中国科学院大学,北京 100049
藻类水华爆发已成为影响内陆水体生态环境的重要因素。遥感能够提供实时的大范围观测,在水华监测中起到越来越重要的作用。遥感植被指数已广泛应用于藻类水华监测中,通过对研究区植被指数图像进行阈值分割,能够反映不同子区域内的藻类爆发程度; 然而阈值分割法的结果只能反映某一时间点(图像获取时)的藻类爆发状况,无法表征长时间内藻类的变化。相比于单个时间点的植被指数,植被指数时间谱(时谱)包含藻类的物候信息,能够更加全面准确地反映藻类的长时间变化。目前,植被指数时间谱还尚未应用到水华相关研究中。选取2001年—2013年太湖区域的MODIS NDVI数据,构建年度NDVI时谱数据,利用(support vector machine, SVM)方法对每年的太湖蓝藻水华爆发强度进行分类,将太湖重度、中度和轻度蓝藻水华爆发的区域以及水生植物的区域提取出来,得到其空间分布和面积; 并从2007年的时谱数据中抽取了8个时间点的NDVI图像,利用传统阈值分割法提取太湖重度、中度和轻度蓝藻水华爆发的区域,将结果与2007年时谱数据分类的结果进行对比。结果表明:所提出的方法能够更加全面准确地对太湖蓝藻爆发强度进行分类,通过NDVI时谱曲线提供的丰富物候信息可准确区分蓝藻与水生植被区域。本研究有望为准确掌握和预测藻类水华的爆发趋势及强度提供有效手段。
MODIS; 时谱; 太湖; 蓝藻水华; 支持向量机; 监测
富营养化使得内陆水体藻类爆发越来越频繁,藻类水华爆发破坏湖泊生态系统平衡,引起水体污染,威胁人类生活,如何有效地预防与治理水华爆发已成为亟待解决的问题。随着水华爆发频率和强度的增加,传统的实地观测和实验室分析已经难以满足水华监测的需求。遥感的发展为水华的监测提供了丰富的数据源,与传统监测方法相比,遥感具有实时、迅速、范围广等特点,在湖泊监测中发挥着越来越重要的作用。
目前,遥感手段监测藻类爆发主要利用植被指数数据,如归一化植被指数(normalized difference vegetation index, NDVI)[1-2]、归一化水体指数(normalized difference water index, NDWI)[3]、增强型植被指数(enhanced vegetation index, EVI)[2]、藻类爆发指数(floating algae index, FVI)[4-5]、最大叶绿素指数(maximum chlorophyll index, MCI)[6]等已有研究表明,遥感植被指数能够比较准确地提取藻类爆发的信息,为水华监测提供了有效手段。
目前研究主要使用单个时间点的植被指数,尚未使用植被指数时谱数据。如果要评估较长时间间隔内(例如,季度和年度)水华的爆发情况,仅使用某几个时间点的植被指数很难全面准确地反映藻类水华爆发的强度和范围,因为同一像元在不同时间点的植被指数可能会有很大差别,若选取的时间点不具代表性,很可能造成误判。根据蓝藻水华成因的四阶段理论[7],蓝藻的生长和水华的形成可以分为休眠、复苏、生长和上浮聚集四个阶段。冬季,蓝藻下沉到水底休眠越冬; 春季,当温度和溶解氧达到要求,蓝藻将开始复苏; 春夏季蓝藻的生长主要受控于光合作用和细胞分裂所需要的能量和物质; 当遇到适宜的水文和气象条件,积累在水体中的蓝藻将会上浮并聚集到水体表面,形成水华。时谱数据充分利用了一年内连续观测得到的植被指数信息,其时谱曲线能够反映蓝藻一年内状态的变化。
植被指数时间谱已经应用到遥感地物分类[8-9]的研究中,但其主要还是使用决策树分类法,利用时谱曲线辅助其确定阈值,没有充分利用时谱的曲线特征。目前的藻类水华爆发强度分类主要采用植被指数阈值分割法[10],阈值的选取对分类结果有很大的影响,如何准确地确定阈值是决定分类精度的关键。本研究不仅考虑了时谱曲线数值的大小,而且也充分利用了时谱的曲线特征,分类的结果更加可靠。
藻类水华爆发具有周期性,虽然每年的爆发日期稍微有所差别,但是以一年为周期,水华爆发强度相同的区域具有相似的NDVI时谱曲线,而水华爆发强度不同的区域,其NDVI时谱曲线具有较大的差别,以此可对藻类水华爆发强度进行分类。借鉴高光谱遥感分类思想,即利用地物的特征光谱曲线,可将不同的地物从高光谱图像中区分出来; 同理,不同的地物也有不同的时谱曲线,利用地物的特征时谱曲线,可以将不同地物从时谱数据中提取出来。本研究选取2001年—2013年太湖区域的MODIS NDVI(中分辨率成像光谱归一化植被指数)数据,将其构建成时谱数据,采用支持向量机(SVM)方法对每年的蓝藻水华爆发强度进行分类,并将2007年的结果与传统的阈值分割法结果进行了对比。
1.1 实验区
太湖位于中国长江中下游,是中国第三大淡水湖,对于周边地区的饮水灌溉、防洪抗旱、气候调节、生态建设等具有举足轻重的作用[11]。然而,从19世纪80年代开始,太湖的水质受到污染。近年来,太湖的营养化程度越来越高,蓝藻水华爆发也越来越严重。因此,准确地提取蓝藻水华爆发的强度和区域分布,对于蓝藻的防治和监测具有重要的意义。
将太湖划分为东太湖、胥口湾、贡湖湾、梅梁湾、竺山湾、西太湖、南太湖和湖心区八个研究区,如图1所示。其中,梅梁湾和竺山湾是蓝藻爆发最频繁的区域,而东太湖区域生长着较多的水生植物,受蓝藻水华的影响较小。
图1 太湖
1.2 数据获取与处理
中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer, MODIS)是“图谱合一”的光学卫星遥感仪器。MODIS具有很高的时间分辨率,一天内对同一像元最多可以进行4次观测。MODIS NDVI算法基于像元进行运算,综合16天的多次观测,运用最大值合成算法(maximum value composite, MVC)[12]产生一个合成的NDVI。本研究使用2001年—2013年太湖区域的MODIS NDVI数据,空间分辨率为1 km,时间分辨率为16天。
1.3 时谱数据构建与时谱曲线特征选择
从2001年—2013年,每年可以获取23个时相的MODIS NDVI数据,采用太湖矢量数据对获取的数据进行裁剪,将每年的数据按照时间顺序叠加即可得到该年度的植被指数时谱数据,每一景NDVI图像相当于时谱数据的一个“波段”,从而可以得到太湖区域每个像元的时谱曲线。
分别选取了四类水体样本的时谱曲线:轻度蓝藻水华爆发,中度蓝藻水华爆发,重度蓝藻水华爆发,水生植物。2001年以来,全太湖水体的营养盐水平一直处于较高水平,已经不是蓝藻生长的限制因素[13],整个太湖区域都不同程度受到蓝藻的影响。轻度蓝藻水华爆发区域主要包括:(1)水体中有蓝藻生长,但是蓝藻没有大量上浮并聚集到湖面; (2)水体中存在较少或几乎不存在蓝藻。这两种情况的时谱曲线较为类似,合并成一类; 东太湖区域覆盖有较多的水生植物,该区域很少爆发蓝藻水华,为了减弱水生植物对蓝藻提取产生的影响,将其单独划分为一类。
图2为从2007年时谱数据中提取的四条NDVI时谱特征曲线,分别为水生植物、重度水华蓝藻、中度水华蓝藻和轻度水华蓝藻。从图2可以看出,水生植物的NDVI在春季初期开始迅速上升,并于春季中期达到极值,随后虽稍有下降,但是从夏季初期开始又迅速上升,并于夏季末期达到最高值,此后开始急速下降,并于冬季初期下降到较低的水平。重度和中度水华爆发蓝藻的时谱曲线变化趋势较为相似,其NDVI从春季开始上升,并在夏季达到极值,然后开始下降,在秋季会上升到第二个极值,但比夏季的极值低。轻度水华爆发蓝藻的NDVI全年都保持在较低的水平,且波动较小。因为每年蓝藻水华爆发的时间不同,所以不同年份的时谱曲线会有所差别,但是每年的四类时谱曲线都有较好的区分度。
图2 重度、中度和轻度水华蓝藻及水生植物的NDVI时谱曲线
Fig.2 NDVI temporal spectra of aquatic plants, severe cyanobacteria bloom, moderate cyanobacteria bloom and slight cyanobacteria bloom
从图2也可看出,NDVI时谱曲线能够反映蓝藻的年度变化规律,蓝藻经过冬天的休眠后,在春季开始复苏生长,并在夏秋季上浮聚集到水面形成水华,夏季是蓝藻水华爆发最严重的时期,秋季的水华爆发程度相对较低。
1.4 支持向量机分类方法
支持向量机(SVM)最早由Vapnik[14]提出,其中的支持向量机分类(SVC)算法是SVM的主要功能之一,用于解决分类问题。主要思想是将输入的数据映射到高维空间,并建立一个最佳超平面,使原先难以区分的两个群体在高维空间中得以区分开来,并且使类间距达到最大。
SVM在解决小样本、非线性及高维模式识别问题中有许多独特的优势,具有抗噪声、学习效率高与推广性好等优点,因此在高光谱遥感分类中有明显的优越性[15]。本文使用的MODIS NDVI时谱数据具有较高的维度,且选取的样本数有限,适合选取SVM分类算法。
2.1 时谱数据分类结果
图3为2001年—2013年的分类结果,从图3可以看出,太湖北部区域(梅梁湾、竺山湾)一直是太湖蓝藻水华爆发的重灾区。从2004年开始,西部沿湖区域蓝藻水华爆发的区域逐渐增加。2004年之前,太湖南部区域基本没有中重度蓝藻水华爆发,2005年开始,该区域也开始逐步受到中重度蓝藻水华爆发的影响。从2004年开始,中度蓝藻水华爆发向湖心区扩展,并于2007年覆盖大部分湖心区域,此后,湖心区域一直受到中度蓝藻水华爆发的影响。结果与其他学者的研究基本一致[7, 13]。
太湖有五大湖湾,分别是东太湖、胥口湾、贡湖湾、梅梁湾和竺山湾。东太湖是太湖的出水通道并且水生植物茂盛,因此水质较好。其他四个湖湾因为较为封闭,水流缓慢且交换性差,因此污染物容易积累,为蓝藻的爆发提供了很好的条件[16],图3的分类结果也表明这四个湖湾更易爆发蓝藻。太湖地区夏、秋季的主导风向为东风和东南风,春季复苏的蓝藻快速生长并上浮到水体表面后,会在风的驱动作用下向太湖的北部和西部漂移,与太湖北部湖湾(梅梁湾、贡湖和竺山湾)内自身生长的蓝藻会合后形成严重的水华[13],而西部区域由于比较开放,交换性较好,因此水华的强度没有北部湖湾严重。
图3 2001年—2013年太湖蓝藻爆发强度分类结果
表1为2001年—2013年分类面积统计表,从表1可以看出,从2001年开始,重度蓝藻爆发的面积有减小的趋势,但是从2006年开始大幅增加,并于2007年达到最高值,2009年有较大幅度的降低,此后除2011年有小幅增加外,一直保持较为稳定的状态; 中度蓝藻水华爆发的面积从2001年开始不断增加,并于2007年达到极值,之后虽然有所降低,但从2011年开始一直保持较高的状态; 而轻度蓝藻水华爆发的面积从2001年开始不断降低,并于2007年降低到最低值,2008年有较大幅度的升高并在此后一直保持较为稳定的状态。从面积统计表1中可以看出,2007年为蓝藻爆发最为严重的年份,与实际情况相符,在2007年5、6月间,发生了著名的太湖蓝藻污染事件,造成无锡全城自来水污染。
表1 分类结果面积统计(km2)
2.2 阈值分割法分类结果
利用遥感手段对藻类水华爆发进行监测的方法主要是对植被指数图像进行阈值分割,将不同水华爆发程度的区域提取出来。选取的NDVI阈值为0.2和0.4[10],NDVI小于0.2的为轻度蓝藻爆发,NDVI介于0.2和0.4之间的为中度蓝藻爆发,NDVI大于0.4的为重度蓝藻爆发。从太湖2007年的MODIS NDVI时谱数据中抽取了8个时间点的NDVI图像,时间分别是:2月18日、4月7日、5月9日、6月10日、7月12日、8月13日、9月30日和11月1日,利用阈值分割法对其进行分类,获取太湖蓝藻重度、中度和轻度爆发的区域,结果如图4中的(b)—(i)所示。图4中(a)为利用2007年时谱数据得到的结果。
从图4可以看出,阈值分割法没有考虑太湖中的水生植物,在水生植物生长比较旺盛的时期,其NDVI值较高,阈值分割法会将其误认为中重度水华爆发的蓝藻,如图4中(d)—(h)所示。实际上,东太湖区域受到蓝藻的影响较小,存在大面积的水生植物,利用时谱数据提供的物候信息可以将其识别出来,如图4(a)所示。从图4(b)—(i)可以看出,不同时间点的太湖蓝藻爆发情况有很大差异,且没有明显的变化规律。在评价年度蓝藻的爆发情况时,如果仅使用一年中某几个时间点的数据,由于蓝藻爆发的不确定性,得到的结果可能无法全面地反映蓝藻整个年度的爆发情况。相比于单幅的NDVI图像,NDVI时谱数据充分利用了一年内的数据,其结果可看做是对一年中各个时间点蓝藻爆发状况的综合。将图4(a)和(b)—(i)进行对比可以看出,(a)中的重度蓝藻爆发区域曾在多个时间点爆发过严重的蓝藻水华; 其中的中度蓝藻爆发区域为偶尔爆发严重蓝藻水华的区域或者经常爆发中度蓝藻水华的区域; 而其中的轻度蓝藻爆发区域基本上在一年内所有的时间点都是轻度蓝藻水华。
图4 NDVI时间谱数据和单幅NDVI数据的分类结果比较
(a): 基于SVM方法对2007年NDVI时间谱数据的分类结果; (b)—(i): 基于阈值分割法对2007年八个离散时间点NDVI数据的分类结果,时间点分别为:2月18日,4月7日,5月9日,6月10日,7月12日,8月13日,9月30日,11月1日
Fig.4 Classification results using temporal spectral NDVI data and separated NDVI data
(a): Using temporal spectral NDVI data of 2007 based on SVM; (b)—(i): Using separated NDVI data based on threshold segmentation method, and these data were acquired on February 18th, April 7th, May 9th, June 10th, July 12th, August 13th, September 30th, and November 1thof 2007, respectively
目前藻类水华爆发强度分类主要利用实测数据和遥感数据。实测方法需要将有限采样点的数据插值到整个太湖区域,然后设置阈值进行分类,但是,利用有限样本数据插值得到的结果误差较大,很难全面地反映实际情况; 遥感方法则主要对各种植被指数图像进行阈值分割。这些方法的结果只适用于样本获取(遥感数据获取)时间点的环境条件。实验后,由于各种环境因素的影响,同一区域的藻类水华爆发情况可能会有不同程度的变化,所以其结果很难代表年度的藻类水华爆发情况。本工作的方法充分利用了一年内的观测数据,最大限度降低了偶然因素的影响,其结果能够更加全面准确地反映藻类水华年度的爆发情况。
(1)基于MODIS NDVI时谱数据,采用支持向量机方法能够更加全面准确地对太湖蓝藻水华爆发强度进行分类,得到重度、中度和轻度蓝藻水华爆发的空间分布和面积; (2)利用NDVI时谱数据,能够将太湖中水生植物的区域识别出来; (3)2007年为太湖蓝藻水华爆发最为严重的年份,近五年来,太湖的蓝藻水华一直处于较高的水平,治理形势依然非常严峻。
[1] Tian Y Q, Yu Q, Zimmerman M J, et al.Freshwater Biology, 2010, 55(8): 1658.
[2] Zhang Y C, Ma R H, Duan H T, et al.Ieee Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(7): 3060.
[3] Oyama Y, Matsushita B, Fukushima T.Remote Sensing of Environment, 2015, 157: 35.
[4] Hu C.Remote Sensing of Environment, 2009, 113(10): 2118.
[5] Hu C, Li D, Chen C, et al.Journal of Geophysical Research: Oceans (1978—2012), 2010, 115(C5):1.
[6] Gower J, King S, Borstad G, et al.International Journal of Remote Sensing, 2005, 26(9): 2005.
[7] KONG Fan-xiang, GAO Guang(孔繁翔, 高 光).Acta Ecologica Sinica(生态学报), 2005,3: 589.
[8] ZHANG Xia, SUN Rui, ZHANG Bing, et al(张 霞, 孙 睿, 张 兵, 等).Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2006,12: 128,309.
[9] WEN Qing-ke, ZHANG Zeng-xiang, WANG Xiao, et al(温庆可, 张增祥, 汪 潇, 等).Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2010,3: 171,390.
[10] LI Ya-chun, SUN Jia-li, XIE Zhi-qing, et al(李亚春, 孙佳丽, 谢志清, 等).Journal of the Meterological Sciences(气象科学), 2011, 6: 737.
[11] Qin B Q, Xu P Z, Wu Q L, et al.Hydrobiologia, 2007, 581: 3.
[12] Van Leeuwen W J D, Huete A R, Laing T W.Remote Sensing of Environment, 1999, 69(3): 264.
[13] KONG Fan-xiang, MA Rong-hua, GAO Jun-feng, et al(孔繁翔, 马荣华, 高俊峰,等).Journal of Lake Sciences(湖泊科学), 2009,3: 314.
[14] Cortes C, Vapnik V.Machine Learning, 1995, 20(3): 273.
[15] TAN Kun, DU Pei-jun(谭 琨, 杜培军).Journal of Infrared and Millinreter Waves(红外与毫米波学报), 2008,2: 123.
[16] YANG Yu, LI Yun-mei, WANG Qiao, et al(杨 煜, 李云梅, 王 桥,等).Geo-Information Science(地球信息科学学报), 2009,5: 5597.
(Received Feb.9, 2015; accepted May 22, 2015)
*Corresponding author
Monitor of Cyanobacteria Bloom in Lake Taihu from 2001 to 2013 Based on MODIS Temporal Spectral Data
LI Yao1, 2, ZHANG Li-fu1*, HUANG Chang-ping1, WANG Jin-nian1, CEN Yi1
1.State Key Laboratory of Remote Sensing Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, 2.University of Chinese Academy of Sciences, Beijing 100049, China
Algal bloom highly impacts the ecological balance of inland lakes.Remote sensing provides real-time and large-scale observations, which plays an increasingly significant role in the monitoring of algal bloom.Various Vegetation Indices (VIs) derived from satellite images have been used to monitor algae.With threshold segmentation of VI, the area of algal bloom can be extracted from images.However, the result of threshold segmentation only reflects the condition of algae when images were generated.Compared to separated VI data obtained at a particular moment of time, temporal spectral VI data contains phonological information of algae, which may be used to evaluate algal bloom more accurately and comprehensively.This study chose MODIS NDVI data of the Lake Taihu from 2001 to 2013, and constructed temporal spectral data for each year.Then, we determined the feature temporal spectra of severe cyanobacteria bloom, moderate cyanobacteria bloom, slight cyanobacteria bloom and aquatic plants, and separated these four kinds of objects using SVM (Support Vector Machine) algorithm, getting the spatial distribution and area of them.In order to compare the results of our method with traditional threshold segmentation method, we chose 8 separated NDVI images from the temporal spectral data of 2007.With the threshold 0.2 and 0.4, cyanobacteria bloom was classified into three degrees: severe cyanobacteria bloom, moderate cyanobacteria bloom, and slight cyanobacteria bloom.By comparison, it showed that our method reflected cyanobacteria bloom more comprehensively, and could distinguish cyanobacteria and aquatic plants using the phonological information provided by NDVI temporal spectra.This study provides important information for monitoring the algal bloom trends and degrees of inland lakes, and temporal spectral method may be used in the forecast of algal bloom in the future.
MODIS; Lake Taihu; Algal bloom; Temporal spectra; Support vector machine; Monitor
2015-02-09,
2015-05-22
国家自然科学基金项目(41201348, 41371359)和高分水利遥感应用示范系统项目(08-Y30B07-9001-13/15-01)资助
李 瑶,1990年生,中国科学院遥感与数字地球研究所在读博士研究生 e-mail: liyao@radi.ac.cn *通讯联系人 e-mail: zhanglf@radi.ac.cn
TP79
A
10.3964/j.issn.1000-0593(2016)05-1406-06