汪政辉,辛存林,孙喆,罗菊花,马荣华,3
(1.西北师范大学 地理与环境科学学院,兰州 730070;2.中国科学院南京地理与湖泊研究所,南京 210008;3.淮阴师范学院 江苏区域现代农业与环境保护协同创新中心,江苏 淮安 223001)
水生植被具有吸附净化、阻滞水流、促进沉降、澄清水质、抑制藻类等生态功能,在维持湖泊生态系统平衡、物质循环和水质方面发挥着重要的作用[1-2]。水生植物繁茂的湖泊,水体具有较高清澈度,较低的营养盐浓度和藻类生物量[3]。水生植被,尤其是沉水植被的盖度和丰度直接决定着湖泊的稳态[4]。因此,大范围、准确、快速地监测湖泊水生植物类群及其时空分布对湖泊管理和生态修复具有十分重要的意义。
传统的水生植物监测方法主要以人工调查法为主,精度虽高,但费时费力,监测覆盖范围小,且时空连续性差。卫星遥感技术具有宏观、低成本、快速、动态的优势,同时具有实时性和历史追溯性等特点,已成为浅水湖泊水生植物监测的有效手段[5-7]。相比陆生植被,水生植被由于其生长在复杂度较高的水体中,其光谱特性具有复杂性[8]。相关研究[9-12]表明,挺水和浮叶植物大部分叶片位于水面之上,光谱信号无需经过水体辐射传输过程,受水环境影响较小,具有典型的植被光谱特征;而沉水植被由于完全沉入水中,反射光谱易受水环境参数影响,其光谱特征与挺水和浮叶植被有显著差异。不同水生植被类群的光谱特征及对水环境的光谱响应各有差异,也是水生植被遥感监测的理论基础。近年来,国内外学者基于多种遥感卫星数据,也在不同的大型浅水湖泊先后开展了一系列水生植物遥感分类和制图研究[13-15],并发展了一些用于区分水生植被与其他植被及藻华的光谱指数,如Villa等[16]发现使用蓝光和近红外波段构建的归一化水生植被指数(normalized difference aquatic vegetation index,NDAVI)对水生植被具有很高的敏感度,且可以降低背景噪声对水生植被提取的影响,并在太湖和加尔达湖等湖泊取得了较好的应用效果;Liu等[17]考虑了藻类与水生植被在物候特征上的差异,基于浮游藻类指数(floating algal index,FAI)建立了植被出现频率指数(vegetation presence frequency,VPF)用于识别太湖水生植被和藻华;Oyama等[18]基于蓝藻水华与水生植被的光谱差异,结合归一化水体指数(normalized difference water index,NDWI)和浮游藻类指数构建决策树识别日本的3个湖(lakes kasumiguara,inba-numa and tega-muma)的蓝藻水华和水生植被。但以上方法均只能识别浮叶和挺水植被,而将沉水植被归为水体,因此对水生植被类群的监测能力均十分有限。而在水生植被类群遥感监测研究方面,Luo等[19]基于HJ-1A/B数据,利用有限的波段数量,采用主成分变换和缨帽变换对原始影像进行图像增强处理,建立浮叶类植被敏感指数(floating-leaved vegetation sensitive index,FVSI)和沉水植被敏感指数(submerged vegetation sensitive index,SVSI),构建决策树对太湖不同水生植被类群进行了分类提取。但其分类指数均是针对HJ-CCD数据进行图像变换后构建的,故仅适用于HJ和与HJ数据有类似波段设置的卫星;Wang等[20]利用归一化植被指数(normalized difference vegetation index,NDVI)时序数据结合植物功能类型(plant functional types,PFTs)采用支持向量机模型,应用于2007年4月至2008年5月的北京1号卫星数据,对鄱阳湖的水生植被类群进行了判别,不过这种方法不能应用于水生植被的日常监测,因为NDVI时序数据必须基于整年遥感数据统计分析所得。综上所述,受传统遥感卫星(如Landsat、MODIS、HJ)空间和光谱分辨率的限制,水生植被卫星遥感监测研究多集中于太湖等大型浅水湖泊,且研究对象多为挺水或浮叶植物,在分类时多将沉水植被归为水体,对于小型湖泊/水库以及水生植被类群遥感监测的内容还鲜有报道。
近年来,随着遥感技术的不断发展,国内外一大批高质量卫星相继发射,如Sentinel-2A/B、GF-1、GF-6等,为小型湖泊的水生植被类群遥感监测提供了良好的契机。故本研究以翠屏湖为研究区,利用高时间、高空间和高光谱分辨率的Sentinel-2数据,研究不同水生植被类群的光谱差异,并构建分类光谱指数,最终提出一种适用于小型湖泊/水库的水生植被主要类群的自动分类方法。该方法为翠屏湖水生植被的时空监测提供了方法支撑,以期为水生植被适时打捞和科学管理决策提供科学依据。
翠屏湖(图1)位于天津市蓟县城东4 km、蓟运河左支流——周河上游出山口处,是天津市唯一的饮用水源地。在水位21.26 m时,水面面积为86.8 km2,最大水深12.16 m,平均水深4.74 m。主要入湖河流由黎河与沙河、淋河2条支流组成,流域面积达2 060 km2[21-22]。
图1 研究区概况图
根据水生植物的形态结构和生长特征,可将其分为三大主要类群:挺水植物、浮叶植物和沉水植物[23]。据蓟县水产局调查,翠屏湖分布有挺水、浮叶和沉水三大水生植被群落,共计21种,分属于14科13属,其中挺水植物6种,优势种为芦苇;浮叶植物2种,优势种为荇菜和野菱;沉水植物13种,优势种为菹草[24](图2)。
图2 翠屏湖水生植被实地照片
本研究基于遥感技术开展,由于到沉水植物完全沉于水下,其表面反射光谱在经过大气-水界面过程中受到水体中浮游植物和悬浮物、叶绿素等光学活性成分的影响,与叶片在水面之上的挺水和浮叶植物具有显著的差异,故根据遥感对水生植物的可分性,将翠屏湖水生植物分为两大植被类群:叶片在水面之上的浮叶类植被类群(浮叶植被和挺水植被)和叶片在水面之下的沉水植被类群[25]。
据调查,沉水植被为翠屏湖优势类群,其中菹草为绝对优势种。菹草较为耐寒,能够忍受0 ℃以下的低温,3—4月份进入高速生长期,在4—5月份生物量达到最大值,随后很快枯萎死亡,在7月份其生物量达到最小值,8—10月份进入休眠状态,11月份进入萌发期,12月至次年2月份进入缓慢生长期[26]。故选择在5月份Sentinel-2过境前后(2017年5月9—11日)开展翠屏湖水生植被野外调查实验。
实验共采集有效样点105个(35个浮叶类植被样点、36个沉水植被样点和34个水体样点),采集信息包括样点经纬度、水生植被类型、覆盖度、照片等。考虑到Sentinel-2卫星影像的空间分辨率(10 m),采集样点时,选择在30 m×30 m的水生植被区的中心位置定位并采样。
Sentinel-2系列卫星属于欧空局(ESA)“哥白尼计划”(global monitor for environment and security,GMES)中的光学遥感卫星。目前已有2颗在轨,即Sentinel-2A和Sentinel-2B,分别于2015年6月23日和2017年3月7日发射升空,组网后时间分辨率提升为5天[27]。该系列卫星共13个波段,不仅具有光学遥感卫星常见的可见光、近红外和短波红外波段,还包含3个应用在高光谱数据中的“红边”波段,和一个增强的窄近红外波段[28],据相关研究[29-30]表明“红边”波段与近红外波段对植被的辐射强度响应更为明显。虽然数据在不同波段间的空间分辨率略有不同(表1),但经重采样后可统一提升至10 m,较Landsat系列卫星,在光谱分辨率和时空分辨率上都具有明显优势。
表1 Sentinel-2A/B卫星数据主要参数
通过ESA数据共享网站(https://scihub.copernicus.eu/dhus/#/home)获取了2017年3—8月覆盖翠屏湖云量较少、质量较高的影像,共6景(表2)。由于下载的原始数据为已经经过几何校正的L1C级的大气顶层反射率数据,所以需要对数据进行大气校正。本研究采用ESA提供的Sen2cor模型对L1C级数据进行大气校正得到L2A级地表反射率数据,再使用最邻近插值法在SNAP5.0软件中将L2A级各波段数据重采样至10 m,将数据输出为ENVI标准格式,最后在IDL环境支持下对重采样后的L2A级数据进行波段合成及裁剪[31]。
表2 Sentinel-2A/B 数据列表
1)水生植被类群的分类特征构建及其评价方法。已有研究[32]表明,相较于水体和沉水植被类群,浮叶类植被具有典型的植被光谱,在705~865 nm范围“植被特征”最为显著。故本研究基于浮叶类植被在Sentinel-2数据上的光谱特征,在705~865 nm范围找到最敏感的波段作为分类特征(floating-leaved aquatic vegetation index,FAVI),开展翠屏湖浮叶类植被类群的提取。
沉水植被由于在水面以下,其光谱具有复杂性,故如何提取沉水植被是本研究的难点和重点。本研究基于沉水植被和水体实测样点在Sentinel-2数据上的光谱,分析沉水植被与水体的光谱特征和差异,旨在构建一个对沉水植被敏感、且与水体具有较好的识别能力的植被指数(submerged aquatic vegetation index,SAVI)。同时,选取常用提取水生植被的3个植被指数,如NDVI、NDAVI和NDWI(表3),通过灰度图目视判别和绘制频数分布曲线2种方法,比较和评价新建的SAVI指数对沉水植被的识别能力和效果。
表3 常用水生植被遥感监测指数
2)决策树分类。水生植被遥感分类方法主要有监督分类、非监督分类、面向对象和决策树分类等。其中,决策树分类是基于对解释变量的阈值进行二分法分析,它是由一系列二叉树决策树构成,较适合用于训练样本较少的分类研究中,为目前最主流的水生植被遥感分类方法[32]。本研究采用决策树分类作为翠屏湖水生植被类群的分类方法。
考虑到浮叶类植被相比沉水植被具有更显著的可分性,因此,本研究先利用FAVI和其阈值开展浮叶类植被遥感剥离,然后基于SAVI和其阈值开展沉水植被的提取,最终得到2种植被类群的空间分布结果。故构建的决策树如图3所示。
图3 翠屏湖水生植被类群遥感分类决策树(n和m为分类阈值)
3)基于Otsu算法的分类阈值自动计算。Otsu又名最大类间方差法,是一种确定图像二值化分割阈值的算法,适合决策树分类方法中的阈值计算[34]。故本研究利用Otsu自动计算决策树(图2)中的FAVI和SVSI的分类阈值。
Otsu算法根据图像的灰度特性,采用最小二乘法的原理自动获取全局阈值,将图像分割为目标与背景2个部分。基本原理如下:记图像目标和背景的分割阈值记为T,目标像素点数占整幅图像的比例记为ω0,其平均灰度μ0;背景像素点数占整幅图像的比例为ω1,平均灰度为μ1,图像的总平均灰度记为μ,类间方差记为g,则有
g=ω0ω1(μ0-μ1)^2
(1)
采用遍历的方法得到类间方差g最大的值记为分割阈值T。
图4(a)和图4(b)分别为浮叶类和沉水植被类群及水体随机选取的采样点的光谱曲线和3个种类的平均光谱曲线。由图可见,浮叶类植被类群相比沉水植被类群和水体,具有较典型的植被光谱特征,特别是当水体和沉水植被在近红外波段附近对光强烈吸收时,浮叶类植被光谱却出现明显的反射峰,尤其在“红边”波段的783 nm处,三者的光谱差异最为显著,故以此波段建立浮叶类植被指数(FAVI),设置阈值区分浮叶类植被类群:
图4 实测样点光谱曲线和分类地物平均光谱曲线及特征
(2)
式中:ρ783为第3个红边波段反射率,中心波长为783 nm。
沉水植被由于其完全沉入水中,其冠层反射光谱必须穿过大气-水界面,其光谱受多种因素和介质的影响,因而植被的光谱特征不甚明显[35],但由图4(b)可知,沉水植被和水体在Sentinel-2的500~600 nm和700~900 nm这2个波段范围仍具有较大差异,如在560 nm处的反射率低于水体,未形成显著的绿峰,而705 nm处反射率则迅速增加形成红边,明显高于水体光谱。沉水植物在这2个波段范围的光谱特征分别受叶片各种色素和植物冠层、叶片内部细胞的结构影响[36]。因此,选择用差异最为突出的 705 nm“红边”波段与560 nm绿光波段进行波段组合,采用归一化指数的计算方式进行图像变换,构建沉水植被指数(SAVI)来增强沉水植被类群与水体的光谱特征差异,其计算公式如下:
(3)
式中:ρred_edge为形成反射峰的第一个红边波段的反射率,中心波长为705 nm;ρgreen为绿光波段的反射率,中心波长为560 nm。
从图5中可以看出,4种植被指数都能明显区分出水生植被区域与水体,和原始影像相比分类特征都得到了增强。其中NDVI图像中的水生植被区域对应暗色调,其余植被指数图像中的水生植被对应亮色调。根据目视判读,NDVI图像中水生植被区域虽然与水体的对比最为明显,但对覆盖度较低的沉水植被不敏感,如北岸(A区)的部分沉水植被区,与水体灰度差异较小;NDAVI和NDWI虽然在湖东部(B区)较NDVI相比,对沉水植被更为明显,但在湖的北岸和湖中心部分区域对沉水植被的识别能力仍较差,基本与水体的灰度一致。
图5 4种植被指数分类特征灰度图(2017年5月15日)
选择水体和沉水植被类群的典型区域在ENVI5.1支持下绘制感兴趣区ROI(region of interest)。统计2种地物类型ROI在植被指数分类特征灰度图上的频数分布。从图6可以看出,前3种指数较SAVI的频数曲线,水体和沉水植被均存在较大的重叠区域,主要是因为大部分沉水植被信息未能从水体中分离,导致分类时将部分沉水植被被误分为水体。灰度图和频数曲线的结果表明SAVI对沉水植被更为敏感,在水体和沉水植被之间具有较好的可分离性。
图6 4种植被指数频数分布曲线图(源于2017年5月5日影像)
图7为研究区2017年5月15日FAVI和SAVI的分类特征频数直方图,通过MATLAB(R2014a)环境计算得出分割阈值分别为0.141 2和0.156 9。
基于FAVI、SAVI的阈值n、m可构建决策树获取2017年5月15日的翠屏湖水生植被类群分类结果(图8)。分类结果显示,翠屏湖2017年5月15日水生植被面积约为38.06 km2,占翠屏湖面积57.29%,其中优势类群为沉水植被,面积约为28.06 km2,占翠屏湖面积42.24%。
图7 2017年5月15日翠屏湖光谱分类特征FAVI直方图和SAVI直方图
图8 2017年5月15日的假彩色卫星影像图和水生植被分类结果图
利用实测样点对分类结果进行验证,表4为分类误差矩阵[37]。结果显示,本研究提出的分类方法和阈值对翠屏湖水生植被类群的分类总体精度为88.57%,Kappa系数82.70%。其中,浮叶类植被类群和沉水植被类群的分类精度分别为85.71%和82.05%。
表4 翠屏湖水生植被类群分类精度
应用上述分类方法,对翠屏湖其他日期的影像进行水生植被分类,以检验分类方法的普适性。通过对比图9中不同日期的原始卫星影像和分类结果,在目视效果上均很好匹配。从分类结果可以看出,翠屏湖沉水植被类群的空间分布范围主要在湖的北岸以及东岸,总体上呈现出北岸大于南岸、东岸大于西岸的趋势,湖中心由于水位较高,即使在水生植被生物量最高的5月,也鲜有沉水植被出现。从年内面积变化曲线(图10)可以看出,翠屏湖沉水植被类群的面积变化呈明显的单峰型,从4月开始面积快速增长,至5月中旬达到最大,随后迅速减小,在6月下旬之后几乎完全消失,其面积变化与菹草的物候特征相吻合,也进一步验证了菹草为翠屏湖沉水植被类群的绝对优势种。
图9 2017年4—8月翠屏湖假彩色卫星影像图和水生植被分类结果
图10 2017年4—8月翠屏湖沉水植被类群面积变化图
目前遥感监测大多采用中低等分辨率卫星影像(如MODIS、Landsat等),容易产生由于混合像元带来的分类误差,不太适用于小型湖泊,而空间分辨率更高的Sentinel-2数据则可弥补此类缺陷;并且随着Sentinel-2A/B两颗卫星组网的形成,重返周期缩短至5天,使得水生植被的遥感监测更为及时。此外,该卫星拥有更多的波段设置,特别是具有3个应用于高光谱数据中的对植被更为敏感的“红边”波段,能获取水生植物特别是沉水植物更为丰富的光谱信息,放大不同水生植被类群之间的光谱特征差异,将沉水植被信息从水体中分离出来。敏感光谱特征分类评价结果表明,引入Sentinel-2数据的“红边”波段的沉水植被指数,较其他植被指数在频数分布上重叠部分较少,能更好实现沉水植被类群和水体的分离。因此通过利用Sentinel-2数据的“红边”波段建立的植被指数开展沉水植被类群的识别是一个可行的思路。
决策树是目前最主流、使用最广泛的水生植被遥感分类方法。但决策树中分类特征的阈值大多是通过与影像同步的大量实测样点训练确定,对于缺少实测样点的影像,难以获取准确阈值,成为水生植被类群遥感监测和历史重建的瓶颈[38]。虽然也有学者通过建立拟合函数的方法提取分类阈值[15],但这种方法难以避免不同时相影像之间引起的误差。基于Otsu的自适应阈值算法,较为适合二分法的决策树分类阈值的确定,由于是针对每幅影像各自的特征,可以自动获取分类特征的阈值,所以较统计学方法的分类精度更高。
水体环境是由叶绿素浓度、悬浮物浓度、透明度等各种复杂因素组成的[39],挺水与浮叶植物大部分叶片都位于水面之上,光谱信号不需要经过水体辐射传输过程,受水体环境影响较小,具有典型的植被光谱特征;沉水植物由于完全沉入水中,光谱反射率受到冠层水深、植被盖度以及水体环境等多种因素的影响,会改变沉水植物的光学特性[40]。本研究仅分析了不同水生植被类群在遥感卫星上的光谱差异,并未将沉水植物的生物物理参数以及水体环境等因素引入光谱特征分析,因此,在下一步研究中,将基于近地面高光谱数据,分析水生植物冠层和水环境参数对反射光谱的影响机理,进而分析其对遥感分类的误差和影响。
基于Sentinel-2影像,分析了小型浅水湖泊——翠屏湖的不同水生植被类群的光谱特征差异,构建了对浮叶类植被类群和沉水植被敏感的FAVI和SAVI指数。并将SAVI与其他几个常用与沉水植被提取的指数(NDVI、NDAVI、NDWI、SAVI)进行了定性和定量的比较和评价。结果表明,SAVI对翠屏湖沉水植被的识别最好。
将FAVI和SAVI作为浮叶类和沉水植被的分类特征,结合Otsu的自动获取分类阈值算法,构建了翠屏湖水生植被类群的分类决策树,经验证,其总体分类精度为88.57%,KAPPA系数为83.78%。进而,基于2017年的多期Sentinel-2影像对本论文构建的分类方法进行了普适性检测和评价,发现翠屏湖的优势类群沉水植被的面积变化符合菹草的物候变化特征,与翠屏湖的实际情况吻合。因此,基于该方法可以研究翠屏湖菹草的长时序时空变化分析。
本文利用Sentinel-2影像,构建了FAVI和SAVI指数,提出了一种翠屏湖不同水生植被类群自动提取方法。研究结果表明该方法能有效提取翠屏湖水生植被类群的分布信息。基于近地面高光谱数据,分析水生植物冠层和水环境参数对反射光谱的影响机理,从而分析其对遥感分类的误差和影响将是下一步的研究方向。