武爽,冯险峰,陈点点,陈振,陈芸芝
(1.中国科学院地理科学与资源研究所 资源与环境信息国家重点实验室,北京 100101;2.中国科学院大学,北京 100049;3.天津市城市规划设计研究总院有限公司,天津 300190;4.福州大学 数字中国研究院(福建),福州 350108)
河流作为水资源的重要组成部分,在调节区域气候等方面发挥着非常重要的作用,是区域生态环境可持续发展的重要因素[1-2]。随着城镇化和工农业发展进程加快,大量工业废水及生活污水被排入河流[3],我国河流污染问题日益突出,因而研究河流水质变化,为河流治理提供意见显得尤为重要。
叶绿素a与水体富营养化和水生生物平衡密切相关,是衡量水环境质量的重要指标。水质监测是水质评价与水污染防治的重要依据[4],因此对河流中叶绿素a进行实时监测及污染物迁移动态监测,是河流水质治理的关键步骤。遥感技术由于具备监测范围广、速度快、成本低等优势已经被广泛用于水体水质监测中[5-6],弥补了传统监测方法无法实现长期动态监测水质的不足。
水中叶绿素a浓度的高低会导致水体光谱信息出现差异,根据这一特性,国内外学者基于遥感影像及实测数据,利用统计回归[7-10]以及机器学习方法[11-14]建立了不同区域的叶绿素a反演模型。随着遥感影像时空分辨率的提升,以及内陆水体光谱特征研究的逐渐深入,叶绿素a反演逐渐被应用于内陆水体,而河流由于其流动性较强,浑浊度较高,因而遥感监测河流叶绿素a浓度难度较高[15-16]。水体中叶绿素a的光谱特征在不同季节以及丰、枯水期均存在差异[17],而关于内陆水体叶绿素a反演研究大多是单时相反演模型应用到各个时期的叶绿素a反演,目前仅有部分学者对湖泊[18]以及河口、海湾等地区[19-20]进行分期叶绿素a反演模型构建,虽有效提升了叶绿素a反演精度,但由于受到采样数据限制,针对河流的分期叶绿素a反演研究仍较少。
闽江是福建省第一大河,其在省生态建设中占有举足轻重的地位,也是国家生态环境部批准的河流治理示范点[21]。近几年闽江水环境整治工作取得了一定成效,闽江整体水质良好,均为Ⅰ~Ⅲ类水,但由于城市化进程的加快,农业、养殖业和工业的迅速发展及闽江水量的减少,部分河段、水库的环境问题突出[22-24]。本文以闽江干流为例,基于Landsat影像,利用闽江实测光谱特征差异分别建立丰、枯水期闽江干流叶绿素a的遥感反演模型并进行精度检验,对闽江干流水质进行遥感监测。
本文利用遥感技术监测闽江水质变化,而闽江上游水域狭小,难以利用遥感影像进行相应研究,因而本文以闽江干流及其连通水域如大樟溪、尤溪、古田水库等作为研究区,地理范围为117°58′E~119°35′E、25°28′N~26°44′N,其中闽江干流为沙溪汇入富屯溪后经延平至琅岐岛入海的河段,长约230 km。为方便行文表述,本文将研究区概述为闽江干流。
主要包括两种数据,一种是实测数据,包括水质数据及光谱数据,另一种是遥感影像数据。
1)实测水质数据。本文在2014、2017、2019年野外采样数据基础上,于2020年11月10日和11月11日分别进行了两次野外采样,采样时间与选取卫星的过境时间基本同步,采样水质数据为水温及叶绿素a浓度数据。在采样点位布设过程中,考虑了与往年采样点位的一致性,并且结合实际需要,在重点区域增加了点位布设(图1)。综合往年采样以及本次野外采样情况,共在闽江下游白沙至琅岐岛段采样了135组数据。
2)实测光谱数据。采用美国ASD公司生产的Field Spec4手持便携式光谱分析仪进行光谱测量,获得了研究区水体的光谱反射率。
3)遥感影像数据。通过对比国内外主要遥感卫星数据,综合考虑了数据覆盖时间、空间分辨率、时间分辨率、光谱分辨率、幅宽等因素,本文确定了Landsat影像作为基础数据。
本文基于Landsat影像,利用实测光谱及叶绿素a浓度数据通过相关分析,确定对叶绿素a变化响应敏感的影像波段/波段组合,基于敏感波段/波段组合和叶绿素a实测浓度分别建立了多元回归以及机器学习模型,通过对比分析不同模型的结果,确定闽江干流的最佳叶绿素a反演模型。
1)相关分析。通过计算实测叶绿素a浓度与影像波段/波段组合间相关系数Rxy进行相关分析,确定对于实测叶绿素a浓度响应敏感的影像波段/波段组合。相关系数的取值区间在-1到1之间,1表示两个变量完全线性相关,-1表示两个变量完全负相关,0表示两个变量不相关。
2)多元线性回归模型。多元线性回归模型是多个自变量的回归,本研究以叶绿素a浓度作为y值,多个敏感波段/波段组合作为xi值。
3)机器学习。本文利用机器学习方法对叶绿素a浓度进行反演模型构建,并进行精度验证。根据文献[25-27]研究经验,采用的机器学习方法包括BP神经网络、随机森林、粒子群算法优化的径向基神经网络、粒子群算法优化的最小二乘支持向量机等。
(1)BP神经网络。基于三层神经网络结构,将叶绿素a实测浓度数据作为输出层,敏感波段/波段组合作为输入层,输入层神经元个数为4,通过不断调整隐含层节点数,分别构建丰水期及枯水期叶绿素a反演模型,进行研究区叶绿素a反演。
(3)PSO-RBF是将径向基神经网络(radial basis function,RBF)的初始化参数作为粒子群算法的粒子个体,利用PSO(particle swarm optimization)算法进行优化,从而提升RBF神经网络模型的性能。本文将叶绿素a实测浓度数据作为输出层,敏感波段/波段组合作为输入层,运用PSO-RBF方法构建丰、枯水期的叶绿素a反演模型。
(4)PSO-LSSVM运用PSO算法优化最小二乘支持向量机(least squares support vector machine,LSSVM)的两个参数,可以有效提高模型的预测精度和收敛速度。本文基于叶绿素a实测数据及遥感影像敏感波段/波段组合,利用PSO-LSSVM方法进行反演模型构建,其中粒子群个数经过调整设置为50,迭代次数为400。
4)精度验证。利用平均绝对误差、平均相对误差、均方根误差以及拟合优度R2对叶绿素a反演结果进行精度验证,确定出最佳的反演模型方法。
1)光谱曲线平滑。通过实际测量,获得了2014—2020年闽江干流水体光谱反射率曲线共129组,原始曲线中噪点较多,本文利用Savitzky-Golay平滑器,通过移动窗口,利用最小二乘法进行最佳拟合,用以平滑实测水体光谱反射率曲线中的噪声数据。
2)光谱特征分析。结合实测光谱数据、现场采样照片及水质数据,可将闽江干流水体光谱特征分为两类(图2),第一类水体悬浮泥沙含量较高,悬浮物浓度为140~200 mg/L,水体较为浑浊,在550~700 nm范围内反射率呈水平波动;第二类为叶绿素a浓度中等的较为清澈水体,悬浮物浓度为10~40 mg/L,其在550~700 nm范围内反射率呈逐渐下降趋势。
3)可反演影像区域筛选。由于水体光谱特征在可见光及近红外波段较为明显,因而本文仅针对Landsat系列影像中的可见光及近红外范围内的波段进行分析。为方便表述,以Bblue代表蓝光波段反射率、Bgreen代表绿光波段反射率、Bred代表红光波段反射率、Bnir代表近红外波段反射率,通过对单波段以及加、减、比值、指数等共计28种不同的单波段或波段组合与叶绿素a浓度进行相关分析,完成影像敏感波段选择。
利用剔除异常值后的数据进行相关分析,结果发现,利用总体样本得到的相关性结果并不理想(|R2|≤0.5)。而将丰、枯水期的样本数据进行分别相关性分析,发现丰水期具有比较明显的敏感波段,而枯水期波段与叶绿素a浓度间相关性依然不显著(|R2|≤0.5)。
结合光谱特征分析结果,初步确定Landsat影像中的绿光波段(Bgreen)、红光波段(Bred)是反映闽江干流水体光谱特征的对应波段,根据悬浮泥沙含量对叶绿素a反演的影响,以及其光谱特征,本文假设Bgreen-Bred值达到一定标准的水体区域叶绿素a浓度反演效果较好,丰水期所有采样点均满足Bgreen>Bred,并且二者间存在一定差值,其相关性分析结果较佳。因而针对枯水期波段与叶绿素a浓度间相关性不显著问题,研究以Bgreen-Bred值的不同大小为标准,通过相关分析,筛选可用于枯水期反演的采样点。
相关分析结果表明,枯水期满足0 4)影像敏感波段选择。通过对比丰、枯水期的相关分析结果,丰水期所有样点均满足叶绿素a光谱特征,可进行叶绿素a反演模型的构建,其敏感波段组合为Bblue/Bred、(Bblue-Bred)/(Bblue+Bred)、Bgreen/Bred、Bgreen/Bnir,敏感波段及波段组合的|Rxy|均大于0.5,Rxy最大的Rxy为-0.68,对应的是Bblue/Bred;枯水期仅有部分样点满足叶绿素a光谱特征,可用于叶绿素a反演,因而研究根据Bgreen-Bred值的范围结合相关分析结果,将采样点分为0 综合上述结果来看,丰、枯水期影像敏感波段不同,并且丰水期及分区域的枯水期相关分析结果较佳,结合实测水质结果分析,丰、枯水期叶绿素a浓度存在很大差异,丰水期叶绿素a浓度整体偏高,均值为11.47 ug/L,而枯水期叶绿素a浓度整体偏低,均值为2.35 ug/L,另外根据荧光峰位置(670~700 nm)与叶绿素a浓度间关系,丰、枯水期水体中叶绿素a与光谱间响应关系不同,丰水期叶绿素a光谱特征呈现显著的随着叶绿素a浓度增加,荧光峰向长波方向移动,而枯水期荧光峰与叶绿素a浓度间无显著相关。综合考虑这些因素,本文对丰、枯水期以及不同影像区域分别构建叶绿素a反演模型。 1)不同回归模型反演精度对比。基于实测数据,对丰水期及枯水期分别利用多元线性回归及机器学习方法构建闽江干流叶绿素a反演模型,并对反演结果进行精度验证。 通过对比多元线性回归模型以及机器学习模型的反演精度,确定丰、枯水期叶绿素a反演的最佳模型。由于枯水期反演结果存在着对于实测值结果极低时预测精度较差的情况,因而在进行精度验证中计算的枯水期精度指标是去除实测值极低后的结果,即去除了枯水期Ⅰ(0 通过对不同方法构建的模型进行精度对比可知(表1),丰水期及枯水期Ⅰ的叶绿素a最佳反演模型为机器学习中的随机森林方法,而枯水期Ⅱ的叶绿素a最佳反演模型根据精度验证结果为多元线性回归方法,但是由于其实际估测结果中出现了较多负值,因而枯水期Ⅱ的叶绿素a反演模型选择了机器学习中的BP神经网络方法。 表1 不同回归模型预测叶绿素a的精度情况 2)前人研究模型精度对比。前人基于2017年采样数据,利用最佳三波段因子构建了生物光学模型[28],本文通过对比实测值及三波段光学模型结果以及本文的随机森林模型结果,如图3所示,可以看出,随机森林模型能够较好地反映叶绿素a的真实结果。 随着遥感影像时空分辨率的提升以及内陆水体光谱特征研究的逐渐深入,叶绿素a反演逐渐被应用于内陆水体如湖泊、河流等。内陆水体情况复杂,传统的统计回归方法难以满足叶绿素a反演精度要求,机器学习算法对叶绿素a反演精度较高,并且具有一定的抗干扰能力。本文基于Landsat影像,通过分析丰、枯水期闽江干流水体实测叶绿素a光谱特征,确定对叶绿素a浓度变化响应敏感的影像波段/波段组合,并利用多元线性回归及机器学习方法构建叶绿素a遥感反演模型。研究结果表明:水体光谱特征为绿光波段反射率-红光波段反射率>0的影像区域适用于进行叶绿素a反演;基于丰、枯水期叶绿素a浓度及光谱特征差异,确定了丰、枯水期及不同影像区域敏感波段不同;丰、枯水期03.2 叶绿素a反演模型精度对比
4 结束语