周 正,万茜婷
(1.长江流域水环境监测中心,湖北武汉430010;2.长江水利委员会长江年鉴社,湖北武汉430010)
东湖是我国最大的城中湖,位于湖北省武汉市内。近年来,随着城市经济的快速发展,东湖水环境承受的压力与日俱增,不仅破坏了湖泊生态环境,而且影响到了周边的人居环境,造成了不小的经济与生态损失。湖泊水质恶化的直接表现是藻类物质大量繁殖,而叶绿素a是浮游植物生物体的重要组成成分之一,叶绿素a含量的高低与该水体中藻类的种类、数量等密切相关,是浮游植物现存量的重要指标,是反映内陆湖泊水质状况的重要参数。
中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer,MODIS)是当前世界上新一代“图谱合一”的光学遥感仪器,有36个离散光谱波段,光谱范围宽,从 0.4 μm(可见光)到 14.4 μm(热红外)全光谱覆盖,可用于对陆表、生物圈、固态地球、大气和海洋进行长期全球观测,建立基于MODIS数据的内陆水体叶绿素a遥感反演模型,对于内陆湖泊水质监测具有重要的现实意义。
本研究选择东湖污染较为严重的郭郑湖区及庙湖区作为研究试验区。通过研究试验区的相关资料,并结合实地考察,采样区的布设综合考虑了数据采集的可行性、湖体面积、湖区主要排污口的分布等问题。在布设采样点的过程中,设置了10个主采样点位,均匀分布于湖区范围内。由于本研究在利用遥感影像进行水质反演时采用的是中低分辨率的卫星遥感影像,因此主采样点位之间的距离均设置在1000 m左右,以保证各主采样点位在遥感影像上对应不同的像素;并在每个主采样点位的辐射范围内以150 m左右的间隔采样3次,将3次采样的平均值作为主采样点位的相关地面数据,用于反映500 m×500 m区域的水质平均情况,从而在最大限度上实现地面采样点的“点数据”和遥感影像的“面数据”的对应。
根据卫星过境的同步要求,分别于2012年1月9日、1月29日、3月20日、10月26日及11月6日分批对试验区10个主采样点位进行了地面数据同步或准同步的野外测量。
其中,1月9日及3月20日在 a、b、c、d点位各采样两次,1 月29 日在 g、h、i、j点位采样一次,10 月26 日在 a、d、e、f点位采样一次,11 月6 日在 d、g、i、j点位采样一次,因此共有21组地面实测数据。每组数据包括:各主采样点位地面光谱数据、水质参数数据、各主采样点的GPS定位信息,以及现场风速、水温、气温与湿度数据。通过预处理,从所采集的光谱数据中导出各测点水体出水反射率,并进一步确定各测点所对应的水质参数及其他辅助数据,用以研究试验区目标水体光谱特性、各水体组分吸收与散射特性,从而为遥感反演波段选择、模型构建及精度评价提供参考和依据。
根据经验与试验分析,相比于原始光谱,归一化后的光谱与水质组分浓度呈现较高相关性,并且特征突出。因此,将归一化后的水体出水反射光谱各波段进行组合,并将其与叶绿素a浓度进行相关性分析,结果如图1所示。其中波段组合采用了比值Ri/Rj(i≠j)、差值 Ri- Rj(i≠j),以及和差组合算法(Ri-Rj)/(Ri+Rj)(i≠j)。
图1 叶绿素a浓度与归一化波段反射率组合相关分析结果
由图1(a)、(c)、(e)与图1(b)、(d)、(f)的对比可知,光谱数据与叶绿素a原始浓度的相关系数基本上都分布在-0.95~0.95范围内,而光谱数据与叶绿素a浓度对数值的相关系数则分布于-0.8~0.8的范围内,说明光谱数据与叶绿素a原始浓度的相关系数绝对值在总体上要大于其与叶绿素a浓度对数值的相关系数绝对值。可见对于本研究中的目标水体,应采用相关性较高的归一化处理后的波段组合与叶绿素a原始浓度构建反演模型。
比较图1(a)、(c)、(e)的不同波段组合与叶绿素a原始浓度的关系:在波段比组合中,相关系数绝对值大于0.8的组合集中于波段625~675与波段500~640,以及波段700~780与波段500~750的波段比组合,前者是叶绿素红波段吸收峰与550 nm处反射峰的比值,后者是叶绿素715 nm处反射峰与550 nm处反射峰的比值。其中波段406与波段557的比值即叶绿素蓝波段吸收峰与550 nm反射峰之比的相关系数绝对值最高,为0.951 6。而在波段差组合中,相关系数绝对值较大的组合集中于波段750~790与波段760~770之间的波段差值组合,是叶绿素715 nm处反射峰及其峰值移动范围内各波段的差值。最大值出现在波段879与波段857组合上,其相关系数达到了0.966 0。在波段和差比组合中,波段400~470与波段740~761,以及波段600~750与波段650~750波段和差比组合与叶绿素a浓度存在较强相关性,前者是叶绿素蓝波段吸收峰与715 nm处反射峰范围波段的比值,后者是叶绿素685 nm荧光峰与680~715 nm处反射峰的比值。最大正相关和差比组合为(R761-R457)/(R761+R457),相关系数为0.954 0;而最大负相关和差比组合为(R402-R748)/(R402+R748),相关系数为 -0.925 7。
在经验模型的构建与分析中,变量间多元共线的现象十分普遍。偏最小二乘法(PLS)是构造回归方程的一种较新颖的方法,它能在建立两数据块之间关系的同时,消除数据之间的冗余信息,从而达到降维的目的,可用于多目标回归分析。PLS与主成分分析法类似,数据中存在共线性时,构造新的解释变量,对新的解释变量使用最小二乘来确定因变量和自变量间的回归方程;PLS还考虑了因变量矩阵即水色要素矩阵的信息相关性。另外,PLS方法比较适用于处理变量多而样本数少的情况,因此更适合二类水体的信息提取。
将经过大气校正后的MODIS波段反射率各种组合与叶绿素a浓度实测值进行相关分析发现:MODIS单波段反射率及其归一化结果与叶绿素a浓度相关性都不高。这些分析组合的相关系数绝对值大部分集中在0.5以下,相关系数绝对值大于0.5的组合仅占所有分析组合的3.85%,其中最大的相关系数绝对值也仅为0.604 3。另外,相同波段组合与叶绿素a浓度的相关性高于其与叶绿素a浓度对数值的相关性。因此,对于本研究的目标水体,宜采用归一化后的MODIS多波段组合建立经验模型,这与第3部分地面波段选择的分析结果一致。在MODIS不同波段组合与叶绿素a浓度的相关性分析中,同样采用了第3部分的比值、差值,以及和差组合算法。相关系数较高的波段组合见表1。
表1显示了与叶绿素a浓度的相关系数绝对值大于0.7的19个波段组合,其中最大相关系数绝对值为0.808 4。不同波段的比值类组合在整体上相关性大于其他类型的波段组合,不同类型的波段组合所涉及的波段集中于MODIS的第3、4、9至11,以及13波段,这是因为这些波段覆盖了叶绿素蓝光范围吸收峰、550 nm主反射峰,以及685 nm荧光峰等特征波段,而由于750 nm波段范围的大气校正效果影响导致第15波段相关系数较低。
表1 叶绿素浓度反演MODIS波段组合选择结果
基于以上分析,利用PLS方法进行解算,选取不同时间具有不同水质参数浓度的7个样点,即01091、01291、03202、03204、10262、11062 及 11064样点作为检查点对模型进行精度评价。对于叶绿素a浓度的PLS模型,如图2所示,从图2(a)PRESS值随PLS因子个数的变化可以看到,PRESS值在因子数为9时,达到极小,其值为0.065 1;之后随着因子数的继续增加,PRESS值有所上升并稳定在0.260 2左右。
图2 PLS模型叶绿素a浓度预测分析
根据PRESS的分析结果,选择PLS方法所得前9个主因子进行叶绿素a浓度反演模型的构建,模型具有最佳的预报能力,其预测结果见表2。通过统计分析可得,PLS方法所建叶绿素a浓度预测模型的相关系数平方R2为0.901 7,说明模型对建模数据的拟合程度较高;显著性概率为0.003 2,远小于0.05,方差比F为311.3,模型有意义。观察图2(b),7个样点的叶绿素a浓度的预测估值与实测值较为吻合,残差值大部分集中在 -10~10 μg/L之内,平均相对误差为26.04%,最小相对误差为14.59%,最大相对误差为36.59%。从结果分析来看,模型对叶绿素a浓度范围在低于20 μg/L、20~30 μg/L,以及大于30 μg/L的各个样点的反演精度比较平均,并没有出现对某个浓度范围测点具有更好精度的情况,说明模型对不同叶绿素a浓度都具有一致的敏感性。
表2 叶绿素a浓度PLS模型预测结果
综上所述,对于经验模型,将MODIS反演结果与地面数据反演结果相比可知:在波段相关分析中,叶绿素a浓度与地面实测光谱数据的相关系数绝对值总体上要高于与MODIS波段的相关系数绝对值;在相同测点上,利用地面数据所建模型的反演精度都要高于MODIS数据所建模型。前者对大部分测点的估算误差在10%以下,而后者对大部分测点的估算误差在20%至30%范围内,对个别测点的估算误差达到了40%以上。总体上来看,虽然利用MODIS数据估计的精度比地面实测数据估计的精度低,但前者仍较好地反映了各水质参数不同浓度的分布趋势,其对叶绿素 a浓度反映的精度为26.04%,也符合目前国际上水体水质参数测量平均误差范围(10% ~40%)的要求。
根据以上所建模型,得到东湖秋冬季水体叶绿素a浓度的分布情况,如图3所示。
图3 东湖秋冬季叶绿素a浓度分布
从MOIDS数据所反演的叶绿素a浓度分布来看,对于秋冬季的东湖水体,污染相对严重的水域集中在汤林湖与郭郑湖交界区域、郭郑湖西岸、庙湖西岸、牛巢湖,以及后湖的西南沿岸,体现为这些水域都具有较高的叶绿素a浓度;而小汤林湖、郭郑湖湖心区及后湖东南沿岸水质状况较好,水中叶绿素a浓度都较低。其中郭郑湖及庙湖西岸周边以学校、住宅小区及餐馆等为主,牛巢湖南岸则为东湖磨山风景区,可见,人为活动对东湖水质变化的影响较大。由 PLS经验模型所得反演结果可知,利用MODIS数据进行叶绿素a浓度反演所得结果较好地反映了实际水质的概况。
因此,在中等精度的要求下,利用MODIS数据建立经验模型,可快速获取大范围内陆湖泊水体水质状况,具有一定可行性。
本文以主要水质遥感监测指标叶绿素a为主要研究对象,针对内陆湖泊二类水体的特点,较系统地研究了利用地面实测光谱数据反演湖泊主要水质组分的方法和技术,并构造了针对内陆湖泊二类水体的水质反演经验模型;在此基础上,进一步构建了基于MODIS数据的水质遥感反演模型,并利用地面实测数据对其进行精度评价与分析,以探索中低分辨率下内陆湖泊水质参数遥感定量反演的可行性,取得了较好的结果。
[1]周正,何连,刘良明.基于HJ-1A/B CCD数据的东湖叶绿素 a浓度反演可行性研究[J].测绘通报,2011(3):11-14.
[2]黄昌春,李云梅,徐良将,等.内陆水体叶绿素反演模型普适性及其影响因素研究[J].环境科学,2013,34(2):525-531.
[3]吕恒,江南,李新国.内陆湖泊的水质遥感监测研究[J].地球科学进展,2005,20(2):185-192.
[4]VOS R J,HAKVOORT J H M,JORDANS R W J,et al.Multiplatform Optical Monitoring of Eutrophication in Temporally and Spatially Variable Lakes[J].The Science of the Total Environment,2003,312(1):221-243.
[5]李素菊,吴倩,王学军,等.巢湖浮游植物叶绿素浓度与反射光谱特征的关系[J].湖泊科学,2002,14(3):228-234.
[6]马超飞,蒋兴伟,唐军武,等.HY-1 CCD宽波段水色要素反演算法[J].海洋学报,2005,27(4):38-43.
[7]马荣华,唐军武.湖泊水色遥感参数获取与算法分析[J].水科学进展,2006,17(5):720-726.
[8]疏小舟,尹球,匡定波.内陆水体藻类叶绿素浓度与反射光谱特征的关系[J].遥感学报,2000,4(1):41-45.
[9]闻建光,肖青,杨一鹏,等.基于Hyperion数据的太湖水体叶绿素a浓度遥感估算[J].湖泊科学,2006,18(4):327-336.
[10]杨燕明,刘贞文,陈本清,等.用偏最小二乘法反演二类水体的水色要素[J].遥感学报,2005,9(2):123-130.