禹政阳,马荣华,,4*,许金朵,王贞,胡旻琪
1.中国科学院南京地理与湖泊研究所,湖泊与环境国家重点实验室,南京 210008
2.中国科学院大学,南京学院,南京 211135
3.国家地球系统科学数据中心,湖泊–流域分中心,南京 210008
4.草原生态安全省部共建协同创新中心,呼和浩特 010021
湖泊富营养化是指湖泊中营养物质(如氮、磷等)积累,导致水体中浮游植物和藻类大量繁殖,从而引发水质恶化、水生生物死亡、水体变浑浊的现象[1]。湖泊富营养化威胁到湖泊附近的城市地区的用水安全,对水体自身的生态环境造成相当大的隐患。自20 世纪80 年代以来,由于经济的飞速发展和各类废水的过量排放,大量的氮、磷等营养物被排入湖泊中,恶化了湖泊水环境,从而造成了水质性缺水,尤其是东部平原湖泊群(巢湖、太湖)和部分西北湖泊(呼伦湖)[2]。因此,对湖泊营养状态的实时监测可以及时发现和控制水体富营养化,对保护水生态系统和人类健康,以及辅助环境管理,具有重要的意义。
相对于传统的逐点采样的监测方式,卫星遥感具有连续、大范围、周期性观测的特点[3]。目前卫星遥感手段已经实现了对藻华面积业务化监测,以及富营养化湖泊水质参数(叶绿素a、藻蓝素)浓度的反演[4]。Landsat 系列卫星由美国国家航空航天局(NASA)和美国地质调查局(USGS)合作开发,空间分辨率可达30 m,远高于MODIS 产品的空间分辨率。它可以获取地球表面的多光谱图像,从可见光到热红外范围内具有9 个波段(Landsat OLI)。Landsat 产品涉及多个应用领域,如土地覆盖制图、农业监测和自然资源管理,并且其数据通过美国地质调查局(USGS)的EarthExplorer 平台免费向公众提供。因此本研究以Landsat TM/ETM+/OLI 为数据源。
水体营养状态的传统评价指标包括营养盐浓度、透明度(Secchi Disk Depth,SDD)、叶绿素a(Chlorophyll-a,Chla)浓度,这些指标计算和分析较为简单,评价结果明了,评价效率高。然而,这些指标存在一定的局限性。例如,透明度只能反映光在水体中的穿透能力,无法直接反映水体中的营养物质浓度以及富营养化对水体生态系统的影响,同时也易受到水文条件变化和水体的生物化学过程的影响[5]。水色指数(Forel-Ule Index)是湖库、河流和海洋水质的重要衡量指标,与水体清洁度及富营养化状态相关[6]。水色指数容易受到环境条件的影响,如光照、天气、水体中的悬浮物等,并且难以通过仅凭水色指数来准确评估营养级别。综合营养状态指数(Trophic Level Index,TLI)是一种用于评估水体富营养化程度的指标。它结合叶绿素a 浓度、总氮(Total Nitrogen,TN)、总磷(Total Phosphorus,TP)、透明度和化学需氧量(Chemical Oxygen Demand,COD)计算获得,旨在提供对水体营养状态的综合评估[7],然而,其中化学需氧量难以通过遥感反演。因此,在本研究所涉及的呼伦湖营养状态评价中,运用TLI 评价呼伦湖的营养状态可能存在一定困难。卡尔森营养状态指数(Trophic state index,TSI)作为描述水体生态特征和判断水质状况的重要指标,被广泛应用于内陆水体的富营养化研究,它通过透明度、叶绿素a 浓度和总磷浓度计算得出[8-9]。TSI 综合考虑了多个水质参数,能够客观地评估湖泊的富营养化程度,便于对湖泊营养水平进行定量与分级;TSI指数是一种标准化的评价指标,适用于不同湖泊富营养化状况的对比。因此,这种评估方法更具科学性和客观性,可以提高评估结果的可靠性。综合以上几点,本研究选取TSI 作为水体富营养化评价的指标。
呼伦湖也称达赉湖,是中国第五大淡水湖,也是东北地区第一大湖[10]。近40 多年来,由于气候变化和人类活动的影响,湖水总含盐量和pH 值逐年升高,湖周大面积芦苇消失、渔业资源濒临枯竭和大量珍稀鸟类迁移[11]。同时,呼伦湖水体受到过度施肥、农业污染和工业废水排放的影响,导致水体中的营养物质如氮、磷等含量增加,富营养化加剧[12],并导致了有害蓝藻水华。因此,为了保证呼伦湖生态系统的可持续性以及周边城市的用水安全,需要对呼伦湖的营养状态进行实时监测。本研究的创新点在于将适用于江淮地区湖泊(见表1)的基于藻类生物量指数(Algal biomass index,ABI)的TSI 遥感评价方法[13],通过修正系数将算法进一步移植到呼伦湖,从而实现呼伦湖水体富营养化遥感评价,生成1986–2020 共35 年的呼伦湖夏季TSI 空间分布时间序列产品。本数据产品可用于分析气候变化与人类活动对呼伦湖富营养化的影响,为呼伦湖富营养化进程提供理论依据与数据支撑。
表1 湖泊野外采样日期与样点数量Table 1 Sampling dates and site numbers of water samples
2013–2018 年间在江淮流域开展湖泊野外采样活动,选择不同流域的代表性湖泊共17 个(见表1),共采集了224 组实测数据,其中星地匹配数据共31 条;各个湖泊的空间位置如图1 所示。本数据集使用Landsat TM、ETM+和OLI 的地表反射率(Surface Reflectance,SR)Tier 1 Collection 1产品,该产品数据在GEE(Google Earth Engine)平台上免费获取。
图1 采样湖泊与采样点位的空间分布Figure 1 Spatial distribution of sampling lakes and water samples
SDD(m)在野外试验过程中测量获得。在每个采样点处,使用标准的20 cm 直径的Secchi 圆盘垂直于水面放入水中。当它刚好消失在视野时,记录此时圆盘距离水面的高度,作为该样点处的水体SDD。在每个站点处用采水器采集表层水样(< 0.3 m),避光冷藏保存并带回实验室进行水体物质浓度的测定,Chla 浓度(μg/L)采用丙酮萃取法和分光光度计测定[14-15],实测光谱的离水反射比Rrs(sr-1)通过FieldSpec Pro Dual VNIR 测定[16]。
本数据集对Landsat TM/ETM+/OLI 数据的处理流程包括大气校正、水体边界提取、水生植被掩膜和构建基于ABI 的TSI 反演模型。具体流程如图2 所示。
图2 数据处理方法流程图Figure 2 Flow chart of data processing
1.2.1 传感器一致性评价
由于Landsat TM/ETM+/OLI 三者的过境时间没有重合,因此无法直接进行对比。已有研究在清水湖泊中利用两颗传感器重叠处相差一天进行对比,但本研究区呼伦湖的水体变化快,一天内湖泊环境会发生显著差异,因此我们参考CAO[17]的方法,借助MODIS 进行间接对比。MODIS(中分辨率成像光谱仪)是美国航天局研制的大型遥感仪器。自2000 年开始投入运行,时间分辨率为1 天,其成像时间可以与Landsat 系列的三个传感器重合,因此可以作为不同传感器一致性评价的参考。因此,本数据集使用MODIS Aqua 地表反射率产品对Landsat 系列卫星的地表反射数据进行一致性分析。MODIS Aqua 地表反射率产品空间分辨率为250 m,可以从GEE 平台获取[18]。
分析Landsat 系列卫星的一致性,需要进行以下主要步骤:首先,从37 张Landsat 影像中选取14 张OLI 影像、13 张ETM+影像和10 张TM 影像。这些影像覆盖了浑浊、蓝藻水华和较为清澈的水体状况,这样可以确保评价结果的可信度。其次,在野外采样过程中,各采样点之间距离大于1 公里,且距离湖岸超过1 公里,以避免临近像元与临岸混合像元对计算精度的影响。然后,计算点位处25×25 窗口的ABI 平均值,基于Landsat 各景影像的地表反射率,并计算匹配的MODIS 相同点位处3×3 窗口的ABI 平均值,以统一不同传感器空间分辨率下的像元尺度。最后,参考公式(1)和公式(2),比较两个传感器SR 计算的ABI 相关性,并根据拟合关系将基于TM、ETM+的ABI校正到OLI 上。
1.2.2 遥感数据的预处理
为消除大气吸收和散射对反射率的影响,本数据集采用LEDAPS(Landsat Ecosystem Disturbance Adaptive Processing System)算法对TM 和ETM 地表反射率产品进行大气校正,使用LaSRC(Landsat Surface Reflectance Code,Version 2.0)算法对OLI 地表反射率产品进行大气校正[19-20]。利用CFMASK算法生成的质量评估波段,对像元进行筛选,去除云、云阴影、冰雪像元。基于大气校正后的反射率,根据公式(3),将其进一步转换为水体表面的离水反射比Rrs(sr-1)。
式中,min(SRNIR:SRSWIR)表示近红外和短波红外地表反射率的最小波段值。λ对应各波段处的波长。公式(1)利用清洁水体在近红外波段低反射率、浑浊水体在短波红外波段低反射率的特性,将各个波段的反射率与二者的最小值做差值运算,从而达到去除残余气溶胶、水面天空反射光以及太阳耀斑影响的目的[21-22]。
1.2.3 呼伦湖水体提取与水生植被掩膜
首先对呼伦湖水体边界进行识别与提取,具体流程如下:
(1)结合NASA 官方提供的遥感影像,对其进行目视判断,剔除呼伦湖有云层覆盖的TM、ETM+和OLI 影像数据;
(2)根据1.2.1 中经过的转换得到的离水反射比Rrs(sr-1),计算呼伦湖地区的归一化水体指数(Normalized Difference Water Index, NDWI),使用基于NDWI 的动态阈值法对水体边界进行提取,获取最初的水体边界范围[23];
(3)为消除水陆边界的混合像元,对提取的呼伦湖水体边界向内取三个像元[24],将该结果作为最终的呼伦湖水体边界。
藻华像元和水生植被像元对遥感反演精度有着不可忽视的影响。本数据集进一步对湖泊水体中的藻华与水生植被像元进行掩膜,参照了Hu[25]所提出的浮游藻类指数FAI(Floating algal index),将其应用至内陆二类水体。FAI 计算过程见公式(4),水生植被和藻华的去除结果如图3 所示。
图3 藻华与水生植被像元掩膜Figure 3 Masking of pixels contaminated by bloom and aquatic vegetation
式中,SRSWIR、SRNIR、SRRED分别对应OLI 短波红外(1609 nm)、近红外波段(865 nm)与红光波段(655 nm)的地表反射率,λ对应各波段处的波长。本数据集利用统一阈值去除浮游藻类像元,结合直方图将FAI 阈值确定为-0.004,进一步去除藻华与水生植物像元。
1.2.4 基于ABI 的TSI 遥感反演模型构建
呼伦湖的采样数据表明,呼伦湖水体中的Chla 浓度均值大于20 µg/L。相关的研究表明Chla 对于藻类生物量的指示更加稳定[26],因此本数据集将使用基于Chla 的TSI 作为呼伦湖营养级别评价指标(参考公式(5))。基于TSI(Chla)的营养级别划分标准:TSI(Chla)≤ 40 属于贫营养型;41
水体富营养化的本质是藻类生物量的增加,遥感技术所探测到的信号不仅包括水体表面的信息,也包括真光层内水体综合信息,例如垂向藻类生物量[2]。对此,Hu 等人[27]提出了藻类生物量指数,以定量评估二类水体的藻类生物量,它与藻类生物量之间是负相关关系。该指数通过分别基于近红外波段、蓝光波段及绿光波段和红光波段、蓝光波段及绿光波段构建的两条基线的差值,对真光层内藻类生物量具有很好响应。ABI 计算方法如公式(6):
式中,BLUE、GREEN、RED和NIR分别对应Landsat-8 OLI 在482 nm、561 nm、665 nm 与865 nm处的地表反射率,λ为相应波长。
由于呼伦湖实测数据数量的限制,本数据集利用东部江淮地区湖泊的实测离水反射比Rrs(sr-1),计算ABI 和TSI,并以之为基础建立基于ABI 的TSI 反演模型,将其运用至呼伦湖。模型的拟合结果如图4 所示,随着ABI 的增加,藻类生物量减少,TSI 也随之降低。该模型在东部的湖泊水质遥感反演中效果良好,因此本研究将该模型尝试用于呼伦湖,以获取呼伦湖TSI 时空变化信息。
图4 基于ABI 的TSI 反演模型Figure 4 ABI-based TSI inversion model
1986–2020 年呼伦湖夏季TSI 数据集的数据实体名称为:HulunLake_TSI.tif。本数据集空间分辨率为30 m,均为栅格数据,数值范围为50–100。呼伦湖TSI 空间分布如图5 所示,1986–2020 年间,呼伦湖TSI 最大值达到100,最小值为0;从空间分布模式上看,湖心区的TSI 通常低于近岸区的TSI。在1986–1994、1999–2004、2017–2020 年间,呼伦湖TSI 呈现骤降趋势;然而在1998–2001、2007–2008、2013–2016 年间,呼伦湖的TSI 呈现上升趋势。2013 年之后,呼伦湖的TSI 基本维持在较高水平。
图5 呼伦湖夏季TSI 空间分布图Figure 5 Spatial distribution of TSI of Hulun Lake in summer
本数据集为确保数据的准确性,根据光谱响应函数(Spectral Response Function,SRF),将实测光谱数据换算成OLI 模拟的离水反射率Rrs(sr-1)。为提高星地同步匹配的准确性,采用邻近像元的方式进行空间匹配,同时在时间匹配中,将时间差小于3 小时的观测值视为同步观测。Landsat-8 OLI 各波段Rrs(λ)与基于实测光谱模拟的OLI 各波段Rrs(λ)对比结果如图6 所示,在不同的波长处,模拟的反射率Rrs(λ)的均方根误差均小于0.0045,平均绝对百分比误差均小于11.51%;基于模拟反射率得出的ABI 与卫星反射率得出的ABI 相比,均方根误差为0.0045,平均绝对百分比误差为9.73%。
图6 基于模拟OLI 的Rrs(sr-1)和OLI 的Rrs(sr-1)对比结果图Figure 6 Comparison betweem simulated OLI Rrs(sr-1)and OLI Rrs(sr-1)
本数据集利用呼伦湖现有的实测数据对基于东部江淮地区湖泊实测数据建立的TSI 反演模型进行精度评价,结果如图7(a)所示,基于实测离水反射比的TSI 和基于OLI 反射率的TSI 的平均绝对百分比误差为3.53%,均方根误差为2.39,均保持在较低的水平。根据呼伦湖富营养化已有的研究结果[28],对本数据集的精度进行评价,结果见图7(b),平均绝对百分比误差和均方根误差分别为7.53%和4.50。
图7 模型精度评价图Figure 7 Evaluation of the model accuracy
TSI 作为湖泊富营养化的指示器,是对水体进行实时监测的关键指标,因此在二类水体的富营养化时空变化研究领域得到了广泛应用。本数据集是基于ABI 的TSI 反演结果,精度较高。本数据实体解压后的tif 数据可以使用专业的GIS软件打开和编辑,也可以使用R 语言或python 的相关package直接读取分析;其时间序列涵盖了1986–2020 的呼伦湖TSI 的空间分布信息,可以为呼伦湖生态环境监测提供必不可少的数据支持。
致 谢
感谢Google Earth Engine(简称GEE)平台提供的丰富数据资源和强大技术支持,为本数据集提供了重要的数据基础和分析工具;感谢NASA(美国国家航空航天局)提供的卫星数据支持,为本数据集提供了非常宝贵的数据资源。
数据作者分工职责
禹政阳(1997—),男,山东省烟台市人,博士生,研究方向为湖泊环境遥感。主要承担工作:数据生产,结果验证,论文撰写和修改。
马荣华(1972—),男,山东省临沂市人,博士,研究员,研究方向为湖泊环境遥感。主要承担工作:总体思路设计,论文修改。
许金朵(1982—),女,江苏省睢宁县人,硕士,工程师,研究方向为数据库建设、数据共享和地图学与地理信息系统。主要承担工作:数据准备,数据整理与上传。
王贞(1983—),女,河南安阳人,硕士,研究方向为地理信息制图。主要承担工作:论文数据下载及处理、数据编辑。
胡旻琪(1994—),女,江苏省南京市人,博士,助理研究员,研究方向为湖泊环境遥感。主要承担工作:卫星一致性评估,论文修改。