赵起超 赵姝雅 刘剋 王延仓 李怀瑞
关键词: COD; 白洋淀; 实测光谱; Landsat8; BP神经网络; 遥感监测
中图分类号: TN98?34 文献标识码: A 文章编号: 1004?373X(2019)03?0056?05
Abstract: By taking Baiyang Lake as the research area, the chemical oxygen demand (COD) inversion model is constructed by using BP neural network, combining actually?measured spectrum, Landsat8 image and COD actually?measured values. The results show that the spectral reflectivity can distinguish the pollution level of COD in water of Baiyang Lake, the average relative error of the value predicted by BP neural network and actually?measured value is 16.5%, and the model has high accuracy. The space distribution of COD concentration in water of Baiyang Lake on 30th October, 2017, is inversed on the basis of the model. The inversion results show that the Baiyang Lake has organic pollution to a certain extent, and the pollution level of part of the water can reach up to V?level, the center of the pollution area locates around villages and scenic spots at the southeast of Baiyang Lake. The main reason to cause COD rising is domestic and industrial sewage in the areas.
Keywords: COD; Baiyang Lake; actually?measured spectrum; Landsat8; BP neural network; remote sensing monitoring
白洋淀是雄安新区水生态系统的核心组成部分,其水质状况关系着居民生活和工农业生产活动。近年来,白洋淀水体富营养化问题日益凸显[1],氨氮(NH3?N)、总磷(TP)、化学需氧量(COD)等水质参数严重超标,距离国家要求的Ⅲ类水体红线较远。因此,对白洋淀进行水质动态监测,实时掌握水质时空变化特征显得尤为重要。水质遥感监测近年来发展迅速,该方法基于水质参数与光谱反射率的内在联系实现水质遥感监测[2],具有经济、快捷、时空分布连续等特点,可避免水质采样分析耗时、耗力、监测局部化等问题。一些学者通过统计回归、智能算法对叶绿素?a(Chl?a)、悬浮物(SS)、有色可溶性有机物(CDOM)、化学需氧量(COD)、总磷(TP)、总氮(TN)、氨氮(NH3?N)等指标实现了直接或间接的卫星遥感监测[3?4],并得到了较好的效果。水质遥感反演的核心问题是研究水质参数与光谱反射率的响应关系,建立二者的定量模型。因此,在模型建立前,有必要结合实测光谱数据讨论水质参数与光谱反射率的相关关系,确定最优响应波段,以便于提高模型反演精度。
本文以白洋淀为研究区域,结合实测光谱和Landsat8影像,分析COD与光谱反射率的相关关系,讨论COD反演的原理和可行性,并使用BP神经网络建立反演模型,据此进行水质评价分析。
白洋淀位于北纬38°43′~39°02′,东经115°38′~116°07′,其主体位于河北雄安新区安新县境内。白洋淀共由143个大小不等的淀泊组成,总流域面积为31 199平方千米,淀区水域辽阔,与居民生活区紧密联结。淀区主要以农业、养殖业、旅游业为主,位于北部的烧车淀是国家5A级旅游景点。此次采样路线由北至南依次经过烧车淀、安新镇、端村镇、赵北口镇和圈头乡,共布设14个采样点位。采样点分布图如图1所示。
2.1 卫星数据
使用Landsat8多光谱数据,时间为2017年10月30日。经查证,在10月30日—31日,采样区天气晴朗,无降雨发生,所选卫星影像云量几乎为零,卫星数据质量较好。卫星数据的预处理主要包括辐射定标和大气校正,辐射定标即将卫星图像的数字量化值转化为辐射亮度值或反射率,大气校正则是为了去除大气层中发生的散射、吸收等对真实地物反射率的影响。上述处理均在ENVI 5.1环境下进行。
2.2 水样及光谱采集
在2017年10月30日进行水样和光谱采集,以保证所有数据的同步性。采样时,使用GPS记录位置信息,同步采集水样和光谱。使用采样器将采集的水体静置30 min后移至采样瓶保存并送实验室分析,本文所分析的COD使用重铬酸钾溶液进行滴定。使用美国ASD公司的Field Spec地物光谱辐射仪采集光谱,采集时先对标准灰板进行优化,采用水面以上法对每个点位采集10次并求平均值作为最终结果。为减少环境因素带来的影响,对光谱数据使用均值归一化方法进行处理[5]。
3.1 实测光谱分析
COD是表征水体中还原性物质总量的化学指标,地表水中还原性物质以有机物为主,因此COD常用于表示水体有机污染程度。如表1所示,14个实验点位中仅有3个达到Ⅲ类水体标准(COD≤20 mg·L-1),其余均不达标,其中5个达到劣V类水体(COD>40 mg·L-1),表明水体有机污染程度较高。
归一化光谱曲线如图2所示。图2a)为各点位归一化光谱曲线,白洋淀水体光谱呈现内陆水体的典型特征,在近红外波段,反射率远大于0,并且受Chl?a,SS,CDOM等光学活性物质影响,谱线具有明显的峰和谷[6]:570 nm处出现最高反射峰,是由于藻类色素、悬浮物等发生散射作用;660 nm处有反射谷,是由于Chl?a在红波段的强吸收;700 nm处有反射峰,是由于Chl?a荧光效应以及Chl?a与水在该处吸收系数之和最小。
將各点位按COD浓度分为三组,即A组(COD>35 mg·L-1),B组(20 mg·L-1<COD≤35 mg·L-1)和C组(COD≤20 mg·L-1),依次代表重度污染、中度污染和清洁水体,在每一组内将光谱数据求平均值并绘制光谱曲线(见图2b))。从图2b)可以看出,光谱反射率与COD污染程度有着较好的对应关系,在近红外波段820~900 nm,反射率为[C>B>A],即污染越重的水体反射率越低;在波峰范围500~660 nm和700 nm处,反射率为[A>B>C],即污染越重的水体反射率越高;在波谷范围650~680 nm,光谱反射率为[C>B>A],即污染越重水体反射率越低。
上述现象表明,白洋淀水体的COD污染程度可通过光谱反射率区分,这主要与COD与有机物以及Chl?a存在内在联系有关。COD浓度取决于水体可溶性有机物总量,后者含有大量氢基团(如C—H),其在近红外区的倍频与合频会发生光谱吸收,虽然水含有羟基,但水分子极性较强,对中红外区的影响更大,在近红外区影响相对较弱[7],因此随着有机物总量提升,COD浓度升高,导致水体在近红外区反射率降低。由于Chl?a及其他藻类色素的散射、吸收作用,本文光谱数据在绿波段(570 nm)、红波段(660 nm和700 nm)出现特征峰和特征谷,浮游植物的新陈代谢会释放有机物,而Chl?a可以反映浮游植物存量高低,从该过程讲COD是Chl?a的被动因子,文献[1]在白洋淀的实测数据发现,COD与Chl?a存在明显的正相关关系,也说明这一点。因此,在图2b)中的波峰范围,COD污染程度较重的水体反射率高,而在波谷位置,COD污染程度较重的反射率低。因此,白洋淀水体的COD污染程度可通过光谱反射率加以区分,而绿波段、红波段和近红外波段可能是反演COD浓度的敏感波段。
3.2 卫星反演模型建立
3.2.1 相关性分析
将采样点分为训练样本和验证样本,Landsat8 OLI数据前7个波段包括可见光至近红外范围,分别用[B1~B7]表示,如表2所示。随COD浓度升高,各波段反射率总体呈下降趋势,这是由于有机污染导致水体颜色加深,呈黑色、蓝黑色,因此反射率较清洁水体要更低[8]。
表3为卫星光谱反射率与COD浓度的相关系数,这里考虑单波段以及波段组合[Bi+Bj],[Bi-Bj],[ln(Bi*Bj)]和[ln(BiBj)],由于组合种类较多,仅列出相关性较好的结果。单波段反射率同COD的相关性较差,仅有[B3,B4]和[B7]在[p=]0.05水平显著,其余波段均未通过显著性水平检验。经波段组合后,相关性明显提升,其中[B1+B7],[B2+B7]和[B4+B7]的[r]值均达到或接近0.8,并在[p=]0.01水平显著,这三种组合主要包括蓝、绿和近红外波段,这与前文光谱的分析结果是一致的。
3.2.2 BP神经网络模型
使用BP神经网络构建COD遥感反演模型,根据上述分析结果,选择相关性最显著的[B1+B7],[B2+B7]和[B4+B7]作为输入,COD作为输出。将学习速率设为0.01,这是因为学习速率低于0.05会导致计算速率过慢,而高于0.10时泛化能力和准确性较差[9]。为避免过拟合,本文选择单隐层的网络结构。理论证明,该结构可以逼近任何有理函数[10]。隐含层单元数经逐步试凑最终确定为3,训练函数选取“trainbr”,该函数引入贝叶斯正则化,能在一定程度上抑制过拟合,隐含层选用S型函数“tansig”,输出层选用线性函数“purelin”,训练步长设为1 000,COD训练目标为0.01。最终拟合出的模型拟合优度[R2]为0.708,均方根误差RMSE为5.88。
4.1 模型检验
引入验证样本对模型进行校验,统计结果如表4所示。
结果显示,训练样本和验证样本的平均相对误差分别为19.2%和9.7%,而全体的平均误差为16.5%。总体来看,模型精度较好,大部分点位平均误差小于20%,仅个别点位误差较大。造成误差可能因为输入因子选取了[B1+B7]和[B2+B7],[B1]和[B2]波长较小,受大气散射影响较大;另外,白洋淀水体形态复杂,中间散落村镇、苇田、台地等,这些外部环境因素均会影响反射率,从而引起误差。
4.2 模型应用
基于BP神经网络模型生成的2017年10月30日白洋淀水体COD浓度分布图如图3所示。从整体来看,白洋淀部分区域COD已达劣V类水体,区域水环境不容乐观。从空间分布上来看,烧车淀及白洋淀中部、西部水质较好,东南部污染较重,劣V类水体中心主要位于村镇或旅游景点,如李广村、梁庄村等为劣V类,王家寨度假村和荷花淀休闲岛附近为V类?劣V类,表明水质受人类活动影响较为明显,村镇和旅游景点人口稠密,各类生产、生活活动较强,向水体中排放大量有机物,引起COD浓度升高。
本文基于实测光谱和Landsat8影像,分析了光谱反射率和COD浓度相关关系。实测光谱数据表明,由于COD与可溶性有机物、Chl?a存在内在联系,光谱反射率可以较好地区分白洋淀水体COD污染程度。基于BP神经网络构建白洋淀COD遥感反演模型,模型拟合度[R2=]0.708,模型整体精度较好,仅对个别点位存在一定误差。总体来看,模型具备对COD较好的预测能力,可用于反映白洋淀COD的总体状况。最终结果显示,白洋淀水体有机污染程度较重,多个区域COD已达到劣V类水体,且劣V类水体中心多位于村镇和旅游景点,表明白洋淀水质受人类活动影响较为明显,应加强相关管理工作。
参考文献
[1] 杨丽伟,陈诗越.白洋淀水环境质量评价[J].南水北调与水利科技,2015,13(3):457?462.
YANG Liwei, CHEN Shiyue. Assessment of water environment quality of Baiyang Lake [J]. South?to?north water transfers and water science and technology, 2015, 13(3): 457?462.
[2] PALMER S C J, KUTSER T, HUNTER P D. Remote sensing of inland waters: challenges, progress and future directions [J]. Remote sensing of environment, 2015, 157: 1?8.
[3] 岳佳佳,庞博,张艳君,等.基于神经网络的宽浅型湖泊水质反演研究[J].南水北调与水利科技,2016,14(2):26?31.
YUE Jiajia, PANG Bo, ZHANG Yanjun, et al. Water quality inversion in wide and shallow lake based on artificial neural network [J]. South?to?north water transfers and water science & technology, 2016, 14(2): 26?31.
[4] 张丽华,武捷春,包玉海,等.基于MODIS数据的乌梁素海水体遥感监测[J].环境工程,2016,34(3):161?165.
ZHANG Lihua, WU Jiechun, BAO Yuhai, et al. Water monitoring based on MODIS remote sensing image in Wuliangsuhai Lake [J]. Environmental engineering, 2016, 34(3): 161?165.
[5] 唐军武,田国良,汪小勇,等.水体光谱测量与分析Ⅰ:水面以上测量法[J].遥感学报,2004,8(1):37?44.
TANG Junwu, TIAN Guoliang, WANG Xiaoyong, et al. The methods of water spectra measurement and analysis Ⅰ: above?water method [J]. Journal of remote sensing, 2004, 8(1): 37?44.
[6] 马荣华.湖泊水环境遥感[M].北京:科学出版社,2010:85?86.
MA Ronghua. Lake water environment remote sensing [M]. Beijing: Science Press, 2010: 85?86.
[7] 严衍禄.近红外光谱分析基础与应用[M].北京:中国轻工业出版社,2005.
YAN Yanlu. The basis and application of near infrared spectroscopy [M]. Beijing: China Light Industry Press, 2005.
[8] 王云鹏,闵育顺,傅家谟,等.水体污染的遥感方法及在珠江广州河段水污染监测中的应用[J].遥感学报,2001,5(6):460?465.
WANG Yunpeng, MIN Yushun, FU Jiamo, et al. Remote sensing method of water pollution and application on water pollution monitoring in Guangzhou Section of Pearl River [J]. Journal of remote sensing, 2001, 5(6): 460?465.
[9] DIN E S E, ZHANG Y, SULIMAN A. Mapping concentrations of surface water quality parameters using a novel remote sen?sing and artificial intelligence framework [J]. International journal of remote sensing, 2017, 38(4): 1023?1042.
[10] HORNIK K, STINCHCOMBE M, WHITE H. Multilayer feedforward networks are universal approximators [J]. Neural networks, 1989, 2(5): 359?366.