匡子艺,江 辉,赵心如
(南昌工程学院 鄱阳湖流域水工程安全与资源高效利用国家地方联合工程实验室,江西 南昌 330099)
中国水资源具有人均占有量少、时空分布不均、水土资源不匹配、人类活动影响显著等特点,加上经济社会快速发展造成水资源供需矛盾突出,水资源态势十分严峻[1],因此对水体的研究显得尤为重要。遥感具有时间跨度大、重返周期短、监测准确度高和信息量充足等优势,是目前水体信息提取的重要手段。随着卫星技术的迅速发展,卫星遥感数据量急剧膨胀,遥感数据已具备明显的大数据特征:遥感数据的空间分辨率不断提高,由过去的百米、千米级分辨率逐步提高到现在的亚米级[2];卫星重访周期不断缩短,从过去几十天一次提高到现在的几天、甚至一天内多次重访的程度。随着遥感数据分辨率的提高,人们对精度提取有了更高的要求。Jiang等[3]利用Sentinel-2高分辨率卫星,开发了一种SWI新型水指数,结果表明,结合SWI和Otsu能以较高的精确度提取各种水体类别;Zhang等[4]基于ZhuHai-1高光谱(OHS)像素指数,实现了地表水的半自动提取,总体精度在98.8%以上,提取性能优于水指数(WI)、卷积神经网络(VFCN)或支持向量机(SVM)。但运用高分辨率卫星过程繁琐,面临海量数据的处理及预处理、跨尺度的分析、多平台交替使用等巨大挑战。
为应对这一挑战,GEE平台应运而生。中国传统遥感大数据平台,如自然资源卫星遥感云平台、地理空间数据云、地理国情监测云平台等,均是采用影像下载,本地处理及存储的方式,而GEE云平台提供了预处理及原始影像,且基于云端的处理方式和云盘存储省去了繁琐的前期工作和计算机空间,从而节约了成本;国外遥感大数据平台,如美国地质调查局(USGS)需要安装Java,并且下载速度受限;欧空局ESA哨兵数据库仅能下载哨兵影像数据,数据类型不够全面,而GEE云平台集成了多种常用遥感数据集以及不透水面积、降水量和数字高程等常见的地理空间数据集。GEE云平台中的全球水体数据(JRC)、全球降水量数据(GPM)、水体指数算法等也为GEE进行水信息监测提供了大量的数据支持和算法支撑。云平台中产品、算法的不断完善,文档的不断丰富,用户量的不断增多,也使得在将来利用GEE平台进行多尺度地理及遥感数据的处理和分析成为趋势[5]。
本文对GEE平台的架构体系和开发界面进行介绍,在查阅相关文献的基础上,分别介绍了GEE平台在水体提取方法、水域面积监测、水域地物分类、洪水灾害监测和水质监测5个方面的研究进展,并以鄱阳湖为例,分别作了实例应用,最后分析和讨论了GEE平台在水信息监测研究中的优势和不足之处。
用户在地理云计算平台提供的在线编辑器以及第三方应用Web Apps上编写代码;点击Run运行后编辑器会将编写的代码通过Web REST APIs向系统发送请求;云计算平台接收到代码后会根据代码的逻辑将其分配到不同的服务器上操作;显示的逻辑经过后台计算后返回给编辑器地图界面显示,同时将结果输出到输出窗口;异步导出的逻辑会生成相关导出任务,然后在后台异步执行直至任务导出结束,相关结果会根据设置导出到云端硬盘中(图1)。
图1 系统运行架构
GEE平台的整个开发界面分为脚本文件存放区、代码编辑区、输出控制台以及地图展示4大部分(图2)。
图2 GEE平台界面
GEE云平台是一个基于Google 云服务基础设施的遥感大数据分析平台,它结合了Google 强大的云计算能力与美国国家航空航天局(NASA),欧空局(ESA),美国国家海洋和大气管理局(NOAA)等机构的空间数据。GEE云平台自2015年公测上线至今,已有超过40 a的Landsat系列卫星影像、Sentinel-1/2/3/5卫星遥感数据、MODIS中分辨率遥感影像数据、高分辨率航空遥感影像(仅覆盖美国本土)、基础地理信息数据、地表覆盖数据、耕地数据、NDVI数据、EVI数据等,共计超过200个公共数据集、500多万张影像。通过查阅相关文献,统计了用于水体提取的使用率最高的几类遥感数据集,见表1。
表1 Google Earth Engine用于水体提取的常用遥感数据集
随着遥感大数据的发展,海量的遥感影像数据可供研究者使用。初期研究仅以光学数据为主,随着Sentinel-1的问世,开始出现合成孔径雷达(SAR)数据以及光学数据与雷达数据结合使用。随着研究的深入,不再局限于GEE平台提供的数据,开始上传更高分辨率数据和数据集,并在GEE平台中进行后续分析[6]。对比其他云平台,GEE平台对全球科研人员、学生等非商用性质用户提供免费服务,因其拥有40多a的公开遥感数据以及强大的后台运算处理能力,使得用户不再局限于本地机器的配置。GEE平台也因此成为最受欢迎的云计算平台,在遥感信息提取方面更具优势。
GEE平台已被广泛应用于水体监测的研究,查阅“GEE平台”“水体监测”等此类文献,总结得出主要涉及水体提取方法、水域面积监测、水域地物分类、洪水灾害监测和水质监测等方面。
遥感水体的提取历经了几十年,从目视解译,到半自动化光谱、纹理等特征提取,再到目前基于深度学习的全自动化水体提取[7],提取方法层层迭代,为了进一步节省研究成本,利用GEE平台自动提取水体的方法应运而生。表2列举了近年来利用GEE云平台进行水体提取研究的代表性文献。
表2 近年来水体提取研究进展汇总
从表2可以看出,Bi等[8]使用GEE平台选取3 a的Landsat 8遥感影像,通过计算4种不同水体指数,分析得出提取珠江流域地表水最高精度方法;Wang等[9]将GEE与多尺度卷积神经网络结合,研究出从陆地卫星影像中提取城市水的新方法,特别适合于城市化背景下大规模、长期的城市水变化检测研究。Li等[10]利用GEE云平台结合10 m分辨率光学影像和90 m数字高程模型,有效地提取了黄河上游小型开阔地表河流信息。针对多云、汛期地区,光学卫星如Landsat-8 OLI、Sentinel-2 MSI等难以发挥作用,GEE平台又提供了高分辨率合成孔径雷达卫星Sentinel-1,该卫星拥有在恶劣天气下也能穿过云雾获取地表信息,以及对水体提取较为敏感等优点,迅速获得了研究人员的青睐。祝鹏[11]通过GEE平台中的SAR影像,实现了高频次、长时间序列的地表水体监测提取;朱秀林等[12]基于GEE平台,结合多时相和升降轨SAR数据和Sentinel-2A光学影像,采用不透水面快速提取方法获取了高准确性的不透水面数据集;Zhou等[13]采用基于GEE平台的SAR影像,自动选择地表水提取阈值,实现了快速、精准提取水体,但并未将最大类间方差法与监督学习算法进行比较,得出结果较为单一。
湖泊作为区域陆地水循环中的一个重要载体,对区域的水量平衡发挥重要作用。研究湖泊水域动态变化,为区域水资源可持续利用提供依据是必要的。张振国等[14]利用Landsat 8 OLI影像,对合肥市不同地表水体类型进行水域面积计算,并做出精度评价分析;王占玲[15]利用高时空分辨率卫星GF-1和Sentinel-1作为数据来源,对全国湖泊水体面积分别作了年际、年内变化研究,但研究跨度偏小,影像数量偏少。戴志健等[16]使用DVBS极轨气象卫星和风云三号气象卫星数据,采用归一化水体指数NDWI提取鄱阳湖水体信息,对鄱阳湖水域面积年、月变化做了分析。虽然研究结果精度较高,但预处理及数据来源成本太高,耗时太长,不利于水域面积变化长时序研究。2019年,Deng等[17]在GEE平台上选取34 a长江流域的Landsat影像,通过多指标水质检测方法(MIWDR)快速提取开放地表水体,得出随着季节性水体的减少,长江三角洲永久性水体增加的结论;Luo等[18]使用GEE平台中全球地表水(GSW)数据集,提出了一种重建大型湖泊淹没区长时序、高频率时间序列的新方法,大大节省了时间和人力成本;刘垚燚等[19]基于GEE平台,以JRC全球地表水数据集和Landsat遥感影像为数据源,分析了近34 a太湖水体的动态变化,验证了平台开展水体长期变化监测的可行性;周珂等[20]在GEE平台上,选用Landsat系列多时相影像数据,结合水指数等方法对开封市城区年际水体分布变化情况进行了研究;姬梦飞等[21]以GEE平台为技术支持,选用30 a鄱阳湖Landsat影像,在几种水指数方法中选用最适水体指数提取鄱阳湖水体,分析了鄱阳湖面积的时空变化,因受云层影响,仅使用Landsat 5和Landsat 8,所选影像数量过少,实验结果精度不高。
借助遥感技术对地物进行分类研究是如今的科研手段,但面对处理数据复杂、时间过长、成本太高等问题,如何提高遥感地物判读效率成为了地物分类工作的重点关注之一。新一代基于云的地球科学数据和分析应用行星尺度平台GEE优势逐渐显现出来,它主要应用于地球科学数据,尤其是遥感影像的可视化计算和分析,目前提供了大概600多种地球科学数据集。Fitton等[22]借助GEE平台提出了一种通过使用Sentinel-2卫星来绘制潮间带地图的方法,为海岸管理及变化提供了可靠的评估;Jia等[23]通过GEE平台将最大光谱指数合成(MSIC)和大津算法(OA)相结合,实现对Sentinel-2影像的自动化执行,生成了最新10 m分辨率的中国潮滩地图;Wu等[24]使用Landsat 8 OLI产品,提出了一种克服潮滩湿地复杂环境的影响、对湿地植被物种进行有效分类的方法;张康永[25]利用GEE平台进行图像处理,同时通过随机森林分类法较好地处理了潮间滩与水域的分割,完成了滨海滩涂遥感制图。目前国内在GEE平台上对湿地的研究甚少,传统湿地监测方法对于大尺度范围长时序数据的获取较为困难,GEE平台的出现可有效解决监测数据获取难、处理复杂等问题,具有广阔的应用前景。
注重对水文动态情况的实时监测、对往年数据的规避分析、预测洪涝灾害的几率等都十分必要[26]。2021年,吕玉凤等[27]利用高分雷达卫星遥感影像,对湖南省受洪涝灾害影响严重的5个市,进行了有效的洪灾遥感监测;吕素娜等[28]利用哨兵一号B卫星获取了鄱阳湖区淹水信息,对鄱阳县等乡镇进行了有效的受灾程度分析。随着研究区范围扩大、多影像结合、时间跨度长等要求,单一利用图像处理软件已不能满足现今的技术要求,越来越多的人开始合理运用GEE平台,大大加快分析进程,缩短分析时间。Ben等[29]提出了一种利用SAR影像及Landsat和内置的其他辅助数据源,快速绘制洪水过程中地表淹没的算法。该算法能够迅速摄取数百幅平台上提供的SAR和光学影像,生成受灾地区洪水地图,避免了耗时的数据下载和预处理步骤;Varun等[30]利用GEE平台内置Sentinel-1数据集和大津算法绘制了洪水淹没区,通过混淆矩阵评估了2018年8月9日和21日的SAR洪水淹没图的总体精度;Meysam等[31]利用Sentinel-1影像结合大津阈值法,通过GEE平台对伊朗北部洪水进行了监测,结果表明该算法对变异性极高的淹没区域,也能有效反映洪水变化。针对国内洪涝灾害频发地区,Qiu等[32]选取GEE平台中66幅Sentinel-1影像,采用Otsu方法对2017~2020年珠江流域的洪水进行调查,为防洪工作提供了有力的支持;李健锋等[33]构建了基于GEE平台和Sentinel-1/2影像的洪水淹没范围快速提取模型,并对2020年7月鄱阳湖区的特大洪灾进行了分析,说明了该模型效率高、可行性强。目前国内利用GEE平台对洪涝灾区的研究还不够完善,但通过GEE平台实时进行洪水淹没范围分析是可行的,具有广阔的应用前景。
内陆水体的水质状况直接关系到人类生活用水安全,因此,对内陆水体进行水质监测意义重大,而采用遥感技术进行水质监测是主要手段之一。但分辨率低、易受天气和大气尘埃影响等问题是目前亟需解决的难题。表3列举了近年来利用GEE云平台进行水质监测的代表性文献。
表3 近年来水质监测研究进展汇总
从表3看出,Pereira等[34]在GEE平台上使用了2002~2017年的陆地卫星Landsat 8 OLI影像,挑选无云影像对巴西淡水湖PH值进行测定,实现了PH预测的相关性超过85%;Ramdani等[35]基于GEE平台以及Sentinel-3遥感卫星提取了海湾总悬浮物质,结果表明GEE平台在时间和效率方面均有利于海洋总悬浮物的测定;Khan等[36]利用GEE平台和Sentinel 2影像,通过归一化差异水体指数(NDWI)对手指湖区沉积物进行了监测,并得出春季和夏季前期沉积物量较大的结论,有利于及时保护水质。在水质监测中,叶绿素a浓度是表征水体富营养化程度的重要指标,通过遥感方式监测水体富营养化程度是有效途径[37]。田洪阵等[38]基于GEE平台的MODIS数据,对中国黄海叶绿素a浓度数据进行了有效的分析,发现叶绿素a浓度(Chl-a)分布呈现由近岸向黄海中部递减的特征;黄珏等[39]借助GEE平台,对全国湖泊五大湖区2003~2018年间Chl-a浓度分布特征做了分析。结果表明:在研究日期内,中国90%的湖泊处于中营养状态,82%的湖泊年均Chl-a变化率较小,温度和降水是影响Chl-a浓度变化的主要因素。
鄱阳湖是中国第一大淡水湖,其与长江相通,是最重要的生态保护区之一,在维系水生态安全方面发挥着重要的作用,也深刻影响着长江中下游人民生活。近年来,随着全球气候变暖、五河流域各种水坝林立、过度捕捞、无序采砂、围湖造田等自然或人为因素,鄱阳湖“老化”进程加速,湖泊面积缩减,鄱阳湖的及时监测与治理至关重要。
GEE平台提供了30 m分辨率Landsat 8 TOA卫星遥感影像,筛选出云层覆盖率较低的几景影像,计算对比了NDWI,MNDWI,SDWI等多种水体指数法,通过提取效果最好的MNDWI水体指数法结合OTSU分别提取了2019~2021年枯水期和丰水期鄱阳湖流域多年水体,如图3所示。其中2020年9月水体区域显著扩大,与当年7,8月暴雨雨情相吻合。
图3 2019~2021年鄱阳湖区水域范围
结合以上理论方法,通过GEE平台及Landsat 8影像集,运用最大类间方差法计算得出鄱阳湖近7 a枯水、平水和丰水期的水体面积柱状图(图4)。可以看出,受超强厄尔尼诺及副热带高气压带影响,2016年与2020年水域面积较其他年份显著增加,2020年突破峰值,为近10 a来最大。
图4 2015~2021鄱阳湖区水域面积
研究近30 a来,鄱阳湖区湿地作物及水体时空变化情况。通过GEE平台的Landsat 5-8系列多年影像,采用随机森林监督分类的方法对鄱阳湖区域进行水体、草洲、泥滩、沙地和其他等5种地物分类,结果如图5所示。可以看出,湖泊区域在1987年和2016年之间缩减了,大部分处于湖泊的南部和西部。
图5 1987~2021年鄱阳湖枯水期地物分类
洪水淹没范围研究对于防洪减灾、风险防范有着重要的意义。2020年鄱阳湖水域7月8日和7月12日短时间内持续扩大,通过GEE平台及Sentinel-1遥感卫星对鄱阳湖及周边地区2020年洪灾前后进行分析,提取鄱阳湖水域非水部分变成水的部分,通过updatamask分析从非水变成水的情况,提取结果如图6(c)所示,淹没面积约为2 117 km2,主要是对周边农田和草洲的淹没。
结合以上理论,运用GEE平台对鄱阳湖水域多年范围做Chl-a浓度分析。结合Landsat 8无云影像,根据反演模型提取Chl-a,效果如图7所示,可以看出鄱阳湖水域整体Chl-a浓度不高,在南部、西部以及东部少量地区Chl-a浓度较高,北部湖区相对较低,与实际状况大致相符,运用GEE对水质进行监测是有效可行的。
对于大部分卫星,如MODIS,Landsat,Sentinel-2等,GEE都集成了天顶反射率(TOA)和经过大气校正的地表反射率(SR)产品,使用时直接导入即可。通过导入Landsat 8 TOA卫星遥感影像,在编辑区编写水体指数公式和面积计算代码,可以得出鄱阳湖流域多年水体图以及对应的面积数值;导入Landsat 5-8系列多年影像,编写监督分类代码,经过调整训练样本点,可以得出鄱阳湖湖区地物分类图;导入GEE内Sentinel-1A遥感影像,对洪灾前后的分析可以得到洪水淹没范围图。通过GEE云平台的Sentinel-2遥感影像,结合实测数据,对鄱阳湖叶绿素浓度进行反演,进而得出水质状况。整个计算过程都是在谷歌云上运行,处理能力不受空间、时间的限制,利用GEE云平台对水信息进行监测是有效、可行的。
通过上述分析,本文认为GEE平台在水体及其他领域有着实际的研究价值,特别是水体研究等以下几个方面有较好的发展前景:
(1) 提高了科研效率。很大程度上缩短了遥感影像数据源的下载和预处理时间,尤其是SAR影像;让用户集中精力解决问题本身,而不需要花大量时间对遥感数据进行下载和处理。
(2) 存储更加方便。随着网络和科技的发展,海量的遥感数据也需要更大的存储和更高的计算能力,因此对本地服务器的存储能力有了较大的要求。云端硬盘提供了15 GB的免费容量,GEE下载的影像数据直接保存在云端硬盘中,便于随时取用。
(3) 地物分类更加精确。GEE云平台配置了监督和非监督分类算法,由传统的自动分类向人工智能技术转变。随着机器学习和深度学习的迅速发展,未来可提供Python端的深度学习算法来提高分类精度进行改进。
GEE云平台在大区域、多时相遥感研究领域取得快速发展的同时,也存在一些问题:
(1) GEE云平台对于使用者的网络状态和编程技术有一定的要求,需要使用者对于JavaScript或者Python语言的函数有一定的了解。
(2) 在批量导出影像集合后,GEE云平台会将大文件自动切片导出,Drive内会出现一景多图的现象,不便于后期的图像整理。
(3) 受气候条件影响,研究区可能存在云层覆盖量高的问题,仅使用光学遥感产品略显不足,还需改进光学结合微波遥感的产品集。