薛娇,姚晓军*,褚馨德,庞文龙,张聪,周苏刚
1.西北师范大学地理与环境科学学院,兰州 730070
2.中国地质调查局西宁自然资源综合调查中心,西宁 810000
冰川是冰冻圈的重要组成部分[1],其融水对于干旱半干旱地区尤为重要,素有“固体水库”之称。作为气候变化的理想指示器[2-3],冰川通过自身改变(如冰川面积增减或长度消长)适应环境变化[4]。冰川编目是认识冰川资源分布和研究冰川变化规律的基础数据[5]。受限于地域范围大小,多期冰川编目数据较少且现势性往往较差。由于冰川分布区自然条件恶劣和遥感特有的范围广、重复性和综合性等优势,遥感技术在冰川编目及冰川变化研究得到广泛应用,并形成一些冰川轮廓自动或半自动解译及相关参数自动提取方法[6-12]。得益于Landsat系列卫星丰富的历史存档数据和免费易获得性,现有的大多数冰川编目数据以该数据源为主[6,13-15],但其中等空间分辨率也在一定程度上影响了冰川数据(如面积和长度)的精度。随着近年来高空间分辨率卫星遥感影像的增多和深度学习方法的应用深入[16],获取现势性更强、精度更高的冰川数据集已成为可能,同时将深度学习方法应用于冰川遥感解译有助于提高其自动化程度。
青海省位于青藏高原东北部,境内冰川资源丰富,平均海拔在3000 m以上,基本呈现由东北和西北向西南逐渐升高趋势(图1)。因深居高原内陆,青海省属大陆性干旱、半干旱高原气候,气温和降水受海陆位置和地形影响较大[17]。在全球气候变暖背景下,青海省境内冰川呈现退缩减薄态势,冰川消融使得冰川融水增加,间接造成青海省湖泊面积扩张和自然灾害频发[18],因此明晰青海省冰川现状对研究该区域冰川变化规律及其对气候变化的响应具有十分重要的理论价值和现实意义。目前有关青海省的冰川数据集[19-21]多使用Landsat系列卫星影像,空间分辨率较低,且冰川变化研究主要集中在山系、流域和青藏高原等尺度,未涉及省级行政区域研究。为此本数据集基于2018—2021年高分卫星遥感影像和SRTM DEM数据,利用深度学习和冰川中流线方法提取青海省冰川边界和长度数据,以期为全面认识在气候变暖背景下青海省冰川的响应规律和水资源的合理利用提供科学依据。
本数据集共选用2018—2021年45景高分卫星(以下简称GF)遥感影像(表1),其中GF-1 PMS影像7景,GF-2 PMS影像9景,GF-6 PMS影像29景,影像级别均为Level-1A级,由高分辨率对地观测系统网格平台(https://www.cheosgrid.org.cn/)下载获得。为提高影像质量,在ENVI软件中对所有影像进行融合、几何校正和配准等预处理,处理后的GF-1/6 PMS影像空间分辨率为2 m,GF-2 PMS影像空间分辨率为1 m。受云雪影响,个别区域采用了同期Sentinel-2 A/B MSI(53景)和Landsat-8 OLI(4景)影像(表2),分别从欧空局哥白尼数据中心(https://scihub.copernicus.eu/dhus/#/home)和美国地质调查局(https://earthexplorer.usgs.gov/)下载获得。为提取冰川地形参数,选用的高程数据为SRTM DEM。该数据产品由美国国家航空航天局(NASA)、美国国家测绘局(NIMA)以及德国与意大利航天机构共同合作联合测量,于2000年2月11~22日由“奋进”号航天飞机上搭载的SRTM(Shuttle Radar Topography Mission)系统完成,空间分辨率为30 m,从美国国家航空航天局官网(https://earthdata.nasa.gov/)获取,本数据集使用的版本是V4.1。此外,参考《简明中国冰川目录》[22]和中国第二次冰川编目数据集[23],以完善冰川名称及所属市州、山系和流域等属性。
表1 本数据集所用的高分卫星遥感影像信息Table 1 Information about the Gaofen satellite images in this dataset
表2 本数据集所用的Sentinel-2 MSI和Landsat-8 OLI遥感影像信息Table 2 Information about the Sentinel-2 MSI and Landsat-8 OLI images in this dataset
本数据集首先采用深度学习方法中的DeepLab V3+网络对GF-1/2/6 PMS影像进行分割,基于样本库数据对模型进行训练并得到训练良好的模型,继而使用该模型提取待分类影像冰川轮廓。图2为基于GF-6 PMS影像的冰川边界提取过程示意图,具体步骤如下:
(1)选取影像上冰川分布区少云少雪的数据作为训练样本,并对冰川进行标记,然后将影像和标记好的二值化标签随机裁剪成多个1024×1024像素的瓦片作为深度学习训练的输入数据,并经过旋转、翻转等数据增强处理,得到3600张样本;最后将样本输入模型进行训练,得到训练好的模型并用于冰川分类。
(2)将待分类遥感影像按顺序裁剪为1024×1024尺寸(图2a和图2b),输入训练好的模型进行分类,得到冰川提取结果(图2c)。将各切片合并后,得到完整的结果(图2d)。
(3)深度学习直接获取的冰川提取结果为概率图,即每个像元被识别为冰川的概率,将概率图进行重分类并做栅格—矢量转化后得到冰川区矢量边界(图2e和图2f)。
(4)最后对冰川矢量边界进行逐一检查与修订,根据山脊线自动提取方法[17]提取的山脊线对修订后的冰川边界进行分割,从而得到单条冰川的矢量数据(图2g和图2h)。
冰川长度提取采用ZHANG等[11]提出的基于欧氏分配和冰川表面地形特征的冰川中流线自动提取方法,该方法仅需输入冰川边界矢量数据和DEM数据。其基本原理是基于DEM数据获取冰川轮廓上的海拔最高点和最低点,依此将冰川轮廓线进行分割,结合分割后的冰川轮廓线采用欧式距离方法将冰川平面划分为两个区域,每个区域为距各冰川轮廓线距离最近的点集,两个区域的公共边界为中轴线,即冰川中流线。处理过程包括冰川数据的预处理、辅助线提取、分割点获取、冰川特征线处理、冰川中流线生成和冰川长度计算6个主要步骤(图3)。对于简单冰川而言,其中流线长度即为冰川长度;对于复杂冰川(如山谷冰川、冰帽等)而言,以长度最长的中流线长度作为该冰川长度。
2020年青海省共有冰川3769条,面积为3685.25 km2,平均长度为1312.97 m。青海省冰川数量以<0.5 km2的冰川为主(2545条),面积以介于2-10 km2的冰川为主(1350.13 km2)(图4)。其中,面积<0.1 km2的冰川数量最多(1072条),但面积仅为52.55 km2(1.43%);面积≥50 km2的冰川数量最少(2条),面积为140.02 km2(3.80%)。当冰川面积≥0.2 km2时,各面积等级的冰川数量随面积等级的增加呈减少趋势,而各面积等级的冰川面积呈现先增加后减少的分布格局。
表3列出了2020年青海省各流域冰川数量和面积。显然,东亚内流区的冰川资源量最多,其冰川数量(2153条)和面积(1765.74 km2)分别占青海省冰川各自总量的57.12%和47.91%;长江流域的冰川资源仅次于东亚内流区,其冰川数量和面积分别为900条(23.88%)和1014.86 km2(27.54%);黄河流域的冰川资源最少,其冰川数量(164条)和面积(111.90 km2)分别占青海省冰川各自总量的4.35%和3.04%。在二级流域中,柴达木内流区的冰川资源最多,岷江流域冰川资源最少。
表3 2020年青海省各流域冰川统计Table 3 The statistics of glaciers in different basins in Qinghai Province in 2020
根据冰川积累区和消融区的末端形态差异,将冰川分为简单和复杂冰川2种形态。图5展示了不同形态的冰川轮廓及其长度,简单冰川(GLIMS编码为G091213E33132N)位于色林错流域(5Z2),其面积为0.16 km2,仅有1条中流线,冰川长度为596 m,海拔最高点和最低点分别为5722 m和5491 m;复杂冰川(GLIMS编码为G091151E33204N)位于色林错流域(5Z2),其面积为16.10 km2,有4条中流线。本数据集中仅保留其长度最大(8300 m)的中流线,海拔最高点和最低点分别为6031 m和5434 m。
2020年青海省冰川边界矢量属性表由13个字段构成(表4),反映了冰川的基本属性信息。其中,FID为冰川标识码;GLIMS_ID为冰川编码,编码方法与中国第二次冰川编目一致[5];Name为冰川名称,主要参考中国第一、二次冰川编目,除少数规模较大的冰川或有考察记录的冰川有名称外,研究区绝大多数冰川未命名;City为冰川所在市(自治州)的行政区划名称,参考最新青海省行政区划图确定;Mountain和Basin分别为冰川所属山系和流域;Area为冰川面积;Perimeter为冰川周长;Length为冰川长度;Date及Image_orig为冰川解译时所用遥感影像的采集日期和信息,Max_Elev和Min_Elev分别为冰川最高海拔和最低海拔。
表4 2020年青海省冰川边界数据集属性表说明Table 4 Description of the attribute table for the glacier boundary dataset in Qinghai Province in 2020
冰川长度属性表由FID、GLIMS_ID和Length三个字段构成。其中,FID为标识码;GLIMS_ID为冰川编码,与冰川边界数据集属性表中的GLIMS_ID相同;Length为冰川长度,数据类型为Double,单位为m。
基于遥感影像提取的冰川数据精度主要受卫星传感器和图像配准误差的影响[24-26]。若仅考虑遥感影像空间分辨率造成的误差[27],可由下式计算得出:
式中:ε为影像空间分辨率造成的冰川面积误差;N为冰川轮廓的周长;A为半个像元的边长。其中,2020年由GF-1/2/6 PMS(空间分辨率分别为2/1/2 m)、Sentinel-2 MSI(空间分辨率为10 m)和Landsat-8 OLI(空间分辨率为15 m)遥感影像空间分辨率造成的冰川面积误差分别为10.16 km2、25.95 km2和0.43 km2,合计为36.54 km2,占该期冰川面积的0.99%。
在保证冰川形态类型划分正确的前提下,冰川长度信息的精度取决于冰川轮廓的准确性和DEM数据质量,而后者对冰川长度信息的影响可以忽略[4]。因此单条冰川长度信息的精度取决于所用遥感影像空间分辨率在提取冰川海拔最高点和最低点时造成的误差[12],计算公式如下:
式中:ε为冰川长度提取的精度,L为冰川长度,λ为所用遥感影像的空间分辨率。其中,由GF-1/2/6 PMS、Sentinel-2 MSI和Landsat-8 OLI遥感影像空间分辨率造成的冰川长度总体精度为98.89%。
与现有其他冰川数据集[19-21]相比,本数据集使用了空间分辨率更高的国产GF卫星遥感影像,并应用最新的冰川中流线自动提取方法提取了冰川长度,所有结果均经过人工修订,准确性较高。本数据集充分反映了2020年青海省冰川分布现状和特征,可作为该地区冰川变化、冰川水资源的评估与合理利用以及防灾减灾等研究和应用的基础数据。
本数据集的数据存储格式为ESRI Shapefile,地理坐标系为WGS-1984,投影坐标系为Albers等积投影。用户可以使用ArcMap等GIS软件打开,并进行编辑和查询等相关操作,同时也可以基于最新遥感影像数据源对2020年冰川边界和长度数据进行更新修改,延长数据集时序。
致谢
感谢高分辨率对地观测系统网格平台提供的高分卫星遥感影像。
数据作者分工职责
薛娇(1998—),女,甘肃省泾川县人,硕士研究生,研究方向为GIS设计与开发。主要承担工作:基础数据收集、处理和论文撰写。
姚晓军(1980—),男,山西省夏县人,博士,教授,研究方向为地理信息技术与冰冻圈变化。主要承担工作:总体方案设计和论文修改。
褚馨德(1998—),男,湖南省常宁市人,硕士研究生,研究方向为GIS设计与开发。主要承担工作:编写数据处理代码。
庞文龙(1989—),男,甘肃省定西市人,高级工程师,研究方向为自然资源调查。主要承担工作:遥感影像质量检查。
张聪(1995—),男,甘肃省甘谷县人,博士研究生,研究方向为GIS设计与开发。主要承担工作:数据质量控制。
周苏刚(1995—),男,甘肃省静宁县人,硕士研究生,研究方向为GIS设计与开发。主要承担工作:论文修改。