张大弘,宫鹏,姚晓军*,刘娟
1. 西北师范大学地理与环境科学学院,兰州 730070
数据库(集)基本信息简介
数据库(集)名称 1967–2014 年科西河流域面积≥0.05 km2 冰湖轮廓数据集 数据作者 张大弘,宫鹏,姚晓军,刘娟 数据通信作者 姚晓军(yaoxj_nwnu@163.com) 数据时间范围 1967–2014年 地理区域 空间分辨率 地理范围包括26.86°–29.14°N,85.39°–88.95°E,北至雅鲁藏布江南部,南到尼泊尔与印度交界处,西临加德满都,东达中、尼、印三国接壤地区。 全色影像1.8 m(Corona) / 15 m(Landsat ETM+/OLI),多光谱影像78 m(Landsat MSS) / 30 m(Landsat TM/ETM+/OLI);地理坐标系为WGS1984,投影坐标系为UTM。 数据量 143.94 MB 数据格式 ESRI Shapefile文件(压缩为.zip格式) 数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/885 基金项目 国家自然科学基金(41561016、41861013、41801052);西北师范大学青年教师科研能力提升计划(NWNU-LKQN-14-4)。 数据库(集)组成 数据集共包括2个数据文件:(1)Basin_Koshi.zip是科西河流域边界数据,数据量0.1 MB;(2)Glacial_lake_Koshi.zip是1967–2014年科西河流域面积≥0.05 km2的冰湖轮廓数据,数据量143.84 MB。
冰湖溃决洪水(Glacial Lake Outburst Flood,GLOF)是高山冰川作用区常见自然灾害之一[1-2],主要由冰川阻塞湖和冰碛阻塞湖溃决所引发。就中国西藏自治区而言,20 世纪以来发生的冰湖溃决洪水(泥石流)事件超过30 次[3];欧洲的阿尔卑斯山、南美洲的安第斯山、中亚的天山以及青藏高原周边高山地区也是冰川溃决洪水的主要分布区[4]。冰湖溃决洪水有可能造成人员伤亡、牲畜死亡、淹没草场或农作物以及毁坏道路桥梁等损失,因此防治冰湖溃决洪水灾害是当前这些区域的重要任务之一,而冰湖分布及变化正是预测冰湖溃决洪水灾害的最基础数据。冰湖扩张或萎缩可以灵敏地反映气候变化[5],其面积或水量的变化能从一定程度上反映区域水资源分布的变化。因此,构建较长时间序列的冰湖数据集对于研究冰湖分布与变化、预测冰湖溃决洪水灾害、合理利用水资源及探讨气候–冰川–冰湖间耦合关系具有重要意义。
关于冰湖的概念,学者们给出的定义不尽相同[6-12],但都强调冰湖是冰川作用所形成的,区别主要是冰川作用时期与湖泊物质来源。例如,在《冰冻圈科学辞典》[6]中,冰湖被定义为由冰川作用形成的湖泊;姚治君等[12]认为冰湖是末次冰期以来冰川运动或退缩产生的融水在冰川表面、前部或侧部汇集形成的湖泊,此定义强调冰湖与冰川间的地理位置关系;姚晓军等[9]从冰湖编目和冰湖溃决洪水角度提出冰湖是以现代冰川融水为主要补给源或在冰碛垄洼地内积水形成的天然水体,并给出了冰湖类型及遥感判识指标。考虑冰湖识别的易判别性、可操作性及一致性,本文采用姚晓军等[9]提出的冰湖定义及其分类体系。
喜马拉雅山中段是冰湖溃决最频繁的地区之一[13],其中科西河流域上游历史上发生此类事件数量最多[14-15]。作为恒河水系的重要支流,科西河流经中国、尼泊尔和印度3 国,流域内具有世界上最大的高差,最为完整的气候、土壤和植被带谱。在科西河流域,分布有多座8000 m 以上山峰,现代冰川发育,冰川覆盖率达9.78%。据统计,科西河流域历史上发生过17 次较大规模的冰湖溃决事件,其中中国境内高达12 次[16]。2015 年尼泊尔博克拉地区发生8.1 级地震,Kargel 等[17]对震后灾区分析时指出,未来当该区域发生更大震级的地震或震源靠近冰湖分布区时,发生严重冰湖溃决洪水灾害的可能性依然存在。除地震外,雪(冰)崩、强降水、冰川强烈消融、冰碛坝内死冰消融等亦是引发冰湖溃决的诱因[15,18]。因此,建立科西河流域长时间序列的冰湖数据集可为分析该地区冰湖时空变化特征、冰湖危险性评估及冰湖溃决洪水(泥石流)灾害等研究提供基础数据支撑和科学依据。
为获取科西河流域不同年代的冰湖数据,本研究选用的遥感影像数据源主要包括USGS/NASA(http://earthexplorer.usgs.gov)提供的14 景Corona 卫星影像和56 景Landsat MSS/TM/ETM+/OLI 遥感影像(表1)。其中,Corona 卫星影像成像时间集中在1960s,是该时段可获得的质量较好的遥感影像;Landsat MSS/TM/ETM+遥感影像时间为1970s、1980s、1990s、2000s,Landsat OLI 遥感影像则反映了2013 年以来该流域冰湖状况。以Landsat MSS/TM/OLI 数据作为主要数据源,可以免费获取大量的数据,且回访周期短,利用成像时间接近的影像通过交叉验证解译方法可以避免云和山体阴影等因素的干扰,提高冰湖解译精度。为保证数据的准确性,本研究同时选用了该流域1966–1980年的83 幅地形图,其中包括4 幅1:50 万、22 幅1:10 万、48 幅1:5 万和7 幅1:2.5 万地形图。受遥感影像空间分辨率限制,按Landsat MSS 影像空间分辨率(78 m)计算,0.006 km2是像元解译的理论阈值,考虑历史上该流域已溃决的冰湖面积普遍较大及冰湖面积扩张时长,本研究仅解译面积≥0.05 km2的冰湖。此外,冰川轮廓矢量数据可以辅助识别或确定冰湖位置,研究区所用的冰川轮廓数据由科技部科技基础性工作专项“中国冰川资源及其变化调查”项目组和国际山地中心(ICIMOD)提供[19]。
表1 数据集所采用的遥感影像列表
影像编号/轨道号 卫星/传感器 空间分辨率/m 影像获取时间 Landsat MSS 78 1976-12-19; 1977-03-19 140/041 Landsat TM 30 1989-01-17; 1992-09-22; 1999-10-28; 2000-10-30; 2009-10-15 Landsat OLI 30 2014-01-05; 2014-05-22 Landsat MSS 78 1976-12-02 141/040 Landsat TM 30 1991-11-30; 1993-03-08; 1999-12-06; 2000-10-05;2000-11-22; 2009-06-08; 2009-10-30; 2010-10-01 Landsat OLI 30 2013-12-04 Landsat MSS 78 1976-12-02 141/041 Landsat TM 30 1991-11-30; 2001-02-26; 2001-12-27; 2009-05-07; 2010-11-02 Landsat OLI 30 2014-04-11; 2014-05-13
基于光学遥感影像提取冰湖轮廓时易受云、雪及山体阴影的影响,因此在选取遥感影像时遵循少云多期原则,以达到多时段多角度的交叉解译目的,从而尽量避免漏画、错画问题。除Corona 遥感影像需进行几何校正和图幅拼接外,获取的Landsat 卫星系列遥感影像在数据生产时已经过初步预处理(系统辐射校正、地面控制点几何校正及基于DEM 的地形校正),经检查同一目标地物在不同影像中无明显错位、变形的情况,而目视解译又属于定性判别地类,故这些遥感影像未做其他预处理。
科西河流域位于青藏高原南部、喜马拉雅山中段(26.86°–29.14°N,85.39°–88.95°E),北抵雅鲁藏布江,南至尼泊尔与印度交界处,西临加德满都附近,东达中、尼、印三国接壤地区。流域内地势北高南低,海拔落差极大,主河全长255 km,上游分Arun(中国境内称为朋曲)、Sun Koshi(中国境内称为波曲)和Tamor 三个支流(图1)。流域东西长340 km,南北宽230 km,总面积约5.5×104km2,位于中国和尼泊尔境内的面积分别占流域总面积的51.96%和48.04%[20]。流域内分布有5 座海拔8000 m 以上山峰,围绕这些山峰发育了众多的冰川及冰湖。受地形影响,研究区气候类型差异明显,自北向南依次分布着喜马拉雅山过渡带、高山带、亚高山带、温带、亚热带和热带等,后三种气候类型分布在河流中下游,比较适宜农业发展,分布着大量人口。据统计,尼泊尔境内总人口434.59万人,占流域总人口的96.57%[18]。
冰湖作为一类自然水体,目前已有一些比较成熟的基于遥感影像的自动提取算法,如水体指数法、波段比值法、监督分类法及面向对象分割法等。由于本数据集采用的本底数据存在全色影像、地形图等多源数据,加之自动提取算法对影像质量要求较高,为保证数据采集精度,本数据集统一采用目视解译方法,具体步骤如下:
图1 研究区概况图
(1)获取解译底图:下载、收集并整理科西河流域的遥感影像、地形图等可提供解译对象信息的资料,按时间、类型、位置等归类,确保每个时段每个位置至少有一期影像覆盖。
(2)确定解译方式:因冰湖具有季节性变化特征,一年之内最稳定的时段为9–12 月,且少量影像(如Landsat ETM+)局部存在坏带,故以其他相邻时相的影像作为补充,通过交叉检验解译方式获取精度较高的冰湖轮廓信息。
(3)冰湖边界目视解译:以交叉检验解译的方式逐时期进行,显示比例尺控制在1:2000 左右,沿水陆、冰陆或者冰雪界线像元中心数字化冰湖边界,精度控制在一个像元以内。
(4)确定冰湖与非冰湖:采用姚晓军等[4]提出的冰湖定义、冰湖与非冰湖的界定方法,逐一对不同时期提取到的研究区湖泊数据进行判定,剔除由大气降水、地下水等形式补给的非冰湖,包括研究区内大量存在的古冰蚀湖,最终得到研究区不同时期的冰湖数据集。
(5)冰湖数据质量检查:逐一检查各冰湖轮廓图形数据、对应的影像数据及属性数据等,确保无漏画和错画、各数据项无遗漏和录入正确等。
(6)冰湖类型识别:将最终获得的冰湖数据导入Google Earth 软件,根据冰湖分类体系[4],逐一识别出所有冰湖的类型并写入属性表。
图2 展示了科西河流域冰湖整体分布情况。冰湖多边形矢量数据以gl_XXXX 形式命名,其中XXXX 表示年份;冰湖点矢量数据gl_LocationCode 给出了流域内所有的冰湖位置、编码、类型等信息。至2014 年,流域内共发育冰湖221 个,其中冰川侵蚀湖83 个(冰斗湖10 个,其他冰川侵蚀湖73 个),冰碛阻塞湖128 个(终碛阻塞湖115 个,侧碛阻塞湖13 个),冰面湖4 个,其他冰川湖6个。以面积持续扩张的冰湖GL085838E28322N 为样本,图3 展现了该湖泊在研究时段内的边界、周长及面积等的变化情况。图4 给出了数据集中面积先减小后持续扩张的龙巴萨巴湖不同时期的边界。
图2 冰湖分布数据集示意图
图3 冰湖(GL085838E28322N)轮廓及其面积与周长变化
图4 龙巴萨巴湖(GL088075E27946N)轮廓及其面积与周长变化
在本数据集中,每个冰湖对象由图形数据和属性数据两部分组成,其中属性数据包括要素标识码(FID)、形状类型(Shape)、冰湖编码(Code)、冰湖名称(Name_gl)、冰湖周长(Perimeter_gl)、冰湖面积(Area_gl)以及冰湖类型(Type_gl)等。其中,冰湖编码结构为GLnnnnnnEmmmmmN,编码中的GL 表示冰湖,n 表示冰湖质心经度,m 表示冰湖质心纬度,E、N 分别代表东经和北纬,n 的前三位和m 的前两位分别表示经度、纬度的整数部分,后三位表示经纬度小数前三位。为保证冰川编码的一致性,以2010s 时期冰湖质心为准。如冰湖在2010s 时期不存在,则以第一次出现年代对应的冰湖质心进行编码。
解译时依据姚晓军等[4]提出的冰湖定义、冰湖与非冰湖的界定方法,遵循马荣华[21]、宫鹏[20]等所使用的湖泊边界遥感判译原则,精度控制在一个像元以内。由于参与本数据集解译的长时序多源遥感影像空间分辨率存在差异,如Corona KH-4 影像空间分辨率为1.8 m(全色),Landsat MSS 影像为78 m(多光谱),Landsat TM 影像为30 m(多光谱),Landsat ETM+和OLI 影像为30 m(多光谱)和15 m(全色),因此本数据集的精度虽不及其他高/甚高空间分辨率、单一数据源生产的数据,整体精度仅能保证在最低空间分辨率78 m 左右。但从数据时序长度来看,本数据集可以满足大多数相关领域的研究要求。
科西河流域分布有数量众多的湖泊,因此通过区分冰湖与非冰湖以及识别各个冰湖的类型所得到的冰湖数据及湖泊类别属性是本数据集的价值之一,这可以为当地相关部门以及从事冰湖溃决危险性评价工作的学者们提供宝贵的参考。
本数据集是依据不同时期多源遥感影像数据(1967–2014 年)生产的6 期冰湖边界矢量数据,特点在于较长时间序列,可作为科西河流域冰湖时空变化、冰湖水量变化评估等研究的基础数据,也可作为该区域冰湖溃决危险性评估、水资源变化、气候变化及冰湖与冰川间变化响应关系等研究的重要依据。
本数据集解压后为ESRI Shapefile 文件,可使用支持该文件格式的GIS 与遥感软件读取与编辑。数据集直接反映了1967–2014 年科西河流域的冰湖分布特征,进一步分析处理可获得流域内冰湖的时空变化特征等信息,结合相关资料,亦可用作冰湖危险性评估及冰湖溃决洪水(或泥石流)灾害的基础数据。另外,如果还有其他来源的数据,可对本数据做更新修改,也可用最新的数据更新2010s数据,以延长数据时序。
数据作者分工职责
张大弘(1993—),男,甘肃平凉人,硕士研究生,主要研究方向为GIS 设计与开发。主要承担工作:基础数据收集、处理及论文撰写。
宫鹏(1990—),男,甘肃礼县人,硕士,主要研究方向为GIS 与冰冻圈变化。主要承担工作:基础数据处理、目视解译。
姚晓军(1980—),男,山西夏县人,博士,副教授,主要研究方向为地理信息技术与冰冻圈变化。主要承担工作:总体方案设计、冰湖类型确定。
刘娟(1993—),女,甘肃定西人,硕士研究生,主要研究方向为环境科学与地理信息系统。主要承担工作:数据集后期处理、冰湖类型识别。