马羽赫 赵牡丹 周鹏 王建
(西北大学城市与环境学院,西安 710127)
不透水面泛指由沥青、混凝土、塑料等会阻止地表水分下渗至土壤的物质构成的地表面(如广场、道路、建筑物屋顶等)[1],已经成为衡量城市化进程和环境品质评价的重要指标[2]。随着城市化程度加深,大量植被、湿地等自然表面被不透水面所代替[3],城市地表结构和热环境受到改变,导致地表径流污染[4-5]、热岛效应增强[6-7]、物种多样性下降[8]等生态环境问题。因此,快速、精确地提取城市不透水面信息具有重要意义。
卫星遥感具有更新周期短、可以大范围监测的特点被广泛应用[9-10],为快速、大范围监测不透水面动态变化提供了一种有效手段。目前,不透水面遥感信息提取的方法主要有:回归模型[11]、指数法[12-14]、线性光谱混合分解法[15],以及包括支持向量机[16-17]、人工神经网络[18]、随机森林[19]、决策树[20]等的分类器模型法。指数法主要利用不透水面同其他背景地物的光谱特征在不同波段上的差异,通过建立波段间的比值运算,突出不透水面信息,并辅以合适阈值将其与背景地物分离。该方法可以简单、高效、快速地提取大范围的不透水面,并且无需设置参数[21],目前已得到广泛的应用。但是,不同的指数构建方式和提取效果存在较大差别。文献[22]提出比值居民地指数(Ratio Resident-area Index,RRI)用于裸地较多城镇信息提取;文献[23]利用植被指数(Soil Adjusted Vegetation Index,SAVI)、改进的水体指数(Modified Normalized Difference Water Index,MNDWI)和建筑指数(Normalized Difference Built-up Index,NDBI)三个专题指数构建遥感建筑用地指数(Index Based Built-up Index,IBI);文献[24]等构建生物物理指数(Biophysical Composition Index,BCI)推导城市的构成;文献[25]等结合夜间灯光数据构建植被温度指数(Vegetation Temperature Light Index,VTLI);文献[26]等构建组合建筑指数(Combinational Build-Up Index,CBI)识别不透水面;文献[27]选用蓝、近红外波段组合提出一种新的垂直不透水层指数(Perpendicular Impervious Index,PII);文献[28]提出一种针对西北干旱区城市不透水面提取的增强型不透水面指数(Enhancement Normalized Difference Impervious Surface Index,ENDISI)。
以上指数模型均能有效对不透水面进行提取,但各模型最初为追求提取效果均基于单一传感器针对特定区域进行实验,鲜有推广到其他新型传感器的讨论。另外,各模型均提到裸土、沙地对不透水面提取结果的影响,但尚无研究对不同模型受裸土、沙地的影响程度进行定量对比。因此,本文使用目前数据品质高、易获取的开放免费传感器数据Landsat8 OLI和Sentinel-2A MSI数据,并选取NDBI、RRI、IBI、PII和ENDISI五种不透水面提取指数进行实验,这些指数主要利用可见光、近红外和中红外波段构建,不涉及分辨率较低、数据源较少的热红外波段,具有一定普适性。结合不同传感器数据和提取方法,本研究以大量裸土、沙地与人工不透水面混合分布的银川市部分区域为研究区,系统对比这5种指数对不同传感器数据的响应效果和对人工不透水面与裸土沙地的区分程度,填补各指数在两种传感器研究区下不透水面提取差异的研究空白,以期为今后不透水面的大范围精准提取、多时序监测提供参考。
银川市位于宁夏回族自治区北部,祁连山以东,黄河上游以西,地处北纬37°29′~38°53′、东经105°49′~106°53′。银川市下辖兴庆区、金凤区、西夏区、永宁县、贺兰县以及灵武市。本次研究区主要包括市辖区大部以及贺兰县和永宁县的部分区域(见图1)。银川市是我国西北地区重要的中心城市,是国家西部大开发战略的重点发展城市,“一带一路”建设的重要节点城市,素有“塞上江南,鱼米之乡”之美誉。2017年,银川市常住人口达222.54万人,GDP达1 803.17亿元,城市化率达到74%。受自然环境和人为活动影响,区域内有大量沙地和裸露地表。
图1 研究区位置Fig.1 Location of study area
Landsat8是美国陆地卫星系列的第8颗光学对地观测卫星,发射于2013年2月11日,延续了Landsat TM/ETM+的空间和时间分辨率,保持较好的时序性,并且在波段数量、波谱范围和辐射分辨率上得到了改进[29]。Sentinel-2是欧洲航天局分别于2015年6月23日和2017年3月7日发射的Sentinel-2A和Sentinel-2B双卫星,可以获取地球表面10~60m空间分辨率的光学影像,拥有较高的空间分辨率、较短的重访周期,并在全球范围免费开放获取[30]。Landsat8 OLI和Sentinel-2 MSI数据是目前和今后一段时期可稳定获得的高品质多光谱遥感数据[31]。Landsat8 OLI和Sentinel-2 MSI的常用波段对比见表1。
本研究所使用的Landsat8 OLI数据下载于地理空间数据云(http://www.gscloud.cn),条带号为130/33,成像时间2017年6月25日。Sentinel-2数据下载于欧洲航天局(https://scihub.copernicus.eu/)L1C级产品,成像时间为2017年7月29日,经Sen2Cor插件进行辐射定标和大气校正处理后转换为L2A级产品。Sentinel-2 MSI的可见光和近红外波段为10m分辨率,短波红外为20m分辨率,为了使6个波段的分辨率保持一致,利用“哨兵”数据应用平台(Sentinel Application Platform,SNAP),使用最近邻方法对可见光和近红外波段进行重采样。两种数据时间相近,都经过预处理得到地表反射率。
表1 Sentinel-2 MSI和Landsat8 OLI常用波段对比Tab.1 Comparison of common bands between Sentinel-2 MSI and Landsat8 OLI
(1)归一化建筑指数(NDBI)
文献[12]受到归一化植被指数(NDVI)构建的启发,发现在Landsat5 TM影像的第4与第5波段之间,城镇的灰度值递增,其他地类灰度值减小,据此构建指数NDBI如式(1)
式中 TM4、TM5分别指近红外和中红外波段的反射率,NDBI取值在–1与1之间。
(2)比值居民地指数(RRI)
文献[22]采样分析影像上6类典型地物的光谱特征,认为Landsat5 TM影像的第1和第4波段对比度较大,能很好地反映城镇和裸地信息,因此提出指数RRI如式(2)。在此基础上,通过设置合适阈值剔除裸地,掩膜水体,最终提取出城镇信息。
式中 TM1、TM4分别指蓝波段和近红外波段的反射率。
(3)遥感建筑用地(IBI)
文献[23]针对建筑用地光谱性质的复杂性,未采用影像的原始波段,而选用三个有关的专题指数,利用土壤调节植被指数SAVI、改进水体指数MNDWI和归一化建筑指数NDBI,构建遥感建筑用地指数IBI,如式(3)。由于这三个专题指数互为负相关,因此能够很好地从遥感影像中分离出建筑用地信息。
(4)垂直不透水层指数(PII)
文献[27]在分析比值型植被指数和线性型植被指数的基础上,认为在不透水层提取中,线性形式构建的指数能够根据不同研究区内的土壤线自适应调整参数,减弱土壤带来的噪声影响。因此,利用蓝波段和近红外波段组合构建线性指数PII,如式(4)
式中BBlue、BNIR为蓝波段和近红外波段的反射率;m、n分别为蓝波段和近红外波段系数;C为随参照线选取而变化的常数,m、n、C可通过参照线方程求出。在PII计算中,需要根据研究区土壤样本和不透水层样本计算蓝波段和近红外波段系数m、n。但是m、n值在不同的研究区中差异不大[32],所以这里取文献[27]所选研究区m、n、C的平均值(m=0.905,n=0.435,C=0.019)进行实验。
(5)增强型不透水面指数(ENDISI)
文献[28]在对主要地类谱特征对比分析的基础上,发现在蓝波段,不透水面的值高于水体、植被和裸土,并且差值较大;在红波段,裸土的反射率高于不透水面;在近红外波段,裸土和植被的值均高于不透水面。据此提出ENDISI,如式(5)
式中BRed、BSWIR1、BSWIR2分别为红波段和2个中红外波段的反射率。
使用最大类间方差法(OTSU)[33]自适应阈值分别对Landsat8 OLI和Sentinel-2 MSI两种数据的5种不透水面指数进行阈值分割。文献[34]提出的MNDWI指标可以有效消除植被信息,快速提取水体,因此利用MNDWI对水体掩膜,最终得到不透水面提取结果,如图2、图3所示。对比假彩色合成图和Google Earth高清影像,发现每种指数基本都可以将不透水面信息提取出来,但NDBI、RRI、IBI、ENDISI四种指数出现明显的误提(红线标出),特别是裸土信息误提严重,PII指数出现明显的漏提(黄线标出)。
图2 OTSU阈值的Landsat8不透水面提取结果Fig.2 OTSU threshold Landsat8 impervious surface extraction results
图3 OTSU阈值的Sentinel-2不透水面提取结果Fig.3 OTSU threshold Sentinel-2 impervious surface extraction results
因此,本文在OTSU法确定的分割阈值基础上,结合Google Earth同期高清影像,人机交互确定出每种指数的人工阈值进行提取实验。Landsat8数据的NDBI、RRI、IBI、ENDISI、PII最终阈值分别为–0.012、0.353 2、–0.013 5、–0.033 7、–250.413 8;Sentinel-2数据的NDBI、RRI、IBI、ENDISI、PII最终阈值分别为–0.054 9、0.440 6、–0.071 3、–0.023 9、–117.503 0,提取结果如图4、图5所示。
分别选用本次使用的10m分辨率的Sentinel-2真彩色影像和2017年7月15日更新的Google Earth银川市高清历史影像,作为Landsat8和Sentinel-2的验证数据源,通过目视解译的方式,从验证数据源中随机选取300个不透水面样本和300个非不透水面样本作为真值参考,对OTSU法阈值分割的结果和人机交互阈值分割的结果进行精度验证,结果如表2所示。
可以得出2种传感器数据、5种不透水面提取指数的10种组合中人机交互阈值提取结果的总体精度均高于OTSU法阈值,原因在于人机交互阈值提取的结果可以很好的平衡错分和漏分情况,从而提高了总体精度。针对最终选取的人机交互阈值提取结果来看,以Sentinel-2为数据源的5种指数提取结果的总体精度各自均高于Landsat8。同一传感器下,ENDISI、PII、RRI的总体精度相对NDBI、IBI更高。5种指数中提取结果总体精度最高的为RRI。
图4 人机交互阈值的Landsat8不透水面提取结果Fig.4 Landsat8 impervious surface extraction results of human-computer interaction threshold
图5 人机交互阈值的Sentinel-2不透水面提取结果Fig.5 Sentinel-2 impervious surface extraction results of human-computer interaction threshold
表2 2种传感器数据的5种不透水面指数提取结果精度指标Tab.2 Accuracy index of five kinds of water-impermeable surface index extraction results of two sensor data 单位:%
图6 Landsat8和Sentinel-2数据下5种指数的不透水面提取结果叠加Fig.6 Superposition of the impervious surface extraction results of the five indices under Landsat8 and Sentinel-2 data
表3 5种不透水面指数提取结果像元统计Tab.3 Pixel statistics of the extraction results of the five types of impervious surface index 单位:%
分别将Landsat8和Sentinel-2两种数据源的5种指数提取结果进行叠加,如图6,显示每个像元被几种指数提取为不透水面,并统计各类像元的占比,如表3所示。经验证比对,被5种指数均提取为不透水面的像元基本与实际吻合;被4种和1种指数提取为不透水面的像元较少,主要为建筑或道路与高亮度裸土的混合像元;被3种指数提取为不透水面的像元多分布于城区内,主要由ENDISI、RRI和PII的提取结果组成,由于NDBI和IBI未能正确识别大量建筑、道路和小面积裸土混合分布的区域,因此出现了较多的漏提,这种漏提现象在Landsat8数据中更加明显;被2种指数提取的像元在Landsat8数据下多分布在南部的城区外围,主要由于这些地方分布较多裸土、未种植作物的裸露农地与零散建筑混合,NDBI和IBI两种指数错提较多造成,而这种情况在Sentinel-2数据中更加突出,错提像元在近郊区大量出现,东部、南部城区外尤为严重。从总体上看,该研究区裸土和沙地占比较大,干扰严重,但是在两种传感器下分别被5种指数均判别为不透水面和非不透水面的像元分别达79.31%和77.7%,说明5种指数均可以基本识别研究区内的不透水面。从结果上看,对该研究区东部、南部不透水面及大量裸土沙地混合分布的区域,NDBI和IBI的不透水面提取效果相对ENDISI、PII和RRI较差。
先将Landsat8提取结果重采样至10m,然后分别对5种指数的Landst8和Sentinel-2两种数据源提取结果进行叠加,如图7,共有仅S2为不透水面、仅L8为不透水面、L8、S2均为非不透水面和L8、S2均为不透水面这4种像元类型(L8、S2分别代表Landst8、Sentinel-2数据的不透水面提取结果),统计每种指数叠加结果的各类像元占比,如表4所示。结合图7和表4可知,5种指数的2种传感器数据提取结果在大部分区域较为一致,提取结果中同类型像元占比均在80%左右,但像元分布有所差异,NDBI和IBI的叠加结果中仅Sentinel-2判定为不透水面的像元较多。经对比发现,在Sentinel-2数据下,NDBI和IBI可以更好的提取城区内建筑密集区域的不透水面,漏提现象较少,另外,这两种指数对研究区东部和东北部的人工大棚识别效果较好。RRI的叠加结果中仅Landsat8判定为不透水面的像元较多,主要是误提了大量的高亮度裸土信息。ENDISI和PII对两种传感器数据的提取结果比较一致,因此,这两种指数对Landsat8和Sentinel-2的响应效果具有更好的一致性。
图7 5种指数下Landsat8和Sentinel-2的不透水面提取结果叠加Fig.7 Landsat8 and Sentinel-2 impervious surface extraction results are superimposed under five indexes
表4 各像元类型不同叠加结果的面积占比Tab.4 Proportion of each pixel type 单位:%
为进一步对比各指数在不同传感器下的提取精度和细节效果,选取研究区内6个较为典型的局部区域,将2种数据源的5种指数提取结果进行对比(见表5)。区域1为包含植被和水体的密集建筑区,可以看出Landsat8影像由于分辨率相对更低,混合像元的存在极大影响了提取效果,尤其在Landsat8数据的提取结果中可以明显观察到NDBI和IBI指数的漏提较为严重,Sentinel-2数据则能更好的表现建筑细节。区域2为农田中的道路,可以看到Landsat8数据的提取结果虽然相对较粗,但RRI和PII指数基本能较为完整的识别出道路和建筑,Sentinel-2数据的分辨率优势极大的减少了混合像元的影响,对道路这类细小的不透水面的识别较为准确,但可以看到NDBI和IBI指数有将农田中的裸土识别为不透水面的情况。区域3为细碎的建筑和裸土混合分布的地区,尽管基于Sentinel-2数据能提取更多的建筑细节,但Landsat8和Sentinel-2两种数据在不同方法下均出现了将裸土识别为人工不透水面的情况。区域4为被道路围着的大块裸地,可以看到两种数据源下NDBI和IBI指数基本将裸土全部识别为不透水面,ENDISI也将大部分裸土识别为不透水面,而RRI和PII指数则能较好的区分出道路和裸土,并且在Sentinel-2数据下的区分效果更好。区域5和区域6主要为包含裸土的农地,有零散建筑分布其中,可以看到NDBI和IBI指数将大量的裸土识别为不透水面,ENDISI指数同样也有一定程度的误提情况,而RRI和PII指数则能较为准确的识别面积较小的不透水面。总体上,Landsat8数据受限于分辨率较低,导致提取结果较为粗糙,局部漏提较严重,细节不完整,Sentinel-2数据能表现更多的细节,提取结果比较完整,5种指数的提取效果均好于Landsat8数据,因此,提高数据的分辨率,可以改善地物识别效果。具体来看,两种数据源下PII和RRI的总体提取效果、局部提取细节以及区分不透水面和裸土沙地的能力均优于NDBI、IBI和ENDISI。
表5 5种指数在2种传感器数据下的局部提取结果Tab.5 Local extraction results of five indexes under two sensor data
本文以银川市部分区域为例,选取NDBI、IBI、ENDISIS、PII和RRI五种常用不透水面提取指数,分别对Landsat8和Sentinel-2两种传感器数据的不透水面进行提取,得出以下结论:
1)5种指数针对Landsat8和Sentinel-2数据均可以基本提取出研究区的不透水面信息,但提取结果均不同程度的受到裸土和沙地的干扰,在裸土和沙地分布较广泛的情况下,NDBI、IBI的精度在70%左右,ENDISI、PII和RRI可达80%以上,其中,RRI和PII区分不透水面和裸土沙地的效果最好,RRI提取结果的总体精度最高。
2)总体上,以Sentinel-2为数据源的5种指数提取结果总体精度各自均高于Landsat8,提取的不透水面细节表现更清晰、更完整。结果表明,NDBI和IBI对Sentinel-2数据的响应效果更好,在不透水面密集分布的城市内部较Landsat8数据提取精度更高,同时,这两种指数可以很好的识别人工大棚。RRI在Landsat8数据下,裸土和沙地误提现象较Sentinel-2严重。ENDISI和PII对两种传感器数据的响应效果较一致。
总体上看,数据分辨率仍是影响提取精度的主要因素,这也是相同指数在不同传感器下提取结果产生差异的直接原因,今后需要结合更高分辨率的数据进行分析。此外,由于不同指数方法选取的波段组合不同,导致了相同传感器下不同指数提取结果的差异性,未来仍需在更多典型区域进行推广实验,探究更加合理的识别方法。目前,对裸土沙地和不透水面的准确区分仍是不透水面提取的难点之一,本文通过比较5种不透水面指数在2种传感器数据下的提取结果,对比分析了5种指数的差异性、区分不透水面和裸土沙地信息的能力以及对两种传感器数据的响应效果,希望能为未来大范围、快速、精准地提取不透水面提供参考,并进一步促进这两种数据在不透水面提取中的应用。