边万超,张辛佳,张 斌,颜洋洋,宋 瑜,2
(1. 杭州师范大学信息科学与技术学院,浙江 杭州 311121; 2. 浙江省城市湿地与区域变化研究重点实验室,浙江 杭州 311121)
近年来,随着我国城市化进程的加快和发展水平的不断提高,不透水面所占的比例也显著提高,并逐渐成为衡量城市化进程的一个重要指标[1].不透水面是指水体不能下渗至土壤的物质,包括自然不透水面和人工不透水面(如道路、建筑物顶部、沥青等水无法渗透的人工构筑表面)[2],其对城市的空间格局、生态建设等有着直接或间接的影响[3],甚至会阻碍城市的可持续发展.随着城市化过程中土地利用的显著变化,大量耕地、未利用地等转变为不透水面,不透水面不合理的空间布局已被证明是城市内涝和热岛现象的主要影响因素之一.因此,如何快速且有效地实现城市不透水面信息的提取具有十分重要的意义[4].
传统获取城市不透水面信息主要采用人工实地测绘的方法,具有很多的不足之处,比如需要耗费大量资金、数据更新的速度不够快等.随着卫星对地观测技术的快速发展,越来越多的学者提出遥感提取不透水面信息的新方法与新技术,如光谱混合分析法、指数法、决策树模型、回归模型及其他基于分类的方法等[5-7].众所周知,遥感技术具有快速、大范围、多尺度、可重复对地观测等众多优势,为高效准确进行不透水面空间分布信息的获取和分析提供了良好的手段.本文拟重点对城市不透水面遥感提取中的指数法与监督分类法进行研究讨论,对比分析不同方法提取的效果,并利用高分辨率影像进行精度验证,以期为不透水面信息的提取提供一种快速准确的方法.
图1 研究区遥感影像图Fig.1 Remote sensing image of study area
杭州市(118°21′—120°30′E,29°11′—30°33′N)地处浙江省北部,是浙江省的省会城市,也是浙江省的政治、经济和文化中心.杭州市属于典型的亚热带季风气候,雨季雨量充足,又因为地势低平、河湖众多[8],在自然和人文因素的双重作用下,汛期时极易发生城市内涝灾害.近年来随着杭州市城市发展速度的加快,城市建成区不断扩大,不透水面在整个城市中所占的比例也显著增加,且夏季易受暴雨影响,因此对杭州市进行城市不透水面的提取分析意义重大.本研究选取杭州市绕城高速所环绕的城市核心区为研究区域,其遥感影像如图1所示.
本研究所使用的数据主要包括:1)Landsat 8遥感影像数据,成像时间为2015年10月13日,用于后续的不透水面提取工作;2)杭州市中心城区的矢量数据,用于提取研究区的范围;3)SPOT 6遥感影像数据,因其具有较高的分辨率,可用于不透水面提取效果的评价即精度验证.
因研究所使用的遥感影像是Landsat 8 OLI/TIRS数据的L1T级产品,故需要进行影像预处理工作,主要包括辐射定标、大气校正、影像裁剪.辐射定标是为了将记录的原始DN值转换为表观反射率,将图像的亮度灰度值转换为绝对辐射亮度;大气校正是借助ENVI软件中的FLAASH模块完成的[9],其目的是消除大气和光照等因素对地物反射的影响;图像裁剪主要借助杭州市中心城区的矢量数据来掩膜裁剪出遥感影像中的对应范围并以此作为本次研究的影像区域.
2.1.1 归一化差值不透水面指数(normalized difference impervious surface index, NDISI)
NDISI[10]是基于不透水面在热红外波段辐射率高、在近红外波段反射率低的特征提出的,操作简单方便,能够让不透水面信息与砂土和水体区别开来,其公式如下:
式中:ρT、ρNIR和ρSIR1分别是热红外波段、近红外波段和中红外1波段的反射率,各自对应Landsat 8的第10、第5和第6波段;IM为改进的归一化差异水体指数(modified normalized difference water index, MNDWI)[11],其计算公式为
式中,ρG是绿波段的反射率,对应Landsat 8的第3波段.
2.1.2 增强型不透水面指数(enhanced normalized difference impervious surface index, ENDISI)
ENDISI指数是穆亚超等基于Landsat 8 OLI影像提出的一种新的增强型不透水面指数[12].但由于该指数对蓝光波段的值进行了扩大,使具有低反射率的水体通过差值运算也得到了一定程度的增强,从而对不透水面信息提取造成干扰.因此,本文在计算之前运用上文提及的MNDWI指数先去除影像中的水体部分.ENDISI指数的计算公式如下:
其中,ρB、ρR、ρNIR、ρSIR1和ρSIR2分别对应Landsat 8第2、4、5、6和7波段的反射率.
2.1.3 城市建成区指数(build up area index, BUAI)
BUAI指数[13]由归一化建筑指数(normalized difference build-up index, NDBI)和归一化植被指数(normalized difference vegetation index, NDVI)构建而成,其计算公式为B=NB-NV.由于NDBI与NDVI的值均在[-1,1],所以BUAI的取值介于[-2,2].
2.1.4 生物物理成分指数(biophysical component index, BCI)
Deng等提出了BCI指数用于提取不透水面信息[14],其指数由缨帽变换的3个分量构成,计算公式为
其中,T1、T2、T3分别代表缨帽变换的亮度、绿度和湿度分量.该指数是根据亮的不透水面具有高的T1值,暗的不透水面具有高的T3值,而植被具有高T2值的原理构建的.由于暗色不透水面易与水体混淆,因此在计算前也需要剔除影像中的水体部分.
2.2.1 支持向量机(support vector machines, SVM)
SVM是一种建立在统计学习理论基础上的机器学习方法[9],可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率.SVM分类方法的一个突出优点在于尽管只需要较少的训练样本,但其分类结果的精度能保持在较高的水平[15].
2.2.2 神经网络
神经网络指用计算机模拟人脑的结构,用许多小的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程,然后应用于图像分类[9].其特点是容错能力较强,精度高于最大似然法等基于统计的分类方法[16].
分别采用上述的6种方法提取杭州市中心城区2015年的不透水面信息.其中4种指数方法在进行波段运算后的取值范围各不相同,需要设置合理阈值来进行图像分割,将各指数法计算得到的灰度图转化为不透水面与非不透水面的二值图.阈值的设定直接影响到各指数法的提取精度,因此借助SPOT 6高分辨率遥感影像,通过人机交互不断尝试最终确定每种指数法的分割阈值[17].监督分类的2种方法则在选取训练样本执行监督分类后得到分类图像,重点关注类别为不透水面.其后先随机生成一定数量的验证点,再借助高分辨率影像通过目视解译来判断各点是否为不透水面,建立混淆矩阵并计算总体分类精度和Kappa系数,由此来比较各个方法对不透水面的提取精度.
对于各指数法而言,除NDISI指数法外,另外3种均需要事先剔除水体.如图2所示,各方法能够对影像中的不透水面产生增强的效果.
本研究对各指数运算后的结果分别设定合理阈值进行图像分割,将计算得到的灰度图转化为只有不透水面与非不透水面的二值图[18],如图3所示.
对于监督分类方法来说,在完成感兴趣区的选取(训练样本的定义)之后再选择合适的分类器即可完成不透水面信息提取.本研究主要基于3类地物——不透水面、植被、水体来选取感兴趣区,最终得到的分类结果中也只包含此3种地物类型(图4).结果发现:在研究区域的西南部山区部分,2种监督分类方法的提取效果目视好于NDISI和ENDISI指数法,可能是因为在抑制植被信息和山体阴影的效果上具有一定优势.
(a)为对应的局部Landsat 8影像假彩色合成图; (b)、 (c)、 (d)、(e)分别为NDISI、ENDISI、BCI和BUAI指数法提取结果.
(a)为对应的局部Landsat 8影像假彩色合成图; (b)为神经网络分类法提取结果; (c)为支持向量机分类法提取结果.
随后,基于研究区域内随机生成的200个验证点,定量验证各方法对不透水面信息的提取精度[12].对照2015年的SPOT 6高分辨率卫星遥感影像数据,把具有高分辨率的遥感影像数据当作真实情况,通过目视解译人工判别各随机验证点所处位置是否为不透水面,同时对照所提取出的不透水面信息,建立混淆矩阵,分别计算上述6种方法对应的提取不透水面的总体精度和Kappa系数.由表1可见,各方法的提取精度有所差异,其中,BCI指数法的提取精度最高(Kappa系数为0.70),其次为BUAI指数法(Kappa系数为0.69),支持向量机、神经网络和ENDISI的Kappa系数分别为0.66、0.63和0.63,而NDISI的提取精度最低(Kappa系数为0.51).
表1 各方法提取精度评价结果Tab.1 Evaluation results of extraction accuracy
NDISI指数法提取不透水面的精度相较其他方法偏低,可能是因为本研究中所使用遥感影像数据的热红外波段分辨率较低[5].ENDISI指数法提取不透水面的精度高于NDISI指数法,但实际上它是针对西北干旱地区提取不透水面存在的局限性而提出的[11],因此虽然提取精度高于NDISI指数法,但在本研究区域相比其他方法,其精度表现较低.此外,BCI和BUAI指数法提取不透水面的精度较高,且这2种方法都对植被信息和山体阴影有很好的抑制效果,在本研究区域的西南部山区范围内,可以有效区分不透水面与植被、不透水面与山体阴影,而另几种指数法都有很大程度的混淆情况.
对于支持向量机和神经网络这2种监督分类方法,在选取了相同数量的不透水面训练样本后,两者提取不透水面的效果都不错,其中支持向量机分类法的提取精度要优于神经网络分类法,这也已被其他学者的研究[5,9]所证实.但这2种监督分类方法的最终提取精度低于BCI和BUAI指数法,可能是因为选择训练区时仅分了3类,并未做到很精细.
总体来看,除NDISI指数法的Kappa系数小于0.6(表现为中等的一致性)外,其余几种方法的Kappa系数都大于0.6,基本可以提取出本研究区域内的不透水面.虽然指数法提取城市不透水面信息的操作快速便捷,但是由于指数法提取不透水面的思想是基于不同地物不同的光谱特征来构造的[18],所以“同物异谱”和“异物同谱”现象的存在会对不透水面的提取精度造成影响,例如不透水面与砂石裸地的光谱特征相似,因而在提取结果中极容易导致混淆[5].
本文以杭州市中心城区为研究区域,分别采用NDISI、ENDISI、BCI和BUAI指数法及支持向量机和神经网络分类法提取杭州市中心城区的不透水面信息.结果表明,6种方法均可以提取出研究区域内的不透水面信息,但提取的效果各有差异.除NDISI指数法外,其余几种方法计算得到的Kappa系数均表现为高度的一致性(0.6~0.8),尤以BCI和BUAI指数法的提取效果最好,Kappa系数分别为0.70和0.69,可为有关部门快速、高效、大范围地提取不透水面提供一定的参考.
本研究所涉及的几种不透水面的提取方法仍存在提取的不透水面信息与阴影信息、裸地信息混淆的问题.未来可借助高光谱分辨率数据、有效的几何纹理信息、适宜季节的影像数据、LiDAR数据等方法来改善遥感提取不透水面的精度.此外,本研究只涉及到光谱指数法与监督分类方法,且仅在杭州市中心城区进行了相关的实验.在后续的研究中,可尝试综合使用多种方法如光谱混合分析法、决策树模型和回归模型等,且在更多的区域进行推广实验以期得到较为系统的结论.