刘 润,张绍良,贾 蓉
(1. 中国矿业大学环境与测绘学院,江苏 徐州 221116; 2. 江南大学,江苏 无锡 214122)
城市建筑物是城市最基本的元素,利用遥感技术快速、高精度提取城市建筑物信息是城市动态监测、数字城市和智慧城市建设的关键技术。
随着高空间分辨率遥感技术的发展,传统的基于像元的分类方法已经无法满足高精度建筑物提取的要求。但是,高分辨率遥感影像建筑物信息的高精度提取的计算和分析过程必须依赖更多的综合地物的结构、大小、形状、分布等空间特征信息和语义信息[1-4]。国内外很多学者都曾基于建筑物明显的几何结构特征尝试对建筑物信息进行提取,如利用直线和角点特征[5-7],线段的空间关系特征[6]等。但该类方法多使用影像底层特征信息,严重依赖单一或少量特征,且算法复杂。为了更好地实现光谱信息、纹理信息等更多特征信息的综合应用,学者又尝试了新的识别方法,如Baatz和Schape等利用多尺度区域分割结合决策树分类的方法,通过综合地物的光谱信息,纹理信息和上下文信息来检测建筑物,实现了建筑物屋顶的提取[8];吕凤华等提出了一种基于多层次特征的航空影像规则建筑物提取方法,即先利用大尺度特征,如方向梯度直方图对建筑物进行粗识别,然后利用小尺度特征如光谱和纹理的特点对粗提取结果进行筛选,最后通过试验提取表明该方法对规则建筑物的提取效果较好,一些复杂建筑物的提取也很理想[9];周绍光等利用角度纹理特征和光谱特征构造特征矢量,利用图割法获取建筑物候选点,经数学形态学处理得到建筑物斑块,最后通过试验证明了该方法的可行性[10]。综合使用建筑物光谱、形状及纹理等特征可以提高建筑物提取精度,但过多的特征信息往往也会造成特征冗余,且大量信息的计算分析往往也比较耗时且对计算机硬件要求较高。
鉴于此,本文以Pleiades卫星影像建筑物信息提取为例,研究利用改进型Relief F算法进行特征筛选来减少冗余特征,实现最优特征组合构建,从而提高建筑物信息提取效率和提取精度。
Kira和Rendell于1992年提出Relief算法,它是一种多参量过滤式特征筛选方法,通过统计样本之间的距离来选取参与权重计算的邻近样本[11]。其在计算距离过程中,相关特征会影响样本的相对距离进而影响邻近样本选择,从而为特征权重计算提供理论依据[12]。特征降维通过对样本进行迭代计算,筛选出权重最大的特征组成特征集合而实现。特征权重更新方法如下
wi=wi-xi-Mi(x) +xi-Hi(x)
(1)
H(x)和M(x)分别是与x的同类和非同类的最近邻点。根据Relief算法将样本特征按照分类能力大小进行排序,然后通过设置阈值筛选出最优特征。然而Relief有其固有的弱项,由于高分遥感影像中存在干扰噪声,单一选取最近最远样本计算特征权重不能保证精度,又由于样本大小,计算难度限制了全样本计算,因此选取合适的简化算法来优化Relief算法成为保持其稳健性的最佳选择。Relief F方法是一种较为常见的改进方法,相较于Relief算法,取值选择为K个样本,数目为较少的一类样本数目的一半[13]。
Relief F作为一种具有较强区分度的方法,其由于缺失冗余处理过程,特征间具有高度相关性。故对原算法进行改进,增加冗余处理决策修改为Relief FT(relief fund threshold)。通过特征权重至限制特性之间的相关性处理,对特征进行进一步筛选,若经过阈值筛选后仍有多个特征存在,则保留特征权重值最大的特征。Relief FT的数学表达为
(2)
(3)
Relief FT算法的实现步骤为:
输入:训练样本集合D,迭代次数r,最近邻样本个数d,阈值为m,特征选择集合A。
输出:预测的特征权值向量w0,初始化特征权值向量w0。
Fori=1 tor;
(1) 从D中随机选择实例Si。
(2) 计算d个同类最近邻实例xj(j=1,2,…,k)。
(3) 从与Si不同类的实例中选出d个最近邻实例Mj(C)(C≠class(Si))。
(4) fori=1 to all attributes(对每个特征,用式(2)更新权值,式中,c为类别;P(c)为c类目标样本占样本总数的比例)。
(5)wi (6) 运算结束。 样本间距离difft,si,x计算采用马氏距离法,分别从类间和类内考察特征区分样本的能力。由上式可知,样本特征是否有利于分类,可以通过比较样本之间的距离diff来判断,具体原则为:同类样本距离越小,不同类样本距离越大,则特征为最优特征,即有利于分类。 本研究选用的数据为法国Astrium公司Pleiades卫星所获取的高分辨率遥感影像,Pleiades卫星是SPOT星族的后续卫星。由Pleiades-1和Pleiades-2两颗卫星组成[14]。本文实验数据获取时间为2012年10月5日,研究区位于某中学,如图1所示。其中包含一个0.5 m分辨率的全色波段(图1(a))和一个2 m分辨率的4波段的多光谱(图1(b))。 在进行建筑物提取之前需要对原始影像进行预处理。旨在减少影像几何畸变,辐射误差,如几何校正、辐射校正。为了提高多光谱影像空间分辨率和地物细节特征,进行了图像融合和增强处理。在ENVI 4.8软件的支持下,遥感影像预处理流程如图2 所示。其中图像融合方法采取主成分分析融合法,对比度增强采用分段线性变换。 图1 原始遥感影像 特征空间构建首先需要对图像进行分割,本文试验对影像由下而上进行分割,为保证地物边界异质性,在底层影像分割时采取小尺度分割方法。综合已有研究成果[15-16],根据建筑物在影像上的表征特点,构建基础特征空间。特征主要分为三大类:光谱特征、形状特征和纹理特征。其中光谱特征包含亮度、最大均值差、方差等;形状特征包含面积、周长、形状复杂度等;纹理特征主要有标准差、熵等。建筑物基础特征汇总见表1。 图2 预处理流程 光谱特征形状特征纹理特征波段(R/G/B/N)亮度、最大均值差、方差、比率、灰度最大值、灰度最小值面积、周长、宽度、长宽比、紧密度、对称性、边界平滑度、形状复杂度对比度、同质性、差异性、标准差、能量、熵 将选择出来的特征以图像为基础数据,以Relief FT算法为依据,在图像分割的基础上,随机选取建筑物和非建筑物各10个样本,在Matlab环境下进行操作。得到每个特征对应权重及各特征权重分布情况,如图3和表2所示。 图3 各特征权重分布 权重0~100100~200200~300300~400>400分布/个1613441 根据图3和表2可知,特征权重介于0~600之间,其中最大权重值所对应的特征依次为相异性特征、面积特征和B波段亮度;权重最小值对应的特征依次为长宽比特征、G波段方差和宽度特征。根据权重最大筛选最优特征原则说明,相异性特征、面积特征和B波段亮度均值能够满足建筑物提取要求。对于特征权重较小的长宽比、G波段方差和宽度则不能很好地用于建筑物提取。在特征筛选结束后,将得到的有效特征代入样本中进行验证,这里以特征最大和最小权重为例,如图4所示。 其中,前10个样本选自建筑物,后10个样本选自非建筑物。通过分析图4(a)各样本相关系数后发现,建筑物10号样本相关系数大于0.7,其他均小于0.7,非建筑物15号样本相关系数小于0.8,其他均大于0.8。因此可将阈值区间设置为0.7—0.8。图4(b)中建筑物样本和非建筑物样本之间并无明显的分布规律,因此在这类特征中难以通过设置阈值达到提取建筑物的目的,并且无关特征参与计算在加大工作量的同时也会影响最终提取结果。综上所述,本文设置权重阈值为300,相关系数阈值为0.9作为筛选特征的条件,经过筛选,最终有5组特征满足要求,分别为相异性特征、面积特征和B波段的亮度均值、方差和信息熵。 针对研究区影像,分别使用传统基于像元的监督分类、无特征筛选的决策规则分类和基于改进型Relief F特征筛选的决策规则分类3种方法对研究区建筑物进行检测提取,其中监督分类的分类算法使用支持向量机SVM。在初提取的基础上,运用形态学算法对提取结果进行优化处理,最后得到三者提取结果如图5所示。 图4 最大、最小权重特征验证结果 图5 建筑物提取结果 通过比较3种分类方法结果图可以发现,相比其他两种分类方法,使用监督分类得到的结果中有大量地面不透水铺装,如建筑物前广场、篮球场等被错分成了建筑物屋顶,这主要是由于该类不透水铺装材质与建筑物屋顶材质相似,导致遥感影像上两类地物的光谱特征相似,因此难以将两种地物区分开来;无特征筛选分类结果较监督分类有所改善,但仍有不透水铺装被错分成建筑物屋顶;基于Relief F特征筛选的分类方法取得效果较好,大大减少了不透水铺装被错分成建筑物屋顶的数量。为进一步验证这3种方法提取精度,通过人机交互式解译方法选取32个建筑样本点,抽取建筑面积5860 m2作为精度验证参考数据。表3给出了最终精度验证结果。 从表3可以看出,监督分类方法精确度只有57.3%,其生产精度和用户精度也只有60.43%和61.34%,这说明传统基于像元的分类方法并不适合高分辨率影像建筑物提取;而另外两种基于特征的建筑物提取方法各项精度都能达到80%以上,明显优于监督分类,这是由于大量特征的应用可以模拟人工思维进行信息选择,因此可以提高分类精度。由于过多的特征也会导致误判,因此特征筛选可以使最终分类精度进一步得到提高。 表3 精度验证结果 本文以Pleiades高分辨率遥感影像为数据源构建建筑物特征空间,使用Relief F特征筛选法进行最优特征筛选,利用最优特征组合进行建筑物提取,并与监督分类法、无特征筛选建筑物提取法进行对比。 试验证明,基于特征的建筑物提取方法要优于监督分类。而利用特征筛选过后的最优特征组合进行建筑物提取为3种方法中最优,且提取精度能够满足相关研究需要。本研究使用Relief F特征筛选方法,并未与其他筛选方法作对比。若条件允许,也可进行特征筛选方法的对比研究。在数据源方面,也可借助其他辅助信息(如雷达数据)进一步提高建筑物提取精度。 [1] CHRISTODOULIDIS A,HURTUT T,TAHAR H B,et al.A Multi-scale Tensor Voting Approach for Small Retinal Vessel Segmentation in High Resolution Fundus Images[J].Computerized Medical Imaging and Graphics,2016,52(9):28-43. [2] 胡荣明,黄小兵,黄远程.增强形态学建筑物指数应用于高分辨率遥感影像中建筑物提取[J].测绘学报,2014,43(5):514-520. [3] 李朝奎,方文,董小姣.面向对象和规则的高分辨率影像分类研究[J].测绘通报,2015(9):9-13,35. [4] 张庆云,赵冬.高空间分辨率遥感影像建筑物提取方法综述[J].测绘与空间地理信息,2015(4):74-78. [5] NEVATIA R,LIN C,HUERTAS A.A System for Building Detection from Aerial Images[C]∥Proceeding of Automatic Extraction of Man-made Object from Aerial and Space image(Ⅱ).Basel:Brikhauser,1997:77-86. [6] HUERTAS A,NEVATIA R.Detecting Buildings in Aerial Images[J].Computer Vision,Graphics and Image Processing,1988,41(2):131-152. [7] 唐亮,谢维信,黄建军,等.直线Snakes及其在建筑物提取中的应用[J].西安电子科技大学学报,2005,32(1):60-65. [8] BAATZ M,SCHAPE A.Object-oriented and Multi-scale Image Analysis in Semantic Networks[C]∥Proceedings of the 2nd International Symposium on Operationalization of Remote Sensing.Enschede:ITC,1999. [9] 吕凤华,舒宁,龚颵,等.利用多特征进行航空影像建筑物提取[J].武汉大学学报(信息科学版),2017,42(5):656-660. [10] 周绍光,孙金彦,凡莉,等.高分辨率遥感影像的建筑物轮廓信息提取方法[J].国土资源遥感,2015,27(3):52-58. [11] KIRA K,RENDELL L.The Feature Selection Problem:Traditional Methods and a New Algorithm[C]∥Proceedings of the Ninth National Conference on Artificial Intelligence.New Orleans:AAAI Press,1992:129-134. [12] 李晓岚.基于Relief特征选择算法的研究与应用[D].大连:大连理工大学,2013. [13] KONONENKO I.Estimating Attributes:Analysis and Extension of Relief[J].Machine Learning,1994,784(4):171-182. [14] CHENG F,THIEL K H.Delimiting the Building Heights in a City from the Shadow in a Panchromatic SPOT-image—Part 1.Test of Forty-two Buildings[J].International Journal of Remote Sensing,1995,16(3):409-415. [15] 付卓.高分辨率遥感卫星影像中城市人工地物提取方法研究[D].北京:北京交通大学,2006. [16] 陶阳宇,梁林,徐迎庆,等.利用贝叶斯结构模型的复杂形状建筑物提取[J].计算机辅助设计与图形学学报,2010,22(4):647-653.2 结果与讨论
2.1 影像简介及预处理
2.2 初始化特征空间构建
2.3 特征筛选
2.4 建筑物信息提取
3 结 语