灰度共生矩阵和模糊分类的高分辨率光学影像欠发达村落提取

2015-12-11 05:58梁晓莉李利伟高连如
测绘通报 2015年8期
关键词:欠发达纹理类别

梁晓莉,李利伟,程 钢,高连如

(1.河南理工大学矿山空间信息技术国家测绘地理信息局重点实验室,河南焦作454000;2.中国科学院遥感与数字地球研究所数字地球科学重点实验室,北京100094)

一、引 言

城市化进程中欠发达村落变化最为剧烈,给城市管理带来了不便,因此,及时准确地掌握这些地区的信息,有助于城市化的推进和政府部门的管理决策。高分辨率遥感影像能够提供大量丰富的地面信息,能够更加详细地表现城市地物复杂多样的形态和纹理结构。目前,利用高分辨率影像进行城市地物信息的自动提取已经取得了一定的进展。Hofmann利用面向对象的分类方法,充分考虑影像对象的光谱、纹理、形状等信息,实现了IKONOS影像中居民地的分类[1]。Mayunga等利用蛇算法和径向投射方法,提出一种半自动建筑物提取方法[2]。郭舟等提出一种面向对象结合两种分辨率的城市建设区提取方法,在低分辨率影像上粗提取,在高分辨率影像上精提取,实现了QuickBird影像上建设区的自动识别和提取[3]。近些年利用形态学特征和分类器结合进行高分辨率影像分类的研究也取得了一定的进展。Benediktsson等利用形态学结合神经网络分类方法对IKONOS城市影像进行分类,通过DAFE和DBFE算法实现特征提取和选择,最终得到较好的分类结果[4]。Chanussot将提取的DMP特征放入模糊模型中进行分类,得到比利用神经网络分类更好的结果[5]。欠发达村落在高分辨率遥感影像中呈现出复杂多样的形态结构,并且易与其他类型的居民地混淆。目前,关于这种敏感地物信息提取的研究很少。

纹理特征是一种不依赖于颜色或亮度而反映图像中同质现象的视觉特征[6],它是物体表面共有的内在特性,包含了物体表面结构组织排列的重要信息及它们与周围环境的联系[7]。因此,纹理特征广泛应用于遥感影像分类。高分辨率遥感影像中常会出现混合像元和不同地物光谱相似的情况,传统的分类方法只考虑光谱信息,会出现错分、漏分等问题,导致分类精度不高[8]。Zadeh提出模糊集理论,为地物类别的软划分提供了强有力的分析工具[9]。模糊分类技术允许像元在每个类别中存在一个隶属度,从而能够更好地表示真实数据的不确定性。

本文提出一种将灰度共生矩阵(GLCM)和模糊分类原理相结合进行欠发达村落信息提取的方法,并利用京津地区样本和图像进行试验验证,结果表明,该方法能有效区分欠发达村落和其他地物。

二、技术路线

本研究主要利用GLCM和模糊分类原理进行欠发达村落信息提取,主要技术包括3部分:类别体系构建与样本采集、纹理特征提取及模糊分类。具体流程如图1所示。

1.类别体系构建与样本采集

本文依据国家土地利用现状分类标准(GB/T 21010—2007)[10]并结合研究区域地物特点进行类别体系构建。为强调欠发达村落信息及光学影像中土地利用与覆盖的内部纹理差异,将研究区地物分为14类,包括林地、草地、交通运输用地、水体、耕地、欠发达村落、裸地、工矿厂房用地、公共管理与公共服务用地、商服用地、混合用地、农用设施用地、高密度低层小区和低密度低层小区。本研究旨在提取欠发达村落信息,即类别体系中的第6类。构建详细的类别体系有助于识别易与第6类混淆的类别,构建的类别体系见表1。

表1 类别体系

图1 技术流程

根据实地调查和专家知识,在构建的类别体系下选取300 m×300 m大小的样本,并将样本分为训练样本和验证样本两类。

2.GLCM纹理特征提取

特征提取是基于GLCM选取的纹理特征和训练样本实现的。特征提取前需要对样本进行预处理,这里选取G波段将RGB图像变为灰度图像。为了减少计算量,将灰度值的范围线性压缩为64(N=26)级。特征提取时,选取对比度、熵、同质性和能量 4 种常用纹理特征,采用 0°、45°、90°、135°这 4 个方向的均值作为最终特征值,并通过步长1、2、3获得多尺度纹理特征。利用上述参数计算训练样本在每种纹理下的特征值,并绘制在箱线图中。据此得到每种纹理特征区分第6类与其他类别的能力,从中选出区分性能好的纹理特征参与分类。4种常用纹理特征的统计测度与统计特性参考黄昕关于高分辨率影像的纹理特征提取的相关内容[11]。

3.模糊分类

模糊分类是接近于神经网络和概率方法的一种非常强大的软分类器,是典型的专家分类系统[12]。模糊分类系统主要由3个步骤构成,即模糊化、模糊推理和去模糊化。

模糊化是指将布尔系统转化到模糊系统,为每个特征值分配一个[0,1]之间的隶属度,而隶属度值由隶属度函数来定义[13]。本文通过计算训练样本在选择特征下的直方图分布来实现模糊化。对于复杂的多类识别问题,不同特征的量纲往往不同,一般先对特征进行归一化处理,以解决量纲不同的问题[14]。在每个特征下检索所有类别的训练样本,计算出样本的特征值直方图,并归一化到[0,1]范围内。为保证离散分布的特征值落在隶属度函数范围内,采用一个预定义的一维核函数对归一化后的直方图进行卷积,以泛化特征空间提高算法精度。模糊推理时,计算每个输入对象在各个类别中的模糊隶属度,这是通过计算选择的所有特征值在各类别中的最大隶属度来确定的。去模糊化时,首先比较输入对象在所有类中的隶属度,然后将具有最大隶属度的类别赋给该对象。若得到的隶属度过低则输入对象的类别难以确定,另外,训练样本的局限性也会影响算法的推广。

三、数据与试验

1.数据和试验设置

本文选取北京和天津作为研究区,京津地区位于我国华北地区,地物类型丰富多样,在偏远农村、郊区及城市中都散落分布着一定数量的欠发达村落。试验使用的数据是借助Google Earth在京津地区1 m分辨率下获得的,包括126个300像素×300像素大小的样本和两幅900像素×2100像素大小的影像,其中,样本又包括45个训练样本和81个验证样本。

试验中所用的纹理特征是通过计算45个训练样本的特征值并绘制在箱线图中提取出来的。试验选用第6类的特征描述进行分类,在模糊化时也只对第6类的训练样本进行训练。在所有试验的直方图计算中,区间数设为32,卷积运算的核函数设为[0.05,0.1,0.2,0.3,1,0.3,0.2,0.1,0.05]。为验证算法的有效性和普适性,分别利用81个验证样本和截取的两幅高空间分辨率影像进行试验验证。从每个类别中选取的典型样本如图2所示。

图2 14类典型样本图

2.特征提取

试验选取4种常用的纹理特征,并分别计算每种特征在步长1、2、3下的特征值,共设计12组试验进行特征提取。将计算出的特征值放入箱线图中,在箱线图中对比不同步长、纹理的特征值分布。通过特征值对比发现,第6类易于与第1、11、12、14类混淆,其中能最佳区分第1类和第6类的特征是步长为2和3时的同质性特征,即Hom2和Hom3特征。45个训练样本在Hom2和Hom3下的特征值分布如图3所示。

图3中步长为2和3时同质性特征箱线图中矩形盒两端边的位置分别对应数据的上下四分位数(Q1和Q3),矩形盒内的线段称为中位线,在Q3+1.5IQR(四分位数距)和 Q1-1.5IQR 处的两条线段为异常值截断点,称为内限。位于内限范围外的点称为异常值,下限用“Δ”标记,上限用“*”标记。

3.试验结果与分析

(1)试验一

利用81个验证样本,以及上述选择的特征和参数对算法的有效性进行验证。试验利用 Hom2、Hom3、Hom2+Hom3 3组特征进行验证,根据得到的验证样本的混淆矩阵计算出生产者精度和用户精度,据此对分类结果进行评价。3组特征的精度分析见表2—表4。

图3

表2 Hom2分类结果

表3 Hom3分类结果

表4 Hom2+Hom3分类结果

通过对比可知,Hom2得到的精度最高,生产者精度为93.3%,用户精度为63.6%,第6类中有14个样本正确分类,其他类样本中错分为第6类的仅有8个。Hom3精度比 Hom2低些,生产者精度为86.7%,用户精度为 56.5%;Hom2+Hom3 得到与Hom2近似的精度。3组试验中错分类别均为第11、12、14类,这与特征提取时箱线图中结果相符。

(2)试验二

为进一步验证算法对大幅图像的适用性,分别截取两幅京津地区900像素×2100像素大小的影像进行试验验证。逐块读取300像素×300像素大小的影像,然后利用上述算法对读取的影像块进行处理,从中提取出欠发达村落。对隶属度设定适当的阈值,然后输出分类结果图和隶属度图,并对分类结果进行分析。

图4为两幅影像的分类结果,分类结果图中,白色块为识别出的欠发达村落,黑色为其他地物类型,对应的隶属度图中影像块越亮隶属度越高。通过对上述两幅影像的分类结果和隶属度分析可知,Img1中除了第2块(虚线方框中)错分为第6类外,其他欠发达村落块均能正确识别出来,且错分的第2块隶属度不高。Img2中欠发达村落均能区分出来,第5块(白色方框中)因包含了部分道路信息隶属度不高。另外,在欠发达村落与其他地物混淆的边缘部位区分性不太好,这与算法中欠发达村落(第6类)易与混合地物(第11类)错分的情况一致。

从分类结果可知,Img1中共有5块欠发达村落,其中有4块能正确分类;Img2中共5块欠发达村落,且所有块均能正确识别出来,两幅影像的精度分析见表5。

图4 高分辨率影像分类结果图

表5 影像分类精度

四、结束语

本文提出一种将GLCM纹理特征和模糊分类原理相结合提取高分辨率光学影像中欠发达村落信息的方法,并借助IDL语言编码实现。试验选取京津地区1 m分辨率下126个300像素×300像素大小的影像,并设计试验验证了方法的可行性和有效性。试验表明,该算法在同质性特征下最高精度可达93.3%,且对于大范围影像也具有较好的适用性。算法的主要困难在于欠发达村落与其他类型居民住宅的区分及混合边界地区的信息提取。该算法比较灵活,利用特征描述就可以达到较好的分类结果,并且仅对欠发达村落样本进行训练,避免了其他地物的干扰。算法涉及的技术流程和试验设计能够为相关领域研究提供参考依据。

下一步将会利用更大范围影像对算法进行测试,并考虑不同成像条件对算法的影响。为有效实现所有类别信息的自动提取,算法将进一步建立所有地物类型的样本库,并为每种地物选择最佳的尺度和特征组合进行分层分析,从而提高算法的精度和普适性。

[1]HOFMANN P.Detecting Informal Settlements from IKONOS Image Data Using Methods of Object Oriented Image Analysis—An Example from Cape Town(South Africa)[C]∥Remote Sensing of Urban Areas/Fernerkundung in Urbanen Räuman.Regensburg:Geographische Schriften,2001:107-118.

[2]MAYUNGA S D,COLEMAN D J,ZHANG Y.A Semiautomated Approach for Extracting Buildings from Quick Bird Imagery Applied to Informal Settlement Mapping[J].International Journal of Remote Sensing,2007,28(10):2343-2357.

[3]郭舟,杜世宏,张方利.基于高分辨率遥感影像的城市建设区提取[J].北京大学学报:自然科学版,2013(4):1-8.

[4]BENEDIKTSSON J A,PESARESI M,ARNASON K.Classification and Feature Extraction for Remote Sensing Images from Urban Areas Based on Morphological Transformations[J].IEEE Transaction on Geoscience and Remote Sensing,2003,41(9):1940-1949.

[5]CHANUSSOT J,BENEDIKTSSON J A,FAUVEL M.Classification of Remote Sensing Images from Urban Areas U-sing a Fuzzy Possibilistic Model[J].IEEE Geoscience and Remote Sensing Lettes,2006,3(l):40-44.

[6]SMITH J R,CHANG S F.Automated Binary Texture Feature Sets for Image Retrieval[C]∥IEEE International Conference on Acoustics Speech and Signal Processing.Atlanta:[s.n.],1996.

[7]HARALICK R M,SHANMUGAM K,DINSTEIN I.Textural Features for Image Classification[J].IEEE Trans on Systems,Man and Cybernetics,1973,3(6):610-621.

[8]SHACKELFORD A K,DAVIS C H.A Hierarchical Fuzzy Classification Approach for High-Resolution Multispectral Data Over Urban Areas [J].IEEE Transaction on Geoscience and Remote Sensing,2003,41(9):1920-1932.

[9]ZADEH L A .Fuzzy Sets[J].Information and Control,1965,8(l):338-353.

[10]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 21010—2007土地利用现状分类[S].北京:国土资源部,2007.

[11]黄昕.高分辨率遥感影像多尺度纹理、形状特征提取与面向对象分类研究[D].武汉:武汉大学,2009.

[12]颜宏娟.面向对象的遥感影像模糊分类方法研究[D].西安:西安科技大学,2008.

[13]BENZ U C,HOFMANN P,WILLHAUCK G,et al.Multiresolution,Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information [J].ISPRS Journal of Photogrammetry& Remote Sensing,2004(58):239-258.

[14]李炜,黄心汉,陈曦.一种基于模式类特征空间统计分布的离散模糊隶属度函数模型[J].信号处理,2004,20(2):170-173.

猜你喜欢
欠发达纹理类别
关于欠发达地区医疗废物规范化管理的思考
一起去图书馆吧
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
欠发达地区如何推进公立医院改革
西夏刻本中小装饰的类别及流变
消除凹凸纹理有妙招!
别让欠发达地区的新能源项目成摆设
多类别复合资源的空间匹配