金叶蒙,虞思逸,周坚华
(1.华东师范大学 地理系,上海 200241;2.华东师范大学地理信息科学教育部重点实验室,上海 200241)
目前使用的遥感图像分析软件以及通用的图像处理软件,通常以多边形采样来获得训练或测试数据。当多边形轮廓复杂时,圈选工作量较大。为此一些通用图像处理软件(如Photoshop)和面向对象遥感信息提取软件(如eCognition)开发了“魔棒”或“一键式”采样工具。它可以根据用户指定的容差,实现一键式点选和快速采样。然而,目前的魔棒和一键式采样均基于单特征,即波谱特征进行提取。当目标物与背景的波谱特征相似时,使用这种方法会出现容差难以确定和采样区域过生长或欠生长的情况,使样本质量下降或无效。
事实上,在利用遥感图像多特征进行信息提取方面已经有许多成功的实例。多数研究涉及的多特征主要包括波谱、纹理、形状和空间位 置 等[3-5,9-10]。分类器包括决策树、支持向量机和一些自适应算法等[6,11-13]。参与分类实验的图像多为中等分辨率(如TM/ETM等)和高分辨率(如QuickBird等)的多光谱遥感图像[14-15];多数研究显示使用多特征分类比仅仅使用单特征分割能大幅提高分类精度[7,16-17],但在采样阶段就利用图像多特征的内容尚未检出。
作为一种尝试,本文提出了一键式多特征遥感图像采样器(Multiple Feature Point Sampler,MFPS),它不仅融合了一键式采样的思想,而且率先在图像采样阶段就采取遥感图像多特征分析,以尽可能全面和深度利用用户通过采样暗示的目标物与背景之间的全部特征差异,或者称为“用户判读知识”。以便在提高采样效率的同时,进一步提高样本对用户判读知识的代表性。实验结果表明,MFPS具有采样效率高、误判率低等优点。对于常规遥感图像分析具有普适性,尤其适合于图像特征复杂的地物类型采样。另外,MFPS还能用于对分类结果的人机交互后期整理等方面。
本文以上海市高分辨率天然彩色或彩红外遥感图像为实验图像。对于其他类型的图像,可能需要重新调整特征描述符。比如对于天然彩色图像,可以考虑以“绿度指数”[8]代替NDVI。为了适应图像分辨率的变化,可以使用可变的窗口尺寸d,d是图像尺寸和分辨率的函数。典型算法具有多特征和串行搜索两个主要特点。
“串行”包括空间域的串行搜索和特征的串行计算。
空间域的串行搜索与上述魔棒或一键式采样方法相比有了较大改进,主要表现在两个方面。(1)“容差”的确定方式不同。这里的容差指特征值域。传统点采样方法的容差通常由用户根据经验指定,并以人机交互方式传入系统。而MFPS方法通过对采样窗口值的统计获得容差。用户只需要事先定制特征空间,即指定特征维数和特征表达式和采样窗口尺寸d。(2)特征空间的丰度不同。传统点采样方法通常只使用波谱特征,比如由分色亮度R-GB构成的3D空间,或由H-S-V(色调-饱和度-明度)构成的3D空间。而MFPS采用用户自定义多特征空间,包括波谱、纹理和形状等特征,特征表达式(描述符)由用户设计。特征空间的维数任意,通常为s(s≥3)维空间。
MFPS方法以采样窗口像素作为种子,通过统计获得种子的图像特征值域,并按照该值域生长,直至形成采样区域(图斑)。
而特征的串行计算指多层面图像特征的递进计算。比如先计算采样窗口的波谱特征和纹理特征,通过分割形成图斑(波谱和纹理特征的均质区域)后,再计算图斑的形状特征值并做形状分割。
图1为MFPS的基本算法流程图,下文将介绍其基本思想和核心算法。
遥感图像种类和获取环境条件常常具有多变性,而使得不同时相、不同区域的图像呈现显著的波谱特征差异,如果直接以分色亮度做波谱分割,则分割阈值会随环境条件不同而变化。使用一些复合、归一化的波谱特征,如归一化植被指数NDVI[18]等,能够有效减少分割阈值的多变性。
描述符是图像特征表达式,体现判读人员对于具体识别任务中的具体现象的认知。可以使用一些普适性比较好的描述符,(比如本文使用的NDVI、NDSV、暗细节密度、形状系数等),也可以根据具体任务的要求补充新的描述符。描述符的设计原理超出了本文的讨论范畴,将另文详述。
本文采用NDVI以及归一化阴影指数NDSV[2]这两个最为常见的描述符作为本文算法的主要波谱特征描述符参见表1。表中,NIR和R分别为近红外和红波段的分色亮度;S和V分别为饱和度和明度。图2~图4比较了在常规波谱空间与描述符组合空间几种典型地物分离性的差别。
表1 波谱特征的数学描述符
图2 典型地物类在R-G-B空间的分离性
图3 典型地物类在H-S-V空间的分离性
由图2和图3可见,在R-G-B空间,屋顶与部分道路的分离性较差;而在H-S-V空间,两者的分离性进一步下降。实验表明,在常规波谱空间,某些类别的区分度较低。
图4 典型地物类在NDVI-NDSV空间的分离性
而当采用描述符组合空间时,可分性有所改善。由图4可见,在NDVI-NDSV空间,尽管特征空间降低了一维,4种类别的可分性仍然较好。它说明设计完善的描述符可以提高分类精度,并降低特征阈值的不确定性。因此本文以NDVI-NDSV作为默认波谱特征空间。由该空间值域确定的采样结果集BW1可以用式(1)表达。
其中,I是采样图像全集;minVI,maxVI分别为由采样窗口计算的NDVI最小和最大值;类似地minSV,maxSV分别为NDSV的最小和最大值。在后面的讨论中,也常常把[minVI,maxVI]和[minSV,maxSV]分别称为NDVI和NDSV的窗口容差或窗口值域。
在窗口尺寸合理的情况下,通常可以获得与采样点具有相似波谱特征的图斑(图5)。
图5 NDVI-NDSV空间一键采样实例
纹理是图像分析的主要特征之一。由于纹理特征几乎不受遥感图像的类型和获取环境条件变化的影响,使其重要性在许多方面胜过波谱特征[1]。此外,纹理特征不像形状特征那样要求前驱分割,可以直接由邻域/窗口像素的特征值计算得到。
纹理可以用图像灰度共生矩阵计算的统计量来表达,如二阶矩、均质度、对比度和熵等。也可以直接由一些简单统计特征来表达,如值域(最大最小值之差)、离差、均方差等。也有一些文献提出了一些新型的纹理描述符,如亮细节密度、暗细节密度等[2]。本文主要测试了暗细节密度Dd用于 MFPS的有效性(图6)。当仅用光谱特征分割时,树木和草坪无法区分,它们都归为植被类(图6(a));但加入Dd后二者的可分性改善,图6(b)和6(c)分别显示草坪和树木(乔、灌木)图斑。
另外,植被图斑的欠提取主要由由树冠表面阴影引起(图6(d))。可用数学形态学方法提取尺寸较小的凹陷,称为暗细节(图6(e))。根据植被图斑的暗细节密度(单位面积的暗细节数)不同,可以将植被图斑分割为草坪(图6(f))和树木(图6(g))。草坪和树木图斑二值图BW2和BW3可分别用式(2)和式(3)表达。
其中,Dd称为暗细节密度或相对暗细节,它根据式(4)计算;T为Dd的分割阀值,它是一个由高低两个限值组成的二元阵列,根据式(5)估算。
其中,Sd是区域暗细节数,A为区域面积。这里的“区域”可以是由波谱分析提取的样本图斑,也可以是样本窗口。使用前者时,具有“串行”分析特点,即先波谱分析后纹理分析,根据波谱分析的结果再行纹理分析。而后者具有“并行”分析特点,即将波谱和纹理特征合并构建特征空间,并在该空间里实现由样本点到图斑的生长。对后者需要注意的是,波谱特征值域计算和纹理特征计算所使用的窗口尺寸不同,通常波谱值域和纹理特征分别以d*d和nd*nd(n=2,3,4…)窗口计算。
暗细节提取可以使用形态学的“低帽变换”算法。它先用闭合操作消除比结构元素se尺寸小的暗细节,获得背景估计b;然后从b中减去原图像I,即能获得暗细节集da。即:da=b-I=I·se-I。其中运算符·表示图像“闭合”,即以se做先腐蚀后膨胀的操作。式(4)中的Sd为某区域da子集的像素数。
mean(·)表示求均值;P为2元权系数阵列,P(1)为T(1)的权,P(2)为T(2)的权,通常根据经验设定。
图6的实例表明暗细节密度对区分粗糙度不同的地物类有效。
形状是目标对象的重要属性,由于形状分析建立在对象的基础上,因此要先进行基于波谱特征和/或纹理特征的图像分割,以获得目标图像。一键采样后将提取波谱、纹理、形状特征相似的若干图斑,而非仅仅扩展出采样点所在的单个图斑。因此,加入形状特征的“采样”严格来说应当称为“对象提取”。
常用的形状特征包括椭圆长短轴之比r、椭圆主轴方向a、图斑长轴与图斑骨架长度之比e、圆形度m(P和A分别为图斑周长和面积)等。
对象提取步骤为:①获取对象/图斑。使用一键式点选,获取与采样点窗口值具有波谱和/或纹理特征相似性的所有图斑。②计算形状特征值。计算含样本图斑在内的所有图斑的长短轴之比r、主轴方向a、边界复杂度e、圆形度m等4个属性值。③将图斑分类。在r-a-e-m四维属性空间将所有图斑分为目标和背景两类。
图7是附加形状特征提取不同形状建筑的例子。它表明,引入形状特征有助于区分那些波谱和/或纹理特征相似、但形状差别较大的对象。
图7 附加形状特征提取目标的实例
下面将通过监督分类实验分析MFPS方法的样本质量以及简单讨论该算法的普适性。
一键式采样器试图在引入Photoshop中魔棒的便捷性的同时,又能达到遥感图像处理软件多边形采样的效果,甚至试图在多特征运用方面优于上述软件的采样功能。下面将通过MFPS与传统波谱特征点采样(如eCognition等软件)方法的比较,讨论MFPS的实际采样效率和样本用于监督分类的精度。
分类精度检验的过程为:①确定图像I的类别数cs;②分别以MFPS和点采样方法对I采样,各类别的采样点数规定为MFPS不少于6个(MFPS获得的是样本图斑,在构建训练集和测试集时,图斑中的每个像素作为一个样本。),点采样不少于30个;③将两种方法获得的样本集随机分为训练集和测试集,并要求各占50%的样本;④以决策树(DT)作为学习机模型,以两种方法获得的训练集分别训练学习机,获得各自的分类决策树t1和t2;⑤以t1和t2对I分类;⑥以两组分类结果与各自的测试集对照,统计用户精度和全局精度。
表1和表2分别为以MFPS和点采样采样时,监督分类结果的混淆矩阵。混淆矩阵的行名表示正确类名,而列名表示实际分类。表中数值表示测试用样本数。比如表2中第一行第二列的值62表示类别w有62个点被误分为v类。对角线上的数值表示正确分类的样本数。“列和”表示实际分给该列类别的样本总数,它与对角线数值的差为各类别的误分样本数;用户精度(UA)为对角线数值与列和之比。
由表1和表2可见,以MFPS采样做监督分类时,各类别的用户精度均好于传统点采样。由图8和图9的两个分类实例可见,以MFPS采样的分类全局精度(GA)比传统点采样采样分别高出4.19%和8.49%。另外,由表5可见,MFPS与传统点采样方法的采样点数之比为19.55,即MFPS方法采样的工作量不到传统点采样方法的五分之一,但实际获得的样本数却是传统点采样方法的33.51倍。
图9 MFPS适用性检验补充实例(图例参见图8)
表2 以MFPS采样分类结果的混淆矩阵
表3 以传统点采样采样分类结果的混淆矩阵
表4 图9实例的分类精度
表5 MFPS与传统点采样工作量比较
MFPS是一种新型采样方式的概念框架,本文只以有限实例测试了它的关键技术和算法的可行性。在本文提供的实例中,以NDVI-NDSV-Dd作为默认的波谱-纹理特征空间,以r-a-e-m 作为默认的附加形状特征空间。
事实上用户可以根据具体任务设计波谱、纹理和形状特征描述符,并将它们组合为特征空间;而不必拘泥于本文介绍的少量描述符。在构建了特征空间后,还需要提供采样窗口尺寸d、纹理分割权系数阵列P、纹理特征窗口扩展倍数n等少量参数,该过程称为定制采样器。
理论上MFPS具有较好的普适性,它对于具体任务的适应程度通常只受限于特征空间维数、特征描述符表达式、采样窗口尺寸等参数设计的合理性。设计原则包括:使描述符对于目标和背景具有明确的分割阀值、在多描述符构成的特征空间里能有效分离目标和背景、采样窗口尺寸与最小目标尺寸匹配等等。
决策树是一种直观的、易于理解和实现的分类模式。与其他分类器不同,决策树能处理不同尺度不同类型的数据,且不受数据统计分布特征的影响。与神经网络相比,决策树运算开销较小[19]。由于MFPS采样得到的是样本图斑,图斑中的每个像素都作为样本参与训练,因此样本数通常很大。采用决策树可以减少训练分类器的运算开销;同时可以免除输入矢量各分量归一化的工作,以及便于查看和分析分类规则等。
本文提出了一种基于多特征信息的一键式遥感图像采样方法MFPS,其主要目标是减少传统人工采样的工作量。MFPS组合使用光谱特征、纹理特征和形状特征,通过响应用户的一键式点选、在以采样点为中心的窗口内计算特征阈值、并生长出与点选位置具有多特征相似性的采样区域/图斑。
为了证明在采样特征空间采用描述符的必要性,在传统分色亮度空间与描述符组合空间比较了几种典型地物类的可分性,并证明采用描述符组合通常可以降低特征空间维数和提高地物类之间的可分性。
为了检验MFPS获得样本的质量,进行了MFPS与传统波谱特征点采样图像采样、训练学习机和监督分类的MATLAB仿真实验。实验结果表明,MFPS方法能够比较充分地利用用户提供的目标物和背景之间的多特征差异,因而改善了样本对用户判读知识的代表性。与传统点采样相比,以MFPS采样做监督分类的全局精度平均提高了6.34%。另外,MFPS具有依据采样点自动生长出采样图斑的功能,因而具有较高的工作效率。在本文提供的实例中,MFPS方法采样的工作量不到传统点采样方法的五分之一,但实际获得的样本数却是传统点采样方法的33.51倍。
理论上MFPS具有较好的普适性,它对具体任务的适应程度通常只受限于特征空间和采样窗口尺寸等少量参数的合理性。在这个框架下,用户可以通过自行设计特征空间和修改某些参数,来改善对具体任务的适应性。
[1]周坚华.遥感图像分析与空间数据挖掘[M].上海科技教育出版社,2010:140-158.
[2]周坚华,周一凡,穆望舒.城镇绿地树种识别的数学描述符[J].遥感学报,2011,15(3):524-538.
[3]潘琛,林怡,陈映鹰.基于多特征的遥感影像决策树分类[J].光电子·激光,2010,21(5):731-736.
[4]刘峰,龚健雅.一种基于多特征的高光谱遥感图像分类方法[J].地理与地理信息科学,2009,25(3):19-22.
[5]孙显,王宏琦,张道兵,等.基于多特征融合的城市遥感图像自动解译方法[J].光子学报,2010,39(1):179-181.
[6]周夷,景奉广.多分类器组合的遥感图像分类的方法[J].城市勘测,2008(2):56-59.
[7]刘仁钊,廖文峰.遥感图像分类应用研究综述[J].地理空间信息,2005,3(5):11-13.
[8]李登辉.绿度指数图像处理方法研究[J].遥感信息,2000(4):74-78.
[9]MALIK J,BELONGIE S,LEUNG T,et al.Contour and texture analysis for image segmentation [J].International Journal of Computer Vision,2001,43(1):7-27.
[10]MAHESWARY P,SRIVASTAVA N.Retrieval of remote sensing images using colour and texture attribute[J].International Journal of Computer Science and Information Security,2009,4(1&2).
[11]HAN Y,KIM H,CHOI J,et al.A shape-size index extraction for classification of high resolution multispectral satellite images[J].International Journal of Remote Sensing,2012,33(6):1682-1700.
[12]KUANG Y C,OOI M P L.Complex feature alternating decision tree[J].International Journal of Intelligent Systems Technologies and Applications,2010,9(3):335-353.
[13]BENHADDOUCHE D,BENYETTOU A.The Decision Tree and Support Vector Machine for the Data Mining[J].Journal of Applied Sciences,2010,10(13):1336-1340.
[14]MYINT S W,GOBER P,BRAZEL A,et al.Per-pixel vs.object-based classification of urban land cover extraction using high spatial resolution imagery[J].Remote Sensing of Environment,2011,115(5):1145-1161.
[16]PENG H,LONG F,DING C.Feature selection based on mutual information criteria of max-dependency,max-relevance,and min-redundancy[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2005,27(8):1226-1238.
[17]SCHIEWE J,TUFTE L,EHLERS M.Potential and problems of multi-scale segmentation methods in remote sensing[J].GeoBIT/GIS,2001,6(01):34-39.
[18]GAMON J A,FIELD C B,GOULDEN M L,et al.Relationships between NDVI,canopy structure,and photosynthesis in three Californian vegetation types[J].Ecological Applications,1995,5(1):28-41.
[19]PAL M,MATHER P M.An assessment of the effectiveness of decision tree methods for land cover classification[J].Remote sensing of environment,2003,86(4):554-565.