陶舒,周旭,刘倩,程滔,高志宏
(国家基础地理信息中心,北京100830)
面向对象的高分辨率遥感影像数据的道路提取流程
——地理国情普查数据的自动提取
陶舒,周旭,刘倩,程滔,高志宏
(国家基础地理信息中心,北京100830)
为了提高地理国情普查数据生产的自动化程度,针对高分辨率遥感影像的特征,以道路为例,基于面向对象的思想构建了一套通用性较高的数据提取方法流程,并以北京门头沟、河南郑州市作为实验区,证实自动提取规则的有效性。研究结果表明,郊区道路的自动化提取精度比城区道路更高;大比例尺基础数据的引入,可屏蔽掉缓冲区外非道路要素的干扰,提高分类精度。
面向对象;地理国情普查;数据提取;道路;高分辨率遥感影像
开展地理国情普查是社会经济发展到一定阶段的必然要求,也是测绘地理信息部门顺应时代需求、实现转型发展的战略选择[1]。按照相关规定与方案[23],地理国情普查要求以覆盖全国陆地国土的、分辨率优于1m的多源航空航天遥感影像数据作为主要数据源进行信息提取。显然,基于高分辨率遥感数据进行地理国情普查有着不可替代的优势,比如宏观、动态、便捷、可重复和成本低等,但是如此大范围大批量应用高分数据,也会存在一定的挑战:首先,在高分辨率遥感影像上,地物特征并不是单一的由光谱信息体现出来,而是结合地物的空间信息共同表现的,因此基于高分影像进行信息提取时,要综合考虑地物的形状、纹理、结构等空间信息的共同作用,根据其特点采取新的技术方法;其次,数据量庞大,如何高效、快速、准确地完成数据处理和信息提取,最大限度地实现自动化,也是工程化管理提出的新要求。
数十年来,研究人员提出建立了许多自动、半自动信息提取的理论框架、试验系统与算法。以道路为例,有Snake模型方法[4-5]、水平集方法[6]、动态规划方法[7]、模板匹配方法[8]、Hough变换方法[9]、面向对象[10-14]和数学形态[15]方法等,其中面向对象是近年来提出的新方法,具有明显的优势[16]。然而,受制于问题本身的复杂度、难度和当前科技发展的水平,要研制达到满足工程需要且具有很高自动化程度的实用系统,在理论和算法上仍面临着较大的困难。
本文以面向工程生产为导向,对高分辨率遥感影像上数据自动提取的理论与方法进行了分析和探索,以道路为例,基于面向对象的思想构建了一套通用性较高的方法流程,使其对道路的提取精度尽可能不受地域差异、传感器等因素的干扰,满足地理国情普查工程大范围提取信息的需求。
地理国情普查数据成果包含地表覆盖分类、地理国情要素和地表形态3种表现形式。按照地表覆盖的形式采集道路时,除铁路外的其他道路覆盖分类统一归为无轨路面,包括公路、城市道路、乡村道路的路面,含无植被覆盖、经硬化的路堤、路堑的范围[2]。
相比中低分辨率影像上的光谱综合作用,高分辨率影像细节信息繁多,同物异谱、异物同谱的现象非常明显,因而路面表现为连续的、灰度变化、宽度变化缓慢的狭长区域,并且受路面噪声(如汽车、非均一材质、绿化带以及阴影等)、周边建筑物、停车场等其他要素的干扰较大[17]。研究证明,面向对象的分类方法可以有效地解决噪声问题,更好地利用目标的特征[18]。该方法一般分为两个阶段:一是分割阶段,即把高分辨率遥感图像分割成一些空间上相邻、光谱相似的同质区域;二是知识库构建阶段,即选用合适的特征,经特征计算获得关于单元的特征矢量,通过模式分类方法或模式匹配,将分割单元归类到对应的模式类。
1.1 影像分割
影像分割是遥感图像处理和分析中的关键技术,选用哪种分割方法、分割结果的好坏直接影响到后续道路信息分析和识别的精度。常见的有棋盘分割、四叉树分割和多尺度分割[19]3种方法。结合分割效果及道路特征,本文选用多尺度分割,即综合考虑遥感影像的光谱特征和形状特征,计算影像中每个波段的光谱异质性与形状异质性的综合特征值,然后根据各个波段所占的权重,计算影像所有波段的加权值,当分割出对象的光谱和形状综合加权值小于某个指定的阈值时,进行重复迭代运算,直到所有分割对象的综合加权值大于指定阈值,即完成影像的多尺度分割操作[18]。
1.2 知识库构建
知识库是多种特征的集合,道路提取质量的好坏关键在于建立的知识库中的规则是否能够有效地区分地物,因此必须充分了解道路在影像上的特征。有关道路特征的描述可概括为以下几类:①几何特征。整体宽度相对均一,边缘变化缓慢;相比于其他对象,道路对象一般长度较长,长宽比较大;且延伸一般趋向于直线方向,在道路设计中,考虑到车辆拐弯的可行性及安全因素,弯曲的道路部分曲率一般比较小,弯曲变化缓慢。②辐射特征。道路在遥感影像上的辐射特征主要受材质的影响,一般有沥青表面、水泥混凝土表面和土石表面3种,其中沥青表面常见于城市道路,该类材质的道路表面的反射率较低,在高分辨率遥感影像上通常表现为灰度较暗的狭长区域;水泥混凝土表面常见于大部分的公路表面,由于水泥的反射率较高,通常在高分辨率遥感影像上表现为明亮的狭长区域,而且分布较均匀;土石表面常见于乡村道路,该类道路与野外农田等环境有明显的差别,道路在高分辨率影像上表现为明亮的线状区域。③拓扑特征。道路通常相互连通、交叉并且连通成网络,一般不会在某个区域突然中断或孤立存在。④道路噪声。通常情况下,受树木、建筑物及其阴影、道路中心的障碍物(如绿化带)、车辆、道路年龄差异、路面材料等因素的影响,影像上道路灰度呈现出不均一状态,形成差异明显的斑块;此外,道路边界模糊且道路周围的地物具有与道路相似的灰度特征,容易导致错误区域的检测,即不属于道路区域的地物有可能会检测为道路区域。
基于以上分析,本文以北京试点区域为例,从道路(包括公路、城市道路、乡村道路3种类型)、非道路(主要包括建筑物、植被)类型中分别选取50个对象作为试验样本,分别计算光谱、形状、纹理特征参数值,然后运用SEaTH(Seperability and Thresholds)算法进行特征空间优化,即计算特征参数值的J-M(Jeffries-Matusita)距离作为度量不同类别间可分性的分离度,由此选择分离度较大的几个参数作为优选特征,并按照从易到难的原则人为构建道路分层提取规则。关于最优阈值的确定,则以SEaTH算法计算的特征阈值作为参考,结合试验结果进行调整,计算公式为[20]:
式中,假设类别c1的样本特征值服从均值为m1、方差为σ21的正态分布,类别c2的样本特征值服从均值为m2、方差为σ22的正态分布,T为特征阈值,p(c1)和p(c2)分别表示类别c1、c2的先验概率,这里用类别样本的数目n1和n2来代替。
具体技术流程如图1所示。考虑到地理国情普查区域的基础地理信息数据、专题辅助资料(通常为道路网矢量数据)详尽程度不一致,下文在道路提取过程中不涉及辅助资料的嵌入。但是实际操作时,对于辅助资料较好的区域,可利用道路网矢量数据按路宽的距离生成缓冲区,然后仅在缓冲区内按以下3个流程提取道路特征,从而有效地排除其他要素的干扰,提高分类精度[21]。
图1 道路提取技术流程图
2.1 “潜在道路”提取
在本阶段,主要目的是提取与道路具有相似形状特征的要素作为“潜在道路”,并从中剔除与道路光谱、空间拓扑特征有明显差异的要素。
(1)第一层分割
在此次分割中,需要将道路分割成一个个具有一定长度的长条状对象,并保证道路边缘的清晰。设置第一层分割参数,参考值:分割尺度(Scale)为100,形状因子(Shape)为0.7,紧致度(Compactness)为0.5,波段权重均为1。
(2)第一层知识库构建
分割后的影像对象中,道路具有以下两个特征:一是在灰度上具有一定的相似性;二是这些对象具有一定的长度或较大的长宽比。其中,形状是道路区别于其他类型地物的主要特征。经试验,不对称性(Asymmetry)能较好地表达这一特征。对于一个影像对象来说,可近似于一个椭圆,不对称性则表示为椭圆的短轴和长轴的长度比,因此一个影像对象越长,它的不对称性越高。给Asymmetry设定阈值(参考值0.81),提取大于该阈值的对象作为“潜在道路”。
从结果发现,由于主干道中间的绿化带等植被覆盖区也呈条带状,因此被误分入“潜在道路”中。考虑到植被在绿波段上的反射率较低,可结合利用归一化植被指数(NDVI)与绿波段均值(Mean Layer Green),剔除植被的影响(参考值分别为0.139、557.3)。此外,考虑到道路具有连通性,可将去除植被后的“潜在道路”进行合并,然后通过设置长度(Length)参数的阈值(参考值314),将小于该阈值的、不具连通性的要素剔除。
2.2 “潜在道路”优化
在本阶段,主要目的是剔除“潜在道路”中的非道路要素。
(1)第二层分割
此次分割只需在“潜在道路”中进行,分割尺度不宜过小,尽量降低路面的车辆、标识等要素的干扰,但需保证道路边缘的清晰。设置第二层分割参数,参考值:分割尺度为200,形状因子为0.5,紧致度为0.5,波段权重均为1。
(2)第二层知识库构建
阴影在遥感影像数据上表现为DN值(像元亮度值)偏低。经试验,给近红外波段的光谱均值(Mean Layer Nir)设置阈值(参考值248),低于该值的对象为阴影,即可从“潜在道路”中将其去除。
剔除阴影后,“潜在道路”中的干扰因素最大的是建筑物,而两者在形状特征指数上存在较大差别,因此可利用形状特征指数将其区分开。经试验,宽度(Width)与长宽比(Length/Width)同时小于某阈值(参考值分别为73、4.3)时,可较好剔除长方形等较规整的建筑物;长度(Length)与长宽比(Length/Width)同时小于某阈值时(参考值分别为250、4),可较好剔除L型等不规整建筑物;密度(Density)大于某阈值时(参考值1.53),可较好剔除近似正方形的要素;边界指数(Border index)与密度(Density)同时大于某阈值时(参考值分别为3.4、0.94),可剔除边界为锯齿状凹凸不平的要素。
2.3 道路信息提取
在本阶段,主要目的是进一步修正优化“潜在道路”,提取最终结果。
由于路面车辆、交通标识线等地物的存在,使得提取出的道路中存在少量“空洞”,影响提取效果。一般来说,这类对象面积不会太大,与先前优化的“潜在道路”存在相邻或者被包含的关系,其边界与“潜在道路”具有相同的公共边,并且公共边界在该对象的整个边界中所占比例较大,因此,可以利用面积(Area)和对于“潜在道路”的相对边界(Rel.border to latent road)这两个特征进行修补,例如可设定当对象的Area小于阈值4000、且Rel.border to latent road大于阈值0.95时,将其归为道路。此外,利用growing和shrinking两种调整模式去除消除影像中道路网信息上的毛边,基本完成道路提取。
为了验证技术流程的合理性与适用性,基于2景WorldView-2卫星遥感影像开展实验。①采用北京门头沟地区2011年11月20日成像的影像,将全色与波段谱影像融合后进行正射校正,空间分辨率为0.5m,覆盖面积12.58km2;以此作为郊区的典型代表区域,采用上述技术流程进行道路提取。②采用河南郑州市2010年3月5日成像的影像,面积为16km2,作为城区的典型代表区域。实验分为两个部分,一是基于正射影像,采用上述技术流程直接提取道路;二是利用该区域1∶50000比例尺的道路中心线数据按路宽生成缓冲区,仅在缓冲区内按上述流程提取道路。
提取结果如图2、图3所示。从中可以看出,按该技术流程能够较完整地提取出试验区的道路,一定程度上保证了道路的连贯性。为了直观地验证道路信息提取的精度,以地理国情普查数据成果作为依据,分别对这3种分类结果图进行精度评价,结果如表1所示。实验表明:①相比城市地区的道路,郊区的道路提取精度更高,总体精度达到93.7%,Kappa系数0.777。分析原因,在高分辨率遥感影像中,城区反映的结构特征比较复杂,道路交叉口多,道路附近建筑物密集,这些要素都增加了道路提取的难度,比如建筑物、公园、车辆等目标平行的边缘,与道路的两条边极其相似,易形成虚假道路信息,因此错分误差也大大高于郊区道路;同时,受路面的汽车、汽车道、树木、房屋及阴影等影响,容易导致道路形成断裂线性片段,影响提取精度;而在郊区,道路与周边农田、林地等有明显的差别,道路在高分辨率影像上表现为明亮的线状区域,提取效果有一定的优势。②大比例尺基础数据的引入,可屏蔽掉缓冲区外非道路要素的干扰,分类精度由83.7%提高至87.8%,且漏分误差大大降低,由42.1%降至11.8%。
图2 实验区一的原始影像与道路提取结果对比图
表1 道路信息提取精度
图3 实验区二的原始影像与道路提取结果对比图
本文面向地理国情普查数据生产,针对高分辨率遥感影像的特征,构建了面向对象的道路自动提取规则库,并以北京门头沟、河南郑州市为例进行验证,得出如下结论:面向对象的分类方法可以灵活地运用地物本身的几何信息和结构信息,弥补传统的基于像素统计特征分类方法的不足;尽管城区道路的自动化提取效果没有郊区道路好,但通过引入大比例尺基础数据,可屏蔽掉缓冲区外非道路要素的干扰,有效提高分类精度。
当然,本文也存在一定的不足之处,主要表现在基于有限样本对象构建的规则库及阈值,在不同区域、不同时相、不同类型影像的适用性及推广性方面有待进一步验证。
[1]兀伟,邓国庆,张静,等.地理国情监测内容与分类体系探讨[J].测绘标准化,2012,28(4):10-12.
[2]国务院第一次全国地理国情普查领导小组办公室.地理国情普查内容与指标[G].北京:测绘出版社,2013:168.
[3]国务院第一次全国地理国情普查领导小组办公室.地理国情普查数据采集技术方法[G].北京:测绘出版社,2013.
[4]林祥国,张继贤,李海涛,等.基于T型模板匹配半自动提取高分辨率遥感影像带状道路[J].武汉大学学报(信息科学版),2009(3):293-296.
[5]BAUMGARTNER A,STEGER C,MAYER H,et al.Automatic road extraction based on multi-sclae,grouping and context[J].Interneatinal Archives of Photogrammetry and Remote Sensing,1997(30):106-113.
[6]曹广真,金亚秋.基于水平集方法的多源遥感数据融合及城区道路提取[J].电子与信息学报,2007(6):1464-1470.
[7]刘晓平,朱晓强,余烨,等.基于动态规划的城市道路提取改进算法[J].工程图学学报,2010(4):183-188.
[8]林祥国,张继贤,刘正军.用改进的剖面匹配算子提取高分辨率遥感影像上带状道路[J].测绘科学,2009,34(4):64-66.
[9]刘小丹,刘岩.基于Hough变换和路径形态学的城区道路提取[J].计算机工程,2012(6):265-268.
[10]唐静,吴俐民,左小清.面向对象的高分辨率卫星影像道路信息提取[J].测绘科学,2011,36(5):98-99.
[11]唐伟,赵书河,王培法.面向对象的高空间分辨率遥感影像道路信息的提取[J].地球信息科学,2008(2):257-262.
[12]GAMANYA R,DE MAEYER P,DE DAPPER M.Object-oriented change detection for the city of Harare,Zimbabwe[J].Expert Systems with Applications,2009,36(1):571-588.
[13]DIAZ-VARELA R A,ZARCO-TEJADA P J,ANGILERI V,et al.Automatic identification of agricultural terraces through object-oriented analysis of very high resolution DSMs and multispectral imagery obtained from an unmanned aerial vehicle[J].Journal of Environmental Management,2014,134:117-126.
[14]ZHANG R,ZHU D.Study of land cover classification based on knowledge rules using high-resolution remote sensing images[J].Expert Systems with Applications,2011,38(4):3647-3652.
[15]PEETERS A,ETZION Y.Automated recognition of urban objects for morphological urban analysis[J].Computers,Environment and Urban Systems,2012,36(6):573-582.
[16]陶超,谭毅华,蔡华杰,等.面向对象的高分辨率遥感影像城区建筑物分级提取方法[J].测绘学报,2010(1):39-45.
[17]龙辉.高分辨率光学卫星影像城市道路识别方法研究[D].北京:中国科学院研究生院(遥感应用研究所),2006.
[18]胡进刚,张晓东,沈欣,等.一种面向对象的高分辨率影像道路提取方法[J].遥感技术与应用,2006(3):184-188.
[19]黄亮,左小清,张晓晓,等.面向对象的道路信息识别提取分析[J].昆明理工大学学报:理工版,2010(6):6-10.
[20]孙家波.基于知识的高分辨率遥感影像耕地自动提取技术研究[D].北京:中国农业大学,2014.
[21]刘晨帆,刘海砚,唐爽.基于粗糙集的城市主要道路提取规则[J].辽宁工程技术大学学报(自然科学版),2013(3):336-341.
Objects-oriented Method of Data Extraction in National Geographic Census:A Case Study of Road
TAO Shu,ZHOU Xu,LIU Qian,CHENG Tao,GAO Zhi-hong
(National Geomatics Center of China,Beijing100830)
Taking the case of road,ageneral data extraction workflow of land cover data is proposed to reduce manual labor and subjectivity in the national geographic census.Taking advantage of recent advances in object-oriented image analysis,the optimal rule set of object metrics used to extract road is also constructed based on the very high resolution remote sensing imagery.Experimental results indicate that the extraction model achieved higher accuracy of roads in the suburb,compared to the one in the urban area.With the combination of large-scale geographic data,the interference by spectral similarities of road with other landscape elements outside of road buffer zone can be eliminated,which is helpful to significantly enhance the classification accuracy.
objects-oriented;national geographic census;data extraction;road;high-resolution remote sensing image
10.3969/j.issn.1000-3177.2015.06.015
TP751
A
1000-3177(2015)142-0076-05
2014—05—21
2014—11—04
陶舒(1986—),女,博士,现主要从事地理国情普查与监测方面的应用研究。
E-mail:taoshuxuxu@163.com