徐庆红,吴波,梁志锋
(福州大学 空间数据挖掘与信息共享教育部重点实验室,福州 350002)
湿地信息提取的结果是湿地景观格局研究、湿地保护及管理工作的重要依据,信息提取的精度需满足一定要求。然而,湿地生态系统含水量高,各湿地类型在遥感影像上的光谱特征和空间特征对环境背景依赖性强,“同物异谱”和“异物同谱”现象严重。传统仅依靠地物光谱特征差异分类的方法,湿地信息提取精度较差[1]。面向对象的方法以同质像元组成的对象为处理单元,在原有的光谱信息上,增加了形状、纹理、层次和类空间关系等可用特征,能有效提高湿地信息的解译精度[2]。但面向对象方法仍存在许多难点[3-4],如分割尺度的选择问题、多尺度分割实现困难等。实际应用中的湿地研究区面积较大、数据量多,要达到工程性应用,应引入有效的自动或半自动信息提取方法,形成完整可靠的技术流程,以减少工作量和保证解译结果的可重复性和稳定性[5]。本文旨在提出一种有效的面向对象湿地信息提取方法,为开展湿地调查工作提供技术支撑。
为验证结果的可重复性和稳定性,本文选取两个地区进行实验。区域一是福建省宁德市霞浦县,地理位置为 N26°49′50″~N26°55′1″,E119°59′52″~N120°6′18″;区域二是福建省莆田市涵江区,地理位置为 N25°22′5″~N25°28′3″,E119°2′20″~E119°9′25″。两区均位于闽东滨海地区,浅海、滩涂面积广阔,主要湿地类型有稻田、养殖场、滩涂、浅海水域等。
实验数据包括2010年1月14日霞浦区和2010年3月18日莆田区共两景ALOS AVNIR-2影像。该数据包含4个波段(蓝、绿、红、近红外)信息,空间分辨率为10m。
采用ERDAS中的AutoSync模块对原始数据进行几何校正。辅助数据为已校正的全省TM和ASTER GDEM影像,校正模型为3阶多项式。校正后从影像上裁剪出目标区域:霞浦区影像大小为960*1072像元,莆田区影像大小为1213*1213像元。
面向对象法首先将图像分割成具有一定意义的均质对象,然后用一组特征来描述对象,最后通过建立对象与类结构之间的关系和判别规则,将对象分配到相应的类中。本文提出一种迭代分割方法,以支持向量机(SVM)分类器进行湿地类别识别。最后,通过更深层次的挖掘遥感影像上湿地类别的深层空间语义信息,加入人的思维,构建优化规则,使信息提取结果更加准确。
由于地物间存在大小差异,单一尺度的分割结果过于破碎或分割不完全。因此,应采用多个尺度对不同类别地物进行分割,以保证后续分类精度[6-7]。多 尺 度 提 取 地 物 的 技 术 主 要 是 分 层 分割[8-9],即以不同尺度分割影像,生成多个尺度的对象层,然后逐层提取地类。分层分割方法在一定程度上提高了影像分类的精度,但由于分割层的数量受地类数量的影响,故地类丰富时,相应的对象层多而杂乱,可操作性差;且各类别的提取精度在一定程度上受提取顺序的影响,提取误差累积后易造成提取精度的不平衡,故分层分割的方法在精度和效率的平衡上很难把握[8]。
湿地作为重要的环境资源,类别丰富,信息提取的结果应尽可能准确的反应湿地类型在空间位置和数量上的分布情况,且在实际应用中要考虑到效率和精度的平衡,故逐层提取的方法实用性差。特别是在地类结构复杂时,分层分割技术难以满足湿地信息提取的实际要求。
针对以上情况,本文构想一种迭代分割方法获取多尺度分割对象层,技术流程如图1所示。首先以小尺度进行初分割并分类;然后对同类对象进行合并,则每个类别形成单独的执行域(domain)[13];对每个执行域以不同尺度进行分割(分域分割),形成新的分割对象层;判断新的对象层是否满足要求,若不满足则重复以上过程进行新的分割,若满足则结束分割过程。初始分割尺度应保证分割完全,故采用较小尺度,初始分类采用最近邻分类器分类。
支持向量机(SVM)算法[10]是在统计学习理论基础上发展起来的新一代学习方法,利用核函数将训练样本映射到一个高维的特征空间中,通过寻找最优分类超平面,解决低维不可分问题。在对偶拉格朗日方程中,其内积由核函数(式(1))替代,并且非线性SVM的对偶拉格朗日方程LD(α)(式(2))与线性SVM的情况类似。满足约束条件(3)。利用求解线性可分问题的方法解得最优分类超平面可表示如式(4)所示。
式中,b为偏移量,k xi,( x)为核函数。
实践证明:SVM分类算法具有良好的泛化性能,应用于遥感影像分类中,能有效解决小样本、非线性、高维和局部的问题[11-12]。采 用SVM 分 类 进行湿地信息的提取,在训练数据非常少的情况下仍能得到较好的效果,确保结果的有效性和稳健性,有利于实现信息提取工作的精度和效率的均衡。
考虑到湿地类型具有含水量高、植被覆盖度低、相邻像元同质性强等特点,本文提取了光谱均值(mean)、标准差(Standard Deviation)、基于灰度共生矩阵的同质性(GLCM Homogeneity)、长宽比(Length/Width)、归一化植被指数(NDVI)和归一化水体指数(NDWI)等6种特征参与分类。SVM分类器采用RBF核函数。依据每个类别的光谱特征和纹理特征的丰富性,对应的样本数量为5到10个不等。
利用影像的语义信息描述地物间的空间关系,是面向对象技术的一个主要优势。对象中与语义信息有关的特征主要有:与邻域对象的关系特征、与父对象或子对象的关系特征、利用语义信息描述与类相关的一些对象特征等[13]。本文通过将地类之间的关系以及每个类别特有的空间属性特点与影像分类结果进行比较,由此分析影像分类后出现的类别错分类型,从而构建优化规则改善信息提取的结果。
将SVM分类结果与实际地类分布情况进行比较,得到两个地区的初分类结果的错分情况,由此构建相应的优化规则。
霞浦区湿地类别从沿海向内陆呈水平分布;各个类别斑块相对独立,交错少,邻域对象关系清晰;林地、稻田、水域、水产养殖场均成块状分布;淤泥质海滩处于水陆过渡地带。与实际地类比较得出初分类结果的错分情况:部分疏林地或无林地错分成稻田;内陆地区大量裸地错分成淤泥质海滩;水域与水产养殖场部分混分。根据以上情况建立霞浦区优化规则:稻田对象中与林地存在被包含关系的重定义为林地;包含于建设用地中的淤泥质海滩重定义为建设用地;与非湿地类型存在被包含关系的养殖场重定义为水域。
莆田区湿地资源以木兰溪为界均匀分布于南北两侧;输水河(沟渠)、稻田和水产养殖场交叉分布;建设用地区基本无湿地资源分布;输水河、稻田主要分布于内陆;淤泥质海滩只分布在海陆过渡地区且对象面积较大。与实际地类比较得出初步分类结果的错分情况:部分建筑区由于阴影的影响错分成养殖场;由于光谱混淆,少量养殖场错分成淤泥质海滩、水域和输水河。根据以上情况建立莆田区优化规则:建设用地中包含的水产养殖场对象重定义为建设用地;水产养殖场中的淤泥质海滩、水域和输水河对象重定义为水产养殖场;面积小于1500像元的淤泥质海滩对象重定义为裸地。
本文以专业化面向对象方法软件eCognition为实验平台,采用分形网格演化算法(FENA)进行影像分割。
采用迭代分割方法对影像进行分割,分割参数见表1,分割结果如图2。本文中的各参数通过人机交互确定。考虑到湿地类型含水量高的特性及近红外波段对水体的响应特性,分割时加大近红外波段的权重。根据各湿地类型分布的形状结构及光谱特性,相应调整各参数取值。分割结果的好坏以传统目视评价手段为评判标准。
表1 湿地类别分割参数
从图2可以看出:初步分割的结果分割尺度小,分割完全,但是分割结果过于破碎,不能突出各个地类分布的特点;而经过迭代方法分割的结果,水域、水产养殖场和稻田等地类的块状纹理特征明显,分割边界与地类边界吻合度提高,分割得到的对象信息损失更少。
根据研究区的实际情况结合影像特点,并参照湿地分类规范[14],将研究区地类分为湿地和非湿地两大类别。其中湿地类包括稻田、水产养殖场、淤泥质海滩、输水河、水域(由于区内河流均处于入海口,与浅海水域分界不确定,故将永久性河流和浅海水域合并为水域一类)5类;非湿地类别包括建设用地、林地、旱地3类。
根据影像解译标志进行样本训练并分类,然后利用优化规则修正结果。由于本文的重点是湿地信息的提取,最终结果将非湿地类别合成一类。结果见图3和图4中的(b)、(c)、(d)。
对两区的影像进行传统最大似然分类(图3和图4中的(a))。以经过野外调查验证的人工解译分类结果作为参照依据,分别对最大似然分类结果、SVM分类结果和优化后结果进行精度评价,评价结果见表2和表3。
由表2可知,3种分类方法在霞浦区的分类精度都较高;相对于最大似然分类结果,霞浦区基于迭代分割的SVM分类结果在总体精度上提高了3.88%,kappa系数提高了0.05;经过优化后,总体精度又提高了0.81%,kappa系数提高了0.01。由表3可知,莆田区的最大似然分类结果精度较低,特别是输水河、水产养殖场和水域的光谱混淆,错分情况严重;SVM分类结果精度较高,总体精度达到83.16%,kappa系数为0.76;优化后的总体精度提高到94.18%,kappa系数为0.92。
从两个地区分类结果中可看出:最大似然分类的结果过于破碎,且受光谱限制,部分地类提取精度很低。面向对象的方法各类别提取精度较高且相对均衡,优化后的结果对类别的空间表达更加准确。
表2 霞浦区3种分类结果精度评价
表3 莆田区3种分类结果精度评价
迭代分割与分层分割不同,能在单个对象层中获取多尺度对象,为基于多尺度分割的面向对象方法提供了一种新的思路。基于迭代分割的SVM分类方法,提高了湿地类别的识别能力。依据实际地类与分类结果的比较分析构建优化规则,改善了湿地信息空间上的表达效果,特别是在湿地类别丰富的地区,空间关系成为地类识别的重要依据,这种改善效果更加明显。
本文方法是一种半自动的湿地信息提取方法,技术流程清晰,理论依据明确。影像解译结果具有可重复性、稳定性及有效性等优点;湿地信息的提取结果较为准确的反映湿地类型在量和空间上的分布情况。该方法关键是找到建立规则的规律,将所有步骤保存成完整的规则集,在处理大量数据时,只需直接将规则集导入软件中,修改部分参数,即可实现计算机自动分类,故自动化程度较高,能达到工程性应用要求。
[1]TANSEY K,CHAMBERS L,ANSTEE A,et al.Object-oriented classification of very high resolution airborne imagery for the extraction of hedgerows and field margin cover in agricultural areas[J].Applied Geography,2009,29(2):145-157.
[2]闫利.遥感图像处理实验教程[M].武汉:武汉大学出版社,2010.
[3]CAMPBELL C.Kernel methods:A survey of current techniques[J].Neurocomputing,2000,48(3):63-84.
[4]张秀英,冯学智,江洪.面向对象分类的特征空间优化[J].遥感学报,2009,13(4):664-669.
[5]LENNARTS S P,CONGALTON R G.Classifying and mapping forest cover types using IKONOS imagery in the NorthEastern United States[C].Proceedings of the ASPRS 2004Annual Conference,Denver,USA,2004.
[6]林先成,李永树.面向对象的成都平原多源遥感影像分割尺度研究[J].测绘科学,2010,35(4):38-40.
[7]BAATZ M,SCHAPE A.Multi resolution Segmentation:An optimization approach for high quality multi-scale image segmentation[J].Angewandte Geographische Informationsverarbeitung,Wichmann Verlag,2000,12(12):12-23.
[8]陈云浩,冯通,史培军,等.基于面向对象和规则的遥感影像分类研究[J].武汉大学学报(信息科学版),2006,31(4):316-320.
[9]彭海涛,柯长青.基于多层分割的面向对象遥感影像分类方法研究[J].遥感技术与应用,2010,25(1):149-154.
[10]李国正,王猛,曾华军.支持向量机导论[M].北京:电子工业出版社,2004.
[11]胡自申,张迁.基于SVM 的遥感影像的分类[J].遥感信息,2003(2):14-19.
[12]陈晨,张友静.基于多尺度纹理和光谱信息的SVM 分类[J].测绘科学,2009,34(1):29-31.
[13]Definiens.eCognition Developer 8Reference Book[M/OL].http://www.definiens.com,2009.
[14]国家林业局.全国湿地资源调查技术规程(试行本)[M].北京:中华人民共和国林业部,2008:4-6.