基于ICA面向对象的耕地信息提取

2016-10-20 15:47欧阳涛刘振华肖北生
江苏农业科学 2016年7期
关键词:信息提取

欧阳涛 刘振华 肖北生

摘要:对高分一号卫星影像的波段进行独立成分分析转换(ICA),分析耕地在转换后影像的波段特征、纹理特征以及空间特征,再使用面向对象的方法提取耕地。相对于主成分转换的面向对象分类后的精度,经过独立成分分析能够有效消除波段之间的二阶甚至是高阶相关,经其变换的各分量之间也能保持相互独立。主成分转换的面向对象整体精度为72.50%,κ系数是0.675 4。独立成分转换波段的面向对象提取耕地的方法整体精度达87.01%,κ系数是0.846 3。提取耕地的制图者精度平均达89.25%,用户精度平均达85.09%。说明将预处理的波段进行独立成分分析转换,能够更加有效地提取耕地类型,是一种有效、可行的提取方法。

关键词:面向对象方法;独立成分分析转换;耕地资源;信息提取

中图分类号: P237 文献标志码: A 文章编号:1002-1302(2016)07-0372-05

耕地资源是人类赖以生存和发展的物质基础,快速、准确地提取耕地信息对耕地动态监测、耕地保护以及土地资源利用程度分析等具有重要意义。传统的遥感分类以单个像素为研究对象,仅根据光谱特征信息进行分类,这样的分类会导致遥感影像中同物异谱、异物同谱现象普遍存在,使得地物分类的精度降低。随着遥感卫星的迅猛发展,高空间分辨率影像为高精度地物分类提供了可能。然而高分辨率影像在提高空间分辨率的同时,也增强了耕地的内部差异性,使得耕地覆盖的光谱表现呈现多样性,加大了耕地准确提取的难度[1]。因此,对原始波段进行某种有效转换,使用转换后影像中的纹理、空间、光谱特征,采取面向对象方法进行分类,能更有效地提高提取耕地精度。面向对象(object-oriented)是指采用多尺度分割法则,获得每个影像对象的地物特征(包括光谱特征、几何结构特征、纹理特征、语义关系),并以影像对象为信息提取的基本单元而非影像单个像素,实现地物类别的自动提取[2]。邓劲松等将比值植被指数RVI和归一化植被指数NDVI作为新的波段,融入到SPOT5影像中,在增加有效信息量的同时,利用简单的决策树模型提取耕地信息,结果表明,该方法能够在快速、准确地提取植被信息的基础上,进一步区分旱地和水田,并且去除容易混淆的园地[3]。邵蔚等以陕西省榆林市某区域作为研究区,针对QuickBird影像,基于面向对象分类的思想建立了土地利用分类规则集,分别在3个分割尺度上获取耕地、旱地、水浇地[4]。东启亮等将Landsat TM影像和SPOT5影像进行独立成分分析和主成分分析,处理后的影像进行湿地提取,提取湿地的整体精度和κ系数都有一定程度提高[5]。面向对象信息提取方法有2个关键问题:第一是如何合理选择影像分割算法与最佳分割参数,选择不同的参数和算法将会影响信息提取的精度,大多数试验选择参数时采用重复试验方法;第二是对象特征选取和分类规则的建立[6-9]。本研究引入独立分量分析方法(ICA),获取对象特征,建立规则数据库,提取耕地信息,并对分类后的结果进行精度检验,探讨ICA方法对耕地提取精度的影响,旨在解决高分辨率中提取耕地信息的问题。

1 数据来源与预处理

本研究所用的遥感数据为高分一号卫星获取的2013年12月8 m多光谱影像和2 m全色影像数据。多光谱影像包含4个波段:蓝波段-b1(450~520 nm)、绿波段-b2(520~590 nm)、红波段-b3(630~690 nm)、近红外波段-b4(770~890 nm)。全色波段波长450~900 nm。将影像进行辐射定标、大气校正,利用DEM文件和影像的RPC文件进行正射校正以及Gram-Schmidt融合。对融合后的影像进行裁剪,裁剪的研究区域为3.34 km×4.46 km,融合后的空间分辨率为2 m(图1)。

2 方法

2.1 独立成分转换

独立成分分析方法(independent component analysis,ICA)基本思想是用一组独立的基函数来表示一系列随机变量,算法如下:设N个波段的高光谱数据的观测信号为X=(x1,x2,…,xN)T,每个观测信号是m个独立的、非高斯分布的源信号S=(s1,s2,…,sM)T的线性组合,即X=AS,其中A=(αij)N·M为未知的混合矩阵[10]。ICA变换就是在混合矩阵A和独立成分S未知的情况下,根据观测数据X确定分离矩阵W=(w1,w2,…,wM)T,使得变换后的输出S*=A+X=WX是对S的最优估计。基于互信息最小化信息理论,采用负熵度量准

则作为判断向量相互独立的标准,其表达式为:

2.2 面向对象分类法

本研究采用面向对象的特征提取方法,该方法通过一定的分割算法,对遥感影像进行分割,生成任意尺度下内部特征信息类似的影像分割对象,运用模糊逻辑方法获得每个影像对象的特征信息,以影像对象为特征提取基本单元,在特征空间中进行对象识别,完成地物信息提取[11]。依据相邻像元的特征值(光谱、纹理、颜色等),采用合适的算法分割影像,使得分割对象内特征呈一致性,对象间特征呈差异性。分割后的碎片称为“对象”,与现实世界的对象是一一对应的,这是选择分割尺度的重要依据[12]。本研究采用基于边界分割算法,不仅运算速度快,而且只需要1个参数(分割尺度),这种算法依靠抑制弱边界,可达到多尺度分割的结果。分割尺度属于空间范畴概念,是一种无量纲化表达。分割尺度范围在0~100之间,分割尺度越小,分割数量对象越多;分割尺度越大,分割数量对象越少。影像分割时,为了保证将兴趣对象不分割到其他对象中,不可避免会将兴趣对象分割成多个小对象,所以,采用Full Lambda-Schedule算法[13]合并那些由于分割尺度选择不当而造成的破碎对象,达到分割影像初始目标的目的,从而提高分割对象的精度。Full Lambda-Schedule算法迭代合并相邻基于空间和光谱的信息。合并发生在1对相邻的地区,例如合并值小于一个λ阈值。Full Lambda-Schedule算法公式为:

式中:Oi指图像的区域i;|Oi|指图像区域i的面积;ui是区域i的平均值;uj是区域j的平均值;‖ui-uj‖是区域i和j之间的光谱值的欧几里德距离;length[(Oi,Oj)]是和的共同部分的边长。

合并尺度范围在0~100之间,合并尺度越大,越多的分割对象进行合并,合并尺度越小,越少的分割对象进行合并。根据具体的地物特征以及地物信息特点来选择合适的分割尺度、合并尺度进行分割。图像分割对象后,针对感兴趣的地物类型,采集地物类型的光谱特征、空间特征、纹理特征,逐步建立各种规则,提取遥感影像中的地物信息进行图像分类。

3 结果与分析

3.1 ICA转换结果

利用ICA对遥感图像进行变换,得到一组相互独立的成分图像,在这些成分图像上,各种相关信息得到很好的分离。将转换后的波段IC3赋予红色,IC2赋予绿色,IC1赋予蓝色。ICA转换后的研究区域如图2所示。各种典型地物均值在转换波段后研究区域的具体统计值如表1所示,ICA统计曲线如图3所示。

从表1可知,可以利用各种典型地物在IC波段中的差异来设定阈值进行分类,例如水体等。但是,有些典型地物在IC波段的均值非常接近,仅仅依靠IC波段的光谱特征仍然无法分类出耕地等其他地物。因此,本研究同时运用IC波段中的纹理特征以及空间特征、NDVI值等影像信息,用面向对象的方法进行分割分类,提取耕地。

3.2 ICA转换波段的面向对象分类法的规则

从表1可知,水体、道路等非耕地IC波段纹理、空间等特征都与耕地有相互的重叠区域。因此,直接提取耕地将会包含这些非耕地的信息,降低分类精度。应先提取非耕地波段以及空间特征等明显典型地物,用掩膜去除这些地物,在未分类影像中继续提取其他地物。如果地物面积较大,且纹理清晰则分割尺度可以稍大,分割数量越小,合并尺度稍大,合并数量越多,地物更为集中。每次提取一个地物,建立掩膜,从未分类的影像中依次提取水体、道路、居民点、林地等。

3.2.1 水体的提取规则 水体主要是以湖泊、水库等形式来进行呈现,面积较大,纹理分布较均匀,NDVI值明显较小。经过反复试验,本研究选择的提取水体规则如表2所示。

3.2.2 道路的提取规则 提取水体后,把提取出来的水体建立掩膜文件,在未分类的影像中继续提取其他地物。道路主要横穿林地、建筑物、农田等,空间特征较突出,长度较长。经过反复试验,选择的提取道路规则如表3所示。

3.2.3 居民点的提取规则 居民点在每个光谱的亮度值几乎一样,矩形的长宽比比较突出。经过反复试验,选择的提取居民点规则如表4所示。

3.2.4 林地的提取规则 林地的NDVI值较大,而且面积较大,光谱特征非常明显。经过反复试验,选择的提取林地规则如表5所示。

3.2.5 耕地的提取规则 耕地主要分为旱地、水浇地以及水田。在预处理后的4个波段中,这3种耕地类别的光谱特征非常接近,所以进行了ICA转换。在IC波段设置规则,分类前4个地物类别,在未分类影像中继续进行分类。 旱地分布较为零散,分类规则较多,使用的是经过独立成分转换后的波段,IC1、IC2、IC3、IC4指经过独立成分转换后的4个波段,同理TEXTURE(ICi)指第i个波段的纹理信息。经过反复试验,选择的提取旱地规则如表6所示。

同理,分类旱地之后,提取水浇地。由于研究区域水浇地面积小,而且分布较为集中,因此使用纹理信息、紧凑度、NDVI 值,建立的规则多次使用空间特征的紧凑度。经过反复试验,选择的提取水浇地规则如表7所示。

分类水浇地之后,未分类的影像中绝大部分都是水田。水田的纹理较为清晰,主要分布在道路附近。经过反复试验,选择的提取水田规则如表8所示。

3.3 面向对象分类法的结果图

本研究首先选择了主成分分析转换波段且使用面向对象方法进行分类,经过ICA转换后,使用面向对象方法得出分类图。主成分分析转换和ICA转换的面向对象法分类结果见图3、图4。

对主成分分析转换的面向对象法分类图和ICA转换波段的面向对象法分类图进行精度评价。选取一样的随机样本点作为检验样本,分别评价这2种分类方法的精度,这2种方法的混淆矩阵如表9、表10所示。

由表9、表10可知,经过主成分分析转换的面向对象方法整体精度只有72.50%,κ系数为0.675 4。ICA转换波段的面向对象方法提取整体精度达87.01%,κ系数是0.846 3。将预处理后波段ICA转换后进行分类,相比于经过主成分分析转换的面向对象方法,各种典型地物精度都得到了显著提高。其中,在旱地、水田、水浇地上,经过主成分分析转换的面向对象方法的制图者精度分别为70.53%、74.80%、7495%,用户精度分别为76.99%、77.85%、72.32%。ICA方法的制图者精度分别为90.18%、88.74%、88.83%;用户精度分别为88.64%、86.66%、79.88%。这说明基于ICA转换波段的面向对象方法提取方法是可行的,可以有效提取旱地、水田、水浇地等地类的精度。

4 结论与讨论

独立成分分析方法(ICA)基于高阶统计信息,不但可以去除波段之间的相关性,而且可以得到各分量之间相互独立的特性,增强不同地类之间的可分离性,ICA转换波段处理的高分影像变得更加清晰,图像信息损失少,其对高分影像耕地信息提取的总体精度和κ系数都大于经过主成分分析转换的面向对象方法,能够高精度提取耕地信息、提高分类精度。本研究利用ICA转换波段,提取了纹理信息、光谱信息和空间特征紧凑度,并结合NDVI值,建立了规则知识库,获取的规则知识库比主成分分析转换后获取的规则知识库更优,分类结果更为合理。本研究逐步提取地物类别,仍然会把部分地物信息错误地进行分类,例如道路和居民点信息以及水田与旱地的信息较为接近,较容易混淆。此外,需根据大量的重复性试验和花费大量的时间来获取阈值,因此,后续研究中应选取更为有效、简便的方法。

参考文献:

[1]孙家波.基于知识的高分辨率遥感影像耕地自动提取技术研究[D]. 北京:中国农业大学,2014.

[2]Hay G J,Marceau D J,Dubé P,et al. A multiscale framework for landscape analysis:object-specific analysis and upscaling[J]. Landscape Ecology,2001,16(6):471-490.

[3]邓劲松,王 珂,沈掌泉,等. 基于特征波段的SPOT-5卫星影像耕地信息自动提取的方法研究[J]. 农业工程学报,2004,20(6):145-148.

[4]邵 蔚,张友静,王玲玲,等. 土地利用分类规则集的构建与应用研究[J]. 遥感信息,2012(1):88-94.

[5]东启亮,林 辉,孙 华,等. 独立分量分析与主成分分析方法的湿地遥感分类精度对比——以西洞庭湖湿地为例[J]. 湿地科学,2014,12(3):332-339.

[6]别 强,何 磊,赵传燕. 基于影像融合和面向对象技术的植被信息提取研究[J]. 遥感技术与应用,2014,29(1):164-171.

[7]朱超洪,刘 勇. 基于影像认知和地学理解的面向对象分类研究[J]. 遥感技术与应用,2012,27(4):536-541.

[8]Dronova I,Gong P,Nicholas E,et al. Landscape analysis of wetland plant functional types:the effects of image segmentation scale,vegetation classes and classification methods[J]. Remote Sensing of Environment,2012,127:357-369.

[9]郭亚鸽,于信芳,江 东,等. 面向对象的森林植被图像识别分类方法[J]. 地球信息科学学报,2012,14(4):514-522.

[10]葛山运. 基于MNF、PCA与ICA结合的高光谱数据特征提取方法[J]. 城市勘测,2013(2):103-106.

[11]黄慧萍,吴炳方,李苗苗,等. 高分辨率影像城市绿地快速提取技术与应用[J]. 遥感学报,2004,8(1):68-74.

[12]王新军,武红旗,盛建东,等. 面向对象的高分辨率影像耕地信息提取[J]. 新疆农业科学,2012,49(2):371-378.

[13]Robinson D J,Redding N J,Crisp D J. Implementation of a fast algorithm for segmenting SAR imagery[R]. Scientific and Technical Report,2002.

猜你喜欢
信息提取
基于信号处理技术的正念脑电信息提取方法
建筑电气设计中BIM技术的应用研究