利用粗糙集理论进行遥感分类信息提取

2015-03-06 11:37周林飞陈启新
关键词:粗糙集决策树反射率

周林飞,陈启新,成 遣,张 静

沈阳农业大学水利学院,沈阳 110161



利用粗糙集理论进行遥感分类信息提取

周林飞,陈启新,成 遣,张 静

沈阳农业大学水利学院,沈阳 110161

以辽宁省双台子河口湿地为研究对象,以Landsat 8和HJ-1-A/HJ-1-B的多时相遥感影像为数据源,根据研究区现状,将研究区分为旱地、芦苇、水田、碱蓬、混合植被、水面、滩涂、居民点、养殖塘九个类型。利用时间序列的归一化植被指数提取植被与非植被的分类阈值,采用粗糙集理论和多时相遥感影像,对植被和非植被分别进行分类规则的获取,建立了研究区决策树分类模型。为了进行精度评价,利用相同的训练点又进行了同样基于像元的最大似然法分类。最后利用混淆矩阵对上述两种方法进行了精度评估,基于粗糙集的决策树分类法与最大似然法总体分类精度分别为93.70%和91.62%,Kappa系数分别为0.92和0.90,两项指标值基于粗糙集理论法均比最大似然法有所提高。这为构建决策树分类模型进行湿地地表分类信息提取提供了一条新的研究思路。

双台子河口湿地;遥感分类;归一化植被指数(NDVI);粗糙集理论;决策树

0 前言

天然湿地一般面积较大、地形条件复杂,加之湿地的季节性变化等因素,给湿地覆被信息变化监测带来挑战。如何利用一种高效精确的方法对大面积的湿地进行监测成为湿地研究的一个热点问题。卫星遥感技术是伴随航空航天技术发展而形成的一门新型对地观测技术,具有观测范围广、精度高、速度快等优点。自从20世纪70年代美国第一代Landsat卫星发射成功,卫星遥感技术便开始用于湿地研究。由于早期遥感影像空间分辨率的限制,遥感技术仅用于大尺度范围湿地分布图的绘制[1-2]。随着传感器技术的发展,遥感影像的空间分辨率和光谱分辨率得到极大提高,目前遥感技术已经成为湿地覆被信息变化监测的一种重要手段。

一切地物都具有特定的电磁辐射特性、空间分布特征以及时间变化规律,而遥感影像就是通过收集这些信息,并用不同的成像方式表现地物特性的一种电子存储数据。地物之间同一时期或不同时期的差异性是利用遥感技术进行地物信息提取或分类的理论基础[3]。遥感分类是获取地表信息的重要手段,也是目前遥感技术应用领域研究的重要内容。目视解译是遥感信息获取的常用办法,但是该方法获取信息周期较长、工作量大、成本较高等缺点在一定程度上限制了它的推广。越来越多的学者倾向于利用计算机人工智能技术进行遥感信息的自动提取,以使遥感信息提取更加高效[4]。

计算机自动解译是目前遥感信息提取的主要研究方向。决策树分类是一种基于空间数据挖掘和知识发现的监督分类方法,它突破了其他分类方法分类模型构建需要分类者有扎实的生态学和遥感知识的瓶颈,通过决策树学习过程获取分类规则,具有很好的灵活性和鲁棒性,结构清晰直观,能够有效抑制训练样本的噪音和属性缺失问题[5]。在本研究中,笔者以双台子河口湿地为研究对象,以新一代Landsat系列卫星Landsat 8遥感影像、环境减灾小卫星HJ-1-A/HJ-1-B遥感影像和研究区内样本点信息为基础数据,采用多时相的遥感影像,利用粗糙集理论获取分类规则,构建决策树分类模型,对双台子河口自然保护区内的湿地覆被信息进行提取。

1 研究基础

1.1 研究区概况

双台子河口湿地位于辽宁省盘锦市辽河三角洲最南端,南接渤海(图1),地理坐标为东经121°30′--122°00′,北纬40°45′--41°10′,区域面积1 280 km2,年平均气温8.4 ℃,年平均降雨量623.2 mm,属北温带大陆性半湿润季风气候区。区域内植被类型多样,动植物资源丰富;芦苇和碱蓬是这里主要的植物群落,形成了独特的芦苇荡和红海滩景观;这里也是我国珍贵野生动物丹顶鹤、东方白鹳、黑嘴鸥等的栖息之地,具有很高的生态研究价值。

1.2 影像数据及预处理

本研究采用3期Landsat 8多光谱遥感影像和2期HJ-1-A/HJ-1-B多光谱遥感影像构成研究区不同时相的基础数据(表1)。Landsat 8卫星由美国宇航局(NASA)和美国地质调查局(USGS)共同负责完成,于2013年2月11日成功发射。该卫星上携带的陆地成像仪(OLI)用于多光谱数据的获取,图幅大小185 km×185 km,星下分辨率30 m,全球运行周期为16 d;相较于之前的Landsat系列卫星,Landsat 8在波段设置上进行了一定的调整,增加了深蓝波段(波段1)和短波波段(波段9)[6-7]。环境减灾卫星是我国专门用于监测环境和灾害监测预报的卫星,由2颗光学星(HJ-1-A/HJ-1-B)组成,上面携带多光谱CCD(charge-coupled device)相机进行地面拍摄,幅宽711 km,星下分辨率30 m,可以实现2 d对国土的全覆盖[8]。

图1 研究区地理位置图Fig.1 Location of the study area

遥感影像在获取过程中必然受到大气散射、空间颗粒物质等因素的干扰,使影像无法真实地反映地物的真实光谱信息,因此要首先对获取的影像进行大气校正。由于本区域地势平坦,属于平原区,宜采用FLAASH(fast line-of-sight atmospheric analysis of hypercube)模型对基础影像数据进行大气校正[9]。由于单幅的Landsat 8影像无法完全覆盖研究区,首先对两幅Landsat 8影像进行镶嵌处理;然后对镶嵌处理后的影像进行几何校正,并以Landsat 8为基准对HJ-1-A/HJ-1-B卫星影像进行几何校正;最后根据研究区的矢量化边界进行裁剪,获取研究区的基础数据,且含云量均满足研究需求。

表1 研究采用遥感影像概况

注:OLI多光谱数据包含一个全色波段。

1.3 湿地覆被分类体系的建立与样本点的采集

根据对研究区的实际野外调查,以及对研究区遥感影像的人工解译结果,结合辽宁省土地分类系统,确定研究区的覆被信息分为旱地、芦苇、水田、碱蓬、混合植被、水面、滩涂、居民点、养殖塘九个类型,构成了双台子河口湿地覆被信息的研究体系。经野外调查,双台子河口属于芦苇沼泽湿地,芦苇是关键物种,此外还有碱蓬;水田与旱田为人工种植区;其他植被不易细分,混生在一起,因此称为混合植被。

决策树是通过对训练样本进行归纳学习生成决策规则,然后使用决策规则对新数据进行分类的一种数学方法。为了建立训练区的需求,利用手持式GPS机在研究区内进行现场样本点的采集,每种类型共获取150个样本点,其中100个样本点作为训练点,50个样本点用于最终结果的精度验证。在采集过程中记录下样本点周围的地表信息和地理坐标信息,利用ArcGIS平台对各个点进行矢量化处理。

2 基于粗糙集理论的决策树分类模型建立

2.1 方法概述

决策树分类模型基于遥感影像数据及其他空间数据,采用专家总结、简单数学统计和归纳方法等设定分类规则实现遥感分类,其关键在于利用何种数学方法建立分类规则。建立决策树模型的总体思路如下:1)确定根节点。湿地内生态类型多样,为使决策树更加简洁,需要用最大信息增益的属性作为决策树的根节点。2)建立分类规则。由于湿地的生态类型多样性、复杂多变性、分布广泛性,不同类型地物空间边界模糊,因此,利用空间数据挖掘和知识发现从空间数据库中自动或半自动地挖掘事先未知却潜在有用的空间模式变得十分必要。本研究基于粗糙集理论,结合多时相遥感影像数据进行分类规则知识发现的研究,分别确定根节点两侧不同类型的决策树分类规则。3)决策树分类模型的建立。根据分类规则建立决策树分类模型。

2.2 植被和非植被分类阈值----根节点的确定

分析双台子河口湿地覆被信息体系九个类型的特征,应先区分为植被和非植被。植被指数是反映植被信息的重要参数,它利用绿色植被在近红外波段具有较强反射率的性质,通过一定的波段运算,反映植被的“绿度”。研究表明,利用遥感卫星的红光和近红外波段的不同组合对植被研究为最佳。归一化植被指数(NDVI)是目前植被研究领域应用最广泛的植被指数之一,其限定值为[-1,1][10]。

(1)

式中:DNNIR为近红外波段的反射率;DNR为红光波段的反射率。

首先,提取植被指数的值,然后进行统计分析,找出区分植被和非植被的分类阈值,作为决策树的根节点[11-12]。然后再采用粗糙集理论分别确立植被和非植被的决策树分类规则。

利用归一化植被指数获取植被和非植被的分类阈值是一种基于统计学理论分类思路,提取训练点内植被和非植被的反射率值,利用统计学理论,获取各个分类类型训练点反射率置信水平为95%的置信区间,分别对比植被和非植被反射率置信下限和置信上限,获取一个区分二者的最佳阈值。由于不同时期植被生长特性的差异性,利用单一时期归一化植被指数获取的分类阈值不具有推广性,但可以利用这种思路进行其他时期分类阈值的获取。

2.3 基于粗糙集理论的决策分类规则的确定

粗糙集是一个强大的数据分析工具,它可以利用不精确、不确定和部分真实的信息来获取知识规则,在知识获取过程中只依赖于样本数据本身,而不需要其他先验知识或附加信息。其主要思想是在保持知识库分辨能力不变的前提下,通过知识的约简,剔除其中不相关或者不重要的冗余信息[13]。同时它还与概率论、模糊数学、证据理论等不确定性与不精确性信息处理工具有很好的互补性,因而被广泛应用于机器学习、模式识别、数据挖掘、智能控制等领域。目前,粗糙集的应用研究主要集中在属性的约简和模式分类两个方面[14]。粗糙集理论以及利用粗糙集理论进行遥感分类的主要思路如下[15-16]。

2.3.1 粗糙集理论

定义一个信息系统S=(U,A),U表示一个非空的有限对象集,称为论域,A为非空的有限属性的集合。若R⊆A且R≠Φ,则∩R(表示R的所有等价类的交集)是一个等价关系,称为R上的不可区分(indiscernibility)关系,记作ind(R),且有

式中:[X]ind(R)表示集合X在R上的不可区分关系;[X]R表示U中所有与X在关系ind(R)下是等价的元素构成的集合。

在粗糙集理论中,一个粗糙集可以用两个精确集来表示,分别为上近似集(upper approximation)和下近似集(lower approximation)。上近似集表示那些知识R中可能属于X的U中元素的集合,下近似集表示那些知识R中肯定属于X的U中元素的集合。

式中:X表示U的子集;x表示U中的一个对象。

对于一个给定的信息系统S=(U,A),如果存在r∈A,且ind(A)=ind(A-{r}),则可以认为r是A中可以忽略的,去掉它不会对分类结果造成影响。对于P⊆A,满足ind(P)=ind(A)且对于P的子属性P′⊂P,ind(P′)≠ind(P),则成P是A的一个约简(reduct),记作red(A)。core(A)=∩red(A),即A的所有约简的交集。它表示一个信息系统不可少的属性集。

2.3.2 属性约简算法

属性约简是粗糙集理论的核心内容之一,它通过对知识表达信息进行属性简约和属性值约简,从而得到最小的决策表[16]。目前对属性约简有很多的算法,其中最为常用的是Susmaga等[17]提出的分辨矩阵和分辨函数算法。假如研究对象有m个,利用这种算法进行属性约简只需要m(m-1)/2次的比较。算法如下:设某决策信息系统S=(U,E∪{d}),其中E为对象的属性集,{d}为决策属性集,那么定义分辨矩阵为C(S),每个元素Cij为

(2)

分辨函数f定义为

(3)

根据Local分辨函数获得每个分类规则的属性组合:

(4)

2.3.3 决策信息系统属性集

在遥感分类中,将训练点在多光谱遥感影像各个波段的反射率值作为决策信息系统的属性集,分类体系作为决策属性集。经过约简,找出能区分各个分类的最优波段组合,生成决策规则,然后使用决策规则对新数据进行分类。

3 模型应用

3.1 分类阈值----根节点的确定

由于地物之间存在“异物同谱”现象,以及植被生长周期的原因,因此运用单一时期的NDVI数据不容易提取植被信息[18-19]。因此,将研究区2013年6月8日、2013年7月26日、2013年9月3日、2013年9月28日、2013年10月30日的NDVI数据构成的时间序列并分别命名为N1,N2,N3,N4,N5。利用ENVI 5.0提取训练点的归一化植被指数,将每个时期的指数值进行统计分析,得出该系列指数值置信水平为95%的置信区间(表2)。

通过表2置信区间上限和下限的对比可以看出,N1,N2,N5中植被的置信下限与非植被的置信上限均有重叠,所以不适合建立决策树的根节点。N3处于9月上旬,在居民点会有局部的绿色植被,加之本研究所采用的遥感影像空间分辨率不高,在居民点会出现很多混合像元,进而对采集点的NDVI造成影响。N4处于9月末,居民点局部的绿色植被对NDVI的影响较小,通过对此时期绿色植被的置信下限与非植被的置信上限比较,选择碱蓬的置信下限0.232作为区分植被和非植被的阈值。

3.2 分类规则的建立

以碱蓬的置信下限0.232作为分类阈值,将双台子河口湿地分为植被与非植被两类,然后利用粗糙集理论,分别对两者建立更为详细的分类规则。

3.2.1 植被分类规则

植被是湿地生态系统重要的生态因子,因此植被一直是湿地研究的重要内容;利用遥感技术对湿地进行分类具有很大优势。植被在夏季的7--8月份光谱特性表现出极大的相似性,一般提取植被信息不宜采用这一时期的影像数据。本研究采用2013年6月8日Landsat 8影像进行植被信息提取。通过对标准假彩色影像的观察,在这一时期芦苇的植被特性表现明显,其他植被也表现出不同程度的植被特性,适合进行植被信息提取。令X1、X2、X3、X4、X5分别表示旱地、芦苇、水田、碱蓬、混合植被,构成植被分类体系,B1、B2、B3、B4、B5、B6、B7分别代表Landsat 8影像的深蓝、蓝、绿、红、近红、短波红外1、短波红外2一共七个波段的地表反射率。提取各个训练点在不同波段的地表反射率,经过统计分析,得出置信水平为95%的置信区间(表3)。根据式(2)得分辨矩阵(表4)。

表2 归一化植被指数统计值

表3 2013年6月8日植被各分类波段反射率统计值

表4 2013年6月8日遥感影像植被各分类区分矩阵

根据式(4),可以得到X1的分辨函数fX1:

fX1=(B6∨B7)∧(B5∨B6∨B7)∧(B3∨B4∨B6∨B7)=(B6∨B7)。

根据数学运算定律(吸收律),得到区分X1的两个约简{B6}、{B7},分类规则如下:

当B6∈[1 732,2 795]时,分类=X1=旱地;

或当B7∈[1 432,2 230]时,分类=X1=旱地。

同理,从这个决策矩阵中,还可以获取芦苇、水田、碱蓬的约简,进而得到它们的分类规则(表5)。由于混合植被的反射率不具有统计规律,因此利用排除法,将剩余的归为混合植被。

3.2.2 非植被分类规则的建立

以研究区内2013年10月30日Landsat 8遥感影像为数据源,进行非植被信息的提取。令Y1、Y2、Y3、Y4分别代表水面、滩涂、居民点和养殖塘,利用ENVI5.0分别提取训练点在各个波段的亮度值,经统计分析,得出置信水平为95%的置信区间(表6)。根据式(2)可以得到非植被各分类的区分矩阵(表7)。通过计算,利用单一时相的影像数据可以获取水面和养殖塘的分类规则。

利用2013年10月30日的遥感影像,只能区分出水面与养殖塘, 这是由于非植被的光谱曲线本身具有混淆性所致;非植被地表信息的提取宜采取多时相的影像数据。因此,滩涂和居民点采用2013年6月8日的遥感影像作为信息提取的数据源。训练点的反射率值见表8,分辨矩阵见表9。通过计算,可以获取居民点的分类规则(表10),再利用排除法获取滩涂的覆被信息,这样通过多时相的影像数据便得到了完整的非植被信息的分类规则。

表5 植被分类规则

表6 2013年10月30日非植被各分类波段反射率统计值

表7 2013年10月30日遥感影像非植被各分类区分矩阵

Table 7 Discernibility matrix of each non-vegetation category on Oct 30, 2013

Y1Y2Y3Y4Y1ΦY2B5∨B6∨B7ΦY3B1∨B2∨B5∨B6∨B7ΦΦY4B6∨B7B5B1∨B2∨B5∨B6∨B7Φ

3.3 决策树分类模型的建立

利用粗糙集理论,根据植被和非植被各个分类类型的分辨函数,选择各个分类的任意一个分类规则,即可获得已建立分类系统的遥感分类模型(图2)。

3.4 分类的执行及分类后处理

根据已建立的双台子河口湿地决策树分类模型,利用ENVI5.0 SP3提供的决策树分类模块,得到双台子河口湿地初步分类图。通过分类器的初步分类,会有很多的孤立像元存在,即所谓的“椒盐”现象(图3a);不管是从实际的角度还是制图的角度出发,都需要对这些小图斑进行剔除并进行重新分类,即分类后处理,最终达到理想的分类结果[20]。分类后处理一般包括分类颜色的设置、分类统计分析、小斑点处理、栅格转换等。笔者主要对初步生产的分类图进行主次(majority/minority)分析、过滤(sieve)和聚类(clump)处理(图3a、b),得到双台子河口湿地最终的分类图(图4)。

表8 2013年6月8日非植被各分类波段反射率统计值

表9 2013年6月8日遥感影像非植被各分类区分矩阵

Table 9 Discernibility matrix of each non-vegetation class type on Jun 8, 2013

Y1Y2Y3Y4Y1ΦY2ΦΦY3B5∨B6∨B7B5∨B6∨B7ΦY4ΦΦB5Φ

表10 非植被分类规则

NDVISep.9月份NDVI值;B7-Jun.6月份第7波段(Band 7)地物反射率。其余依次类推。图2 研究区决策树分类模型Fig.2 Decision tree classification model of the study area

图3 预处理前(a)后(b)对比图Fig.3 Comparison of classification map between initial map (a) and after post-classification (b)

图4 双台子河口湿地信息提取及分类图Fig.4 Classification results of Shuangtaizi Estuarine wetlands

4 分类精度评估

分类精度的评估是遥感分类工作的重要组成部分。从某种意义上来讲,只有通过了精度评估后,分类过程才算完成[21]。目前,精度评估常见以下几种方法[11,22]:1)通过高分辨率影像获取研究区内各个分类特征点,将分类结果与特征点比较,进行精度的验证;2)查阅研究区年鉴或者土地利用数据库等资料,获取各个分类的面积, 进行精度验证;3)利用GPS到研究区现场定点,利用这些点计算混淆矩阵和Kappa系数。

为了验证分类精度,笔者又利用相同的训练点进行同样基于像元的最大似然法分类,然后采用计算混淆矩阵和Kappa系数分别对它们分别进行精度评估。根据GPS定点数据,利用ENVI5.0 SP3软件,计算得基于粗糙集理论的决策树分类整体分类精度为93.70%,Kappa系数为0.92;最大似然法整体分类精度为91.62%,Kappa系数为0.90。二者相比,决策树分类方法整体分类精度比最大似然法整体分类精度高2.08%,Kappa系数提高了0.02。同时获取了各分类类型的精度(表11)。

5 结论与讨论

1)笔者以Landsat 8和环境减灾小卫星(HJ-1-A/HJ-1-B)的多时相遥感影像为数据源,利用时间序列的归一化植被指数,将研究区分为植被与非植被两个大类,达到初步分类降维。又利用粗糙集理论对不同时相的遥感影像进行研究,分别获取植被和非植被的分类规则,并建立决策树分类模型,对双台子河口湿地进行分类研究。利用混淆矩阵对分类精度进行了评估,总体分类精度为93.70%,Kappa系数为0.92,取得很好的分类效果。

表11 不同分类方法精度对比

2)单纯利用粗糙集理论和训练点的反射率很难获取完整的分类规则。本研究采用统计方法,利用归一化植被指数对分类系统进行初步的分类降维,取得了很好的效果。这种降维的思路可为其他研究提供一定的借鉴。

3)利用中等分辨率的Landsat 8和环境减灾小卫星(HJ-1-A/HJ-1-B)遥感影像进行湿地典型地表信息提取基本可以满足需求,但是对于细部信息的提取还存在一定的不足,可以探索通过高空间分辨率和高光谱遥感数据进行弥补。对于湿地的遥感监测需要各种分辨率的影像结合使用,以弥补彼此的不足,为更好的科学管理湿地提供依据。

4)以粗糙集理论为数据挖掘工具可以利用不精确、不确定和部分真实的信息来获取知识规则,在知识获取过程中,只依赖于样本数据本身,而不需要其他先验知识或附加信息。

5)研究表明利用Landsat 8和环境减灾小卫星(HJ-1A/1B)的多期遥感影像进行信息获取时,采用研究区6月、7月、9月和10月的遥感影像组合效果最佳。本研究所建立的双台子河口湿地决策树分类模型可以用于同数据源、同期遥感影像的双台子河口湿地的信息提取。此湿地分类规则的建立方法以及信息提取的方法也可用于其他湿地覆被信息的自动提取。

[1] Ozesmi S L, Bauer M E. Satellite Remote Sensing of Wetlands[J].Wetlands Ecology Management , 2002, 10: 381-385.

[2] Chen H, Zhao Y W. Evaluating the Environmental Flows of China's Wolonghu Wetland and Land Use Changes Using a Hydrological Model, a Water Balance Model, and Remote Sensing[J]. Ecological Modelling, 2011, 222: 253-260.

[3] 王文杰,蒋卫国,王维,等.环境遥感监测与应用[M].北京:中国环境科学出版社,2011. Wang Wenjie, Jiang Weiguo, Wang Wei, et al. Environmental Remote Sensing Monitoring and Application[M]. Beijing: China Environmental Science Press,2011.

[4] 黄颖,周云轩,吴稳,等.基于决策树模型的上海城市湿地遥感提取与分类[J].吉林大学学报:地球科学版,2009,39(6):1156-1161. Huang Ying, Zhou Yunxuan, Wu Wen, et al. Shanghai Urban Wetland Extraction and Classification with Remote Sensed Imageries Based on a Decision Tree Model[J]. Journal of Jilin University: Earth Science Edition, 2009, 39(6): 1156-1161.

[5] 申文明,王文杰,罗海江,等.基于决策树分类技术的遥感影像分类方法研究[J].遥感技术与应用,2007,22(3): 333-334. Shen Wenming, Wang Wenjie, Luo Haijiang, et al. Classification Methods of Remote Sensing Image Based on Decision Tree Technologies[J]. Remote Sensing Technology and Application, 2007, 22(3): 333-334.

[6] 张玉君.Landsat 8简介[J].国土资源遥感,2013,25(1):176-177. Zhang Yujun. Landsat 8 Introduction[J]. Remote Sensing for Land & Resources, 2013,25(1),176-177.

[7] 徐涵秋,唐菲.新一代Landsat系列卫星:Landsat8遥感影像新增特征及其生态环境意义[J].生态学报,2013,33(11):3250-3257. Xu Hanqiu, Tang Fei. Analysis of New Characteristics of the First Landsat 8 Image and Their Eco-Environment Significance[J]. Acta Ecologica Sinica, 2013, 33(11), 3250-3252.

[8] 曲伟,路京选,李琳,等.环境减灾小卫星影像水体和湿地自动提取方法研究[J].遥感应用,2011,4(4):28. Qu Wei, Lu Jingxuan, Li Lin, et al. Research on Automatic Extraction of Water Bodies and Wetlands on HJ Satellite CCD Images[J].Remote Sensing Application,2011,4(4):28.

[9] 李鑫川,徐新刚,王纪华,等.基于时间序列环境卫星影像的作物分类识别[J].农业工程学报,2013,29(2): 169-173. Li Xinchuan, Xu Xingang, Wang Jihua, et al. Crop Classification Recognition Based on Time-Series Images from HJ Satellite[J]. Transactions of the Chinese Society of Agricultural Engineering,2013,29(2):169-173.

[10] 李小文,刘素红.遥感原理与应用[M].北京:科学出版社,2008. Li Xiaowen, Liu Suhong. Remote Sensing Principles and Applications[M]. Beijing: Science Press,2008.

[11] 张健康,程彦培,张发旺,等.基于多时相遥感影像的作物种植信息提取[J].农业工程学报,2012,28(2):134-135. Zhang Jiankang, Cheng Yanpei, Zhang Fawang, et al. Crops Planting Information Extraction Based on Multi-Temporal Remote Sensing Images[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(2):134-135.

[12] 徐娜,丁建丽,刘海霞.基于NDVI和LSMM的干旱区植被信息提取研究:以新疆吐鲁番市为例[J].测绘与空间地理信息,2012,35(7):52-57. Xu Na, Ding Jianli, Liu Haixia. Extraction of Vegetation Information in Arid Area Based on NDVI and LSMM:A Case Study of Turpan[J]. Geomatics & Spatial Information Technology, 2012,35(7):52-57.

[13] 王婧,赵天忠,曾怡.基于粗糙集规则提取的面向对象树种分类方法[J].遥感信息,2013,28(4):90-96. Wang Jing, Zhao Tianzhong, Zeng Yi. Object-Oriented Classification of Tree Species Based on Rule Extraction from Rough Set[J]. Remote Sensing Information, 2013, 28(4): 90-96.

[14] 王学恩,韩崇昭,韩德强,等.粗糙集研究综述[J].控制工程,2013,20(1):1-5. Wang Xueen, Han Chongzhao, Han Deqiang, et al. A Survey of Rough sets Theory[J]. Control Engineering of China, 2013,20(1):1-5.

[15] 张树清.3S支持下中国典型沼泽湿地景观时空动态变化研究[M].长春.吉林大学出版社,2008. Zhang Shuqing. Temporal Dynamic Changes of Wetland Landscape in China Based on 3S Technology[M]. Changchun: Jilin University Press,2008.

[16] Yee Leung,Tung Fung,JuSheng Mi,et al.A Rough Set Approach to the Discovery of Classification Rules in Spatial Data[J].International Journal of Geographical Information Science,2007,21(9):1033-1058.

[17] Susmaga R, Slowinski R, Greco S, et al. Generation of Reducts and Rules in Multi-Attribute and Multi-Criteria Classification[J].Control and Cybemetics, 2000, 29(4): 969-988.

[18] 邓传辉,侍洪波.一种基于粗糙集理论的决策树分类模型的构造[J].中南工业大学学报:自然科学版,2003,34(1):85-88. Deng Chuanhui, Shi Hongbo. Construction of Decision Trees Model Based on Rough Sets Theory[J]. Journal of Central South Unitersity of Technology: Natural Science, 2003, 34(1):85-88.

[19] 郭琳,裴志远,吴全,等.面向对象的土地利用/覆盖遥感分类方法与流程应用[J].农业工程学报,2010,26(7):194-195. Guo Lin, Pei Zhiyuan,Wu Quan, et al. Application of Method and Process of Object-Oriented Land Use-Cover Classification Using Remote Sensing Images[J]. Transactions of the Chinese Society of Agricultural Engineering, 2010,26(7);194-195.

[20] 邓书斌.ENVI遥感图像处理方法[M].北京:科学出版社,2012. Deng Shubin. Remote Sensing Image Processing Using ENVI[M]. Beijing: Science Press, 2012.

[21] Thomas M, Ralph W. Remote Sensing and Image Interpretation[M]. New York: Wiley,2000.

[22] 蔡学良,崔远来.基于异源多时相遥感数据提取灌区作物种植结构[J].农业工程学报,2009,25(8):128. Cai Xueliang, Cui Yuanlai. Crop Planting Structure Extraction in Irrigated Areas from Multi-Sensor and Multi-Temporal Remote Sensing Data[J]. Transa-tions of the Chinese Society of Agricultural Engineering, 2009, 25(8): 128.

Remote Sensing Classification Information Extraction Based on Rough Set Theory

Zhou Linfei, Chen Qixin, Cheng Qian, Zhang Jing

CollegeofWaterConservancy,ShenyangAgriculturalUniversity,Shenyang110161,China

Using Shuangtaizi estuarine wetland as the research area, and Landsat 8 and HJ-1-A/HJ-1-B remote sensing data as the data sources, this study was conducted for land-cover information extraction. According to the status of the land, the study area was divided into 9 categories, including upland, reed, paddy field, Suaeda, mixed vegetation, water body, beach, residential land, culture pond. First, the study area was divided into vegetation and non-vegetation using the time-series normalized difference vegetation index (NDVI). Then, the classification rules of vegetation and non-vegetation were extracted based on the rough set theory and on multi-temporal remote sensing data. Finally, a decision tree classification model was established. For the purpose of an accurate evaluation, the maximum likelihood classification was conducted based on the pixels using the same training samples; and the confusion matrix and kappa coefficient were calculated. The results showed that the overall accuracy both of the deeision tree and the maximum likelihood classification reached up to 93.70% and 91.62% with a kappa coefficient of 0.92 and 0.90 respectively. The two evaluation index values were improved. It provided a novel research idea for a wetland classification information extraction based on remote sensing images.

Shuangtaizi estuarine wetlands; remote sensing classification; normalized difference vegetation index (NDVI); rough set theory; decision tree

10.13278/j.cnki.jjuese.201504304.

2014-10-21

高等学校博士学科点专项基金(20112103120003);辽宁省水利科技指导性计划项目(〔2011〕137号-12)

周林飞(1971--),女,副教授,博士, 主要从事3S技术应用研究,E-mail:zlf924@163.com。

10.13278/j.cnki.jjuese.201504304

TP79

A

周林飞,陈启新,成遣,等. 利用粗糙集理论进行遥感分类信息提取.吉林大学学报:地球科学版,2015,45(4):1246-1256.

Zhou Linfei, Chen Qixin, Cheng Qian, et al. Remote Sensing Classification Information Extraction Based on Rough Set Theory.Journal of Jilin University:Earth Science Edition,2015,45(4):1246-1256.doi:10.13278/j.cnki.jjuese.201504304.

猜你喜欢
粗糙集决策树反射率
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
基于Pawlak粗糙集模型的集合运算关系
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
多粒化粗糙集性质的几个充分条件
基于决策树的出租车乘客出行目的识别
双论域粗糙集在故障诊断中的应用
两个域上的覆盖变精度粗糙集模型