面向对象的GF-1 卫星影像苹果树种植面积遥感提取研究
——以山地丘陵地区的栖霞市为例

2020-06-02 09:46舒美君
沙漠与绿洲气象 2020年2期
关键词:面向对象决策树苹果树

秦 泉,王 冰,李 峰*,王 昊,赵 红,舒美君

(1.山东省气候中心,山东 济南250031;2.烟台市气象局,山东 烟台264003;3.济南轨道交通集团第一运营有限公司,山东 济南250306)

苹果是世界四大水果之冠, 也是中国种植面积最广的温带水果之一。近些年,随着人们对苹果经济价值的追求,苹果树种植面积逐年扩大,各大主要产区的地方政府对苹果树种植面积和空间分布的重视程度逐渐加大。 栖霞市是渤海湾苹果产区中规模化程度最高的苹果种植区, 其种植面积与产量对渤海湾苹果产区有很大影响。 传统的苹果资源信息统计数据多是通过人工调查统计获得,这种方法效率低、时效差、精度不高,在大尺度空间分布调查时存在较多问题[1],难以满足现代农业发展的需求。 快速、有效、准确的获取苹果树种植面积及空间分布,可为政府部门进行苹果树种植布局调整、 苹果估产及灾害预防应急等提供数据支撑。

遥感技术作为一门前沿的现代信息技术,具有快速、客观、监测范围广等优点。自应用以来,国内外学者开展了大量利用遥感技术提取农作物种植信息的研究。如Wardlow 等[2]、Sun 等[3]和许文波等[4]使用MODIS(moderate-resolution imaging spectroradiometer) 产品数据, 通过构建时间序列的方法对农作物进行分类和提取,取得了较好的效果;顾晓鹤等[5]、程乾等[6]和樊香所等[7]通过MODIS、FY-3 等数据,采用特征指数法对玉米、 水稻和冬小麦种植面积提取进行研究,结果精度都达到80%以上。 以上学者的研究多是基于中等分辨卫星数据,其空间分辨率较低,分类精度会受到一定限制。 随着卫星数据空间分辨率的不断提高,采用面向对象分类方法[8]或者基于高分辨率卫星数据[9]进行作物提取的研究逐渐增多,陈燕丽等[10]和任传帅等[11]利用SPOT 卫星影像通过多尺度分割, 建立分类规则对水稻和芒果林进行了提取研究;石涛等[12]和于新洋等[13]基于TM 影像数据通过特征参数分析建立提取模型对冬小麦和果园信息进行提取,提取精度在85%以上;罗卫等[14]以环境卫星的CCD 影像为数据源,综合NDVI、波段信息、地形地貌等特征构建决策树模型, 对东江源果园进行提取,提取精度达89%;姬忠林等[15]基于GF-1 影像对扬州市冬小麦和油菜进行了提取,总体精度达97%和96%;黄健熙等[16]基于GF-1/WFV 影像进行主成分变换建立多特征数据集,通过构建决策树模型,分别提取水稻和玉米,精度达95%以上。 上述研究充分说明采用面向对象分类方法或者基于高分辨率卫星数据在农作物信息提取方面有巨大的应用潜力。

综上所述,MODIS、FY-3 等卫星影像空间分辨率偏低, 在作物提取精度方面会受到限制;TM、SPOT 和GF-1 等高分辨率卫星影像可以提供更丰富的空间信息,但分类多是应用在小麦、水稻、玉米等大宗农作物, 对山地丘陵苹果树信息提取的研究相对较少, 以往的研究中很少将国产高分辨率卫星GF-1 影像用于山地丘陵苹果树信息的提取。 基于此,本研究基于GF-1/WFV 卫星影像数据,以山地丘陵城市栖霞为研究区, 采用面向对象决策树分类方法, 将植被覆盖度和坡度信息融入影像的多尺度分割,以DEM、坡度、光谱信息为辅助数据,开展山地丘陵地区苹果树种植信息分层提取方法研究,建立适合山地丘陵地区苹果树种植信息遥感提取模型, 以期为国产高分辨率卫星GF-1 在山地丘陵地区果园信息遥感提取方面提供科学性的参考和技术支撑。

1 数据源与方法

1.1 研究区概况

本研究选取山地丘陵城市栖霞为研究区, 该区域地形复杂下垫面信息丰富,丘陵、山地和平原均种植苹果树,是渤海湾重要的苹果产区,苹果是该区域的支柱产业。栖霞市位于山东半岛东部,属山区丘陵地形,有“胶东屋脊”之称,海拔约800 m,四季分明,光照充足, 年平均气温11.3 ℃, 降雨量650 mm 左右,年日照总时2690 h,属暖温带季风型半湿润气候,是我国最适宜果树生长的地区之一,研究区地理位置如图1 所示。据统计2016 年栖霞累积出口鲜苹果10.9 万t,出口量位居全国县级市首位,全市苹果年总收入近100 亿元,80%的农民经济收入来源于苹果业[17]。

图1 研究区地理位置和GF-1 假彩色合成影像

1.2 数据源及预处理

GF-1 号卫星作为中国高分辨率对地观测系统的第一颗卫星, 搭载了4 台16 m 分辨率多光谱相机,包括绿、蓝、红和近红外4 个波段,其主要卫星参数见表1。 本研究使用的GF-1/WFV 卫星影像数据获取时间为2016 年4 月25 日,产品级别为1 级(相对辐射校正产品),云量<3%,数据来自中国资源卫星中心(http://www.cresda.com/CN/)。

表1 GF-1 卫星参数

GF-1/WFV 卫星影像数据预处理主要包括正射校正、 辐射定标和大气校正, 预处理所有过程在ENVI 软件环境中完成。 借助30 m 分辨率DEM 数据对影像进行正射校正, 影像的误差控制在一个像元内; 通过资源卫星应用中心提供的辐射定标系数进行辐射定标; 利用ENVI 的Flaash 模块进行大气校正,以消除大气在传输过程中对地物反射的影响。

坡度(SLOPE)作为重要的地形因素之一,能在一定程度上反映土地利用类型及植被的分布状况[18],特别对于山地丘陵地区,坡度信息可作为识别地物的一个重要因子。 研究区坡度信息通过30 m分辨率DEM 数据进行提取,DEM 数据来自地理空间数据云(www.gscloud.cn),通过3 次卷积内插进行重采样与卫星数据进行匹配。

植被遥感监测中,归一化植被指数(NDVI)是植被生长状况和植被覆盖度的重要指示因子, 本文通过NDVI 进行植被覆盖度的估算,NDVI 计算公式如下:

式中,NIR 为近红外波段反射率,R 为红光波段反射率。

植被覆盖度(FVC)是指植被地面垂直投影面积与统计区地面总面积的百分比[19]。 它能反映植被的生长状况和空间分布密度, 可有效剔除非植被及植被覆盖较低的地物。 根据像元二分模型[20-22],假设每个像元地表均为无植被覆盖和植被覆盖两个部分构成,因此可通过NDVI 进行植被覆盖度的估算。计算公式为:

式中,NDVIsoil为无植被覆盖地表或裸地NDVI 值,NDVIveg为植被完全覆盖地表NDVI 值。 为保证植被覆盖度精度,NDVIsoil值选取NDVI 影像频率累积率为5%的NDVI 值,NDVIveg值选取NDVI 影像频率累积率为95%的NDVI 值。

为掌握研究区苹果树的种植分布情况, 本研究对研究区进行了野外实地调查, 同时结合在线高分辨率影像,按照样本点数量充足、均匀分布的原则,共选取456 个苹果树样本点及125 个非苹果树样本点。

1.3 研究方法

1.3.1 分类方法

面向对象决策树分类。 以影像分割后的同质区域为分析目标, 通过构建特征指数及分割后所得对象的形状、 语义等多种特征作为建立决策树的判断准则,对影像的各个对象进行逐层识别和归类,逐步将目标地物分离出来。 多尺度影像分割是面向对象决策树分类的关键, 分割尺度直接影响目标地物的提取精度[23-24]。 根据目标地物及研究区的不同,融入辅助信息参与影像分割可以提高分类精度[25]。 本文研究区属于山地丘陵地形, 影像分割时将坡度(SLOPE)和植被覆盖度(FVC)数据融入影像分割,经过多次对比分析,将分割尺度设为15,合并尺度设为70, 苹果树大多被分割到同一多边形区域,同时对零碎地块也有较好的分割, 通过对研究区不同地物样本的统计分析, 建立决策树分类模型对目标地物进行提取。

最大似然监督分类。 最常用的遥感影像监督分类方法之一[26-27],该方法基本原理是通过对遥感数据像元统计分析,假定各类地物均为正态分布,通过训练样本,根据判决准则构建非线性判别函数,判定每个对象的归属度,把各对象分配到相应类别中去[28]。

1.3.2 研究方案

分别利用面向对象决策树分类和最大似然监督分类法对研究区苹果树进行识别提取, 通过对分类结果分析及精度验证, 得到山地丘陵的苹果树最优提取方法。在面向对象决策树分类中,为了验证辅助信息参与影像分割是否能进一步提高苹果树提取精度, 将面向对象决策树分类按辅助信息SLOPE 和FVC 数据是否参与影像分割分为2 种方法。 研究方案分3 种:(1)SLOPE 和FVC 数据作为辅助信息参与影像分割的面向对象决策树分类, 记为K1;(2)无辅助信息参与影像分割的面向对象决策树分类,记为K2;(3)最大似然监督分类,记为K3。 具体技术路线如图2 所示。

图2 研究技术路线

2 特征分析及决策树构建

2.1 特征参数的分析与选取

地物特征参数的选取和确定是构建决策树的重要前提,尤其是在复杂下垫面的区域,不同地物的光谱特征及其周围的地形环境因子是遥感影像中最直观的特征。光谱特征是光学遥感进行地物识别的基础,地物光谱特征分析有助于提取目标地物;而地形因子是植被种植生长的特征之一。相比于平原地区,山地丘陵地形较为复杂, 因此植被具有显著的地带性空间分布特征[29]。

通过调查和查阅研究区的相关资料发现, 研究区地物类型主要为苹果树、林地、冬小麦、水体、建设用地和未利用地。基于此,本研究对研究区典型地物样本光谱及环境地形特征进行选取和分析。 由于本研究主要讨论的对象为苹果树, 故先将地物类型分为非植被和植被两大类, 其中, 非植被主要包括水体、建设用地和未利用地,植被主要包括冬小麦、林地和苹果树。然后,统计样本数据并且生成非植被和植被的植被覆盖度(FVC) 的概率密度柱状图(图3)。 从图3 可以看出,非植被地物FVC 值分布在0~0.6,主要集中在0~0.4,并且随着FVC 值的增加概率密度逐渐减小。 相比而言,植被地物的FVC 值范围在0.3~0.9,主要集中在0.5~0.9,并且随着FVC 值的增加概率密度逐渐增大。 考虑到非植被与植被的FVC 值在部分区间存在交集, 但是所占比例较小,因此本研究可以通过设置FVC 阈值来区分植被与非植被。

图3 2016 年4 月研究区植被与非植被地物植被覆盖度(FVC)概率密度对比

研究区的苹果树在4 月下旬处于花期, 其光谱表现为花与叶的综合光谱特征[30],而冬小麦处于孕穗—抽穗期。 苹果树的光谱特性与冬小麦和林地存在一定差异(图4)。3 种植被在蓝和红波段表现为吸收谷,在绿和近红外波段为反射峰。在可见光波段范围,苹果树的反射率最高,其次为林地,冬小麦最低。在近红外波段处,苹果树和冬小麦的反射率相近,并且高于林地。基于上述分析,通过绿和近红外波段反射率阈值可以实现苹果树与冬小麦和林地的区分。

图4 2016 年4 月研究区植被光谱曲线

坡度作为一个重要的地形因子, 在一定程度上反映植被的种植分布情况,特别在山地丘陵地区。针对本文的研究区,中部及东部山区坡度较大,北部、西部和南部地势较低缓, 林地多分布在海拔较高且坡度较陡的地方[30]。 通过实地调查和相关文献的查阅可知, 栖霞苹果树种植坡度在不同DEM 区域存在一定差异性。 因此,在前人研究的基础上,本文通过DEM 对研究区进行具体分层, 进而对不同层的苹果树种植坡度进行分层统计分析。在本研究中,依据研究区的地形特征,将DEM 共分为3 层,即(1)DEM<150 m;(2)150~250 m;(3)250~400 m。在此基础上,对不同DEM 层的苹果树样本点进行统计,生成不同DEM 层的苹果树种植坡度柱状图(图5)。从图5 中统计结果可以看出,DEM 在150 m 以下,苹果树种植坡度在3°以下;DEM 在150~250 m 苹果树种植坡度在9.3°以下;DEM 在250~400 m 苹果树种植坡度在13.5°以下。 由此可见,苹果树种植坡度特征可作为提取苹果树种植信息的一个重要参数。

图5 研究区不同DEM 层的苹果树种植坡度统计结果

2.2 面向对象的决策树模型构建

基于研究区地物特征分析结果, 本研究选择植被覆盖度(FVC)、DEM、坡度和光谱参数进行决策树分类方法的构建,图6 为决策树分类规则路线。通过各节点的分类规则, 逐层分类, 最终提取苹果树信息。 首先,通过DEM 阈值筛选出苹果树种植区;其次,通过植被覆盖度阈值进行植被与非植被的分离;然后通过DEM 阈值对苹果树种植区进行分层提取,即DEM 在150 m 以下的区域,通过绿波段反射率阈值进行苹果树与冬小麦的区分;DEM 在150~250 m 的区域, 通过坡度和绿波段反射率阈值进行苹果树与冬小麦和林地的区分,DEM 在250~400 m的区域, 通过坡度和近红外波段反射率阈值进行苹果树与林地的区分。

根据上述决策树分类规则,同时应用到SLOPE和FVC 数据作为辅助信息参与遥感影像分割的面向对象和无辅助信息参与影像分割的面向对象中,以作为对比。

图6 决策树分类规则

3 结果与分析

根据上述决策树分类规则, 通过统计得到的合理阈值对研究区进行分类, 最终得到3 种不同分类方法提取的苹果树种植分布结果(图7)。在空间上,3 种方法在北部和南部海拔较低的区域提取苹果树种植信息效果较为理想。栖霞北部和南部多为平原,其地势平坦, 苹果树种植区多为连片种植的大面积地块,种植面积比例较大;中部地区多为山地丘陵,特别是中东部山区,苹果树种植区地块较为破碎,由于受到地形及种植条件的影响, 大多种植在村庄附近或者地势坡度较缓区域,种植面积相对较少。从分类结果(图7)可以看出,栖霞苹果树种植分布存在差异性, 随着DEM 和坡度的增加苹果树种植区域呈现递减趋势,这与张迎萍等[31]对胶东山区苹果树种植适宜性分布的研究结果较为吻合。

为了定量地评估3 种分类方法的分类结果精度, 本研究采用实测样本点与在线高分辨率影像数据选取的混合样本点为真值, 采用混淆矩阵生成的生产精度和用户精度定量评估分类结果的精度(表2)。3 种分类方法中引入SLOPE 和FVC 参与影像分割的面向对象分类法(K1)精度最高,利用混合样本点验证的生产精度为87.3%,用户精度为90.3%,相较于其他两种分类方法(K2 和K3),K1 分类方法的生产精度提高了2.6%和10.1%, 用户精度提高了2.8%和10.1%; 利用实测样本点验证的生产精度为91.6%,用户精度为90.8%,相较于其他两种分类方法(K2 和K3),K1 分类方法的生产精度提高了2.4%和7.3%,用户精度提高了2.1%和5.4%。 由此可见,在山地丘陵地区,单纯依靠地物光谱信息并不能有效地提取苹果树种植信息。然而,通过引入辅助信息的面向对象决策树分类可以提高苹果树种植面积的提取精度,此外将辅助信息(SLOPE 和FVC)融合到遥感影像多尺度分割的面向对象决策树分类则可以进一步提高其提取精度。

表2 3 种分类方法的苹果树分类精度

图7 3 种不同分类方法提取的苹果树种植分布

此外, 通过将3 种分类方法提取苹果树种植面积结果与当地农业部门统计数据进行对比分析(表3) 发现,2 种面向对象决策树分类法提取苹果树种植面积精度要高于最大似然监督分类。其中,SLOPE和FVC 数据参与影像分割的面向对象分类法(K1)提取面积精度达到了94.1%, 相较于无辅助信息参与影像分割的面向对象决策树分类法(K2)和最大似然监督分类法(K3) 提取面积精度分别提高了0.3%和17.4%。

表3 3 种分类方法的苹果树面积提取精度

为了较好地比较上述3 种分类方法在研究区的效果和精度, 计算和对比分析了这3 种方法针对不同DEM 层苹果树种植分布面积的提取结果(表4)。针对K1 和K2 分类方法,这2 种方法提取的苹果树种植面积在3 种DEM 层(DEM≤150 m、150 m<DEM≤250 m 和250 m

表4 3 种分类方法分层提取苹果树面积比例

4 结论与讨论

面向对象决策树分类方法多用于高分辨率卫星影像,不仅可以避免基于像元分类的“椒盐现象”,同时可以融合多种辅助信息对目标地物进行提取。 针对山地丘陵地区, 本研究对比分析了基于GF-1/WFV 卫星影像的3 种苹果树信息提取方法,面向对象决策树分类中将植被覆盖度和坡度信息融入影像的多尺度分割,以DEM、坡度、光谱信息为辅助数据, 构建决策树模型对山地丘陵地区苹果树种植信息进行提取,苹果树种植面积提取精度达94.1%,生产精度达87.3%,用户精度达90.3%,相较于无辅助信息参与影像分割的面向对象决策树分类法和最大似然监督分类法提取面积精度提高了0.3%和17.4%,生产精度提高了2.6%和10.1%,用户精度分别提高了2.8%和10.1%。 说明基于国产高分辨率卫星GF-1 影像数据的面向对象决策树分类法通过引入目标地物自身特征及地形因素作为辅助分类信息, 一定程度上可以提高山地丘陵地区苹果树种植信息提取精度。

在山地丘陵地区,苹果树种植受到土地开发、水浇、管理等条件的限制,随着DEM 和坡度的增加,种植面积分布逐渐减小, 根据不同DEM 层苹果树种植分布的地形特点进行相应坡度阈值的设定,可有效的提高信息提取精度。 山地丘陵地区作物种植结构相对零散, 面向对象决策树分类虽然可以充分利用光谱和辅助信息, 但分割尺度太大或太小都会对提取结果有一定的影响,因此针对不同目标地物,确定最优分割尺度仍是今后研究的重点。

猜你喜欢
面向对象决策树苹果树
做一颗永远成长的苹果树
一种针对不均衡数据集的SVM决策树算法
面向对象方法在水蓄冷PLC编程中应用分析
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
苹果树
峰丛洼地农作物面向对象信息提取规则集
基于面向对象的车辆管理软件的研制与开发
基于肺癌CT的决策树模型在肺癌诊断中的应用
面向对象的SoS体系结构建模方法及应用