孟启凤,卢小平,张向军,于海坤,李国清,朱梦豪
(1.河南理工大学 自然资源部矿山时空信息与生态修复实验室,河南 焦作454150;2.河南省遥感测绘院,河南 郑州 454003)
遥感技术由于具备观测范围大、时效性高等优势,可作为研究农作物分类和提取农业种植结构的重要手段[1]。
目前,使用遥感技术进行地物分类的研究较多,常用的影像分类方法按照处理单元分为2类:基于像素分类(Pixel-based Image Classification,PBIC)与面向对象分类(Object-based Image Classification,OBIC)[2]。其中PBIC方法应用广泛,Toll[3]和Martin等[4]于20世纪80年代使用多光谱扫描仪(Multi-spectral Scanner,MSS)、专题制图仪(Thematic Mapper,TM)和Spot卫星获取同一研究区的影像并使用PBIC进行信息提取,结果表明随着影像空间分辨率的提高,PBIC方法并不能得到更高的分类精度。除此之外,该方法只能利用像素信息,无法获取邻近像元信息,在分类后会导致“椒盐现象”。OBIC方法则可以克服以上缺点,通过弥补PBIC导致的语义信息损耗,实现较高层次的遥感影像分类和地物提取。类似研究也表明,OBIC方法在中、高空间分辨率影像分析上有更好的效果[5]。随着高分辨率影像的普及,OBIC方法的相关研究增加,自20世纪70年代以来,国内外利用OBIC方法进行了大量的研究,已将其应用于土地利用分类、道路提取和树种识别等[6-9],但在农作物精细分类方面的研究较少。
影像分割是OBIC的基础,主要包括3种模式:单时相影像分割、多时相影像组合分割和多时相影像分别分割[10]。分别分割会造成影像子对象边界不对应的现象,从而无法建立空间联系,应用范围受限,这里不再介绍。单时相影像分割是使用最多的分割模式,在该分割模式基础上已进行甘蔗识别、水稻提取和作物分类等研究[11-12],但应用场景有限,仅适用于地物变化缓慢、地物类型单一的场景。多时相组合分割则可以弥补单时相影像分割的不足,该分割模式的问题主要集中在参与分割波段的选取上,一般多时相组合分割是机械地将多时相影像的光谱波段叠合后分割,没有考虑到多个波段之间的相关性与互补性。为充分利用遥感影像中的隐藏信息,可以通过多个波段的运算和组合,挖掘新的特征波段参与分割,同时也可对参与分割的波段进行选择,避免高度相关的波段同时参与分割导致算力消耗。自1999年以来,国内关于多特征参与影像分析的研究逐渐增多,骆剑承等[13]和陈秋晓等[14]通过研究表明基于多特征的遥感影像能够引入除光谱特征之外的时相特征与空间特征,特征选择和特征组合意味着更多领域知识和规则融入分类过程,可以提高影像分析的智能化程度。但PBIC方法的作用对象是像素,无法通过空间特征进行影像分析,与之相比,OBIC方法可凭借影像对象充分利用各类特征,在影像分析上更具优势。
本研究以开封市通许县为研究区,以哨兵2号影像作为数据源,基于随机森林算法对多个时相的影像特征进行优选,利用多尺度分割算法将优选特征在对象层面进行融合,进行多时相影像组合分割优化,并统一不同时相影像的分割尺度,在此基础上使用OBIC方法进行农作物识别,探究多时相影像组合分割优化后的表现,以及OBIC方法在农作物种植结构监测方面的可行性。
本文选择开封市通许县作为研究区,以 2020年2月22日的哨兵2号真彩色影像描述概况,如图1所示。该地年平均气温14.6 ℃,年平均降水量658.4 mm,年平均风速1.8 m/s,主导风向为东北风。地势平坦,种植结构复杂,除了连片种植冬小麦、花生、棉花、玉米和红薯等农作物,大蒜、西瓜、辣椒和胡萝卜等经济作物,还存在大量间作套种,其中通许县中南部为优质专用小麦优势区,西北部以种植胡萝卜和反季蔬菜为主,东北部以种植大蒜为主。
图1 研究区位及其哨兵2号影像
1.2.1 卫星遥感数据
从欧洲航天局官网获取哨兵2号影像的L2A级产品作为数据源,并剔除云量高于5%遥感影像,成像时间分别为2019年12月4日,2020年2月22日,2020年3月23日,2020年4月22日以及2020年5月22日。
1.2.2 野外调查数据
2019年12月21日到研究区展开实地调查,使用手持GPS采集样本。采集时遵循空间上均匀分布的原则,后期根据实际采样成果,利用高分影像进行目视解译,补充样本数量,最终的样本状况如表1所示。
表1 研究区样本详情
以哨兵2号影像为数据源,从多时相影像中提取光谱、纹理和植被指数等特征波段;使用随机森林算法进行特征选择,将优选波段合成多特征影像后分割,并应用OBIC;最后与最佳单时相影像分割、多时相影像组合分割后的OBIC结果进行比较,验证本文提出方法的有效性。技术路线如图2所示。
图2 技术路线
本文通过对研究区不同时相哨兵2号影像的原始光谱波段进行组合运算获取特征波段。其中归一化植被指数(Normalized Difference Vegetation Index,NDVI)是描述生物量主要参量,但其对植被茂密区敏感度较低,而增强植被指数(Enhanced Vegetation Index,EVI)可弥补其不足,于是从各时相影像中分别提取NDVI,EVI,裸土指数(Bare Soil Index,BSI)共15个指数。纹理信息是对影像局部信息的描述,对地物识别起重要作用。本文使用灰度共生矩阵对各时相影像经主成分变换后的第一主成分进行运算,提取各时相影像包括均值、方差、同质性、对比度、非相似性、相似熵、角二阶矩和相关性等共40个纹理特征作为初始波段,再引入各时相影像的原始光谱波段,共获取115个波段。初始波段之间的相关性如图3(a)所示。
(a)初始波段相关性
由图3(a)可以看出,波段之间存在相关性和互补性,如果影像某些波段之间存在高度相关,分析所有波段是不必要的。这就需要对参与组合分割的所有波段进行优选,使优选出的波段既能保留多时相遥感影像的主要信息,又能使参与分割的波段数量得到有效精简,提高分割效率[15]。这里使用随机森林算法对所有波段进行选择[16],详细步骤如下:
假设有N个训练样本:
① 当n=1,创建决策树Tn,记袋外数据(Out of Bag,OOB)为LOOBn。
④ 对于n=2,3,…,N,重复步骤①~③,计算所有波段。
(1)
由上可知,波段Xf变化引起的袋外误差越大,表明波段Xf具有越高的重要性,最后将特征波段重要性与分类精度结合确定优选波段的数量。
图像分割效果是OBIC关键,利用单一尺度分割影像可能会造成分割过剩或欠分割的情况,很难完整反映对象特征。佃袁勇等[17]的研究表明多尺度分割效果更好,可以更全面、更完整地描述地理对象。这里采用分形网络演化算法(Fractal Net Evolution Approach,FNEA)进行多尺度分割,在分类之前,需要根据研究区域地物块状特征调整图像分割尺度,本文借助ESP尺度评价工具选取最佳分割尺度。除了分割尺度之外,多尺度分割时,形状因子与紧致度因子对分割效果的影响是不可忽略的[18]。但紧致度因子与形状因子无法通过具体公式选定,只可通过多次实验比较分割结果发现二者之间的规律性。
JM(Jeffries-Matusita)距离是一种基于条件概率之差的光谱可分性度量标准。本文使用JM距离通过判断样本点在各时相影像中的分离性选取最佳单时相影像。当样本之间的JM值大于1.9,小于等于2.0时,认为样本之间可分离性高,该影像为最佳单时相影像。JM距离求解方法为:
JM=[2(1-e-B)]1/2,
(2)
式中,B表示巴氏距离,计算公式为:
(3)
式中,m1和m2为2个类别的某特征均值;σ1和σ2为2个类别的某特征标准差。
随机森林算法不仅用于对高维数据进行特征重要性排序,还可用于影像分类。该算法通过在数据样本上集成多个决策树,然后从少量样本中学习投票规则,最后通过投票决定地物的最终归属类型,并且集成决策树思想使随机森林分类算法具有很高的稳定性,不易出现过拟合现象。
通过随机森林法求得各特征波段重要性并进行排序,结果如图4所示。
图4 特征波段重要性
后续将特征波段重要性与分类精度结合确定优选波段数量。经多次实验表明,当特征波段数量达到一定程度之后,分类精度随波段数量少量增加变化不明显,以10个特征波段为单位递增,不仅可以明显观察到总体分类精度随波段数量增加时的变化趋势,决定优选波段数量,还可以避免不必要的算力消耗。
本研究从特征波段重要性排序结果中选取重要性靠前的10个波段为基础,按重要性依次增加10个波段进行合成,并分别对具有不同波段数量所合成的多特征影像进行分类,把总体分类精度与Kappa系数作为选取多特征影像的重要参考,进而以该多特征影像所包含的波段作为优选波段。分类精度详情如图5所示。
图5 多特征影像分类精度随特征波段数量变化情况
就分类精度来看,前10个波段合成的多特征影像分类精度较由更多波段合成的多特征影像低,前30,40,50个波段合成的多特征影像,分类总体精度与Kappa系数较高且相近,综合考虑运算效率与后续分类精度,最终从115个波段中选取重要性靠前的30个波段作为优选波段参与多时相影像组合分割,优选波段详情如表2所示。优选后波段相关性如图3(b)所示,可以看出,与初始波段相关性相比优选波段相关性明显降低。
由表2可以看出,从波段类型来看,光谱波段在优选波段组合所占比重最大,贡献个数为22个,植被指数次之,贡献个数为7个,纹理特征最少,该结果与文献[19]的研究成果相符,即研究所使用的影像空间分辨率相对于亚米级遥感影像来说,纹理信息不够丰富,其扰动对分类精度影响较小,对优选出来的波段组合贡献薄弱。从时间维度来看,4月份获取的影像贡献的波段数量最多,3月份次之,其他月份最少且贡献度相似。
表2 优选波段详情
借助ESP插件所得受试者工作特征(Receiver Operating Characteristic,ROC)曲线去分析最佳分割尺度。采用控制变量法,以步长为0.1进行多次实验,确定紧致度因子与形状因子。最终得到的多尺度分割参数如表3所示。
表3 影像分割参数详情
由JM距离计算出各地物之间的可分离性状况如表4所示。由表4分析可以看出,冬小麦与大蒜的光谱信息在多数时期都相互干扰,可分离性较弱,与菜地及其他地物的可分离性在2—4月则较好,综合考虑各时相影像中地物样本的可分离性以及对特征优选子集的贡献程度,选取4月份影像为最佳时相影像。
表4 样本光谱可分性状况
实验将样本按照3∶7的比例随机分为训练样本和验证样本,将训练样本输入随机森林分类器中学习,再将学习过的随机森林分类器分别应用于经统一分割尺度分割后的最佳单时相影像、多时相影像和优选波段合成的多特征影像,并基于样本分类结果的混淆矩阵进行精度评价,评价结果如表5所示。经混淆矩阵验证得,本文提出的方法分类总体精度为86.02%,Kappa系数为0.792,较单时相影像分割后的OBIC分别提高6.36%和8.37%,整体精度得到了提升,较多时相影像组合分割模式下的OBIC分别提高了0.25%,0.47%。总体而言,本方法优于单时相影像分割模式下的OBIC和多时相影像组合分割模式下的OBIC。
表5 基于样本分类结果的混淆矩阵
3种分割模式下的分类结果如图6所示。由图6对比结果可以看出,单时相影像分割模式下的OBIC结果存在大蒜与菜地混分现象,种植结构边界模糊,按照本文方法得到分类结果不仅精度高,而且与通许县的农业种植结构更相符。
(a)最佳时相影像分类结果
与单时相影像相比,多特征影像更丰富的地物信息使得最终的分类精度高于单时相影像。虽然多时相影像分类效果与多特征影像差距甚小,但是多特征影像仅用30个特征波段参与分类就可以达到多时相影像60个波段参与分类的效果,证明该优化方法兼具效率与精度。本文所用波段是根据研究区地物特点选取,受地域及地物覆盖类型限制,后续研究将增加其他种植结构或其他地区的分类实验以进一步验证该方法的适用性。