面向对象和多分类器的棉花出苗信息快速提取方法

2021-03-08 06:17闫春雨赵静兰玉彬鲁力群杨东建温昱婷
关键词:面向对象分类器尺度

闫春雨,赵静,兰玉彬,鲁力群,杨东建,温昱婷

(1.山东理工大学 农业工程与食品科学学院,山东 淄博 255049;2.山东理工大学 国际精准农业航空应用技术研究中心,山东 淄博 255049;3.山东理工大学 交通与车辆工程学院,山东 淄博 255049)

棉花作为中国重要的经济作物之一,在国民经济中有着举足轻重的地位,与其他大宗农产品相比有一定的收益优势[1]。作物的出苗期是其生长的初始物候期,也是其关键物候期之一[2]。棉田中若出现棉苗弱小或缺苗断垄会严重影响棉花的品质与产量。苗期管理是棉花经营管理的核心,快速提取棉花出苗信息可为苗期管理提供指导。传统获取棉花出苗信息的主要手段是靠实地调研测量,以人的主观判断与个人经验为主,对于大面积的棉田来说耗时费力、判别准确率与精确性较低。

无人机具有机动灵活、响应快、高分辨率、更新速度快等优势。遥感技术具有获取信息快、覆盖面积大、获取成本相对低等优势。无人机遥感技术作为新的信息获取手段已越来越多地用于农作物氮含量、植被覆盖度和作物产量等信息的获取[3]。精准农业的迅速发展要求更准确、快速、低成本地获取各种作物生长信息。李明等[4]利用多尺度分割对水稻种植面积进行提取,与目视解译结果相比面积误差小于3.5%。雷亚平等[5]利用HIS阈值法对无人机获取的低空棉田数字图像进行棉苗识别,精度超过90%。魏文丽等[6]利用NDVI均值及均方差对研究区玉米出苗情况进行提取,总体积精度达80%。董梅等[7]利用面向对象方法对无人机拍摄的烟草遥感影像进行种植面提取和监测,为大区域的烟草种植面积监测提供了参考。面向对象的无人机遥感影像在棉花苗情信息方面的提取研究鲜有报道。本研究利用无人机拍摄的棉苗正射图像,通过面向对象的分类思想,采用机器学习分类器快速提取棉花苗期出苗信息,提取结果可为苗期管理提供及时的参考。

1 材料与方法

1.1 研究区概况

研究区地处冀鲁豫三省交界处(如图1所示),属黄河下游冲积平原。试验小区地势平坦,土地肥沃,土质以沙壤为主,属典型的温带大陆性季风气候,年平均降水量为600 mm左右,年平均日照时数2 629.7 h,年平均气温为12.8 ℃,年无霜期平均206 d,非常适宜棉花生长,为黄淮流域棉花生态区的典型代表。

图1 研究区位置与研究区分布Fig.1 Location and distribution of research area

1.2 数据获取与处理

本研究数据于2019年5月20日在山东棉花研究中心(临清棉花试验站)采集。数据获取的设备为深圳市大疆创新科技有限公司生产的Mavic 2无人机,该无人机将可见光相机与三轴增稳云台设计于一体,保证了高质量图像的获取。无人机重量为907 g、展开尺寸322 mm×242 mm×84 mm、最长飞行时间31 min(无风环境25 km/h匀速飞行)、最远续航里程18 km(无风环境);相机使用的传感器为1英寸CMOS、有效像素2 000万,最大照片尺寸5 472×3 648。拍摄时无人机飞行高度为30 m,航向重叠率与旁向重叠率均为85%。拍摄时间为当天的12:00-14:00,天气晴朗,相机曝光模式为自动。

本研究借助Pix4Dmapper软件对无人机获取的高清影像进行拼接处理。将带有POS数据的原始影像与地面控制点数据导入,便可自动完成空三测量,生成DSM、DOM,拼接过程中可以使用GPU加速处理。航拍前在无人机飞行区域内设置50 cm×50 cm几何参考板(如图2所示),几何参考板由两块黑色布和两块白色布十字相间粘贴而成,几何参考板在棉花整个生长周期内是保持固定不变的。几何参考板的中心点为地面控制点,为后期影像拼接时提供参考,用以提高影像拼接精度,降低相机的系统误差。

图2 几何参考板Fig.2 Geometric reference board

2 研究方法

无人机拍摄的影像具有空间分辨率高和色彩鲜明的特点,高分辨率影像能够更清晰地表达地物拓补关系、纹理和形状等特征[8]。在高分辨率影像的分类中,面向对象的分类方法有着广泛的应用。本研究使用的是只有红、绿、蓝3个通道的JPEG图像,只采用基于单个像元光谱信息对地物进行分类会造成分类精度不高,对遥感图像处理带来不利影响。通过面向对象的分类方法,不仅利用单一像素的光谱信息,而且能充分利用遥感影像的形状、大小、纹理以及上下文联系等特征,可以更好地提取遥感影像中的有效信息,进而提高分类的精度[9]。在本研究中通过采用基于面向对象的分类方法,将棉花、地膜和土壤进行分类。因为分类中包含棉花,所以在三种地物信息分类完成的同时也就完成了棉花出苗信息的提取。数据处理软件使用eCognition Essentials,分割算法采用多尺度分类算法,技术路线如图3所示。

图3 技术路线Fig.3 Technical route

2.1 面向对象分类的思路

面向对象的遥感影像分析技术在地理信息科学与遥感领域取得了突出的成绩,尤其是对高分辨率遥感影像的处理效果更佳。多尺度分割的目的是把遥感影像分割成影像对象,若干个满足一定同质标准的基本像元单元组成了具有多边形区域的影像对象。利用eCognition Essentials软件进行面向对象分类分析,首先在经任一尺度分割后生成初始影像对象,该软件能够生成多个层,并把这几个层进行组织形成等级结构,生成的第一个对象层的下限是像素层,上限是整幅影像。后续新产生的影像对象层,可以放在已有层的上层、中间层或下层。在这个具有拓补关系的网络结构中,每一个对象都知道自己的子对象、父对象和相邻对象。比如,子对象的边界是由父对象决定的,子对象的总和决定了父对象的区域大小。对象层的层次结构展示的不同尺度的影像对象信息,对象层次结构如图4所示。

图4 影像对象层次结构Fig.4 Image object hierarchy

2.2 多尺度分割

影像分割质量的好坏直接影响后期分析处理的结果。影像分割是基于对象影像分析的关键和基础,后续的影像分析对分割出的影像对象有严格的要求,使分割出来的对象同时具备非连续性和相似性两大特征,非连续性是指影像对象区域边界处特征不连续,相似性是指影像对象内的所有像素都基于色彩、纹理、灰度等满足某种相似性准则[10-12]。eCogniton Essential软件能够进行任意分辨率的区域合并算法,因此需要设置合理的分割尺度参数来控制合并算法的阈限,从而满足提取不同尺度地物的需要。

对于遥感影像的分类、信息提取等操作来说,前期的影像分割是极其重要的。如果只是单一提取棉花这一类别,则不能最大可能地排除错分(棉花类别被错分到土壤类别或地膜类别)和漏分(土壤、地膜中应该为棉花类别却没有分到棉花类别中),所以本研究中分类对象为土壤、地膜与棉花三类。常用的分割算法有四叉树分割、多尺度分割、多阈值分割等。本研究采用多尺度分割算法,分割算法的主要参数包含分割尺度、形状因子和紧密度等[13]。具体为形状与颜色权重相加为1,形状特征包含紧密度与光滑度,两者权重相加也为1。在选择分割尺度时可根据目视解译结果进行调整。分割参数设置如图5所示。

图5 分割参数设置Fig.5 Segmentation parameter settings

在eCogniton Essential软件分割设置中选择基于对象的区域生长分割算法。由于出苗放苗后的棉苗较小,分割尺度采用5比较合适。除分割尺度外,还需设置形状、颜色因子、紧致度、光滑度因子,来保证分割的结果不至于太破碎。在清晰分割出棉苗的同时,还要使地膜、土壤对象与棉苗对象形状差异尽可能地大。经过多次尝试与可视化调节,最终颜色/形状设置为0.9,光滑度/紧致度设置为0.9。分割结果如图6所示。

图6 分割结果Fig.6 Segmentation results

2.3 机器学习模型

机器学习是从已知的实例中自动发现规律,来对未知实例建立预测模型。机器学习分类器,既可用于像素级分类,也可用于影像对象分类。相对基于像素的训练,基于对象的机器学习分类方法需要更少的训练样本,一个样本对象可以包含很多的典型的像素样本。本研究采用朴素贝叶斯(NB)、K最邻近分类(K-NN)、支持向量机(SVM)、决策树(CART)和随机森林(RF)。

3 结果与分析

3.1 精度验证

对遥感信息提取完成之后,分类结果的好坏影响着分类结果的可信性与可利用性,通常使用精度评价来评判遥感影像分类结果的好坏。分类的精度是用分类结果与地面实测值、数据等,比较与实地的吻合程度。遥感信息提取的过程中,精度评价是非常重要的一个步骤,是对整个信息提取的评价。

在以总体分类精度为主的前提下,用户精度和生产者精度两者均越高则分类结果越好,综合三种分类精度评价来确定最佳分类器。本研究中精度验证采用目视解译分类结果与五种机器学习分类器的分类结果进行验证,用户精度和生产者精度都是研究中进行定量评价的重要指标。由表1和表2中可以得出总体分类精度较高的三种分类器分别为支持向量机、K最邻近和朴素贝叶斯。在表1中,朴素贝叶斯分类器对三种类别的生产者分类精度都非常高,但因生产者精度实际上是一种分类结果制图的衡量方法,他仅可以说明分类结果满足参考分类的程度,却不能给出一个分类a的像素确实是属于a的可能性。这时候可以使用用户精度来进一步确定估计的可能性。在表2中可以看到朴素贝叶斯分类器分类的结果中,棉花这一类精度是非常低的,综合表1和表2可以确定朴素贝叶斯分类器不是最佳分类器。在剩余的两个分类器分类结果的比较中,可以得出支持向量机分类器是面向对象分类提取棉花出苗信息的最佳分类器。

表1 五种分类器生产者精度对比Tab.1 Comparison of producer precision of five classifiers

表2 五种分类器用户精度对比Tab.2 Comparison of precision of five classifiers

3.2 总体苗情分析

利用本文提出的方法对研究区无人机影像(图7)进行自动分类,将最佳分类器分类结果中的棉花类别进行提取导出(图8),按实际种植面积折算出研究区地块的平均种植株数为5 250 株。在提取的棉花类别中,面积小于2 cm2的对象算为弱苗。本研究最佳分类器-支持向量机识别出棉花的出苗数、弱苗数分别为4 539株、921株,目视解译的出苗数、弱苗数分别为4 362株、812株,最佳分类器识别与目视解译出苗数与弱苗数一致性都较好。从表3中可以看出支持向量机与目视解译的出苗率一致性比较好。本研究的快速提取体现在对大范围的棉田内某一研究小区进行分割、分类、提取出苗信息之后,可以将分类参数及规则进行移植到其他棉田区域,完成整个棉田范围的棉花出苗信息快速提取。

图7 无人机拍摄的大田棉苗原图Fig.7 Original picture of field cotton seedling taken by UAV

图8 面向对象分割分类棉苗结果图Fig.8 Results of object-oriented segmentation and classification of cotton seedlings

表3 SVM与目视解译提取苗情比较Tab.3 Comparison between SVM and visual interpretation to extract seedling situation

4 结论

与传统的棉花出苗信息提取相比,无人机遥感具有数据获取灵活方便、提取精度高、成本较低等优势,对大范围的棉花出苗信息提取具有十分大的潜力。本研究基于高分辨率可见光无人机影像,通过面向对象的分类思路,选取合适的阈值进行多尺度分割,采用常用的机器学习分类器进行分类,提取棉花出苗信息,并通过对比分析得出以下结论:

1)采用基于面向对象的分类思想,提取高分辨率无人机影像中棉花出苗信息,五种分类器总体精度都比较高,表明无人机遥感技术在提取棉花出苗信息方面是可行的。

2)通过五种分类器分类结果对比可知,支持向量机分类器无论在用户精度方面还是在生产者精度方面,都具有很高的分类精度。可以将最优分类分割参数应用到整个棉花种植区域,完成棉花出苗信息提取。

猜你喜欢
面向对象分类器尺度
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
环境史衰败论叙事的正误及其评判尺度
基于深度学习与融合地形特征的黄土陷穴面向对象提取方法
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
基于AdaBoost算法的在线连续极限学习机集成算法
基于Web的科研项目管理系统的设计与实现
以长时间尺度看世界
9