基于K均值聚类的棉田地膜无人机图像分割

2021-03-24 09:13朱松松陈至坤
现代计算机 2021年2期
关键词:棉田覆盖率阈值

朱松松,陈至坤

(华北理工大学电气工程学院,唐山063210)

针对基于无人机的棉田地膜分割研究较少的现状,以无人机低空拍摄的棉花播种期图像作为实验数据,分析图像中黑色地膜、土壤以及杂草等图像特点,发现地膜和周围环境颜色差异较明显,采用K均值聚类的算法分割出地膜区域。针对图像中杂草及阴影等干扰,通过图像去相关拉伸后,运用阈值法删除离群点。结果显示,K均值聚类对棉田地膜的分割效果优异,识别率为99.13%,满足棉田地膜分割的要求。此研究为棉田残膜的识别以及覆盖度对棉田生产的影响提供方法和参考。

地膜;聚类;图像分割;K均值;去相关拉伸

0 引言

地膜覆盖栽培技术是从20世纪中叶发展起来的广泛应用于农业生产的农艺技术,1978年从日本引进以来在我国迅速得到了推广使用,现在地膜覆盖技术已经广泛应用到多种经济作物和粮食作物的生产之中。根据颜色,地膜主要分为透明、白色、黑色,都有增温保墒,减少水分流失的作用。黑色地膜虽然在增温方面稍逊于其他颜色地膜,但它能够很好地抑制杂草的生长,减少了除草剂使用带来的生产成本[1],从而得到了广泛应用。地膜的应用大大提高了农作物的产量,但是随着废膜越来越多的残留,对耕地、村庄造成了严重的污染[2]。因此对棉田地膜覆盖技术的研究,主要可分为增产效益和环境效应,如田间不同地膜、不同覆盖方式、不同覆盖时间、不同覆盖度等相关参数对比。而野外调查耗费人力、物力,且难于保证准确性和实时性。因而,随着无人机(Unmanned Aerial Vehicles,UAV)和传感器技术的不断提高,田间影像数据的获取方式也更加多样化[3],无人机平台具有效率高、成本低、操作灵活、更适合复杂农田环境等特点[4],在田间影响数据的获取领域得到广泛应用。

图像分割是根据一定的规则,将图像中的不同性质的区域分开,提取感兴趣的区域,是图像识别、场景解析、对象检测等任务的预处理[5]。有研究者把图像处理技术运用于地膜识别,梁长江等人[6]对垂直拍摄的6叶期单垄单行烟田图像进行研究,通过对比多种阈值分割方法,应用迭代阈值分割算法对地膜分割识别,地膜最高识别率到达80.06%,阈值分割在田间存在各种干扰时,容易出现误分割情况。朱秀芳等人[7]应用融合监督分类和图像形态学算法的覆膜农田提取方法,进而通过面积阈值分割法获取高精度的覆膜农田分布信息,这种方法从宏观尺度上分割覆膜农田区域,未对覆膜农田中的地膜进行分割和识别。张航[8]基于对高光谱影像的研究,提出了一种地膜多波段均值图像的分割方法,AOM值达到0.6439,这种方法为对夹杂在棉花里的地膜的识别方法研究,而非棉田中的覆膜。哈斯图亚[9]分别开展基于单时相和多时相多特征的地膜覆盖农田遥感识别,实现地膜覆盖的农田识别,此方法应用的是Landsat-8卫星数据,在时效性方面有很大不足。

为了对地膜覆盖技术使用进行科学规划管理、更好地发挥地膜覆盖技术的积极作用、减轻负面影响,准确获取棉田地膜覆盖率具有重要的理论和实践意义。针对以上地膜的研究现状,本文提出了一种基于K均值聚类的棉田地膜分割算法,为棉田中地膜的分割和识别提供了理论依据,为棉田中残膜的污染评估以及地模覆盖度对棉花生长的影响提供了方法,为棉田苗行检测提供参考标准。

1 材料与方法

1.1 研究区域概况

试验区棉田铺设地膜为黑色,膜宽为80cm,棉田为1膜2行,膜距大约40cm,采用先铺地膜后在膜上开孔播种的方式。

1.2 图像获取及实验平台

图像获取设备为大疆无人机-精灵系列-3Profes⁃sional,飞行器重量1280g,风速5m/s以下飞行,飞行器机身配备GPS模块和视觉定位系统,视觉定位系统高度测量范围为30cm至300cm,GPS模块需GPS卫星信号良好。

相机配备1/2.3英寸CMOS影像传感器,有效像素1240万,CMOS尺寸比例为,4:3,传感器宽度为5.565mm,高度为4.174mm。镜头为FOV 94°,20mm(35mm格式等效),f/2.8,对焦无穷远。照片最大分辨率为4000×3000。

图像处理硬件平台为笔记本电脑,型号戴尔N5110,处理器为Intel Core i5-2410M CPU@2.3GHz,运行内存为6.00 GB,操作系统为Windows 7旗舰版。图像处理和分析软件平台为MATLAB 2018b,手动分割图片软件为Photoshop CS6。

1.3 图像数据分析

图像拍摄于2020年4月23日,天气多云无风,无人机飞行高度为5m,拍摄图片20张,拍摄时期为已经播种未出苗。从20张图片中选取6张图片进行处理,分别为棉田前段2张,中段2张,后段2张,如图1所示。图像中内容主要有:黑色地膜、土地、地膜上覆盖的土、剩余残膜、绿色杂草,部分土块和遗留的玉米秸秆存在阴影。图2为图像中存在的部分干扰,图2-a中为土地裂缝,图2-b为杂草,图2-c为玉米秸秆,图2-d为土块及其阴影。

1.4 图像分割算法

图像分割是图像识别和图像理解的预处理,主要是将图像中感兴趣的区域分割出来,为后续高级任务的处理提供技术前提。彩色图像分割方法主要分为:基于阈值的分割方法、基于聚类的分割方法、基于区域的分割方法以及基于特定理论的分割方法[10]。基于阈值的分割[11-12],多应用于灰色图像或将图像从RGB颜色空间转化成其它颜色空间,然后对各分量分别进行处理,主要目标是找到一个最佳阈值。基于聚类算法的分割[13-14],需要先确定类的数目,然后根据选定的类以随机确定各类的初始聚类中心,属于无监督分类方法。基于区域的分割方法[15-16],对噪声比较敏感,且目标较大时分割速度较慢。特定图论的分割[17-18],首先需要把图像映射为图(Graph),然后根据不同的分割准则实现图像的分割。

棉田中地膜与周围土地颜色区别很大,肉眼可识别,因此可以通过聚类的方法进行分类。但图2中杂草、阴影等与地膜颜色相近,容易出现错误的分类,需提前处理离群点。在图像分割领域,K均值算法由于其原理简单,计算效率高,得以广泛的运用。

图1 实际拍摄图像

图2 棉田中干扰

2 结果与分析

2.1 图像分割方案

文中采用Photoshop软件中魔棒工具,容差为20,通过目视解译的方法对图像中地膜进行选取,并计算出地膜的覆盖率,以此覆盖率作为评价图像分割算法效果的标准。

通过对棉田地膜图像的分析,使用图像去相关拉伸进行图像增强,然后通过阈值法删除大区域的离群点,再用聚类算法进行图像分割及形态学的开闭操作删除小区域干扰,最后得到棉田地膜的覆盖率。基于以上信息,本文提出了棉田地膜分割方案总体框架如图3所示。

图3 图像分割总体框架

2.2 图像预处理

为了提高分割精度,先对原图像进行预处理,通过去相关拉伸达到图像增强的效果。去相关拉伸[19-20](Decorrelation Stretch)是一种常用的图像增强方法,该方法能够保留原图像中的色彩信息且失真程度较低。其主要原理是放大图像中相关程度低的信息,从而提高生成图像的饱和度。去相关拉伸的步骤分为以下几部分:首先对原始图像进行坐标变换,然后对变换后的图像进行部分拉伸来放大某一部分的信息,最后通过坐标逆变换恢复图像。图像去相关拉伸后图像如图4所示。

图像去相关拉伸后,图中杂草显示为绿色,土块间纹理显示为红色。通过阈值法分别删除区域性绿色和红色,并用背景色填充,如图5所示。经过以上预处理后,区域性干扰被删除,图中剩余部分为地膜和土地,将此图像输入给聚类算法进行图像分割。

图4 图像去相关拉伸

图5 图像删除离群点

2.3 K均值聚类算法

K均值(K-means)[21-22]算法是基于样本集合划分聚类算法,其基本思想是,将样本集合划分为k个子集,构成k个类,将n个样本分到k个类中,计算出类中样本到其所属类的中心的距离,将所有距离求和并使其最小,K均值聚类的策略就是通过最小化损失函数,从而得到最优的划分。

样本到类中心的距离,采用的是欧氏距离的平方,如式(1):

作为中国的数学教师,可以为自己积极参与了这些年来的课改实践,以及自身的专业成长感到自豪;当然,在这方面又应说还有很长的路要走,大家应继续努力.

其中为xi和xj为样本空间中的两个样本,m为样本的维度,d(xi-xj)为样本xi和xj之间的欧氏距离。

样本与其所属类的中心之间的距离的总和为损失函数,如式(2):

形态学操作一般作用于二值化图像,来连接相邻的元素或分离成独立的元素,腐蚀和膨胀[23]是图像形态学中的基本操作。在聚类分割后,应用3×3方形结构元素对二值图像进行腐蚀和膨胀,平滑掉二值化图像中的细小干扰,保留大区域的地膜区域,分割后图像如图6所示。

图6 K均值分割二值图

2.4 分割数据分析

将应用Photoshop分割和K均值聚类算法分割出图像的覆盖率统计如表1和图7所示,计算方法如式3和式4。其中fp为Photoshop手动分割覆盖率,fk为K均值分割覆盖率,fε为覆盖度误差率,fˉ为平均覆盖率,n为样本数。文中以棉田前段、中段、后段各取两张图像进行处理,以平均覆盖率fˉ作为评价分割效果的优劣的标准。

表1 覆盖率数据表

图7 覆盖率统计折线图

分别对比图1和图7中的各张子图,发现棉田中的地膜区域已经全部分割出。从表1中覆盖度误差率可以看出,K均值聚类可以有效分割出地膜区域大部分区域,但与手动分割值存在上下波动。分析是由于应用Photoshop手动分割,存在人为主观因素,在地膜上覆盖些许薄土及地膜边缘处,人员会存在过分割和欠分割情况,但是多张图像的平均覆盖度较接近实际覆盖度,满足对地膜的分割及覆盖率获取的要求。

3 结语

综上,通过实验效果图的对比,K均值聚类可以实现棉田地膜的图像分割,聚类前对离群点的处理是实现地膜有效分割的关键一步。在大块棉田中进行地膜分割时,利用平均覆盖度进行统计时K均值聚类效果优异。

在棉田图像分割中,存在地膜上覆盖极少数土壤等情况,制定相关地膜分割尺度标准是一个重要方向。K均值聚类在黑色地膜分割中取得了较优异的效果,但未对白色地膜、透明地膜等进行研究,如何提高地膜分割算法的适用性及效率仍是努力的方向。

猜你喜欢
棉田覆盖率阈值
民政部等16部门:到2025年村级综合服务设施覆盖率超80%
非平稳声信号下的小波变换去噪方法研究
土石坝坝体失稳破坏降水阈值的确定方法
非均匀光照下文本图像分割算法研究
扁桃棉花间作对棉田牧草盲蝽发生与为害的影响
电信800M与移动联通4G网络测试对比分析
利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰
基于移动GIS的棉田朱砂叶螨预警系统
走失的棉田
覆盖率