陈道颖+张娟+黄国强+杨鹤猛+郭亮+刘金玉
摘要:传统烟草(Nicotiana tabacum L.)数量清点工作主要依靠人工现场抽样的方式,这种方法费时、费力且统计误差较大。针对这一缺点,提出一种基于航空可见光图像处理的烟草数量统计方法。利用无人机所获取的高分辨率影像,采用K-means聚类方法对烟田图像进行图像分割分类,提取图像中绿色植物部分,提取颜色、面积、长宽比等简单特征对杂草进行预剔除,通过构建烟株与杂草样本库,利用灰度梯度共生矩阵,提取其灰度平均、梯度均方差、相关、惯性等4种特征参量,并基于BP神经网络算法进一步对杂草进行识别,剔除杂草,统计烟株,提取连通域数量,即为烟株数量。
关键词:烟草(Nicotiana tabacum L.);数量统计;航空遥感;可见光图像;神经网络;杂草剔除
中图分类号:S572;S127 文献标识码:A 文章编号:0439-8114(2017)07-1348-03
DOI:10.14088/j.cnki.issn0439-8114.2017.07.038
A Statistic Method for Tobacco Based on Airborne Images
CHEN Dao-ying1,ZHANG Juan2,HUANG Guo-qiang1,YANG He-meng2,GUO Liang1,LIU Jin-yu2
(1.Ningxiang Branch of Changsha Tobacco Companies,Changsha 410600,China;2.Tianjin Aerospace Zhongwei Data System Technology Co.,Ltd.,Tianjin 300301,China)
Abstract: Traditionally, the work of counting the number of tobacco has to mainly rely on the artificial method. This method is time-consuming and brings large errors. In response to this shortcoming, a method based on aviation visible images was provided. In this method, the images acquired by UAVs, are first segmented based on K-means clustering algorithm to extract the green parts. Remove the weeds initially by features, such as colors, area and aspect ratio. Then, characteristic parameters are extracted by the gradient co-occurrence matrix. Recognize the weeds based on the BP neural network, taking the characteristics as the entrances. In this way, the integral tobacco can be obtained. Finally, compute the number of connected domains in the image and take it as the number of tobacco plants.
Key words: tobacco(Nicotiana tabacum L.);counting;airborne remote sensing;visible images;neural network;weeds removing
近年來,遥感技术已经越来越多的应用于农业领域,主要涉及农作物种类、种植面积及分布范围的统计分析。利用遥感影像可实现对各种农作物种植面积的快速监测,便于各部门及时掌握每年作物种植情况,从而为政府采取相关农业管理措施提供决策依据。
烟草公司在烟草种植过程中,需对烟草数量进行严格控制,以便于对烟草市场进行管理,因此,烟草公司通常在烟苗移植初期对单位面积的烟草种植数量进行抽样统计。目前,烟草清点工作主要依靠工作人员现场抽样的方式,这种方法费时、费力,工作效率较低,已无法满足烟草公司快速、及时监控烟草种植情况的需要。由于卫星影像分辨率的限制,无法满足烟草植株统计工作的需求,利用高分辨率的航空遥感可见光影像,经过图像处理过程可实现烟草植株数量的统计。
1 基于航空可见光图像的烟草统计算法
本研究基于航空可见光图像实现烟草植株提取及其数量统计,基于可见光图像处理的烟草数量统计方法主要经过图像预处理、图像分类分割[1,2]、烟株提取、杂草剔除、连通域数量统计来进行,具体流程如下:
1)图像分类与分割。烟田区域地物较为简单,主要有烟株、杂草、土壤、地膜、道路几类地物。利用K均值聚类对烟田图像进行分类。对于烟苗移植前期获取的航拍数据,通过K均值聚类对图像进行分类,并利用植株的颜色特征对植株类别进行识别,可通过如下公式对植株类别进行判断:
g_mean=sum(2×fgreen-fred)/num(f≠0) (1)
其中,g_mean为各子类绿色分量特征值,fgreen为各子类的RGB空间绿色分量值,fred为相应红色分量值,f为对应像素的像素值。对K_means聚类得到的各子类的g_mean值进行排序,最大值所对应的子类即为植株所对应类别,其对应子类图为Igreen。
2)形态学处理。对最终获得的烟株部分的二值图进行形态学处理,先进行膨胀,对细碎的烟株部分进行合并,然后再进行开运算,消除烟株之间叶片相连的现象,得到最终烟株部分。
3)杂草预剔除。经过K均值分类得到的烟株分量不可避免地包含了杂草部分,为准确对烟株数量进行统计,需首先对杂草[3-5]进行剔除。本研究首先对分类所得包含杂草的烟株类别图像进行二值化,对二值图像进行开运算,消除部分烟株黏连情况,并通过面积、长宽比等阈值对杂草进行预剔除。
①颜色:通过观察可知,部分杂草与烟株在颜色上有一定差异,因此,通过颜色特征对部分杂草进行剔除,通过如下公式将烟株子类图Igreen转换为可突出表示颜色差异的灰度图Igray:
Igray=2×Igreen_G+Igreen_R (2)
其中,Igreen_G表示子类图Igreen在RGB空间的绿色分量,Igreen_R表示其红色分量。
利用阈值法对灰度图Igray进行阈值分割得到分割二值图,并将其映射到烟株子类图Igreen上,得到新的子类图,仍记为Igreen。
②面积:考虑到图像分辨率对烟株所占面积的影响,将烟株子类图二值化,通过二值图中各连通区域的面积分布情况获得杂草剔除的阈值,以下面的取值范围对面积分布进行统计:
area={0,1000,…,n×1000,…,Amax} (3)
其中,Amax为二值图中连通域的最大面积。以1 000 pixel为间隔对连通域面积进行统计,得到90%的连通域的面积所在范围,并将其作为阈值进行剔除。
③长宽比:通常烟株长宽比变动范围不大,通过设置一定的长宽比阈值对垄间长条状杂草进行剔除,本研究中阈值取1.5,即将长宽比大于1.5的连通域作为杂草剔除。
4)基于BP神经网络的杂草剔除。经过预剔除的烟株中仍存在一定的杂草干扰,影响烟株统计精度,通过建立烟株与杂草样本,基于神经网络算法对剩余杂草进行识别与剔除。
首先需进行特征提取,经过对比分析,本研究选取了图像灰度平均、梯度均方差、相关性和惯性作为烟株与杂草识别的特征参量。计算样本图像梯度矩阵[6]:
gray_m(i,j)=(I(i,j+1)-I ■■)+(I(i+1,j)-I ■■) (4)
其中,I(i,j)为图像在(i,j)处像元的像素值。
对得到梯度矩阵进行灰度级离散化,设置灰度级为32,得到新的梯度矩阵,仍记为gray_m,计算得到图像灰度梯度共生矩阵[7,8],并基于此得到灰度平均、梯度均方差、相关性、惯性等特征参量,共生矩阵计算如下:
H(I(i,j)+1,gray_m(i,j)+1)=H(I(i,j)+1,gray_m(i,j)+1)+1 (5)
將所提取各样本特征参量输入BP神经网络[9]模型进行参数训练,BP神经网络共包括输入层、隐含层、输出层三层,输入层为所提取的特征参量,节点数为4,经隐含层节点和输出层节点作用后可反复调整判别权重和阈值,最终得到合理的判断参数模型。将经杂草预剔除后得到的二值图像中各连通域中心一定邻域范围内的原始图像作为判别图像,提取其特征参量并输入训练好的神经网络模型进行判别,从而对杂草进行剔除。
5)连通域统计。利用最终得到的烟株二值图进行连通域数量统计,即二值图中每一个连通区域均代表一株烟草,得到最终图像中的烟株数量。
2 结果与分析
利用无人机航拍所获取的烟田可见光影像进行了烟株统计试验,无人机搭载相机焦距为16~50 mm,拍摄时采用50 mm焦距,航拍高度为50 m,所获得影像地面分辨率为0.48 cm,可以满足烟株提取要求,试验主要基于matlab平台进行处理。
1)图像分类分割。利用K-均值分类算法对经过预处理的烟草可见光影像进行分类(图1),并根据烟株绿色分量远大于其他两个分量值的特点进行子类排序,提取混有杂草的烟株部分。
2)杂草剔除。根据颜色、面积、长宽比等特征对杂草进行初步剔除后,构建烟株与杂草样本库,如图2所示,通过提取样本图像的4个特征参量并输入BP神经网络进行参数训练,对待识别图像中每个连通域中心65 pixels×50 pixels的邻域范围内的图像进行判断识别,以剔除杂草(图3)。
利用经过处理后的图像,分别对图像中所包含烟草数量进行了统计,并与每幅图像中真实烟草数量进行了对比,结果显示,利用本研究中算法对可见光图像中烟草数量进行统计,精度较高,平均精度可达到90%以上,具体统计结果如表1所示。
3 小结
烟株种植数量统计是烟草局相关部门的重要工作内容,传统依靠人工清点烟株数量的方式具有工作量大、效率低、可靠性差等缺点。本研究针对烟株清点时期,烟田杂物较少、烟株较小的特点,提出利用无人机获取的高分辨率可见光影像,通过K-均值聚类进行图像分割,并利用BP神经网络算法剔除杂草,进而对烟株数量进行统计,可以快速得到图像中烟株数量,且统计精度较高,可达到90%以上,对提高烟株数量统计工作的效率和精度具有重要意义。
参考文献:
[1] 王 易,赵勋杰.基于K均值聚类分割彩色图像算法的改进[J].计算机应用与软件,2010,27(8):128-130.
[2] 林 敏,陈建新,陈哲亮.基于边缘检测与分裂合并的图像分割算法[J].电子技术应用,2011,37(7):130-133.
[3] 毛文华,曹晶晶,姜红花,等.基于多特征的田间杂草识别方法[J].农业工程学报,2007,23(11):206-208.
[4] 毛文华,姜红花,胡小安,等.基于位置特征的行间杂草识别方法[J].农业机械学报,2007,38(11):74-76.
[5] 陈丽君,李永奎.基于位置特征的穴间杂草快速识别算法[J].农机化研究,2009(9):19-22.
[6] EVANS A N,LIU X U. Amorphological gradient approach to color edge detection[J].IEEE Transactions on Image Processing, 2006,15(6):1454-1463.
[7] 李晓阳,唐普英.基于灰度共生矩阵的图像纹理特征提取分析[J].自动化信息,2012(9):28-30.
[8] SOGARRD H T. Weed classification by active shape models[J].Biosystem Engineering,2005,91(3):271-281.
[9] 蒋捷峰.基于BP神经网络的高分辨率遥感影像分类研究[D].北京:首都师范大学,2011.