基于机器视觉的烟青虫和棉铃虫雌雄蛹的分类识别

2020-04-27 00:02张红涛刘迦南
烟草科技 2020年2期
关键词:雌雄棉铃虫识别率

张红涛,刘迦南,谭 联,朱 洋

华北水利水电大学电力学院,郑州市金水区北环路36 号 450011

烟青虫和棉铃虫属于同目同科同属害虫,且两种昆虫杂交可育,生物习性、形态等特征极为相似,对其进行检测分类一直是生产实践中研究的热点问题之一[1-2]。目前国内外对昆虫的检测分类主要采用人工识别法[3-7]、生物标记法[8-10]、红外光谱法[11-12]、图像识别法等[13-16]。方红等[6]首次对我国4 种丽金龟蛹进行了形态描述,主要鉴别特征依据为上唇、发音器、尾部形状等,从而编制了我国丽金龟蛹的分种检索表;梁培生等[13]利用机器视觉技术对雌雄蚕蛹分别进行了图像获取,并结合PCA 及BP 人工神经网络对其进行了分析识别,准确率达98%;周昊等[10]通过对棕尾别麻蝇蛹3 个发育时期基因转录组的差异分析,发现蛹在不同发育时期基因表达量存在显著差异;郭婷婷等[7]利用体视显微镜实现对双委夜蛾蛹和成虫雌雄性的快速鉴别,正确率达100%;代芬等[12]利用近红外漫透射光谱对家蚕蚕蛹的雌雄性实现快速、无损鉴别,建立了PLSDA、BPNN 和SVM 3 种判别模型,并选出效果最优的PLSDA 模型,准确率达94.57%。但以上方法中,人工识别耗时耗力且容易出错,生物标记工作周期长,红外设备造价昂贵且建模难度大,而图像识别方法则方便、高效,且目前对烟草主要害虫雌雄蛹的分类判别研究鲜见报道。为此,采用机器视觉技术对烟草主要害虫烟青虫和棉铃虫的雌雄蛹进行自动识别分类,旨在为害虫的有效监测与防治提供支持。

1 材料与方法

1.1 材料与设备

供试虫源由河南农业大学植物保护学院实验室提供,为化蛹2~5 d 的烟青虫和棉铃虫。图像采集设备为SLR 相机(型号Canon EOS 5D Mark IV 配百微镜头,日本Canon 公司),软件运行环境为Windows7,处理器为Intel Core i7 @3.60GHz,软件应用工具选择matlab2014a。

1.2 虫蛹图像采集与特征提取

使用SLR 相机对固定后的活体虫蛹样本进行拍照,由于两种害虫雌雄蛹的明显判别特征位于腹部末节处,故将相机聚焦于此位置。对采集到的原始图像进行腹部末节有效区域提取后可以获得表征害虫蛹的局部特征图像,共计2 类4 种图像,见图1。由采集到的图像可以观察到2 种害虫蛹的形状大小几乎无差异,但雌雄蛹在腹部末节处存在差异,雄蛹表现为末端凸起且呈暗黑色,雌蛹表现为凹陷状且质地均匀无明显颜色变化,且上述特征在人眼状态下不易观察到。

图1 两类害虫雌雄蛹腹部末节的采集图像Fig.1 Images of abdominal end segment of male and female pupae for two types of pests

对上述图像进行多种颜色空间变换,经观察比较发现RGB 颜色空间下的虫蛹图像具有较高的对比度和清晰度,便于后续特征提取与分类判别。将采集到的原始图像分别提取其R、G、B 三通道灰度图像,试验发现R 通道下的虫蛹图像特征表现最为显著, 故最终选择R 通道的虫蛹图像作为特征提取的输入图像,见图2。

对上述4 种虫蛹的R 通道灰度图片分别提取其基于灰度共生矩阵的纹理特征构建原始特征空间,包括对比度、角二阶矩、相关性、同质性4 个特征指标(均选取0°、45°、60°、90°4 个方向的数据),共形成16 维原始特征数据[17]。

图2 两种害虫蛹的R 通道图像Fig.2 R channel images of pupae for two types of pests

①对比度CON:反映了图像的清晰度和纹理沟纹深浅的程度,对比度值越大,表明纹理沟纹越深,图像整体视觉效果就越清晰;相反,对比度值小,则纹理沟纹浅,图像也就越模糊[18]。计算公式:

式中:P(i, j)表示彩色图像第j 个像素的第i 个颜色分量。

②相关性COR:描述了像素矩阵在行或列方向的线性关系程度,相关度大,则图像像素在行或列方向的相似度高,矩阵元素均匀相等,纹理模糊;反之,纹理会越明显[18]。计算公式:

③角二阶矩ASM:又称能量,描述了图像灰度分布的均匀性和纹理的粗细程度,能量值越大,目标的灰度分布越均匀,纹理越清晰;反之亦然[18]。计算公式:

④同质性Homogeneity(Hom):也称为逆差距,描述了目标图像局部所具有的信息量和纹理复杂程度,同质度越大,则图像局部包含的信息量越多,纹理越复杂;反之,若图像没有纹理,则逆差距值接近于零[18]。计算公式:

1.3 分类识别机制选择

支持向量机(SVM)作为一种创新的监督式机器学习方法,其原理是依据Vapnik 创立的统计学习理论中的风险经验最小化准则(SRM), 将样本点误差以及结构风险水平降到最低,对样本数量范围没有过多要求,较大地提高了模型的推广度[19]。本试验中为线性不可分情况,通过非线性变换将样本集的原始特征空间转换成高维空间中的一个线性的问题,从而在变换的空间中求出最优分类并实现目标判别,这一过程需要核函数的参与,因此选择径向基核函数。

设训练样本集为(xi,yi),其中xi∈Rd(i=1, 2, …, n)。对于研究对象的分类问题,如二分类,yi∈(-1,1)。该分类可归结为二次规划问题。

式中:(ω, ω)、(ω, xi)为两向量之间的内积;ξi为训练样本不可分时引入的一个松弛变量;c>0 表示一个整数,是用来控制对错误判断样本惩罚力度的惩罚因子,将错分样本数量尽量降到最低;ω和b 为线性判决函数f(x)=(ω, x)+b 中的权向量和分类阈值。

对于害虫雌雄虫蛹的SVM 分类问题,选用c-SVC 分类和径向基核函数(RBF),K(x, xi)=exp(-g||xi-x||2),其中g>0。惩罚因子c(0,+∞)和RBF核函数参数g(方差)是影响SVM 分类器识别率的重要参数,因此利用参数组合寻优的方法对其进行优化选择[20]。

在SVM 分类器的参数寻优中,将交叉验证训练模型识别率作为最终判别标准, cg(m, n)=svmtrain(train_pest_labels, train_pest_features,’-c cm

-g gm -k 5’)。其中,train_pest_labels 为两类害虫雌雄蛹训练样本的种类标签;train_pest_features 为两类害虫雌雄蛹训练样本的纹理特征数据;cm 和gm 分别表示第m 次循环的c 和g;参数k 表示交叉验证的折数(选取k=5),根据交叉验证的识别率作为判断best-c 和best-g 的标准[21-22]。

2 结果与讨论

2.1 两类害虫蛹图像的纹理特征

按照1.2 节方法对两类害虫蛹的图像进行特征提取,共提取32 个蛹图像的纹理特征,其中烟青虫雌雄蛹纹理特征见表1,棉铃虫雌雄蛹纹理特征见表2。表中结果显示,烟青虫蛹的纹理特征中雄蛹的对比度、相关性、角二阶矩特征指标均明显大于雌蛹,而同质性指标雌蛹大于雄蛹;棉铃虫雌雄蛹纹理特征指标变化趋势与烟青虫一致。表明两类害虫的雄蛹纹理特征指标优于雌蛹,图像上表现为其虫翅表面的轮廓、斑纹等更清晰、对比度较高。由于两类害虫间雌雄蛹特征指标差异不大且规律不明显,因此未对烟青虫和棉铃虫的混合雌雄蛹进行识别,仅对单一害虫的雌雄蛹进行有效识别。

2.2 烟青虫和棉铃虫蛹的分类识别

对烟青虫和棉铃虫蛹的采集图片分别提取70张作为样本集,其中每类别均将50 张用于训练,20 张用于测试,共计280 张,以此形成训练样本特征空间200×16 维,测试样本特征空间80×16 维,最终形成280×16 维原始特征数据作为支持向量机的输入。由于两类昆虫间蛹的图像极为相似,试验中只对其种类内虫蛹进行分类识别。

表1 烟青虫蛹的纹理特征Tab.1 Texture features of Helicoverpa assulta pupae

表2 棉铃虫蛹的纹理特征Tab.2 Texture features of Helicoverpa armigera pupae

首先使用支持向量机对害虫特征数据进行分类,即对害虫种类内雌雄性的识别,在分类器中4类害虫分别用“1,-1,2,-2”4 类标签来表示,其中“1”表示棉铃虫雄蛹,“-1”表示棉铃虫雌蛹,“2”表示烟青虫雄蛹,“-2”表示烟青虫雌蛹。

选择烟青虫蛹的图像测试样本共40 张,其中雌雄各20 张,分类结果如图3 所示。图3 结果表明,雌蛹有5 个被错判,雄蛹全部识别正确,识别正确个数35 个,总体识别率达到87.5%。

图3 烟青虫雌雄蛹的分类Fig.3 Classification of male and female pupae of Helicoverpa assulta

选择棉铃虫蛹的图像测试样本共40 张,其中雌雄各20 张,分类结果如图4 所示。图4 结果表明,雌蛹有7 个被错判,雄蛹全部识别正确,识别正确蛹个数33 个,总体识别率达到82.5%。

分类结果表明,存在识别精度较低的原因可能是由于两种害虫蛹的特征差异微小且仅体现在腹部末端局部位置;同时由于饲养环境、食物等因素的影响,生长过程中虫蛹的局部特征表现均存在差异;另外烟青虫对饲养条件要求较高,其存活率低导致样本采集量较少。因此,在昆虫饲养实验及图像处理等方面还有待于进一步研究。

图4 棉铃虫雌雄蛹的分类Fig.4 Classification of male and female pupae of Helicoverpa armigera

3 结论

利用SLR 相机对烟青虫和棉铃虫的雌雄蛹进行图像采集并进行有效区域提取,同时提取其RGB 颜色空间的R 通道灰度图像作为纹理特征提取的特征图像。提取基于灰度共生矩阵的对比度、角二阶矩等16 维特征指标作为原始特征数据。将280×16 维的原始特征空间送入SVM 分类器进行自动识别分类,烟青虫雌雄蛹的识别率达到87.5%,棉铃虫雌雄蛹识别率达到82.5%,表明该方法具有可行性。

猜你喜欢
雌雄棉铃虫识别率
太行鸡雌雄鉴别智能技术的研究与应用
天然沙棘林改造雌雄株配比嫁接调控技术
芦笋田棉铃虫药剂筛选试验探究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
玉米棉铃虫的发生与综合防治措施
提升高速公路MTC二次抓拍车牌识别率方案研究
高速公路机电日常维护中车牌识别率分析系统的应用
雌雄时代
我们与棉铃虫的战争