基于优化神经网络的小麦品种分类研究

2012-09-19 06:17石小凤侯利龙
关键词:特征参数图像处理籽粒

樊 超,夏 旭,石小凤,侯利龙

(河南工业大学 信息科学与工程学院,河南 郑州 450001)

基于优化神经网络的小麦品种分类研究

樊 超,夏 旭,石小凤,侯利龙

(河南工业大学 信息科学与工程学院,河南 郑州 450001)

为提高基于图像处理的小麦品种识别的准确率,首先选取L8998、内乡188、9023、优展1号、豫麦47、周麦12等6个品种作为研究对象,对采集到的小麦颗粒图像进行中值滤波后采用迭代式阈值法分割图像,提取出颜色、形态和纹理3方面共16个特征,然后通过构建神经网络研究了小麦品种的识别准确率与品种数量之间的关系.最后,为避免网络因达到局部最优而停止训练,利用MIV算法计算了各输入特征参数对分类结果的平均影响值,进而使用遗传算法对网络结构进行了优化.结果表明,随着小麦品种的增加,分类的准确率逐步下降,当待识别的小麦种类增加到6类时,优化后的神经网络的样本识别准确率从81.3%增加至85.6%,有效提高了小麦品种分类的准确性.

小麦;图像处理;特征提取;神经网络;优化算法

0 引言

对于我国这样的人口大国,确保粮食安全不仅是实现国民经济又好又快发展的基本条件,也是确保国家安全的战略基础.小麦作为我国第二大粮食作物,在满足人们的膳食需求和保证粮食安全方面具有举足轻重的地位.过去,农业科研与生产方面的许多工作都是依靠人类视觉进行判断和辨别的,随着计算机信息技术的迅速发展和硬件成本的不断下降,图像处理技术得以广泛应用于农产品品质检测和分类中,成为保障农业高效生产的有力手段[1-2].与人类的视觉相比,用图像处理技术代替人工进行种子质量鉴别具有以下优点:1)能一次进行多个参数的测量,满足分类中对综合指标的要求;2)可以克服人的主观因素和疲劳程度等对分类准确性的影响,利于实现自动化.

然而,如何提高基于图像处理的小麦品种识别的有效性和准确性是影响该技术能否实用化的关键所在.国内外在小麦籽粒检测和识别方面开展了广泛研究,一方面成功地识别小麦品种和类别,如对燕麦、大麦、黑麦草和小麦的正确识别率均达到90%以上[3-5];另一方面有效识别不同类别的小麦种子,如对不同冬春性、质地和粒色的小麦类别判断效果良好[6-7],但对同一类型不同品种的识别效果并不理想.笔者基于图像处理技术通过对6种河南产小麦籽粒的图像特征参数进行提取并结合优化遗传算法,实现同一类型不同品种小麦的识别和分类.

1 材料准备与系统组成

研究中选取6个不同品种的河南产小麦(L8998、内乡188、9023、优展1号、豫麦47、周麦12).由于小麦籽粒的体积相对较小,为获得高质量的小麦图片,采用BENQ-5000E扫描仪进行图像采集.在得到不同品种小麦的图像后,使用图像处理技术对小麦品种进行识别,识别系统流程参见图1.其中预处理的目的在于改善图像数据,其处理效果的好坏将直接影响后续图像特征提取质量的高低.最后通过构建并优化神经网络完成小麦品种的分类.

图1 系统流程

2 特征提取

特征提取就是对图像进行物理测量或变换,得到一组反映其特性的数字值,而有效的小麦图像预处理工作对后续的特征提取具有重要影响.由于本系统中图像降质的主要原因在于光学系统及背景环境的影响,并且采集得到的小麦籽粒图像背景简单且前景与背景之间区别较大,因此试验中首先利用空域处理中的中值滤波法进行图像增强,然后采用简单实用的迭代式阈值选择法分割籽粒图像,最后利用形态学进一步完善分割效果,得到的图像见图2.通过图像分割,将小麦籽粒图像从背景中分离出来,以便特征提取.

图2 形态学处理后的图像

特征提取的涉及面很广,与待识别对象的各种物理的、形态的性能都有联系.针对具体问题有各种各样的特殊方法.本研究中的图像特征提取工作包括三方面的内容:1)描述小麦籽粒色彩的颜色特征;2)描述小麦籽粒外形的形状特征;3)描述小麦籽粒表面灰度变化的纹理特征.

其中,国内外利用颜色特征在谷物的检测和识别方面开展了广泛研究[8-9].试验中联合使用RGB模型和HSI模型提取了小麦籽粒的6个颜色特征,得到的颜色数据见表1.

形状特征方面,有研究表明,农产品的结构、组成与其粒形有密切的关系,因此谷物的形状特征也是进行谷物检测分级的重要参数之一.形状特征参数的选取没有统一的规定,只要能有效区分籽粒之间的形状差异,并且能方便、快速获取的参数都可作为形状特征参数.参照以往研究[10],这里选取周长(P)、面积(A)、矩形度(R)、圆形度(C)、伸长度(E)5个特征参数,每种小麦籽粒的形态参数计算结果参见表2.

纹理是图像中一个重要而又难于描述的特征,通常被定义为“一种反映一个区域中像素灰度级的空间分布的属性”.为了度量纹理,需设法对物体内部灰度级的变化性质进行量化.试验中采取灰度共生矩阵法[11],并结合小麦籽粒的特点以及纹理特征参数的含义,这里选用能量 (ASM)、熵 (ENT)、对比度(CON)、局部平稳性和相关性(COR)作为关键特征,得到小麦纹理特征数据如表3所示.

3 基于神经网络的小麦品种分类

通过对采集得到的籽粒图像进行分割共提取得到小麦籽粒705颗,其中共有L8998类籽粒121颗、内乡188类籽粒109颗、9023类籽粒120颗、优展1号类籽粒118颗、豫麦47类籽粒121颗、周麦12类籽粒116颗.从每类籽粒中随机抽取100颗构建籽粒图像库,并将抽取得到的各类籽粒中前60颗用于训练,其余40颗用于测试.试验中选用人工神经网络作为分类器,工作方式由两个连贯的阶段即分析阶段和识别阶段组成.定义样本识别准确率为正确识别籽粒个数与输入籽粒总个数的比值,即样本识别准确率:

表1 小麦颜色特征

表2 小麦形状特征%%

表3 小麦纹理特征%%

根据前节对小麦特征参数的提取,得到小麦籽粒的6个颜色特征、5个形状特征以及5个纹理特征等共16个特征参数,将这16个参数作为神经网络的输入节点;并根据待分类籽粒的种类数目,依次确定输出层节点的个数.为了方便进行试验验证,首先选取L8998、内乡188、9023和优展1号等4类小麦籽粒进行分类,分类结果参见表4.由此可以看出,无论使用哪种网络结构,系统对4类小麦的分类准确率均达到90%以上,具有较好的分类效果.

在此基础上,尝试将待分类籽粒的数目逐步增加至5类和6类,分类结果参见表5和表6.可以看到,随着待分类籽粒种类的增多,分类准确率越来越小.尤其是在籽粒种类增加到5类、6类时,对5类籽粒分类时最佳的网络结构为16-22-5结构,此时的分类准确率为86.5%;而对6类籽粒分类时最高分类准确率仅为81.3%.横向比较可以看出,网络对豫麦47和周麦12的分类效果明显差于对其他种类籽粒的分类效果.进一步分析表明,导致小麦品种分类效果不佳的主要原因在于输入特征参数的选取不当以及网络陷入局部最优解而造成的,因此首先采用MIV算法对神经网络输入参数的有效性进行计算,然后通过使用遗传算法寻找全局最优解的方法对BP神经网络进行优化,期望得到更好的分类结果.

4 神经网络优化

4.1 基于MIV算法的特征参数有效性计算

MIV被认为是在神经网络中评价变量相关性最好的指标之一,其符号代表相关的方向,绝对值大小代表影响的相对重要性.因此,试验中将平均影响值方法应用于BP神经网络,计算每个特征参数对神经网络分类结果的影响程度,从中找出对结果有较大影响的输入项,继而实现对神经网络的输入变量进行筛选.使用MIV算法对网络结构为16-22-6时各输入特征参数对输出结果的影响程度进行计算,结果如表7所示.

表4 4类小麦分类结果

表5 5类小麦分类结果

表6 6类小麦分类结果

表7 输入特征对输出结果的影响

从表7可以看出,MIV值在0.07以上的共有4个,对应的变量分别为颜色参数中的B分量、色调参数中的I分量、面积参数A和圆形度C,说明这4个参数对小麦品种的分类结果影响较大;而MIV值在0.01以下的参数只有2个,分别对应于形态特征参数中的矩形度(R)和纹理特征参数中的相关性 (COR).若将MIV值在0.01以下的变量看作是对输出结果不重要的特征参数,则在后续对神经网络的研究中,输入节点的个数简化为14个.

4.2 结合遗传算法的网络优化

由于BP网络是在梯度法基础上推导出来的,要求目标函数连续可导,在进化学习的过程中收敛速度慢,容易陷入局部最优,找不到全局最优值.并且由于BP网络的权值和阈值在选择上是随机值,每次的初始值都不一样,造成每次训练学习预测的结果都有所差别.遗传算法是一种全局搜索算法,把BP神经网络和遗传算法有机融合,充分发挥遗传算法的全局搜索能力和BP神经网络的局部搜索能力,利用遗传算法来弥补权值和阈值选择上的随机性缺陷,得到更好的预测结果.

针对表6中对6类小麦籽粒的分类情况,结合MIV算法以及遗传算法对神经网络进行优化,网络的输入参数简化为14个,当采用14-22-6的网络结构时,分类效果对比如图3所示,此时的样本平均识别准确率达到了85.6%,并且此时网络在对其他几种小麦分类效果保持不变的情况下,豫麦47和周麦12的识别准确率大幅改善,相比于原有神经网络的分类效果有了明显的提高.

图3 识别效果对比

5 结论

通过对6类不同小麦品种的籽粒图像进行特征提取,并利用神经网络方法对小麦品种实现自动分类,可以得到以下研究结果.

1)%不同品种的小麦在颜色、形态和纹理特征参数上均有所差异,将这些参数应用于小麦的分类识别研究中是可行的.

2)%利用MIV算法计算了各特征参数对分类结果影响的平均值,从而优化了输入参数.在此基础上,使用遗传算法对网络进行了优化,取得了更好的分类效果.

3)%本试验仅在外观层面对不同种类的小麦进行分析讨论,如何扩展到内部品质的检测仍有待今后进一步研究.

[1] 李明,张长利,房俊龙.基于图像处理技术的小麦叶面积指数的提取[J].农业工程学报,2010, 26(1):205-209.

[2] 王志军,丛培盛,周佳璐,等.基于图像处理与人工神经网络的小麦颗粒外观品质评价方法[J].农业工程学报,2007,23(1):158-161.

[3] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:I.Morphology models[J].Transaction of the ASAE,2000,43:1669-1675.

[4] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:II.Color models[J]. Transaction of the ASAE,2000,43:1677-1680.

[5] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:III.Texture models[J].Transaction of the ASAE,2000,43:1681-1687.

[6] Majumdar S,Jayas D S.Classification of cereal grains using machine vision:IV.Combined morphology,color,and texture models[J].Transaction of the ASAE,2000,43:1689-1694.

[7] 何胜美,李仲来,何中虎.基于图像识别的小麦品种分类研究 [J].中国农业科学,2005,38(9):1869-1875.

[8] Liu Chang-Chun,ShawJai-Tsung,Keen-Yik Poong.Classifying paddy rice by morphological and color features using machine vision[J].Cereal Chemistry,2005,82(6):649-653.

[9] 成芳,应义斌.基于颜色特征的稻种霉变检测法[J].农业机械学报,2004,35(4):102-105.

[10] 何胜美,李仲来,何中虎.基于图像识别的小麦品种分类研究[J].中国农业科学,2005,38(9): 1869-1875.

[11] 徐秋景,戚大伟.基于灰度共生矩阵的东北虎纹理特征参数 [J].东北林业大学学报,2009,37(7):125-127.

RESEARCH ON WHEAT VARIETY CLASSIFICATION BASED ON OPTIMIZED ARTIFICIAL NEURAL NETWORK

FAN Chao,XIA Xu,SHI Xiao-feng,HOU Li-long
(School of Information Science and Engineering,Henan University of Technology,Zhengzhou 450001,China)

To improve wheat variety classification accuracy based on image processing,we selected 6 varieties of wheat samples of L8998,Neixiang 188,9023,Youzhan 1,Yumai 47 and Zhoumai 12 as objects,then acquired wheat grain images,processed the images by median filtering,segmented the images by iterative threshold method,extracted 16 features from color,morphology and texture aspects,and constructed an artificial neutral network to study the relationship between the classification accuracy and the number of varieties.Finally,we utilized MIV algorithm to calculate the mean impact value of each input characteristic parameter to the classification result to prevent the ANN from trapping into local optimum and stopping training,and further used genetic algorithm to optimize the network structure.The results showed that the classification accuracy dropped gradually when the number of wheat varieties increased;the identification accuracy of the optimized ANN increased form 81.3%to 85.6%when the number of wheat varieties increased to 6,thereby effectively improving the wheat variety classification accuracy.

wheat;image processing;characteristic extraction;artificial neural network;optimization algorithm

TP183;TP391.41

A

1673-2383(2012)04-0072-05

http://www.cnki.net/kcms/detail/41.1378.N.20120829.1722.201204.72_017.html

网络出版时间:2012-08-29 05:22:00 PM

2011-05-30

国家自然科学基金(61071197)

樊超(1976—),男,河南郑州人,博士,副教授,研究方向为模式识别、图像处理.

猜你喜欢
特征参数图像处理籽粒
籽粒苋的饲用价值和高产栽培技术
籽粒苋的特性和种植技术
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
玉米机械脱粒籽粒含水量与破碎率的相关研究
基于PSO-VMD的齿轮特征参数提取方法研究
基于图像处理的定位器坡度计算
牡丹籽粒发育特性与营养成分动态变化的研究