基于计算机视觉的葵花子外观品质检测研究

2019-01-11 17:38吴进玲张海东李哲施伟田小军
湖北农业科学 2019年23期
关键词:葵花子计算机视觉决策树

吴进玲 张海东 李哲 施伟 田小军

摘要:通过采集完好、霉变、破损葵花子的图像并对其进行预处理,研究共提取了3个颜色特征值(G、B、I)和5个纹理特征值(灰度均匀性、梯度均匀性、惯性矩、一致性、熵),采用BP神经网络和决策树算法分别对3种葵花子进行检测识别。结果显示,BP网络采纳全部8个特征值,正确率98.58%;决策树算法采纳2个特征值(G、B),正确率99.25%,说明决策树算法模型更简洁,效果更好,表明計算机视觉技术可以实现完好、霉变、破损葵花子的检测识别。

关键词:葵花子;计算机视觉;神经网络;决策树

中图分类号:S126         文献标识码:A

文章编号:0439-8114(2019)23-0201-06

DOI:10.14088/j.cnki.issn0439-8114.2019.23.050           开放科学(资源服务)标识码(OSID):

Research on detection of sunflower seed's appearance quality based on computer vision

WU Jin-ling,ZHANG Hai-dong,LI Zhe,SHI Wei,TIAN Xiao-jun

(School of Mechanical and Electrical Engineering,Yunnan Agricultural University,Kunming 650201,China)

Abstract: The images of intact, mildewed and damaged sunflower seed samples were acquired and preprocessed to extract 3 color featuresvalue of G, B and I, and extract 5 texture feature values which include gray uniformity, gradient uniformity, moment of inertia, consistency and entropy. Then BP neural network and decision tree algorithm were conducted to discriminate above three kinds of sunflower seed samples based on extracted color features and texture features. Results showed that all eight image features were adopted by BP neural network, and the BP model gave the recognition rate by 98.58% for intact, mildewed and damaged sunflower seed samples respectively; while only two features were inputted into decision tree model, G and B, and the model gave the recognition rate by 99.25%. Compared with BP neural network model, the decision tree model shows more concise structure and more efficient performance. Result told that intact, mildew and damaged sunflower seeds can be discriminated computer vision technology.

Key words: sunflower seeds; computer vision; neural network; decision tree

葵花子外观是评价葵花子品质的重要指标,外观品质的好坏直接影响其价格和销售,影响其市场竞争力。葵花子外观品质通常包括尺寸、形状、破损和霉变等方面。传统上,这些外观品质主要依靠人工挑拣,工作量大且精度低,易受人为因素的影响。计算机视觉作为一种无损检测技术,不仅能够实现非接触、长时间稳定的检测,并且识别精度高,故在水果、肉类、鲜花等相关品质的检测中得到了广泛应用,极大地提高了农产品检测的质量和效率[1-4]。赵巍[2]根据西瓜的外形和表面特点,提出基于计算机视觉技术的西瓜无损检测与分级技术。张静[3]以牛肉为研究对象,利用高光谱成像技术检测牛肉微生物腐败过程;许文方[4]利用计算机视觉技术实现了玫瑰切花品质的评判研究。

本研究拟利用计算机视觉技术对葵花子外观品质进行检测研究,通过采集葵花子图像,进行预处理并提取相关特征,利用BP神经网络以及决策树算法进行分级,以此来实现葵花子外观品质的自动化识别和精选,从而促进葵花子生产过程数字化、智能化控制和管理,有效提高葵花子的成品质量和生产效率。

1  材料与方法

1.1  试验材料

研究选用云南滇王驿农业科技开发有限公司的黑珍珠葵花子作为样本,经过人工处理挑选出完好葵花子470粒,霉变葵花子470粒,破损葵花子520,3个种类总共1 460粒样本,每种又分成两部分,一部分取出70粒用于模型的建立,剩下的另外一部分用于模型的验证。

1.2  图像采集

1.2.1  图像采集系统  研究的图像采集系统结构和组成如图1所示,主要包括光箱、光源、工业相机和计算机等部分。

1.2.2  参数设置  为了使工业相机能够采集到清晰的葵花子图像,根据光源的选用原则并结合本研究的实际情况,图像采集过程在光箱内进行,光箱规格为35 cm×25 cm×75 cm,內壁用黑色纸片包裹。光源用一个自制圆柱形灯罩密封起来,并在灯罩上方放置一张相同大小的透明垫片,方便放置葵花子。光源采用OPPLE LED灯,功率30 W,色温正白色。相机镜头与葵花子距离为55 cm,光源与葵花子距离为4 cm,工业相机分辨率为1 024×768。

1.2.3  图像采集  图像采集时,将样本葵花子平躺放置于光源室垫片上方,打开光源,每个样本分别采集3次,从中选取效果最好的一张图像。采集过程中,注意保证相机焦距、物距等参数不变,并使葵花子样本与光轴垂直。图2中(a)、(b)、(c)分别为完好葵花子、霉变葵花子和破损葵花子图像。

2  图像预处理及特征参数提取

2.1  图像预处理

图像预处理可以提取出图像中有用的信息,去除无用的信息,增强有关信息的可检测性,最大限度的简化数据[5]。研究采用了以下图像预处理方法。

2.1.1  图像分割  图像分割的目的是提取出研究所需要的目标对象[6]。灰度阈值分割法是一种最常用的并行区域技术,该算法的关键是确定合适的分割阈值,为了确定葵花子图像的分割阈值,需要将葵花子原始图像转换为灰度图像[7]。图3是样本葵花子灰度图像阈值直方图。由图3可以发现,葵花子灰度图像阈值直方图的波峰开始是在低于500的范围内波动,随着灰度值的增大逐渐出现一段低谷,最后波峰突然增高达到4 000以上。低谷处灰度值可作为阈值分割的依据[7],图4是分割后的葵花子。

2.1.2  图像去噪  图像在输入、传送、处理过程中受到干扰,形成噪声,降低图像质量,中值滤波是一种典型的图像去噪方法[8],图5为中值滤波后的葵花子。

2.1.3  图像二值化  二值图像只有黑白两个灰度级,能够很好地突出图像特征,便于图像识别[8]。图6为二值化处理后的葵花子。

2.1.4  膨胀和腐蚀  膨胀是对图像中的目标对象增加像素,腐蚀则相反[9]。对图像先进行腐蚀而后膨胀的操作称为开启运算,利用该运算可以消除尖峰、凸缘、切断狭细连接,起到磨光边缘的作用(图7),得到的不是原始图像,结果会比原始图像更简单[9]。

2.1.5  边缘检测  边缘检测的目的是标识数字图像中亮度变化明显的点,保留图像重要的结构属性[10]。本研究边缘检测结果如图8所示。

2.1.6  图像合成  将葵花子边缘检测后的图像作为模板与分割后的图像进行位运算,把模板图形中间部分用分割后的彩色图像代替,而轮廓不变合成新的图像,这样能够较好的保留葵花子的颜色、纹理和轮廓特征[10]。图9是本研究合成后的葵花子。

2.2  特征参数提取

霉变、破损葵花子表皮的颜色、表面光滑程度和正常葵花子存在明显差异。本研究提取葵花子的3个颜色特征(G、B、I)和5个纹理特征(灰度分布不均匀性、梯度分布不均匀性、惯性矩、一致性和熵)分别建立基于计算机视觉的葵花子霉变、破损神经网络以及决策树检测识别模型。

2.2.1  葵花子颜色特征参数提取  每幅葵花子图像中葵花子所有像素G、B、I的均值,计算公式如下:

2.2.2  葵花子纹理特征参数提取  纹理是按一定规则对元素或基元进行排列所形成的重复模式[11]。根据各纹理特征的意义和试验需求,本研究选用灰度分布不均匀性、梯度分布不均匀性、惯性矩、一致性、熵5个纹理特征提取葵花子图片特征参数。表1是所提取特征参数的范围、均值和标准差。比较表1数据可以看出,无论是特征参数的范围、均值还是标准差,完好、霉变、破损葵花子都存在一定的区别。总体上,完好葵花子要比霉变、破损葵花子颜色更偏向绿色和蓝色,纹理特征排列更加有序;霉变葵花子的特征基本介于完好以及破损葵花子之间;破损葵花子的颜色特征最弱,且熵值明显大于其他两类而灰度均匀性明显小于其他两类;说明葵花子图像处理的效果良好,满足后续研究要求。

3  葵花子外观品质分类模型的建立与分析

3.1  BP神经网络

3.1.1  BP神经网络概述  BP(Back Propagation)神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,它通过自身的训练,学习某种规则,在给定输入值时得到最接近期望输出值的结果,实现了从输入到输出的非线性映射[12]。BP神经网络包括输入层、隐含层和输出层,当输入节点为n,输出节点数为m时,BP神经网络就表达了从n个自变量到m个因变量的函数映射关系[13]。图10是BP神经网络的拓扑结构。

3.1.2  霉变、破损葵花子的BP神经网络识别  BP神经网络的隐含层节点数直接影响BP神经网络的预测精度[14],选择最佳隐含层节点数的参考公式为:

式中,l为隐含层节点数,n为输入层节点数,m为输出层节点数[14]。

本研究以输入层和输出层节点数之和的平均值4作为隐含层节点初始数,图11显示了不同隐含层节点数与网络分类误差的关系。

由图11可以看出隐含层节点数为4时,分类误差最小。本研究以隐含层、输入层、输出层节点数分别为4、8、1建立完好、霉变、破损葵花子BP神经网络识别模型。图12和13分别为训练集和测试集葵花子的BP神经网络分级结果。

从图12、图13可以看出,训练集样本中有1个完好葵花子被误判为霉变葵花子,其他样本均识别正确,识别正确率为99.92%;测试集样本中存在2个破损葵花子被误判为完好葵花子,其余样本均分级正确,识别正确率为98.58%。表2為BP神经网络训练集和测试集样本中各种葵花子识别正确率。由表2可以看出,在训练集样本中,霉变、破损葵花子的识别正确率均为100%,完好葵花子的识别正确率为99.75%,总体识别正确率为99.92%;测试集样本中,完好、破损葵花子识别正确率均为100%,破损葵花子的识别正确率为97.50%,总体识别正确率为98.58%,这充分说明了该模型对葵花子有较好的识别能力。

3.2  决策树算法

决策树算法是一种归纳学习算法,它能够从一组毫无规律的数据样本集合中推理出决策树具体的表示形式以及分类规则[15]。如图14是一棵决策树,其中A,B,C表示属性名,a1,b1,c1分别表示A,B,C的取值,当属性A的取值为a1,属性B的取值为B1时,它属于第1类,其余树的分支以此类推。从图14可以发现,构造好的决策树分为根节点、内部节点、叶节点三大类,其中根节点和内部节点都是数据的属性或者属性的集合,叶节点则是分类的结果[15]。该算法用信息增益率作为选择标准,信息增益是指数据集原有的信息量与经过分类以后的信息量的差值[16]。对于属性A的信息增益率计算方法如下:

GainRatio(A)=Gain(A)/SplitInfo(A)   (5)

本研究信息增益率设置为0.1,如果信息增益率小于0.1时,那么决策树模型对于样本的识别判断将不再增加新的特征。以根节点与叶节点数分别为8、3建立完好、霉变、破损葵花子决策树识别模型,图15为本研究决策树算法识别结果。图15中,x1、x2分别表示葵花子图像特征G和B;1、2、3分别代表完好、霉变、破损葵花子。从图15可以看出,运用该算法只需要前两个特征就可以正确的识别出葵花子不同种类,此时再增加其他任何特征,信息增益率均小于0.1,所以识别模型停止添加新特征。表3为决策树算法训练集和测试集样本中各种葵花子识别正确率。由表3可以看出,训练集样本中,完好和霉变葵花子的识别正确率均为100%,破损葵花子的识别正确率为99.30%,总体识别正确率为99.77%;测试集样本中,霉变和破损葵花子识别正确率均为100%,完好葵花子的识别正确率为98.58%,总体识别正确率为99.52%,这充分说明了该模型对葵花子具有较高的识别判断能力。

3.3  两种算法结果比较

将两种算法先后在同一台笔记本上运行,笔记本型号为华硕X43B,表4是两种算法性能比较。分析比较表4可以发现,决策树算法用时明显少于神经网络,且准确率更高。运用BP神经网络以及决策树算法,均能对葵花子完好、霉变、破损进行较准确的识别,决策树算法可以选用更少的特征,能够展现出具体的节点数据,但是具体误判情况需要识别判断前后数据对比得知,不够直观;而BP神经网络结果可以直接显示出每种样本误判的情况以及误判个数,更加直观。

4  结论

本研究基于计算机视觉技术,提取完好、破损、霉变葵花子图像的颜色、纹理特征,运用BP神经网络、决策树算法分别对3种葵花子进行检测识别,并对两种算法结果性能进行比较,表明运用计算机视觉技术检测葵花子外观品质是完全可行的。

参考文献:

[1] 陈  旭,吕小俊,贾志洋.浅谈计算机视觉的发展及应用[J].科技信息,2013(16):6.

[2] 赵  巍.计算机视觉在西瓜无损检测与分级中的应用[D].武汉:华中农业大学,2013.

[3] 张  静.基于高光谱成像的牛肉微生物腐败检测方法的研究[D].北京:中国农业大学,2010.

[4] 许文方.利用计算机视觉技术评判玫瑰切花品质的研究[D].昆明:云南农业大学,2013.

[5] XU T G. A study on the quality Evaluation of cut Rose Flowers by computer Vision technique[D].Kunming:Yunnan Agricultural University,2013.

[6] SUN D W. Infrared spectroscopy for food quality analysis and control[M].Holland:Elsevier,2009.

[7] 胡祖辉,徐  毅.大数据背景下髙校教育数据的分析与应用研究[J].现代教育科学,2017(1):109-114.

[8] 高  文,陈熙霖.计算机视觉—算法与系统原理[M].北京:清华大学出版社,1999.

[9] RICHARD S,STEVE S,DAVID F. Computer vision:Algorithms and applications[M].London:Springer,2011.

[10] 高  成.Matlab图像处理与应用[M].北京:国防工业出版社,2007.

[11] 赵娟娟.数字图像边缘检测方法的对比分析及优化[J].甘肃科学学报,2012,24(3):143-146.

[12] 朱晓丽.关于机器视觉及其应用问题的探讨[J].中国教育技术装备,2010(9):89.

[13] 马  燈.基于C4.5算法的高校教师评价研究[J].现代计算机(专业版),2017(2):42-44.

[14] 路  狮,徐  辉,杨永春.基于决策树分类算法的研究与应用[J].电子设计工程,2016,24(28):1-3.

[15] MA L,DEST E S,WANG Y. Online active learning of decision trees with evidential data[J].Pattern recognition,2016,52:33-45.

[16] SANTOS C N D,GATTIT M. Deep convolutional neural networks for sentiment analysis of  short  texts[A].Proc of international  conference on computational linguistics[C].Dublin:Technical papers,2014.69-78.

猜你喜欢
葵花子计算机视觉决策树
冬季吃点葵花子防冻
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
关于葵花子被偷吃的调查报告
葵花子
危险气体罐车液位计算机视觉监控识别报警系统设计
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用