张玉荣,陈赛赛,周显青
(河南工业大学 粮油食品学院,河南 郑州 450001)
小麦是一种世界性的粮食作物,也是我国的三大储备粮食之一,具有良好的耐储存性.在小麦流通过程中,水分含量是衡量其质量优劣的限制指标并作为小麦增扣量的依据.因此,研究小麦水分含量检测技术对正确评定小麦质量和保障储粮安全都有着重大的意义.
随着信息技术的迅速发展,粮油及其他农产品检验已经逐渐向无损检测、在线检测的方向发展,计算机图像处理技术作为一种新的检测方法,受到国内外学者的普遍关注.利用图像处理技术进行大米[1-3]、玉米[4]、马铃薯[5-6]、花生[7-8]等农产品质量与品质检测已经取得了一定进展.在小麦质量与品质检测方面,也有诸多研究成果,主要涉及小麦品种与种类识别[9-15]、质量分级[16]、角质和硬度检测[17-19]等方面.图像处理技术在农产品质量与品质的检测过程中,通常从样品的形态、颜色和纹理等方面提取特征参数,用于农产品特征描述并对其进行评价.与传统检测方法相比,该方法具有速度快、精度高、重复性好等优点.将图像处理技术应用于实际检测如小麦流通过程中的现场等级评定,是今后研究需要关注的重点.作者以不同水分含量小麦作为研究对象,根据其在颜色和纹理等特征上的差异,使用相应的模式识别方法建立识别模型,可以自动、快速地识别小麦水分含量,为图像处理技术在小麦水分含量检测中的应用提供参考.
黄淮麦区硬质白小麦(2012 年产;容重:805 g/L;水分含量:11.9%),由河南省粮油饲料质检中心提供,除去杂质和不完善粒后将样品储存于4 ℃左右的恒温冰箱.
1010-3 型鼓风恒温干燥箱:上海实验仪器厂有限公司;AY120 电子天平:日本岛津制作所;纷腾h9 型平板式扫描仪(光学分辨率(dpi):2 400×4 800;扫描元件:CCD):上海中晶科技有限公司;计算机(处理器:Intel Core;内存:2.00 GB):联想有限公司;MATLAB R2010a、SPSS17.0、SAS9.1 软件.
1.3.1 样品水分含量测定
参照GB 5497—1985 中105 ℃恒重法进行测定.
1.3.2 原料处理
将小麦样品分为5 份,加入不同含量的蒸馏水,将其含水量分别调节为10%、11%、12%、13%和14%.待小麦水分平衡后将每种水分含量样品分别分成两份,一份用于单籽粒图像扫描,另一份用于整批籽粒图像扫描.
1.3.3 图像采集与预处理
小麦单籽粒图像的采集:分别将不同水分含量的小麦籽粒以互不粘连的方式置于扫描仪上,以黑色环氧树脂板为背景,将扫描仪亮度调为-30,对比度调至30,分辨率600 dpi 扫描小麦籽粒数字化图片,图片以BMP 格式储存,共采集600 个单籽粒图像(120 个籽粒×5 种水分含量).小麦整批籽粒图像的采集:将小麦倒入去底的矩形玻璃盒中(8 cm×7 cm×1.2 cm),并将表面刮平,扫描仪参数与图像规格设置与单籽粒图像扫描相同,共采集500 幅整批小麦籽粒图像(100 个样品×5 种水分含量).图像采集完成后,对图像进行中值滤波、形态学运算等预处理,以达到图像增强的目的.
1.3.4 图像特征提取
对于单籽粒小麦图像,选取其形态、颜色和纹理特征参数用于不同含水量小麦籽粒之间的识别;对于整批小麦籽粒图像,由于不同含水量小麦形态特征参数差异不明显,因此只选取颜色和纹理特征参数用于不同含水量小麦样品的识别.
颜色特征参数:提取RGB(红色、绿色、蓝色)颜色模型和HSI(色调、饱和度、亮度)颜色模型中的各颜色分量均值和方差等参数用于小麦水分的识别.
形态特征参数:对于单籽粒图像,小麦籽粒形态可以通过二值图像标号将每一个小麦籽粒从整体图像中提取出来,图像经形态学运算处理后,可有效去除噪声干扰,之后利用籽粒区域和边界特性可提取籽粒形态特征.小麦形态特征参数包括籽粒长轴长、短轴长、长宽比、周长、面积、伸展度、等效圆直径、离心率、紧密度等参数.
纹理特征参数:纹理是对局部区域像素之间关系的一种度量,可用于定量描述图像中的信息.纹理特征参数包括图像的平滑度、平均对比度、一致性、三阶矩、熵等参数.
1.3.5 小麦水分含量分类识别模型的建立
小麦籽粒图像完成采集和预处理后,使用MATLAB R2010a 软件编程对单籽粒和整批小麦籽粒图像进行特征参数提取.为了减少数据冗余并缩短数据处理时间,使用逐步判别分析进一步选取对分类贡献率较大的参数,该过程使用SAS 数据处理软件完成.
模式识别过程分别使用线性参数统计分类器和BP 神经网络分类器完成,线性参数统计分类器使用SAS9.1 建立,BP 神经网络使用MATLAB 编程完成,对于不同水分含量的所有样品均使用这两种模型进行分类识别.
本研究中BP 神经网络选用单隐层结构,其神经元传递函数选用S 型正切传递函数tansig,输出层采用S 型对数传递函数logsig,网络训练函数采用trainlm.输入层神经元个数由通过逐步判别分析筛选的参数数量确定,中间层节点数通过训练来确定.由于网络输出为5 种水分含量,因此输出层的神经元应该有5 个,目标输出模式为(10000)、(01000)、(00100)、(00010)和(00001),分别对应的水分含量为10%、11%、12%、13%和14%.对于单籽粒图像,收集5 种类型水分含量小麦图像各120 个共600 个样本,随机选取其中的400 个作为训练样本,剩余的200 个作为测试样本.对于整批小麦籽粒图像,每种水分含量图像选取60 幅作为训练样本,其余40 幅作为测试样本,完成模型的学习和测试.
采集到的小麦单籽粒和整批籽粒图像如图1所示,本研究选取的小麦样品来源于同一收获年份的同一品种,避免了因小麦品种、收获年限等因素的不同对图像特征参数造成影响.
由图2 可以看出,图像经滤波处理后,噪声明显减少,图像变得清晰,图像边缘及细节部分信息也得到较完整的保存.图像的二值化处理有助于提取籽粒的形态特征信息,但是二值化处理后的图像容易使小麦籽粒形成断裂、孔洞等现象,影响籽粒区域和边界的描述.形态学图像处理可以平滑籽粒的轮廓、消除细小的突出物或孔洞,依次使用形态学处理中的开运算、闭运算对籽粒图像进行处理后,小麦籽粒图像中的孔洞或裂缝基本被清除.
小麦图像完成采集或预处理后,首先采用MATLAB 软件编程提取小麦单籽粒图像的62 个特征参数和整批籽粒图像的48 个特征参数,然后使用SAS 软件中的逐步判别分析对提取的特征参数进行筛选,参数类型及数量如表1 所示.
图1 5 种水分含量小麦的原始图像
图2 图像预处理效果
表1 逐步判别分析前后图像特征参数数量
表2 利用逐步判别分析选取的前7 个贡献较大的特征参数
通过逐步判别分析对所有特征参数进行筛选后,可有效减少数据冗余,并筛选出对识别影响较大的特征参数.对于单籽粒和整批小麦籽粒图像特征参数,分别从筛选出的特征参数中选取对水分识别影响最大的3 个参数,观察5 种水分含量之间特征参数值的差异,单籽粒与整批小麦籽粒图像的特征参数值差异分别如图3 和图4 所示.
由图3 和图4 可以看出,在小麦单籽粒图像中,随着水分含量的变化,各特征参数值并没有明显的变化,并且5 种水分含量的籽粒特征参数值存在较严重的重叠现象;在整批小麦籽粒图像中,不同水分含量样品的特征参数值之间存在较明显的差异.因此可以推断,整批小麦籽粒图像的特征参数能更好地反映水分含量的不同,使用从整批籽粒图像提取出的特征参数建立分类器,将更利于不同水分含量籽粒的识别.
2.3.1 基于线性判别分类器的分类识别
图3 单籽粒图像分析中5 种水分含量的前3 个特征参数
图4 整批籽粒图像分析中5 种水分含量的前3 个特征参数
之前的逐步判别分析已经完成了特征参数的筛选,利用筛选出的对识别贡献较大的变量,继续使用SAS 软件中的DISCRIM 过程,完成线性参数分类器的建立.以整批小麦籽粒图像水分的识别为例,将通过逐步判别分析得到的颜色和纹理特征参数用于水分的识别,利用SAS 判别分析建立各水分含量相应的线性判别模型,5 种水分含量对应的判别函数分别为:
使用上述线性判别分析模型对小麦水分进行识别,对样本训练集的正确回判率达到95%~100%,可以较好地反映小麦水分含量,对测试集的识别结果如表3 所示.
表3 整批籽粒样本测试集水分识别结果 %
使用相同的方法,将通过逐步判别分析筛选出的形态、颜色和纹理特征参数用于不同含水量小麦单籽粒特征的描述分析,可以建立单籽粒小麦水分识别模型,其测试集识别结果如表4 所示.
表4 单籽粒样本测试集水分识别结果 %
由表3 和表4 可知,使用统计分类器对小麦水分进行识别时,分类器对整批籽粒图像水分的识别正确率远远高于对单籽粒水分的识别.产生该结果的原因主要是与单籽粒图像相比,整批小麦籽粒图像的特征参数能更好地反映出水分含量的不同.
2.3.2 基于BP 神经网络模型的分类
将相同的样本使用BP 神经网络模型进行分类识别,以整批小麦籽粒图像为例,由筛选的特征参数个数可知网络的输入神经元个数为7,根据Kolmogorov 定理,隐含层可以取15 个节点.由于中间层的神经元个数直接影响网络的非线性预测性能,因此隐含层节点数分别选取11、13、15、17、19、21,采用试凑法检验不同节点个数下的网络性能,即BP 神经网络的结构为7-(11、13、15、17、19、21)-5,当网络的预测误差最小时,网络中间层的神经元个数就是最佳值.
使用不同隐含层节点数构建神经网络,学习速率定为0.05,网络训练结果表明,当中间层节点数为15 时,经过38 次训练后,网络输出的均方误差已经降低到0.008 67,达到了目标误差要求,并且网络训练时间与其他结构网络相比也较短.因此,研究中将中间层节点数选为15,神经网络结构为7-15-5.
用200 个测试集样本对神经网络模型的识别正确率进行检验,其结果如表5 所示,该模型对5种水分的识别正确率为90%~95%,总体识别正确率为92%.
表5 BP 神经网络模型对整批小麦籽粒水分的识别结果 %
使用相同的方法对单籽粒小麦水分含量进行识别,经过比较,将网络结构设计为7-17-5 时,网络性能最好.使用该模型对单籽粒测试集小麦水分进行识别,其结果如表6 所示.
表6 BP 神经网络模型对单籽粒小麦水分的识别结果 %
由表5 和表6 可以看出,使用BP 神经网络模型对小麦水分进行识别时,对整批籽粒水分的识别正确率同样高于对单籽粒小麦水分的识别.
由表3—表6 可知:从两种分类器对水分含量识别的正确率可以看出,BP 神经网络分类器的性能优于线性参数统计分类器.此外,对于整批小麦籽粒图像水分的识别,统计分类器和神经网络分类器均能得到较高的识别正确率,但两种分类器对小麦单籽粒水分的识别率较低.由之前的柱形图分析可知,与整批小麦籽粒图像相比,水分含量对单籽粒图像特征参数的影响不大,因此不同水分含量的单籽粒小麦图像特征参数差异不明显,不利于区分,识别率相应也较低.
(1)在黑色环氧树脂板背景条件下获取小麦籽粒真彩色图像,图像采集后进行的中值滤波、形态学运算等预处理,可以较好地实现图像增强和消除噪声的目的,能够满足图像特征信息提取的要求.
(2)利用图像处理技术提取了小麦单籽粒图像的形态、颜色、纹理共62 个特征参数和整批小麦籽粒图像的颜色、纹理共48 个特征参数.使用逐步判别分析对特征参数进行处理,从比较筛选出的特征参数值可知,与小麦单籽粒图像相比,整批小麦籽粒图像的特征参数能更好地反映水分含量的差异.
(3)分别建立线性参数统计分类器和BP 神经网络分类器,用于不同水分含量小麦籽粒的检测识别.其中,BP 神经网络分类器对水分的识别率高于线性参数统计分类器;两种分类器对整批小麦籽粒图像水分的识别正确率均高于对单籽粒小麦水分的识别;使用BP 神经网络模型对整批小麦籽粒的5 种水分含量进行识别,整体识别正确率达到了92%,证明将图像处理技术应用于小麦水分含量识别是可行的.
(4)目前的图像采集方法仍以静态图像采集为主,由于动态采集的图像特征表现能力相比静态图像仍比较低,难以实现实际检测中动态、实时检测的需求,如何从快速运动的小麦群体中提取有效特征信息,是一个亟需解决的问题.此外,开发相应的检测方法和评价体系,建立与标准检测方法对比的样本库,也是图像处理研究中需要关注的重点.
[1]Wan Y N,Lin C M,Chiou J F.Rice quality classification using an automatic grain quality inspection system[J].Transactions of the ASAE,2002,45(2):379-387.
[2]尚艳芬,侯彩云,常国华.基于图像识别的黄粒米自动检测研究[J].农业工程学报,2004,20(4):146-148.
[3]Courtois F,Faessel M,Bonazzi C.Assessing breakage and cracks of parboiled rice kernels by image analysis techniques[J].Food Control,2010,21(4):567-572.
[4]郝建平,杨锦忠,杜天庆,等.基于图像处理的玉米品种的种子形态分析及其分类研究[J].中国农业科学,2008,41(4):994-1002.
[5]Tao Y,Heinemann P H,Varghese Z,et al.Machine vision for color inspection of potatoes and apples[J].Transactions of the ASAE,1995,38(5):1555-1561.
[6]周竹,李小昱,陶海龙,等.基于高光谱成像技术的马铃薯外部缺陷检测[J].农业工程学报,2007,28(21):221-228.
[7]陈红,熊利荣,胡筱波,等.基于神经网络与图像处理的花生仁霉变识别方法[J].农业工程学报,2007,23(4):158-161.
[8]韩仲志,赵友刚.基于计算机视觉的花生品质分级检测研究[J].中国农业科学,2010,43(18):3882-3891.
[9]Zayas I,Lai F S,Pomeranz Y.Discrimination between wheat classes and varieties by image analysis[J].Cereal Chemistry,1986,63(1):52-56.
[10]Manickavasagan A,Sathya G,Jayas D S.Comparison of illuminations to identify wheat classes using monochrome images[J].Computers and Electronics in Agriculture,2008,63(2):237-244.
[11]Paliwal J,Shashidhar N S,Jayas D S.Grain kernel identification using kernel signature[J].Transactions of the ASAE,1999,42(6):1921-1924.
[12]Luo X,Jayas D S,Symons S J.Comparison of statistical and neural network methods for classifying cereal grains using machine vision[J].Trans of the ASAE,1999,42(2):413-419.
[13]Majumdar S,Jayas D S.Classification of cereal grains using machine vision:I.Morphology models[J].Tansactions of the ASAE,2000,43(6):1689-1694.
[14]Zhang G,Jayas D S,Jiang D Y,et al.Grain classification with combined texture model[J].Transactions of the CSAE,2001,17(1):149-153.
[15]Choudhary R,Paliwal J,Jayas D S.Classification of cereal grains using wavelet,morphological,colour,and textural features of non -touching kernel images[J].Biosystems Engineering,2008,99(3):330-337.
[16]王志军,丛培盛,周佳璐,等.基于图像处理与人工神经网络的小麦颗粒外观品质评价方法[J].农业工程学报,2007,23(1):158-161.
[17]Xie F,Pearson T,Dowell F E,et al.Detecting vitreous wheat kernels using reflectance and transmittance image analysis[J].Cereal Chemistry,2004,81(5):594-597.
[18]Wang N,Zhang N,Dowell F E.Determining vitreousness of durum wheat using transmitted and reflected images[J].Transactions of the ASAE,2005,48(1):219-222.
[19]范璐,周展明,汤坚,等.图像分析测定红麦硬度方法的研究[J].中国粮油学报,2002,17(6):28-31.