杜晓晨 张 幸 陆国权
(浙江农林大学信息工程学院1,临安 311300)
(浙江农林大学薯类作物研究所2,临安 311300)
(浙江农林大学生物种业研究中心3,临安 311300)
(浙江省农产品品质改良技术研究重点实验室4,临安 311300)
甘薯是一种重要的农作物,遍布我国各地。由于甘薯的品种繁多,不同品种的甘薯经济价值不同,存在鱼龙混杂现象,因此对甘薯加工、生产机构来说,如何智能、便捷、有效地对薯块进行薯种识别具有重要的应用价值。目前国内对薯块种类的识别主要还是依靠人工和化学的方式进行[1-2]。人工方式是通过观察薯块的外形、颜色等信息来进行判断。这种方式比较便捷,但需要专业知识,实际操作中工人未必具有相应的经验,另外这种方式具有人为因素,判断结果的准确性不能保证。化学方式是对薯块中的淀粉含量进行化学分析,并将结果用于相应薯种的化学特性进行比对[3]。这种方法的准确性有保证,但不够简便,且成本过高。
利用图像处理技术对农作物、农产品进行识别能兼顾准确性和便捷性,目前已经在很多农作物上得到了应用,如玉米、花生等[4]。对甘薯进行相关的研究较少,主要集中在质量分级和疫病检测。如:Tao等[5]进行了基于傅里叶描述子的甘薯形状检测,能将薯块分为非常好、良好、一般、差4种类型,与人工分级一致率达89%;孔彦龙等[6]通过马铃薯俯视图像的面积和侧视图像的周长为特征,实现了马铃薯质量与形状检测分级;郝敏等[7]使用Zernike矩方法对甘薯图像进行了提取特征,能对薯块形状进行分类,检测出薯形良好和正常的薯块;马晓丹等[8]针对马铃薯的疫病,提取了马铃薯叶片病斑图像中的形状、颜色等特征,并采用了量子神经网络作为分类器实现了马铃薯早期疫病的诊断。但对薯种的识别研究鲜见报道。
考虑到甘薯的横切面图像中包含着自身品种特有的颜色、纹理信息,本研究提出了一种基于图像颜色和纹理特征相结合的甘薯薯种识别方法。该方法组合了颜色直方图法、灰度共生矩阵法和Gabor滤波法提取的图像特征,融合各种方法的优势,能方便、准确地通过图像信息进行薯种识别。
数字图像质量会直接影响特征选取与薯种识别的结果。为了统一焦距和光源等因素,在图像获取环节中,自行构建了图像采集环境,它包括图像采集箱、CMOS相机、光源,如图1所示。其中,图像采集箱由木板搭建,箱内贴黑色哑光纸;相机采用OLYM-PUS(型号 E-PL5,30 mm焦距,1 600万像素,JPG图像格式),固定在图像采集箱顶部,距离样品50 cm;光源由一对LED灯组成,位于相机左右两边,功率6W,色温5 000 K。
图1 图像采集
采集甘薯横切原始图像之后,在图像预处理环节,首先找到原始图像的中心像素点所在区域,然后截取周围256×256像素范围的邻域图像作为本研究的样本图像。
肉质颜色是甘薯的重要属性之一,可以作为识别甘薯种类的依据之一。常用的颜色空间有RGB和HSV等[9-10],其中,HSV颜色空间是一种面向视觉感知的颜色模型,对比从计算机硬件角度提出的RGB颜色模型,它能更好与人眼主观感受相匹配,转换公式如下:
本试验使用多特征融合的方法进行薯种识别,为了减少特征量,将HSV空间非等间隔量化(H量化成16级,S量化成4级,V量化成4级),再将HSV3个分量合成为1个分量:
式中:Qs Qv分别是S和V的量化级数,C取值范围为[0,255],最后对C构建直方图。图2中的a和b显示了浙紫薯1号和心香薯块的横切面图像;d和e显示了其对应的HSV空间颜色直方图,显然2类薯种的肉质在HSV颜色统计值上差异明显。所以本试验将C中出现频率最高的值(即图2中纵坐标最大值所对应的横坐标值)作为颜色特征,记为f1。
图2 薯种样本的颜色特征
图2中的浙紫薯1号和心香2类薯种在肉质颜色存在较大差别,但有很多薯种之间的颜色差别并不明显,如图2中的心香和美国红,肉质的视觉直观感受都呈黄色,两者的HSV颜色直方图也较为相近。由此可见,仅靠图像的颜色信息不足以进行薯种识别。考虑到不同薯种的肉质存在差异,如:紧实程度、淀粉含量、含水率等,体现到图像中,可以发现不同薯种的图像纹理信息存在规律性的差异。故本研究进一步对薯块图像提取纹理特征,采用颜色特征和纹理特征相结合的手段来识别薯种。
灰度共生矩阵是一种经典的图像纹理分析方法,它是基于统计方法,根据图像中各个像素之间的距离、方向关系构造而成[11]。这种灰度共生矩阵能根据图像灰度值的空间信息计算出距离(Dx,Dy)的2个像素点同时存在的联合分布概率,它表达了各像素点对之间的空间关系的相关性。
从图像中灰度值为i、坐标值为x,y的像素点位置开始,计算灰度值为j,生成方向 θ(可以选择0°、45°、90°和 135°4个方向)为距离为 d(位置在 x+Dx,y+Dy)的像素点同时出现在纹理图像中的频数P(i,j,d,θ)。那么,灰度共生矩阵的数学表达式为:
p(i,j,d,θ)={[(x,y),(x+dx,y+dy)]|f(x,y)=i;f(x+dx,y+dy)=j} (5)
图3 在2个方向生成的步长为4的灰度共生矩阵
图3显示了心香和美国红薯块的横切面图像在2个在0°和90°方向生成的灰度共生矩阵图。结果显示,虽然这两类薯种的肉质颜色相近,但无论在0°或90°方向,它们的灰度共生矩阵均差异明显,表明它们的肉质纹理特性存在区分度,可以作为有效的薯种识别依据之一。Haralick等[11]通过灰度共生矩阵进一步提取了若干个通用的纹理特征:均值和、方差、熵、对比度、角二阶矩、逆差矩、相关、方差和、差的方差、和熵、差熵。根据文献[12-13]的仿真试验,在这些基于灰度共生矩阵方法得到纹理特征值中,对比度和角二阶矩最有代表性,能够很好的表示出薯块肉质纹理的粗细均匀程度和强弱程度。本研究仅保留这2个纹理特征,分别记为f2和f3,这样最终生成的混合特征向量维数能保持在较低的水平,从而提高识别算法性能。
生成方向参数θ和步长参数d是GLCM算法的应用过程中的2个重要参数,直接影响生成的纹理特征优劣。文献[12]验证了在实际应用中,θ取0°或90°合适,d取4合适(图像大小为256×256像素)。本研究也采用相同的参数设置进行薯种识别试验。
依靠纹理特征对颜色相近的薯种进行分类是本试验方法的关键。由于灰度共生矩阵法仅考虑了基于图像空域的纹理信息,单独使用未必能得到最佳效果[13]。因此,本研究拟将灰度共生矩阵与经典的Gabor滤波法相结合使用,以进一步提高识别率。Gabor滤波法与灰度共生矩阵法不同,它是基于图像的时域和频域信息进行纹理分析,能有效提取图像的整体特征并突出局部纹理信息[14],两种算法能有效互补。
针对图像f(x,y),首先定义二维小波变换:
式中:Δx、Δy表示距离间隔,一般为1;p和 q表示某像素点的坐标;m和l表示了小波变换的方向、尺度(m=0,…,M-1,l=0,…,L-1)。
φml(x,y)则可表示为:式中:x′=a-m(x cosθ+y sinθ),y′=a-m(-x sinθ+y cosθ),y′=a-m(-x sinθ+y cosθ)。φ(x,y)为母波,它根据a-m的尺度进行调整,方向θ的调整可表示为:
当母波为Gabor函数时,Gabor滤波就可以表示为:
式中:W为滤波器窗宽。
图4 W=0.5,θ=3π/4时的 Gabor滤波结果
根据文献[15]的研究,W取0.5较为合适,此时的滤波结果图像符合人的视觉感知系统。图4显示了心香薯块横切面图像的Gabor滤波结果,可以明显发现,通过滤波后,图像中的纹理细节体现的更加明显,这有利于后续特征提取。最后,对变换后的图像提取统计特征均值和能量(即:一致性),分别记为f4和f5。
采用HSV颜色直方图法提取1个颜色特征值f1;然后,将图像转为灰度图,在90°的方向上生成灰度共生矩阵,分别提取共生矩阵的对比度和角二阶矩作为纹理特征值,分别记为f2,f3;最后,对图像进行Gabor变换(窗宽设为0.5,方向设为3π/4),并对变换后的图像提取均值和能量作为另一组纹理特征值,分别记为f4,f5。这样,得到了薯种图像的混合特征向量 F=[f1,f2,…f5]。
由于本研究用到了3种特征提取算法,得到特征值区间并不一致,需要进行归一化处理。这个环节本文使用高斯归一化法,如果向量F=[f1,f2,…f5]符合高斯分布,则归一化计算可表示为:
式中:m为F的均值,σ为F的标准差。这样F最终落入[-1,1]区间内。在得到最终的特征向量F′=[f1′,f2′,…,f5′]后,建立薯种图像样本集,然后应用BP人工神经网络作为分类器进行薯种识别。
人工神经网络是一种由大量神经元连接而构成的自适应非线性学习、分类系统[16]。其中,BP人工神经网络由输入层、隐层、输出层构成,采用反向传播算法训练神经网络,具有较强学习和抗噪声能力,已被广泛应用于各种分类或预测研究。本研究应用BP人工神经网络对混合特征向量的5个分量进行融合,通过大量样本使其学习各类薯种中各项特征值的相应取值范围,从而“掌握”各类薯种的综合属性,训练得到甘薯薯种的识别模型,并最终应用于薯种的识别。
针对浙紫薯1号、心香、美国红、川薯924、徐薯26、泰中10号、北京553等10类薯种,每个薯种采集15个薯块。由于农产品生长受环境等因素的影响较大,为了检验本方法的适应性,这些薯块取自不同年份(2012年、2013年)和产地(浙江、江苏、北京等地),并统一在薯块出土1周左右进行图像获取,总共采集了150个样本图像。为了验证算法性能,针对每类薯种随机选择12幅样本图像作为训练样本,另外3幅图像作为测试样本。
分别单独使用颜色直方图法、灰度共生矩阵、Gabor滤波和本文方法对10种甘薯种类在Matlab 7.0的环境中进行了薯种识别试验。其中,BP人工神经网络中的期望误差设置为0.000 1,最大迭代次数设置为5 000次,隐层的神经元个数设置对分类结果有一定影响,当隐层神经元个数取25时,本试验的融合模型训练效果最好,试验结果如表1所示。可以看到,单独使用灰度共生矩阵法或Gabor滤波法也能取得一定的正确识别率,说明针对甘薯横切面图像中存在大量纹理信息,可以被充分利用于甘薯的薯种识别或检测研究;而颜色直方图法由于只考虑了图像的颜色信息,不少薯种的肉质颜色几乎一样,所以单独在本应用中的识别结果不理想,这与前文中主观预计一致。将3种方法融合使用后,本文方法的识别成功率得到明显提升,平均识别成功率达到了90%。这说明将灰度共生矩阵法和Gabor滤波法结合后,算法不仅提取了图像空域中的纹理,还能有效分析图像时域和频域中的局部信息,再结合颜色直方图法综合考虑了图像的颜色特征,使得本文方法充分利用了图像中的可用信息进行识别。
表1反映了本方法在算法准确性方面的性能。除了隐层的神经元个数,样本个数也对BP人工神经网络的训练结果有一定影响。图5反映了本方法的对样本个数的适应能力。由于算法在设计时已经充分考虑了特征向量在训练、分类时的计算复杂度,所以在提取特征时已经进行了优化选择,5个特征值能简洁、有效地协同工作,就10种薯类而言,当样本数量接近70个开始,本方法得到的识别成功率就趋于稳定,这说明算法具备较好的鲁棒性。综上所述,本研究提出的识别方法在准确性、鲁棒性方面的表现令人满意。
图5 试验结果
试验中的样本图像统一在薯块出土1周左右的时间进行采集。为了进一步分析本方法的适应性,再次对不同时间采集的薯块进行薯种识别试验。仍然以上述试验中的训练样本为训练样本,每类薯种另取3个薯块的横切图像为测试样本,这些测试薯块的出土时间为0.5周、1周或2周,试验结果如表2所示。可以发现,薯块出土时间的不同,颜色直方图法的识别成功率并未下降,这是因为薯块肉质的颜色在2周时间内变化并不明显;但薯块出土时间的不同,对2种纹理特征方法和本文的融合特征方法有一定影响,其中,GLCM法的识别成功率下降了6.6%,Gabor法由于突出了图像纹理细节所以仅下降了3.4%,而本文方法也下降了3.3%。这表明随着薯块出土时间的增加,淀粉含量、含水率等因素的变化会导致薯块横切图像中纹理特征产生细微变化,但变化的程度仍可接受。
表1 不同方法的试验结果
表2 不同时间获取测试样本的试验结果
本研究提出了一种基于图像处理技术的甘薯种类识别方法。通过试验验证了将颜色直方图方法、灰度共生矩阵方法以及Gabor滤波方法相结合能成功地用于薯种识别,平均识别成功率达到了90%。该方法有望应用于甘薯加工、生产、销售行业。研究表明,通过图像的颜色、纹理等信息对甘薯进行识别应用是完全可行的,这类方法具备更深、更广的研究空间。
[1]Chen Z,Schols H A,Voragen A G J.Physicochemical properties of starches obtained from three varieties of Chinese sweet potatoes[J].Journal of Food Science,2003,68(2):431-437
[2]Abegunde O K,Mu T H,Chen JW.Physicochemical characterization of sweet potato starches popularly used in chinese starch industry[J].Food Hydrocolloids,2013,33(2):169-177
[3]Tsakama M,Mwangwela A M,Manani T A,et al.Physicochemical and pasting properties of starch extracted from eleven sweetpotato varieties[J].African Journal of Food Science and Technology,2010,1(4):90-98
[4]万鹏,孙钟雷,宗力.基于计算机视觉的玉米粒形检测方法[J].中国粮油学报,2011,26(5):107-110
[5]Tao Y,Morrow C T,Heinemann PH,etal.Fourier-based separation technique for shape grading of potatoes using machine vision[J].Transactions of the ASAE,1995,38(3):949-957
[6]孔彦龙,高晓阳,李红玲,等.基于机器视觉的马铃薯质量和形状分选方法[J].农业机械学报,2012,28(17):142-148
[7]郝敏,麻硕士,郝小冬.基于Zernike矩的甘薯薯形检测[J].农业工程学报,2010,26(2):347-350
[8]马晓丹,谭峰,许少华.基于量子神经网络的马铃薯早疫病诊断模型[J].农业机械学报,2011,42(6):174-178
[9]章毓晋.图像工程上册-图像处理[M].北京:清华大学出版社,1999
[10]Vimina E R,Jacob K P.Content based image retrieval using low level features of automatically extracted regions of interest[J].Journal of Image and Graphics,2013,1(1):7-11
[11]Haralick R M.Statistical and structural approaches to texture[J].Proceeding of IEEE,1975,67(5):786-504
[12]白雪冰,王克奇,王辉.基于灰度共生矩阵的木材纹理分类方法的研究[J].哈尔滨工业大学学报,2005,37(12):1667-1670
[13]尹建新,祁亨年,冯海林,等.一种基于混合纹理特征的木板材表面缺陷检测方法[J].浙江农林大学学报,2011,28(6):937-942
[14]Jain A K,Farrokhnia F.Unsupervised texture segmentation using gabor filters[J].Pattern Recognition,1991,24(12):238-241
[15]Lee T S.Image representation using 2D gabor wavelets[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(10):959-971
[16]Goyal S.Artificial neural networks in vegetables:a comprehensive review[J].Scientific Journal of Crop Science,2013,2(7):75-94.