王 亮
(安徽机电职业技术学院,安徽 芜湖 241000)
赣南是我国脐橙的主要产销地,其脐橙味道鲜美,已销往全国各地,包括港澳台等地区。但其工业水平相对落后,其脐橙分级检测基本上采用人工检测的方式[1],虽然其识别率很高,但其需要消耗大量的人力,且劳动强度大、检测效率低下。
近来年,随着人工智能技术及机器视觉技术的发展,农产品及水果的检测分级也逐渐采用智能方式,李聪、高海燕等[2]为了解决传统苹果分级优化方法的单一特征问题,建立基于最小二乘支持向量机的苹果自动分级模型,加快了苹果自动分级速度;施健、何建国等人利用单片机高性能、低成本的特点,实现了鲜枣大小的快速分级,但其检测率收到一定的限制;为了实现棉田中不同类型杂草对棉花识别的影响,文献[3]提出基于主成分分析和支持向量机的杂草识别方法,通过试验结果证明该方法具有识别率高、训练时间短等优点;许月明[4]等对槟榔分级研究,提取形状、颜色、纹理特征,综合性较强,但识别率效果欠佳;也有研究采用多个特征向量进行分级,识别率较高,由于考虑的特征量较多导致系统的实时性降低[5-7]。通过考虑脐橙的形状特征,拟通过提取脐橙的大小、表面缺陷等特征,建立极限学习机的综合分级模型,实现脐橙的准确分级。
试验所用的脐橙样本均由江西中新云农科技有限公司提供,产地江西赣州。受限于实验室的平台条件,将使用Cannon PowerShot SD1200相机为图像采集设备,将采集到的图像存入计算进行图像处理,其图像采集处理系统见图1。图像采集在封闭箱中进行,光照条件是荧光灯,背景是蓝黑色,为了提高图像处理的速度,图像采用640×480像素,存储格式bmp。
脐橙检测分级系统采用北京达盛科技有限公司的EL_DM6437达芬奇图像处理设备,其主芯片为TI的TMS320DM6437(DSP),其主频为600MHz,其处理速度快、外设丰富,同时含有DSP子系统与视频处理子系统(VPSS)。其中,VPSS前端包括CCD控制器、预览器以及图像缩放装置等;VPSS后端包括0SD模块及视频编码器。
脐橙的整个分级系统由图像预处理、特征参数提取以及极限学习机分类的构建和测试三个部分组成,其处理流程如图2所示。
进行图像处理过程中,图像的颜色模型至关重要。根据自然界的颜色分类,所有的研究均可分解为红(Red)、绿(Green)及蓝色(Blue),即RGB模型,基于RGB模型得到试验过程中采集到的脐橙RGB分量图如图3所示。
由图3可知,相比较G分量与B分量,B分量的颜色与背景颜色的差异相对较大,其表面缺陷的差异更加明显,便于后续的图像预处理[8]。因此,选用R分量图作为后续工作的输入图。
图像处理过程中,噪声无处不在,特别对于机器视觉系统,其输送带运动过程中产生的噪声对脐橙的检测产生较大的影响。因此,需要对噪声进行抑制甚至消除。综合比较去噪算法,选用中值滤波对图像进行去噪处理。
大小是脐橙分级的重要特征之一,通常定义脐橙果实赤道部位的横经为其大小。根据R分量的图像参数,采用划线法对图像进行阈值分割来提取脐橙的大小特征参数,得到各像素点的灰度值如图4所示。
由于脐橙的边界接近于椭圆形,可使用最小二乘法对边界点进行线性回归,建立拟合的椭圆,分别用椭圆的长轴与短轴来描述脐橙的横径与纵径,得到的实验结果如图5所示。其横径对应的回归模型为y=0.288x+16.75;其纵轴对应的回归模型为y=0.982x+1.228,其相关系数为0.9802,最大相对误差为4.1%。
在脐橙分级检测中,表面缺陷对其影响最大,常见的缺陷包括腐烂(呈现出灰绿色),病斑、溃疡、裂果(呈现出黑灰色)。
脐橙正常表面和缺陷部分的颜色直方图有明显的不同,考虑计算正常表面与缺陷部分颜色分量(RGB)的平均值,找到能区分正常与缺陷的参数,再遍历脐橙图像的所有像素点[9],大于该参数为正常像素点,否则为缺陷像素点,且将该像素点变成红色。本研究选择R/B=2和G/B=1.6作为分割正常与缺陷的阈值,结果如图6所示。
脐橙果面颜色为橙色,为了将亮度信息和图像携带的信息区分开,结合RGB颜色模型和HIS颜色模型来提取脐橙的颜色特征,从RGB转换到HIS模型的转换公式为:
(1)
(2)
(R+G+B)/3
(3)
选取110个脐橙样本,其正确率达到95%左右,验证所选取算法的精确性。
极限学习机(extreme learning machine,ELM)是Hang等[10]于2006年提出的一种适用于单隐层前馈神经网络的新型学习算法模型,该算法在训练前只需设置合适的隐层节点数,随机给输入节点和隐层节电的权值与阈值赋值,在训练过程中无需调整便可获得唯一的最优解,优点是学习速度快、泛化性能好。
给定任意N个样本(xi,yi),其中xi=[xi1,xi2,…,xin]T∈Rn是样本输入值,yi=[yi1,yi2,…,yin]T∈Rn是期望输出值,激活函数g(x)是无限可微的,单隐层神经网络模型如图7所示。
学习机模型可表示为:
(4)
式中j,1,2,…,N,wi=[wi1,wi2,win]T是输入层节点与第i个隐含层节点的连接权值向量;βi=[βi1,βi2,…βin]是第i个隐含节点与网络输出层节点的连接权值向量;yi=[yi1,yi2,…,yim]是网络的输出值。对于任意的w和b,误差函数E可表示为:
(5)
将其写成矩阵形式,Hβ=Y,其中
H=(w1,w2,…,wL;b1,b2,…,bL;x1,x2,…,xL)=
由此可知,ELM在计算过程中不需要调整过多参数,训练速度较其他算法更快。
为了提高ELM的识别准确率,要选取较好的激活函数,常用的有Sigmoidal、Sine和Hardlim几种[11],通过分析不同神经元个数对准确率的影响,最终选择Sigmoidal函数作为ELM的激活函数。当隐含神经元个数与训练样本个数相等时,ELM可以以零误差逼近所有训练样本。当神经元个数逐渐增多时,测试样本识别准确率逐渐降低,需要综合考虑进行选择,本研究选用30作为隐含神经元的个数。
脐橙的级别在出厂时已由专业人员通过评定确定了等级,分别为特级、一级、二级、三级、级外。其中特级果是脐橙横径在7.5到8.5厘米之间,果形为椭圆,着色率大于90%,表面光洁;一级果的着色率大于80%,表面附着物面积不超过10%;二级果的横径在7到9厘米之间,着色率80%以上,表面附着物面积不超过15%;三级果的横径在6.5至9.5之间,附着物面积不超过20%;级外的特征是特大特小尺寸,着色率差。其分级流程图如图8所示。
实验共采集了326幅图像,其中特级30幅,一级48幅,二级110幅,三级95幅,级外33幅,以Sigmoidal函数为激活函数,隐含神经元个数为30进行识别分析。识别结果如表1所示。可见,激活函数为Sigmoidal,隐含神经元个数为30的极限学习机能够准确对脐橙进行分级,误差小于4%。
表1 识别结果
研究通过对脐橙图像进行预处理,选择HIS颜色模型,R分量灰度图,对图像去噪,分别提取脐橙的大小特征、缺陷特征和颜色特征。构建极限学习机,选取Sigmoidal为激活函数,隐含神经元个数为30,试验测得该模型的正确分级率较高。结果表明利用机器视觉技术将不同等级的脐橙识别出来是可行的,为脐橙的分级检测提供了参考,也为其他球类农产品的检测提供了实际参考价值。