王 慧
(中国石油管道局工程有限公司管道学院,河北 廊坊 065000)
红枣属于鼠李科枣属,含糖量极高,营养丰富,具有较高的食用价值。成熟的红枣可以作为鲜果食用,在产量较大的地区则晾成干枣后运输和食用。红枣的加工方式多样,包括将干枣包装,以及制成果脯和蜜枣等。红枣发源于我国,也是我国独具特色的水果,比较受消费者欢迎。作为红枣的唯一出口国,近年来我国种植的红枣种类日益增加,产量和销售量也保持上升趋势。目前,我国红枣年产量超过800万t,种植规模和产量占世界总量的95%[1]。新疆是红枣产量最高的省份,该地区红枣种类丰富,部分优质品种的含糖量高达到34%,已经成为当地农业经济的重要组成部分。
受产地消费能力和自身特性的限制,红枣大多以干枣的形式运输、储藏、加工和销售。一直以来,我国农产品的加工程度和技术水平不高,高附加值产品较少。红枣产业也面临着这一问题,对我国红枣在国际市场的竞争力和产业经济效益都造成了影响。因此,提高生产与消费之间各环节的技术水平,对于我国红枣产业的发展具有重要的推动作用。
分级是对果实按照大小、形状、颜色或表面缺陷等外部性状进行检测,再根据相应的标准把品质近似的果实划分为相同等级,是水果进入市场销售前的重要处理环节。通过分级可以使各等级的水果按照相应的价格销售,以供消费者选择,对经济效益也有一定提升作用。我国红枣产业总量庞大,若完全实现品质分级,则能够极大地提高销售收入。红枣的传统分级方法是人工目测观察,或利用选果板等辅助工具依据经验评价品质。该方法简单易行,无需复杂的仪器设备,可以根据具体要求评价各种外观性状[2]。传统方法劳动强度大,无法保持较高的准确性和效率。另外,近年来随着人口年龄结构的变化,劳动力减少,该方法不再具有以往的成本优势。
科技进步催生出各种红枣的自动分级系统和方法,主要包括自动机械系统、光电系统和计算机视觉方法,它们大多以红枣尺寸大小为指标进行分级。自动机械系统在结构上具有间隙,操作时根据红枣的大小阈值调整间隙的宽度;红枣通过机械时,在离心力或重力下从小到大依次通过对应大小的间隙,最终得到分离。红枣自动分级机械按照分级的核心部件可以分为带式、滚筒式和滚杠式,这些机械的分级效率高,通用性较好,有的已在实际生产中得到应用[3]。它们的缺点在于只能识别单一性状,运行过程中的碰撞磨损会引起损伤,影响了其推广应用。光电式分级是利用光电传感器检测红枣对光线的遮挡时间,从而推测其长度和大小[4]。这种系统的自动化程度和精确度很高,且克服了自动机械碰撞引起的损伤问题;但是检测指标的稳定性没有得到改善,离实际应用还有距离。
计算机视觉是在计算机科学和信息技术基础上建立起来的,能够将采集的图像转换为数字信号,然后识别和分析目标特征。计算机视觉的应用领域广阔,瓜果蔬菜的分级是其中之一[5]。与之前的分级方法相比,计算机视觉能够克服主观因素干扰,检测精确度较高,并且能实现无损分级。计算机视觉应用于红枣分级的研究较多,出现了与之相关的各种分级设备、检测方法和分析算法,而分级的实时性和通量是目前需要重点解决的问题[6-8]。
在检测多种性状的情况下,基于计算机视觉的分级检测计算量极大,对硬件和成本提出了更高的要求。因此,外观特征和算法变得尤为重要,此时图像边缘便成为较为理想的选择。边缘检测是检测图像中的像素在其区域中灰度阶跃变化,通过相邻的导数变化规律来体现边缘,即利用特定算法提取目标与背景的分界线[9]。作为计算机视觉的分支,图像边缘检测已经演化出了多种算法,这些算法都有各自的优缺点,并适用于各种外观特性的农产品,包括鸭蛋、烟草、苹果、大米和红枣[10-14]。本研究提出了一种基于图像边缘检测的红枣分级方法,利用小波变换、自适应Canny算法和梯度算法分别对红枣的大小和表面缺陷进行识别和检测,作为等级划分的指标。最后,试验验证上述3种算法的检测精确性,以期筛选最适宜的算法,为实现红枣的自动化分级提供技术支撑。
将红枣样品放在传送带上,模拟自动分级流水线移动,移动速度为0.5m/s。照相设备为1台世纪科信UCMOS0300型CCD工业相机,安装在红枣样品上方。相机拍摄获取红枣的图像,然后传送给计算机并转换成数字信号,用MatLab工具箱所带的边缘检测程序进行分析。
红枣原始图像大小为640×480,JEPG格式。图像中的背景为黑色,目标样品显示为红色。运动状态导致图像质量下降,对后续的处理分析造成了干扰。这里对图像通过5×5的中值滤波做平滑处理,去除干扰因素,增强图像的质量,如图1所示。
灰度化处理是图像边缘检测的前提条件。图1中只有一种背景颜色,并且与检测样品之间的差异明显,可以通过RGB这3种通道的色彩模式做灰度化处理。鉴于边缘检测目标的主体颜色为深红,RGB色彩空间的B通道可以表现最明显的峰值,得到理想的分割和识别效果。因此,采用基于B通道的阈值分割法进行灰度化处理,如图2所示。
灰度化的图像再进行HIS加权的二值化,消除背景和目标范围内的各种毛刺和噪音点。以B通道的峰值特征为依据设定图像分割阈值,然后分别利用小波变换、自适应Canny算法和梯度算法检测目标的边缘,最终得到红枣及其表面缺陷区域的轮廓,并计算面积。
图1 红枣的原始图像
图2 红枣的灰度化图像
梯度算法以傅立叶变换为基础,专门用于彩色图像的边缘检测。该算法采用RGB色彩空间,分别对每个像素点在R、G、B上的分量计算梯度值,然后用快速最大熵法确定阈值,基于阈值判别其是否为边缘点。由于引用了并行的微分算法和快速最大熵阈值,梯度算法的计算简单,检测边缘的速度快,具有很好的实时性。
Canny算法属于阶梯型边缘检测算法,先用指定标准差Guass滤波器获得原始图像的平滑滤波,再进行高斯函数滤波,产生梯度矢量计算公式,对图像边缘的定义为在特定方向上矢量模具有极大值的点。Canny算子精确度较高,但会产生假边缘和局部边缘丢失现象。自适应Canny算法针对上述缺点,引入信息熵来适应Canny算子的高低阈值。信息熵用于反映平均信息源的不确定性,根据信息熵最大时的Canny算子阈值可以将图像分为目标和背景两部分。
小波变换对边缘的定义为灰度突变明显的像素点,即一阶微分极大值点或二阶微分过零点。小波变换以奇异性检测图像边缘,对信号的分析较精确。平滑二维函数计算方法参考姚娜等的研究[14],通过与水平方向的夹角确定梯度矢量的极值,再利用阈值分割便可以获得图像的边缘;最后,根据目标的方向,进行相应角度的小波变换。
本研究将图像边缘检测用于对红枣的大小和表面缺陷进行分级,红枣的大小以单个红枣图像的面积来反映。计算组成边缘的像素点数可以得到边缘周长,将红枣按照圆形处理,算出红枣的面积。这种方法虽然不能准确反映红枣的实际大小,但不会影响相对比较的结果。红枣的表面缺陷一般是由蹭碰和害虫啃食引起,呈现明显的白色。因此,通过设定RGB色彩空间的相关阈值,便可以使表面缺陷的区域显示出来。检测缺陷区域所包含的像素点数,并计算其占整个红枣图像的比例。
试验选用的样品为从市场购买的哈密红枣干制品,经过初步分拣,去除了严重霉烂和畸形的个体。随机选择50个红枣编号并用天平称重,以3个质量3.5、4.0、4.5g为阈值,将红枣划分为4、3、2、1级。进行图像边缘检测后计算图像面积,根据各个等级红枣的检测结果确定等级划分的图像面积阈值;然后选择4个等级的红枣各25个,其中10个具有表面缺陷,再进行基于图像边缘检测的自动分级,比较分级结果的准确性。人工判定表面缺陷的依据为缺陷区域面积占单枣面积超过10%,验证的方法同上。
红枣边缘检测的效果如图3所示。由图3可以看出:梯度算法能检测到完整的边缘,但是内部线条较多,可能会对分级结果造成影响[见图3(a)];自适应Canny算法检测到的线条较少,边缘的清晰度和连续性都较好,是最为理想的检测算法[见图3(b)];小波变换检测到的线条最少,但是断点较多,边缘的完整性差,可能导致无法识别整个红枣[见图3(c)]。总体而言,3种算法对边缘的定位精度都很高,也能有效检测到表面缺陷。
图3 红枣图像的边缘检测
3种算法的分级准确性如表1所示。由表1可知:梯度算法、自适应Canny算法和小波变换对各级红枣大小的分级准确率分别为92%、97%和94%。其中,自适应Canny算法的分级效果最好。3种算法都有个别的表面缺陷漏检问题,可能是由拍摄角度遮挡造成的。
表1 准确分级的红枣数目
建立了一种基于图像边缘检测的红枣分级方法,利用工业相机拍摄图像并进行预处理和灰度化;然后利用小波变换、自适应Canny算法和梯度算法检测边缘,并计算红枣的大小和表面缺陷面积比率,作为等级划分的指标。试验表明:这3种算法对边缘的定位精度都很高,也能有效检测到表面缺陷。3种算法都有各自的优缺点,其中自适应Canny算法所得的边缘清晰度和连续性较好,是最为理想的检测算法。
本研究用于验证的红枣品种为哈密红枣干制品,因不同品种在大小和性状上的差异,若上述算法应用于其它红枣的检测分级,则还需对相应的参数和阈值进行重新设定。另外,图像边缘检测只是解决了理论和软件问题,这些算法还需要与相适应的硬件和机械装置整合集成,才能实现红枣的自动化分级,为红枣产业的发展提供技术支撑。