基于SSA睰means聚类算法的青菜杂质图像分割

2024-05-22 14:30刘可心赵爽苗玉彬
中国农机化学报 2024年2期

刘可心 赵爽 苗玉彬

摘要:為解决青菜包装生产线在加工过程中的杂质在线检测问题,提出一种基于SSAKmeans的青菜杂质图像分割算法。首先利用直方图均衡化进行彩色图像增强以降低光照影响;其次基于麻雀搜索算法对初始聚类中心寻优,根据得到的最佳聚类中心,选取包含颜色信息的ab二维数据进行Kmeans聚类;然后对聚类后的图像二值化处理并用形态学滤波方法校正,最终完成图像分割。利用该算法对落叶、枯叶和黄叶等杂质进行图像分割试验,杂质平均匹配率为93.22%,平均误分率为0.70%,平均准确率为92.52%。与FCM算法、Kmeans算法、PSOKmeans算法的对比试验表明:本文算法分割精度更优,对不同杂质的分割均表现出良好的鲁棒性,为实现青菜杂质在线检测提供一种新方法支撑,对提高青菜机械化生产水平具有一定的实用价值。

关键词:青菜生产;杂质检测;Kmeans聚类;麻雀搜索算法

中图分类号:S636: TP391.4

文献标识码:A

文章编号:20955553 (2024) 02015106

收稿日期:2022年4月7日  修回日期:2022年5月10日

基金项目:上海市科技兴农项目(沪农科创字(2019)第2-2号);国家自然科学基金项目(51975361)

第一作者:刘可心,女,1997年生,河北石家庄人,硕士研究生;研究方向为机械优化设计、机器视觉。Email: 932589630@qq.com

通讯作者:赵爽,女,1973年生,山东菏泽人,博士,副教授;研究方向为机械优化设计、机器视觉。Email: zhaos@sdju.edu.cn

Image segmentation of green vegetable impurities based on SSAKmeans clustering algorithm

Liu Kexin1, Zhao Shuang1, Miao Yubin2

(1. School of Mechanical Engineering, Shanghai Dianji University, Shanghai, 201100, China;

2. School of Mechanical Engineering, Shanghai Jiao Tong University, Shanghai, 201100, China)

Abstract:

In order to solve the problem of online detection of impurities in green vegetable packaging production line during processing, a green vegetable impurity image segmentation algorithm based on SSAKmeans is proposed. Firstly, the color image is enhanced by histogram equalization to reduce the effect of illumination. Secondly, the initial clustering center is optimized based on the sparrow search algorithm, and the ab twodimensional data containing color information is selected for Kmeans clustering according to the best clustering center obtained. After that, the clustered image is binarized and corrected by morphological filtering method to finally complete the image segmentation. Using this algorithm for image segmentation experiments on impurities such as fallen leaves, dead leaves and yellow leaves, the average matching rate of impurities is 93.22%, the average misclassification rate is 0.70%, and the average accuracy rate is 92.52%. The comparison experiments with FCM algorithm, Kmeans algorithm and PSOKmeans algorithm show that the segmentation accuracy of the algorithm in this paper is better, and the segmentation of different impurities shows good robustness, which provides a new method to support the realization of automatic picking of impurities in green vegetable and has certain practical value to improve the mechanized production of green vegetable.

Keywords:

green vegetable production; impurity detection; Kmeans clustering; sparrow search algorithm

0 引言

杂质不仅严重影响青菜感官品质,还会给消费者带来食用安全风险,需要及时进行检测并剔除[1]。目前青菜包装生产线上的杂质检测主要依靠人工判断挑拣,劳动强度大、检测效率低、难以满足实际生产需求,亟须一种快速、有效的方法用于青菜杂质检测。

相比于人工目检、破坏性检测等传统检测方法,无损检测是一种新兴的现代检测技术,在农产品和食品生产加工方面得到广泛应用。根据检测原理的不同,可分为光学、声学、电磁学等方法。X射线技术能够检测出食品(如肉类[2]、面包[3])中的塑料、石头等多种杂质。超声检测技术可用于识别方腿中不同尺寸的玻璃、金属等异物[4]。光学检测是利用電磁波谱不同波段的特性进行检测的一种方法,其中机器视觉技术用相机代替人眼进行检测,快速、准确且成本更低,大量应用于农产品收获和采后处理环节[56]。邵志明等[7]利用近红外成像技术和阈值分割方法对苹果早期损伤进行检测,即时损伤的判别准确率达到90%。席芮等[8]提出基于混沌优化K均值算法实现了对马铃薯芽眼的快速、精准分割。李帼等[9]在分析EXG超绿分割和GrabCut算法优缺点的基础上提出了一种分割精度更高的改进算法用于黄瓜植株图像的分割。近年来,随着深度学习技术的发展,已有许多学者将基于深度学习的图像分割应用于农业工程领域[10]。但深度学习由大数据驱动,如何获取大量数据、需要多少训练数据尚缺乏统一标准,且模型训练过程难以可视化,可解释性较差。

针对以上问题,围绕青菜包装生产线中的杂质检测需求,本文提出一种基于SSAKmeans聚类的图像分割方法,利用麻雀搜索算法较好的全局搜索和局部开发能力,快速优化初始聚类中心,可以有效改善传统Kmeans算法易陷入局部最优解的问题,提高青菜杂质图像的分割质量和速度,为实现青菜生产线中杂质的在线检测提供技术支持。

1 青菜杂质图像采集与预处理

1.1 杂质图像采集

本文试验选用的青菜品种为上海青,杂质为青菜采收过程中常见的落叶、枯叶和黄叶。在包装车间内通过工业相机对生产线上的青菜和杂质进行数据采集,共获取50张青菜杂质图像。根据杂质类型不同,将采集到的图像分为3组,其中落叶图像17张,枯叶图像15张,黄叶图像18张。图像大小为640像素×480像素,格式为JPEG。在Matlab2021a试验平台下编程实现图像处理算法,试验环境如下:操作系统Windows10,处理器为Intel (R)Core (TM)i5-10200H@2.4 GHz,内存16 GB。

1.2 图像预处理

包装车间内采集到的青菜杂质图像光线分布不均匀,存在局部过明或过暗,需要对原图进行彩色图像增强和中值滤波降噪处理,如图1所示。为此,首先将图像转换到Lab颜色空间,对光度层L进行直方图均衡化后转换回RGB格式,然后用中值滤波的方法去除图像噪声。该操作在保留原始颜色的基础上使像素值分布更加均匀,有效减少了环境因素给后续杂质分割工作带来的困难。

(a) 原始图像

(b) 预处理图像

2 基于SSAKmeans的杂质检测算法

2.1 基于SSA的Kmeans聚类分割

Kmeans是一种无监督的聚类算法,由于参数简洁,时间复杂度低已成功应用于各种农作物图像分割,取得了良好的分割效果[11]。但传统的K均值聚类算法易受初始聚类中心的影响,随机选择的聚类中心容易使算法陷入局部最优解,造成错误分割,影响分割质量[12]。麻雀搜索算法(Sparrow Search Algorithm,SSA)是Xue等[13]于2020年首次提出的一种新型群智能优化算法。与粒子群算法、蚁群算法等传统优化算法相比,麻雀搜索算法在搜索精度、收敛速度等多方面表现更为优异,因此本文利用麻雀搜索算法的全局寻优能力对Kmeans聚类算法进行优化,实现两种算法的有机结合,可以有效改善初始聚类质量,提高图像分割效率。算法的具体实现步骤如下。

1)  给定由n个像素点组成的样本数据集X,对样本数据随机采样,作为麻雀搜索聚类候选点。

2)  将聚类准则函数J作为麻雀搜索的适应度函数,设置麻雀种群参数。

J=∑Kj=1∑X∈W(t)j‖X-C(t+1)j‖2

(1)

式中:

K——聚类中心个数;

W(t)j——

第t次迭代中第j个簇中的数据样本;

C(t+1)j——

在第t+1次迭代中第j个聚类中心的位置。

3) 初始化种群,计算适应度并排序。

4)  依次更新发现者、跟随者和预警者的位置。

Xt+1i,j=

Xti,j·exp-iα·itermaxif R2

Xti,j+Q·Lif R2≥ST

(2)

式中:

t——当前迭代次数;

Xi,j——

第i个麻雀种群在第j维中的位置信息;

α——0~1之间的随机数;

itermax——最大迭代次数;

Q——一个服从正态分布的随机数;

L——

一个1×d并且元素全为1的矩阵;

R2——

安全值,R2∈[0,1];

ST——警报值,ST∈[0.5,1]。

Xt+1i,j=

Q·expXtworst-Xti,ji2if i>n/2

Xt+1p+|Xti,j-Xt+1p|·A+·Lotherwise

(3)

式中:

Xp——發现者搜索的最优位置;

Xworst——当前全局最差位置;

A——

随机赋值为1或-1的1×d矩阵,且满足

A+=AT(AAT)-1。

Xt+1i,j=

Xtbest+β·|Xti,j-Xtbest|if fi>fg

Xti,j+K1·|Xti,j-Xtworst|(fi-fw)+εif fi=fg

(4)

式中:

Xbest——当前全局最优值;

β——步长控制参数,服从标准正态分布;

K1——一个随机数,K∈[0,1];

fi——当前个体适应度值;

fg——当前最佳适应度值;

fw——当前最差适应度值;

ε——一个避免分母为0的常数。

5)  重复步骤3、步骤4直到迭代结束,得到K个全局最佳位置。

6)  以K个最佳位置作为初始聚类中心,划分图像像素点。

7)  计算新的聚类中心以及聚类准则函数值。

8)  重复步骤6、步骤7直到聚类准则函数J值收敛,聚类中心不再发生改变,实现图像分割。

为了降低光照影响,选取包含全部颜色信息的ab二维图像数据作为输入,基于上述算法对青菜杂质图像进行分割,并交替使用开闭运算校正分割图像,得到最终杂质分割结果。

2.2 图像分割效果评价

分割后的图像为一幅二值图像,1代表目标(杂质)像素,0代表背景像素。统计自动分割与标准分割图像的像素值,从全局和目标两个角度定义匹配率MAT、误分率MIS以及二者差值准确率ACC评价图像分割性能。其中匹配率越高,误分率越低,则准确率越高,图像分割效果越好。理想情况下,匹配率为100%,误分率为0,准确率为100%。具体公式如式(5)、式(6)所示。

MAT=∑mi=1∑nj=1(P(i,j)∩Q(i,j))=1

∑mi=1∑nj=1Q(i,j)=1

(5)

MIS=∑mi=1∑nj=1(P(i,j)!=Q(i,j))m×n

(6)

式中:

P(i,j)——自动分割图像的像素值;

Q(i,j)——标准分割图像的像素值;

m×n——图像像素总数。

3 结果与分析

在青菜包装产线上采集了3组不同杂质图像,各抽取15张共45张图片,按2∶1的比例划分训练集和测试集用于分割试验。试验主要分为两部分:(1)利用基于SSAKmeans分割算法在训练集上分别对3组青菜杂质图像进行分割,得到3种杂质的分割结果并统计评价指标的平均值;(2)为了更好地说明算法的有效性,采用模糊C均值聚类(FCM)、传统Kmeans和基于PSO优化Kmeans三种分割算法与本文算法在测试集上进行对比试验,得到不同算法的图像分割效果图并统计分割精度和速度指标的平均值。

3.1 试验结果及分析

落叶、枯叶以及黄叶三种杂质的分割结果如图2~图4所示。三组杂质分割性能指标的平均值如表1所示。

从图2~图4可以看出,本文算法能够将三种杂质从复杂的青菜生产背景中较为完整的分离出来。针对图2(c)中落叶边缘的毛刺以及图3(c)和图4(c)中存在的少量噪点,经过多次形态学滤波处理,可获得边缘光滑、轮廓清晰的杂质分割图像。

(a) 原图

(b) SSAKmeans分割目标

(c) 二值化后的图像

(d) 形态学滤波后的图像

(a) 原图

(b) SSAKmeans分割目标

(c) 二值化后的图像

(d) 形态学滤波后的图像

(a) 原图

(b) SSAKmeans分割目标

(c) 二值化后的图像

(d) 形态学滤波后的图像

从准确率来看,本文算法对于落叶的分割准确率最高,达到94.59%;黄叶的分割准确率最低为90.56%。主要原因在于发黄的叶片与正常青菜的茎部颜色相似,增加了分割难度,造成准确率降低。从匹配率和误分率来看,落叶分割具有最高的匹配率94.89%和最低的误分率0.30%。由于落叶形状较为规则且颜色与正常青菜具有较大差异,在分割过程中更容易完整的分离出轮廓,减少误分割的情况。而枯叶和黄叶由于形状不规则且与正常青菜颜色相近,容易将青菜背景误分为前景,影响分割效果。

总体来看,本文算法对于落叶、枯叶以及黄叶三种杂质的分割匹配率和准确率均在90%以上,误分率控制在1%以下,说明该算法对于不同颜色和形状的三种杂质均具有良好的分割性能,能够准确、完整地将杂质从青菜背景中分离出来。

3.2 算法评价及分析

为说明本文算法的优越性,分别采用FCM算法、Kmeans聚类算法等多种算法与本文算法进行三种杂质的分割试验。从图像分割效果来看(图5~图7),FCM算法对于三种杂质的分割效果不佳,存在大量将青菜以及传送带背景误分为前景的情况,不能有效地对杂质进行分割。Kmeans算法基本实现了三种杂质与青菜背景的分离,达到杂质识别效果。但对于青菜与传送带的交界部分处理地不够好,残留了部分青菜边缘,分割质量不佳。而基于粒子群算法改进的Kmeans算法对于落叶和枯叶两种杂质的分割效果较好,可以完整地分离出杂质边缘,仅存留少量噪点,分割质量较高。但该算法对黄叶杂质的分割效果仍不理想,青菜背景处理地不够干净,造成青菜边缘误分割的情况。本文算法可以干净、完整的分割出三种杂质图像。对落叶和枯叶杂质的分割轮廓完整、边缘清晰,不仅实现了黄叶杂质与复杂背景的分离,对于被正常青菜遮挡住的黄叶部分也有一定的识别效果。由此可见,本文算法整体分割质量明显优于其他算法,分割效果最佳。

(a) 原圖

(b) FCM算法

(c) Kmeans算法

(d) PSOKmeans算法

(e) 本文算法

从表2可以看出,在分割精度方面,本文改进算法对于三种杂质分割的平均准确率为93.93%,平均匹配率和平均误分率分别为94.71%、0.70%,均优于其他三种算法,表明本文改进算法在分割精度上具有较大优势。而FCM算法对于三种杂质分割的平均匹配率、误分率以及准确率与其他三种算法均具有较大差距,分割效果最差。对于落叶,本文算法和其他两种算法均具有较好的分割效果,平均分割匹配率和准确率均高于90%,误分率低于0.5%;对于枯叶和黄叶,本文算法明显优于其他两种算法,仍具有90%以上的匹配率和准确率,保持2%以下的误分率。因此本文算法的分割性能不会因杂质类型不同产生较大变化,具有较好的鲁棒性。

(a) 原图

(b) FCM算法

(c) Kmeans算法

(d) PSOKmeans算法

(e) 本文算法

(a) 原图

(b) FCM算法

(c) Kmeans算法

(d) PSOKmeans算法

(e) 本文算法

在分割速度方面,由于杂质的颜色和形状不同以及青菜生产环境的复杂性,不同算法处理不同杂质图像的时间会有一定差异,如表3所示。

总体来看,本文算法对于三种杂质的平均分割速度明显优于FCM和PSOKmeans两种算法,比Kmeans算法的分割速度稍慢。基于SSA改进的Kmeans算法需要先运行麻雀搜索算法对初始聚类中心寻优,再利用Kmeans算法聚类分割得到杂质图像,因此运行时间会大于单独使用Kmeans算法。但本文算法的平均分割速度为2.58 s/帧,相比于其他算法具有明显优势,而且对于不同杂质的分割速度差别不大,表明该算法具有较好的稳定性。

4 结论

针对青菜生产加工过程中杂质在线检测问题,本文提出一种基于SSA改进Kmeans聚类算法的图像分割方法,试验结果表明该方法对青菜中常见的落叶、枯叶以及黄叶三类杂质均具有良好的分割效果。

1) 在Lab颜色空间中对青菜杂质图像预处理,在光度层L中进行直方图均衡化,调整图像亮度,增强彩色图像细节;用中值滤波去除图像噪声。经过上述处理,原始图像的噪声降低,光照更加均匀,有效降低环境因素对青菜杂质分割造成的影响。

2) 针对传统Kmeans算法随机选取初始聚类中心导致聚类结果不稳定的问题,提出一种基于SSAKmeans聚类算法。利用麻雀搜索算法强大的全局搜索能力,自适应地对初始聚类中心快速寻优,有效改善聚类效果,提高图像分割质量。

3) 采用本文算法分别对三组青菜杂质图像进行分割试验,得到三种杂质分割的平均匹配率为93.22%,平均误分率为0.70%,平均准确率为92.52%,表明本文算法对青菜中的三种杂质均具有较好的分割效果。将本文算法与FCM算法、Kmeans算法以及PSOKmeans算法进行对比实验,结果表明本文算法具有最佳的分割精度和良好的鲁棒性,能够快速、有效地将三种杂质从杂乱的青菜生产背景中分离出来。

本文所提算法对于包含同类杂质的三种青菜杂质图像均获得了精确而稳定的分割效果,但在实际青菜包装生产环境中,可能会出现同时混有两种及以上杂质的情况,因此后续将对同时识别青菜中的多种杂质以及深度学习中的实时检测算法开展研究,以期为包装产线中青菜杂质在线检测提供技术参考,推动青菜生产向机械化、自动化、智能化方向发展。

参 考 文 献

[1]熊传武. 探究不同国家和地区的食品异物风险[J]. 食品安全导刊, 2019(19): 22-25.

[2]Li F, Liu Z, Sun T, et al. Confocal threedimensional micro Xray scatter imaging for nondestructive detecting foreign bodies with low density and lowZ materials in food products [J]. Food Control, 2015, 54: 120-125.

[3]Einarsdóttir H, Emerson M J, Clemmensen L H, et al. Novelty detection of foreign objects in food using multimodal Xray imaging [J]. Food Control, 2016, 67: 39-47.

[4]张俊俊, 赵号, 翟晓东, 等. 基于超声成像技术的方腿中异物检测[J]. 中国食品学报, 2019, 19(8): 223-229.

Zhang Junjun, Zhao Hao, Zhai Xiaodong, et al. Detection of foreign body in luncheon sausage based on ultrasonic imaging technology [J]. Journal of Chinese Institute of Food Science and Technology, 2019, 19(8): 223-229.

[5]谢为俊, 魏硕, 王凤贺, 等. 基于机器视觉的胡萝卜表面缺陷识别方法研究[J]. 农业机械学报, 2020, 51(S1):450-456.

Xie Weijun, Wei Shuo, Wang Fenghe, et al. Machine vision based detection method of carrot external defects [J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(S1): 450-456.

[6]谢丽娟, 戴犇辉, 洪友君, 等. 基于全卷积神经网络的核桃异物检测装备设计与试验[J]. 农业机械学报, 2022, 53(5): 385-391.

Xie Lijuan, Dai Benhui, Hong Youjun, et al. Design and test of detecting system for impurities in walnut based on full convolutional neural network algorithm [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(5): 385-391.

[7]邵志明, 王怀彬, 董志城, 等. 基于近红外相机成像和阈值分割的苹果早期损伤检测[J]. 农业机械学报, 2021, 52(S1): 134-139.

Shao Zhiming, Wang Huaibin, Dong Zhicheng, et al. early bruises detection method of apple surface based on near infrared camera imaging technology and image threshold segmentation method [J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(S1): 134-139.

[8]席芮, 侯加林, 李立成. 基于混沌优化K均值算法的马铃薯芽眼的快速分割(英文)[J]. 农业工程学报, 2019, 35(5):190-196.

Xi Rui, Hou Jialin, Li Licheng, et al. Fast segmentation on potato buds with chaos optimizationbased Kmeans algorithm [J]. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(5): 190-196.

[9]李幗, 曹苏艳, 钱婷婷, 等. 基于改进GrabCut算法的黄瓜植株图像分割[J]. 中国农机化学报, 2021, 42(3): 159-165.

Li Guo, Cao Suyan, Qian Tingting, et al. Image segmentation of cucumber plants based on improved GrabCut algorithm [J]. Journal of Agricultural Mechanization, 2021, 42(3): 159-165.

[10]薛君蕊, 王昱潭, 曲爱丽, 等. 基于改进FCN-8s的灵武长枣图像分割方法[J]. 农业工程学报, 2021, 37(5): 191-197.

Xue Junrui, Wang Yutan, Qu Aili, et al. Image segmentation method for Lingwu long jujubes based on improved FCN-8s [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(5): 191-197.

[11]张永剑, 任洪娥. 基于PSO优化K均值聚类的葡萄果穗图像分割算法[J]. 智能计算机与应用, 2020, 10(5): 81-84, 88.

Zhang Yongjian, Ren Honge. Grape image segmentation algorithm based on particle swarm optimization and Kmeans clustering [J]. Intelligent Computer and Applications, 2020, 10(5): 81-84, 88.

[12]郭超凡, 王旭明, 石晨宇, 等. 基于改进Kmeans算法的玉米叶片图像分割[J]. 中北大学学报(自然科学版), 2021, 42(6): 524-529.

Guo Chaofan, Wang Xuming, Shi Chenyu, et al. Corn leaf image segmentation based on improved Kmeans algorithm [J]. Journal of North University of China (Natural Science Edition), 2021, 42(6): 524-529.

[13]Xue J, Shen B. A novel swarm intelligence optimization approach: Sparrow search algorithm [J]. Systems Science & Control Engineering, 2020, 8(1): 22-34.