陈妙婷 杨广蕾 秦鹏涛
摘 要:针对名优茶嫩芽自动采摘问题,采用SVM学习算法实现对名优茶嫩芽图像自动分割。通过提取嫩芽像素点与背景像素点的RGB及(R-B)特征,将4个特征按重要性组合为3个特征组,分别是RGB特征组、RGB+(R-B)特征组和G+(R-B)特征组,利用3个特征组分别构建SVM嫩芽分割模型。在收集的多幅图像上的实验表明G+(R-B)特征组构建的分割模型分割得到的嫩芽图像较为完整,且用时均低于0.5 s,满足名优茶嫩芽自动采摘的要求。
关键词:自动采摘;SVM;图像分割
中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2021)02-0089-04
Abstract:Aiming at the problem of automatic picking of famous tea buds,the SVM learning algorithm is used to realize the automatic segmentation of the image of famous tea buds. By extracting the RGB and(R-B)features of the bud pixels and the background pixels,the four features are combined into three feature groups according to their importance. They are RGB feature group,RGB+(R-B)feature group and G+(R-B)feature group. Three feature groups were used to construct SVM buds segmentation models. Experiments on several collected images show that the segmentation model constructed by G+(R-B)feature group can obtain relatively complete bud images,and the segmentation time is less than 0.5 s,which meets the requirements of automatic picking of famous tea buds.
Keywords:automatic picking;SVM;image segmentation
0 引 言
图像分割是机器视觉处理与分析的首要一步也是较为关键的一步,准确的图像分割对后续的图像及行为识别尤为重要。目前主流的图像分割算法主要有两类:一是基于边缘检测的分割方法,图像最基本的特征是边缘,边缘检测的原理是利用图像一阶导数的极值或二阶导数的过零点信息为判断边缘点提供基本依据;二是基于区域的分割方法,种子生长法是最典型的基于区域的分割方法,其原理是根据目标像素灰度级与背景像素灰度级的不同,将物体从背景中较好地分割出来[1,2]。随着人工智能和机器学习的不断发展,图像分割也不再仅仅依赖于单纯的数字图像处理技术,越来越多的学习方法[3]开始应用于图像的分割与识别当中。
名优茶嫩芽自动采摘中,视觉系统最终要输出的是采摘点的三维坐标,但求取准确的三维坐标的前提是获得完整的茶叶嫩芽轮廓图像。茶叶就其自身生长特性,嫩芽和老叶的区分界限并不是很明显,加之嫩芽区域小且多,这些都为嫩芽图像的分割增加了难度。韦波[4]对茶叶图像RGB颜色空间中的G分量进行阈值处理并对嫩芽进行轮廓提取,最终得到粗略的分割结果,但整体轮廓并不完整。唐仙等[5]对茶叶图像RGB颜色空间中的色差(R-B)利用Ostu法和迭代阈值法进行分割,能够实现嫩芽的完整提取,但是噪声较多。汪建[6]采用HIS颜色空间,减少光照的影响,对图像采用区域生长法来提取嫩叶轮廓。以上算法都能实现图像的分割,但对图像画质的要求较高,处理后有噪声,且局限性较大。
本文借助机器学习的方法来实现名优茶嫩芽图像的自动分割。对于嫩芽图像的分割,本质是嫩芽像素点与背景像素点的分类问题。目前应用较广的分类学习算法有逻辑回归算法和SVM(support vector machine)算法等。考虑到SVM算法在解决小样本二分类问题上的优势[7,8],因此本文利用SVM算法对名优茶图像进行分割。首先提取合适的样本点用于SVM模型的训练,然后对比3个特征组对分割结果和处理时间的影响。
1 名优茶嫩芽分割过程
1.1 整体分割流程
本文利用SVM算法进行名优茶嫩芽图像分割的总体实现流程如下。
1.1.1 样本预处理
要训练SVM模型,首先要对训练样本进行预处理。预处理包括图像降噪和样本选取:
(1)图像降噪:拍摄到的图像往往因为外界影响产生各种噪声,所以在进行训练前要对图像进行平滑处理,去除有影响的噪声,使后续分割结果更加准确。
(2)样本选取:在去噪后的图像中选出具有代表性的嫩芽样本点与背景样本点。
1.1.2 生成訓练模型
训练SVM模型主要是提取样本中对实验有益的特征以及训练模型所需的核函数,这两方面都对最后的分割结果产生很大的影响。特征是对图像进行分割的主要依据,特征选取的准确不仅能使分割结果更加准确,分割消耗的时间也会大大降低;模型所需的核函数是制约分割计算量的关键,这需要根据实际的分割要求进行权衡。
1.1.3 分类器测试
对测试图像进行同等的图像降噪处理后,利用生成的分类器对图像进行分割,观察分割结果。若分割结果不满足要求,则对模型中的参数进行适当调整。
图1给出了整体的分割流程总框图。
1.2 特征提取
名优茶嫩芽与老叶的区别主要是颜色的差异,所以提取特征主要是像素的RGB值。其中绿色的信息最有价值,所以G值为最主要的特征。考虑到(R-B)值[9]对于以绿色为主调的图像区分度最明显,所以也将该特征值加以训练。图2为测试图像原图与其(R-B)单通道图的对比。但是过多的特征使分割处理时间增加,影响工作效率。因此本实验采取3组对照实验,分别是以RGB组成的特征组、以RGB和(R-B)组成的特征组以及以G和(R-B)组成的特征组,通过实验比较分割结果和处理时间。
1.3 训练与测试
SVM分类算法的基本思想[10-12]是在样本空间里寻找使两类样本最小间隔最大化的最优超平面,数学表达式如式(1)所示:
其中ω为超平面法向量,b为阈值,C为惩罚因子,它控制对错分样本的惩罚程度,ζi为松弛变量,表示训练时允许出现一些错分类的点。
式(1)是典型的凸优化问题,可以利用Lagrange乘子法将其转化为对偶问题再进行求解,如式(2)所示:
其中αi、αi为Lagrange乘子,K(x,xi)为核函数。假定求解得到的最优Lagrange乘子为α*,进而反求得最优超平面的ω*和b*,从而最终的决策函数如式(3)所示:
在SVM模型训练过程中,重要的是核函数和惩罚因子的选择[13],但目前学术界对其并没有具体的选择原则,只能凭研究领域的经验和多次实验挑选合适的参数。
茶叶采摘要求的是高效率和高质量,所以对于嫩芽图像分割既要求分割完整又要求处理迅速。经多次实验,综合考虑多方面要求最终选定多项式核函数,该核函数公式如式(4)所示:
利用该多项式核函数训练模型时,分割得到的嫩芽完整,用时短。d为多项式核函数的幂次,d越大,算法越复杂运行时间越长,综合考虑处理精度和运行时间最终对d取3。对于惩罚因子C的选择,考虑到后续还要对图像进行滤波和形态学处理等操作,所以可以在节省时间的前提下舍弃部分错分类点,所以对C取0.8。
2 实验结果与分析
2.1 实验数据采集
本实验样本是在上午十点阳光适中时在崂山地区拍摄的一组茶叶图像,共计挑选出合适测验的图像50张,从中选出3张背景内容较丰富的图像用于点选训练样本集。
2.2 实验设置
2.2.1 样本集的选取
在挑选出的3张背景内容丰富的图像中,每张选取40个嫩芽像素点和40个背景点,图3为1张样本图像中选取的样本点,其中星状点为背景样本点,圆形点为嫩芽样本点。分别求取每个像素点的R、G、B和(R-B)值,剔除重复的数据和无效的数据,依据所分定的特征组形成3组特征矩阵,用于后续的训练和测试。其中特征组1为RGB特征组,特征组2为RGB+(R-B)特征组,特征组3为G+(R-B)特征组。
2.2.2 SVM模型训练
用3组特征矩阵进行SVM模型训练后,先尝试对这3张样本图像进行分割,如果分割准确率达90%以上,则认为特征矩阵选取正确;如果分割准确率低于90%,则根据错分割部分的像素信息在特征矩阵中进行增加或删减,直至分割准确率达到90%以上。
2.3 实验结果分析
本实验使用3组特征组对所有拍摄的茶叶图像进行分割,图4为使用3组特征组对五幅测试图像的分割图像结果,每行的图从左往右依次为待分割原图、特征组1分割结果、特征组2分割结果和特征组3分割结果。表1为3个特征值组对5幅测试图像的分割时间。
由图4可以看出3个特征组都可以将茶叶嫩芽分割出来,但比较相应的分割结果可知,利用RGB+(R-B)特征组得到的嫩芽图像更完整,其他两种特征组分割的图像嫩芽内部孔洞较多,而且周围噪声也相对多一些。对比表1中的数据可知使用G+(R-B)特征组得到的分割图像处理时间最短,使用RGB+(R-B)特征组得到的嫩芽图像次之。由此可知图像中的G值和(R-B)值是区分茶叶嫩芽与背景的最主要信息,单纯利用这两个信息进行茶叶图像的分割可以得到基本令人满意的结果。如果将分割速度作为首要指标,可以直接使用这两个特征;如果要求较高质量的分割结果,可以將这四个特征均列入处理当中。
实验结果表明,将G值和(R-B)值组合作为特征进行茶叶嫩芽的分割可以同时满足分割速度快和分割准确率高的要求,分割得到的嫩芽轮廓进行些许的图像处理后便可用于嫩芽采摘点的求取。
要想进一步提高分割的准确率和降低分割处理时间,主要的方法一是不断精化样本点,使支持向量所占比例尽可能多;二是寻找使嫩芽与老叶区分度比较高的特征,减少影响较小的特征,这样既可以减少计算量,同时也能减少冗余,提高计算准确率。对于部分未完整分割的图像,主要原因是拍摄时光照使得部分叶片的颜色发生变化,从而使分割的结果出现较大的偏差。后续研究中拍摄图像时会进行拍摄角度的调节或者增加遮光设备以减少原图像对分割结果的影响。
3 结 论
本文针对名优茶嫩芽图像分割,通过得到准确的嫩芽图像,为进一步得到准确的采摘点的位置做好铺垫。在利用SVM算法对名优茶嫩芽进行分割的过程中,首先选取嫩芽与背景区分度大的样本点,在样本点中提取RGB和(R-B)值组成3个特征组,分别为RGB特征组、RGB+(R-B)特征组和G+(R-B)特征组,利用3个特征组分别训练模型,再利用训练好的模型进行测试图像分割,通过对比最后分割结果以及分割时间,分析得出仅使用G+(R-B)值分割图像时所用时间最短,分割准确率也相对较好,并将此作为最终使用的分割方法。与此同时本方法也为其他绿色图像分割处理提供参考。
参考文献:
[1] 章毓晋.图像分割 [M].北京:科学出版社,2001:78-90.
[2] GONZALEZ R C. Digital Image Processing [M].3rd ed. Upper Saddle River:Prentice Hall,2008.
[3] 周莉莉,姜楓.图像分割方法综述研究 [J].计算机应用研究,2017,34(7):1921-1928.
[4] 韦波.基于颜色和形状的茶叶计算机识别研究 [J].福建茶叶,2016,38(3):16-17.
[5] 唐仙,吴雪梅,张富贵,等.基于阈值分割法的茶叶嫩芽识别研究 [J].农业装备技术,2013,39(6):10-14.
[6] 汪建.结合颜色和区域生长的茶叶图像分割算法研究 [J].茶叶科学,2011,31(1):72-77.
[7] 薛志东,王燕,李利军.SVM图像分割方法的研究 [J].微计算机信息,2007(24):306-308.
[8] 胡涛,胡军,郭杭.基于SVM邻域学习的视频目标检测方法 [J].现代电子技术,2017,40(14):95-98.
[9] 韦佳佳.名优茶机械化采摘中嫩芽识别方法的研究 [D].南京:南京林业大学,2012.
[10] 邓乃扬,田英杰.支持向量机:理论算法与拓展 [M].北京:科学出版社,2009:10-35.
[11] BURGES C J C.A Tutorial on Support Vector Machines for Pattern Recognition [J].Data Mining and Knowledge Discovery,1998,2:121-167.
[12] 袁志华,杨百龙,赵文强,等.基于支持向量机的NSCT域自适应图像水印算法 [J].计算机应用研究,2018,35(6):1793- 1796.
[13] CHANG C C,LIN C J. LIBSVM:A library for support vector machines [J/OL].ACM Transactions on Intelligent Systems and Technology,2011,2(3):[2020-11-12].https://doi.org/10.1145/19611 89.1961199.
作者简介:陈妙婷(1993—),女,汉族,河北衡水人,助教,硕士,研究方向:人工智能与图像处理;通讯作者:杨广蕾(1993—),女,汉族,山东淄博人,助教,硕士,研究方向:超硬磨料钎焊。