韦波(广西机电职业技术学院计算机与信息工程系,广西南宁530007)
基于颜色和形状的茶叶计算机识别研究
韦波
(广西机电职业技术学院计算机与信息工程系,广西南宁530007)
摘要:本文先对茶叶图像采集进行了简要介绍,再从茶叶颜色和形状特征分析、以颜色特征为基础的茶叶叶片图像分割、以形状特征为基础的嫩芽提取这三个方面对茶叶嫩芽识别方法作了具体分析,最后对计算机识别茶叶形状作了阐述,以期为相关研究提供一定的参考意见。
关键词:茶叶;计算机识别;颜色;形状
目前我国对茶叶颜色和形状的计算机识别研究还相对较少,更多的都是将计算机识别这一方式运用于田间杂草识别或者植物叶片的形状识别之上。因此,加强对茶叶颜色、形状及其各方面特征进行计算机识别研究就显得尤为必要。
用索尼(R)DSC系列T900型号的相机在白色背景下拍摄一幅陕西省西乡县所盛产的“午子仙毫”照片,拍摄时间在清明期间,并且在拍摄过程中,相机是正对着枝条的,茶叶的枝条也是朝上的。所拍摄图像的尺寸为:521×521(像素)。
1.1在颜色和形状基础上所进行的茶叶计算机识别研究
1.1.1茶叶颜色和形状特征分析
图1
图片说明:图1(a)为原始的彩色图像;图1(b)为红色的R分量图像;图1(c)为绿色的G分量图像;图1(d)为蓝色的B分量图像。
如上图1(a)所示,是所采集到的茶叶枝条的彩色图像,通过观察可知,茶叶的新叶颜色比较浅,其G分量特征也较为明显。而图1 (b)、图1(c)和图1(d)分别为所提取的R分量图像、G分量图像和B分量图像。从图中可以看出,在G分量图像中,是能够清晰地分便出新叶和老叶的,R分量图像的可辨别性就稍微欠缺,B分量图像是很难进行新老叶分辨的。所以,在对彩色图像进行灰度图像转换时,仅需提取G分量即可,直接将R分量和B分量省去。
通过对灰度直方图的观察可知,图中一共有四个波峰,在50级附近有两个,150级有一个,180级有一个。因为前面两个波峰之间相距较近,并且其跨度也比较小,为了使计算更加简化,于是,便将其近似地看成一个波峰,直接将第二个波峰忽略掉,但是灰度值仍旧采用第一个波峰的,即50级。灰度值的第一个波峰的左侧,也就是0—50级这一区间,其像素对应的是图1(c)中老叶片与叶柄这两个部位。灰度值处在第一个波峰与第二个波峰之间,即50—150级这一区间,其像素所对应的是图1(c)中嫩叶与部分叶脉的部位。灰度值处在第二个波峰右侧,即大于150级的这一区间,其像素对应的图是图1 (c)中灰色背景部位。并且都集中在最右波峰,即180级处。
基于茶叶形状特征分析,图1中,纵向观察,所有新叶(a)(嫩芽也包括在其中)通常都处于一个高水平位置,叶片较为细长,但宽度窄于老叶。鲜嫩的芽尖部位是这一整幅图像至高点,两边各有一片新叶,故此,也常称之为“两瓣一心”。“一心”即所谓的嫩芽中心,“两瓣”则是指分布在嫩芽这一中心两侧的两片新叶。在人工进行高质量茶叶的采摘时,因为这两瓣新叶的质量相对较低,所以通常都只采集其中的“一心”,而不采集“两瓣”。本文就是利用计算机图像对比处理法对“一心”进行位置识别,以为研究自动化材质的高质量茶叶采摘设备提供一定的理论依据和技术支持。
1.1.2以颜色特征为基础进行的茶叶叶片图像分割
在进行老新叶分割时,通常采用阈值分割法,其分割结果大多由阈值大小决定。针对分割阈值的比较和确定方面,我国的研究成果还比较多。从上文对茶叶颜色所做的讨论分析可以知道,在整个嫩芽初识、辨认过程中,存在两个极为关键的阈值。如下,是在灰度直方图存在多峰值基础上提出的双阈值的确定方法。
设图像的灰度级为M,其中,灰度级是i的这一像素点的数量是ni,那么,总体像素的数量则为:
首先,选取(M/2)当作硬阈值,对图像灰度级进行分级,分为高灰度值和低灰度值这两个部分。
其次,当灰度级的区域灰度值处于(0,M/2)范围时,可求出包含了像素最大点的对应灰度级t1,如下:
最后,同理可知,在灰度级是(M/2,M-1)这一高灰度值区域,可求出包含了最多像素点的相应灰度级t2,如下:
上述式子中,t2为图中表示的相应阈值T2。
结合图1(c)中所表示的图像,通过上述的算法,可以得出,阈值T1为59,阈值T2为182。可见,这与视觉观察分析所得出的结果是完全一致的。用阈值为59的T1对图1(c)中所示的图像加以分割,便可提取出低于阈值的相应灰度图像。为了使后续处理更加方便,再对其进行一次二值化处理,便可对老叶进行完整分割。
详细对比分析可知,囊括所有嫩芽在内的新芽部分是指从老叶边缘往上计算的所有部分。所以,可以通过叶片边缘的整体轮廓进行提取。首先,就是要对老叶上边缘的轮廓进行提取。具体提取方法如下:
第一步,将图像左下角定为坐标原点,默认是(0,0)。
第二步,以图象的左上角作为扫描起点,对整体图象进行逐一详细地扫描,直到将老叶的叶片上边缘轮廓清晰检测出来为止,检测出来之后,记下该点坐标的精确值。对老叶边缘轮廓进行确定的具体方法如下:
上述式子中,B(i)是指所记录的纵向第i列边缘的相应坐标值,如果该纵列中,没有出现边缘轮廓像素,则可将其记录成0。
而所指的Tbw(j,i)是图中j行列i所显示的像素精确值,其中,1代表的背景为白色,而0则代表叶子为黑色。
消减运算完成之后,便可得知老叶边缘的具体轮廓,此轮廓表示的是老、新叶的分割分界线,在该轮廓线外延的部分均为新叶。
如下图2所示,为分割出的结果。由图可知,新叶已经被分割完全了。通过对比进行分析可知,茶叶中心的叶柄是因其这些突变点的最主要因素,并不会对新叶外围轮廓的检测造成影响,所以,在此处,完全可以不用进行消噪处理,这样一来,计算机的运行时间就能得到大幅度缩减。
图2 被分割出来的新叶
最后运用类似的老叶边缘轮廓检测法对图2进行扫描检测,提取出新叶的具体边缘。图2所示的图像为灰度图像,其像素值在0-225这一区间当中。其具体的计算方法如下。
默认左下角为坐标原点(0,0),从坐标原点开始对图2中的图像的进行精确扫描,观察图2可知,其左右两边都没有叶片,为了使计算量减少,只需对第20~(512-20)列进行处理即可,直到将新叶叶片的上边缘检测出来为止,然后记下该处的具体坐标值,再对其加以计算。
接下来,便可对其中心“一心”部位进行提取,具体操作方法如下所示。
首先,在对叶片形状进行比对分析的基础上,抽取至高点,也就是抽出茶叶顶端,即鲜嫩茶叶的芽尖部位。具体统计方法如下:
上述式子中,P(i)是指由计算分析所得出的至高点的坐标精确值。
其次,根据所求出的P(i)所相应的列朝着两侧水平移动,并计算出嫩芽根部的精确纵坐标,如下:
上述式子中,P'(i)为嫩芽左侧根部的纵坐标值,P'2(i)为嫩芽右侧根部的纵坐标值。
最后,可得出,“一心”根部的纵坐标值为:
实验的结果表明,在对茶叶的颜色特征进行提取时,能够将新叶与老叶差异清晰区分出来的是茶叶叶片的绿色分量图。在颜色特征基础上计算出来的阈值能够对老叶图像进行分割。对茶叶嫩芽的形状特征进行分析之后,提取出其他将要对比的茶叶边缘具体轮廓,便能够完整地识别出茶叶嫩芽所在位置,并且其准确率相对较高,能够达到94%,每幅图像的计算耗时约为0.45s,能够在一定程度上满足实时识别要求。
参考文献
[1]汪建,杜世平.基于颜色和形状的茶叶计算机识别研究[J].茶叶科学,2011,06.
[2]杨福增,杨亮亮,田艳娜,杨青.基于颜色和形状特征的茶叶嫩芽识别方法[J].农业机械学报,2010,S1.
作者简介:韦波(1983-),男,壮族,广西柳江人,本科,讲师、工程师,研究方向:计算机技术应用。