陈亚峰,张晓明,黄亚鸿,徐日华
(1.北京化工大学信息科学与技术学院,北京 100029;2.北京石油化工学院计算机系,北京 102617;3.北京石油化工学院自动化系,北京 102617)
基于静态背景差分的阈值算法在果实识别中的应用
陈亚峰1,2,张晓明2,黄亚鸿3,徐日华1,2
(1.北京化工大学信息科学与技术学院,北京 100029;2.北京石油化工学院计算机系,北京 102617;3.北京石油化工学院自动化系,北京 102617)
图像识别是当前人工智能发展的1个热点。针对农业果园采集图像光照不均匀,背景复杂多样等特点,提出了一种基于静态背景差分的最大类间方差改进算法用于果园复杂背景图像的分割。通过调节参数γ达到不同对比度下果实与背景环境的最佳分割。 然后利用距离变换和分水岭算法进行粘连果实的分离,实现果实图像的识别,并且通过实验分析和计算确定了最佳参数γ范围在0.2~0.3之间。实验验证表明,图像识别效果良好,能够为果园品质在线检测提供很好的技术基础。
图像识别;大津阈值;静态背景差分;分水岭算法
随着物联网与大数据技术的发展和成熟,数据的处理已经不再局限于数字和文字,对图像数据的处理成为适应当前新兴技术发展的迫切需要。工业领域可以通过对大量现场图像进行识别实现产品计数、质量检测[1];农业领域也可以通过图像识别达到病虫害监测和产量预估[2];医疗领域甚至通过图像识别技术进行病灶定位和病变分析[3]。农业果园中的图像采集,一方面由于户外环境复杂,容易受到光照强度、照射方向等自然因素的影响,另一方面待识别的果实也存在识别目标粘连、被遮挡等问题,所以国内外科研人员对此展开了研究。北京林业大学的张春龙等设计了支持向量机和超绿算子的混合分类器用于分割基于夜间图像的绿色苹果[8],虽然效果很好,但是依赖于严格的夜间高质量图片,实现难度较高;中国农业大学的司永胜等提出了基于遗传算法形状特征的苹果识别方法[5],对于一些因为部分遮挡而形状变得不完整的果实识别效果较差;西北农林科技大学的崔永杰等研究了基于椭圆形Hough变换的猕猴桃轮廓识别[11],同样存在对识别形状要求较高和图像对比度要求严格的局限。
笔者在传统的最大类间方差(OTSU)算法的基础上,利用静态背景差分进行了相关优化,通过调节浮动参数γ来适应不同背景对比度下果实图像分割。在此基础之上,利用距离变换和分水岭算法进行粘连果实分离标记和识别,能够解决部分遮挡果实的识别问题。以某果园脐橙图像为目标进行相关试验研究,以验证相关算法的有效性。
针对农业果园中采集的图像,特征量的选择往往受到现场环境、生长状态等多种因素的影响。首先要对待识别果实图像进行特征量提取,实现果实与背景的分割。然后利用距离变换和分水岭算法解决果实粘连的问题,具体流程如图1所示。
在识别之前,预处理部分必不可少。由于实验获取的彩色图像受到各种外界干扰和条件限制往往并不能用来直接使用,需要进行相关的图像处理操作,主要的预处理步骤如下。
1.1 RGB空间R分量提取
彩色信息量巨大,处理起来耗费资源,对于一般的成熟果实图像,在RGB空间模型的R坐标轴上更能显示良好的图像区分性。
1.2 去噪和滤波
传统的图像在成像、传输、存储、转换等过程中容易受到随机噪声的干扰,会造成图像失真特征淹没等问题。因此,采用中值滤波的方法尽量保持图像的真实性,降低噪声干扰。
1.3 图像二值化处理
由于获取的果树图像背景复杂,采用处理后的灰度图并不能实现前景和背景的有效区分,不利于特征量的提取。因此,加入一步图像的二值化操作。用算法确定最佳阈值T,进行灰度划分来实现图像的二值化。
1.4 形态学处理
数学形态学是由一组形态学的代数运算子组成,其基本运算有膨胀(或扩张)、腐蚀(或侵蚀)、开启和闭合。主要用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的,具有过滤噪声,保留图像原始信息的优点。
上述预处理过程中发现,在利用最大类间方差对图像进行二值化操作时,由于受到果园图像背景复杂、光照不均匀等多种因素的影响,往往并不能够提取出有效的前景目标,从而影响整个图像识别的流程操作。笔者将通过改进最大类间方差算法来解决这一问题。
2.1 最大类间方差法
最大类间方差法由日本学者大津(Nobuyuki Otsu)于1979年提出,是一种自适应的阈值确定的方法,又叫大津法,简称OTSU。该方法是基于整幅图像的统计特性实现阈值的自动选取,是全局二值化最杰出的代表[6]。
他是按图像的灰度特性将图像分成背景和目标。背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。
2.2 静态背景差分
背景差分也叫背景减法(Background Subtraction), 背景差分法是目前运动检测中最常用的一种方法,他是利用当前图像与背景图像的差分来检测出运动区域的一种技术[3]。一般能够提供最完全的特征数据,但对于动态场景的变化,如光照和外来无关事件的干扰等特别敏感。静态背景差分可理解为背景图像不变,目标在没有发生运动的情况下,灰度、亮度、颜色或者形状发生了变化。通过变化后的图像和背景图像相减进行背景消去,可以成功捕捉到变化目标。
2.3 基于静态背景差分改进的阈值求解算法
考虑到复杂背景环境对图像分割的影响,单纯的最大类间方差算法并不能有效地区分复杂的背景和目标,而静态背景差分能够消除背景对目标的影响。笔者提出一种基于静态背景差分改进的大津阈值算法。
首先利用最大类间方差法计算待识别灰度图像I(i,j)阈值T,计算归一化阈值水平level:
(1)
自然界中某一颜色分布水平大致上服从高斯分布,在进行大津阈值分割时,许多相邻或相近的像素会发生错分的情况。基于这样的考虑在level的基础上加入浮动因子γ。这样计算的level就从1个值变成了1个滑动窗口:
(2)
(3)
参数level在归一化之后取值范围在[0,1]之间。在加入参数γ之后level+、level-的变化范围也必须同时满足在[0,1]之间。考虑正常情况下,变化范围一般在[0,0.5]之间。
然后得到优化后的背景图像I′(i,j):
(4)
(5)
(6)
利用背景差分算法进行背景消去,获得优化后目标灰度图C(i,j):
(7)
再次利用最大类间方差法计算处理后灰度图像C(i,j)阈值T′。算法流程如图2所示。
对于参数γ的取值理论上和目标与背景的对比度有关。由此定义灰度图中每一个灰度值i出现的概率为pi=ni/N。其中N表示图像像素总数,ni表示灰度值为i的像素的个数。则:
(8)
其中:u0、u1分别为目标的平均像素值和背景的平均像素值;t为灰度图像的初始阈值。接着定义1个目标与背景之间的差值指标β,用来表征目标与背景像素之间的对比度关系:
(9)
不同对比度的图像如图3所示,分别计算其差值指标β和到达最佳分割的浮动因子γ,结果如表1所示。
图像序号u0u1βγ图3(e)236.73.00.9160.10图3(d)221.87.60.840.15图3(c)208.213.20.760.22图3(b)197.419.60.690.24图3(a)188.131.50.610.30
由表1可以看出,对比度β和浮动因子γ之间存在近似线性的关系,如图4所示。
以某果园脐橙为例,利用传统的最大类间方差算法进行阈值选取和图像分割,用基于静态图像差分的大津阈值改进算法进行计算,结果分别如图5、图6所示。
由图5和图6可以看出,基于静态背景差分的改进OTSU算法相比于传统的大津阈值算法能够有效减少复杂背景对识别目标的影响。
3.1 果实图像的识别
果实图像识别对于查看果树生产状况和预估果树产量等具有十分重要的作用。以脐橙为例,图像中存在树叶遮挡果实、果实重叠等情况,所以对于特征值的选取不能以形状为目标,应该以颜色作为图像分割的线索,采用合理的阈值分割相关图像。得到处理之后的二值图像,结果如图7所示,识别效果如图8所示。
从图7、图8可以看出,对于处理之后图像的单个果实能够很好识别,但是对于具有粘连关系的果实识别效果并不好。
3.2 果实图像二次识别
对于重叠的果实图像,由于每个待识别个体之间颜色相近,基于区域颜色的图像分割效果并不良好。笔者采用欧式距离变换和分水岭算法相结合的方法进行图像的二次识别[8-10]。
3.2.1 欧式距离变换
图像进行距离变换之后的新图像中,图像的每个输出像素表示成该点到最近的零像素之间的距离。所以图像中前景目标中的像素点距离背景越远,那么距离就越大,如果用这个距离值替换像素值,那么新生成的图像中这个点越亮。具体的应用就是找前景目标的中心,对于1个经过预处理之后的二值图像Q(m,n)。设前景目标点为Q(i,j)=0,背景点为Q(i,j)=255,设背景点的集合为M,目标点距离为D(i,j),则对所有目标点的距离变换计算公式为:
(10)
将图7进行距离变换之后的效果如图9所示。
经过距离变换后,能够清楚地显示每1个目标到背景的远近关系,但是还是无法完成分离,需再结合之后的分水岭算法进行操作。
3.2.2 分水岭算法
分水岭分割方法是一种较为成熟的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每1点像素的灰度值表示该点的海拔高度,每1个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。采用模拟浸水法对粘连图像进行分割,并且标记每个分割区域,如图10所示。
识别效果如图11所示。由图11可以看出,粘连区域得到了有效的分离。但是对一些被树叶遮挡过于严重的脐橙果实仍然无法进行有效的识别,系统识别的整体效果良好。
为了验证基于改进的静态图像差分阈值算法在农业果园水果识别中的良好适用性。随机选用8张某果园脐橙图片,总计297个脐橙,进行人工分析,样本图片考虑到了不同背景和对比度对果树识别率的影响。识别效果如表2所示。
表2 不同类型果实识别效果
由表2可以看出,个体完整的果实识别率较高,基本能够实现遮挡果实的识别,但是对于部分严重遮挡的脐橙果实,由于图像较暗不能提取相关颜色特征或提取特征亮斑过小被当作噪声滤去,存在着不能识别的现象。对于粘连果实的分离和识别,由于粘连区域轮廓并不明显,也存在着小部分漏分、误识的现象。
在针对不同光照背景的果园图像取样识别时,最佳参数γ是在一定范围内浮动的,并没有变化很大。为了研究在果园脐橙图像识别中参数γ的最佳范围,引入识别率及误识别率:
(11)
(12)
选取不同场景下的脐橙图片进行分析,结果如图12所示。
由图12可以看出,基于静态背景差分的阈值算法中,目标的识别率随着参数γ的减小而增大,与此同时也会增加其把背景中的其他因素当作目标进行识别的概率。通过分析发现,参数γ在0.2~0.3之间两者达到最优,识别率较高,误识别率较小。
(1)采用静态背景差分的阈值算法对待识别图像进行二值化处理,相较于传统的大津算法能够解决识别目标背景复杂,光照不均匀,对比度变化的问题。
(2)通过改变静态背景差分阈值算法中参数γ可以有效适应不同光照程度和复杂程度的样本图像。参数γ随着目标与背景的像素对比度β线性变化。
(3)该算法能够有效应用在农业果园果实识别的场合,为了同时能够达到识别率高,误识别率小的效果,参数γ的指标确定在0.2~0.3之间。
[1] 秦学文,黄金国,皮积敏,等.基于样本集提取的现场钢材计数研究[J].计算机应用软件,2014,31(3):211-213.
[2] 王克如.基于图像识别的作物病虫草害诊断研究[D].北京:中国农业科学院作物科学研究所,2005.
[3] Chen Jingjing, Zhao Dechun, Peng Chenglin, et al. Comparative study on automatic lung paren-chyma segmentation of CT data using improved OTSU and FCM methods[J]. Space Medicine & Medical Engineering, 2014,27(6):448-452.
[4] 司永胜,乔军,刘刚,等.基于机器视觉的苹果识别和形状特征提取[J].农业机械学报,2009,40(8):161-165.
[5] OTSU N. A threshold selection method from gray-level histograms[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1979,9(1):62-66.
[6] 张毅刚,曹 阳,项学智.静态背景差分运动目标检测研究[J].电子测量与仪器学报,2010,24(5):494-499.
[7] 张春龙,张楫,张俊雄,等.近色背景中树上绿色苹果识别方法[J].农业机械学报,2014,45(10):277-281.
[8] 苗中华,沈一筹,王小华,等.自然环境下重叠果实图像识别算法与试验[J/OL].农业机械学报,2016(06) http://www.cnki.net/kcms/detail/11.1964.S.20160317.1049.030.html./*.
[9] 彭卫绘,谈乐斌.基于MATLAB粘连小球球径提取方法[J].计算机系统应用,2012,21(6):191-194.
[10] 吕强,蔡健荣,赵杰文,等.自然场景下树上柑橘自动识别技术[J].农业机械报,2010,41(6):185-188.
[11] 崔永杰,苏帅,王霞霞,等.基于计算机视觉的自然环境中猕猴桃识别与特征提取[J].农业机械学报,2013,44(5):247-252.
The Application of Static Background Subtraction in OTSU for Fruit Recognition
CHEN Ya-feng1,2, ZHANG Xiao-ming2, HUANG Ya-hong3, XU Ri-hua1,2
(1.College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 10029, China; 2.Department of Computer Science, Beijing Institute of Petrochemical Technology, Beijing 102617, China; 3.Department of Automation, Beijing Institute of Petrochemical Technology, Beijing 102617, China)
Image recognition is a hotspot in the development of artificial intelligence. Due to theuneven illumination and complex background of imagescollected from orchard agriculture, this paper proposed a new improved OTSU which is based on static background subtraction algorithm. By adjusting the parametersγto achieve optimal segmented fruit under different contrast with the background environment, the researchers use the distance transform watershed algorithm to separate adhesions fruit, and determine the optimum parameterγrange between 0.2 to 0.3 viaexperimental analysis and calculations. Results show that the image recognition works well, whichcan provide a good foundation for the technical quality of the orchard online testing.
image recognition; Otsu; static background subtraction; watershed algorithm
2016-07-09
北京石油化工学院优秀责任教授资助项目(BIPTPOPME-2015);2016年北京市大学生科研训练项目(2016J00087)。
陈亚峰(1972—),男,硕士生,研究方向为大数据与云计算,E-mail:chenyfjs@163.com。
TP 391.4
A