马军 贾鹤鸣 赵国强 郎春博 胡帅 冯连辉
1980年T. Pun提出利用图像灰度直方图的熵值来获取阈值,1989年A. S. Abutale 将一维最大熵阈值分割方法推广至二维。最大熵阈值分割法通过测量图像灰度直方图的熵寻找最佳阈值,但是在计算阈值时,阈值的选取存在一个全局遍历搜索的过程,计算量大导致计算时间慢、效率低[11]。从工程应用的角度出发,正确高效的寻找到最佳阈值是使用最大熵阈值分割法的重要保障。为了克服上述问题,许多相关学者从不同角度对最大熵阈值分割法进行了改进。张龙[10]等人引入新的阈值门限选取方案以消除误差并通过降维简化计算量,该方法简单易行且对于低对比度图像的分割效果较好。宋家慧[9]引入遗传算法,有效提升了图像分割的计算速度和图像处理的实时性。叶文浩[12]等人引入加权算子来确定最大阈值,将阈值分割问题比作像元分类问题,通过调整加权算子,改变熵函数,从而更好的实现目标与背景的分离。
为了更高效地完成对叶片图像分割的问题,将叶片区域从复杂背景中分割出来,本文引入优化粒子群算法(Improved Particle Swarm Optimization,IPSO)对最优阈值进行寻优。与传统粒子群算法相比,IPSO性能更强,提高了粒子全局寻优能力和解的精度[13],能够更加快速、准确识别叶片并将其从干扰环境中提取出来,为下一步的研究分析提供了良好的环境。
1最大熵阈值分割
熵是信息论中的一个重要概念,是平均信息量的表征,用以确定随机数据源中所包含的信息数量[14]。简单来说,熵就是用来衡量一个分布的均匀程度,熵值越大,说明分布越均匀。图像的熵被认为是图像灰度空间分布状态不稳定的量度[15-16]。
1.1一维最大熵阈值分割
最大熵阈值分割法将图像划分为目标区域和背景区域两部分,当目标熵与背景熵之和达到最大时的阈值即为最佳分割阈值。
灰度直方图中的数值描述的是图像中对应灰度值的频率。假设有一幅尺寸为M×N的图像I,灰度级为L,灰度范围为{ 0,1,2,…,L-1},则图像中灰度级i(0
p(i)=h(i)M×N,∑L-1i=0p(i)=1。(1)
其中,h(i)表示图像中出现灰度级为i的像素数。
若假定图像阈值为T(0 Α区:P(i)=p(i)PΑ(T)i=0,1,…,T Β区:P(i)=p(i)PΒ(T)i=T+1,T+2,…,L-1。(2) 其中,PΑ(T)=∑Ti=0p(i)PΒ(T)=∑L-1i=T+1p(i),PΑ(T)和PΒ(T)分别表示以T为阈值时A区和B区像素的累积概率,且满足PΑ(T)+PΒ(T)=1。 将信息论中熵的概念用于图像分割,根据信息熵的求解公式H=-∫+SymboleB@ -SymboleB@ p(x)log[p(x)]dx,表示目标区域与背景区域在阈值T的情况下所对应的熵函数式如公式(3)所示。 HΑ(T)=-∑Ti=0p(i)PΑ(T)·log[p(i)PΑ(T)]HΒ(T)=-∑L-1i=T+1p(i)PΒ(T)·log[p(i)PΒ(T)]。(3) 此时,图像I的总熵为HI(T)=HΑ(T)+HΒ(T)。 T=argmax[HI(T)]。(4) 遍历穷举阈值T(0~255),找到在所有分割阈值下图像总熵的最大值就是最大熵,该最大熵所对应的阈值为灰度图像的分割点即最佳阈值T*,用公式(4)表示。为了缩短算法运行时间,针对特定的一类图像,可以根据经验适当调整遍历范围以达到更加快速的目的。 1.2二维最大熵阈值分割 基于一维灰度直方图求阈值的方法理解容易且在处理简单图像时效率高,但并未考虑图像的空域信息,因此在噪声严重时极大地影响了分割效果。相较于一维灰度直方图,由像素点灰度值与邻域灰度均值构成的二维灰度直方图更能清晰反映图像灰度分布情况。 假设一幅尺寸为M×N的图像,灰度级为L。图像中每个像素点的灰度值表示为f(x,y),计算每个像素点邻域(m×n)内灰度平均值为g(x,y),定义为公式(5)[17]。 g(x,y)=1α2∑αm=-α∑αn=-αf(x+m,y+n)。(5) 其中,m与n均为大于1的奇数,如图1所示。 领域选取的方式不同對二维阈值化方法的分割结果会造成影响,一般按照惯例取m=n=3。设n(i,j)表示f(x,y)中灰度级为i且g(x,y)中灰度级为j的像素点数,则该二元组(i,j)在图像中出现的概率由公式(6)计算得到。 p(i,j)=n(i,j)M×Ni,j∈[0,L-1]。(6) 二维最大熵阈值分割中,用像素灰度门限S和邻域平均灰度门限T构成阈值向量(S,T)来划分二维灰度直方图,如图2所示。图中阈值向量(S,T)将二维直方图切分为4个区域,其中A区与B区分别表示目标和背景,C区与D区表示边界和噪声。在很多情况下,由于边缘点和噪声点数量远少于目标和背景的像素点数量,同时为了降低算法的复杂程度,进而忽略阈值分割中的噪声和边缘部分[18]。 定义二维熵函数式如公式(7)所示。类似于一维最大熵原理,区域A和区域B的信息熵分别由公式(8)和公式(9)计算得到。 H=-∑i∑jp(i,j)log[p(i,j)]。(7) HΑ(S,T)=∑Si=0∑Tj=0p(i,j)pΑ(S,T)log[p(i,j)pΑ(S,T)] =log[pΑ(S,T)]+hΑ(S,T)pΑ(S,T)。 (8) HΒ(S,T)=∑L-1i=S+1∑L-1j=T+1p(i,j)pΒ(S,T)log[p(i,j)pΒ(S,T)] =log[pΒ(S,T)]+hΒ(S,T)pΒ(S,T)。 (9) 其中,hΑ(S,T)=-∑Si=0∑Tj=0p(i,j)log[p(i,j)], hΒ(S,T)=-∑L-1i=S+1∑L-1j=T+1p(i,j)log[p(i,j)]。 此时,图像的总熵为H(S,T)=HΑ(S,T)+HΒ(S,T)。 当图像总熵达到最大值时,对应的阈值向量即为最佳阈值向量(S*,T*),如公式(10)所表示。 (S,T)=argmax1 根据二维最大熵阈值分割法原理可知,算法总计算量近似为O(L4),运算量惊人[19]。为了缩短运算时间,采用优化粒子群算法进行寻优处理。 2优化粒子群算法 粒子群算法由美国学者Kennedy和Eberhart于1995年提出,算法起源于模拟鸟群捕食行为,一经提出便受到诸多学者广泛关注[20]。在求解优化问题时,算法中每个粒子都是一个潜在解,分别对应一个适应度值。当给粒子一个移动速度,速度随着环境不断更新,粒子通过在一定范围内不断移动实现在空间中的寻优。 假设在一个K维空间中,粒子总数为n,每一个粒子i有一个初始位置xi=(xi1,xi2,…,xiK)和运动速度vi=(vi1,vi2,…,viK),通过迭代的方式,粒子会不断调整自己的速度和位置。在第t次迭代时,粒子的速度和位置如公式(11)和公式(12)所示。 vt+1ik=ωvtik+c1r1[Pti-xtik]+c2r2[Ptg-xtik]。(11) xt+1ik=xtik+vt+1ik。(12) 式中:k=1,2,…,K;i=1,2,…,n;Pi和Pg分别为粒子最优位置与种群最优位置;r1和r2为[0,1]之间的随机数;c1和c2为非负的加速度常量。 从上述更新公式可见,粒子的速度更新由三部分构成,共同决定当前粒子的状态。第一部分反映粒子继承先前速度的能力,平衡局部与全局搜索之间的关系。第二部分反映单个粒子的运动记忆对其运动速度的影响。第三部分为群体信息共享,使粒子具有全局搜索能力。通过前人大量实验证明,取c1=c2=2。 ω为惯性因子,通过调整ω的大小可以控制历史速度对当前速度的影响,对于粒子群算法的收敛性起到很大作用。目前,ω线性递减惯性权重是使用较广泛的一种方法。然而,ω线性递减惯性权重在实际应用中会出现初期局部搜索能力弱、后期全局搜索能力弱的缺陷[21]。本文针对线性递减惯性权重的不足,提出一种非线性惯性递减函数如公式(13)所示。 ω=ωstart-(ωstart-ωend)tTmax·arctan[(tTmax)2]。(13) 式中:Tmax为最大迭代次数;ωstart为初始惯性权重;ωend为迭代至最大次数时的惯性权重。一般来说,惯性权重值ωstart=0.9,ωend=0.4时性能较好。 将优化粒子群算法应用到最大熵阈值分割中,可以降低求解最大熵过程的计算量,提升效率,从而更快找到图像的分割閾值,算法框图如图3所示。下一节将把算法用于植物叶片图像分割的实验与分析中进行讨论。 3植物叶片图像分割实验与分析 为了验证基于优化粒子群的最大熵阈值分割方法在植物叶片图像上的分割效果及效率,本文选择两幅不同的叶片图像进行分割处理,并对其进行研究分析。随着植物的不断生长,叶片会趋于复杂化,俯视视角观察植物,叶片错综复杂、相互重叠,对于算法的性能及其运算能力是一大考验。本文所选择的图像如图4所示,像素大小为3000×4000。实验在Windows7系统,8GB内存,64位操作系统的处理器上的Matlab2014环境下进行。 观察上面两幅图像,植物A叶片简单,预计图像采用一维最大熵单阈值分割便可以达到较好效果。对于植物B,叶片相互重叠,若采用单阈值分割会造成叶片分割缺漏而产生失真,故应用二维最大熵法进行分割处理。下面将分开进行实验并对结果加以分析与讨论。 在应用本文提出的优化算法时,为了提高植物叶片分割效果,将图像由RGB颜色空间转换成HSV颜色空间,并提取其中的V分量。植物A实验结果如图5所示;植物B实验结果如图6所示。 图5(c)为采用传统一维最大熵阈值分割方法所得的结果,可以看出叶片轮廓并没有较好的被分割出来,并且在叶片弯曲的地方存在失真。图5(d)与图5(e)为基于IPSO算法分别在灰度图像和V分量图像上的一维最大熵阈值分割,提取V分量之后的图像在进行分割时明显效果更好,叶片被完整分割出来。由于分割效果受到光线照射与土壤复杂情况的影响,传统方法不能达到应用目的,而本文改进最大熵阈值分割法性能更强。 植物A相较于植物B而言,叶片生长情况相对简单。然而,针对错综复杂的叶片图像,需要将叶片轮廓分割出来的同时最大化展现叶片所呈现的状态,方能后续研究提供良好基础。表1中对比了本文方法与传统方法对于植物B分割结果的数据对比。 从上述结果及数据可以看出,传统二维最大熵阈值分割算法计算得到的两个阈值相差太近,肉眼无法在图像中看出区别,效果并不理想。基于本文优化算法得到的图像能够较好实现目的,利于二次研究。并且本文优化算法运算速度领先近50倍左右,处理复杂图像时性能较强,能够保证分割精度,可以应用于植物叶片图像分割领域。 4结论 本文提出优化粒子群算法来确定最大熵阈值分割的最佳阈值向量,将其作为优化问题进行研究。为了解决传统最大熵阈值分割中计算速度慢,寻优效率低等问题,通过应用IPSO算法能够有效对其进行改善,完成复杂植物叶片图像的有效分割,对植物进行相关研究时提供一种可用方案。 【参考文献】 [1]黄欣研.复杂背景下的植物叶片分割算法研究[D].西安:陕西师范大学,2017. HUANG X Y. Research on plant leaf segmentation algorithm in complex background[D]. Xian: Shanxi Normal University, 2017. [2]马丽,贾宇琛.基于局部阈值的植物叶片图像分割算法研究[J].农业网络信息,2011,26(7):34-36. MA L, JIA Y C. Study on plant leaf segmentation based on local threshold segmentation[J]. Agriculture Network Information, 2011,26(7): 34-36. [3]高理文,林小桦.基于L*a*b*彩色空间和局域动态阈值的药用植物叶片图像分割[J].计算机应用与软件,2014,31(1):232-235. GAO L W, LIN X H. Segmentation of image of medicinal plant leaves based on L*a*b* control space and local dynamic threshold[J]. Computer Applications and Software, 2014, 31(1): 232-235. [4]王萍,王立地.自然场景下植物叶片图像分割方法研究[J].农业科技与装备,2011,18(2):40-43. WANG P, WANG L D. Research on the image segmentation of plant lamina in natural scenes[J]. Agricultural Science Technology and Equipment, 2011,18(2): 40-43. [5]孙俊,宋佳,武小红,等.基于改进Otsu算法的生菜叶片图像分割方法[J].江苏大学学报(自然科学版),2018,39(2):179-184. SUN J, SONG J, WU X H, et al. Image segmentation method of lettuce based on improved Otsu algorithm[J]. Journal of Jiangsu University (Natural Science Edition), 2018, 39(2): 179-184. [6]程玉柱.基于雙向2DPCA与SVM的木材死节缺陷图像分割算法[J].林业机械与木工设备,2018,46(12):61-63. CHENG Y Z. Wood dead knot defect image segmentation algorithm based on bidirectional 2DPCA and SVM[J]. Forestry Machinery & Woodworking Equipment, 2018, 46(12): 61-63. [7]胡加鑫,贾鹤鸣,邢致恺,等.基于鲸鱼算法的森林火灾图像多阈值分割[J].森林工程,2018,34(4):1-6. HU J X, JIA H M, XING Z K, et al. Multi threshold segmentation of forest fire image based on whale algorithm[J]. Forestry Engineering, 2018,34(4): 1-6. [8]张连宽,PAUL Weckler,肖德琴.作物叶面图像自动分割方法[J].江苏大学学报(自然科学版),2016,37(6):663-669. ZHANG L K, WECKLER P, XIAO D Q. Automatic leaf surface region segmentation from crop image[J]. Journal of Jiangsu University (Natural Science Edition), 2016, 37(6): 663-669. [9]李伟涛,彭道黎,吴见.基于改进边缘分割算法的幼苗信息提取[J].农业机械学报,2014,45(4):259-263. LI W T, PENG D L, WU J. Seedling information extraction based on improved edge segmentation algorithm[J]. Journal of Agricultural Machinery, 2014, 45(4): 259-263. [10]宋家慧.基于遗传算法的最大熵阈值的图像分割[J].电子工程师,2005,12(2):60-63. SONG J H. Image segmentation based on maximum entropy threshold of genetic algorithm[J]. Electronic Engineer, 2005,12(2): 60-63. [11]张龙,余玲玲,刘京南.一种改进的最大熵阈值分割方法[J].电子工程师,2006,13(11):40-43. ZHANG L, YU L L, LIU J N. An improved maximum entropy threshold segmentation method[J]. Electronic Engineer, 2006,13(11): 40-43. [12]叶文浩,张淼,罗芳.基于最大熵阈值分割算法的改进研究[J].广东印刷,2012,13(6):22-24. YE W H, ZHANG M, LUO F. Research on improvement of segmentation algorithm based on maximum entropy threshold[J]. Guangdong Printing, 2012,13(6): 22-24. [13]赵乃刚,邓景顺.粒子群优化算法综述[J].科技创新导报,2015,12(26):216-217. ZHAO N G, DENG J S. A survey of particle swarm optimization algorithms[J]. Science and Technology Innovation Report, 2015, 12(26): 216-217. [14]卢鹏,林根巧,邹国良.基于信息熵和深度学习的无参考图像质量评价方法研究[J]. 计算机应用研究,2018, 35(12):3508-3512. LU P, LIN G A, ZOU G L. Research on non-reference image quality evaluation method based on information entropy and deep learning[J]. Application Research of Computers, 2018, 35(12):3508-3512. [15]常海涛,苟军年,李晓梅.分形维-最大熵阈值的弱边缘工业CT图像分割算法[J].兰州交通大学学报,2018,37(1):45-50. CHANG H T, GOU J N, LI X M. Weak edge industrial CT image segmentation algorithm based on fractal dimension-maximum entropy threshold[J]. Journal of Lanzhou Jiaotong University, 2018, 37(1): 45-50. [16]WANG B, CHEN L L, CHENG J. New result on maximum entropy threshold image segmentation based on P system[J]. Optik, 2018, 163: 81-85. [17]洪霞,周牧,田增山,等.基于二维最大熵阈值分割的SIFT图像匹配算法[J].半导体光电,2013,34(4):689-693. HONG X, ZHOU M, TIAN Z S, et al. SIFT image matching algorithm based on two-dimensional maximum entropy-aided threshold segmentation[J]. Semiconductor Optoelectronics, 2013, 34(4): 689-693. [18]张允,焦斌.基于Canny算子的二维最大熵阈值分割算法[J].上海电机学院学报,2018,21(3):1-5. ZHANG Y, JIAO B. A two-dimensional maximum entropy threshold segmentation algorithm based on Canny operator[J]. Journal of Shanghai Dianji University, 2018, 21(3): 1-5. [19]张新明,张爱丽,郑延斌,等.改进的最大熵阈值分割及其快速实现[J].计算机科学,2011,38(8):278-283. ZHANG X M, ZHANG A L, ZHENG Y B, et al. Improved two-dimensional maximum entropy image thresholding and its fast recursive realization[J]. Computer Science, 2011, 38(8): 278-283. [20]歐阳艾嘉.混合粒子群算法及应用[D].南宁:广西民族大学,2010. OUYANG A J. Hybrid particle swarm optimization and its applications[D]. Nanning: Guangxi University for Nationalities, 2010. [21]邓怀勇,李心语,吴开贵.PSO优化算法的微粒寻优过程移动规律研究[J].西南师范大学学报(自然科学版),2018,43(3):71-76. DENG H Y, LI X Y, WU K G. On particle movement rules of PSO optimization algorithm[J]. Journal of Southwest China Normal University (Natural Science Edition), 2018, 43(3): 71-76.