彭智+李勇+甘明
摘 要:对于林业相关领域研究人员、植物学家、植物爱好者来说,研究设备对于植物种类的自动识别能力非常重要,而以往都需要采集标本带回实验室,在PC机上进行分类。随着科技的发展,智能手机走进了我们的生产和生活,而Android系统无疑是手机系统的佼佼者,所以该文提出了一种新的通过特征融合,适用于移动设备的树木叶片识别方法,并选择在Android平台上进行该技术的研究,可以预见在未来这种方法将会快速发展至全平台使用。
关键词:Android应用 特征融合 树木叶片识别
中图分类号:TP39 文献标识码:A 文章编号:1672-3791(2017)04(b)-0007-02
植物对于人类的重要程度不言而喻,而传统的植物识别方式主要是人工鉴别,工作量大而且时间成本高。于是,在智能移动设备愈发强大且高速发展的今天,充分发挥Android平台系统开放且免费、拥有高级图形显示等功能且有相关厂商的大力支持[1]等特点使之与图像识别技术相结合,研究出一种在移动设备上即能对树木进行快速准确识别的方法是相关从业人员或爱好者迫切需要的,这也正是该文想要解决的问题。
1 树木叶片识别概述
虽然植物的各种器官对于自动识别技术而言都有着各自独特的价值,但是在长期的自然选择之后,植物的叶片形态多样,不同外形的叶片很容易就可以用肉眼识别[2]。而其最大的优点则是叶片的主要特点可以由一个二维的图像表现出来,很容易就可以对图像进行加工和处理,而且要想在处理之后提取出某些特征甚至以此作为自动识别和分类的依据,无疑是树木识别的最佳选择。
2 基于叶片特征的树木识别系统
研究表明,每种树木的叶片都有着与众不同而又较为稳定的特征,如果把这些特征提取出来,就恰好可以作為识别树木的基础。所以基于叶片特征的树木识别系统主要由图1所示部分组成。
从图1中可以看出,该系统通过图像预处理、叶片特征提取与融合等技术对树木的种类进行融合,然后将准确的识别结果输出展示。
2.1 图像的预处理
一般来说,我们直接获取到的叶片图像都是RGB彩色图像,在进行训练或识别之前,需要将其转换为灰度图,这是为了尽可能地去除季节和气候对颜色产生的影响而带来的干扰,同时还会使预处理过程更加简单。转换灰度图的公式如下:
随后,为了尽可能地提高特征提取的准确性,必须对图像进行去噪。该文中选择采用高斯低通滤波器进行去噪。在去除噪音后,会使灰度图像更加平滑。
2.2 提取几何特征
为了减少特征提取的计算量,该文选择提取体现叶片形状的外轮廓为特征。提取叶片外轮廓的方法是:先对预处理后的灰度图进行二值化。然后将直方图的最低点作为阈值[3],便可以分割出如图2所示图像。然后通过领域轮廓跟踪算法对图像的边界进行跟踪,同时记录边界坐标,就可以得到叶片的轮廓图。
叶片的长宽比也是树木识别技术中一个重要特征参数,它能够描述目标叶片是偏于圆润还是偏于方长,在众多方法中,最小周长多边形(MPP)的方法可以达到正确去除叶柄同时保持主题不便的效果,在得到叶片的长宽比后,通过M.K.Hu提出的七个矩不变量方法,对图像进行的细节进行描述。并用该结果描述轮廓特征。
2.3 提取纹理特征
纹理特征是物体表面的固有特征之一,所以它也是叶片图像当中的一个非常重要的属性,构成纹理特征的两个要素分别是纹理基元和纹理基元的排列。纹理基元就像花布上的花纹,有一定的形状和大小,如果将其看作一个个小的图形单位,那么纹理基元不同的排列组合便会组成成千上万种不同的图像,使物体的外观产生较大的改变。20世纪80年代,Morlet和Arens提出了被誉为“数学显微镜”的小波变换,其还广泛应用于图像处理,数据压缩,模式识别等方面,该文中采用2-D离散小波变换的方法来提取叶片的纹理特征。
2.4 特征融合
事实上,特征算法的种类繁多,不同特征算法的侧重点也不尽相同,所以为了尽可能地提高识别精度,就必须将多种特征提出来,然后缩小同类之间的差距,同时又增加种类之间的差异,但是由于算法的限制等原因,这一目标很难实现,于是,便诞生了一种可用于多种领域的多特征融合技术。
该文中,主要涉及到基于图像的特征融合技术,基于图像的特征融合技术的主要思路是:利用一定的策略,将多种互不冲突的特征结合在一起,并融合出一个稳定并且可以提高识别准确性的特征,然后可以利用这一新特征进行后续的进一步处理。
图像融合技术根据需要达到的预处理水平、使用范围和融合方法主要被划分成三种,分别是:像素级、特征级和决策级特征融合。其中,决策级融合方法对于硬件配置的要求比较低,而且灵活性较强,由于该文的目标是基于移动端的树木识别,所以该文中最终决定采用决策级的特征融合技术。假设现有M种图像的特征,其中第i种特征为Fi,在融合过程中的权重为Wi,特征距离用di表示,那么融合函数如下:
2.5 设计分类器
特征提取后,可以得到一个叶片图像的N维特征向量,这时就需要一个能通过N维特征向量来对目标进行正确识别的分类器。如果将特征向量看作是一个个样本点,那么分类器实际上要做的就是计算样本点间的距离并以此判断两两样本之间的相似程度。但是事实上,不同的分类器算法以及不同的使用环境都会产生不同的效果,一般而言,考虑到移动端的硬件条件,常用的分类器算法主要是最短欧式距离分类器和直方图交叉核这两种方法。该文在后面的实验中,分别对两种方法都进行了实验,并且比较了两种分类器的准确率,结果显示直方图交叉核的效果就该文所采用的特征提取方案而言优于前者。
3 实验结果
鉴于手机硬件性能的局限性,该文的试验过程是用Matlab仿真进行,将不同气候环境下生长且于不同季节采摘的12个不同种类树木样本的4 500张图片随机划分成了2 500张训练图像以及2 000张测试图像。从试验中得到的数据来看,该文所使用的树木叶片识别方法正确识别成功率可达到92%以上,个别叶片轮廓独具特色的树木种类如枫树、榕树的正确识别成功率可接近100%。而部分叶片特征相似的树木种类正确率相对较差,但也均可达到85%以上,如何提高对这一类树木的识别准确率的问题,也将会是之后研究工作的重点。
4 成果与展望
对于喜欢研究植物以及热爱环保的人士来说,如果能够随时地通过简单的操作就能识别出植物或树木的种类,就能够给他们的研究和生活带来极大地方便,顺应着近年来移动端设备的光速发展,基于移动端设备现有的硬件运算能力和图像处理能力,提出了一种可以在移动端设备运行的,通过对叶片图像预处理、提取特征、特征融合和分类器分类的步骤,将逐步提取出的多个小特征进行融合,从而提高识别精度,并最终实现快速准确识别树木的方法。
但是目前来说,该文所提出的方法仍有很多不足,一方面,虽然从最后的试验结果来看,试验的准确性令人较为满意,但在识别速度上仍有很大的提升空间以提高用户体验;另一方面,限于时间与科研能力,该文只在Android平台进行了测试,对于其他几种热门的移动端平台系统尚未进行测试,亟待社会其他人士进行尝试和试验,推动这一课题方向的房展。
参考文献
[1] 马林海.Android平台下基于内容的植物叶片识别系统的研究[D].合肥工业大学,2014.
[2] Lynn D E, Waldren S. Morphological Variation in Populations of Ranunculus repens from the Temporary Limestone Lakes (Turloughs) in the West of Ireland[J]. Annals of Botany,2001,87(1):9-17.
[3] 张蕾.基于叶片特征的计算机自动植物种类识别研究[D].东北师范大学,2007.