针叶植物叶片或叶小枝数字图像识别和分类

2016-05-30 03:19田超周坚华
吉林农业·下半月 2016年3期
关键词:图像分类形状

田超 周坚华

摘要:本文研究针叶植物数字图像自动识别分类的方法。根据针叶植物不同科(松、杉、柏科)和种叶片/叶小枝的形状特征差异设计了15个特征描述符,以适量样本检验这些描述符以及它们组合使用对于划分针叶植物科和种的有效性,并对这种有效性做评估和排序。实验表明,凹陷密度,凸包欧拉数、凸包面积与同参数三角形面积相对差等,对辨别松科植物有效;叶图斑长宽比、凸残差面积方差、凹陷密度、凹陷平均短长轴比等对划分杉、柏科植物有效。通过这些描述符,可以将至少34种针叶植物分为松、杉、柏3个科和17个种。用这些描述符组合对针叶植物科分类的精度大于80%;由科划分种的精度相对较低,划分松、杉、柏科植物到几个范例种的精度分别为:64.0%、54.3%、40.1%。

关键词:针叶植物;图像分类;形状;数学形态学;特征频数

基金项目:国家自然科学基金项目(41071275)资助

中图分类号: TP391.41 文献标识码: A DOI编号: 10.14025/j.cnki.jlny.2016.06.020

植物数字图像自动分类是植物分类学领域备受关注的新技术“基于内容的图像检索”(Content-Based Image Retrieval, CBIR)是该技术的代表之一,通过把用于植物图像的CBIR软件植入手机等智能移动设备,有可能在野外对植物进行实时分类。已经出现了少量移动设备版植物图像分类/检索软件,如Nam等2005年开发的“三叶草”系统,可以根据植物叶轮廓图检索植物类;Belhumeur等2008年研发的改进型系统,可以查询植物图像与在线植物样本的相似性等。但由于专家知识植入图像自动分类/检索系统比较困难,这类软件目前能够正确辨识的植物种类比较有限,其他类似的CBIR系统还在不断完善中。

据检索,植物图像分类的研究主要集中于阔叶类植物。阔叶植物的属种远比针叶植物的丰富,这可能是它吸引较多关注的原因。另一方面,植物图像分类主要依靠植物叶特征,阔叶类植物的叶特征(包括叶形、叶缘、叶脉等)远比针叶植物的丰富,不同属种之间的特征差异比较显著和易于提取,使得阔叶植物先于针叶植物在图像分类领域取得了较大进展。例如基于叶片形状、基于叶脉和叶缘信息的植物图像分类。

与阔叶植物相比,针叶植物种属间的特征差异不够分明。根据Science Director、Springer Link Journals、中国知网等中外期刊论文数据库的检索,尚未检出针叶植物叶片/叶小枝数字图像自动分类方面的研究文献。本文主要根据松、杉、柏科植物叶片/叶小枝的形状特征差异,设计特征描述符;并以图像分类/分割方法检验这些描述符以及它们的组合,对于辨识不同科和种的针叶植物图像有效。

1 实验数据

研究中使用的植物叶图像样本来自野外自采集和中国植物图像库。野外自采集区域为上海市区和浙江天目山地區,采样设备为普通单反变焦数码相机。自采样本约占总样本数的90%。野外共采集样本近340个,包括了上海市绿地和天目山地区典型的针叶树种。表1列出了实验样本属种和数量。在描述符测试中随机选择其中180个样本构成训练集,其余160个为预留的测试样本。

2 方法

2.1 概述

本文的研究对象为松、杉、柏科植物,由于南洋杉科植物在上海绿化地很少见,仅采集到“智力南洋杉”和“大叶南洋杉”两种,故合并到杉科中。依据松、杉、柏科多种植物叶的表观特征和图像特征,设计了能够将三者及其具体种分开的图像特征描述符。它们中的大多数依据形态测量学设计,能够定量描述叶形特征;还有一小部分根据特征频数统计值设计,如邻域暗细节密度等,用于描述叶片/叶小枝凹陷的密度。通过在这些描述符组合的特征空间里做图像监督分类,可以评估各描述符及其组合的有效性。工作流程见图1。

2.2 针叶图像预处理

针叶植物叶图像预处理的有效算法包括平滑化、维纳滤波、锐化、大津法阈值计算和二值化、形态学开启和闭合、凸(凹)噪声面积过滤、Gaussian滤波和边缘检测等。实验表明,对针叶植物叶图像有效的预处理包括:降噪,去毛刺,闭合裂隙、填补凹陷等,它们能给出比较完整的叶片二值图,以便特征提取和描述符值计算。图2以雪松为例说明该过程。

2.3 描述符设计

形状是叶片图斑的主要特征。常用的形状特征包括图斑面积、图斑的短长轴比、凸包面积、凸残差特征、形状系数、边缘密度、分维等。针叶植物叶形通常具有如下特征:松叶形简单,针状,常2针、3针或5针一束,叶节点无分叉;柏枝叶复杂,分支明显,单叶小而呈鳞片状(或鳞叶、针叶混生);杉多为线形叶等。可以用凸包或凸残差、几何形状、细节频数等描述这些特征,设计出适用的描述符。表2给出部分经实验证明有效的描述符,所有描述符都归一化到值域[0, 1]。

2.4 描述符测试和精度评估

图3和表3~6给出以决策树(DT)评估描述符组合分类精度的实例。如针叶科分类时,随机选择8个描述符构成初始特征向量,训练样本数为180,其中松、杉、柏科植物样本分别为55、61、64。训练中DT自动选择对样本适应性较好的5个描述符构成决策树t(图3);随后以t对测试集图像分类,并以混淆矩阵评估分类精度。

3 描述符的设计依据

表2中的描述符设计基于叶图斑的某些图像特征,例如凸残差、图斑凹陷、图斑面积对称性、图斑密度对称性、图斑几何图形轴对称性、图斑与同参数几何图形的相似性等。下面分别展开讨论。

3.1 凸残差

凸包(convex)是将图斑边界的凸顶点连线形成的外多边形。用凸包减去原图斑得到凸残差(convex deficiency)。实验表明,根据凸包和凸残差设计的描述符对于表征针叶植物叶轮廓形状和叶小枝的分布规律、密度和复杂程度等有效。基于凸残差的描述符有:(见表2)。图4以侧柏、墨西哥落羽杉、白皮松为例,显示这类描述符参变量的提取方法。表7为基于凸残差描述符的分割阈值范例。

(a),(d)分别为龙柏和水杉叶小枝二值图,真元素个数即叶小枝图斑面积;(b),(e)为暗细节二值图,SE均为3×3菱形;(c),(f)为凹陷尺寸大于阈值的图斑,可以通过测量其中面积较大的主凹陷的密度、短长轴比、形状系数等,获得有参考价值的分类特征。由图可见,龙柏的暗细节尺寸较小、细节短、分布密度(单位面积细节个数)较大;而水杉的暗细节尺寸较大、细节狭长、分布密度较小。

3.2 圖斑凹陷

暗细节是叶图像上尺寸较小的暗调元素或叶图斑的孔洞(凹陷),可以通过形态学“低帽变换”提取。它是用闭合操作消除比结构元素(SE)尺寸小的暗细节,获得背景估计b;然后从b中减去原图像I就能获得暗细节集da。

3.3 叶图斑对称性

叶图斑对称性通常以叶小枝某些统计值的上下对称性表述。可用的统计值包括面积、密度和几何图形轴长等。面积和密度的统计对象主要为叶图斑、凸包、凸残差等的二值图。表达式的主要形式为差比值,比如 (见表2)。几何图形轴对称性利用了与叶图斑有关的几种几何图形,如外接矩形、内接圆等。

3.4 图斑与同参数几何图形的相似性

典型的松、杉、柏叶小枝的外轮廓与某些几何图形接近,比如松与三角形、杉与矩形/椭圆、柏与扇形/椭圆相像。利用叶图斑凸包二值图与同参数(高/长轴、宽/短轴等)的几何图形面积的差比值,表征叶图斑凸包接近这些几何形状的程度,可能用于划分不同科的针叶植物,表9列出部分基于图斑对称性的描述符的性能和范例阈值。这些描述符包括(见表2)。

4 结论

本文研究针叶植物叶片或叶小枝图像按科和种分类的方法,设计了14个新的描述符,并评估了各自和组合使用的有效性。上述实验和统计分析支持如下结论:(1)基于凸残差、图斑凹陷、图斑对称性和图斑与同参数几何图形相似性设计的描述符对于识别针叶植物科和部分种有效。(2)适当数量和不同功能的描述符组合,有助于改善分类精度。(3)用这些描述符组合对针叶植物科分类的精度大于80%;由科划分种的精度相对较低,划分松、杉、柏科植物到几个范例种的精度分别为:64.0%、54.3%、40.1%。由本实验还可以看出,要划分更多的属种还有待进一步增加植物样本,并继续深入描述符和分类空间设计等方面的研究。本文的分类方法主要依据的是植物外形特征,而未严格遵守植物学分类规则,比如中国植物志中将日本冷杉划分为松科,而本文根据其形状特征将其划分到杉中,这一点望读者理解。

参考文献

[1]Geng SL (耿生玲). Tian F (田芳). The principle and realization of picture sharpening and smoothing[J]. Journal of Qinghai Normal University(Natural Science) (青海师范大学学报(自然科学版), 2003(03):62-65

[2]Zhu J (朱静),Tian XJ (田兴军),Chen B (陈彬) et al. Computer Recognition System of Plant Leaf-shape[J]. Chinese Bulletin of Botany (植物学通报), 2005,22(05):599-604

作者简介:田超,华东师范大学地理科学学院,在读硕士,研究方向:遥感图像分析与空间数据挖掘。

通讯作者:周坚华,硕士,华东师范大学地理信息科学教育部重点实验室,副教授,研究方向:城市与生态遥感。

网络出版时间:2016-3-10 17:07:45

网络出版地址:http://www.cnki.net/kcms/detail/22.1186.S.20160310.1707.001.html

猜你喜欢
图像分类形状
你的形状
基于数据挖掘的图像分类算法
基于云计算的图像分类算法
基于锚点建图的半监督分类在遥感图像中的应用
火眼金睛
看到的是什么形状