员伟康,木拉提•哈米提,严传波,阿布都艾尼•库吐鲁克,艾赛提•买提木沙,姚娟,杨芳,伊力扎提•阿力甫
1.新疆医科大学医学工程技术学院,新疆 乌鲁木齐 830011;2.新疆医科大学公共卫生学院,新疆 乌鲁木齐 830011;3.新疆医科大学第一附属医院放射科,新疆 乌鲁木齐 830054
·中药研究与开发·
基于颜色和纹理特征的新疆维吾尔医植物药材图像特征提取与判别分析
员伟康1,木拉提•哈米提1,严传波1,阿布都艾尼•库吐鲁克1,艾赛提•买提木沙2,姚娟3,杨芳1,伊力扎提•阿力甫1
1.新疆医科大学医学工程技术学院,新疆 乌鲁木齐 830011;2.新疆医科大学公共卫生学院,新疆 乌鲁木齐 830011;3.新疆医科大学第一附属医院放射科,新疆 乌鲁木齐 830054
目的 对新疆维吾尔医植物药材图像进行特征提取,并对所研究特征进行分析,探讨其在维吾尔医药材图像分类中的效果,找到适用于维吾尔医药材图像分类的特征,为基于内容的新疆维吾尔医药材图像的检索系统奠定基础。方法 以新疆维吾尔药材中植物药的花和叶为研究对象,先对图像进行预处理,进而提取颜色和纹理特征作为原始特征,并对特征进行统计学分析,运用最大类间距法筛选得到图像分类的主要特征,最后应用Bayes判别分析法对特征的分类能力进行评价。结果 将颜色特征和纹理特征筛选后进行分类,花类图像的分类准确率为85%,叶类图像的分类准确率为62%。利用筛选后的特征对花类图像的分类效果好于利用原始特征分类的效果。结论 与原始特征分类比较,运用筛选后的特征进行分类,对于判别花类药材的效果较好。这为进一步研究维吾尔医药材图像分类和完善特征提取方法奠定了基础。
新疆维吾尔植物药材;颜色特征;纹理特征;特征提取;判别分类
维吾尔医学是我国传统民族医学,是新疆维吾尔自治区卫生服务体系中不可或缺的重要组成部分。新疆地域辽阔,具有独特的地理环境,生态环境多样,孕育着丰富的药材资源。合理并有效地利用这些维吾尔药材数据资源,对保护传统民族药材资源意义重大。
基于内容的图像检索(CBIR)随着数字化时代的到来而迅速发展[1],成为当今的研究热点。CBIR是指以1个图像作为查询条件,或描述图像的内容,在提取底层特征的基础上建立索引的方式,然后通过计算比较这些特征和查询条件之间的相似度距离,来判断2个图片的相似程度。CBIR包括图像特征提取、特征值的比对、结合语义分析等步骤,其中图像特征提取是其关键步骤之一。图像特征提取是一门交叉性的学科,它既包含在计算机视觉技术中,也包含在图像处理中,通过计算机的分析和处理提取图像特征,进而解决实际问题[2]。
虽然CBIR技术在各领域得到了长足发展,但针对维吾尔医药材的研究较少,因此,在维吾尔医药领域展开相关研究具有重要意义。本研究以维吾尔医植物药材中的花和叶为研究对象,提取药材图像的颜色特征和纹理特征,通过统计分析判断特征分类能力。
对原始图像提取特征之前,需对维吾尔药材图像进行预处理。
首先,对彩色图像进行去噪,滤除无用信息,加强原图的细节,使图像颜色更加鲜明、更加立体化。然后对图像尺寸大小进行归一化处理,使图像的最长边界为300像素点。处理后,图像的质量和尺寸得到统一。为了适合图像处理,在尺寸归一化的基础上,要把药材图像从RGB颜色空间转化为HSV颜色空间。以药材数据库中的植物药红花和艾叶为例,预处理结果见图1。
将HSV三维特征矢量取不同的权值转换成一维特征矢量。在这3个矢量中,H、S和V影响人眼辨别颜色的能力呈递减趋势。根据H、S、V的量化级数和其频率的不同进行组合,S和V的量化级数均为4。可得到表达式:L=16H+4S+V。
通过计算得到256柄的一维直方图。3个三维分量H、S、V转换成1个一维矢量。对H、S和V分别取权重为16、4和1,减小了S和V对计算和检索结果的影响。进行检索实验时,能够较好地检索出颜色分布不同的图像,在充分利用图像颜色特征的同时达到了对图像检索的要求。得到的颜色直方图结果见
2.1 颜色直方图特征的提取
颜色特征以图像整体为对象,是一种全局特征,描述图像或图像区域所对应景物的表面颜色性质[3-4]。常见的颜色特征有颜色直方图、颜色矩、颜色集。本研究对维吾尔药材图像颜色直方图特征进行提取。
为了便于计算和检索,先将色调(H)、饱和度(S)和亮度(V)3个分量按照色彩的不同范围,采用以下公式的量化级别进行量化。
图2。通过直方图可以直观看出图像的颜色分布。
图2 红花、艾叶图像颜色直方图
在颜色直方图基础上,通过计算得到一些统计量,包括均值、方差、歪斜度、峰态、能量,以此来反映图像的特征值[5]。
2.2 纹理特征的提取
灰度共生矩阵(gray level co-occurrence matrix)是反映图像区域微观纹理的有力工具,它按一定的空间关系描述像素点对之间的灰度相关性[6-7]。基于灰度共生矩阵提取纹理特征的方法是一个经典的统计分析方法,是目前公认的纹理分析方法[8]。
经过正规化处理的灰度共生矩阵即是抽取二次统计量纹理特征系数的基础。本研究所采用的特征统计量有以下5种:角二阶矩、熵、惯性矩、相关性和逆差矩。取像素距离d=1,θ={0°,45°,90°,135°},计算各统计量,并取4个方向的均值。这样就抑制了方向分量,得到的特征与方向无关,从而组成图像的纹理特征。
3.1 图像处理结果
选取图像数据库中2种类型图像各100幅[9-10],采用MATLAB7.1软件编程计算图像的颜色特征和纹理特征,结果见表1。
表1100 幅维吾尔药材图像花和叶的颜色特征和纹理特征
3.2 结果分析
3.2.1 描述性统计分析和类间距分析 通过描述性统计分析,计算特征向量的均值和方差,描述颜色特征和纹理特征的集中、离散趋势。
在判别分析前,为了剔除分类效果相对较差的特征,适当地选择特征是很重要的。方差归一化间距是衡量用1个特征区分2类能力的指标[11],故本研究采用归一化间距来评价和选取特征。
对于某一个特征x而言,第i类和第j类类间距
其中mxi、mxj和分别为第i类和第j类x特征的均值和方差。D越大,说明该特征的分类能力越强;反之,该特征的分类能力越弱。各特征的均值、方差及2种类型图像分类的类间距见表2。
表2100 幅维吾尔药材图像花和叶的特征统计分析
其中,y1、y2表示花类和叶类,x1、x2、x3、x4、x5、x6分别表示均值、方差、能量、角二阶矩、熵、惯性矩。y1、y2的先验概率同为0.5,即一张药材图像,被判别为花类和叶类的概率是相等的。
根据上述判别函数式和先验概率进行判别分析,进而得到后验概率,即每个样品归属于每一类的概率,判别准则是按后验概率的大小归类。结果见表3。进而比较利用不同特征进行判别分析的分类效果。
表3 特征向量的判别分析正确率(%)
根据结果可得,颜色特征对于两类图像的分类效果一样;纹理特征对于花类的分类效果较好,但叶类的就比较差;与原始特征比较,利用最大类间距筛选后的特征进行判别分析使得花类的判别准确率得以提高,但降低了叶类的准确率。综合上述结果,在最大类间距筛选特征的基础上进行判别分类,可以在一定水平上提高花类图像分类的准确率。但叶类药材的效果却相反,这可能与叶类药材的叶片颜色差异不大有关。说明利用筛选后的综合特征比较适合花类,这为进一步研究维吾尔药材图像分类和完善特征提取方法提供了依据。后续会尝试引入其他特征(如形状特征)进行相关研究。
图像特征提取是CBIR中一个重要环节。本研究以维吾尔医植物药材图像为对象,提取图像的颜色特征和纹理特征,初步构建了基于维吾尔医植物药材图像特征数据库。根据新疆维吾尔药材中花类和叶类在颜色和纹理分布上的差异,结合药材图像的特点,使用颜色特征和纹理特征提取方法,并进行统计分析。实验结果表明,使用筛选后的特征对花类图像进行判别分类的效果相对较好。这为进一步研究基于内容的新疆维吾尔药材图像检索系统研究奠定了基础。
[1] 冯伍,张俊兰,白树芳.基于内容的图像检索技术在医学领域中的应用[J].医疗卫生装备,2012,33(11):98.
[2] 王志瑞,闫彩良.图像特征提取方法的综述[J].吉首大学学报(自然科学版),2011,32(5):43-47.
[3] 王娟,孔兵,贾巧丽.基于颜色特征的图像检索技术[J].计算机系统应用,2011,20(7):160-164.
[4] 戴雯惠.一种基于多特征融合的彩色图像检索方法[J].电脑与信息技术,2011,19(5):15-17.
[5] 刘益新,郭依正.灰度直方图特征提取的Matlab实现[J].电脑知识与技术,2009,5(32):9032-9034.
[6] 童隆正,王磊,陈海荣,等.肝纤维化图像的灰度共生矩阵分析[J].首都医科大学报,2003,24(3):240-242.
[7] 木拉提•哈米提,李莉,艾克热木•阿西木,等.新疆地方性肝包虫病CT图像的灰度共生矩阵分析[J].科技通报,2012,28(3):75-80.
[8] WALKER R F, JACKEAY P T, LONGSTAFF I D. Recent developments in the use of the co-occurrence matrix for texture recognition[C]// Proceedings of 13 Intenational Conference on Digital Image Processing. Santorini Greece,1997:63-65.
[9] 国家中医药管理局《中华本草》编委会.中华本草:维吾尔药卷[M].上海:上海科学技术出版社,2005:3-10.
[10] 新疆维吾尔自治区革命委员会卫生局.新疆中草药(维吾尔文)[M].乌鲁木齐:新疆人民出版社,1973.
[11] 尹剑仑,卫武迪,梁永贵.肿瘤超声图像灰度和纹理特征提取方法研究[J].通信技术,2009,42(9):168-170.
[12] ROBIN H, JOHN S, PETER C. Bayesian classification with correlation and inheritance[C]//Proceedings of the 12th international joint conference on artificial intelligence -Volume 2.01.1991:692-698.
[13] 丁国建,徐奎善,李天官,等.应用SPSS逐步判别分析建立晚期血吸虫病治疗分类模型的研究[J].实用预防医学,2011,18(8):1418-1420.
Xinjiang Uygur Medicine Image Feature Extraction and Discriminant Analysis Based on Color and Textural Features
YUN Wei-kang1, Murat HAMIT1, YAN Chuan-bo1, Abdugheni KUTLUK1,
Asat MATMUSA2, YAO Juan3, YANG Fang1, Elzat ALIP1(1. College of Medical Engineering Technology, Xinjiang Medical University, Urumqi 830011, China; 2. College of Public Health, Xinjiang Medical University, Urumqi 830011, China; 3. Department of Radiology, First Affiliated Hospital of Xinjiang Medical University, Urumqi 830054, China)
Objective To extract Xinjiang Uyghur medicine image features and analyze the features; To investigate the image classification effect of the researched features; To find the suitable features for Xinjiang Uyghur medicine image classification; To lay the foundation for content-based medical image retrieval system of Xinjiang Uyghur medicine images. Methods The flowers and leaves of Xinjiang Uyghur medicine were treated as the research objects. First, images were under preprocessing. Then color and textural features were extracted as original features and statistics method was used to analyze the features. Maximum classification distance was used to analyze the main features obtained from image classification. At last, the classification ability of features was evaluated by Bayes discriminant analysis. Results Color and textural features were selected and classified. The correct classification rate of flower images was 85% and the correct classification rate of leaf images was 62%. The classification effect of flower images used by selected features was better than classification effect of original feature. Conclusion Compared with the classification of original features, the classification accuracy of flower medicine is higher through selected features. This research can lay a certain foundation for the further researches on Xinjiang Uyghur medicine imagesand the improvement of feature extraction methods.
Xinjiang Uyghur medicine; color feature; textural feature; feature extraction; discriminant classification
10.3969/j.issn.1005-5304.2016.01.018
R29
A
1005-5304(2016)01-0078-04
2015-03-23;编辑:陈静)
国家自然科学基金(81160182、81460281、61201125)
木拉提•哈米提,E-mail:murat.h@163.com