基于内容的医学图像检索技术在维吾尔药材图像检索中的应用前景
木拉提·哈米提, 孙静, 严传波, 阿布都艾尼·库吐鲁克
(新疆医科大学医学工程技术学院, 乌鲁木齐830011)
摘要:维吾尔医药是我国医药学的重要组成部分,长期以来新疆维吾尔医疗机构累积了大量的药材数据资料,目前主要采用人工标注、文本检索的方式对其进行使用。为改善这种低效利用的局面,建立药材资源数据库及药材图像检索平台是一项亟待解决的问题。为满足快速发展的维吾尔医学及新药开发过程中快速而准确的检索需求,将基于内容的图像检索技术应用于维吾尔医药材资源数据库及检索平台中,此项技术的成功运用将会对维吾尔医学临床治疗、新药开发和民族地区卫生医疗事业的发展产生积极而深远的影响。本文针对基于内容的图像检索技术、图像特征提取方法以及图像相似度匹配方法进行综述。
关键词:维吾尔医药材; 基于内容的图像检索; 特征提取; 相似度匹配
中图分类号:R318.04文献标识码:A
doi:10.3969/j.issn.1009-5551.2015.07.005
[收稿日期:2015-04-19]
维吾尔族医药(简称“维药”)有着长期的发展过程,长久以来维吾尔族人民在与疾病进行斗争和自我保健的过程中,积累了许多宝贵经验,并通过连续不断的发扬创新与总结提高,维药在传统中医学的影响下,综合了阿拉伯和古希腊医药学的优点,逐步形成了具有新疆特色的医学体系[1-4]。
维吾尔族医药在传统医学库中占有很高的比例,仅常用药就有1 000多种,再加上长期以来新疆维吾尔医疗机构的行医用药,积累了大量维吾尔医药材数据资料。目前这些药材数据资源主要是采用已编书籍来存档,使用时通过目录中记载的药材名称或人工标注来进行检索。查找过程中往往依赖于搜索者的先行经验,搜索存在诸多困难,数据利用率低,满足不了快速发展的维吾尔医学及新药开发过程中快速而准确检索的需求。要高效利用这些数据资源,就要建立一个维吾尔医药材资源数据库和检索平台。
针对上述目标,本课题组提出建立“维吾尔医药材资源数据库及检索平台的研究与设计”,本文就该检索平台中的维吾尔族医药材数据库中图像检索技术作一综述。
1图像检索
图像检索技术从20世纪70年代兴起,到21世纪80年代,基于文本的图像检索(TBIR)已经普遍应用起来。其将图像作为一个处理单元,人为地进行关键信息标识;使用时,通过对这些标注的查找,完成对图像的检索。直到20世纪末,利用图像的内容进行分析和检索的方法出现了,称为基于内容的图像检索(CBIR)[5-6]。
1.1基于文本的图像检索基于文本的图像检索使用了传统的文本检索方法,不关注图像视觉信息[7-9],而是通过图像的作者、创建日期、大小、图像基本信息等信息标识图像,并利用这些标识来查询,或按照文件系统的结构化目录浏览图像。进行图像查找时,输入描述性文本,当描述信息与图像标识一致时即可输出图像;反之则输出为空。文本标识检索包括2条途径:(1)使用图像基本信息进行检索,包括图像的作者、创建日期、大小以及其他的文本信息。(2)使用手工标注进行检索。用文字描述图像的内容,分类并标识为关键字,进而建立索引。
基于文本的检索容易实现,操作简单,目前仍然是各搜索引擎和门户网站主要使用方法;但是用户一旦对图像的理解与图像的标注描述有偏差,就无法准确地查找所需图像;同时人为地进行图像标识,工作量较大且效率低,并且标识是主观的;某些图像本身要表达的信息很难用语言或文字进行描述。
在数字化时代,图像数据与日俱增,单纯基于文本的图像检索已满足不了用户的需求。为了突破基于文本检索中标识的人为干预,人们开始研究图像视觉特征,并期望使用这些特征作为图像的“关键字”。
1.2基于内容的图像检索基于内容的图像检索是根据图像本身所包含的信息进行检索,用目标图像本身的颜色、形状等底层视觉特征构成描述图像内容的特征向量,用特征向量建立索引并定义匹配方法,找出特性相似的图像[10]。用图像本身具有的内容去描述图像使得检索的切入点更加准确。目前已启用的基于内容的图像检索系统有很多[11],如IBM公司开发的QBIC系统、哥伦比亚大学研发的WebSeek系统、麻省理工学院研发的Photobook系统等。基于内容的图像检索思路是:(1)针对不同来源的图像进行预处理,选取特定算法进行特征提取,建立特征检索索引;(2)使用相似度匹配算法,计算待查询图像与特征检索索引之间的关联;(3)按相似度的不同级别进行反馈。该方法根据图像表现实质提取检索特征;能够近似匹配,在不知道目标图像注释信息的情况下,利用图像特征找到与其相似的图片;基于内容的图像检索系统一般配套有图像库、特征库等,可以满足用户多方面的查询要求[12-13]。
2图像检索的内容特征提取
图像内容特征提取是对图像本质特性进行检测并将图像分割,将其数值化或符号化,形成特征矢量[14]。图像的本质特征是指那些能够反映图像内在属性和特点的低层信息。在提取这些特征时,对拍摄和采集环境的变化不敏感,因而在表示图像时,尽可能地展现图像本身的内容,并不受到领域的干扰。特征提取是图像识别、基于内容的图像检索、图像数据挖掘等工作的基础,是图像分类和模式识别的重要环节[15]。
2.1图像颜色特征颜色特征是最主要区分事物的视觉特征,在现有检索系统中被广泛使用,主要原因是与其他的视觉特征相比,对于图像的大小、缩放和旋转的依赖性较小,甚至在各种形变中,均能保持特征不变性,稳定性比较好[16-18]。
2.1.1颜色直方图特征颜色直方图作为颜色特征广泛地应用于图像检索系统,表现能力很好,彩色图像的直方图描述的是不同颜色在整幅图像中所占得比例,而对颜色所处的空间位置并不是很关心[19]。计算颜色直方图,首先根据使用的颜色空间划分区间,每一个区间作为一个直方图小单元;然后计算每一个区间中某颜色像素出现的频率;最后进行图形化描述。
2.1.2颜色矩特征颜色矩(Color Moments)特征是一种简单有效的颜色特征表达方法[20],即用它的矩表示图像的颜色分布,例如常使用颜色的一阶矩(Mean)、二阶矩(Variance)、三阶矩(Skewness)。由于像素具有颜色空间的3个分量,结合每个分量上的3个颜色矩就可以表达图像信息,特征量相对少,但是该特征分辨力较低,因而进行过滤缩小范围时使用。
2.1.3颜色集颜色集比较类似于颜色直方图,它支持大数据量的图像检索。在提取该特征时,首先要进行颜色空间的转化,将RGB空间转化为用户感知特性的颜色空间,得到一个多颜色输出的量化函数;利用该颜色分量函数建立图像的索引表。颜色集方法只是一种表达方式,类似于阈值直方图,对大规模的图像集检索效果比较好。
2.1.4颜色相关图颜色相关图(Color Correlogram)是图像颜色分布特征的描述。它描述了图像中颜色变换的空间关系,该特征对于查询空间相同的图像比较好,但是计算量太大。
2.2图像纹理特征纹理特征是一种量化的结构特征,用于反映图像中特定结构的重复,可区分不同内容。近些年来,对纹理分析方法的各种理论或方法的应用已经比较成熟,目前常用的纹理特征提取方法包括结构方法、信号处理方法、几何方法、模型方法和统计方法。
2.2.1灰度共生矩阵灰度共生矩阵是20世纪70年代早期Haralick等[21]提出的基于二阶灰度统计特征的共生矩阵方法。灰度共生矩阵是图像中处于相对位置的像素对同时具有某灰度值的频数来统计表达图像的纹理信息。该方法中总共有14种标量来表征纹理特征,但是在实际应用中只选用能量、惯性矩、熵、相关4种标量,特征向量的维数较少,提取速度快,是公认的一种重要的纹理分析方法。
2.2.2Tamura纹理特征Tamura等[22]以人的主观心理度量为标准,提出6个基本的纹理特征,即粗糙度、方向度、对比度、线像度、规整度和粗略度,其中最常用的是前3个特征:(1)粗糙度:是指图像中像素点之间灰度级别在三维形态下的变化差距和间距状况,它反映了图像灰度变化的程度。(2)对比度:是指一幅图像中灰度变化的层次,层次越多表示对比度越大,反之则越小。(3)方向度:图像中的像素在某个方向上呈现线性分布,例如人体肌肉或者组织的纹理。纹理分析在医学中的应用始于20世纪70年代,目前国内外学者仍在不断地进行探索。将纹理特征提取应用于医学图像时,找到图像的本质特点和纹理分布规律,才可能取得较好的结果。
2.3图像形状特征形状特征是属于图像的基本特征之一,有2种表示方法:一类是区域,它针对图像中特定范围;另一种是轮廓,它针对的是物体的边界[23]。
2.3.1区域特征区域特征利用一定的界限范围内,具有相似性和连续性的像素点来描述这一范围的参数。矩的计算就要使用目标范围内所有相关的点进行统计,从全图像的角度描述对象。
Hu在应用图像二维矩进行模式识别时给出了一组基于通用矩组合的代数矩不变量,称为Hu矩[24]。Hu矩利用图像的第二、三阶归一化中心矩,可以得到描述图像的7个特征变量组。由于Hu矩描述图像轮廓时具有空间几何不变性,已经被广泛用于描述图像的形状特征。
2.3.2轮廓特征轮廓特征是对对象形体和周围区域之间的明显变化进行描述,进而借助该描述,查询具有相似轮廓的其他对象。常见的轮廓描述方法包括基于傅立叶变换的轮廓描述[25]、基于曲率尺寸空间的轮廓描述[26]、基于小波变换的轮廓描述、Hough变换以及链码等方法。
3图像特征提取方法比较
随着图像检索技术的应用,特征提取的方法也逐步深入,不同的特征提取方法也各有优劣。图像颜色特征能够描述一幅图像中不同颜色的分布比例,但其对图像中局部颜色无能为力,而且在对各种色彩所处的空间位置进行描述也比较困难,即无法具体描述图像中的对象[27]。
图像纹理特征是全局特征,因而具有很好的可行性和稳定性。相比颜色特征,纹理特征不会受到局部差异的影响而搜索失败。同时该特征不受图像转动的影响,有很强的抗噪能力。但是,得到的纹理特征会随着图像的像素分辨率变化而变化[28]。
图像形状特征的目的性很明确,研究图像中的特殊区域,但若目标产生形变,则算法稳定性会大大下降,同时由于形状特征具有全局性,对其计算时间比较长,而且存储空间要求也会比较大[29-30]。每一类图像特征都有其各自的忧劣,仅使用某一类特征进行图像检索,可能从该特征的角度出发,可获得比较好的检索结果,但是在进行整体描述时,却可能和人眼观察到的有偏差。因此,在进行整幅图像内容检索时,通常不使用描述部分属性的单一特征,大多数情况下,都会使用不同特征进行组合,力求最好的检索效果。
4图像特征的相似性匹配
一种合适的相似性匹配方法在很大程度上影响着检索结果。人通过眼睛观察、搜寻相似图像和目前使用的距离算法有很大的差异,这也是导致检索结果不一定符合要求的重要原因。
目前,进行图像特征相似性匹配的主要方法是通过向量空间模型,计算图像特征之间的距离来衡量彼此之间的相似性程度。
总之,基于内容的图像检索技术已经应用于多个领域,弥补了传统检索方法的不足。随着网络技术的飞速发展,基于内容的图像检索必将有着更为广阔的使用前景。将基于内容的图像检索技术运用到维吾尔医药学领域,找到适合于新疆维吾尔药材图像检索的特征并验证其检索性能,旨在提高维吾尔医药材图像检索准确率,为开发基于内容的新疆维吾尔医药材图像检索系统提供一定的依据,提高维吾尔医药材图像资料的利用率,进一步辅助医药学科研人员及其他相关人员检索所需药材并查询相关的药理作用,高效地利用已有的维吾尔药材数据资源。这对新疆维吾尔医药材数据资源的全面研究和有效利用有着积极而深远的影响,对于促进民族地区医药事业和经济发展具有重要意义。
参考文献:
[1]新疆药物研究所维吾尔药重点实验室.维吾尔药材真伪鉴别[M].乌鲁木齐:新疆美术摄影出版社/新疆电子音像出版社,2007:132-133.
[2]Liu C, Gu ZY, Yang WJ, et al. Advances of biological taxonomy and species identification in Medicinal Plant Species by DNA barcodes[J].J Am Sci,2011, 7(5):147-151.
[3]黄秀兰,周秋兰.维吾尔医药发展现状及存在问题分析[J].中央民族大学学报,2007,16(3):223-228.
[4]王宇真,吕风民,韩勇明.维吾尔医药资源及药物学说简介[J].中国中药杂志,2005,30(4):315-317.
[5]韦娜,耿国华,周明全,等.基于内容的图像检索系统性能评价[J].中国图像图形学报,2004,9(11):1271-1276.
[6]王春燕,郭圣文,吴效明.基于内容的医学图像检索[J].医疗卫生装备,2008,29(5): 33-35.
[7]Nidhi G, Priti S. A refined hybrid image retrieval system using text and color[J].Int J Comput Sci Issues,2012,9(4):48-56.
[8]阿斯艳·哈米提,阿不都热西提·哈米提.基于文本的图像检索与基于内容的图像检索技术的比较研究[J].首都师范大学学报:自然科学版,2012,33(4):6-9.
[9]张骞.基于文本的与基于内容的图像检索技术比较研究[J].情报探索,2012,171(1):111-113.
[10]齐恒,李克秋,申彦明.基于特征点组合聚类的图像检索新方法[J].大连理工大学学报,2014,54(4):477-481.
[11]王莹,罗坤,姜磊,等.基于内容的图像检索技术的专利技术综述[J].电视技术,2013,3(2):62-65.
[12]Shi ZP, Liu X, Li QY ,et al. Extracting discriminative features for CBIR[J]. Multimedia Tools Appl, 2012, 61(2):263-279.
[13]Imane D, Khalid I. A fast and efficient fuzzy approximation-based indexing for CBIR[J]. Multimed Tools Appl,2014,1(12):821-847.
[14]刘益新,郭依正.灰度直方图特征提取的Matlab实现[J].电脑知识与技术,2009,5(32):9032-9034.
[15]翟俊海,赵文秀,王熙照.图像特征提取研究[J]. 河北大学学报, 2009, 29(1): 106-112.
[16]刘颖,范九伦.基于内容的图像检索技术综述[J].西安邮电学院学报,2012,17(2):1-8.
[17]Liu GH, Yang JY. Content-based image retrieval using color difference histogram [J]. Pattern Recognition, 2013, 46(1):188-198.
[18]Ping Y, Zhang CH. Image retrievals based on color and texture features [J]. IEEE Int Sig Pro Appl,2007, 2:1-4.
[19]张悦,霍宏,方涛.基于生物视觉的颜色直方图特征提取[J].高技术通讯,2014,24(4):407-413.
[20]张少博,全书海,石英,等. 基于颜色矩的图像检索算法研究[J].计算机工程,2014,40(6):252-255.
[21]Haralick RM, Shanmugan K, Instein I. Texture features for image classification [J]. IEEE Trans Syst Man Cybern B Cybern,1973, 3(6): 610-620.
[22]Tamura W, Hideyuki T, Mori C, et al. Texture features corresponding to visual perception [J]. IEEE Trans Syst Man Cybern B Cybern, 1978, 8(6):460-473.
[23]Zhang DS, Lu GJ. Review of shape representation and description techniques[J]. Pattern Recognition,2004,37:1-19.
[24]Hu KM.Visual pattern recognition by moment invariant[J]. IEEE Trans Inf Theory,1962,8(2):179-187.
[25]Zhang DS, Lu GJ. Shape based image retrieval using generic fourier descriptors[J]. Signal Processing, 2002,17(10):825-848.
[26]Mokhtarian F, Mackworth AK. A theory of multiscale, curvature-based shape representation for planar curves [J]. IEEE Trans Pattern Anal Mach Intell, 1992, 14(8):789-805.
[27]Dong YB, Li J, Cheng GL. Research on Feature Extraction Based on Color and Texture[J]. Appl Mech Mater,2013,10(448): 3671-3674.
[28]Gletsos M, Mougiakakou SG, Matopoulos GK, et al. A computer-aided diagnostic system to characterize CT focal liver lesions: design and optimization of a neural network classifier [J]. IEEE Trans Inf Technol Biomed,2003,7(3):153-162.
[29]Sonal K, John HP, Andrew NY, et al. Histological image classification using biologically interpretable shape-based features[J]. BMC Med Imaging,2013,13(1):9.
[30]Li HL, Guo CH. Similarity measure based on multidimensional shape feature representation for time series[J]. Xitong Gongcheng Lilun YU Shijian (Systems Engineering Theory and Practice),2013,33(4):1024-1034.
(本文编辑施洋)