一种基于SVM的胶囊内窥镜出血智能识别方法

2015-11-28 01:28作者徐文铭颜国正王志武赵少鹏
中国医疗器械杂志 2015年1期
关键词:特征提取消化道向量

【作者】徐文铭,颜国正,王志武,刘 刚,邝 帅,赵少鹏

上海交通大学仪器科学与工程系,上海市,200240

一种基于SVM的胶囊内窥镜出血智能识别方法

【作者】徐文铭,颜国正,王志武,刘 刚,邝 帅,赵少鹏

上海交通大学仪器科学与工程系,上海市,200240

由于Wireless Capsule Endoscopy(WCE)在消化道中采集到的巨大数量的图像均需要医务人员靠肉眼来排查,给医生带来巨大的负担。该文提供了一种基于支持向量机(Support Vector Machine,SVM)分类器的胶囊内窥镜出血智能识别方法,创立一种新的特征参数,并对SVM参数的选择进行实验优化,最终达到94%的特异度与83%的灵敏度。

特征提取;SVM;出血检测;无线胶囊内窥镜;颜色空间

0 引言

消化道出血是人体临床最常见的消化道疾病之一,也是众多严重疾病的前期信号。临床上传统的消化道检测采用插管式,给病人带来巨大痛苦,而且有肠穿孔的危险,内窥镜的交互使用又增加了病人间相互感染的几率。在对消化道小肠部分检查时更是无法使用内窥镜进行检查,只能进行手术。对消化道检查最好的办法就是直接获取内部图像,相比X-光,超声波检测这些间接测量方法,WCE(Wireless Capsule Endoscopy)更加可靠[1]。因此WCE作为一种具有无痛无创、全消化道覆盖等优点的新型检查装置被广泛用于临床消化道检测。早在2000年,Given Imaging公司就生产了第一个型号为M2A的WCE。M2A胶囊内窥镜的直径为11 mm,长为30 mm,体积小可以让病人吞咽下去。WCE在临床上给病人带来极大的便利的同时,也给医务人员带来极大的困扰。目前市面上已经出现的WCE产品每秒帧率在2 ~30 之间不等,最大时长在8 h左右[2-3]。取平均值16 f/s进行计算总共产生16×60×60×8 =460 800张图像,在近50万张的照片中寻找有出血病灶的图片不仅费时费力,而且在视觉疲劳时极易错过有出血征兆的图像,所以说几乎是人力不可完成的任务。而随着技术的进步,WCE视频帧率越来越高,届时给医生带来的检测负担将更为严重。

随着图像处理和模式识别技术的发展,通过计算机来辅助自动化识别出血图片成为必然趋势。Given Imaging 公司虽然提供了消化道出血特征自动识别的软件 SBI(Suspected Blood Indicator), 但是该软件的识别精度不够高还不足以代替人工的检测,据报导其灵敏度(sensitivity)与特异度(specificity)均达不到让人满意的程度[4],因此该软件的可靠性不足以满足医学诊断要求。因此,有很多学者从事WCE出血自动识别的研究,致力于提高特异度与灵敏度。根据目前主流的出血特征提取方法可分为三种:(1)基于全局图像的方法 Liu J等在文献[5]中提出了基于RGB空间用全局颜色直方图来提取特征,Li B等在文献[6]提出了基于HSI颜色空间的全局特征提取,使用不同的分类方法将图像直接判断为出血图片或非出血图片,基于图像的特征提取通常是作为一个整体来计算,运行速度快但是会错过一些较小面积出血的识别;(2)基于局部图像区域的方法 文献[7-9]对图像进行分块处理,提取局部特征,Li B等在文献[10]中提出基于色度矩和局部二值模式结合的纹理特征方法;(3)基于像素特征的方法 Pan G等在文献[3]中提出了基于PNN的出血像素提取方法。选择基于像素的特征提取方法,像素计算量大,会导致计算复杂度的升高,要选择合适的算法。

本文提出了一种新的基于像素的特征提取方法,基于RGB颜色空间,使用SVM分类器进行WCE出血检测。

1 图像预处理与特征提取

在分析彩色图像或者颜色特征提取之前,首先就要选定合适的颜色空间。常见的颜色空间有RGB、CMY、CMYK、CIELAB、YUV、HSV、HSI等等。针对不同的应用选择不同颜色空间。RGB空间三个通道相互独立,用R代表红色出血特征较容易被识别,因此首选RGB空间。尽管大多数消化道图片都呈现红色,如图1所示(a)图是正常消化道图像,(b)图是出血图像,但明显出血图像中的红色饱和度更高。本文将红色作为主要评价参数来判断出血图像。

图1 图片对比Fig.1 Contrast images

在图像出血特征提取众多方法中最直接的就是对其RGB三通道的色彩进行提取,因为颜色是出血图像中最重要的特征。本文实验样本的图像来源于Given Imaging公司网站上公开提供的两段视频,我们从中提取了720帧不同的图像。在进行特征提取之前必须对图像进行预处理,包括图像尺寸的规范化,颜色空间转化等。如本文图片原始格式大小为240×320,是从视频中按帧提取图片时保存为24 bit的RGB彩色图像,RGB每个通道相当于8 bit的灰度图像。在图像预处理中首先将图片的黑色边框部分裁剪掉,处理后的图像尺寸为207×85。对该主体图像部分将RGB三个通道的矩阵分别转化为一维的行向量以方便后续得特征提取,所得的每一维向量的维度是207×85=17 595。

由图2某出血图像RGB颜色直方图曲线可知蓝色分布比较集中,蓝色在整个分类中不占主导作用。由于我们目的是提取红色,而绿色对亮度影响较大,在文献[5]中采用红色像素除以绿色像素即R(i) /G(i) 来作为判断是否为出血点的依据。但在实际运算中会出现绿色像素为0,所以R(i)/G(i) 像素比趋向于无穷大。该文采取R(i)/[G(i)+R(i)]的像素比作为判断出血点的依据,可避免出现无穷大现象。每张图片的像素比例特征向量维度为17 595,这么大的特征维度会大幅降低运行速度和识别效率。由于图像中相邻像素之间的颜色差别不大,因此在将特征向量作为输入之前,对向量进行缩放采样。根据经验采样间隔d选为19(选择间距时要注意不要使之能被图片的宽度85整除,以保持采样像素点的随机性)将维度降到927。将720帧图片作为输入,得到一个720×927的矩阵,代表720个样本,每个样本有927个特征参数。

图2 出血图片的RGB颜色直方图Fig.2 RGB color histogram of a bleeding image

2 支持向量机

支持向量机是由Vapnik V在AT&T贝尔实验室时发明的模式识别算法,主要的思路是通过运用核函数的非线性映射将输入向量映射到高维的空间。然后在此高维空间找到一个线性分类超平面使其两类别之间出现最大的距离。也就是说,给定一组输入标定为属于1类或者2类,通过SVM训练建立模型。然后再给一个新的输入时可根据已训练的模型自动分为属于1类或2类。通常我们经常用于模式识别的核函数有以下4种:

本文使用的SVM工具是文献[11]中提到的LIBSVM软件包,使用4种核函数分别实验,选出最好的核函数以及参数,输出为0是正常图片,输出为1是出血图片。具体的使用步骤如下:

(1) 按照LIBSVM所要求的格式变换输入图片特征数据格式;

(2) 对数据进行简单的缩放预处理;

(3) 选择不同的核函数(首选RBF核函数);

(4) 采用格式搜索选取最佳参数c和g;

(5) 采用最优参数c和g训练支持向量机;

(6) 使用获得的模型对测试集进行预测。

在将数据作为LIBSVM输入前进行缩放操作至关重要,可以提高识别精度。本文在图像数据预处理部分已经将输入缩放到(0, 1)区间内。模型的参数选择对实验结果也至关重要,本文采用软件自带的grid_search工具[12]用K-fold交叉验证的方式找到最优的c和g。交叉验证的原理是将原始数据均分成K组,将每个子集数据分别作验证集,其余的K-1组子集作为训练集,K-fold 可以有效地避免过学习以及欠学习状态的发生。

3 实验过程分析

该文用720得到的720×927维矩阵作为输入,其中出血图片360张,正常图片360张。使用SVM集成软件LIBSVM(Chang & LIN 2001),采用四种不同的核函数分别实验。每次选择360张图片作为实验集,其中包括180张出血图片和180张正常图片,剩余360张作为测试集用来验证模型的准确率。如表1所示,在默认的参数设置g=1,c=2时,四种核函数测试准确率最高的是线性核函数和多项式核函数达到80%,而默认的径向基核函数测试准确率只有53%。

表1 不同核函数识别率对比Tab.1 The contrast between different kernels

线性核函数和多项式核函数理论上是径向基核函数的线性特殊形式,所以径向基核函数之所以表现不好的原因可能是默认参数不合适,因此我们选用K-fold交叉验证方法对参数进行寻优,找到最优参数。初始参数寻优cost 参数c的寻优范围根据经验设在(2-6,22)区间,核函数gamma参数g寻优范围设在(2-8,24)区间。由仿真结果可得当c=0.015 625, g=0.189 46时,CVAccuracy =100%是指由训练样本得到的模型对训练样本本身的识别率达到100%。在第二次寻优之前,根据第一次寻优值的结果将c和g的寻优范围分别缩小到(2-4,22),(2-5,22)区间。如图3、图4所示是二次寻优的结果,在c=0.062 5,g=0.25时寻到最优值对训练样本识别率可达到100%。对比两次寻优的结果发现尽管两次识别率同样达到100%,基于支持向量机的原理可得,同等识别率的情况下选择参数越小越好。所以本文选择c=0.015 625,g=0.189 46作为最优参数。

图3 精确参数寻优(等高线)过程图Fig.3 Precise parameters optimization

图4 精确参数寻优过程图(3D视图)Fig.4 Precise parameters optimization (3D view)

在核函数为多项式核函数的情况下运用最优参数c=0.015 625, g=0.189 46 来对测试样本进行实验。可得如下表2结果。对比表1和表2可以看出,线性核函数和多项式核函数在最优参数下的测试准确率和默认设置一致保持为80%。而径向基核函数测试准确率从52.777 8%提升到86.111 1%,K-fold参数寻优对准确率有了极大提升。

表2 采用最优参数的测试结果Tab.2 Testing results with optimal parameters

4 结论分析

本文提出一种在RBG空间基于SVM分类器的出血图像智能识别算法,从输入图像的预处理,特征数据提取与整合着手,提取红色像素与三种颜色之比例作为特征。图像预处理降低了黑色图像边缘对SVM分类结果的影响,而数据整合时采用的压缩采样,保证了算法的效率与运算速度。在支持向量机识别的过程中选用径向基核函数辅以K-fold参数寻优,参数寻优将准确率从53%提升到86%。最终获得令人满意的83%的特异度,94%的灵敏度。本文所提到的方法完全可以满足WCE临床诊断要求,从而帮助医生大大减轻工作负担。

[1] Basar MR, Malek F, Juni KM, et al. Ingestible wireless capsule technology: a review of development and future indication[J]. Int J Antennas Propagation, 2012, doi:10.1155/2012/807165.

[2] Bourbakis N, Makrogiannis S, Kavraki D. A neural network-based detection of bleeding in sequences of WCE images[C]. Fifth IEEE Symp Bioinform Bioeng, 2005, 324-327.

[3] Pan G, Yan G, Qiu X, et al. Bleeding detection in wireless capsule endoscopy based on probabilistic neural network[J]. J Med Syst, 2011,35(6):1477.

[4] Buscaglia JM, Giday SA, Kantsevoy SV, et al. Performance characteristics of the suspected blood indicator feature in capsule endoscopy according to indication for study[J]. Clin Gastroenterol Hepatol, 2008, 6(3): 298-301.

[5] Liu J, Yuan X. Obscure bleeding detection in endoscopy images using support vector machines[J]. Optimiz Eng, 2009, 10(2): 289-299.

[6] Li B, Meng MQH. Computer-aided detection of bleeding regions for capsule endoscopy images[J]. IEEE Trans Biomed Eng, 2009, 56(4):1032-1039.

[7] Poh CK, Htwe TM, Li L, et al. Multi-level local feature classification for bleeding detection in wireless capsule endoscopy images[C]. IEEE Conf Cybernetics Intelligent Syst, 2010,76-81.

[8] Lau PY, Correia PL. Detection of bleeding patterns in WCE video using multiple features[C]. IEEE EMBS, 2007, 5601-5604.

[9] Mackiewicz MW, Fisher M, Jamieson C. Bleeding detection in wireless capsule endoscopy using adaptive colour histogram model and support vector classification[C]. Med Imaging Int Society Optics Photonics, 2008: 69140R-69140R-12.

[10] Li B, Meng MQH. Computer-aided detection of bleeding regions for capsule endoscopy images[J]. IEEE Trans Biomed Eng, 2009, 56(4):1032-1039.

[11] Chang CC, Lin CJ. LIBSVM: a library for support vector machines[J]. ACM Trans Intelligent Syst Tech(TIST), 2011, 2(3):27.

[12] Faruto YL. LIBSVM-farutoUltimateVersion-a toolbox with implements for support vector machines based on libsvm[R]. http://www. ilovematlab. cn, 2009.

A Method for Bleeding Detection in Endoscopy Images Using SVM

【Writers】XU Wenming, YAN Guozheng, WANG Zhiwu, LIU Gang, KUANG Shuai, ZHAO Shaopeng

Department of Instrument Science and Engineering, Shanghai Jiao Tong University, Shanghai, 200240

Because the huge number of images of the digestive tract by Wireless Capsule Endoscopy (WCE) are left to the medical personnels detected by their eyes, huge burden leaves to doctors. This article provides a classification of method based on SVM (Support Vector Machine) for the capsule endoscopy bleeding intelligent recognition. We created a new kind of feature parameter, and the experiment result can reach 83% specificity and 94% sensitivity.

feature selection, SVM, bleeding detection, wireless capsule endoscopy, color space

TP391.41;R318.6

A

1671-7104(2015)01-0009-04

10.3969/j.issn.1671-7104.2015.01.003

2014-10-11

国家自然科学基金(31170968)

颜国正,E-mail: gzhyan@sjtu.edu.cn

猜你喜欢
特征提取消化道向量
向量的分解
大面积烧伤并发消化道溃疡大出血及胸腹腔感染1例
聚焦“向量与三角”创新题
观察消化内镜新技术在消化道早癌诊断治疗中的应用
探讨消化道早期癌前病变行内镜下黏膜剥离术(ESD)治疗后的护理干预
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
一种基于LBP 特征提取和稀疏表示的肝病识别算法
向量垂直在解析几何中的应用