张九妹 杜建军 姚宗碧 田 蕾
1(宁夏回族自治区人民医院信息中心,银川 750021;
2(宁夏工商职业技术学院,银川 750021)
高血压、脑血管硬化、冠状动脉粥样硬化等心脑血管疾病,是目前我国老年人死亡和致残的主要原因,而这类疾病损伤的组织水平首先是在微循环和微血管层次的变化。眼底视网膜微血管是人体惟一可以非创伤性直接观察的较深层的微血管,它的改变程度与高血压、糖尿病等疾病的病程、严重程度及愈后情况等密切相关。考虑到眼底疾病诊断的客观性、重要性及大批量眼底普查的需要,对眼底图像的自动筛查提出了迫切要求。然而,目前计算机辅助诊断(computer aided diagnosis,CAD)在眼科的应用还很少,因此,尝试开发眼底图像CAD系统,利用计算机视觉再解释医学图像的内涵,为医生做出正确的影像学诊断提供帮助,在提升眼底疾病诊治水平方面,有着重大的临床应用价值和经济价值。本研究针对目前现状,充分利用图像的统计特性,基于二维主成分分析法(2-dimensional principal component analysis,2DPCA)[1]、支持向量机 (support vector machine,SVM)[2-4]和K近邻聚类准则(K nearest-neighbor clustering criterion,KNN)[5],设计并实现了一个眼底图像异常筛查系统。
所研究的视网膜图像来自于眼底荧光造影系统,该硬件系统由眼底照相机、视频适配器、CCD摄像头、视频信号解码器、图像采集卡、图像监视器及PC工作站组成,其组成框图如图1所示。
系统采用的是日本TOPCON公司的TRC250 V/50 VT型眼底照相机,这种照相机的视角为20°~50°。CCD摄像头输出标准彩色信号,经视频解码后,分为3路(R,G,B)基色信号送入图像采集卡。图像采集卡把图像信号进行A/D量化为数字图像,保存在图像卡中,微机可以对图像卡中的图像信息作进一步的处理。另外,图像采集卡还可以将计算机处理后的图像通过D/A转化为模拟信号,在图像监视器上显示出来。
图1 系统的硬件组成框图Fig.1 The hardware diagram of the system
正常眼底的解剖结构有视乳头、黄斑、视神经盘和视网膜血管系统等等。在眼底图像处理中,视网膜血管系统是评估处理效果的重要指标之一,也是诊断糖尿病视网膜病变、高血压视网膜病变等疾病需要测量的重要参数之一。
实际应用中,颜色和灰度信息通常是判断眼底正常与否的重要因素;又由于眼底成像的过程中要受照相机视角(20°~50°)变化的影响,在提取特征时要充分考虑特征对颜色(或灰度)的敏感性和对旋转的不变性。而直方图作为最常用的表达特征的方法,它对目标的平移和旋转、部分遮挡不变,且直方图归一化后还使得尺度不变。直方图也适合描述纹理区域的内容,可反映不同灰度在整幅图像中所占的比例,且特别适于描述那些难以进行自动分割的图像。因此,采用灰度直方图作为眼底图像的一种归一化表示。但直方图的缺点是它没有包含任何空间域信息。当不同图像有相同直方图时,可能引起错误。一种更好的办法是在图像中分割目标以提取空间/形状信息,并满足不变性。研究中,发现眼底图像中血管和黄斑区的亮度较高,正常眼底中这些亮度较高区域的面积和其它区域面积的相对比值基本不变;而对于异常病变眼底,受出血点、局部病变等影响,血管、黄斑等较亮区域会被侵蚀,因此图像的明、暗区域比值会有变化,表现出与正常眼底的明显不同。综合考虑颜色、灰度等图像整体信息和上述明暗区域表达的局部信息,本研究提出一种混合表示的图像特征的方法,首先利用经典的OTSU法[2](大津法,也称最大类间方差法)将眼底图像粗分为明区域和暗区域两部分,再利用图像明区域和暗区域的灰度直方图同图像的整体灰度直方图混合来表示眼底图像。这样既考虑了图像的局部区域特征,又考虑了图像的整体特征,能够描述一些重要的空间关系,从而有利于提高检索的精度。
基于Matlab实现的的眼底图像CAD系统框图如图2所示。在训练过程中,读入正常和异常眼底图片各30张,作为正负样本构建训练集。在图像预处理部分,首先提取眼底造影图像的明部分直方图(由血管等较亮像素构成)、暗部分直方图(由其它较暗像素构成)和整个图像的颜色直方图,并分别进行归一化处理,之后再将这3类直方图组合成一个混合向量表示原图像的特征;其次,再用二维主成分分析法来提取非线性的有效特征并形成图像的特征库,同时降低样本中的噪声成分;最后,为了获得满意的检索精度和推广性能,利用线性支持向量机和最近邻聚类准则构建两分类器,并采用“留一交叉验证法”得到最佳分类模型。留一法源于K重交叉验证法,就是将N个样本置乱,然后均匀分成K份,轮流选择其中K-1份训练,剩余的一份做验证,计算预测误差平方和,最后把K次的预测误差平方和再做平均,作为选择最优模型结构的依据。若K取N,就是留一法(leave one out,LOO)。在进行图片识别时,图片间的相似性依靠最小化每个被测图像到分类超平面的决策距离来度量,而该决策距离采用SVM[3-5]对KPCA加权后的距离,这与传统的欧式距离和马氏距离等不同,是本研究的创新之处。
训练好分类器后,可以测试出分类器的分类正确率,接着就可以进行辅助诊断应用。这时,随便打开一个文件夹中的任意一张感兴趣的眼底图片,系统都可以自动进行识别判读,具体识别过程为:待识别的图像经过预处理并利用2 DPCA提取其图像特征,将之与图像的特征库进行匹配,得出匹配结果。
图2 眼底图像CAD系统框图Fig.2 The block diagram of the retinal image CAD system
实验采用软件:Vista系统,MatlabR2007 b编程;硬件:Pentium2.0 GHz CPU,2 GB内存。由于没有标准的眼底图像数据库,实验样本由宁夏自治区人民医院眼科提供。灰度眼底图片的格式为JPG,尺寸为768像素×576像素。
实验中选取由专家预先标注好的正常、异常图片共60幅作为训练样本。其中正常眼底图片包括左、右眼的不同角度的照片共30张,部分样本如图3所示;异常眼底图片包括视网膜中央静脉阻塞(central retinal vein occlusion,CRVO)、视网膜静脉阻塞激光治疗后(retinal vein occlusion,treated with laser photocoagulation)、息肉状脉络膜血管病变(polypoidal choroidal vasculopathy,PCV)、湿性黄斑变性(wet macular degeneration,wet AMD)、黄斑缺损(macular coloboma)等图片共计30幅,部分训练样本如图4所示。
图3 正常眼底训练样本示例。(a)正常左眼眼底(直视);(b)正常左眼眼底(转动后);(c)正常右眼眼底Fig.3 The examples of normal training samples.(a)Normal image of left fundus(looking straight ahead);(b)Normal image of left fundus(left eye moved);(c)Normal image of right fundus
图4 异常眼底训练样本示例。(a)视网膜静脉阻塞(激光治疗后);(b)息肉状脉络膜血管病变;(c)湿性黄斑变性Fig.4 The examples of abnormal training samples.(a)Retinal vein occlusion,treated with laser photocoagulation;(b)Polypoidal choroidal vasculopathy;(c)Wet macular degeneration
利用SVM算法训练分类器[6]后,就可以直接用该程序进行眼底图像识别筛查。该程序用于判读图像的界面如图5所示,只需找到需要判读的图片,系统即会自动识别。
系统识别结果如图6,对正常眼底图片的判读结果是“正常眼底”,如图中(a)所示;对病变眼底的判读结果是“异常眼底”,如图中(b)所示。系统识别结果与专家标注结果完全一致。
实验中通过该系统对120张(60张正常眼底和60张异常眼底)已做过标识的眼底图片进行异常筛查实验。实验中的有关数据见表1。实验表明,该系统的正确识别率为98.33%(识别正确率=识别正确的样本总数 /测试样本总数)。
实验表明,该系统具有很好的小样本学习推广能力,可用于异常眼底的筛查。
图5 打开需判读图片的界面Fig.5 The interface to open the pictures that needs to be interpreted
图6 系统识别结果。(a)正常眼底的识别结果;(b)异常眼底的识别结果Fig.6 The recognition results of the system.(a)The recognition results of normal fundus image;(b)The recognition results of abnormal fundus image
表1 实验数据及测试结果Tab.1 The experimental data and test results
充分利用图像的统计特性,基于2DPCA和SVM技术实现了一个眼底图像异常提示系统。该系统操作便捷,性能稳定,可靠性高。而且该系统是一个开放的系统,具有很好的扩展性。程序中用来进行正常和异常两分类,如果想扩充其分类类别数,只需增加相应数目的训练样本类便可。然而,实验中存在误判情况。观察误判的图片,是因为没有类似的图片参与训练,所以进一步改进系统性能的方法是将被误判的样本当作训练样本充实到CAD系统的训练样本集中,从而不断地完善系统模型的性能。
另外,如果在诊断出异常的情况下,还能细分出异常所属的病种,或者直接进行多分类判读,系统将更加具有实用价值,这将是本课题今后的研究方向。近来一些研究进展,如李士清等探讨了高度近视黄斑病变的类型及荧光素眼底血管造影(fundus fluorescein angiography,FFA)特征,将高度近视黄斑病变分为6种类型(漆样裂纹性黄斑病变,新生血管性高度近视黄斑病变,漆样裂纹性黄斑出血,高度近视性Fuchs斑,高度近视性黄斑萎缩,高度近视性黄斑裂孔等)[7]。如果有标注好的分类图片做训练,该系统也可以用来进行高度近视黄斑病变6种类型的判读。这样的系统有望在今后工作中实现。
[1]Yang Jian,Zhang D,Frangi A F,et al.Two-dimensional PCA:a new approach to appearance-based face representation andrecognion [J].IEEE Trans PAMI,2004,26(1):131-137.
[2]Vapnik VN.The nature of statistical learning theory[M].(2ndEdition).NewYork:Springer-Verlag,2000:17-180.
[3]Vapnik V N.An overview of statistical learning theory[J].IEEE Trans on Neural Network,1999,10(5):988-999.
[4]Vapnik V N.Statistical learning theory[M].New York,John Willey &Sons,1998:493-506.
[5]Dudar O,Hart PE,Stork DG.李冬宏,姚天翔,译.Pattern Classification[M].(2ndEdition).北京:机械工业出版社,2004:174-187.
[6]潘晨,闫相国,郑崇勋,等.用于彩色图像分割的支持向量机的快速训练[J].模式识别与人工智能,2005,18(4):392-398.
[7]李士清,文峰.高度近视黄斑病变分类及眼底血管造影特征分析[J]. 眼科新进展,2007,2(27):113-115.