排孜丽耶·尤山塔依,严传波,木拉提·哈米提,姚娟,阿布都艾尼·库吐鲁克,吴淼
(1.新疆医科大学基础医学院,乌鲁木齐830011;2.新疆医科大学医学工程技术学院,乌鲁木齐830011;3.新疆医科大学第一附属医院影像中心,乌鲁木齐830011)
肝包虫病,是囊状幼虫寄生在肝脏所致的寄生虫病,潜伏期较长,初期症状不明显,畜牧地区较常见,多流行于我国西北、内蒙和四川西部地区[1]。近年来随着旅游业的发展、人口的流动和家犬的增多,肝包虫病已成为全世界流行性疾病,严重危害着各国人民的健康和经济发展[2]。
国家虽已对肝包虫病的防治做了大量工作,但是由于牧区医疗条件相对落后,人才缺失等诸多因素,目前包虫病防治仍然面临诸多困难[3]。内陆和沿海地区因肝包虫病甚为少见,导致当地医生缺乏对该病认识,容易误诊[4]。肝包虫病起病隐匿,临床症状和体征与其他肝占位性病变无特异性,因此,及时准确地发现和诊断肝包虫病,对降低其误诊率和死亡率有重要意义。计算机辅助诊断(computer aided diagnosis,CAD)技术通过分析患者图像,向医生提供病灶信息及初步诊断意见以供参考,提高诊断准确性和工作效率,减少或避免误诊和漏诊的发生[5]。本研究在项目组已有的研究基础上,把图像融合方法应用到肝包虫病的分类识别中,与传统预处理方法进行比较,研究适合于肝包虫病的计算机辅助诊断方法,为后期研发肝包虫病计算机辅助诊断系统奠定基础。
本研究实验对象由新疆医科大学各附属医院影像中心提供,随机选取正常肝脏、单囊型肝包虫病、肝囊肿CT图像各120幅,共360幅。经影像科医师指导分类,并从原始图像中人工干预下分割出病灶信息区,即感兴趣区域(region of interest,ROI),见图1。
图1 ROI选择Fig 1 ROI selection
图2 预处理结果Fig 2 Results of preprocessing
2.2.2 图像融合 图像融合,即尽量地对多源信道图像每一信道中的有用信息进行提取并综合成一幅图像,使各种信息能够在同一幅图像中得到表达,提高图像的有用信息包含量,有利于更准确、可靠、全面地获取目标信息[7]。本研究根据CT图像的特点,对ROI图像分别提取蕴涵着图像多方面信息的特征子图像,再对其进行融合。
在空域中,采用了对扫描噪声非常有效的中值滤波器[8]和使传输过程中由于受干扰而退化的图像细节变得清晰的锐化滤波器[8-9];在频率域中,选取了高斯低通滤波器[8]、高斯高通滤波器[8]和同态滤波器[9];为了消除图像边缘的毛刺,填补图像中由于干扰等原因出现的断裂和缺口,运用了形态学方法对图像进行腐蚀、膨胀、开启与闭合操作[8-9]。最后,采用列灰度均值替换原灰度值的方法对图像进行点处理,这样新得到的增强图像可以反映原有图像本身的对比度与明暗度。以上处理较全面地反映图像的特点,体现图像的边缘和细节特征,反映图像的自然属性。
高斯低通滤波器:
式中,σ是高斯曲线的标准差。
高斯高通滤波器:
膨胀运算:
其中,Ø为空集,B为结构元素。
腐蚀运算:
式中,Qr为计算区多年平均地下水补给量(m3/a),ρ为开采系数。经计算,地下水可开采量(Qap)为 13275 万 m3/a。
均值与方差是数理统计中常用的特征统计量,在图像分析中,均值反应图像的亮度,方差反应图像高频部分的大小,CT图像具有丰富的高频细节信息,因此,采用提取每幅特征子图像的列均值与列方差组成特征矩阵来进行特征图像的融合,减少计算量的同时又尽可能地保留特征图像的特征信息。假设特征图像Xi=(X1,…,XN) ,i=1,…,N,则:
其中,j是图像行维数。
特征图像提取和融合结果见图3,第一个箭头左边是原始图像ROI,右边从左到右依次是中值滤波,锐化滤波,高斯低通滤波,高斯高通滤波,同态滤波,腐蚀,膨胀,开启,闭合与列均值替换后的特征图像,第二个箭头右边是融合后图像。
图3 特征图像提取并融合结果Fig 3 Results of feature image extraction and fusion
2.2.3 图像特征提取 纹理作为物体表面的一种基本属性,能很好地表征图像,被广泛应用于图像分析中。本研究采用基于Tamura和灰度-梯度共生矩阵算法的纹理特征提取方法[10]。灰度-梯度共生矩阵能很好地描绘图像的纹理信息。
(1)粗糙度 图像中像素的平均强度值为:
其中,活动窗口大小2k×2k,g(i,j)是坐标 (i,j)的像素灰度值,k=0,1,…,5。每个像素在不相重叠窗口之间的平均强度差:水平方向
垂直方向
使E值达到最大的k值来设置最佳尺寸:
计算整幅图像中Sbest的平均值可得到粗糙度,表达式为:
式中,m,n分别为水平和垂直方向的像素总数。
式中,np为直方图中峰值的数目,p为直方图HD中的峰值,wp为峰值p包含的量化值范围,Øp为波峰中心位置,Ø为量化后的方向角,r为直方图归一化因子。
其中,PDd表示在距离内的n×n大小的局部方向共生矩阵。
r是归一化因子,σxxx是Fxxx的标准差。
提取到单囊型肝包虫病、肝囊肿、正常肝脏CT图像预处理后的和融合后的ROI图像Tamura 6个特征和GGCM 15个特征值:小梯度优势、大梯度优势、灰度分布不均匀性、梯度分布不均匀性、能量、灰度均值、梯度均值、灰度标准差、梯度标准差、相关性、灰度熵、梯度熵、混合熵、差分距、逆差分距,把它们输入到支持向量机[11]和BP神经网络[12]算法中,进行分类处理,分类结果见表1、表2.(注:最佳分类准确率是模型最优参数下的分类准确率,混合特征是由Tamura和GGCM特征组成的特征,即共21维特征)
实验过程中,采用十折交叉验证法,支持向量机使用序列最小最优化SMO算法,核函数选择多项式核函数,调整参数C(默认值1,一般10-4≤C≤104)和BP神经网络中的隐含层神经元个数(计算公式是属性数量,o是类别数量,n是1~10之间的常数)进行实验。其中,C是惩罚系数,即对误差的宽容度。C越高,说明越不能容忍出现误差,容易过拟合。C越小,容易欠拟合。C过大或过小,模型泛化能力变差。本实验调节C范围1~30。平均分类准确率跟参数调整曲线和最佳平均分类准确率下的模型参数评估见图4(注:标签1、2分别代表预处理后和融合后图像)
表1 不同特征下3种肝脏预处理后图像最佳分类准确率Table 1 The best classification accuracy of preprocessing images with different features
表2 不同特征下3种肝脏融合后图像最佳分类准确率Table 2 The best classification accuracy of three kinds of liver fusion images with different features
由表1、2可知,传统预处理方法对肝囊肿CT图像Tamura和混合特征的分类效果明显优于图像融合方法,其中Tamura特征的分类效果优于混合特征,最佳分类准确率为98.333%;图像融合方法对单囊型肝包虫和正常肝脏CT图像不同特征下的分类准确率均高于传统预处理方法,其中单囊型肝包虫病图像GGCM特征的分类效果比Tamura和混合特征好,最佳分类准确率为99.167%,正常肝脏CT图像不同特征下的分类准确率均相等,为100%。由图4可以看出,图像融合方法不同特征、不同分类器下的平均分类准确率均高于传统预处理方法。
评价一个分类模型的分类精度,除了分类准确率之外,还需要计算一些统计量,如查准率(Precision),查全率(Recall),F度量(F-Measure)和 ROC曲线下面积(AUC)等,这些指标均是[0,1]范围内的小数,越接近1,说明分类模型越好。由图4可以看出,图像融合方法不同特征下两种分类器的参数值均高于预处理方法,说明图像融合方法下的分类模型的平均分类精度比预处理方法的好。
图4 不同方法下平均分类准确率跟参数调整变化曲线和模型参数评估Fig 4 Average classification accuracy,parameter adjustment variation curve and model parameter evaluation under different methods
本研究把图像融合方法应用于肝包虫病CT图像的分型中,从原图像ROI中提取多幅特征子图像,并对其进行融合为一幅蕴涵着原图像多方面特征信息的融合图像,同时使用传统的预处理方法与之比较,通过对融合后和预处理后的图像进行纹理特征提取和分类,结果表明图像融合方法对正常肝脏和单囊型肝包虫的分类能力比传统的预处理方法好,而传统的预处理方法适合于肝囊肿CT图像的分类。