王 进,冯友红
(1.南通大学附属海安市人民医院医学装备科,江苏南通 226600;2.南通大学附属海安市人民医院影像科,江苏 南通 226600)
近年来,随着我国医疗事业的不断发展,医学影像的自动化、智能化检测技术受到了更多的关注。深度学习技术与医学图像分析的结合已成为智能医疗领域的研究热点之一,并具有广阔的应用前景。一方面,医学影像的智能化识别可以降低医务工作者的工作压力,提升医疗检测效率,缓解看病难的社会矛盾;另一方面,医学影像的自动化检测可提升其识别水平,防止由于医务人员精力、认知水平不足造成误诊,以此提升患者的医疗体验[1-4]。但现阶段,医学影像仍无法应用到临床。这是因为当前积累针对特定疾病的医学影像数据不足、结构混乱、缺乏统一的数据接口,无法直接应用于现有的图像处理与识别算法[5-11]。
基于以上分析,该文对医学影像的检测技术进行研究。文中以X光片检测肺部结节为例,对相关的图像处理、机器学习方法进行研究。从图像特征提取、医学图像重构等方面对研究成果进行了细致的介绍,同时结合实际的公开数据集进行了算法的仿真与验证[12-16]。
该文在研究医学影像检测技术时,使用的是X光片。为了更优地完成医学检测,需要在这些图像上完成特征提取,然后将获得的特征输入到机器学习算法中。文中在进行特征提取时,主要基于图像的纹理特征。纹理特征不仅可以表现图像不同区域的像素信息,还能准确地反映图像像素的分布模式,刻画图像细节。使用的相关纹理特征,如图1 所示。
图1 使用的医学影像纹理特征
对于灰度值为I(i,j),尺寸为M×N的图像,图1中使用的各个特征的计算方法如下:
1)灰度统计特征
文中使用的灰度统计特征主要包括图像灰度的平均值、标准差和中值。这些统计特征可以较好地刻画图像的灰度信息。这些特征的计算方法如下:
2)灰度差异特征
对于医学影像检测,人体的某种病变在X 光中通常表现为高亮的斑点,然后再向外扩展,即存在病理区域R1 与过渡区域R2。对这两个区域的灰度均值、方差差异进行统计:
3)基于灰度共生矩阵的纹理特征
对于灰度值为I(i,j),尺寸为M×N的图像,其归一化后的灰度共生矩阵计算方法如下:
根据灰度共生矩阵,可计算在该矩阵下的相关纹理能量,如式(8)所示,对比度如式(9)所示,熵如式(10)所示,相关性如式(11)和式(12)所示。
4)尺度特征和基于Hessian 矩阵的纹理特征
对于尺寸为M×N的图像,其Hessian 矩阵的计算方法如下:
Hij是像素点(i,j)沿着不同方向的二阶导数,即:
此外,文中仍用式(8)的行列式作为特征。
5)基于多尺度高斯微分滤波器的纹理特征
多尺度高斯微分滤波器由灰度图像与二阶高斯滤波器的一阶偏导数在不同尺度、不同方向卷积获得,具体方法如下:
其中,σ、θ是不同方向的尺度,根据该文的定义可获得54 维的特征。在文中,其定义如下:
对于医学图像的检测,通常面临训练样本少的难题。在文中,由于当前的公开数据集中样本规模较小。以JRST 为例,其样本数量只有247 张。而上文中提取的特征共有74 个,样本数量与特征数量较为接近,容易造成分类器模型训练的过拟合,影响模型性能。因此需要结合现有的医学影像数据集,进行医学图像的重构。文中使用的重构算法为卷积稀疏编码,其基本原理如图2 所示。
图2 卷积稀疏编码示意图
在卷积稀疏编码前,首先对图像完成稀疏化处理并作为输入;然后采用不同的卷积核对其进行卷积,提取图像的不同特征;随后进行特征融合,获得输出图像。
该网络前向计算的公式如下:
网络的损失函数定义如下:
通过卷积稀疏编码,可学习到有效特征,获得医学图像检测的分类器。文中使用的卷积稀疏编码的目标函数如下:
经卷积稀疏编码后,可对医学影像进行重构,获得更多的训练、测试样本。从而避免了由于深度学习算法输入特征和样本数量比例畸形所造成的训练中的过拟合现象。在获得足够的训练、测试样本和输入特征后,使用代价敏感支持向量机作为分类模型。该模型适用于样本数量较少的应用场景,其优化函数如下:
其中,C+、C-为模型的正则化稀疏,通过这两个稀疏,可以得到对于正负样本的惩罚力度。
该文以肺部结节的检测识别为例,对相关理论算法进行验证。算法所需的仿真环境如表1 所示,其所使用的数据集来自JSRT 开源数据集。
表1 该文使用的仿真环境
在JSRT 数据集中,共有胸部的X 光片247 张。其中,肺部结节的胸片154 张。5 个不同类别的胸片如表2 所示。在154 张肺部结节的胸片中,有100 例为恶性肿瘤病例,所有的结节平均直径为18.4 mm。该数据集的部分图像如图3 所示。
表2 该文使用的数据集
图3 JSRT中的部分图像
为了评估卷积稀疏编码模型在肺部结节检测时的性能,文中使用灵敏度和特异度作为评价指标。这两个指标的定义方法如下:
其中,TP表示图像为真结节并被算法判定为真结节;FP表示图像为假结节但被算法判定为真结节;TN表示图像为假结节并被算法判定为假结节;FN表示图像为真结节但被算法判定为假结节。因此模型的Sens 和Spec 越高,表示算法的性能越优。
在分类器的选择上,文中使用支持向量机(SVM)算法,对JSRT 中所有图像统计的74 维纹理特征按照2∶1的比例划分为训练集和测试集。为了评估卷积稀疏编码的性能,在实验一中直接将数据输入到CSVM 算法中;在实验二中将数据集利用卷积稀疏编码算法,按照1∶5的比例重构后输入到SVM算法中。实验一、实验二的结果如表3和表4所示,肺部结节的部分识别结果如图4 所示。可以看出,文中的算法可以区分出假阳性肺结节和金标准肺结节。
表3 未引入卷积稀疏编码的计算结果
表4 引入稀疏编码后的计算结果
图4 肺部结节检测示意图
在实验统计时,将JSRT 中的明显可见和比较明显作为易识别组,难检测作为难识别组,非常难检测和完全不可见作为极难识别组。这样不仅保证了不同类别间数据规模的一致性,且使得统计结果更具有可读性。
对比表3、表4的数据可以看出,引入卷积稀疏编码后,所有组别的Sens 和Spec 均有所改善。在极易识别组的模型指标上,卷积稀疏编码对结果的影响较小。随着肺结节识别难度的增大,卷积稀疏编码对于模型指标的改善逐渐增大。最终从所有数据的Sens 和Spec 来看,引入卷积稀疏编码后达到了0.788 和0.769,提升了2.8%和3.8%。
近年来,深度学习算法在图像处理领域已有了广泛的应用。该文以医学影像的智能化检测为应用场景,对相关的深度学习算法和图像处理技术进行了研究。实验结果表明,文中算法在肺部结节的识别分类上取得了较优的分类效果。在未来,随着计算机技术和医疗检测设备的继续进步,计算机辅助医学检测将会得到更多的研究与关注,临床医学将不断向自动化、智能化发展。