贾伟
关键词:结直肠癌;形态特征感知;卷积神经网络;病理图像分类
0 引言
结直肠癌是发生在结肠或直肠的癌症,是我国发病率和死亡率较高的癌症类型之一[1-2]。对结直肠癌病理图像的准确分类有助于医生做出准确的病理诊断和预后判断。为对癌症做出准确分类,一些学者围绕深度学习对癌症病理图像的分类方法展开了研究,例如,NAHID 等[3]提出基于卷积神经网络(Convolu?tional Neural Network,CNN) 和长短期记忆的乳腺癌图像分类方法(Breast Image Classification Method Basedon Convolutional Neural Network and Long-Short-Term-Memory,BCBCL) 。DORJ等[4]提出基于深度CNN的皮肤癌分类方法(Skin Cancer Classification Method Basedon Deep Convolutional Neural Network,SCBC) 。GOUR等[5]提出基于残差学习的乳腺癌图像分类方法(BreastImage Classification Method Based on Residual learning,BCBR) 。HAMEED等[6]提出基于集成深度学习的乳腺癌图像分类方法(Breast Image Classification MethodBased on Ensemble of Deep Learning,BCBED) 。
然而,由于病理切片的制作過程受到各种外部因素的影响,导致结直肠癌病理图像中存在形态细节模糊的情况。此外,结直肠癌病理图像中的形态特征较为复杂,现有的癌症病理图像分类方法难以有效提取特征信息,这些因素导致现有的分类方法无法较好地分类结果。为解决现有分类方法存在的不足,本文提出一种基于形态特征感知的结直肠癌图像分类方法(Colorectal Cancer Image Classification Method Based onMorphological Feature Perception,CCBMF) ,使用两阶段的图像预处理方法(Two-Stage Image PreprocessingMethod,TSIM) 对病理图像进行增强,然后在基于形态特征注意力网络的CNN(Convolutional Neural NetworkBased on Morphological Feature Attention Network,CNBM) 中使用形态特征注意力网络(MorphologicalFeature Attention Network,MFAN) 获得更准确的形态特征信息。
1 结直肠癌图像分类方法
CCBMF 的整体结构如图1所示,其包括两个部分:首先,在图像预处理部分,利用TSIM对结直肠癌病理图像进行预处理,增强形态特征;然后,在图像分类部分,利用CNBM对增强后的病理图像进行特征提取和分类。
1.1 两阶段病理图像预处理方法
为增强结直肠癌病理图像的形态特征,本文使用TSIM对病理图像进行预处理。TSIM的处理过程如图1所示。预处理分为两个阶段,在第一阶段:为了增强形态特征的细节信息,采用Haar小波变换对图像进行二级分解,将图像分解为低频部分和高频部分,分解结构如图2所示,得到一个低频子频带LL1和六个高频子频带LH2、HL2、HH2、LH1、LH1和HH1。对于低频部分,使用改进的直方图bin[7]进行处理,对于高频部分,使用约束最小二乘滤波进行处理,再对低频部分和高频部分进行重构;在第二阶段,使用自适应震动滤波器[8]对经过Haar小波变换重构后的图像进行去噪,从而获得预处理后的增强病理图像。
1.2 结直肠癌图像的分类
为获得更好的形态特征信息,本文使用CBMF对病理图像进行特征提取,在CNN中引入MFAN,该注意力模块使用空间变换网络[9](Spatial Transformer Net?works,STN) 获得病理图像中的形态特征信息。MFAN的结构如图4所示,包括两个分支,特征图1和特征图2是分别从编码器不同层获得的特征图,在第一个分支,上一个编码层和下一个编码层获得的特征图分别经过STN后,进行减运算,得到不同层直接的形态特征差异信息,然后经过由5×5卷积、3×3卷积和1×1卷积并行组成的卷积层,融合不同编码层的特征形态信息。在第二个分支,下一个编码层获得的特征图经过1×1 卷积、3×3 卷积、批归一化(Batch Normalization,BN)、激活函数ReLU、3×3卷积和Softmax函数,再与第一个分支的结果进行乘运算,将乘运算的结果作为MFAN的最终输出。
CBMF的结构如图5所示,将ResNet50作为CNN的下采样编码器并将MFAN引入网络中,在获得更加准确的形态特征后,将其加入解码器的上采样中。
2 实验结果与分析
2.1 实验数据与评价指标
为验证本文分类方法的准确性,在实验中选用结直肠癌组织学数据集[10],该数据集由Aperio数字病理扫描仪获取,包括八种结直肠癌类型。使用准确率、精确率、召回率和F1-Score四个指标对分类效果进行评价,准确率、精确率、召回率和F1-Score的计算公式分别为:
其中,TP 是分类为阳性的阳性样本数,FP 是分类为阳性的阴性样本数,TN 是分类为阴性的阴性样本数,FN是分类为阴性的阳性样本数。
2.2 结果与分析
下面通过消融实验说明TSIM和MFAN在CCBMF中的作用。在消融实验中,将80%的数据作为训练数据,20%的已标记数据作为验证集。实验结果如表1所示,从表1中可以看出,CNN的分类效果低于其他三组分类方法,说明在CNN 中分别加入TSIM 和MFAN后,能提升对结直肠癌病理图像的分类效果,CCBMF的分类效果优于其他三组分类方法,说明同时加入TSIM和MFAN能准确获得形态特征信息,有助于提高分类效果。
为验证本文分类方法CCBMF 的分类效果,将CCBMF 与现有的分类方法BCBCL[3]、SCBC[4]、BCBR[5]和BCBED[6]进行比较。表2为各分类方法的比较结果,从表中可以看出,CCBMF的分类效果优于现有的分类方法,这是因为CCBMF通过TSIM增强了病理图像中的形态特征,利用MFAN获取了较为准确的形态特征信息。
3 结论
本文提出了结直肠癌病理图像的分类方法CCBMF,该方法利用TSIM增强了病理图像中的形态特征,通过在CNN中引入MFAN,获得了更加准确的形态特征信息,使得CCBMF能够有效提高结直肠癌病理图像的分类效果。