基于多特征融合与XGBoost的肺结节检测

2021-12-02 06:44潘子妍邢素霞逄键梁申楠王瑜刘子骄鞠子涵

中国医学物理学杂志 2021年11期

潘子妍，邢素霞，逄键梁，申楠，王瑜，刘子骄，鞠子涵

1.北京工商大学人工智能学院，北京 100048；2.空军特色医学中心，北京 100048

前言

随着我国工业发展迅速、吸烟人群年轻化，肺部疾病发病率每年呈上升趋势［1］，特别是今年受全球新冠肺炎疫情的影响，肺部疾病成为严重威胁人类健康的疾病之一，具有起病急、进展快等特点［2］。英国癌症研究机构的研究数据显示，肺癌患者的5年生存率在I 期为87%，而IV 期仅为19%［3］，因此早发现早治疗，可有效提高生存率，避免病情恶化，降低病死率。

计算机断层扫描技术（Computed Tomography,CT）被认为是检测肺部病变最精确的成像模态［4］。肺癌的早期表现为肺结节，但由于肺腔内部形态复杂，肺结节的大小和位置均各不相同，仅靠医生的人工阅片难以避免漏诊的情况。因此，研究人员提出计算机辅助检测系统（Computer Aided Diagnosis,CAD）以辅助医生检测肺结节，减轻医生负担，提高准确率，降低假阳性率［5］。

国内外专家学者也提出了很多肺结节检测的算法，Li 等［6］采用改进的随机游走算法自动分割肺结节，结合灰度共生矩阵、旋转不变的均匀局部二值模式和Gabor滤波方法生成特征向量，利用交互信息来降维，采用改进的随机森林分类模型对结节进行分类。刘一鸣等［7］采用图像中心坐标随机平移和旋转两种方法对正样本进行扩充，训练卷积神经网络2D-CNN 进行肺结节检测。Chi等［8］采用扩展层代替卷积层，增加了感受域，提高网络学习图像全局信息的能力，对U-net 网络改进后构成DCNN（Deep Convolutional Neural Network）模型。虽然目前已有许多肺结节检测的方法，但仍然没有达到临床应用的要求。为了提高肺结节的检测精确度，本研究提出一种优化特征来优化肺结节检测模型，采用基于超分辨率重建的卷积神经网络（Super-Resolution Convolutional Neural Network, SRCNN）优化特征的提取，基于词袋（Bag-of-Words, BoW）进行多特征融合优化假阳性结节的去除，有效地辅助医生提高肺癌诊断的效率。

1 候选结节的提取

本研究对候选结节的提取主要包括2个步骤，分别是肺实质的分割、候选结节的分割。

1.1 肺实质的分割

在每张肺部CT 断层图像中，均包括了胸廓外组织（肌肉等），胸廓（肋骨、脊柱等），内部脏器，肺实质及肺内血管气管组织［9］，如图1所示。其中肺结节只存在肺实质中，因此为减少无关组织的干扰和降低不必要的计算量，在候选结节的分割处理之前，先从CT图像中分割出肺实质区域。

图1 肺部CT断层图像Fig.1 Lung CT image

肺实质分割从CT 图像中确定左右肺实质的边界，并去除两肺边界以外的区域，进而消除干扰：通过灰度对调和形态学重建的方法对肺部CT 图像降低计算复杂度，为有效分割肺结节的相关区域提供依据。首先对肺实质分割的具体步骤行预处理；其次采用迭代阈值法二值化图像；然后结合最大连通分量法与空洞填补法获得肺实质轮廓；最后将肺实质轮廓与原始肺部CT 图像进行掩膜计算，最终获得肺实质图像，如图2所示。

图2 肺实质分割过程Fig.2 Results of the lung parenchymal segmentation

1.2 候选结节的分割

在获得完整肺实质图像后，需对其进行感兴趣区域（Region of Interest,ROI）的提取，即候选结节的分割。肺结节在肺实质中通常表现为直径3～30 mm的圆形或类圆形致密影。候选结节分割的方法主要有阈值法、区域分割法、聚类法等。

本研究采用中值滤波方法去除肺实质内存在的干扰噪声，如图3a 所示；采用全局自适应阈值分割法实现肺实质内目标和背景的分离；将目标ROI轮廓与原始肺部CT 图像进行掩膜计算，如图3b 所示；采用连通区域标记法标记ROI的序号；最终将ROI的质心作为中心点，裁剪出51×51 的子图像，并将其作为候选结节图像保存。

图3 候选结节提取过程的结果图Fig.3 Result of candidate nodule extraction

2 特征提取与融合

在分割后的候选结节里，依然存在着血管、气管等假阳性结节，为了精确检测并识别出肺结节，需要对其进行特征提取，去除假阳性结节。因此，本研究先采用SRCNN 进行图像分辨率和特征的增强；再采用快速鲁棒特征（Speeded Up Robust Features,SURF）方法、灰度共生矩阵（Gray-Level Co-occurrence Matrix,GLCM）和Hu 不变矩提取ROI 的尺度空间特征、纹理特征和几何特征；最终采用BoW 模型降维后串行融合为新的特征矩阵。

2.1 基于SRCNN的特征增强

超分辨率（Super Resolution, SR）图像重建技术［10］对图像中的高频部分进行填充，使图像的细节部分更加清晰，且重建后图像在视觉效果更好，故本研究选用SRCNN 对候选结节图像进行特征增强。SRCNN是一种用于实现图像超分辨率的特定卷积神经网络模型［11］，其使用双3次插值算法将原始低分辨率图像扩展成目标尺寸大小的插值图像Y后；将Y通过3 层卷积网络进行图像块特征提取、非线性映射、重建3 个过程的非线性映射关系F(Y)变换，最终获得高分辨率图像。其在双3 次插值算法处理图像后对图像进行拟合输出，有效确保图像分辨率的提高。

SRCNN 结构有3 层，如图4所示。其中f和n分别表示滤波器的空间大小和滤波器的个数。

图4 SRCNN结构Fig.4 Super-resolution convolutional neural network structure

SRCNN 的第一层相当于通过一组过滤器对图像进行卷积操作F1，利用卷积网络的性质提取图像块的特征：

其中，W和B分别代表了滤波器和偏差。且将校正后的线性单元(ELU,max(0,x))用于滤波器响应。

第二层为非线性映射，第一层的每一个n1维向量对应于图像中的一个图像块，将提取出来的特征映射到n2维向量中：

第三层为重建操作，均匀分配并整合上一步得到的高分辨率图像块，输出最高分辨率重建图像［12］：

候选结节图像增强前后对比如图5所示。

图5 图像增强前（a）后（b）对比图Fig.5 Comparison of image before(a)and after(b)enhancement

2.2 SURF特征

SURF 算法是一种快速特征点检测算法，具有旋转、平移和缩放不变性。采用SURF 算法提取特征主要包括3个重要步骤。

（1）特征点检测。SURF 特征提取的首要任务是将尺度空间的极值点作为候选特征点进行检测［13］。通过不同大小的盒子滤波器与原始图像在不同方向上进行卷积，构建尺度空间金字塔。对尺度空间中的每一层使用Hessian矩阵进行极值点计算。为平衡准确值与近似值间的误差引入权值，则Hessian 矩阵判别式的近似计算可表示为：

其中，w为权重系数，其值与尺度σ相关，在实际的应用中通常取值为0.9。如果d(Happrox)取值为正，即可确定该点为极大值或极小值［14］。当确定局部极值后，将其与3×3×3的立体内的上下尺度及本尺度周围共26 个邻域值进行非最大值抑制（Non-Maximum Suppression, NMS），把极大值或者极小值的点筛选为候选特征点，再通过插值运算获得稳定特征点的尺度值和所在位置。

（2）特征点主方向的确定。以特征点为中心，计算邻域内的点在x和y方向上的Haar小波响应，并赋予这些响应高斯加权系数；最后将响应累加成新的矢量，选择最长矢量方向作为特征点的主方向，如图6所示。

图6 确定特征点主方向的过程图Fig.6 Process diagram for determining the main direction of feature points

（3）特征点描述符的生成。以特征点为中心，将特征点的主方向设置新坐标轴。首先将窗口划分为4×4 个子窗口，分别计算子窗口中的每个小窗口在x和y方向上的小波响应，记为dx和dy；然后加入高斯加权系数，并对子窗口中的响应系数进行求和与绝对值求和计算，最终每个子窗口有4 个特征描述符，每个特征点有4×16共64个特征描述符。

因此，每张图像可以通过SURF 算法确定N个特征点，最终获得N×64维的特征矩阵。

2.3 GLCM

GLCM 算法针对图像灰度空间的相关特性进行计算来描述灰度图像特征［15］。候选结节图像是灰度图像，对于ROI 分别计算0°、45°、90°、135°这4 个方向，获取4 个互不相关的特征值，分别是能量、熵、对比度（惯性矩）和相关性。最后，针对这4个特征值分别求取均值和标准差，进而生成8维的特征向量。

2.4 Hu不变矩

Hu不变矩以图像归一化中心不变矩的形式来表示图像几何特征，具有平移、尺度和旋转不变性［16］。肺结节具有非对称性和方向性，因此Hu 不变矩能够较好地描述肺结节在形态学以及统计学上的特征。该方法利用连续状态下的二阶和三阶中心矩构造了7个Hu不变矩特征值，最终生成7维的特征向量。

2.5 基于BoW模型的多特征融合

由于候选结节图像得到的SURF 特征向量是针对每个关键点的描述，导致每张候选结节图像中关键点个数不一致，如图7所示，导致所提取的特征矩阵维度也不同，因此本研究采用BoW模型进行降维。

图7 候选结节的SURF特征的关键点Fig.7 Key points of SURF features of candidate nodules

BoW 模型的核心是采用K-means 聚类方法得到K个分类，抽象为BoW 词汇表中的K个词汇，每张候选结节图像均可由聚类形成的K个中心词汇集表示，形成的描述向量经过L2 归一化，得到图像的BoW 描述，即每张候选结节图像可由一个［1×K］的词袋描述向量表示，且此向量内的每个元素可表示成在描述指定图像时所对应“词汇”出现的次数。

最后每张候选结节图像的特征可以用向量ν来描述：

其中，νK表示BoW-SURF 描述的特征向量，νGLCM表示GLCM 方法提取的特征向量，νHu表示Hu 不变矩方法提取的特征向量。

3 基于XGBoost的假阳性去除

XGBoost分类模型是一个集成学习模型，主要思想是训练多个决策树，通过集成方法将它们组合成一个强分类模型。XGBoost 算法是将损失函数的负梯度作为当前拟合的残差值以实现准确的分类效果。不同于传统集成决策树算法，该算法对目标函数进行了改良在原函数的基础上加入正则项，减少了过拟合的可能性，同时加快了收敛速度［17］。即获得的目标函数定义为：

在XGBoost 分类模型中，将候选结节提取的特征矩阵作为分类模型的输入，通过训练和优化该模型，最终完成肺结节和非肺结节的分类，实现肺结节的检测和假阳性结节的去除。

4 实验结果与分析

4.1 实验数据

为了验证本方法的可行性和检测的有效性，本实验将LIDC-IDRI 数据库的图像作为样本集［18］，对肺部CT 图像进行训练和测试。从肺部影像数据库中随机抽取110 例患者，提取出470 张候选结节，234张肺结节和236 张假阳性结节作为数据集进行训练和测试，训练集与测试集的比例为8：2。

4.2 实验环境

本实验在Windows10操作系统，CPU：i7处理器，RAM：8 GB，编程软件为MATLAB R2018a 和Python3.7。

4.3 实验结果与分析

为了进一步分析本研究方法的检测性能，选取目前肺结节检测领域中较为常见的方式［19］，在混淆矩阵的基础上将分类准确率（Accuracy）、召回率（Recall）、F1值和ROC 曲线下面积（Area Under Curve,AUC）作为评判标准。在肺结节检测的分类模型中，将肺结节定义为正样本，假阳性结节定义为负样本。

准确率是反映检测正确的样本占全部样本的比值，定义为：

其中，TP 表示真阳性、TN 表示真阴性、FP 表示假阳性、FN表示假阴性。

召回率又称敏感度，是反映所有肺结节样本中判别正确的情况，定义为：

F1值是精度（Precision）和召回率的调和平均，定义为：

AUC的值介于0.5～1.0之间，AUC越大，检测模型的准确性越高。

本实验在提取BoW-SURF 特征时，需要确定参数K值，获得最有效的特征矩阵。将K值由8～56以8为间隔进行XGBoost 分类模型的训练与测试，检测结果如图8所示。

图8 XGBoost的检测结果Fig.8 XGBoost test results

由图8可知，随着词条长度K值的增加，检测的准确率也随之增加，当K为40 时，达到最好的分类结果，后随着K值的增大，检测结果下降，初步判断K为32～40 是最优K值范围，继续细分K值，K值取32～40时，XGBoost的检测结果见表1。

表1 XGBoost的检测结果Tab.1 XGBoost test results

由表1可知，综合4个评价指标，当K=39时，达到最佳检测结果，准确率可达到92.55%，召回率和F1分别可达到93.75%和92.78%，AUC 可达0.97，所以最终得到39维SURF特征向量。

最后将39 维SURF 特征、8 维的GLCM 特征和7维的Hu 不变矩特征串行融合组成54 维的新特征矩阵，并将其输入到XGBoost 分类模型进行训练与测试。实验对比SRCNN 特征增强前后的检测结果，如表2所示。最终准确率为97.87%，召回率为97.92%，F1值为97.92%，AUC达到0.99。

表2 特征增强前后的对比结果Tab.2 Comparison before and after feature enhancement

相较于其他算法，特征增强和多特征融合的XGBoost分类模型有较高的检测准确率和召回率，如表3所示。

表3 本研究算法与其他方法的比较Tab.3 Comparison of the proposed algorithm with other methods

5 结论

对肺结节检测进行了研究，针对肺结节图像分辨率低、假阳性结节去除难等问题，提出了一种基于SRCNN 和多特征融合的肺结节检测模型，通过SRCNN 提高了候选结节的细节特征的提取；通过SURF、GLCM 和Hu 不变矩提取ROI 的多种特征，增强了图像特征的完整性；最后将融合后的特征输入到XGBoost 分类模型中进行训练和测试，最终获得97.87%的准确率、97.92%的召回率，但仍需要对算法和模型进一步研究，提高各项评价指标，以实现肺结节检测模型在临床中的应用。