基于CT图像的肺结节计算机辅助检测研究进展

2021-06-11 09:36邹雨楠徐秀芳陈艾清魏琪范一峰

计算机时代 2021年3期

邹雨楠徐秀芳陈艾清魏琪范一峰

摘要： CT是检查肺癌的主要方法之一，而精度越来越高的CT在获得更清晰图像的同时，其数据量也在急剧增加，加重了医生阅片的负担。检测速度快、检测精度高的CT图像肺结节计算机辅助检测系统成为帮助医生诊断的有效工具。该综述阐述了CT图像肺结节计算机辅助检测方法的研究意义、检测过程、各类算法、研究难点，并对CT图像肺结节计算机辅助检测的现状进行了总结和展望。

关键词： CT图像; 肺结节; 计算机辅助检测; 深度学习

中图分类号：TP391.7 文献标识码：A 文章编号：1006-8228（2021）03-10-04

Research progress of pulmonary nodules computer-aided detection based on CT images

Zou Yunan， Xu Xiufang， Chen Aiqing， Wei Qi， Fan Yifeng

（School of Medical Imaging， Hangzhou Medical College， Hangzhou， Zhejiang 310053， China）

Abstract： CT is one of the main methods to detect lung cancer. While CT with higher and higher accuracy can get clearer images， its data volume is increasing sharply， which increases the burden of doctors to read the images. The pulmonary nodule computer-aided detection system based on CT images with high detection speed and accuracy has become an effective tool to help doctors to diagnose pulmonary nodules. In this paper， the research significance， detection process， algorithms and research difficulties of computer-aided detection of pulmonary nodules in CT images are described， and the present situation of computer-aided detection of pulmonary nodules in CT images is summarized and prospected.

Key words： CT images; pulmonary nodule; computer-aided detection; deep learning

0 引言

肺癌是近年发病率及死亡率增长最快，对人类生命威胁最大的恶性肿瘤之一[1]。肺癌的早期表现为肺结节，准确检测定位肺结节并对其进行分析是关键。在目前的早筛方法中，CT检查直观有效，但CT图像多且肺结节在其形态、灰度等方面的复杂性导致了人工诊断效率低，易出现漏检或误诊等情况。计算机辅助检测系统（Computer-Aided Detection， CAD）主要利用各类机器学习算法筛选出结节疑似区域并进行定位定量分析，辅助医生来诊断，近年来已成为肺结节自动检测的主力。本综述从图像预处理、肺实质分割、肺结节检测、肺结节分割、肺结节分类等五部分介绍肺结节计算机辅助检测。

1 图像预处理

由于低剂量肺部CT图像会因辐射剂量的变化产生不同程度的噪声，因此需通过图像预处理降低噪声程度，改善图像对比度。国内外研究人员提出了多种滤波方法降低噪声。Ashwin等[2]运用中值滤波器校正采集图像中因光照条件不同引起的对比度差异，并使用自适应直方图均衡技术提高图像对比度。王贝等[3]通过Hessian矩阵对应特征在不同组织结构上的表现，设计球形滤波器并采用二值图像，在消除灰度对滤波影响的同时，实现对肺部不同组织结构选择性的增强。

2 肺实质分割

肺实质的准确分割是后期结节检测的保证。人体的肺组织主要包含肺实质、血管及气管等，一般分两个步骤进行分割：实质粗分割和肺实质细分割。

2.1 肺实质粗分割

最常见的肺实质粗分割算法是阈值法，一般包括固定阈值法[3]和自适应阈值法[4]。固定阈值法是利用感兴趣区域与背景的亮度差异，选取适当阈值进行分离，从而达到有效分割。而自适应动态阈值法通过分析亮度特征的直方图，自动选取最优阈值。

2.2 肺实质细分割

在进行肺实质分割时，肺壁或组织上常存在与之相连的肺结节。前期的粗分割易出现肺边界欠分割或过分割的情况，可能导致结节病变的细节信息丢失。因此，需要更加细化地分割—对边界进行完善。Messaya等[5]使用滚球法，采用圆形结构元素沿着轮廓边界滚动，对封闭部分进行修补，但其半径需随结节改变，自适应较差。李军等[6]利用大津阈值法，获得肺部初始轮廓，依次对图像进行二值法和气管去除，再针对结节凹陷处修补不足的问题，通过传统向量法的改进，取得较好的细分割效果。

3 肺结节检测

肺结节检测主要包括疑似肺结节提取及假阳性剔除。

3.1 疑似肺結节提取

肺结节形态大小不一，种类繁多，且易粘连其他组织，与气管和血管混淆，因而提取难度大。YuanSui等[7]的使用支持向量机（Support Vector Machine， SVM）结合随机欠采样（Random Under-sampling， RU）和少数类过采样（Synthetic Minority Oversampling Technique， SMOTE）进行肺结节检测，使得样本均衡且去除了训练样本中的噪声和重复信息。李云鹏等[8]运用深度学习法改进了基于区域的快速卷积神经网络（Fast Regions with CNN feature，Fast R-CNN）的候选区域生成法，并与三维的基于密度的聚类算法（Density-Based Spatial Clustering of Applications with Noise，DBSCAN）相结合，同时利用3D卷积神经网络构建检测模型，准确率较高，假阳性低。在各种结节中，稀薄模糊状影的磨玻璃类结节灰度常在实质与血管之间，提取难度增加。范立南等[9]提出了用大津法进行实质分割，再用带通滤波器检测该类结节。Anum等[10]在四个公共数据库中验证了整合云计算与三维深度卷积神经网络（Deep Convolutional Neural Network，DCNN）系统的检测能力，当扫描速度为1.97 fps时，灵敏度可达到98.7%，但系统对直径不足三毫米的微小结节的检测仍不灵敏。

3.2 假阳性结节去除

疑似结节区域选定和提取后，一组胸部CT图像中通常可检测出上千个候选结节，但大部分为假阳性结节。去除假阳性结节可以提高检测率且降低假阳性率。较常见的去假阳性方法是提取疑似结节的特征训练分类器，以判别真假结节。刘晓娜[11]采用支持向量机分类器训练样本，并通过对比试验得出高斯径向基核函数的分类效果更佳，有利于临床医生更好地识别肺结节。李军等[6]基于交叉验证法获取Adaboost算法的最优迭代参数，去除假阳性候选结节，减少运算量，也提高了准确率。武盼盼等[12]提出结合粒子群优化算法和二阶锥规划的多核学习RVM法，实验证明其优于传统方法，系统的AUC（Area Under Curve）高达0.9117。

4 肺结节分割

对肺结节边缘的精准分割是确定结节大小以及判断结节类型和生长趋势的关键。然而，因为肺结节大小、密度和生长位置具有多样性的特点，提高肺结节分割精准度成为挑战。一些经典的肺结节分割技术可以在某个或某几个方面取得不错的分割效果，例如大多数区域生长法和阈值技术能分割钙化结节[13];鲁棒各向异性高斯拟合法（Robust Anisotropic Gaussian Fit-ting，RAGF）对微小型结节精确分割[14]。近年，一些基于卷积神经网络的模型及新模型也在肺结节分割中给出了成绩。闫欢兰等[15]提出结合Sobel算子和Mask R-CNN来检测更小的结节。董林佳等[16]提出三维形状指数，有效区分血管和结节。冯宝等[17]提出的改进小波能量的轮廓模型可以精确分割亚实性结节。

5 肺结节分类

在肺结节分类上，大多数研究致力于区分结节的良恶性，少部分不限于良恶二项分类的研究。近年来深度学习在分类性能提升上做出了重大贡献。

5.1 深度学习的应用

深度学习是机器学习的分支。王风等[18]提出4种三维卷积神经网络（Convolutional Neural Networks，CNN），其中CNN-3模型在LIDC-IDRI数据集获最高98.1%的AUC，同时高灵敏度达到93.6%。李飞等[19]引入交并比（Intersection over Union，IOU）自标准化和maxout单元的CNN模型，在LUNA16数据集上的F值为91.2%。Raunak等[20]提出了4种双通道CNN，其中3D多输出的密集连接卷积网络（Multi-output DenseNet，MoDenseNet）在LIDC-IDRI数据集达到了90.40%的精准率、90.47%的灵敏度和95.48%的AUC。在分类微小结节上，Patrice等[21]提出了融合另一神经网络极限学习（Extreme Learning Machine， ELM）的三维CNN模型，在 LIDC/IDRI 数据库实现最优了97.35%的准确度、96.57%的灵敏度、96.42%的F值评分和98%的AUC。深度学习对数据的量和标注质量有要求。深度学习对数据量的需求长期存在，而在标注质量上，LIDC/IDRI数据库仍依赖人工解读。即使是由专家标注，对影像数据的理解也存在一定的差异，从而影响计算机辅助检测系统的性能[22]。通过仿射变换扩充数据、迁移学习或最大似然法改善注释质量具有发展潜力[23]。但是，标注质量不高、数据量少依旧是其瓶颈[24]。

5.2 结合一般机器学习法的分类

在深度学习发展前，机器学习中的支持向量机算法以小样本且较高精度成为稳健的二分类器[25]，但它有抗噪弱和无法适应多样本训练的不足。模糊支持向量机等优化算法，优化了分类精度和抗噪能力[26]。最近，张玲等[27]提出了基于SVM的雷达目标分类法在多目标分类上实现了高精度，可以用于肺结节的检测分类。此外，深度迁移学习法使深度学习有另一发展可能，例如采用渐进式微调策略（Progressive Fine-tuning，PFT）的深度迁移学习在LIDC数据集中已被证明具有91.44%的精确率和96.21%的AUC[28]。

6 结束语

基于CT图像的肺结节计算机辅助检测能够提高肺结节检测效率，在磨玻璃结节检测、去假阳性结节、分割结节和良恶性分类中有良好的应用，但其综合性能不高。未来，可以选择各层性能最优的算法，进行叠加或互补，包括一般机器学习与深度学习的结合，进而提高整个系统的性能。

参考文献（References）：

[1] Freddie Bray， BSc， MSc， et al. Global Cancer Statistics2018：GLOBOCAN Estimates of Incidenceand Mortalitym Worldwide for 36 Cancers in 185 Countries[J].CA CANCER J CLIN，2018.68：394-424

[2] Ashwin S， Ramesh J， Kumar S A， et al. Efficient andreliable lung nodule detection using a neural network based computer aided diagnosis system[C]IEEE International Conference on Emerging Trends in Electrical Engineering and Energy Management，2012：135-142

[3] 王貝.CT图像的肺结节检测与分割[D].电子科技大学，2018.

[4] 郎春博，贾鹤鸣，邢致恺等.基于改进正余弦优化算法的多阈值图像分割[J].计算机应用研究，2020.37（4）：1215-1220

[5] Messay T， Hardie R C， Rogers S K. A new computeationally efficient CAD system forpulmonary nodule detection in CT imagery[J].Medical Image Analysis，2010.14（3）：390-406

[6] 李军.基于HRCT影像肺结节自动检测方法研究[D].湖南大学，2016.

[7] Yuan S， Ying W， Dazhe Z. Computer-Aided Lung Nodule

Recognition by SVM Classifier Based on Combination of Random Undersampling and SMOTE[J].Computational and Mathematical Methods in Medicine，2015：368674

[8] 李云鹏.基于CT图像的肺结节检测方法研究[D].河北地质大学，2017.

[9] 范立南，胡向丽，孙申申.基于OTSU算法和带通滤波器的毛玻璃型肺结节检测[J].沈阳大学报，2012.6（24）：44-46

[10] Anum Masood， Po Yang， Bin Sheng， et al. Cloud-Based

Automated Clinical Decision Support System for Detection and Diagnosis of Lung Cancer in Chest CT. IEEE Journal of Translational Engineering in Health and Medicine，2020.8：1-13

[11] 刘晓娜.基于支持向量机的肺结节识别研究[D]. 浙江大学，2016.

[12] 武盼盼.基于肺部CT图像的肺结节检测技术研究[D].河北工业大学，2017.

[13] 李锵，白柯鑫，赵柳等.MRI脑肿瘤图像分割研究进展及挑战[J].中国图象图形学报，2020.25（3）：419-431

[14] Okada K，ComaniciuD，Krishna A.Robust anisotropic of

lung lesions on CT scans using watershed，active contours，and Markov random field[J]. Medical Physics Imaging，2012.31（1）：33-50

[15] 闫欢兰，陆慧娟，叶敏超等.结合Sobel算子和Mask R-CNN的肺结节分割[J].小型微型计算机系统，2020.41（1）：161-165

[16] 董林佳，强彦，赵涓涓等.基于三维形状指数的肺结节自动检测方法[J].计算机应用，2017.37（11）：3182-3187

[17] 冯宝，陈相猛，李浦生等.小波能量引导下基于活动轮廓模型的部分实性肺结节分割[J].华南理工大学学报（自然科学版），2019.47（2）：41-49，58

[18] 王风，王磊，李囡等.基于三维卷积神经网络深度学习的肺结节良恶性的鉴别诊断[J].中国医学影像学杂志，2019.10：779-782，787

[19] LiF.， HuangH.， Wu， et al. Lung Nodule Detection with a 3D ConvNet via IoUSelf-normalization and Maxout Unit[J].ICASSP，IEEE International Conference on Acoustics， Speech and Signal Processing-Proceedings，2019：1214-1218

[20] Raunak Dey， Zhongjie Lu， Yi Hong. DiagnosticClassification Of Lung Nodules Using 3D Neural Networks[J]. Statistics，2018：774-778

[21] MonkamP.， QiS.， Xu， et al. Ensemble Learning ofMultiple-View 3D-CNNs Model forMicro-Nodules Identification in CT Images（Article）[J]. IEEE Access，2019.7：5564-5576

[22] LIN H， HUANG C， WANG W， et al. Measuring interobserver disagreement in rating diagnostic characteristics of pulmonary nodule using the Lung Imaging Database Consortium and Image Database Resource Initiative[J].Acad Radiol，2017.24（4）：401-410

[23] Guyon I， Dror G， Lemaire V， et al. Unsupervised and transfer learning challenge[C].IEEE International Joint Conference on Neural Networks，2011.

[24] Pehrson Lea Marie， Nielsen Michael Bachmann， Ammitzbol Lauridsen Carsten. Automatic Pulmonary Nodule Detection Applying Deep Learning or Machine LearningAlgorithms to the LIDC-IDRI Database： A Systematic Review[J]. Diagnostics，2019.9：29-39

[25] 柴小雲，韓贵来，林建林等.基于视觉显著性的肺结节检测系统的设计与实现[J].计算机时代，2018（1）： 46-48

[26] 强彦，裴博，赵涓涓等.模糊支持向量机在肺结节良恶性分类中的应用[J].清华大学学报（自然科学版）， 2014.54（3）：354-359

[27] 张玲，陈路路，梁进科等.一种基于支持向量机的雷达多目标分类方法[J].无线电工，2020.50（1）：53-56

[28] 张驰名，王庆凤，刘志勤等.基于深度迁移学习的肺结节辅助诊断方法[J].计算机工程，2020.1：271-278