左玲子,黄艳
沈阳市大众医院 放射科,辽宁 沈阳 110141
人工智能(Artificial Intelligence,AI)是一门新兴的科学技术,在医学领域中已经被广泛应用[1]。目前已经有很多国内外学者采用AI技术对肺结节的检测进行了深入的研究[2],目前以卷积神经网络(Convolution Neural Network,CNN)为代表的深度学习法在肺结节的检测中得到广泛关注[3-4],通过测试显示2D CNN与3D CNN在肺结节检测的灵敏度上都能达到95%左右[5-6]。但是与此同时,AI在肺CT上检出的假阳性结节也很多,据文献报道采用深度学习法的假阳性率多在每例肺CT扫描4~22个假结节[7],这些假阳性结节的识别不但增加了诊断医生的工作负担,也容易被误判为真结节,增加了患者的负担及医疗资源的浪费,所以本研究将从影像角度详细分析假阳性肺结节(False Positive Pulmonary Nodule,FPPN)分布与成因,将有助于放射诊断医生提高假阳性结节的识别能力,为AI在降低假阳性结节方面提供参考。
连续收集2020年8至9月来我院做肺CT检查的体检者500例,男309例,女191例,年龄26~84岁,平均(58.2±11.0)岁。样本纳入时排除了肺内弥漫性病变、胸膜多发病变、广泛瘢痕及纤维化病变。
采用GE optima CT670 128层螺CT机,体检者取仰卧位、头先进,扫描范围从肺尖至肺底。扫描参数:管电压80 kV,采用自动毫安管电流技术。扫描层厚5 mm,重建层厚1.25 mm,重建间隔1.25 mm,FOV 300~350 mm,矩阵 512×512,肺窗算法重建,窗宽:1500 HU,窗位:-600 HU;软组织窗算法重建,窗宽:350 HU,窗位:40 HU。
将500例肺CT数据依次传输至由依图公司提供的基于深度学习模型的AI软件,AI检出的肺结节经两名医师进行真假结节的认定,以两名医师达成的一致性意见作为最终认定结果,记录假结节的数量、大小和密度,并识别和分析假结节的成因。FPPN按大小分为三组:<5 mm、5~l0 mm和10~30 mm,假结节的大小取结节最长径和最短径的平均值,并计算各组假阳性结节的检出率;FPPN按密度分为三组:实性、部分实性和纯磨玻璃密度,并计算三种密度假阳性结节的检出率,以及比较三种密度结节之间的假阳性预测值。500例体检者按年龄段分为六组:25~34岁、35~44岁、45~54岁、55~64岁、65~74岁、75岁及以上,并统计各年龄段假阳性结节的检出率。
应用SPSS 22.0统计软件,对实性、部分实性和纯磨玻璃三种密度结节的假阳性预测值进行多个样本率的χ2检验及两两比较,P<0.05为差异有统计学意义。对体检者的年龄与假阳性结节的检出率进行Spearman等级相关性检验,计算相关系数rs,P<0.05为相关有统计学意义。
500例肺CT通过AI检测出1518个肺结节,其中真结节740个(图1),假结节778个,平均每例肺CT中检出1.6个假结节。<5 mm假结节534个,平均每例检出1.1个;5~10 mm假结节202个,平均每例检出0.4个;>10 mm假结节42个,平均每例检出0.1个。实性假结节353个,平均每例检出0.7个;纯磨玻璃密度假结节402个,平均每例检出0.8个;部分实性假结节23个,平均每例检出0.1个(表1)。实性结节的假阳性预测值为48.3%(353/731),纯磨玻璃密度结节为53.3%(402/754),部分实性结节为69.7%(23/33),两两比较之后发现部分实性结节的假阳性预测值显著高于实性结节的假阳性预测值,有统计学差异(χ2=8.346,P<0.05),部分实性与纯磨玻璃密度以及纯磨玻璃密度与实性之间比较无统计学差异(表2)。随着年龄的增长每例肺CT假阳性结节检出率也逐渐增加,Spearman等级相关系数rs=0.986,P<0.05,二者有显著的正相关关系(表3)。
图1 AI检出的真阳性结节
表1 不同大小和密度的FPPN检出结果
表2 不同密度结节的假阳性预测值比较
表3 不同年龄组FPPN的检出结果
AI检出778个FPPN的成因有14种,按成因多少分为:胸膜结节167个,索条影139个,血管增粗107个,血管分叉95个、肺小叶结构70个,胸膜斑42个,叶间胸膜局部肥厚35个、片状实变或渗出影35个、支气管扩张并管壁增厚24个、瘢痕影20个,血管弯曲19个,树芽征13个,支气管内黏液潴留8个、纵隔血管4个(表4)。实性FPPN以胸膜结节、索条影、血管增粗较为常见,纯磨玻璃密度FPPN以索条影、血管分叉、肺小叶结构、血管增粗和胸膜结节较为常见;部分实性FPPN见于片状影、聚集的支气管扩张和树芽征(图2)。
图2 AI检出的假阳性结节
表4 FPPN的成因分类
AI肺结节检测系统一般分为两个阶段:① 检测候选结节;② 在候选结节中筛查假阳性,其中假阳性筛查是肺结节检测的关键。怎样减少AI假阳性一直是自动化肺结节检测系统中最具有挑战的任务,也在肺癌的诊断和早期治疗中起着重要的作用[8]。目前,以2D CNN和3D CNN为代表的深度学习技术在降低假阳性方面已有很多报道[9-12],由于3D CNN能在CT图像内学习肺结节空间信息,进行一系列的鉴别特征提取,极大地提高了识别准确率,在使用相同网络参数设置、对相同的数据集进行分类识别时,3D CNN在肺结节假阳性筛查中比2D CNN 具有更好的效果[13],但3D CNN 在肺结节检测上的应用研究依旧处于初级阶段,研究成果较少。本研究从影像角度对AI检测出的FPPN进行识别和分析,发现假阳性结节在大小、密度及年龄上有一定的分布规律,构成原因与多种组织结构有关。
本研究对假阳性结节大小和密度分类参照了影像学上肺结节的分类方法[14]。研究中发现<5 mm的假结节构成假阳性结节的68.6%,平均每例CT检出1.1个假结节;5~10 mm假结节构成假阳性结节的26%,平均每例CT检出0.4个假结节;>10 mm假结节构成假阳性结节的5.4%,平均每例CT检出0.1个假结节,总体假结节检出率为每例CT1.6个,如果排除<5 mm的假结节,假结节检出率将降至0.5个/例,与文献报道的假阳性率减少2/3相近[15]。<5 mm的微小结节假阳性多的原因主要与肺小血管结构、肺内索条影有关,这些结构在尺寸上与微小结节相似,形态上多为2 mm×3 mm及2 mm×4 mm的长条形,这类小结节的识别需要诊断医生结合上下层面和毗邻结构进行判断,有时还需要从不同方位进行全面观察。5~10 mm假结节可以与多种原因有关,最常见的是胸膜结节,下文会详细介绍。>10 mm假结节多与肺内片状炎性病灶有关,常把炎性病灶的一部分误诊为结节,通过全面观察病变范围和形态可以识别,同时要注意与不规则真结节进行鉴别,尤其是部分实性结节,因为其恶性概率高于其它两种密度结节[16],并且在AI检出的部分实性结节中假阳性预测值也是最高的,即在AI检出的部分实性结节中有69.7%的结节是不真实的,高于实性结节的48.3%和纯磨玻璃密度结节的53.3%,并且在与实性结节的比较中,有统计学差异。实性和纯磨玻璃密度假结节的检出率分别为0.7个/例、0.8个/例,要明显高于部分实性假结节的0.1个/例,即在假结节的数量上前两种结节明显占优势,对于诊断医师更需要有耐心地去识别。
本研究统计了不同年龄组的AI FPPN的检出率,我们发现随着年龄的增长,假结节的检出率也随之增加,并且二者有着显著的正相关,这与文献报道的随着年龄的增长肺结节的检出率也增加相一致[17-18]。肺结节检出率的升高与年龄增长所积累的慢性感染、肉芽肿、瘢痕形成和反应性淋巴结增大有关[14],同样由积累的慢性感染和其它病变所引起的瘢痕、纤维化、胸膜结节等病变也会导致假阳性率的升高。从表2可以看出55岁以后假结节的检出率有了明显的升高,这与中国肺癌低剂量螺旋CT筛查2018年版指南[19]推荐的肺癌高危人群最低年龄50岁有着相似之处。所以年龄不光是肺结节的危险因素之一[20],也和假阳性结节密切相关。
胸部CT肺结节数据标注与质量控制2018版专家共识[21]指出肺结节包括肺内实性结节、纯磨玻璃密度结节、部分实性结节和肺内钙化结节(本研究钙化结节被纳入实性结节),而胸膜结节、斑块、钙化病变属于胸膜病灶,本研究结果显示胸膜病变是AI上引起FPPN最常见原因,占误诊原因的31.4%,包括:胸膜结节、胸膜斑和叶间胸膜局部肥厚,其中胸膜结节是胸膜病变中引起假阳性最常见原因,主要原因是胸膜结节向肺内延伸时被AI误诊成肺内结节,影像上鉴别依据是胸膜结节向肺内延伸时,周围往往存在一定的胸膜增厚,病灶与胸膜的夹角相对更大。其次造成假阳性结节的常见原因是血管结构,包括血管增粗、分叉和弯曲,占误诊原因的28.4%,其中前两者相对更常见,分别占13.8%和12.2%,主要是因为小血管结构在断层CT的形态上与肺结节有相似之处。除了胸膜病变和小血管结构容易被误诊为肺内结节,其它较常见的还有索条影和肺小叶结构,索条影一般是肺感染性病变残留的纤维化病变,在肺边缘的小索条影更容易被AI误诊为肺结节。肺小叶是被结缔组织间隔包围的最小肺单位,当结缔组织增生,即小叶间隔增厚时,使肺小叶形成类似花环状样结构,也容易被AI误诊为肺结节。剩下相对少见的原因还有片状实变影或渗出影、支气管扩张并管壁增厚、瘢痕影、树芽征、支气管内黏潴留、纵隔凸向肺野的血管,鉴别这些原因时需要结合毗邻结构和仔细辨认病变内部形态。
另外,引起实性FPPN的原因以胸膜结节、索条影、血管增粗较为常见,引起纯磨玻璃密度假阳性肺结节的常见原因除了胸膜结节、索条影、血管增粗外,还有血管分叉和肺小叶结构。血管分叉和肺小叶结构也可以是实性FPPN的原因,但相对纯磨玻璃密度假阳性结节少见。同一种组织结构可以形成两种密度的假结节,可能与组织本身密度有关,也可能与组织结构与扫描的角度有一定关系。引起部分实性FPPN的原因见于斑片影、聚集的支气管扩张和树芽征,与各种炎性病变有关。
本研究选择的是健康体检者,并排除了肺内弥漫性病变、广泛瘢痕及纤维化病变、胸膜多发病变,在AI上平均每例肺CT检出的假阳性结节是1.1个,低于李欣菱等[15]研究的每例CT4.9个,应该与选择的研究对象不同有关。我们在选取样本时发现一些弥漫性、多发性肺内及胸膜病变,会明显增加肺内结节检出的假阳性率,少量这样的数据就会对结果造成较大的不同,所示本次研究排除了这部分病变数据,在选择上存在一定的偏倚。
综上所述,导致AI FPPN的原因很多,但是这些假阳性结节存在一定的分布与构成规律,掌握这些规律,有助于放射科医生在利用AI辅助诊断时对真假结节的识别。