基于DenseNet网络深度学习法CT图像人工智能分析技术判断肺结节良恶性

2020-05-07 01:14戴正行胡春洪王希明陈琦夏菁姚柳刘稳
放射学实践 2020年4期
关键词:符合率敏感度组间

戴正行,胡春洪,王希明,陈琦,夏菁,姚柳,刘稳

肺癌是危害人类生命健康的最常见恶性肿瘤之一。早期疾病筛查是降低肺癌死亡率的重要手段。计算机辅助诊断系统(computer aided diagnosis,CAD)是近年来应用于肺结节筛查的新技术应用,可辅助放射科医师更好地检出微小肺结节,在一定程度上可避免对可疑肺结节的漏诊[1-3]。随着人工智能(artificial intelligence,AI)技术的进步,通过深度学习算法能够提取影像图像上肺结节的主要特征,对病变性质等进行预测[4-5]。本文旨在探讨基于DenseNet网络深度学习算法的人工智能诊断系统对肺部肿瘤的诊断价值。

材料与方法

1.临床资料

回顾性分析2015年1月-2017年12月在苏州大学附属第一医院就诊的510例孤立性肺结节患者的病例资料。所有患者于术前行CT扫描,并经手术切除(309例)或穿刺活检(201例)获得病理诊断结果。

入组标准:①肺内孤立性结节,不伴有肺不张、胸腔积液等表现;②CT检查前未接受过穿刺活检和手术、放疗等相关治疗;③CT检查后一个月内行CT引导下穿刺活检或手术,获得明确的病理诊断;④有完整的临床病历记录和CT影像资料。

排除标准:①缺乏层厚1.00及以下的薄层CT图像;②CT图像上存在影响结节观察的运动伪影或金属伪影等。

所纳入的510例中男233例,女277例;年龄20~82岁,平均(58.29±10.71)岁;良性病变160例,恶性病变350例。

2.CT检查方法

所有患者行胸部CT平扫。使用GE Lightspeed 16层螺旋CT机、Siemens Somatom Sensation 64层螺旋CT机和Siemens Somatom Definition双源CT机进行扫描。扫描范围自肺尖至肺底水平,扫描参数:层厚5.0~7.0 mm,层距8.0 mm,管电压120 kV,管电流110~450 mAs。扫描结束后对病灶部位行肺窗薄层CT重建,层厚0.75~1.00 mm。

3.AI图像分析与处理

对510例患者肺结节CT图像序列提取结节2D图像。采用“取标注点最相近五层”的方法切割CT图像,以候选位置为中心获取图像块,提取横轴面、矢状面和冠状面图像。考虑到本研究中大部分结节的大小,选择每个图像块感受野大小为64像素×64像素。截取CT值为-1000~400 HU,并将它们归一化到0~1,然后减去平均灰度值,来适应网络。共获得样本7570个,包括恶性样本5200个,良性样本2370个。随机选取2370个恶性样本,与2370个良性样本一起作为分析数据集,并分为2组数据:训练数据(包括恶性样本2133个、良性样本2133个)和测试数据(恶性样本237个,良性样本237个),使用DenseNet-BC网络,通过十折随机实验对所有样本进行训练及测试,得出510例肺结节的良恶性判别结果。AI组应用DenseNet网络的相关参数见表1。

表2 三组中对510例肺结节的诊断结果及组间比较

表3 三个诊断组对直径≤10mm结节的诊断结果及组间比较

表1 DenseNet-BC网络参数

4.图像分析和诊断

采用2种方式对图像进行分析和诊断。

①医师组采用单纯人工阅片(artificial reading,AR)方式。由2位从事胸部CT诊断工作满2年的住院医师组成初级医师组(AR1组)、2位从事胸部CT诊断工作满5年的医师组成高级医师组(AR2组),分别采用双盲法对510例患者的胸部CT图像进行独立诊断,如组内两位医师的诊断有分歧,则经过讨论达成一致意见。医师组通过肺结节的影像特征来进行良、恶性的判断,主要观察征象包括结节大小、密度、形态、边缘以及含气支气管征等。

②AI组(深度学习):将510例患者的肺结节CT图像输入至由中国科学院苏州生物医学工程技术研究所(苏州医工所)基于DenseNet网络开发的AI系统中,通过网络学习自动提取结节特征,并通过特征对结节进行分类归纳,最终获得对肺结节良、恶性的判断。

5.统计学方法

使用SPSS17.0软件进行统计分析。计数资料在统计分析之前,对所有数据进行加权,判断数据是否满足统计检验中对样本量的要求。若满足样本量大、任一预测频数>5,采用卡方检验进行组间比较;若不满足上述要求(如预测频数<5),则采用Fisher精确检验。分析医师组(初级、高级)及AI组对510例良、恶性肺结节的诊断敏感度、特异度和符合率等并进行比较。以P<0.05为差异具有统计学意义。

结 果

初级、高级医师组和AI组对510例肺结节的诊断结果及组间比较见表2。AI组中仅诊断敏感度与高级医师组间的差异无统计学意义(P>0.05),其它诊断指标值均高于2个医师组,差异均具有统计学意义(P<0.05)。

根据肺结节的直径(D),将510个病灶进一步分为3组:A组175例,D≤10 mm;B组202例,10 mm20 mm。

初级、高级医师组和AI组对直径≤10 mm结节的诊断结果及组间比较见表3。三组间两两比较,敏感度和符合率的差异均有统计学意义(P<0.05)。高级医师组的特异度低于低级医师组(P<0.05)。初级医师组与AI组的诊断符合率相近(P>0.05)。

直径≤10 mm的肺结节缺乏较典型的影像学表现,以下3个病例在初级医师组和高级医师组中均诊断为良性,AI组不但准确诊断为恶性结节,并分别精确到原位癌、微浸润性癌及浸润性癌的诊断(图1a~c)。

三个诊断组对结节直径>10 mm且≤20 mm的诊断结果及组间比较见表4。AI组除了诊断敏感度与高级医师组之间无明显差异(P>0.05)之外,其它指标均高于高级医师组和初级医师组(P<0.05)。高级医师组的诊断特异度稍高于低级医师组(51.67% vs. 43.33%),但差异无统计学意义(P>0.05);而敏感度及符合率均显著高于初级医师组(P<0.05)。

表4 三个诊断组10mm<直径≤20mm结节的诊断结果及组间比较

表5 三组对直径>20mm肺结节的诊断结果及组间比较

三个诊断组对直径>20 mm肺结节的诊断结果及组间比较见表5。直径>20 mm的肺恶性结节具有较典型的影像学表现(图2a~c),3组的诊断敏感度比较接近,三组间两两比较,差异均无统计学意义(P>0.05)。在诊断特异度及符合率方面,均表现为AI组>高级医师组>初级医师组,且组间两两比较,差异均有统计学意义(P<0.05)。

讨 论

肺结节是指肺内直径≤3 cm的类圆形或不规则形病灶,影像学表现为密度增高影,边界清晰或不清晰[6]。根据肺结节的密度,可分为实性、亚实性和磨玻璃密度结节三类。不同密度的肺结节,其为恶性的概率有所不同,其中以亚实性结节为恶性的概率最高。目前对肺结节的检出主要采用影像学手段(以胸部CT为主)。在人工阅片中,放射科医师根据自己的理论知识及实践学习对肺结节进行诊断,当常见的恶性征象(如分叶、毛刺、胸膜牵拉凹陷、含气支气管征和小泡征、偏心性厚壁空洞等)出现时,肺结节可被诊断为恶性病变[7-8]。然而,对于直径较小、上述恶性征象未见明确显示的肺结节,判断其良恶性的难度加大,常出现漏诊和误诊。虽然人工智能技术(DenseNet网络深度学习)对于CT图像的解读也是在对既往病例进行对照、学习的基础之上,但它可以在短时间内对大量数据进行处理和学习,并能够对人眼所不能观察到的影像征象进行学习。本研究中单纯人工阅片(影像医师)对160例良性肺结节的诊断符合率不足60%(分别为初级医师56.25%、高级医师58.75%),对于边缘清楚、边界光滑、密度均匀等具有典型良性表现的结节的诊断可能没有问题,但对于一些具有毛刺、分叶等征象的结节,人工阅片方式有一定的局限性,尤其是对于直径≤10 mm的恶性肺结节的诊断准确率不高(分别为初级医师17.31%,高级医师组为78.85%)。笔者认为导致上述结果的主要原因是由于细小的恶性结节缺乏特征性影像表现,定性诊断存在一定难度,并且人工阅片依赖于诊断者的经验等主观因素,而人工智能技术不仅可以在短时间内通过大量学习来自动总结分析肺结节的判断特征,相对于人工阅片方式而言更为客观,因此对不同直径结节的良、恶性判断均能达到较高的准确性。本研究结果显示,在10 mm<直径≤20 mm和直径>20 mm两组结节中,高级医师组与AI组诊断敏感度的差异无统计学意义(P>0.05)。笔者认为主要原因是随着结节的增大,恶性结节的影像征象趋向明显、典型,较初级医师更有经验的高级医师的检出敏感度增高,而AI组同样具有良好的诊断敏感度。虽然高级医师组对直径>20 mm结节的诊断符合率与AI组间的差异无统计学意义(P>0.05),但其特异度不及AI组,可见AI组在对结节良恶性的判断上是优于医师组的。基于上述结果,我们可以推演,AI在大范围的肺部CT体检中较人工阅片方式具有更大的优势,可以减少假阳性率。目前,人工智能已成为国内外医疗领域的研究热点。2017年,刘士远团队的一项研究结果显示,基于深度学习的人工智能技术较高年资医师能更加有效地检出肺部的亚实性结节,而且耗时更短(仅17 s),远低于影像医师组的50 min 24 s[9]。Setio等[10]应用深度学习卷积网络对提取的888例肺结节的CT图像进行分类判断,其敏感度高达85%。Cicero等[11]对35000多张胸部X线平片应用深度学习卷积网络进行分析,结果显示AI技术对肺部常见病变(如肺实变、气胸和胸腔积液等)均显示出较高的敏感度和特异度(均达到70%以上),表现出良好的临床应用潜能。

总而言之,应用基于深度学习的人工智能技术可以有效地辅助影像医师对肺结节进行更加准确、可靠的诊断,缩短诊断时间,提高影像医师的工作效率。

猜你喜欢
符合率敏感度组间
A case of conjunctival intraepithelial neoplasia with spheroidal degeneration: a clinicopathological study
假体周围感染联合诊断方法的初步探讨*
一种基于属性的两级敏感度计算模型
Beta-blocker therapy in elderly patients with renal dysfunction and heart failure
慢速训练法助力体弱人群
要背沟,不要“虎背熊腰”
多层螺旋CT与MRI在肝脏肿瘤鉴别诊断中的应用价值
下尿路感染患者菌群分布及对磷霉素氨丁三醇散敏感度分析
体育特长生训练方法浅议
年龄相关性白内障患者超声乳化手术前后对比敏感度分析