大连大学附属中山医院 放射科,辽宁 大连 116001
肺结节是肺癌的早期表现,其检出率随着薄层计算机断层扫描(Computed Tomography,CT)技术的发展而提高,国内大型三级医院现已大部采集薄层图像,但明显增多的CT数据不仅增加了影像科医师的阅片负担[1],同时对医院PACS的传输、硬盘的存储等方面也带来了大量的负担,医院每年对此付出的经济成本相当巨大[2-3]。目前,很多基层医院由于财政投入不足,使用的CT设备及网络建设还相对落后,受限于机器的球管热容量、辐射剂量以及网络存储空间、传输速度等条件,并不适合对全部胸部CT采用薄层后处理重建。近年来,人工智能(Artificial Intellience,AI)技术在各个行业中都有了广泛的应用,基于深度学习[4]的AI辅助诊断系统在影像学诊断肺结节方面的应用有了突飞猛进的进展[5-6],提高了早期肺癌的检出率。应用AI技术对海量CT图像进行初步筛查并标记可疑结节病变,可以帮助三级医院影像医师减少工作量并提高诊断准确率[7-8],也能帮助基层影像医师降低结节的漏诊率。目前国内各级医院利用AI辅助筛查的胸部CT层厚不尽相同,主要应用在1/2/3 mm层厚的CT图像,现在还没有不同层厚间效能对比方面的研究文章,本研究通过分析评价AI所检出的总结节、>4 mm结节、<4 mm结节、实性结节以及亚实性结节的综合效能,从而得出相对适合AI检出肺结节的最佳胸部CT层厚。
前瞻性收集2018年11月1日至12月31日在我院影像科门诊接受常规胸部CT检查的280例患者,经排除,符合研究条件的共190例,其中男性101例,女性89例;年龄范围19~84岁,平均年龄(55.7±7.65)岁。纳入标准:① 患者年龄在18岁以上有肺结节患者;② 经AI推测结节数不超过50个;③ 排除带有伪影的影像资料;④ 排除肺部弥漫性病变、肺炎的影像资料。
采用西门子二代炫速双源CT,吸气屏气状态下肺尖扫描至两侧肾上腺。扫描参数:管电压120 kV,自动管电流设置,探测器准直器128×0.6 mm,机架旋转时间为0.5 s/周,矩阵:512×512。观察CT图像的肺窗窗宽1200 HU,窗位600 HU;必要时手动调整合适的窗条件。扫描后数据分别以1/2/3 mm层厚行骨算法重建图像。
将190例胸部CT行1/2/3 mm层厚重建,卷积核B70f,肺窗。所有重建后数据传输至工作站,由推想公司基于深度学习模型的AI软件将3种层厚的CT图像分别利用AI进行结节检测,分别记录三组层厚的所有肺结节、>4 mm结节、<4 mm结节、实性结节以及亚实性结节的检测个数。所有胸部CT分析由两名十年以上诊断经验主治医师和一名十五年以上诊断经验的副主任医师借助AI软件对190例病例图像的肺结节制定金标准。统计分析三组肺结节的检出情况及差异。
采用SPSS 20.0统计软件进行数据录入、整理及统计学分析。分别计算AI对三组数据(各组总结节、>4 mm结节、<4 mm结节、实性结节以及亚实性结节)检出的敏感度及假阳性率,并对三组肺结节数据进行单因素方差分析或非参数秩和检验。P<0.05为差异有统计学意义。
190例胸部CT,金标准共检出1333个肺结节。AI软件在1 mm层厚共检出1403个结节,其中正确结节1103个,错误结节300个;2 mm层厚共检出853个结节,其中正确结节607个,错误结节246个;3 mm层厚共检出1077个结节,其中正确结节401个,错误结节676个。1 mm层厚检测的结节最多,明显优于2和3 mm(图1),但是检测>4 mm的结节假阳性较多;2 mm层厚检测出的结节数要低于1 mm图像,而假阳性结节数也随之减少,尤其是检测>4 mm的结节,假阳性数明显低于1 mm图像;3 mm层厚检测的结节最少,假阳性也是最多,见表1。
表1 1/2/3 mm层厚利用AI检出结节的数目(个)
AI软件在1 mm层厚检测所有结节的敏感度为(0.833±0.195),2 mm层厚检测所有结节的敏感度为(0.473±0.258),3 mm层厚检测所有结节的敏感度为(0.301±0.239),P<0.001,三组间差异具有统计学意义,见表 2。
?
AI软件在1 mm层厚检测所有结节的假阳性率为1.58/CT,2 mm层厚检测所有结节的假阳性率为1.29/CT,3 mm层厚检测所有结节的假阳性率为3.56/CT;在1 mm层厚图像检测>4 mm结节假阳性率最高,其余相对较低;2 mm层厚图像检测亚实性结节假阳性率最低,其余介于1、3 mm层厚之间;3 mm层厚图像检测>4 mm结节假阳性率最低,其余都很高(图1)。
表3 1/2/3 mm层厚利用AI检出不同结节的假阳性率
本研究结果显示AI软件在三种层厚胸部CT图像的肺结节检测中,1 mm层厚检出的敏感度最高,远高于2、3mm,分析其原因是因为我们使用的基于深度学习的薄层检测模型,此模型大部分是通过1 mm层厚图像的人工标注数据集进行深度学习;三组层厚AI的结节检测假阳性率均相对较高,尤以3 mm层厚为著,这是由于肺内气管、血管复杂,肺结节位置又具有多样性,极易混淆[9-11]。同时,某些肺结节易与肺正常组织粘连,不利于检测,增加了AI辅助检查系统的假阳性率[12-13]。
4 mm以上的肺结节更具有临床意义,也是需要随访的对象[14-15],AI在>4 mm结节检测中,随着层厚的增厚,敏感度逐渐降低[16],但都在较高的水平,3 mm层厚图像结节检出敏感度相对较低,也达到了(0.600±0.396)的。有研究表明,AI辅助诊断系统对结节的检出率随结节的减小而降低[17-18],对直径>4 mm的肺结节,AI辅助检测系统对肺结节的检出率为100%,但对直径≤4 mm的肺结节,其检出率降至70%[19-20]。而AI在>4 mm结节检测中,2 mm层厚的假阳性率却很低,只有1 mm层厚的三分之一左右。
本研究的局限性在于数据样本量不足,4 mm以上的结节数量较少,因此结果可能存在一定的选择性偏倚。
综上所述,AI在1 mm层厚胸部CT的肺结节检测中,虽然存在一定的假阳性率,但相当高的敏感度可以确保结节检出率的提升,能极大降低漏诊的发生概率,并能提高影像医师的工作效率;其层厚最薄,数据量最多,所占用的存储空间最大,建议具有较好经济基础,高端CT设备,患者更多的大型三级医院使用1 mm作为AI检测肺结节的首选层厚。AI在>4 mm结节的检测中,2 mm层厚检测的假阳性率很低,敏感较高,考虑其占用存储较小,对设备要求不高,更适合经济基础比较薄弱,诊断水平相对较低的基层医院使用。