范鸿禹,孙丹丹,张 清,伍建林
(大连大学附属中山医院放射科,辽宁 大连 116001)
近年来,随着我国住院医师规范化培训政策的广泛实施,影像科规培医师已逐渐成为一线阅片的主力军,但因阅片量大、规培医师自身能力或经验不足,常导致漏诊、误诊发生,尤其是在肺结节的诊断方面[1]。因此,如何提高规培医师对肺结节的检测效能并缩短阅片时间,已成为临床工作的重点。计算机硬件水平的提升和深度学习等核心技术的发展,推动了人工智能的发展,在医学影像领域,人工智能拥有人脑远不能及的计算和图像识别能力,能对数据及图像进行高效的分析和识别,在肺结节筛查方面具有良好的辅助诊断作用[2-3]。本研究旨在探讨不同年资规培医师在CT 独立阅片及应用人工智能辅助阅片模式下对肺内结节的检测效能是否有差异,并分析低年资规培医师在应用人工智能辅助阅片后,能否达到高年资规培医师对肺结节的检测水平。
1.1 一般资料 收集2019 年1 月在我院行常规胸部CT 扫描的254 例患者。排除有胸部手术史、肺内弥漫性疾病、胸腔积液、肺实变或不张,以及胸部CT 图像存在呼吸、运动伪影重影响观测者。共纳入180 例,其中男92 例,女88 例。本研究已获得患者及医院伦理审核委员会的批准。
1.2 仪器与方法 胸部CT 扫描采用Siemens 双源CT 机(Siemens Somatom Definition Flash)。患者取仰卧位,单次深吸气后屏气扫描,扫描范围从胸廓入口至肋膈角以下水平。扫描参数:120 kV,130 mAs,探测器准直128×0.6 mm,机架旋转时间为0.5 s/周,螺距1.2,开启CAREDose4D 技术。重建层厚1.0 mm,窗宽1 600~2 000 HU,窗位-800~-600 HU。
1.3 图像分析 CT 扫描获得的DICOM 图像传输至人工智能辅助诊断服务器(InferRead CT Lung Research,Infervision,Beijing,China)上。由2 名低年资规培医师(规培3~6 个月,已完成胸部CT 报告4 000~5 000 份)及2 名高年资规培医师(规培30~33 个月,已完成胸部CT 报告15 000 份以上)阅片,在阅片前统一培训。4 位医师标注肺结节时保证环境安静,每阅片30 min 休息10 min,上下午各阅片约150 min。
阅片分2 个阶段,首先由4 名规培医师在不借助人工智能软件辅助条件下,对180 例胸部CT 图像独立阅片,并记录结节的位置、大小、密度及阅片时间。
经2 周洗脱期后,4 名医师再次对相同CT 图像借助人工智能软件自动阅片筛查出肺结节后,并根据软件阅片结果再次阅片,记录结节的位置、大小、密度及阅片时间。
1.4 金标准制订 首先由2 名具有10 年以上胸部影像诊断工作经验的高年资放射科医师在借助人工智能软件下阅片,即高年资医师A 结合人工智能软件综合阅片,标注肺结节,并将结果交给高年资医师B,由医师B 结合人工智能软件再次阅片并对高年资医师A 的标注结果进行检验,意见不一致时交由第3 名具有15 年以上胸部影像诊断经验的主任医师最后判定,最终达成一致意见。
分别将每名低、高年资规培医师在独立阅片、借助人工智能软件阅片模式下对肺结节的阅片结果与金标准进行比对,记录每例患者的真阳性、假阳性及假阴性结节数,计算敏感度及人均假阳性结节数。敏感度=真阳性结节数/金标准结节数,人均假阳性结节数=假阳性结节数/患者总例数。
1.5 统计学分析 应用SPSS 20.0 统计学软件进行数据分析。采用Kappa 检验分析2 名低年资及2 名高年资医师对肺结节检测的一致性,K<0.4 表示一致性较差,0.4≤K<0.75 表示一致性中等,K≥0.75表示一致性较好。本研究中各医师组对结节检测情况的一致性较好(低年资医师组:K=0.86;高年资医师组:K=0.82),故分别取2 名低年资医师及2 名高年资医师对肺结节检测结果的平均值进行比较。本研究数据均不满足正态分布,故采用Wilcoxon 秩检验(配对样本),比较低、高年资规培医师独立阅片及在人工智能辅助下的诊断敏感度、假阳性率和阅片时间的差异。以P<0.05 为差异有统计学意义。
2.1 低年资规培医师独立阅片与借助人工智能阅片对肺结节检出情况比较 180 例通过金标准共确定1 208 个结节,低年资规培医师独立阅片检出真阳性结节573 个,假阳性结节(误诊结节数)267 个,假阴性结节(漏诊结节数)635 个;借助人工智能阅片后检出真阳性结节931 个,假阳性结节162 个,假阴性结节277 个。
低年资规培医师借助人工智能阅片检出结节的敏感度(77.07%,931/1 208)高于独立阅片模式(47.43%,573/1 208),人均假阳性结节数(0.90 个)低于独立阅片模式(1.48 个)(P<0.01),阅片时间[(361.07±163.07)s]少于独立阅片时间[(429.11±132.61)s],差异均有统计学意义(均P<0.01)(图1)。
2.2 高年资规培医师独立阅片与借助人工智能阅片对肺结节检出情况比较 高年资规培医师独立阅片检出真阳性结节610 个,假阳性结节87 个,假阴性结节598 个;借助人工智能阅片后检出真阳性结节982 个,假阳性结节49 个,假阴性结节226 个。高年资规培医师借助人工智能阅片检出结节的敏感度(81.29%,982/1 208)高于独立阅片模式(50.50%,610/1 208),人均假阳性结节数(0.27 个)低于独立阅片模式(0.48 个),差异均有统计学意义(均P<0.01);高年资规培医师独立阅片时间[(367.22±120.52)s]与借助人工智能阅片时间[(380.16±135.40)s],差异无统计学意义(P>0.05)(图2)。
2.3 低年资规培医师借助人工智能阅片与高年资规培医师独立阅片比较 低年资规培医师借助人工智能阅片对肺结节检出的敏感度(77.07%,931/1 208)高于高年资规培医师独立阅片(50.50%,610/1 208),但人均假阳性结节数(0.90 个)高于高年资规培医师独立阅片(0.48 个),差异均有统计学意义(均P<0.01);低年资规培医师借助人工智能阅片时间[(361.07±163.07)s]与高年资独立阅片时间[(367.22±120.52)s],差异无统计学意义(P>0.05)。
3.1 低年资规培医师独立阅片与借助人工智能阅片模式分析 本研究发现借助人工智能阅片后,低年资规培医师对肺结节的检测效能明显提升,检测时间缩短,提高了工作效率。
我院放射科日常在岗书写影像报告人员约32 名,规培医师24 名,其中低年资规培医师约占1/4。每天上千份影像报告大多由规培研究生进行初写工作,因其工作经验较少,想同时保障数量与质量较困难。本研究低年资规培医师单独阅片结节检出敏感度仅47.43%,人均假阳性结节数达1.48 个,笔者推测可能是由于低年资规培医师工作时间较短,经验不足,对肺结节的识别度较低,且当结节直径小(特别是<4 mm)、密度低、与肺纹理延续、位于血管旁时,易造成漏诊、误诊,与邵亚军等[4]观点一致。低年资规培医师借助人工智能后,诊断效能明显提升,敏感度提高至77.07%,人均假阳性结节数下降至0.90 个,与文献[5-11]报道一致。图1 显示了在右肺上叶尖后段有一直径约0.5 cm 的实性小结节,在低年资医师独立阅片时漏诊,而在其借助人工智能阅片后被检出,分析其原因可能是低年资规培医师将其误认为血管断面。此外,人工智能借助深度学习模式,对肺门、胸膜下、血管旁及一些非实性结节的检测能力较高[12-14],可弥补低年资医师经验或能力不足导致的漏诊,降低假阳性率,提高诊断准确率。
3.2 高年资规培医师独立阅片与借助人工智能阅片模式分析 高年资规培医师经过约30 个月的住院医师规范化培训后,其基础理论水平及临床工作能力普遍高于低年资规培医师[15]。本研究中高年资规培医师对肺结节检测水平提高,但与金标准仍存在一定差距,原因可能为工作量较大、易出现疲劳状态、诊断水平及环境等多种因素影响,导致漏诊、误诊,特别是对较小病变、与血管距离较近且直径类似于血管的病灶,人工智能可充当“第2 双眼睛”,进行准确的辅助诊断,以弥补工作中的不足[16-18]。本研究中虽然高年资规培医师已积累了一定的诊断经验,但借助人工智能辅助可明显提高诊断准确率。图2 显示右肺下叶前基底段见一直径约0.2 cm 的粟粒结节,该结节位于血管旁,位置较隐蔽,高年资医师独立阅片时漏诊,而借助人工智能后将其检出。Teague 等[19]报道,在人工智能辅助下,具有2~4 年工作经验的住院医师对肺结节检测敏感度均有提升。Sahiner 等[20]指出,使用有潜力的高性能CAD 系统,可提高放射科医师对孤立性肺结节的检测能力,尤其是易遗漏的小结节。本研究发现,低、高年资规培医师独立阅片模式下对肺结节检测的敏感度相似,但高年资规培医师人均假阳性结节数(0.48 个)明显低于低年资规培医师(1.48 个)。因此,能否借助人工智能辅助低年资医师,使其缩短培训时长,快速应对临床工作,需进一步研究。
3.3 低年资规培医师借助人工智能与高年资规培医师独立阅片模式分析 本研究中,虽然低年资规培医师借助人工智能阅片模式较高年资规培医师独立阅片模式多误诊75 个结节,但前者对结节检出的敏感度超过后者,多检出321 个结节,可明显提高对肺结节检出的数量,诊断出更多结节。实际工作中因实行影像报告复审制度,上级审核医师需审阅多名低年资规培医师阅片结果,工作量及压力更大,若低年资规培医师漏诊结节,会增加审核医师漏诊风险,而对于误诊结节,审核医师较易进行诊断并二次排除(图3),因此对于低年资规培医师而言,增加结节检出、减少漏诊,才是首要条件。因此,借助人工智能,不但对低年资规培医师快速检出肺结节有较大帮助,同时还可有效降低审核医师压力,提高科室整体工作效率。
此外,本研究还存在一定的局限性:①不同的人工智能模型诊断效能不一,本研究结果仅代表本人工智能软件的诊断效能。②未将结节按不同大小、密度进行细分统计,有待于今后深入研究。
综上所述,人工智能辅助软件对低、高年资规培医师肺结节检测效能均有提升,且大幅缩短低年资规培医师阅片时间。低年资规培医师在人工智能软件辅助下,尽管误诊结节稍多于高年资规培医师独立阅片,但前者检出的真结节数目远超后者。
图1 女,31 岁 图1a 胸部CT 平扫肺窗示右肺上叶尖后段见一直径约0.5 cm 的实性小结节(白箭),低年资医师独立阅片时该结节被漏诊 图1b 人工智能提示右肺上叶尖后段的小结节(绿框),低年资规培医师借助人工智能阅片时该结节被检出 图2 男,42 岁 图2a 胸部CT平扫肺窗示右肺下叶前基底段见一直径约0.2 cm 的粟粒结节(白箭),位于血管旁,高年资医师独立阅片时该结节被漏诊 图2b 人工智能提示右肺下叶前基底段的粟粒结节(绿框),高年资医师借助人工智能阅片后,该结节被检出,另左肺下叶外基底段见一粟粒结节(黄框),在独立阅片及人工智能辅助下均被检出 图3 男,49 岁 图3a 低年资规培医师独立阅片未发现左肺下叶的“结节”,人工智能提示左肺下叶外基底段存在一直径约0.3 cm 的微结节(箭头)。低年资医师借助人工智能阅片考虑该“结节”为真性结节 图3b 高年资医师经三维重建后核定,该“结节”实为支气管内痰栓