宋冬冬,朱晓明,朱丽娟,顾俊,伍建林,张清
1. 大连大学附属中山医院 放射科,辽宁 大连 116001;2. 北京推想科技有限公司 全球临床科研合作学院,北京 100025
肺癌是我国目前发病率和死亡率最高的恶性肿瘤[1],并仍呈逐年增长趋势。多层螺旋CT肺癌的早期筛查,对肺癌的预防以及早期治疗意义重大[2],能有效提高早期肺癌患者的5年生存率[3]。随着人工智能(Artificial Intelligence,AI)深度学习技术在医疗领域的推广应用,肺CT图像的AI辅助结节筛查,在临床上得到广泛开展[4],在提高工作效率的同时能有效降低肺结节的漏诊率[5]。目前关于AI对肺结节检测效能的研究正逐步深入,但这些研究多集中在胸部CT单源扫描以及AI临床应用方法及价值[6-8]的探讨上,而双能扫描对人工智能辅助肺结节检测效能的研究尚无人开展。本文旨在探讨临床中,胸部双能CT扫描结合AI行肺结节筛查,其检测效能与常规胸部CT单源120 kVp扫描的对比,同时比较两种模式的辐射剂量。
研究通过了本院伦理委员会批准,所有研究对象检查前签署知情同意书。收集2018年12月至2019年2月行双源CT肺结节筛查的患者。纳入标准:18岁以上,临床行胸部CT平扫检查的患者。排除标准:由于胸部手术史、胸腔积液、弥漫性间质性病变、肺不张、肺部炎性病变及CT图像中呼吸运动伪影等,影响结节确认及标注者。381例患者纳入研究。按照扫描模式不同将患者分为两组:A组(183例)采用单源120 kVp扫描,B组(198例)采用双能模式扫描并收集融合120 kVp图像。两组患者的年龄、性别、结节大小及结节类型差异均无统计学意义(表1)。
表1 两组患者的临床资料比较结果
所有患者均在双源CT机(Siemens Somatom Definition Flash,德国)上进行。扫描范围为胸廓入口到膈肌水平,包括整个肺野。单源扫描方式参数:探测器准直器128×0.6 mm,机架旋转时间为0.5 s /周,螺距为1.2,管电压120 kVp,参考管电流130 mAs,开启CAREDose 4D技术;双能扫描方式参数:探测器准直器64×0.6 mm,机架旋转时间为0.28 s /周,螺距为0.7,A管球管电压100 kVp,B管球管电压sn140 kVp,融合图像为120 kVp(两者按4:6的比例融合图像),参考管电流A管球110 mAs、B管球94 mAs,开启CAREDose 4D技术。
A、B两组图像均行1 mm、骨算法重建,得到单源120 kVp和双能融合120 kVp两组标准CT薄层图像。使用推想科技的肺结节薄层训练模型检测软件(Infer Read CT Lung Research, Infervision, Beijing,China),该系统基于40万训练数据集且数据来源于全国多家大型三甲医院,能将疑似肺结节的部位准确标记[9]。对上述两组CT图像进行肺结节检测,记录检测出所有结节的数量、位置,并按大小(直径≥4 mm或<4 mm)、类型(实性或亚实性)分类;三名不同年资的影像诊断医生结合AI对两组图像的肺结节进行分析,均依据《肺结节诊治中国专家共识(2018年)》。首先由两名有10年以上经验的医师对两组图像所有结节的数量、位置分别进行标注,并按大小(直径≥4 mm或<4 mm)、类型(实性或亚实性)分类,标注结果不同之处由二人讨论后统一结果,最后再由一名主任医师对以上二人制定结果进行审阅,确立最终金标准结节。将人工智能软件自动检测结果与金标准比对,并统计检出结节的真阳数、假阳数,计算出检测敏感度、精确度和假阳性率。按公式ED=DLP×k(k为转换系数)计算有效辐射剂量。
所有统计学处理均应用SPSS 20.0版本进行。计量资料使用均数±标准差(±s)表示,比较采用卡方检验,分别对敏感度、DLP、CTDIvol、ED进行组间方小差分析,P<0.05差异具有统计学意义。
两组图像对于AI的肺结节检测效能比较,差异有统计学意义(P<0.005),见表2。
表2 两组图像对于AI的肺结节检测效能
两组对于AI对直径≥4 mm和直径<4 mm肺结节的检测效能比较,差异有统计学意义(P<0.005),见表3~4。
表3 两组图像对于AI对直径≥4 mm肺结节的检测效能
表4 两组图像对于AI对直径<4 mm肺结节的检测效能
两组图像对于AI对实性肺结节和AI对亚实性肺结节的检测效能比较,差异有统计学意义(P<0.005),见表5~6。
表5 两组图像对于AI对实性肺结节的检测效能
表6 两组图像对于AI对亚实性肺结节的检测效能
A组CTDIvol、DLP、ED均高于B组,差异有统计学意义(P<0.05),见表7。
表7 两组扫描辐射剂量
基于深度学习[10]的AI肺结节辅助检测在临床CT图像上的广泛应用[11],极大地提高了医生对肺结节的检诊效率[12]。目前临床多在单源扫描下采集CT薄层图像,进行AI辅助肺结节筛查,其检测效能还有不足之处,尤其在临床上极易漏诊的最大直径<4 mm和亚实性结节的检出上[13],敏感度还有待提高[14]。
随着双源CT的普及应用[15-17],胸部CT双能扫描成为日常临床工作中的一个选项,常规条件下与单源扫描相比,胸部CT双能扫描在不增加辐射剂量的前提下,能够得到融合120 kVp、sn140 kVp与100 kVp不同能量的图像,为诊断与鉴别诊断提供更多的参考依据[18]。本研究在双源CT常规剂量胸部CT肺结节筛查中,将单源扫描120 kVp与双能扫描融合120 kVp的肺CT图像中,肺结节的AI检测效能进行了比较,结果显示双能扫描融合120 kVp图像的肺结节检测敏感度明显更高,辐射剂量明显更低,而假阳性率却不高,AI检测效能明显优于单源扫描120 kVp图像。其中:无论对于结节直径≥4 mm(临床需选择性影像随访或12个月影像随访[19]),还是直径<4 mm(临床需12个月影像随访或6~24个月间不同方式影像随访[19]),融合120 kVp图像检测敏感度均明显更高,对于直径≥4 mm的结节融合120 kVp图像检测假阳性率更低;无论实性结节还是亚实性结节,融合120 kVp图像的检测敏感度均明显更高,对于实性结节融合120 kVp图像的假阳性率更低。尽管与单源120 kVp图像相较,融合120 kVp图像在肺结节检测的假阳性率上没有明显的降低,但在AI辅助医生对肺结节的检出上,更高的结节检测敏感度,减少肺结节的漏诊临床意义更大,尤其在临床中容易漏检的小结节(最大直径<4 mm)和亚实性结节上,双能融合120 kVp图像的检测敏感度较单源120 kVp图像有了较大的提高。图1显示了2例临床易漏诊<4 mm亚实性结节在双能融合120 kVp结合AI被检测出来,而在单源120 kVp图像结合AI中漏诊。
图1 两组图像对临床易漏诊结节的AI检出对比
最新发表在RSNA旗舰杂志Radiology: Artificial Intelligence的文章[20]比较了一些扫描参数(比如CT设备厂家、扫描辐射剂量)对于深度学习肺结节检出模型检出效能的影响,结果发现CT设备厂家以及辐射剂量对于检出效能(敏感度、假阳率)并没有影响,在我们的研究当中,单源120kVp的有效辐射剂量(4±1.1)mSv虽然略高于双源扫描(3.23±0.97)mSv,但是这不太可能是影响结节检出率的决定因素。因此我们猜测可能是由于双源融合图像(mixed image)的图像质量优于单源120 kVp图像质量从而导致AI辅助诊断软件的检出效能更高。双源融合图像选取来自低能100 kVp和高能Sn140 kVp的扫描图像,低能(100 kVp)图像具有高对比度,高能图像(Sn140 kVp)具有较低噪声,尤其Sn140是在140 kVp球管上添加了锡板过滤掉低能射线,让射线更“硬”,因此图像噪声得以进一步降低,所以融合图像兼具高对比度和低噪声的特点,往往图像的对比噪声比优于单源120 kVp扫描图像[21]。相比于单源120 kVp扫描,双能扫描更优的融合图像质量可能是引起双能扫描AI检出效能更高的潜在原因,当然这还有待进一步试验和数据的验证。
本研究也存在一定不足之处,首先两组数据的人口统计学信息没有纳入本研究,其次样本量还需继续加大,我们将在以后的研究中予以完善。
总之,双能扫描融合120 kVp的CT图像较单源120 kVp的CT图像,在结合AI肺结节的检测中,敏感度更高,总体假阳性率也更低,且辐射剂量明显降低,值得在临床中推广应用。