双能CT融合图像在人工智能肺结节筛查中检测效能的探索研究

2021-03-01 04:16宋冬冬朱晓明朱丽娟顾俊伍建林张清

中国医疗设备 2021年2期

宋冬冬，朱晓明，朱丽娟，顾俊，伍建林，张清

1. 大连大学附属中山医院放射科，辽宁大连 116001；2. 北京推想科技有限公司全球临床科研合作学院，北京 100025

引言

肺癌是我国目前发病率和死亡率最高的恶性肿瘤[1]，并仍呈逐年增长趋势。多层螺旋CT肺癌的早期筛查，对肺癌的预防以及早期治疗意义重大[2]，能有效提高早期肺癌患者的5年生存率[3]。随着人工智能（Artificial Intelligence，AI）深度学习技术在医疗领域的推广应用，肺CT图像的AI辅助结节筛查，在临床上得到广泛开展[4]，在提高工作效率的同时能有效降低肺结节的漏诊率[5]。目前关于AI对肺结节检测效能的研究正逐步深入，但这些研究多集中在胸部CT单源扫描以及AI临床应用方法及价值[6-8]的探讨上，而双能扫描对人工智能辅助肺结节检测效能的研究尚无人开展。本文旨在探讨临床中，胸部双能CT扫描结合AI行肺结节筛查，其检测效能与常规胸部CT单源120 kVp扫描的对比，同时比较两种模式的辐射剂量。

1 资料与方法

1.1 一般资料

研究通过了本院伦理委员会批准，所有研究对象检查前签署知情同意书。收集2018年12月至2019年2月行双源CT肺结节筛查的患者。纳入标准：18岁以上，临床行胸部CT平扫检查的患者。排除标准：由于胸部手术史、胸腔积液、弥漫性间质性病变、肺不张、肺部炎性病变及CT图像中呼吸运动伪影等，影响结节确认及标注者。381例患者纳入研究。按照扫描模式不同将患者分为两组：A组（183例）采用单源120 kVp扫描，B组（198例）采用双能模式扫描并收集融合120 kVp图像。两组患者的年龄、性别、结节大小及结节类型差异均无统计学意义（表1）。

表1 两组患者的临床资料比较结果

1.2 扫描参数与方法

所有患者均在双源CT机（Siemens Somatom Definition Flash，德国）上进行。扫描范围为胸廓入口到膈肌水平，包括整个肺野。单源扫描方式参数：探测器准直器128×0.6 mm，机架旋转时间为0.5 s /周，螺距为1.2，管电压120 kVp，参考管电流130 mAs，开启CAREDose 4D技术；双能扫描方式参数：探测器准直器64×0.6 mm，机架旋转时间为0.28 s /周，螺距为0.7，A管球管电压100 kVp，B管球管电压sn140 kVp，融合图像为120 kVp（两者按4:6的比例融合图像），参考管电流A管球110 mAs、B管球94 mAs，开启CAREDose 4D技术。

1.3 图像重建与结节检测

A、B两组图像均行1 mm、骨算法重建，得到单源120 kVp和双能融合120 kVp两组标准CT薄层图像。使用推想科技的肺结节薄层训练模型检测软件（Infer Read CT Lung Research, Infervision, Beijing，China），该系统基于40万训练数据集且数据来源于全国多家大型三甲医院，能将疑似肺结节的部位准确标记[9]。对上述两组CT图像进行肺结节检测，记录检测出所有结节的数量、位置，并按大小（直径≥4 mm或＜4 mm）、类型（实性或亚实性）分类；三名不同年资的影像诊断医生结合AI对两组图像的肺结节进行分析，均依据《肺结节诊治中国专家共识（2018年）》。首先由两名有10年以上经验的医师对两组图像所有结节的数量、位置分别进行标注，并按大小（直径≥4 mm或<4 mm）、类型（实性或亚实性）分类，标注结果不同之处由二人讨论后统一结果，最后再由一名主任医师对以上二人制定结果进行审阅，确立最终金标准结节。将人工智能软件自动检测结果与金标准比对，并统计检出结节的真阳数、假阳数，计算出检测敏感度、精确度和假阳性率。按公式ED=DLP×k（k为转换系数）计算有效辐射剂量。

1.4 统计学方法

所有统计学处理均应用SPSS 20.0版本进行。计量资料使用均数±标准差（±s）表示，比较采用卡方检验，分别对敏感度、DLP、CTDIvol、ED进行组间方小差分析，P<0.05差异具有统计学意义。

2 结果

2.1 两组检测效能比较

两组图像对于AI的肺结节检测效能比较，差异有统计学意义（P<0.005），见表2。

表2 两组图像对于AI的肺结节检测效能

2.2 两组对不同大小肺结节AI检测效能比较

两组对于AI对直径≥4 mm和直径<4 mm肺结节的检测效能比较，差异有统计学意义（P<0.005），见表3～4。

表3 两组图像对于AI对直径≥4 mm肺结节的检测效能

表4 两组图像对于AI对直径＜4 mm肺结节的检测效能

2.3 两组对不同类型肺结节AI检测效能比较

两组图像对于AI对实性肺结节和AI对亚实性肺结节的检测效能比较，差异有统计学意义（P<0.005），见表5～6。

表5 两组图像对于AI对实性肺结节的检测效能

表6 两组图像对于AI对亚实性肺结节的检测效能

2.4 两组辐射剂量比较

A组CTDIvol、DLP、ED均高于B组，差异有统计学意义（P<0.05），见表7。

表7 两组扫描辐射剂量

3 讨论

基于深度学习[10]的AI肺结节辅助检测在临床CT图像上的广泛应用[11]，极大地提高了医生对肺结节的检诊效率[12]。目前临床多在单源扫描下采集CT薄层图像，进行AI辅助肺结节筛查，其检测效能还有不足之处，尤其在临床上极易漏诊的最大直径<4 mm和亚实性结节的检出上[13]，敏感度还有待提高[14]。

随着双源CT的普及应用[15-17]，胸部CT双能扫描成为日常临床工作中的一个选项，常规条件下与单源扫描相比，胸部CT双能扫描在不增加辐射剂量的前提下，能够得到融合120 kVp、sn140 kVp与100 kVp不同能量的图像，为诊断与鉴别诊断提供更多的参考依据[18]。本研究在双源CT常规剂量胸部CT肺结节筛查中，将单源扫描120 kVp与双能扫描融合120 kVp的肺CT图像中，肺结节的AI检测效能进行了比较，结果显示双能扫描融合120 kVp图像的肺结节检测敏感度明显更高，辐射剂量明显更低，而假阳性率却不高，AI检测效能明显优于单源扫描120 kVp图像。其中：无论对于结节直径≥4 mm（临床需选择性影像随访或12个月影像随访[19]），还是直径<4 mm（临床需12个月影像随访或6～24个月间不同方式影像随访[19]），融合120 kVp图像检测敏感度均明显更高，对于直径≥4 mm的结节融合120 kVp图像检测假阳性率更低；无论实性结节还是亚实性结节，融合120 kVp图像的检测敏感度均明显更高，对于实性结节融合120 kVp图像的假阳性率更低。尽管与单源120 kVp图像相较，融合120 kVp图像在肺结节检测的假阳性率上没有明显的降低，但在AI辅助医生对肺结节的检出上，更高的结节检测敏感度，减少肺结节的漏诊临床意义更大，尤其在临床中容易漏检的小结节（最大直径<4 mm）和亚实性结节上，双能融合120 kVp图像的检测敏感度较单源120 kVp图像有了较大的提高。图1显示了2例临床易漏诊<4 mm亚实性结节在双能融合120 kVp结合AI被检测出来，而在单源120 kVp图像结合AI中漏诊。

图1 两组图像对临床易漏诊结节的AI检出对比

最新发表在RSNA旗舰杂志Radiology: Artificial Intelligence的文章[20]比较了一些扫描参数（比如CT设备厂家、扫描辐射剂量）对于深度学习肺结节检出模型检出效能的影响，结果发现CT设备厂家以及辐射剂量对于检出效能（敏感度、假阳率）并没有影响，在我们的研究当中，单源120kVp的有效辐射剂量（4±1.1）mSv虽然略高于双源扫描（3.23±0.97）mSv，但是这不太可能是影响结节检出率的决定因素。因此我们猜测可能是由于双源融合图像（mixed image）的图像质量优于单源120 kVp图像质量从而导致AI辅助诊断软件的检出效能更高。双源融合图像选取来自低能100 kVp和高能Sn140 kVp的扫描图像，低能（100 kVp）图像具有高对比度，高能图像（Sn140 kVp）具有较低噪声，尤其Sn140是在140 kVp球管上添加了锡板过滤掉低能射线，让射线更“硬”，因此图像噪声得以进一步降低，所以融合图像兼具高对比度和低噪声的特点，往往图像的对比噪声比优于单源120 kVp扫描图像[21]。相比于单源120 kVp扫描，双能扫描更优的融合图像质量可能是引起双能扫描AI检出效能更高的潜在原因，当然这还有待进一步试验和数据的验证。

本研究也存在一定不足之处，首先两组数据的人口统计学信息没有纳入本研究，其次样本量还需继续加大，我们将在以后的研究中予以完善。

总之，双能扫描融合120 kVp的CT图像较单源120 kVp的CT图像，在结合AI肺结节的检测中，敏感度更高，总体假阳性率也更低，且辐射剂量明显降低，值得在临床中推广应用。