人工智能迭代重建算法对超低剂量胸部CT图像质量和计算机辅助肺结节检测的影响

2024-05-06 07:36张宝平李宇航朱书萌赵文哲王怡名
遵义医科大学学报 2024年4期
关键词:阅片胸部阳性率

张宝平,李 傲,李宇航,朱书萌,田 倩,赵文哲,肖 瑶,侯 伟,刘 哲,王 睿,黄 欣,郝 辉,王怡名,杨 健,2,金 超,2

(1.西安交通大学第一附属医院 医学影像科,陕西 西安 710061;2.陕西省计算影像与医疗智能工程研究中心,陕西 西安 710061)

肺癌是我国目前发病率和死亡率最高的恶性肿瘤,大部分患者由于早期缺乏特异性临床症状而延误诊断及治疗,就诊时已进展至中晚期,5年生存率不足20%[1-2]。国内外多项大型研究表明低剂量CT(low dose CT,LDCT)肺癌筛查有助于早期发现肺结节,通过对高危肺结节进行科学管理,可显著改善患者预后,降低肺癌死亡率[3-5]。因此,通过LDCT肺癌筛查早期精准识别肺结节对肺癌早期防治有重要意义。然而,随着LDCT肺癌筛查的广泛开展,肺结节筛查临床工作量显著增大、CT辐射潜在风险增加等问题也随之凸显。

随着近年来计算机技术的发展,计算机辅助诊断(computer-aided diagnosis,CAD)在临床影像实践中取得了长足的进步,CAD可以高效、便捷的识别多种病变,已经广泛应用于临床肺结节筛查辅助诊断。同时,随着人们对辐射风险认识的不断提高,亚mSv超低剂量CT(ultra-low dose CT,ULDCT)应用于肺结节筛查也是研究的热点之一。由于扫描剂量降低后图像噪声的明显增加及重建算法的本身特性,传统的滤波反投影(filtered back projection,FBP)和迭代重建(iterative reconstruction,IR)算法在ULDCT中的应用受到一定限制[6],近年来,基于深度学习的重建算法在显著降低辐射剂量的同时能够保持良好的图像质量,展现出广阔的应用前景[7]。其中,研究人员提出了一种基于深度学习的迭代重建算法,即人工智能迭代重建算法(AIIR, 上海联影医疗科技股份有限公司)[8],该算法将基于模型的迭代重建与深度学习神经卷积网络相结合,可以在降低辐射剂量和提升图像质量的同时保持图像细节和纹理,AIIR在腹部成像和主动脉CT血管成像中表现良好[ 9-11]。然而,在ULDCT肺结节筛查方面,AIIR对胸部CT图像质量和CAD肺结节检测的影响仍然缺乏相关研究。因此,本研究通过与常规剂量胸部CT对比,探讨AIIR对超低剂量胸部CT图像质量和CAD肺结节检测的影响。

1 资料与方法

1.1 临床资料 前瞻性纳入2023年9月至2023年10月于我院行胸部CT检查的患者41例(男/女,23/18);平均年龄(55±6.2)岁;身体质量指数(body mass index,BMI)为(24.3±2.9) kg/m2。纳入标准包括:(1)高度怀疑或已确诊的肺结节患者;(2)有吸烟史,每年吸烟超过20包或400支;(3)有恶性肿瘤病史或者恶性肿瘤家族史。排除标准包括:(1)孕期妇女;(2)年龄≤18岁;(3)有严重慢性疾病或危及生命的疾病;(4)目前有呼吸道感染症状。本研究经医院伦理委员会批准,所有患者检查前都被告知检查注意事项,并签署知情同意书。

1.2 扫描及重建方案 胸部CT扫描采用320排螺旋CT(型号uCT960+,上海联影医疗科技股份有限公司),扫描前对患者进行呼吸训练以减少呼吸运动伪影。所有患者在接受常规剂量胸部CT平扫后于同一屏气周期内进行超低剂量胸部CT扫描,常规剂量胸部CT扫描方案:固定管电压120 kVp,采用管电流调制技术,剂量等级为2级(对应参考管电流106 mAs);超低剂量胸部CT扫描方案:固定管电压120 kVp,管电流固定为15 mAs,使超低剂量组的有效剂量(effective dose, ED)<1 mSv。其他扫描参数均一致:扫描层厚为0.5 mm,旋转时间为0.5 s/r,螺距为0.993 7,准直宽度80 mm。将获得的原始数据推送至联影探索者工作平台(uInnovation-CT,R001,上海联影医疗科技股份有限公司)进行重建,常规剂量CT图像采用联影CT的商用混合迭代重建算法(Karl, 上海联影医疗科技股份有限公司)在等级6强度下进行重建,算法核心为B-SHARP-C。ULDCT图像分别用Karl在等级6强度和AIIR在等级1/3/5强度下进行重建,Karl算法核心为B-SHARP-C,AIIR算法核心为LungStandard,5组图像均选择系统设置的肺窗进行重建,窗宽为1 600 HU,窗位为-600 HU。将常规剂量通过Karl生成的图像记为SD Karl组,将ULDCT图像通过Karl和AIIR在等级1/3/5生成的图像分别记为RD Karl、RD AIIR1、RD AIIR3、RD AIIR5组,共获得5组重建图像数据,同一患者所有重建范围保持一致,层厚、层间距均为1 mm。

(2)主观评价:参与主观评价的医师均为我院医学影像科胸部学组诊断医师,为尽可能避免除图像以外的各种信息对评价真实性的影响,应用自主开发的图像质量评价软件(图1)进行主观图像质量5分法评价:1)医师A对5组图像分别进行编号和记录;2)系统以随机顺序排列并显示同一患者5组不同剂量和重建算法的胸部CT图像(隐去除图像外的其他所有信息);3)2名分别有5年和10年以上胸部影像诊断经验且对图像重建方法及患者信息不知情的主治医师B和C分别通过评分软件独立地对图像按5分法进行评价。其中,1分:无法诊断,图像质量极差,噪声及伪影非常严重,结构显示不清;2分:诊断困难,图像质量欠佳,噪声及伪影重,结构显示欠清;3分:基本满足临床诊断,图像质量中等,噪声及伪影一般,结构显示尚可;4分:满足临床诊断,图像质量好,噪声小,有少量伪影,结构显示较清晰;5分:满足临床诊断,图像质量极好,无明显噪声和伪影,结构显示清晰。图像评价完成后由医师A收集整理评分结果,以图像主观评分≥3分视为符合临床诊断需求[12-13]。

图1 主观图像质量评价软件用户界面

1.4 CAD肺结节检测评价 首先,由医师B和C在完成图像质量主观评价4周以后共同对41例患者CT图像阅片,检测并记录所有直径4 mm以上的非钙化结节作为参考,如有意见不一致,由我院医学影像科胸部学组1名具有15年以上胸部影像诊断经验的副主任医师D加入后3人共同商议确定。随后,将5组图像传输至同一台联影后处理工作站(uWS-CT,R006,上海联影医疗科技股份有限公司),使用CAD肺结节检测分析系统进行肺结节检测,5组图像检测均在标准肺窗和同一条件下使用自动识别模式进行。由医师E检查并记录5组图像CAD肺结节检测结果,并与医师B和C检测到的参考结节进行比较,计算 CAD肺结节检测的真阳性、假阳性(误诊)和假阴性(漏诊)的数量。肺结节检测过程中,以RD Karl组为例,记录RD Karl组人工阅片时间和CAD阅片时间。

1.5 辐射剂量记录和分析 通过剂量报告记录每次扫描的体积CT剂量指数(volume CT dose index, CTDIvol)和剂量-长度积(dose length product, DLP)。计算ED的公式为ED=DLP×k,其中k为辐射剂量换算因子,胸部为0.014 mSv/(mGy.cm)。

2 结果

2.1 图像质量客观评价结果 常规剂量和超低剂量不同重建方法获得的5组图像的主动脉、脂肪、肌肉CT值组间比较,差异均无统计学意义。5组图像主动脉、脂肪、肌肉的SD值组间差异均有统计学意义(P<0.005),RD Karl组SD值显著高于其他4组,RD Karl及SD Karl组SD值均高于RD AIIR 1、RD AIIR 3、RD AIIR 5组,以肌肉的SD值表示图像噪声,图像噪声由小到大排序为RD AIIR 1

表1 不同剂量和重建条件下胸部CT图像的CT值、SD值、SNR和CNR

2.2 主观图像质量评价结果 医师B和C对SD Karl、RD Karl、RD AIIR1、RD AIIR3、RD AIIR5 5组图像质量主观评价的Kappa值分别为0.74、0.67、0.85、0.78及0.77。5组图像主观评分由大到小排序为SD Karl>RD AIIR5>RD AIIR3>RD AIIR1>RD Karl。按照评价标准,RD AIIR3、RD AIIR5、SD Karl组图像满足临床诊断要求。SD Karl与RD Karl组之间、RD Karl与RD AIIR3和RD AIIR5组之间主观评分差异均有统计学意义(P<0.005),RD Karl与RD AIIR1组、SD Karl与RD AIIR5组之间主观评分差异无统计学意义。见图2。

SD Karl、RD AIIR3和RD AIIR5组图像质量符合临床诊断要求(黑色虚线,评分≥3分),相同的上标表示事后两两检验组间无显著性差异(P>0.05),不同上标表示组间有显著性差异(P<0.005);字母顺序a~c表示降序。

2.3 CAD肺结节检测评价 CAD肺结节检测分析系统成功读取并分析了所有5组图像数据,图3为CAD系统的用户界面,图4为SD Karl、RD Karl、RD AIIR1、RD AIIR3、RD AIIR5 5组图像在CAD上检测到的结节示例。作为参考,2名诊断医师在41例患者胸部CT中检测到>4 mm的非钙化结节共81个,5组图像在CAD上检测到的结节的真阳性率、假阴性率和假阳性率结果见表2。SD Karl、RD Karl、RD AIIR1、RD AIIR3、RD AIIR5 5组图像CAD检测的灵敏度分别为93.8%(76/81)、88.9%(72/81)、91.4%(74/81)、93.8%(76/81)、93.8%(76/81),RD Karl组灵敏度最低,CAD检测肺结节的灵敏度各组之间差异无统计学意义。RD Karl 组CAD检测肺结节的假阳性率最高,为79.2%(52/72),其次为SD Karl组46.1% (35/76),SD Karl、RD AIIR1、RD AIIR3、RD AIIR5组的假阳性率均低于RD Karl组,差异有统计学意义(P<0.005),RD AIIR1、RD AIIR3、RD AIIR5组的假阳性率均低于SD Karl组,差异有统计学意义(P<0.005)。RD Karl组人工阅片时间为(65.8±6.8)s,CAD阅片时间(24.1±3.0)s,CAD阅片时间较人工阅片减少约63.3%,两组阅片时间之间差异有统计学意义(P<0.05)。

表2 不同组之间CAD检测肺结节的真阳性率、假阴性率和假阳性率(%)

所有图像均采用自动分析模式进行肺结节检测(红色箭头)。

A:SD Karl组;B: RD Karl组;C: RD AIIR1组;D: RD AIIR3组;E:RD AIIR5组。

真阳性率和假阴性率分别为CAD检测到的真实结节和CAD漏检的真实结节与81个真实参考结节的比值,假阳性率表示为在每个条件下CAD检测到的非结节结果与CAD检测到的真实结节数目的比值;相同的上标表示事后两两检验组间无显著性差异(P>0.05),不同上标表示组间有显著性差异(P<0.005);字母顺序a~c表示降序。

2.4 辐射剂量 如表3所示,常规剂量组与超低剂量组的CTDIvol、DLP、ED差异均有统计学意义(P<0.05)。相比于常规剂量组的ED(5.91±1.99) mSv,超低剂量组的ED(0.63±0.03) mSv降低约89.3%。

表3 常规剂量与低剂量组辐射剂量参数比较

3 讨论

本研究从主动脉、肌肉、脂肪等结构的CT值、图像噪声、SNR、CNR、主观整体图像质量评价及CAD肺结节检测性能等方面对比了常规剂量胸部CT Karl重建图像与超低剂量胸部CT Karl及AIIR1/3/5等级强度重建图像,探究了AIIR对超低剂量胸部CT图像质量和CAD肺结节检测的影响。本研究中超低剂量胸部CT的ED约0.63 mSv,较常规剂量降低约89.3%,研究发现AIIR在改善超低剂量胸部CT图像质量的同时可以保持CAD肺结节检测的灵敏度、降低CAD检测的假阳性。

在图像质量方面,AIIR是一种将基于模型的迭代重建(model-based iterative reconstruction,MBIR)与深度学习神经卷积网络相结合的深度学习重建算法,传统的MBIR通过弦图域和图像域之间的反复迭代重建和修正优化图像质量,有重建准确性高、降噪和抑制噪声伪影性能优异的特点,然而,重建时间长、计算要求高等因素限制了其在临床的广泛应用[14]。AIIR算法将深度学习神经卷积网络引入MBIR,通过深度学习神经卷积网络能够快速有效的了解图像噪声特性及纹理特点,两者的结合既保证了快速的图像降噪,又保留了MBIR的优势,从而有效的降低图像噪声,提升图像质量[8]。在本研究中,超低剂量胸部CT的Karl及AIIR重建图像主要结构的CT值差异无统计学意义,与常规迭代重建算法相比,AIIR算法能准确的恢复结构的CT值,这与之前的研究结果是一致的[9-10]。在对图像噪声的影响方面,本研究中AIIR1、3、5等级强度的重建图像噪声均低于常规剂量和超低剂量Karl重建,图像噪声随AIIR重建等级增加而增加,相比于超低剂量Karl图像,AIIR重建可降低64.6%~81.2%的图像噪声。同时,AIIR1、3、5等级强度重建图像的SNR、CNR均高于常规剂量和超低剂量Karl重建图像,表明AIIR可以有效的降低超低剂量胸部CT图像的噪声,提升图像的SNR、CNR,这与AIIR重建算法在其他部位的既往研究结果是一致的[15]。在本研究中,主观图像质量评价结果表明,AIIR可以改善超低剂量胸部CT的图像质量,AIIR3和AIIR5级重建图像主观评分优于同剂量Karl重建图像且满足临床诊断要求,其中AIIR5级重建在辐射剂量降低89.3%时仍能获得与常规剂量Karl重建相当的图像质量。值得注意的是,AIIR1级重建图像的图像噪声、SNR、CNR均优于其他组,但主观图像质量评分较低,这可能是由于该级别的降噪强度下图像部分高频噪声被抑制,图像细节显示较差、图像平滑度过高而影响阅片者主观感受所致。由于临床实践中胸部CT的诊断任务不仅局限于CAD肺结节筛查,在保持CAD优良的检测性能的同时,基于AIIR算法的超低剂量胸部CT图像质量也需满足其他临床诊断需求。因此,AIIR可以改善超低剂量胸部CT图像质量,综合客观评价指标及主观图像质量评价结果,在本研究中超低剂量胸部CT扫描条件下,AIIR5级重建能获得最佳的图像质量。

在CAD肺结节检测方面,得益于计算机技术的发展,应用CAD软件协助影像诊断医师进行快速精准的肺结节筛查以降低结节筛查工作负荷是CAD发展和研究的热点方向之一[16-19]。在肺结节检测的灵敏度方面,Yao等[20]通过肺结节体模研究分析了不同剂量等级和重建方法对CAD肺结节检测灵敏度的影响,研究发现在超低剂量扫描时,图像噪声过高会导致CAD灵敏度降低,当剂量增加至0.51 mSv时,不同重建算法图像的CAD肺结节检测灵敏度相当,而Jiang等[21]的研究发现,基于深度学习重建的超低剂量胸部CT可以降低图像噪声、提高图像质量和基于CAD的肺结节检测灵敏度,本研究中超低剂量扫描方案辐射剂量(约0.63 mSv)略高于以上两项研究,AIIR重建图像CAD肺结节检测灵敏度与常规剂量Karl重建相当,这可能是剂量增加提升图像质量、AIIR重建进一步降低图像噪声的综合作用。在肺结节检测的假阳性率方面,Den Harder等[22]研究发现,CAD可识别基于迭代重建的超低剂量胸部CT图像中的肺结节,然而,在超低剂量胸部CT中,基于迭代重建的图像会导致CAD结节检测的假阳性率增加。在本研究中,相比于常规剂量Karl重建,超低剂量Karl重建图像的CAD肺结节检测假阳性率增加,而AIIR重建可以在保持超低剂量胸部CT图像CAD肺结节检测灵敏度的同时降低CAD检测的假阳性率。本研究对比了RD Karl组图像人工阅片和CAD阅片时间,CAD阅片时间较人工阅片减少63.3%,表明CAD有阅片快捷的优势,然而,在临床实践中CAD往往起到辅助诊断的作用,CAD结节筛选结果需要进一步人工确认,超低剂量Karl重建过高的假阳性率可能会在实际应用中削弱CAD快捷性,因此,在超低剂量胸部CT图像CAD肺结节检测中通过AIIR降低CAD的假阳性率可能进一步降低临床肺结节筛查的工作量,在临床实践中有重要的意义。

本研究存在局限性和不足。首先,本研究纳入的样本量较少,相关结果和结论需要在更大样本量的研究中进一步验证和深入探究。其次,本研究仅探究了基于联影CAD的肺结节分析结果,目前投入临床应用的CAD软件众多,超低剂量扫描条件下不同软件之间的结节检测性能可能存在差异,这将在后续的研究中进一步探讨。

综上所述,AIIR重建可以改善超低剂量胸部CT的图像质量,AIIR5级重建可以获得最佳的整体图像质量,基于AIIR重建的超低剂量胸部CT图像可以在保持CAD肺结节检测灵敏度的同时降低CAD检测的假阳性,可能进一步降低临床肺结节筛查的工作量,具有较好的应用前景。

猜你喜欢
阅片胸部阳性率
高、低年资住培医生应用人工智能检出脑转移瘤的价值
《住院医师规范化培训教学阅片指南(2022年版)》解读
ORH方法在评价肋骨骨折多阅片者诊断试验中的应用*
胸部肿瘤放疗后椎体对99Tcm-MDP的摄取表现及分析
不同类型标本不同时间微生物检验结果阳性率分析
SP-1000i全自动推片染色仪及CellaVision DM96自动阅片仪在形态学检验人员镜下比对中的应用
人体胸部
密切接触者PPD强阳性率在学校结核病暴发风险评估中的应用价值
肌电图在肘管综合征中的诊断阳性率与鉴别诊断
胸部Castleman病1例报道