曹源,李丹阳,张扬,高道福,顾俊,张清
目前低剂量CT作为胸部肺结节筛查已成为临床首选检查[1,2],常规胸部CT降低剂量主要以降低管电流和降低管电压两种方法,单纯降低管电流会增加胸部两边图像质量不足[3];管电压降低较管电流降低更能有效降低辐射剂量,但过度降低管电压会造成密度分辨力下降[4],研究表明100 kVp应用迭代重建算法不但可明显降低辐射剂量还能保证图像质量以满足胸部影像诊断[5]。
随着人工智能(artificial intelligence,AI)技术不断取得新突破,深度学习与大数据等前沿技术在医疗领域广泛应用[6],AI医学影像作为医疗辅助诊断系统不仅准确率高而且大大提高医生工作效率,受到越来越多影像医生青睐[7],但目前AI应用多采用常规管电压120 kVp FBP图像,对低管电压不同重建算法图像应用甚少。本文针对管电压100 kVp条件下不同重建算法对AI辅助检测肺结节效能影响做了相关研究。
搜集2019年1月14日-2月14日行胸部双能量CT检查患者189例,男93例,女96例;年龄22~68岁,平均(48.1±11.8)岁;BMI指数18.1~33.9 kg/m2,平均(24.9±3.4)kg/m2。排除标准: 因金属伪影、呼吸伪影等导致CT图像质量不佳者;患者存在肺炎、肺不张、胸腔积液等影响病灶确认及标注者。
所有患者均行西门子双源(Definition FLASH )CT双能量胸部扫描,采用双能量管电压组合(两个球管电压分别为Sn140kVp、100kVp),采用自动管电流调节技术Care Dose 4D,重建层厚1.0 mm,将100 kVp数据分别采用FBP及SAFIRE1、3、5等级迭代重建算法行图像重建,每例患者4组图像,分别为FBP、SAFIRE1、SAFIRE3、SAFIRE5。选用AI辅助软件(InferRead CT Lung Research,Infervision,Beijing,China)行肺结节自动检测。该系统以40万训练数据为根基,数据库数据来源于全国多家大型三甲医院,是一款已被广泛运用于协助肺结节检测深度学习软件。
由两位主治以上职称放射科医生双盲对双能CT融合120 kVp图像结合AI显示结果行肺结节标注,报告结节数量、位置、大小及密度,最后再由1名副主任医生进行确认并建立金标准。
选取气管分叉轴面层面降主动脉和同侧竖脊肌分别放置面积60 mm2ROI,记录平均CT值及其标准差(SD),采用公式计算各重建算法组平均SNR与CNR[8]:
采用SPSS 20.0软件进行分析4组不同算法敏感度、准确度、假阳性率、SNR和CNR比较采用单因素方差分析,两两之间采用多重比较。以P<0.05为差异有统计学意义。
金标准共检测出1016个肺结节,其中<4 mm结节778个,≥4 mm结节238个,实性结节801个,亚实性结节215个。AI肺结节自动检测系统对FBP、SAFIRE1、SAFIRE3和SAFIRE5 共4组图像检测真阳性结节数无明显差别,统计分析结果表明4组算法检测敏感度差异无统计学意义(P>0.05);4组算法检测结节假阳性率差异具有统计学意义(P<0.05),其中FBP图像假阳性率低于其它算法(表1、图1)。同时4组重建算法图像各部位CT值均无明显变化,噪声值随迭代等级提升而降低,SNR和CNR随着迭代等级提升呈上升趋势且两两之间差异具有统计学意义(P<0.05)。
4组重建算法对检测实性结节和亚实性结节敏感度无统计学差异,但两两比较亚实性结节FBP和SAFIR5具有统计学差异,各组算法准确度具有统计学意义(P<0.05),随着迭代等级提升而降低(表2)。
图1 女,53岁,经金标准标注左肺下叶示1个磨玻璃结节。a、b、c、d分别代表FBP、SAFIRE1、SAFIER3、SAFIRE5肺结节检测图像,其中FBP准确显示真阳性结节且无假阳性结节,其他各组不但检测出真阳性结节且随着迭代等级提升假阳性结节逐渐增加。绿框:AI检测出真阳性结节;红框:AI检测出假阳性结节。
表1 四组重建算法图像AI检测结节数、敏感度、假阳性率、准确度、SNR、CNR
4组重建算法对AI检测长径≥4 mm结节敏感度和准确度均无统计学差异,对于长径<4 mm敏感度无统计学差异,但准确度具有统计学意义(P<0.05),且准确度随着迭代等级提升而降低(表3)。
CT作为肺癌常用诊断方法广泛应用临床,而常规CT检查由于辐射剂量大,普遍筛查一直受到限制。国家肺癌筛查试验(NLST)表明高危人群筛查随着低剂量CT适用肺癌死亡率大大减少,相比于120 kVp,管电压100 kVp辐射剂量平均约降低50%[9],因此100 kVp属于目前低电压低辐射主流市场,而在管电压下降辐射剂量降低同时图像噪声也会随之增加,使得难以检测和区分肺结节[10-11]。西门子最新迭代重建算法(sinogram affirmed iterative reconstruction,Safire)不仅进一步提高图像域迭代对噪声去除性能且引入基于原始数据迭代伪影去除技术解决了原始滤波反投影中因剂量降低产生噪声问题而且重建速度大大提高。
本研究显示随着迭代等级提升图像CT值无明显变化,图像噪声有显著下降,因此图像SNR和CNR都有明显提高。研究[12-14]证实纯磨玻璃肺结节与间质性病变检出率随噪声降低而显著提高,因此本研究中亚实性结节敏感度随着迭代等级增加有所升高,除此之外无论在长径≥4 mm、<4 mm结节还是实性结节均对AI检测肺结节敏感度无明显增加,反而除≥4 mm结节外假阳性率都逐渐增高,分析原因研究表明图像噪声对深度学习软件检测部分肺结节并没有影响[15],而迭代算法是对投影数据以FBP算法进行重建,将获得图像数据与基于统计光子和电子噪声理想噪声模型进行比较,去除噪声得到校正图像,对此校正图像再通过正投影更新原始投影数据 用于下次迭代计算,如此进行多次迭代重建图像,但随着迭代次数增加(等级提升)图像过度细腻造成失真[16-17]也是造成假阳性率升高原因,对于长径≥4 mm结节检测准确度无明显差别,原因可能AI对于大结节模型训练程度相对精确,所以准确度无明显差别。
表2 四组重建算法对不同密度肺结节的敏感度和准确度
表3 四组重建算法对不同大小肺结节的敏感度和准确度
本研究使用是推想科技AI诊断辅助软件,它是多数基于FBP算法胸部CT图像训练出来模型[18],对于FBP算法胸部图像AI检测肺结节阳性率尚可,但对于在迭代算法图像上可能缺乏经验,也是造成假阳性率依旧偏高原因之一。
随着辐射剂量逐渐被人们所重视,越来越多人选择了低剂量胸部CT来筛查肺结节。本文之所以采用双源CT100kVp图像就是避免多次扫描给患者带来伤害,同一组患者既得到了120kVp图像又得到了100kVp图像且有相关报道显示[19]双源CT100kVp图像约等同于单源CT100kVp图像,也可以证实在双源CT100kVp下相关研究可行性。本文显示在100kVp下各种重建技术AI检测肺结节敏感度均在70%左右,这与Giovanni等[20]研究显示AI检测肺结节敏感度高达92.20%相差较大,究其原因是目前多数报道AI检测肺结节都是120kVp下进行的,我们金标准也是基于120kVp图像所做出的,因此我们应该继续加大深度学习训练模型多元化以满足不同条件下检测效能考证。
综上所述,低剂量(100kVp)条件下为保证诊断准确率,除亚实性结节外人工智能检测肺结节CT重建算法应首选FBP。