申太忠,魏友平,马风荣,张 顺,王淑荔
(航空总医院医学影像科,北京 100012)
图1 患者女,86岁,左肺上叶结节 图2 患者女,47岁,左肺下叶结节
肺癌是中国死亡率最高的癌症[1]。肺结节,尤其是恶性肺结节是存在被治愈可能的肺癌形式[2],恶性结节早期发病隐匿,病程迅速,预后差,因此肺癌早期筛查极其重要[3]。
近年来,随着CT技术的进步与肺癌早期筛查的普及,胸部CT已成为早期筛查与诊断肺癌的最主要的非侵入性手段[4-5],而这在另一方面加重了影像科医师日常工作的负担。肺结节自动检测算法因可提高医师临床诊断效率和效果而已成为热门研究方向[6-7]。对此以深度学习(deep learning, DL)[8]为代表的人工智能 (artificial intelligence, AI) 技术取得了较好效果,但需海量参数进行建模,且对医师而言可解释性较差[9],需要在临床数据下对不同风险因素[10-11]进行评估,以确定其适用场景。肺结节所在位置是肺癌发病的关键因素之一[12]。本研究观察肺结节所在位置对基于DL的肺结节检测算法的影响。
1.1 一般资料 收集2018年9月21日—2019年5月29日于我院门诊或急诊接受肺部CT扫描的1 224例肺结节患者。纳入标准:①无胸部间质性病变(如肺纤维化、间质性肺炎、间质性肺水肿等)、慢性阻塞性肺疾病、肺结核及各种类型肺炎等肺部弥漫性疾病;②无严重呼吸伪影。最终493例患者入组,男210例,女283例;年龄16~94岁,中位年龄57岁。
1.2 方法 使用Toshiba Aquilion ONE 320和Siemens Sensation 16 CT仪,管电压120 kV,自适应管电流。重建算法均为肺重建,层厚均为2 mm,层间距为2 mm。结节定义为长径≤3 cm、圆形或椭圆形的局限性高密度影[2]。由1名有17年工作经验的副主任医师对每幅图像进行标注,保证医生的工作状态与临床场景一致,标注结节所在位置及其大小,位置包括左肺上叶(图1)、左肺下叶(图2)、左肺斜裂、右肺上叶(图3)、右肺中叶(图4)、右肺下叶(图5)、右肺水平裂、右肺斜裂和胸膜。采用Dr.Wise肺结节辅助诊断软件中基于DL的肺结节检测算法进行处理,输出算法检出结果,将其与医师标注结果进行对比,得到肺结节检测算法对于不同位置结节与医师标注结节的匹配度等指标。由同一位医师对未能匹配的算法检出框进行审核,以确定其具体分布。根据筛查指南[3]建议,本研究仅统计0~4.0 mm与4.1~30.0 mm肺结节相关指标。
1.3 统计学分析 采用开源函数库Scipy1.0.0进行数据处理与统计。采用多个样本比较的秩和检验,对肺结节检测算法在不同位置检出的结节与医生标注结节的匹配度,以及未能匹配的算法检出框的数量及其在各个肺叶及胸膜叶间裂的分布进行统计学分析[13]。P<0.05为差异有统计学意义。
基于DL的肺结节检测算法对不同位置结节与医生初次标注结节的匹配结果见表1。检测算法对0~4.0 mm肺结节与医师初次标注结节的匹配度为84.38%,4.1~30.0 mm肺结节匹配度为96.84%。检测算法对0~4.0 mm和4.0~30.0 mm结节对不同位置肺结节的匹配度差异均无统计学意义(P均>0.05)。
基于DL的肺结节检测算法共得出2 177个检出框,其中710个与医师初次标注结果匹配(表2);1467个未能匹配,其中747个(56.92%)经审核判定为算法比医生初次标注多检出的结节。进一步分析结果(表3)显示,基于DL的肺结节检测算法多检出的结节数量位置差异具有统计学意义(P均<0.05),右肺上叶多检出结节数量最多,为187个,右肺中叶数量最少,为47个。基于DL的肺结节检测算法多检出的结节中,0~4.0 mm 结节占比80.05%,4.1~30.0 mm 结节占比仅为19.95%,见表4。
在传统肺结节良恶性判定模型如贝叶斯推断[14]和逻辑回归[15]中,结节所在肺叶位置被认为是具有预言性的特征。就概率而言,肺实性结节所在肺叶位置与其活检病理结果具有一定相关性[12],相比其他位置,右肺中叶和右肺下叶实性肺结节类癌可能性更大,而右肺上叶实性肺结节则腺癌可能性更高。从频率上看,肺癌(包括鳞癌、小细胞癌和腺癌)主要出现在两肺上叶[16]。另有文献[17]报道,肺癌多发生于右肺,尤其是右肺上叶。
表1 基于DL的肺结节检测算法在不同肺叶检出结节与医生初次标注结节的匹配结果(个)
注:*:医师初次标注的结节中可与算法检出框相匹配的比例
图3 患者男,85岁,右肺上叶结节 图4 患者男,29岁,右肺中叶结节 图5 患者女,88岁,右肺下叶结节
表2 算法检出框审核结果
表3 基于DL的肺结节检测算法在不同位置多检出结节数量
表4 基于DL的肺结节检测算法多检出结节的大小分布
针对结节所在位置对于检出效果的影响,既往国内外相关研究较少,且大多集针对辐射剂量、重建算法等因素的影响。如文献[11]报道,低辐射剂量多层螺旋CT能够清晰显示肺中部与底部的正常生理结构,对检测肺内病灶不会产生消极影响。另有文献[10]指出,相比1.25 mm重建层厚,使用2.50 mm重建层厚胸部CT 并不会对检出结节及判断结节相关征象造成显著影响。作为对未来使用AI系统辅助肺结节筛查的可行性研究之一,本研究以结节所在位置作为影响因子,观察其是否对基于DL的医疗辅助诊断软件检出肺结节产生影响。由于4种筛查指南对肺结节的随访流程各有差异[3],但对4.0 mm以下的肺结节均不建议进行随访,故本研究仅统计0~4.0 mm与4.1~30.0 mm肺结节相关指标。
由表1可见,无论0~4.0 mm肺结节还是4.1~30.0 mm肺结节,基于DL的肺结节检测算法检出的结节与医师初次标注结节的匹配度在不同位置上均无明显差别,提示结节所在肺叶或叶间胸膜裂位置对于算法检出效果无明显影响。既往研究[9]表明,在大量且具有代表性的数据上进行训练后,基于DL的肺结节检测算法检测效果好,鲁棒性也强。本研究所使用的检测软件对不同位置肺结节也显示出了很好的鲁棒性。由表3可见,基于DL的肺结节检测算法比医师多检出的结节在肺叶位置分布上有所差异,而不同肺叶的体积不同,故此结果符合临床认知。结合表1结果,基于DL的肺结节检测算法对于不同肺叶结节均对医师标注结果具有补充作用。
审核结果显示,基于DL的肺结节检测算法结果未能与医师初次标注匹配的检出框中,747个判定为结节,其中0~4.0 mm肺结节占比达80.05%,提示基于DL的肺结节检测算法可辅助医生提高总体肺结节检出率,尤其对于0~4.0 mm小结节更加敏感。
本研究的主要局限性:①本研究中排除了基础病变与多发结节图像,而临床上此类图像较为常见,且部分基础病易干扰对于肺结节的判断;②尽管医生未检出和算法检出肺结节在左肺上叶与右肺中叶无明显差异,但此两处易受心脏搏动伪影干扰,有待未来开展更具针对性的研究;③缺乏与其他软件或检测算法针对相同数据的公平比对。
综上,本文验证了基于DL的肺结节检测算法对于不同肺叶位置结节具有较好的鲁棒性,算法使用流程中,可对肺叶位置这类风险因素施以较少关注。基于DL的肺结节检测算法可以作为医师诊断结果的补充。