石逸秋 沈雨雯 陈劼 闫婉莹 刘可夫
由于肺结节人工智能软件的普及,肺结节的检出率增 加,尤其是磨玻璃结节(ground glass nodules,GGNs),早期腺癌往往以GGNs为主要表现形式[1,2]。虽然有研究表示存在磨玻璃成分的肺结节术后生存率优于实性结节[3],但不同病理类型的预后也不尽相同,原位腺癌(adenocarcinomain situ,AIS)和微浸润腺癌(microinvasive adenocarcinoma,MIA)患者的5年无病生存率接近100%,而浸润性腺癌(invasive adenocarcinoma,IAC)患者仅有40%-85%[4]。此外,肺腺癌的病理类型决定了手术方式,相较于非典型瘤样增生(atypical adenomatous hyperplasia,AAH)+AIS、MIA而言,目前IAC推荐在切除肺叶后行淋巴结采样或清扫[5,6]。另外,根据2021年世界卫生组织(World Health Organization,WHO)最新胸部肿瘤分类标准[7],AAH、AIS已归为前驱腺体病变而非腺癌。因此,区分GGNs是否为AAH+AIS、MIA、IAC具有十分重要的临床意义。
由于人工智能软件在肺结节诊疗中的广泛使用,且具有高重复性的优点,有效地避免了人工测量误差以及主观观察不一致的问题,通过人工智能软件鉴别GGNs的病理类型具有临床实用价值。既往研究[8-12]中不少学者利用人工智能参数有效地对AAH+AIS与MIA+IAC以及AAH+AIS+MIA与IAC进行了二分类,关于结节AAH+AIS、M I A、I AC的三分类相关研究较少,本研究旨在通过回顾性分析患者术前胸部计算机断层扫描(computed tomography,CT)图像,探讨人工智能定量参数在鉴别诊断GGNs病理类型中的价值。
1.1研究对象 收集2019年1月至2023年5月南京医科大学附属苏州医院符合纳入标准的359例患者的389个GGNs,女性242例,男性117例,年龄19-80岁,平均年龄(52.33±12.49)岁,AAH+AIS 138例,MIA 109例,IAC 142例。纳入标准:(1)具有手术前2周以内胸部CT图像,图像质量良好,且具有1或1.25 mm薄层重建图像;(2)胸部CT图像上肺结节表现为GGNs,且结节最大径5-30 mm;(3)经过手术切除并经病理证实为AAH、AIS、MIA及IAC;(4)人工智能系统肺结节三维识别成功。
1.2检查方法 采用荷兰飞利浦Brilliance iCT或Ingenuity螺旋CT进行常规胸部扫描,患者取仰卧位,双手抱头,吸气末屏气,由肺尖扫描至肺底,管电压120 kV,自动管电流,层厚5 mm,层间隔5 mm,重建层厚1或1.25 mm。
1.3数据处理 由两位有丰富工作经验的放射科诊断医师共同评估主观CT影像学征象,人工测量横断面结节最大径,观察结节的位置及是否存在毛刺征、分叶征、空泡征、胸膜牵拉征、血管穿行征及支气管穿行征。将常规DICOM格式CT图像导入推想医疗科技股份有限公司肺结节CT影像辅助检测软件(InferRead CT Lung 4.0),自动勾画结节三维边界,并进行结节分析(图1),由该系统自动计算出结节大小相关参数(包括体积、表面积、3D最大面面积、质量、3D长径)、CT值相关定量参数(包括CT最大值、CT最小值、平均CT值、CT中位数、CT值标准差)、实性占比、紧凑度、球形度、峰度、偏度、能量及熵。
图1 肺结节CT影像辅助检测软件自动识别肺结节并勾画边界。A:AIS;B:MIA;C:IAC。Fig 1 CT imaging assisted detection software automatically recognized,outlined ground glass nodules.A: AIS;B: MIA;C: IAC.CT: computed tomography;AIS: adenocarcinoma in situ;MIA: microinvasive adenocarcinoma;IAC: invasive adenocarcinoma.
1.4统计学分析 应用SPSS 27.0软件进行统计学分析。符合正态分布的计量资料采用Mean±SD描述,组间比较采用独立样本t检验或单因素方差分析;不符合正态分布的计量资料采用中位数(P25,P75)描述,组间比较采用非参数检验;计数资料采用频数(百分比)描述,组间比较采用卡方检验分析。P<0.05为差异有统计学意义。使用受试者工作特征(reciever operating characteristic,ROC)曲线对计量资料进行统计学分析。采用多因素Logistic逐步回归分别建立主观CT影像学征象模型、人工智能参数模型以及两者结合的联合模型。
2.1AAH+AIS组、MIA组、IAC组主观CT影像学征象资料的比较 AAH+AIS组、MIA组、IAC组的结节最大径逐渐增大;毛刺征、分叶征、胸膜牵拉征在AAH+AIS组、MIA组、IAC组出现的频率依次增加;在结节位置上,AAH+AIS组、MIA组及IAC组三组差异无统计学意义(表1)。通过ROC曲线分析,AAH+AIS与MIA、MIA与IAC的结节最大径最佳临界值分别为7.50、12.50 mm。
表1 AAH+AIS组、MIA组、IAC组主观CT影像学征象资料比较Tab 1 Comparison of subjective CT imaging signs among AAH+AIS,MIA and IAC
2.2AAH+AIS组、MIA组、IAC组人工智能定量资料的比较 AAH+AIS组、MIA组及IAC组在结节大小相关参数(体积、表面积、3D最大面面积、质量、3D长径)、CT相关定量参数(CT最大值、CT最小值、平均CT值、CT中位数、CT值标准差)、实性占比、能量和熵中依次增大,在紧凑度、球形度中依次减小;在峰度、偏度中,AAH+AIS组、MIA组大于IAC组(表2)。通过ROC曲线分析,在区分AAH+AIS与MIA时,体积、表面积、3D最大面面积、质量、3D长径、CT最大值、CT最小值、平均CT值、CT中位数、CT值标准差、实性占比、紧凑度、球形度、峰度、偏度、能量及熵的曲线下面积(area under the curve,AUC)分别为0.64、0.64、0.63、0.69、0.65、0.64、0.63、0.65、0.64、0.62、0.61、0.58、0.58、0.55、0.56、0.59及0.65,质量分类效能最佳,峰度分类效能最差,平均CT值分类效能优于其他CT值相关定量参数;在区分MIA与IAC时,体积、表面积、3D最大面面积、质量、3D长径、CT最大值、CT最小值、平均CT值、CT中位数、CT值标准差、实性占比、紧凑度、球形度、峰度、偏度、能量及熵的AUC分别为0.63、0.64、0.64、0.66、0.65、0.63、0.66、0.69、0.67、0.69、0.68、0.67、0.66、0.74、0.71、0.57及0.69,峰度分类效能最佳,平均CT值、CT值标准差分类效能优于其他CT值相关定量参数(图2)。
表2 AAH+AIS组、MIA组、IAC组人工智能定量资料比较Tab 2 Comparison of AI quantitative parameters among AAH+AIS,MIA and IAC
图2 人工智能定量参数区分磨玻璃结节病理类型的ROC曲线。A-C:区分AAH+AIS与MIA的ROC曲线;D-F:区分MIA与IAC的ROC曲线。Fig 2 ROC curve of artificial intelligence quantitative parameters to classify pathological types of ground glass nodules.A-C: ROC curve to classify AAH+AIS and MIA;D-F: ROC curve parameters to classify MIA and IAC.ROC: receiver operating characteristic;AUC: area under the curve;AAH:atypical adenomatous hyperplasia;SD: standard deviation.
2.3Logistic逐步回归分析建立AAH+AIS组、MIA组、IAC组分类模型 AAH+AIS组、MIA组及IAC组三分类模型:主观CT影像学征象模型中,结节最大径、毛刺征、分叶征、胸膜牵拉征为参数,准确度为51.67%。人工智能定量参数模型中,3D长径、平均CT值、峰度为参数,准确度为56.56%。主观CT影像学征象、人工智能定量参数的联合模型中,3D长径、平均CT值、峰度为参数,而所有传统影像学参数均未进入模型,联合模型与人工智能定量参数模型为同一模型,准确度为56.56%(表3)。
表3 主观CT影像学征象、人工智能定量参数及其联合预测AAH+AIS、MIA、IAC的多元Logistic回归模型结果Tab 3 Results of multiple Logistic regression models of subjective CT imaging signs,artificial intelligence quantitative parameters and combined parameters to predict AAH+AIS,MIA and IAC
AAH+AIS组、MIA+IAC组二分类模型:主观CT影像学征象模型中,结节最大径、毛刺征、胸膜牵拉征为参数,准确度为69.92%。人工智能定量参数模型中,3D长径、平均CT值为参数,准确度为73.52%。主观CT影像学征象、人工智能定量参数的联合模型中,胸膜牵拉征、3D长径、平均CT值为参数,准确度为72.75%(表4)。
表4 主观CT影像学征象、人工智能定量参数及其联合参数预测AAH+AIS vs MIA+IAC、AAH+AIS+MIA vs IAC的二元Logistic回归模型结果Tab 4 Results of binary Logistic regression models of subjective CT imaging signs,artificial intelligence quantitative parameters and combined parameters to predict AAH+AIS vs MIA+IAC and AAH+AIS+MIA vs IAC
AAH+AIS+MIA组、IAC组二分类模型:主观CT影像学征象模型中,结节最大径、毛刺征、分叶征、胸膜牵拉征为参数,准确度为73.52%。人工智能定量参数模型中,结节表面积、平均CT值、峰度、偏度为参数,准确度为75.84%。主观CT影像学征象、人工智能定量参数的联合模型与人工智能定量参数模型为同一模型,准确度为75.84%(表4)。
肺腺癌是早期肺癌最常见的病理类型,且以GGNs为主要表现形式。在2021年WHO最新胸部肿瘤分类标准中,AAH、AIS不再纳入肺癌分类,且非IAC与IAC手术方式存在差异,区分GGNs的病理类型对于临床诊疗中具有重要意义。近年来,人工智能发展迅速,在肺结节诊疗过程中发挥越来越大的作用,人工智能软件在识别肺结节的同时可以自动获取结节的定量资料,对术前预测肺结节的病理类型具有一定的价值。
肿瘤的最大直径是肿瘤病理侵袭性的重要危险因素,肿瘤的最大径与其侵袭性呈正相关。随着GGNs病理级别的增加,由于肿瘤组织成分增多,肺泡间隔增厚,病变累及的范围增大,结节的长径也随之增加。既往研究[8,13,14]中,GGNs的最大径对于AAH+AIS与MIA+IAC、非IAC与IAC二分类具有鉴别意义。本研究中GGNs最大径从AAH+AIS、MIA至IAC依次增大。Fang等[15]研究中AAH+AIS与MIA、MIA与IAC结节最大径最佳临界值为8.98、10.33 mm,而本研究中最佳临界值分别为7.50、12.50 mm,二者略有不同,这可能是人工测量的差异引起的;此外,与结节大小相关的定量参数(体积、表面积、3D最大面面积、质量、3D长径)在区分三分类中同样具有统计学意义,且从AAH+AIS、MIA至IAC逐渐增加。
CT值作为GGNs侵袭性的另一重要因素,由于肺结节的平均CT值与肿瘤细胞侵袭正常肺组织引起的肌成纤维细胞基质增厚程度相关,侵袭性越大,平均CT值越高。既往研究[11,12]中发现平均CT值能够有效预测肺腺癌的病理类型。本研究中CT值相关定量参数(最大值、最小值、平均值、中位数、标准差)随病理级别的增加而逐渐增大,此外,通过ROC曲线分析发现平均CT值对于分类AAH+AIS与MIA、MIA与IAC的AUC(0.65,0.69)高于其他CT值相关定量参数,更能有效地鉴别GGNs的病理类型。
毛刺征、分叶征、空泡征、胸膜牵拉征、血管穿行征及支气管穿行征均为提示肺结节恶性的影像学征象,结节恶性程度越高,其出现的概率越大[16,17]。本研究进一步发现毛刺征、分叶征、胸膜牵拉征在AAH+AIS、MIA、IAC中出现的频率随病理级别的增高而逐渐增加,而空泡征、血管穿行征、支气管穿行征并没有该表现。既往研究[9,10,18,19]中也有发现空泡征、血管穿行征、支气管穿行征在鉴别GGNs病理类型中无统计学意义,空泡征、血管穿行征、支气管穿行征是否能够鉴别GGNs病理类型存在争议,仍需要进一步验证。
紧凑度与球形度衡量了结节形态,本研究中在AAH+AIS、MIA、IAC中逐渐减小,提示随着病理级别的增高,结节将不再近似于球体,形态越不规则。峰度、偏度分别代表结节中CT值的波动范围以及不对称性,即为反映结节密度均匀程度的参数。既往研究中[12,20-24]峰度、偏度对GGNs病理类型具有预测价值。本研究中峰度、偏度在三组间存在差异,但在AAH+AIS、MIA组间不存在统计学差异,则表示AAH+AIS、MIA在CT值分布中存在较大相似性。熵衡量了图像纹理的复杂程度,病理级别越高,浸润成分越多,结节的纹理则表现得越复杂,熵值也就越大。Gao等[23]研究中熵是分类AIS+MIA、IAC的重要指标,本研究中熵从AAH+AIS、MIA至IAC递增。能量值衡量了图像中体素值的大小,本研究中发现病理级别越高,能量值越大,但在鉴别AAH+AIS与MIA、MIA与IAC的AUC(0.59,0.57)较小,提示能量在预测GGNs病理类型方面可靠性可能不高,需要进一步加大样本量进行验证其诊断价值。
通过Logistic逐步回归分析发现,人工智能定量参数模型在GGNs三分类以及二分类的准确度上不亚于主观CT影像学征象模型,联合模型也并未明显提高分类的准确度;且在联合模型中,AAH+AIS、MIA、IAC三分类模型中并未纳入主观CT影像学征象,AAH+AIS、MIA+IAC二分类的联合模型中虽纳入了胸膜牵拉征参数,但并没有提高模型准确度,这表明人工智能定量参数对于GGNs病理类型的鉴别能力不亚于主观CT影像学征象,更有利于肺结节的临床自动化诊疗。此外,AAH+AIS、MIA、IAC三分类的主观CT影像学征象模型、人工智能定量参数模型及其联合模型中,MIA的阳性预测值极低,约90%的MIA被误认为是AAH+AIS及IAC,这可能是由于MIA是AAH+AIS发展为IAC的中间阶段,与AAH+AIS有一定的相似性,并存在进展为IAC的可能性。但本研究中多元Logistic逐步回归三分类模型相较于二分类模型的准确度不高,这可能需要通过影像组学、深度学习模型等进一步提取结节特征来进行分类。
本研究存在一定的局限性。首先,本研究属于回顾性研究,样本数据来源于单中心,样本可能存在偏倚;其次,三组样本量不均衡,临床实际中术后病理证实为AAH的GGNs样本量偏少。
综上所述,GGNs的人工智能定量参数在一定程度上能够区分GGNs的病理类型,能方便地为临床开展精准化以及个性化治疗提供参考依据。
Competing interests
The authors declare that they have no competing interests.
Author contributions
Shi YQ and Liu KF conceived and designed the study.Shi YQ,Shen YW and Yan WY collected patient data.Shi YQ,Shen YW and Chen J supported the statistical analysis.Shi YQ and Liu KF provided critical inputs on design,analysis,and interpretation of the study.All the authors had access to the data.All authors read and approved the final manuscript as submitted.