张 彬,路成文(通信作者),徐婧雯,仲莉玮,陈宪令
(1 龙口市人民医院放射科 山东 烟台 265700)(2 波士顿大学 美国马萨诸塞州 波士顿 02134)
随着高分辨率CT 临床大量应用,肺磨玻璃结节(ground-glass nodule,GGN)被大量发现。人工智能(artificial intelligence,AI)不但能筛出GGN,而且能定量分析、评估恶性程度,但对其测量的各种参数与病理类型间的关系尚未明确定论。既往研究指出,结节大小、密度、实性成分等因素与病理类型间密切相关[1-3]。本研究旨在探讨AI 对GGN 定量分析与病理类型相关性。
选取2017年5月—2022年3月龙口市人民医院和青岛大学附属医院行胸部CT 检查后接受手术治疗的GGN 患者152 例,其中男48 例,女104 例,平均年龄(55.5±9.6)岁。纳入标准:①结节直径≤3 cm;②CT 图像层厚≤1 mm。先根据病理结果将GGN 患者分为四组:不典型腺瘤样增生(atypical adenomatous hyperplasia,AAH) 组、 原位癌(adenocarcinoma in situ,AIS) 组、 微浸润性腺癌(microinvasive adenocarcinoma,MIA)组及浸润性腺癌(invasive adenocarcinoma,IAC)组。再根据临床治疗策略分成腺体前驱病变组(AAH+AIS)及腺癌组(MIA+IAC)两组。
扫描参数:GE LightSpeed VCT 采用管电压140 kV、管电流260 mA,GE Revolution 采用管电压120 kV,管电流50 ~450 mA,GE 660 采用管电压120 kV,管电流50~450 mA,Siemens Somatom Definition Flash 采用管电压120 kV、参考管电流267 mA,后三者均使用自动管电流技术。采用标准算法,重建层厚≤1mm。图像传入商汤科技的CT 影像辅助诊断系统V1.0,得到结节最大直径、体积、最大密度、最小密度、平均密度及恶性概率。
采用R 语言统计软件进行数据分析。AI 测量CT参数以均数±标准差(±s)表示,行Kruskal-Wallis rank sum test 检验,以P<0.05 为差异有统计学意义。再对腺体前驱病变组及腺癌组使用受试者操作特征曲线(receiver operating characteristic,ROC 曲线)分析方法确立二者之间的最佳截断值。
152 例患者,男性48 例,女性104 例,平均年龄(55.5±9.6)岁,其中125 例患者为切除单一磨玻璃结节,21 例患者切除两个磨玻璃结节,5 例患者切除三个磨玻璃结节,1 例患者切除五个磨玻璃结节。10 个AAH,36个AIS,48 个MIA 及93 个IAC,见表1。
表1 不同病理类型间GGN 临床信息
四组之间GGN 最大径比较,差异有统计学意义(P<0.05),四组之间两两比较,AAH、AIS、MIA 三组间病灶最大径之间差异无统计学意义(P>0.05),IAC 组与其他三组之间差异有统计学意义(P<0.05),见表2。分析腺体前驱病变组及腺癌组最大径ROC 曲线得出:最佳截断值是9.255 mm,其中灵敏度和特异度分别为68.8%、71.7%,见表3、图1。
图1 腺体前驱病变组及腺癌组各定量测量数据ROC 曲线
表2 不同病理类型间GGN 的AI 量化参数(±s)
表2 不同病理类型间GGN 的AI 量化参数(±s)
注:与其他组比较,①P<0.05。GGN,肺磨玻璃结节;AI,人工智能;AAH,典型腺瘤样增生;AIS,原位癌;MIA,微浸润性腺癌;IAC,浸润性腺癌。
AAHAISMIAIACP最大径/mm6.85±2.169.01±3.978.29±3.4312.62±4.69*<0.05体积/mm3162.41±119.09525.82±873.61369.49±361.84959.89±1014.48①<0.05最大密度/HU-378.40±151.76-360.31±169.11-318.18±217.67-119.72±180.83①<0.05最小密度-808.70±98.38-820.56±96.66-808.93±94.61-835.28±80.860.384平均密度/HU-651.70±68.24-645.76±79.70-629.40±103.17-526.36±167.58①<0.05恶性概率/%57±2269±2270±2385±12①<0.05
表3 腺体前驱病变组与腺癌组ROC 曲线分析
四组之间体积比较,差异有统计学意义(P<0.05);四组之间两两比较,AAH、AIS、MIA 三组间病灶体积之间比较,差异无统计学意义(P>0.05),IAC 组与其他三组之间差异有统计学意义(P<0.05),见表2。分析腺体前驱病变组及腺癌组两不同临床治疗策略组的体积ROC 曲线得出:最佳截断值是348.350 mm3,其中灵敏度和特异度分别为68.1%、71.7%,见表3、图1。
四组之间最大密度比较,差异有统计学意义(P<0.05),四组之间两两比较,AAH、AIS、MIA 三组间病灶最大密度之间比较,差异无统计学意义(P>0.05),IAC 组与其他三组之间差异有统计学意义(P<0.05),见表2。分析腺体前驱病变组及腺癌组两不同临床治疗策略组的最大密度ROC 曲线得出:最佳截断值是-259.500 HU,其中灵敏度和特异度分别为68.1%、78.3%,见表3、图1。
四组之间平均密度比较,差异有统计学意义(P<0.05),AAH、AIS、MIA 三组间病灶平均密度之间比较,差异无统计学意义(P>0.05),IAC 组与其他三组之间比较,差异有统计学意义(P<0.05),见表2。分析腺体前驱病变组及腺癌组两不同临床治疗策略组的平均密度ROC 曲线得出:最佳截断值是-588.000 HU,其中灵敏度和特异度分别为53.9%、89.1%,见表3、图1。
四组之间恶性概率差异有统计学意义(P<0.05),AAH、AIS、MIA 三组病灶恶性概率之间比较,差异无统计学意义(P>0.05),IAC 组与其他三组之间差异有统计学意义(P<0.05),见表2。分析腺体前驱病变组及腺癌组两不同临床治疗策略组的恶性概率ROC 曲线得出:最佳截断值是79.5%,其中灵敏度和特异度分别为64.5%、67.4%,见表3、图1。
目前,很多关于GGN 的研究主要集中在形态学特征和密度方面[4-7]。因较小的GGN 形态学特征并不显著,定量测量可重复性差,定性诊断更困难。本研究采用AI测量结节大小、密度及恶性概率定量参数,因此很好地避免人工阅片可重复性差的缺点。
结节大小是评估GGN 良恶性及浸润性的一项重要指标[8]。本研究结果显示:病灶的最大径、病灶体积在IAC 组与其他三组之间的差异有统计学意义,而在AAH、AIS、MIA 三组间的差异无统计学意义,这与既往研究[9-11]相似。本研究结果还显示:腺体前驱病变和腺癌的最大径的最佳截断值是9.255 mm,AUC 为0.686;腺体前驱病变和腺癌的体积的最佳截断值是348.350 mm3,AUC 为0.685,这与蔡雅倩等[12]的研究结果相似。
影像学成像的密度差异的病理机制可能是GGN 内细胞沿着肺泡间隔生长,导致肺泡腔内气体减少,或由于肺泡塌陷、纤维化等因素导致[13]。本研究中,各组之间在最大密度和平均密度差异有统计学意义;腺体前驱病变和腺癌平均密度的最佳截断值是-588.000 HU,AUC为0.704,灵敏度和特异度分别为53.9%、89.1%,这与既往研究[12,14]结果相似。国内外研究[15-16]认为,肿瘤实性成分越多,GGN 越倾向于恶性。这也较好地解释了为什么磨玻璃结节的最大密度在不同病理类型之间的差异是有统计学意义的。本研究中,各种GGN 的最小密度比较,差异无统计学意义,与既往研究[9,12,17]结果相似。之所以最小密度差异无统计学意义,可能是因为肿瘤组织沿肺泡壁生长,受其内支气管影、未填充肺泡组织以及AI 勾画感兴趣区准确率等因素影响太大。
既往关于AI 评估磨玻璃结节的恶性概率的研究较小、结果也不尽相同。熊静娴等[18]认为,GGN 恶性风险是否随着AI 评估风险增高而递增暂不明确。蔡雅倩等[12]指出当恶性概率大于80%时,提示GGN 恶性的可能性较大。这与本研究结果是一致的。
综上所述,AI 辅助诊断系统定量测量肺结节参数与病理类型间有相关性,可以一定程度上帮助判断肺结节性质,有助于判断外科治疗的最佳时间点。