卓越,刘敬禹,李甜,吴久纯
(锦州医科大学附属第三医院呼吸科,辽宁 锦州 121000)
近年来随着影像技术的发展及人们健康意识的增强,肺结节的检出率逐年增高,有研究指出[1]肺部恶性肿瘤、结核、转移瘤、炎性假瘤、错构瘤、结节病等多种疾病均可导致肺结节发生。据统计,在我国肺癌的发病率及死亡率高居首位[2],早期肺癌常常表现为孤立性肺结节,不同性质的肺结节转归大不相同,2021年WHO肺肿瘤指南[3]将及原位癌及非典型腺瘤样增生定义为前驱腺体病变,如果可以在肺癌早期阶段进行准确的诊断和相应处理,对疾病控制及预后具有重要意义[4],目前在临床上对于肺结节良恶性鉴别尚且没有特异性方法,因此如何判断肺结节的性质仍然是研究的热点和难点。
近年,AI兴起并广泛应用于医疗的各个领域,促使精准医学快速发展[5]。人工智能辅助诊断系统可以极大提高就诊效率,明显缩短患者就诊时间。既往研究指出人工智能辅助诊断系统对肺结节检出具备良好效能,可以明显减少肺结节漏诊率[6-7],但普遍存在高假阳性率的问题,存在一定的误诊率。本文旨在《2021版肺肿瘤指南》基础性上探讨人工智能辅助诊断系统对肺结节定性诊断的效能及恶性结节AI相关变量的危险因素。
选择在2019年7月至2021年5月期间于锦州医科大学附属第三医院诊断为肺结节,且其结节病理性质明确的100名患者作为研究对象。纳入其中112个肺结节(同一位患者不同位置的肺结节视为独立事件)作为研究标本。所有患者均知情并签署同意书,且通过医院伦理委员会批准、备案。纳入标准:(1)符合肺结节诊断标准;(2)有完整的影像学资料;(3)所有肺结节均有明确病理诊断。排除标准:(1)直径≥3 cm的肺结节;(2)伴有肺不张、肺门肿大及胸腔积液;(3)其他部位恶性肿瘤所致转移瘤;(4)患者资料信息不完整。研究对象共计100人,其中男性39人(39.0%)、女性61人(61.0%),平均年龄为(58.93±10.16)岁;被选取的肺结节标本中,良性结节为35个(31.2%)、恶性结节为77个(68.8%)。
1.2.1 影像数据的采集
采用东芝128层CT系统行常规胸部 CT扫描,扫描范围从肺尖至后肋膈角,扫描参数为:管电压120 kV,管电流≤40 mA,平扫层厚:5 mm,重建后层厚:1 mm,肺窗参数设置为:窗宽1500 HU,窗位-600 HU;纵隔窗参数设置为:窗宽350 HU,窗位50 HU。
1.2.2 AI肺结节检测
将扫描后的胸部CT影像导入推想科技的AI辅助诊断系统中,该系统可以显示出患者的性别、年龄、肺结节所在位置(具体到肺叶、肺段)、平均直径(在病灶最大层面,测量病灶最长径及垂直径的长度,平均直径为二者平均值)、平均CT值(选择病灶的最大层面感兴趣区CT值,并尽量避开血管等成分)、类型(实性结节或亚实性结节)、恶性征象(空泡征、分叶、毛刺等)、恶性概率(恶性概率≥70%提示为高危结节,恶性概率<70%提示为为中低危结节;其中高危的肺结节提示为恶性,中低危的肺结节提示为良性)、实性占比(实性成分占有的百分比)、肺结节倍增时间(肿瘤体积或细胞数增加一倍的时间)等[8]。
1.2.3 病理检查
将取得的112个肺结节标本进行特殊处理,其病理结果由2名主治医师(从事临床工作5年以上)或更高级职称的病理科医师最终确定。根据《2021年WHO肺肿瘤指南》所述,由于非典型腺瘤样增生及原位癌已定义为腺上皮癌前病变,不再属于肺腺癌,因此本研究将非典型腺瘤样增生、原位癌、炎症、结核球、炭末沉积、硬化性肺细胞瘤、淋巴结视为良性结节,其余均视为恶性结节。
采用SPSS 22.0统计软件对数据整理、分析。金标准为病理诊断结果,采用Kappa一致性检验评价AI对肺结节定性诊断与病理结果的一致性,其中K≤0.4被认为一致性较差,0.4
在112个肺结节标本中,经病理检查证实良性肺结节共计35个,AI辅助诊断为中低危结节29个、高危结节6个;恶性肺结节共计77个,AI辅助诊断为良性结节3个、恶性结节74个。经Kappa一致性检验得出K=0.809,AI辅助诊断鉴别肺结节性质与病理检查结果的一致性良好(P<0.05),见表1。
表1 AI辅助诊断结果与病理结果一致性检验(n)
将AI辅助诊断对恶性结节检测到的所有相关变量进行单因素Logistic回归分析,结果显示:年龄、体积、平均直径、恶性征象、恶性概率等5个相关因素,差异有统计学意义(P<0.05),而性别、随访次数、平均CT值、结节类型、倍增时间等因素,差异无统计学意义(P>0.05),见表2。
表2 恶性结节AI相关变量的单因素Logistic回归分析
对单因素回归分析中P<0.05的5个相关因素进行多因素Logistic回归分析,结果显示恶性概率(P<0.05)为影响恶性结节诊断的独立危险因素,即恶性概率为高危则提示肺结节恶性的可能性越大,见表3。
表3 恶性结节AI辅助诊断相关变量的多因素Logistic回归分析
将多因素回归分析中的恶性概率进行ROC曲线绘制,恶性概率差异有统计学意义(P<0.05),结果显示恶性概率AUC曲线下面积为0.874。提示基于AI辅助诊断恶性概率对恶性结节诊断可能具有良好的准确性,见图1。
图1 基于AI辅助诊断恶性概率对恶性结节诊断的ROC曲线
近年来,我国肺癌的发展趋于年轻化,早期肺癌在影像学上常表现为肺结节。由于在疾病早期的患者常无不适感,当出现临床症状时,部分患者已经失去了最佳治疗的机会,因此早诊、早治才是提高早期肺癌患者生存的关键[9-10]。2015年WHO肺腺癌分类标准将非典型腺瘤样增生、原位癌归类于肺腺癌[11],发现后需要手术干预。术后部分患者的肺功能有所减弱、活动耐量欠佳、生活质量明显降低。而最新的2021年肺肿瘤指南提出非典型腺瘤样增生、原位癌为良性病变[3]1725-1757,病理结果为非典型腺瘤样增生及原位癌的肺结节需要定期随访观察其生长情况,必要时可进行手术干预。AI辅助诊断利用和学习卷积神经网络,通过一般的计算机程序实现的人类智能化技术,应用目前已逐渐地应用到医学等专各个领域[12]。有关研究表明[13],AI检测软件对肺结节的检出能力等同于甚至优于有数年临床经验的医学影像科医生,灵敏度极高,减少了医学影像科医师的工作量,提高了传统计算机辅助诊断系统的稳定性,解决了人工制定规则的不全面性,精准的对肺结节进行同质化的诊断及制定科学有效的随访管理。
本文结合患者的临床病理诊断结果和肺结节相关的AI辅助诊断影像学资料,比较AI辅助诊断与病理结果的一致性,研究所应用的AI辅助诊断系统以全国多家知名三级甲等医院提供的大数据为根基,以有明确病理结果的肺结节数据集为金标准进行训练,从而判断出肺结节的恶性概率。经验证AI辅助诊断对肺结节定性诊断与病理结果一致性良好,K=0.809,说明AI辅助诊断对肺结节的定性诊断可能具有良好的价值,与张治佳等人[14-16]研究结果一致。江苏大学附属医院的一项研究[17],也证明了AI对肺结节诊断能力较强,在辅助临床医师对肺癌早期结节诊断方面是有意义的。
本研究进行恶性结节AI相关变量的单因素及多因素Logistic回归分析时发现恶性概率是影响恶性结节诊断的独立危险因素,即AI辅助诊断系统提示为高危结节的,肺结节恶性风险越高;提示为中危或低危结节的,肺结节恶性风险相对较低,需要长时间的随访观察,与文献报道结果一致[15,18]58-60。此外,一些研究提示肺癌发病的风险与年龄、性别、恶性征象等具有显著相关性,同时结节大小、密度、体积和倍增时间均有助于肺结节的危险分层。本研究多因素Logistic回归分析提示恶性结节在性别、年龄、随访次数、平均CT值、体积、平均直径、结节类型、倍增时间、恶性征象中无显著差异,与文献结果不符[19-20],考虑与以下因素有关:(1)有一部分肺结节即使出现分叶、毛刺等恶性征象,但最终的病理结果证实确为良性病变,考虑导致AI辅助诊断系统做出错误的判断的因素如下:①某些肺结节与胸膜相贴较广、与叶间裂联系较大;②部分肺脏血管分叉、聚集、迂曲;③各级支气管走形、增厚的细支气管壁、增厚的小叶间隔、纤维条索及淋巴结等结构复杂,且个体间差异较大,使肺结节表现的形态多样;(2)本研究纳入的结节标本由于来源有局限性,且病例数、人群不同、年龄构成不同、参考的诊断标准不同(最新版肺肿瘤指南2021版)、纳入与排除标准不同可能会导致结果出现偏倚。
ROC曲线提示:AI辅助诊断对恶性概率为高危的,诊断恶性结节的灵敏度为94.8%,特异度为80%。AI辅助诊断对肺结节恶性概率为高危时,诊断恶性结节的灵敏度和特异度均很高,提示对恶性结节诊断可能具有一定的准确性,与周诚[21]等人的研究结果保持一致。虽然本研究中年龄、平均直径、体积、恶性征象(分叶、毛刺、不规则、胸膜凹陷)在多因素Logistic回归分析中不能作为肺结节良恶性鉴别的独立危险因素,但是在单因素分析中差异显著,或许也可以为临床初步鉴别诊断提供重要参考价值。
本研究的局限性:(1)本文回顾性分析有明确病理结果的肺结节标本,纳入研究的病例较为局限并且总数量较少,对结果可能会产生一定的影响,需要扩大样本量、纳入更多的研究因素,更深入探讨AI辅助诊断对肺结节诊断效能;(2)本研究没有纳入无病理结果的肺结节标本,在病例选择方面也会有一定的偏倚;(3)目前AI辅助诊断上市时间较短,现缺乏大量肺结节病例的手术资料、病理结果、基因检测等大数据,对于恶性程度分级、分层仍有欠缺。
综上所述,通过AI辅助诊断无创检测可以对肺结节做出定性诊断,在肺结节的早期诊断中人工智能辅助诊断系统对临床医师工作具有重要指导意义。AI辅助诊断系统还应继续完善,希望AI辅助诊断系统在医疗领域中的技术水平快速发展,精准助力于临床工作。
利益声明:该研究无影响其科学性与可信度的经济利益冲突。