AI对肺磨玻璃结节筛查及定性的临床应用研究

2019-09-25 01:51蔡雅倩张正华韩丹黄建强李浚利金文凤
放射学实践 2019年9期
关键词:阅片长径恶性

蔡雅倩, 张正华, 韩丹, 黄建强, 李浚利, 金文凤

肺癌的发病率、病死率已位居我国恶性肿瘤第一位,早期诊断和治疗可明显提高患者生存质量,延长生存期。随着高分辨率CT (high resolution CT,HRCT)在肺癌早期筛查中的普及,图像数量倍增、小结节显示率提高及定量测量使阅片工作量显著增加,高强度工作致影像科医生易产生视觉疲劳,加之经验不足等,不可避免导致小结节的漏诊率增高,特别是磨玻璃结节(ground glass nodule,GGN),密度浅淡,漏诊率更高。以往研究表明持续存在的GGN可能提示癌前病变、微浸润性或浸润性肿瘤的可能[1],因此在大量图像资料中准确筛查出GGN并早期定性,已成为临床迫切需求。基于深度学习的人工智能(artificial intelligence,AI)凭借其准确的算法模型,不仅能在短时间内检出GGN,而且能对其进行定性分析,预判其良恶性,已在临床广泛试用,但对其准确性目前尚无明确定论。本研究旨在探讨AI对GGN筛检和定性诊断的临床应用价值。

材料与方法

1.研究对象

搜集2018年12月-2019年6月间行胸部CT平扫的200例患者。病例纳入标准:①结节直径≤3 cm;②CT图像层厚为1 mm。病例排除标准:①肺部弥漫性病变;②图像有严重伪影。137例GGNs患者经手术病理证实,其中良性54例,恶性83例。54例良性病变患者中,男25例,女29例,平均年龄(52.24±8.47)岁,包括不典型腺瘤样增生6例,肺泡间隔纤维化12例,结核11例,炭末沉积6例,炎症19例;83例恶性病变患者中,男30例,女53例,平均年龄(54.64±8.45)岁,包括浸润性腺癌44例,微浸润性腺癌29例,原位癌10例。

2.CT扫描方法

采用Siemens Somatom Definition AS 128层螺旋CT机、Siemens Somatom Definition Flash及联影UCT 760行胸部HRCT平扫。Siemens Somatom Definition AS 128层螺旋CT机及Siemens Somatom Definition Flash扫描参数:管电压100 kV,管电流80 mAs,CarekV semi,自动管电流调制,螺距0.938,重建卷积函数采用B70f。联影UCT 760扫描参数:管电压100 kV,管电流80 mAs,自动管电流调制,螺距0.938,肺窗滤波函数B-SHARP-C。重建层厚1 mm,层间距1 mm。扫描范围从肺尖至肺底全部区域,两侧包括胸壁、腋窝。采用肺窗进行图像分析(窗宽1500 HU,窗位-400 HU)。

3.图像分析处理

由两位从事胸部影像诊断的高年资医师对200例患者的胸部CT图像同时进行阅片分析,定量结节个数,两者意见不一致时,讨论后达成统一意见。根据阅片方式不同将200例患者分成3组:A组由住院医师单独阅片,B组由AI(医学影像辅助诊断软件Dr.Wise Lung Analyzer,版本:V1.1.0.1,型号:MIDS-PNA)单独阅片,C组由住院医师结合AI综合阅片。记录每组的阅片时间及结节检出数,并以两位高年资医师的诊断结果为标准,分别计算A、B、C三组的误诊率、漏诊率、敏感度、阳性预测值,误诊率=误诊数/检出数×100%,漏诊率=漏诊数/结节总数×100%,敏感度=诊断正确数/结节总数×100%,阳性预测值=诊断正确数/检出数×100%。

将经手术病理证实的137例患者的肺窗薄层图像调入进行AI分析(图1),得到相关量化参数:结节长径、短径、最大面积、体积、平均CT值、最大CT值、最小值CT值及恶性概率。长径和短径分别为结节在三维空间内的最长径和最短径。恶性概率为AI基于计算机深度学习分析肺结节特征后得出结节为恶性的概率。

4.统计学分析

采用SPSS21.0软件包进行统计学分析。采用χ2检验和t检验比较A、B、C三组间肺GGN检出效能的敏感度、误诊率、阳性预测值和平均诊断时间;比较GGN良、恶性组间一般临床资料和AI量化参数的差异,采用受试者工作特征(receiver operator characteristic,ROC)曲线分析其诊断效能,并采用Logistic回归分析其恶变的独立危险因素。以P<0.05为差异有统计学意义。

结 果

1.肺GGN检出情况比较

由两位从事胸部影像诊断的高年资医师对200例患者的胸部CT图像进行分析,确认有1230个结节。A组检出854个结节,误诊52个,漏诊428个; B组检出1476个结节,误诊320个,漏诊74 个;C组检出1476个结节,误诊63个,漏诊49个。三组的平均诊断时间见表1,两两比较差异均有统计学意义(P值均<0.05)。统计学分析结果显示B组误诊率高于A、C组,阳性预测值小于A、C组;A组漏诊率高于B、C组,敏感度低于B、C组,差异均有统计学意义(P值均<0.05,表1)。

图1AI自动筛选肺结节并对其进行定量分析,计算机自动测量其长径、短径、最大面积、平均CT值、最大CT值、最小CT值,并对其进行准确定位。a) AI对肺内结节进行筛检、勾画结节轮廓并标注序号; b) AI直接显示肺结节的各参数。

图2GGN各量化参数的ROC曲线。

表1 三种阅片方式肺结节检出情况比较

注:*表示与其它组比较,差异具有统计学意义(P<0.05)。

2.良恶性肺GGN患者的一般临床特征及AI定量参数比较

GGN良、恶性患者组间年龄、性别、短径、最小CT值差异均无统计学意义(P值均>0.05),长径、最大面积、体积、平均CT值、最大CT值及恶性概率差异均有统计学意义(P值均<0.05,表2)。

3.诊断效能分析

表2 GGN良恶性组间临床特征及AI量化参数比较

对良、恶性组间有统计学差异的各个参数进行ROC曲线分析(图2),以曲线下面积(area under curve,AUC)大于0.7的参数为自变量,以病理结果良恶性为因变量,进行二元Logistic回归分析,结果显示长径[优势比(odds ratio,OR)=4.232,P<0.001]和最大面积(OR=0.896,P=0.008)是GGN恶变的独立危险因素。

表3 GGN良、恶性组的ROC曲线分析

讨 论

肺癌是我国最常见的恶性肿瘤,病死率高,但研究表明IA期肺癌患者中,原位癌和微浸润性癌术后五年生存率可接近100%[2,3],因此肺癌的早期发现、早期诊断及治疗显得尤为重要。早期筛查已成为肺癌防治的重要手段,其中HRCT是国际公认的有效手段。肺结节筛查图像诊断较为简单,但随着人们健康体检意识不断加强,胸部HRCT筛查人群日益增多,图像数量倍增,影像医师的工作压力也日趋增大,漏诊、误诊的风险不断增加。AI的出现不仅降低了早期肺癌的漏诊率,也在一定程度上解放了影像科医生的双眼,使其可将有限的精力用于更高难度的工作中。AI是现阶段各行各业研究的热点,目前已广泛运用于影像、临床及病理等多个医学领域[4,5],主要集中在发现异常、量化测量及鉴别诊断等方面[6,7]。而用于肺结节筛查和定性的辅助诊断软件国内外各有不同,主要是由于模型算法不同使其结果的灵敏度、特异度出现一定偏差[8]。本研究旨在探讨我院引入的深睿公司医学影像辅助诊断软件对肺GGN检出和定性诊断的价值。

本研究结果显示A组的漏诊率明显高于B、C两组,而敏感度明显低于B、C两组,正是由于医生在进行大量重复阅片过程中不可避免地产生视觉疲劳,大大影响结节的检出情况。B组的误诊率明显高于A、C两组,而阳性预测值明显低于A、C两组,原因为AI主要容易将局部稍增粗的肺纹理误判为GGN,表明AI的算法有待进一步完善和提高。C组(住院医师结合AI)的阅片诊断水平接近于高年资医师,明显提高了GGN的检出率,减少了漏诊风险,又弥补了AI假阳性率高的缺点。另外,AI平均6s能完成1例阅片,而一般人工阅片需要7 min,人工结合AI大大提高了影像科医生的工作效率和诊断准确性,值得广泛推广,与胡琼洁等[9]和邵亚军等[10]的研究结果一致。

以往较多研究探讨肺GGN良、恶性间三维特征的差异,对其良恶性预判具有一定参考价值,但测量繁琐、费时,AI弥补了这些缺点,可直接提取结节并对其各指标进行准确量化,方便、快捷,减少了人工测量的误差,可重复性强。另外AI可根据其模型算法计算出结节的恶性概率,影像医生可参考AI提供的三维特征参数及恶性概率对其进行定性分析,提高诊断效率。本研究中,GGN良、恶性组间结节短径和最小CT值差异无统计学意义,长径、最大面积、体积、平均CT值、最大CT值及恶性概率差异均有统计学意义,与Shi等[11]的研究结果一致。回归分析结果显示长径和最大面积是GGN恶变的危险因素,AUC分别为0.867、0.899,当临界值分别为10.34 mm、61.12 mm2时,敏感度均为0.795,特异度分别为0.852、0.870。Kitami等[12]和熊廷伟等[13]的研究结果表明直径是GGN恶变的危险因素,Yang等[14]的研究结果也表明基于直径的logistic回归模型用于区分良、恶性GGN的准确率达78.7% ,AUC为0.861,敏感度和特异度分别为78.0%、80.0%。最大面积是GGN恶变的独立危险因素以往少有文献报道,可能与本研究中部分GGN整体体积缩小、局部恶变面积增大有一定关系,需扩大样本量进一步证实。关于GGN的CT值以往研究结果各有不同,矫娜等[15]研究表明恶性GGN的平均CT值及最大CT值均明显高于良性GGN,而Xiang等[16]认为两者差异并无统计学意义,本研究结果表明两者间差异有统计学意义,病理机制可能是由于恶性GGN内肿瘤细胞沿着肺泡间隔贴壁生长,导致肺泡腔内气体减少,或由于肺泡塌陷、纤维化等导致病灶内局部密度增高[17]。Logistic回归分析结果显示恶性概率不是GGN恶变的危险因素,表明AI对GGN的定性预判能力有待提高。但是,本研究发现良、恶性两组GGN的恶性概率差异有统计学意义,当恶性概率大于80%时,提示GGN恶性的可能性较大,具有一定参考价值。因此在诊断工作中重点观察AI提供的GGN长径、最大面积、体积、CT值、恶性概率等参数,并结合常规形态学进行综合分析,可明显提高GGN定性诊断的准确率。

本研究存在以下局限性:①需扩大样本量,进一步对结果进行验证;②未引入随访数据等重要指标说明AI在肺结节随访中的价值,有待进一步研究。

综上所述,在肺GGN的检出及良、恶性鉴别诊断方面,AI可在短时间内有效提高GGN检出的敏感度,并对其三维特征参数进行准确量化,计算其恶性概率,且结果可信度较高,是影像科医生可靠而实用的有力助手,可在临床中广泛应用。但目前AI的假阳性率仍较高,需进一步改善其算法以提高特异度。

猜你喜欢
阅片长径恶性
《住院医师规范化培训教学阅片指南(2022年版)》解读
基于全三维动网格技术的变长径比间隙环流的研究
刚性基础下水泥土桩复合地基有效长径比研究
恶性胸膜间皮瘤、肺鳞癌重复癌一例
玄武岩纤维长径比对混凝土力学性能的影响
阅片列表在耳科住院医师颞骨CT影像阅片教学的应用与实践
计算机辅助检测系统(CAD)在16层CT低剂量肺癌筛查肺结节检出中的应用价值
卵巢恶性Brenner瘤CT表现3例
SP-1000i全自动推片染色仪及CellaVision DM96自动阅片仪在形态学检验人员镜下比对中的应用
铟掺杂调控氧化锌纳米棒长径比