邢倩,张晓东,王霄英
随着肺癌CT筛查的广泛普及,不确定肺结节的数量不断增加,这为肺结节的诊断和管理带来了相当大的挑战。对胸部CT检查中发现的肺结节,进行标准、合理的分类,对结节的处理方案有极重要的意义。有研究表明,肺结节的影像学性质比结节大小对预后有更为重要的意义。
本研究以读片者的判断作为金标准,对肺结节的影像学性质进行分类——实性结节(solid nodule,SN)、部分实性结节(part-solid nodule,PSN)及纯磨玻璃密度结节(pure ground glass nodule,pGGN),这一分类通过两个分类模型完成,先进行实性结节与亚实性结节的分类,再将亚实性结节进一步分为部分实性结节与磨玻璃密度结节。均通过对兴趣区的勾画,使用影像组学的方法,建立判断结节性质的组学模型,并分别得到两个组学模型的平均受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)、敏感度、特异度及符合率。本研究旨在将建立的组学模型与肺结节CAD辅助诊断软件联合应用于临床工作中,将组学模型结果输入结构式报告,从而实现自动发现结节并对肺结节进行Lung-RADS分类的目的。
1.病例资料
回顾性收集2018年10月-12月于本院行CT胸部平扫检查的患者。纳入标准为:①影像检查的图像质量满足诊断;②图像中含有一个或一个以上的肺结节(SN、PSN或pGGN)。
2.结节的分类原则
将所有纳入分析的结节分为SN、PSN及pGGN。每类结节中,依据结节大小分为大结节组(1.0cm<直径<3.0cm)及小结节组(0.4cm≤直径≤1.0cm)[1],保证每类结节中大结节与小结节的数目相近,在笔者类似的关于肺结节影像组学的研究中,发现目标病灶的像素值对影像组学分类的准确性存在影响,因而对肺结节的大小进行分类可以平均掉这种差异,确保该模型对任何体积的结节均适用。
结节的影像学性质由2名胸部CT诊断经验分别为3年(读片者A)及20年(读片者B)的影像科医师共同阅片决定,当两人意见不一致时,商议决定结节性质。
结节性质的评估标准,结合文献的6类分类方法[2]在肺窗观察,窗位-600HU,窗宽2000HU[3],评估结节的最大层面、实性成分及磨玻璃密度成分是否存在及其范围、以及结节的均匀性(图1)。其中1类、2类结节密度均匀,不含实性成分,2类较1类密度略高;3类及4类结节密度不均匀,实性成分均<50%,3类由实性成分及周围磨玻璃密度晕组成,4类由磨玻璃密度及含有充气支气管影的实性部分组成;5类及6类主要由实性成分构成,5类的实性成分周围伴少许磨玻璃密度成分,而6类仅由实性成分构成。将1~2类归为pGGN,3~5类归为PSN,6类为SN。
3.图像分割
在CT胸部平扫的薄层横轴面图像上,使用ITKSNAP软件(version 3.6.0)对病灶进行手工分割。由一位具有3年胸部影像诊断经验的医师勾画。大结节组,沿病灶边缘进行分割,共勾画该病灶的最大层面及其上下各1层。小结节组,由于病灶体积小,所含有的像素值较少,因而沿病灶边缘分割,勾画含有病灶的所有层面(分割方法见图2)。
使用沿结节边缘分割的方法,可以尽可能避免病灶周围肺内成分,如血管、索条或胸膜等成分的干扰。对于磨玻璃密度结节,尽可能避开穿行其中的血管、索条等成分;对于部分实性结节,要勾画到其含实性成分的层面。
4.特征提取及选择
在人工分割的3D病灶中提取所有特征,从薄层胸部CT图像中提取非纹理特征:体积(volume)、面积(size)、实性度(solidity)以及偏心率(eccentricity)和纹理特征:基于直方图的全局纹理特征及基于灰度的纹理特征包括以下4项:灰度共生矩阵(GLCM)、灰度行程长度矩阵(GLRLM)、基于灰度区域尺度矩阵(GLSZM)、邻域灰度差分矩阵(NGTDM)。
使用机器学习的方法提取常见的影像组学特征,在得到多个特征后,运用前向特征选择机制算法进行特征降维,消除高度相关的特征。继而利用Spearman秩相关及最大信息系数(maximal information coefficient,MIC)评估特征间的冗余度及特征预测能力。
5.建立模型
在本研究中需要使用二分类的方法,先建立一个判断实性结节与亚实性结节(含全部部分实性结节及纯磨玻璃密度结节)的模型,随后再建立一个将亚实性结节二分类的模型,判断部分实性结节与纯磨玻璃密度结节,从而实现肺结节影像学性质的分类。
在特征降维后,通过最大化0.632+自举验证(the 0.632+bootstrap[4])AUC度量,逐步进行特征选择,得到结合1~20个变量(模型阶数)的纹理模型,选取分类性能最优的简约特征子集。这些模型的建立是使用预测曲线最高而模型阶数最低的影像组学特征集建立的。
随后采用不平衡调整逻辑回归IALR构建预测模型。利用在100个自举检测样本中,得到的平均AUC值、符合率、敏感度和特异度作为模型的预测效能[5],公式如下:
其中B为自举检查样本的数目,在本研究中设为100,p代表模型阶数,而j=0代表模型模型g(xi)的偏倚。
此后,再使用sigmoid函数,将相应的预测输出值转换为概率相关指标P(i):
其中x表示预测模型的输出值,Pi表示结节变化可能性的概率。
第一个模型记亚实性结节为0,实性结节为1,Sigmoid函数的输出值为0~1之间的任意数,输出值即为判断值,其中间值是0.5,则认为结果在0~0.5属于亚实性结节,0.5~1属于实性结节。
第二个模型记磨玻璃密度结节为0,部分实性结节为1,Sigmoid函数的输出值为0~1之间的任意数,输出值即为判断值,其中间值是0.5,则认为结果在0~0.5属于纯磨玻璃密度结节,0.5~1属于部分实性结节。
6.模型效能判断
AUC被认为是评价分类器性能的最佳度量之一[6]。当模型的AUC值为0.5~0.7时,有较低准确性,0.7~0.9时有一定的准确性,AUC在0.9以上时有较高准确性。
1.一般资料
共计285个患者纳入分析,总结节数为315个,患者年龄24~93岁,平均(63.2±12.2)岁,共有实性结节106个、部分实性结节110个、纯磨玻璃密度结节99个。其中大结节组结节数共148个,实性结节51个,部分实性结节52个,纯磨玻璃密度结节45个;小结节组结节数共167个,实性结节55个,部分实性结节58个,纯磨玻璃密度结节54个(表1)。
其中大结节组实性结节长径11~34mm,短径7~26mm;部分实性结节长径11~34mm,短径7~22mm;磨玻璃密度结节长径11~29mm,短径7~24mm。小结节组实性结节长径4~12mm,短径4~10mm;部分实性结节长径4~12mm,短径范4~10mm;磨玻璃密度结节长径4~10mm,短径4~10mm(表2)。
表1 大结节组与小结节组的三种类型肺结节组成
表2 不同类型肺结节的大小
2.影像组学特征
两个组学模型分别提取特征数973个(图3),记二分类实性结节与亚实性结节为分类1,亚实性结节分为部分实性结节与纯磨玻璃密度结节为分类2。分别通过提取1~20个变量的纹理模型,发现分类1在选择6个特征时,模型达到最优效能,分类2在选择14个特征时,模型达到最优效能。
分类1与分类2选择的特征见表3。
表3 分类1与分类2选择的模型特征
3.影像组学模型判断结果
应用影像组学分类1模型,在所有315个结节中输出值与实际情况一致的结节有288个。准确判断的实性结节97个,亚实性结节191个,其中部分实性结节106个,纯磨玻璃密度结节85个。
应用影像组学模型分类2模型,在209个亚实性结节中输出值与实际情况一致的的结节有169个,其中部分实性结节83个,纯磨玻璃密度结节86个(图4)。
4.影像组学效能
图1 结节影像学性质6分类。a)1类;b)2类;c)3类;d)4类;e)5类;f)6类。
分类1的敏感度、特 异度分别达到9 0.0%及90.2%,符合率达到90.1%,其AUC值为0.961,可信度极高。
分类2的敏感度、特异度分别达到73.2%及75.6%,符合率达到74.2%,其AUC值为0.822,可信度较高。
影像组学模型对实性结节中的大结节有最高的预测效能,在两个组学模型中,大结节均较同分类中的小结节有更高的预测效能(表4)。
1.影像组学模型对肺结节影像学性质判断能力的整体分析
图2 结节影像学性质判断的兴趣区分割方法。a~d为小结节组,e~h为大结节组。a)右肺上叶磨玻璃密度结节;b)沿结节边缘勾画;c)确定兴趣区;d)病灶的整体情况显示;e)右肺下叶部分实性结节;f)沿结节边缘勾画;g)确定兴趣区;h)病灶的整体情况显示。
图3 肺结节影像学性质分类研究,分类1与分类2分别提取的影像特征及不同特征的预测能力排序。a)分类1及分类2提取同样数目的影像组学特征;b)分类1及分类2的特征计算方法;c)分类1研究中不同特征预测能力排序;d)分类2研究中不同特征预测能力排序。
分类1作为区分实性与亚实性结节的模型有很好的效能,判断的符合率高达90.1%,其AUC值也高达96.1%,可信度极高。其敏感度(对实性结节的判断)为90.0%,略低于特异度(对亚实性结节的判断)90.2%,仍然处于较高的水平。在临床工作中,亚实性结节作为一种特殊的肺结节亚群,其特征与实性结节不同,尤其在生长速度和恶性风险方面[7],因而准确地将亚实性结节与实性结节区分的意义更为重要。而在后续研究中,由于分类1效能较高,探讨在分类1模型使用后得到亚实性结节的基础上,进一步使用分类2模型来区分纯磨玻璃密度结节及部分实性结节的方法是可行的。分类2作为区分纯磨玻璃密度结节与部分实性结节的模型也有较好的效能,其AUC值为82.2%,可信度较高。其特异度(对纯磨玻璃密度结节的判断)75.6%略高于敏感度(对部分实性结节的判断)73.2%。
2.影像组学模型对不同体积肺结节判断能力的分析
分类1中,输出结果与金标准对照,判断错误的结节共27个,其中大结节仅4个,其中1例为部分实性结节,3例为纯磨玻璃密度结节。判断错误的实性结节全部为小结节。
分类2中,输出结果与金标准对照,判断错误的结节共40个,其中27例部分实性结节中,9例为大结节,18例为小结节;磨玻璃密度结节13例判断错误,5例为大结节,8例为小结节。
分类1与分类2中大结节与小结节判断的情况具体见表4。从该表中可以看出实性结节中的大结节组预测效能最好,高达100%,在每一分类中,其内部的大结节组均较同分类中的小结节组有更高的预测准确数目。这可能与大结节有更多的体素,能够提取到更多纹理信息有关。
3.临床应用价值分析
当前随着肺结节计算机辅助诊 断(computer-aided diagnosis,CAD)软件的开发及应用,临床工中可以由机器辅助识别肺内病灶。CAD辅助诊断软件有较好的检出效能[8],能够较准确地检出病灶,测量病灶大小,但在病灶的影像学性质分类上,其能力尚不足以准确判断。
本研究使用影像组学的方法,对肺结节的影像学性质进行判断,并将结果输入结构式报告中(图5),并结合CAD辅助诊断软件自动判断结节位置及大小的结果,从而自动得到该结节的Lung-RADS分类,并将Lung-RADS指南对应的处理意见或复查时间自动反馈在报告中,给患者一个清晰明了的指导方案,同时大大提升影像科医师的工作效率及判断的符合率。
肺结节的影像学性质在肺结节的诊断、评估及处理方式选择中有极重要的意义。相同大小的病灶,在不同的影像学性质下,其背后的组织学成分也有很大的差异。以Lung-RADS指南为代表的多个肺结节处理指南,都需要对肺结节的大小及影像学性质进行评估。
随着肺结节计算机辅助诊断软件的开发及应用,在机器能够自动检出病灶,并测量病灶大小的基础上,可以结合判断肺结节影像学性质的组学模型,对肺结节的影像学性质进行判断,从而自动得到该结节的Lung-RADS分类,实现机器对病灶的初步识别与判断,这将是人工智能在胸部CT筛查与诊断方面的一大进步。
表4 结节大小与预测符合率的关系
图4 肺结节影像学性质分类研究。a)分类1在不同模型阶数下的预测效能;b)分类2在不同模型阶数下的预测效能。
图5 肺结节影像学性质分类研究的结果在结构式报告中的输出部位。