吴佳琪 倪炯 王培军
肺癌是全世界范围内最常见的恶性肿瘤。早期筛查和精准分期是影响肺癌患者预后的关键,其中淋巴结分期尤为重要[1]。目前有很多方法,如正电子发射计算机体层显像(positron emission computed tomography,PET-CT)[2]、纵隔镜检查[3]和超声内镜引导下的细针抽吸检查[4],被用于诊断淋巴结转移。然而,由于存在创伤性、费用高昂以及并发症等问题,上述检查方法不作为患者的常规检查。胸部CT平扫是临床上最常用的肺癌检查之一,通常影像科医师认为短径>10 mm的淋巴结存在潜在转移,而淋巴结短径<10 mm,术后病理证实存在转移的淋巴结被定义为隐匿性淋巴结转移(occult lymph node metastasis,OLM)[5]。由于OLM的存在,胸部CT对淋巴结分期的准确率仅为45%~79%[6]。为准确评估区域淋巴结转移情况,本研究以胸部CT平扫为基础,拟建立OLM相关的影像组学预测模型,以期为外科医生提供有用的信息,从而避免不必要的大范围淋巴结清扫,改善患者预后。
回顾性收集2016年1月至2021年12月同济大学附属同济医院114例行胸部CT平扫的肺癌患者影像及临床资料。OLM(+)患者纳入标准:①由病理证实为原发性非小细胞肺癌;②胸部CT平扫断层图像显示目标淋巴结短径<10 mm,术后病理证实淋巴结内存在肿瘤转移;③患者临床资料完整。OLM(-)患者纳入标准:①由病理证实为原发性非小细胞肺癌;②胸部CT平扫断层图像显示目标淋巴结短径<10 mm,术后病理证实目标淋巴结内不存在肿瘤转移;③患者临床资料完整。患者排除标准:①未由病理证实为原发性非小细胞肺癌;②图像质量不佳、影响分析结果;③患者临床资料不完整。本研究符合《赫尔辛基宣言》原则。
采用联影uCT760螺旋CT扫描仪和西门子第三代Force双源CT扫描仪,患者取仰卧位,行横断面螺旋CT扫描。扫描范围:肺尖至膈底,包括两侧肋膈角。扫描参数:管电压120 kV,管电流40 mA,扫描层厚7.0 mm,层间距7.0 mm,高分辨率算法重建,重建层厚1.0 mm,层间距0.8 mm。选择纵隔窗(窗宽250~300 HU,窗位30~50 HU),观察目标淋巴结。
将胸部CT平扫图像以DICOM标准格式导入ITK-SNAP 3.8.2软件中,以纵隔淋巴结为研究对象(图1 A、B),由2名影像科医师沿淋巴结边缘逐层手动勾画感兴趣区(ROI),勾画后的ROI再由1名高年资影像科医师核对、审核。采用Pyradiomics软件自动匹配ROI,对图像进行滤波器处理并提取影像组学特征,获得一阶特征、形态学特征、灰度共生矩阵特征、灰度游程矩阵特征、灰度区域矩阵特征和灰度依赖矩阵特征。
图1 纵隔淋巴结影像示例A. OLM(+)肺癌患者,男性,72岁,经手术病理证实该淋巴结存在肺癌转移(红色);B. OLM(-)肺癌患者, 女性,64岁,经手术病理证实该淋巴结不存在肺癌转移(红色)。
按7:3比例,随机将79例患者纳入训练集,35例患者纳入内部验证集中。基于训练集,通过最小冗余最大相关性(minimum redundancy maximum relevance,mRMR)去除非特异性特征,应用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)选择最优特征子集,计算特征相应系数并建立影像组学模型。
采用PASW18.0软件进行统计学分析,计数资料采用Pearsonχ2检验进行统计学比较;计量资料符合正态分布,以±s表示,采用单因素方差分析进行统计学比较。影像组学模型在训练集和内部验证集中的诊断效能采用受试者工作特征(receiver operating characteristic,ROC)曲线进行比较,计算曲线下面积(area under the curve,AUC)、准确度、灵敏度和特异度。采用RStudio 2022.2.0软件绘制决策曲线评价模型的临床价值。
共计114例肺癌患者,125枚目标淋巴结,OLM(+)淋巴结39枚,OLM(-)淋巴结86枚。随机将患者分入训练集和内部验证集中,各组患者年龄、性别分布差异均无统计学意义(P>0.05),各组淋巴结短径和长径差异均无统计学意义(P>0.05)。详见表1。
表1 训练集和验证集患者临床资料的比较
通过LASSO回归模型对组学特征进行筛选,获得17个最具预测性的影像组学特征,包括6个一阶特征、4个灰度共生矩阵特征、4个灰度区域矩阵特征和3个灰度依赖矩阵特征(图2A、B),影像组学评分为常量加上各特征与对应系数乘积之和。见表2。
表2 影像组学特征与对应系数
图2 影像组学特征筛选A. 二项式偏差随参数λ的变化曲线图,LASSO模型中参数λ的选择采用10折交叉验证。利用二项式最小偏差和最小偏差的1个标准误在图中画垂线。经10折交叉验证,λ=0.028,ln(λ)=-3.57。B. 组学特征的LASSO系数分布图,在10折交叉验证所选值处绘制垂线,最终获得17个非零系数。
根据影像组学评分绘制ROC曲线,训练集AUC值为0.86(95% CI,0.78~0.93)(图3A),准确度、灵敏度和特异度分别为76.14%、91.30%、70.77%;内部验证集AUC值为0.85(95% CI,0.72~0.97)(图3B),准确度、灵敏度和特异度分别为70.27%、68.75%、71.43%。
图3 影像组学模型效能评估图A. 训练集ROC曲线图,AUC值为0.86(95%CI 0.78~0.93);B. 内部验证集ROC曲线图,AUC值为0.85(95% CI 0.72~0.97);C. 影像组学模型决策曲线图,灰色斜线代表假设所有淋巴结都为OLM(+),横线代表假设所有淋巴结都为OLM(-)。
决策曲线显示净获益率随着高风险阈值不断波动,高风险阈值在0.2~0.9范围内,模型的净获益率明显高于两条极端线,模型具有较好的临床获益(图3C)。
本研究基于胸部CT平扫,系统性地分析了OLM(+)和OLM(-)淋巴结影像组学特征的差异,并根据筛选获得的组学特征建立了肺癌OLM相关的预测模型。在训练集和内部验证集中,准确度、灵敏度和特异度提示本研究建立的组学模型对肺癌OLM具有较好的预测能力,决策曲线提示模型有较高的临床获益。
在本研究建立的组学模型中,共获得17个最具有预测潜能的影像组学特征,其中灰度共生矩阵特征类的相关性值权重最大,与影像组学评分呈负相关。灰度共生矩阵特征是图像区域的二阶联合概率函数,由其导出的相关性值可反应灰度值与邻近体素间的相关性[7]。因此,ROI区域灰度值均质性越低,影像组学评分越高,提示目标淋巴结存在转移。该结果可能与淋巴结发生转移时,病灶内部成分混杂,造成图像的灰度值分布不均有关。此外,一阶特征类的第10百分位数、灰度依赖矩阵特征类的大依赖低灰度强调和灰度区域矩阵特征类的归一化区域大小不均匀性在其相应类别的特征中权重最大,与影像组学评分呈正相关。第10百分位数是特征值的第10个百分位数,通过基本参数描述病灶内体素分布情况,可以预测病灶的性质。大依赖低灰度强调是用较低的灰度值测量相关性大的联合分布。归一化区域大小不均匀性是测量整个图像中大小区域体积的可变性,与ROI区域的同质性有关,特征值越高,病灶同质性越低,影像组学评分则越高,提示存在转移。
多年来,CT扫描对淋巴结转移的诊断依赖于淋巴结短径,该方法灵敏度和特异度较低。影像组学可基于医学图像发现人眼无法察觉到的生物学改变,并能将图像中提取出的生物信息客观量化[8-9]。许多研究表明,在诊断淋巴结转移方面,尤其在淋巴结大小正常的患者中,影像组学比传统的形态学测量更准确[10]。因此,影像组学的出现有望提高纵隔淋巴结分期准确性。本研究基于胸部CT平扫筛选影像组学特征,旨在建立有临床价值的肺癌OLM预测模型。结果显示,训练集和内部验证集的ROC曲线下面积均>0.80,提示本研究中组学模型具有较好的诊断准确性。决策曲线提示模型具有较好的临床获益,对预测OLM具有重要的临床意义。
既往研究中,Zhong等[11]尝试以肺内原发肿瘤为ROI提取组学特征,预测肺癌OLM。但由于肺癌引发的阻塞性肺不张和阻塞性肺炎使原发肿瘤的边界难以确定,造成通过勾画肿瘤边缘提取组学特征的难度增高。而本研究以纵隔淋巴结为研究对象,不受原发肿瘤和邻近肺组织病变的干扰,能更直观地提取组学信息,完成OLM预测。Zhang等[12]通过胸部CT增强图像建立OLM预测模型,其训练集AUC值、灵敏度、特异度为0.78(95%CI 0.68~0.86)、76.5%、64.3%,内部验证集AUC值、灵敏度、特异度为0.78(95%CI 0.66~0.85)、80.9%、68.3%。虽然与平扫图像相比,增强图像能为病灶提供更多有效信息,但Zhang等基于增强图像建立的组学模型,除内部验证集灵敏度外,余诊断效能均未优于本研究中基于胸部CT平扫建立的模型。沙雪等[13]基于不同CT增强时相建立纵隔淋巴结转移模型,同样也发现各时相模型中,平扫期模型的AUC值最高,具有较好的诊断效能,与本研究结果一致。因此,与CT增强相比,CT平扫检查不仅能降低患者的辐射剂量和减少造影剂不良事件的发生率,以其为基础的肺癌OLM影像组学研究同样有着较高的临床价值。
本研究存在以下不足。第一,本研究为回顾性研究,容易产生选择偏倚和回忆偏倚。第二,虽然每位患者在实际手术中会清扫多枚淋巴结,但根据纳入标准和图像分割要求,仅1~2枚淋巴结可被纳入研究,造成目标淋巴结样本量较小。第三,本研究缺乏外部验证。因此,在后续工作中本研究将弥补上述不足,引入多中心影像数据,扩大样本量,提高结果可靠性,并结合临床指标完善对OLM的预测。
综上所述,本研究基于胸部CT平扫建立影像组学模型,其在预测肺癌OLM上具有较好的临床价值,有望为临床医师的无创性术前决策提供依据。