韩 冬,陆 洋,段绍峰,郭莉莉
1.南京医科大学附属淮安第一医院影像科,江苏 淮安 223300;2.上海GE 医疗,上海210000
原发性肝癌是世界上第6 位常见恶性肿瘤和第4 位肿瘤死亡原因[1],在我国是第4 位常见恶性肿瘤及第3 位肿瘤死亡原因[2]。原发性肝癌主要包括肝细胞癌(占85%~90%)、肝内胆管癌和两者混合型3 种病理类型。科学的分期和选择最佳的治疗方案是改善患者预后的关键[3]。巴塞罗那临床肝癌分期系统(Barcelona Clinic Liver Cancer,BCLC)因包含了肝细胞癌各分期的治疗建议,在全球应用广泛[4]。纹理分析通过获得大量人类肉眼无法识别的定量特征反映区域图像中像素强度分布、不同强度水平间的空间关系、纹理图案的形状和异质性,以及肿瘤与周围组织关系,是目前较热门的一种图像分析技术。本研究通过量化分析图像纹理特征构建肿瘤的预测模型,探究CT 图像纹理特征用于肝细胞癌BCLC 分期的可行性。
回顾性收集南京医科大学附属淮安第一医院2016 年10 月至2022 年12 月经病理确诊的肝细胞癌患者362 例。纳入标准:①术前或治疗前行CT 平扫及增强扫描;②CT 图像包括平扫、动脉期和门静脉期图像;③临床资料完善,包括患者的一般情况、总胆红素、白蛋白、凝血酶原时间等。排除标准:①扫描前已行经导管动脉化疗栓塞术、微波、射频消融等治疗;②术前病灶破裂出血,掩盖真实影像;③合并严重脂肪肝;④BCLC 分期为C 或D 期。
最终纳入190 例,其中男150 例,女40 例;年龄32~81 岁,平均(57.87±9.85)岁。根据2022 版肝癌BCLC 进行分期[5]:0 期为最早期,A 期为早期,B 期为中期,而C、D 期分别为晚期和终末期。采用分层随机抽样方法将190 例患者按8∶2 的比例分为训练集152 例,测试集38 例。训练集的数据用于特征筛选与模型构建。
采用Siemens Somatom Definition 双源64 层CT 扫描仪。扫描参数:120 kV,层厚、层距均为5 mm。患者取仰卧位,以高压注射器静脉注射碘佛醇注射液80~100 mL(碘含量320 mg/mL),流率3 mL/s。在注射对比剂30、50 s 后分别行动脉期、门静脉期扫描。
1.3.1 ROI 分割 由2 名经验丰富的影像医师(医师A、B)利用ITK-SNAP 软件对CT 平扫、动脉期及门静脉期图像逐层勾画靶病灶ROI,合成VOI(图1)。每个病灶医师A 勾画2 次,医师B 勾画1 次。
图1 原发性肝细胞癌的CT 图像及VOI 示意图注:患者,男,59 岁,肝右叶原发性肝细胞癌。图1a 示CT 平扫肿块呈低密度(箭头);图1b 示增强扫描动脉期病灶明显不均匀强化(箭头);图1c 示门脉期病灶呈相对低密度(箭头);图1d 为病灶VOI 示意图
1.3.2 高通量特征提取 首先对图像行重采样和灰度离散化预处理,重采样设为1 mm×1 mm×1 mm,灰度为64 个灰阶,以利于提高纹理特征的计算速度,并降低噪声的干扰。应用Anaconda Prompt(anaconda3)软件,运行开源程序exampleCT.yaml,对CT 图像进行特征提取,每一期提取217 个特征参数,包括直方图特征、几何形态特征和纹理特征3 大类,去除14 个形态学征,每期共203 个特征。每例患者有3 组影像组学特征。
1.3.3 特征筛选与模型构建 首先行观测者内与观测者间的一致性检验,保留组内和组间一致性系数(inter/intra-class correlation coefficient,ICC)>0.75的特征,删除方差近乎零的特征。使用Spearman 相关分析进一步筛选影像组学特征,剔除相关系数>0.9 的特征。过滤单向方差<0.01 的特征。将保留的特征导入最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)回归模型中,使用十折交叉验证筛选超参数λ,选择模型误差最小的λ,保留系数不为0 的特征。采用医师A 第1 次勾画ROI 所提取的影像组学特征,筛选可重复性好、稳定性高的参数分别基于CT 平扫图像、动脉期图像、门静脉期图像建立影像组学模型。计算影像组学评分,组学评分为特征与对应系数乘积的和。
采用R 软件(http://www.rproject.org,Version.3.4.4)进行统计学分析。DescTools 包用于计算ICC;caret包用于数据分组、Spearman 相关分析与校准分析;glmnet 包用于LASSO 回归分析、计算影像组学评分,影像组学评分分类采用Wilcoxon 检验;logistic 回归分析用于单因素和多因素分析;绘制ROC 曲线评价预测模型的影像组学评分在训练集和测试集中区别肝细胞癌BCLC 分期的检测效能,获得敏感度、特异度、准确率、阳性预测值、阴性预测值及AUC。利用DeLong 检验两两比较BCLC 0、A、B 期测试集不同影像组学模型的AUC。计量资料不符合正态分布,以M(QL,QU)表示,3 组间比较采用单因素方差分析;计数资料以例(%)表示,组间比较行χ2检验。以P<0.05 为差异有统计学意义。
表1 不同BCLC 分期患者的基本资料比较
190 例中,BCLC 分期0 期38 例,A 期76 例,B期76 例。各期患者的年龄及性别比较,差异均无统计学意义(均P>0.05)。
LASSO 筛选出平扫纹理特征共6 个,分别为original_glszm_SmallAreaEmphasis、log_sigma_1_0_mm_3D_glszm_LargeAreaLowGrayLevelEmphasis、log_sigma_1_0_mm_3D_glszm_SizeZoneNonUniformity Normalized、original_firstorder_Minimum、log_sigma_1_0_mm_3D_glszm_ZoneEntropy、original_firstorder_90Percentile,各组学特征所占权重见图2。训练集检测0、A 及B 期的AUC 分别为1.00、0.99、0.99,总准确率为98.5%;测试集检测0、A 及B 期的AUC 为0.61、0.51、0.55,总准确率为35.4%(表2,图3)。
表2 CT 平扫影像组学模型预测肝细胞癌BCLC 分期结果
LASSO 筛选出10 个动脉期图像纹理特征,分别为original_glszm_ZoneEntropy、original_glszm_Large AreaHighGrayLevelEmphasis、log_sigma_1_0_mm_3D_glszm_ZoneEntropy、log_sigma_1_0_mm_3D_firstorder_Maximum、original_glszm_LargeAreaLowGray LevelEmphasis、original_gldm_SmallDependence Emphasis、original_glszm_SmallAreaEmphasis、log_sigma_1_0_mm_3D_glrlm_ShortRunEmphasis、log_sigma_1_0_mm_3D_glszm_LargeAreaLowGrayLevel Emphasis、log_sigma_2_0_mm_3D_firstorder_Median,各组学特征所占权重见图4。训练集检测0、A 及B 期的AUC 均为1.00,总准确率达100.0%;测试集检测0、A 及B 期的AUC 分别为0.99、0.98、0.99,总准确率为92.7%(表3,图5)。
表3 CT 动脉期影像组学模型预测肝细胞肝癌BCLC 分期结果
图4 CT 动脉期图像筛选获得的影像组学特征及其所占权重 图5 CT 动脉期影像组学模型预测肝细胞癌巴塞罗那临床肝癌分期系统分期的ROC 曲线 注:图5a 为训练集,图5b 为测试集
LASSO 筛选出共10 个门静脉期图像纹理特征,分别为original_glszm_Large Area High Gray LevelEmphasis、original_glszm_Zone Entropy、original_glszm_LargeAreaLowGrayLevelEmphasis、log_sigma_1_0_mm_3D_glrlm_ShortRunEmphasis、log_sigma_1_0_mm_3D_glszm_ZoneEntropy、log_sigma_1_0_mm_3D_glszm_GrayLevelNonUniformity、log_sigma_1_0_mm_3D_firstorder_Maximum、log_sigma_1_0_mm_3D_gldm_DependenceVariance、log_sigma_2_0_mm_3D_glcm_Imc1、original_gldm_DependenceEntropy,各组学特征所占权重见图6。训练集检测0、A 及B 期的AUC 均为1.00,总准确率达100.0%;测试集检测0、A 及B 期的AUC 分别为0.98、0.95、0.99,总准确率为90.9%(表4,图7)。
表4 CT 门静脉期影像组学模型预测肝细胞癌BCLC 分期结果
图6 CT 门静脉期图像筛选获得的影像组学特征及其所占权重 图7 CT 门静脉期影像组学模型预测肝细胞癌巴塞罗那临床肝癌分期系统分期的ROC 曲线 注:图7a 为训练集,图7b 为测试集
表5 不同影像组学模型在测试集的ROC 曲线分析
表6 DeLong 检验两两比较不同影像组学模型在测试集的诊断效能(P 值)
采用DeLong 检验两两比较组学模型的诊断效能,其中动脉期及门静脉期组学模型与平扫组学模型对BCLC A、B 期诊断效能差异均有统计学意义(均P<0.05)。动脉期与门静脉期组学模型对BCLC 0、A、B 期诊断效能差异均无统计学意义(均P>0.05)。
肝细胞癌是最常见的肝脏恶性肿瘤,多发于慢性肝病患者(如肝硬化或肝严重纤维化)。其主要原因包括慢性乙型或丙型肝炎病毒感染,以及非酒精性脂肪性肝炎或酒精性肝病引起的代谢性肝病[6]。BCLC 由Llovet 在1999 年提出,后经美国肝脏疾病研究协会[7]在2005 年进行修改,包含4 类预后因素:患者的一般状态、肿瘤的状态、肝功能状态,以及可供选择的治疗方法;目前在全球应用最广泛。不同BCLC 分期患者的治疗方式不同,早中期的肝细胞癌由于发现早,可通过手术或介入治疗,预后明显比C或D 期(终末期)好。
近年来,肿瘤在生物学和基因组特征方面的异质性已成为癌症研究中重点关注的话题[8]。研究发现,肝细胞癌是一种具有显著异质性的疾病,其异质性可表现为不同肿瘤或同一肿瘤不同部位的生长特点、细胞构成及分化程度不同[9]。如CT、PET 或MRI等医学成像方法可在整个3D 范围内捕获具有反映肿瘤异质性特征的图像。这种横截面成像技术已成为现代肿瘤学研究的重要工具[10-13]。然而,当前根据所获得图像评估肝细胞癌患者预后的方法仍非常初级,多由放射科医师主观分析肿瘤的大小、数量和血管侵犯等情况。与传统影像学特征相比,影像组学利用计算机技术对医学图像进行深度挖掘,可提供大量人类肉眼所无法识别的定量特征,且特征更加高效、相对客观,种类更丰富[14]。黄燕琪等[15]研究显示,利用门静脉期图像纹理分析鉴别肝肿瘤良恶性准确率最高,证实基于CT 图像的纹理分析技术对于肝脏良恶性病变的鉴别具有重要价值。李嘉颖等[16]分析了原发性肝癌DWI 影像组学与中医证型的相关性,经特征降维后最终筛选出4 个影像组学特征与肝癌虚、实证有相关性。Xu 等[17]结合临床及影像组学特点构建了预测肝细胞癌微血管侵犯及预后的模型,展现了良好的检测效能。秦丽莉等[18]通过筛选出基于MRI-T2WI 图像的最优影像组学标签,建立预测肝细胞癌瘤体中细胞增殖抗原标志物(Ki-67)表达程度的预测模型,认为肝细胞癌MRI-T2WI 影像组学特征与瘤体Ki-67 的表达具有相关性,可作为临床术前无创预测肝细胞癌Ki-67 表达的手段。
本研究从图像中提取的特征包括几何形态特征、直方图特征和纹理特征。几何形态特征主要描述ROI 的基本特征及与球度相似的特征,包括大小、形态、致密度、球形度等,而本研究的目的主要针对肉眼不可及的影像组学特征,且BCLC 分期参考的肿瘤状态指标中涉及肿瘤大小这一形态特征,遂舍弃。直方图特征是图像灰度级的函数,反映像素值的分布;纹理特征是描述体素空间分布强度等级的特征,是基于特定像素的联合概率分布。恶性肿瘤内异常血管生成、细胞通透性改变及坏死常导致肿瘤内部不均匀,成分混杂,结节内部粗糙,灰度分布复杂,异质性差。上述变化肉眼不易察觉,但通过纹理特征可发现,且不受主观影响[19]。因此,本研究最终选取的为图像直方图及纹理学特征。
CT 作为一种临床上重要的检查方法,主要用于肝细胞癌患者的诊断及随访。本研究显示,CT 平扫图像影像组学模型无法预测肝细胞癌的BCLC 分期,测试集总准确率仅35.4%;而动脉期组学模型在测试集预测BCLC 分期中O、A、B 期的AUC 分别为0.99、0.98、0.99,总准确率为92.7%;门静脉组学模型预测BCLC 分期O、A、B 期的AUC 分别为0.98、0.95、0.99,总准确率为90.9%;动脉期总准确率略高于门静脉期。因此,肝细胞癌动脉期及门静脉期影像组学特征可用于区分肝细胞癌BCLC 分期的0、A 及B期。从动脉期及门静脉期图像筛选获得的影像组学特征及其所占权重可见灰度级区域相关参数均占显著比重。灰度级区域被定义为灰度强度相同且相邻体素的数量,肝细胞癌根据灰度强度进行区域划分产生的影像组学特征所占权重较高,可能是因为肿瘤区域某些状态与临床分期之间有联系,但还需进一步研究。
本研究不足之处:①为单中心研究、样本量较小。②纳入患者同时行腹部平扫+CT 增强扫描,可能存在一定的选择偏倚;③BCLC 分期中C、D 期由于病理确诊数量较少未纳入研究,还需进一步扩大样本量或行多中心研究。
综上所述,CT 影像组学可用于肝细胞癌的BCLC 分期研究,通过影像组学特征可很好预测其早、中期的临床分期。