李文华,许传斌,崔景景,刘晓鸣,王 肖,贾文昊 ,李天然
(1.佳木斯大学临床医学院,黑龙江 佳木斯 154002;2.解放军总医院第四医学中心放射诊断科,北京 100048;3.联影医疗科技<北京>有限公司,北京 100089)
肝细胞癌(hepatocellular carcinoma,HCC)是导致人类死亡的常见肿瘤。因其恶性程度高,病程短、病情发展迅速的特性,被视为临床重点防治的肿瘤疾病。肝硬化和未经抗病毒治疗的慢性乙型肝炎是我国肝癌的主要病因[1]。随着体检的普及、各种血清肿瘤标志物的临床指导应用以及成像技术的快速发展,肝癌的早期诊断率明显提高。近年来,精准外科和微创外科的时代已经到来,射频消融治疗(radiofrequency ablation,RFA)以其微创、安全、操作简单、可反复使用、费用低的优点,逐渐成为我国早期肝癌的首选治疗方式[2]。有研究指出,RFA 治疗肝癌的近期疗效可达到手术切除的同等效果,可替代临床上部分外科手术治疗[3]。但是长期的随访结果表明[4,5],RFA 术后5 年内的肿瘤总复发率及消融部位的局部复发率较高,肝癌的复发转移是影响患者疗效和长期生存的主要因素。因此,探讨预测HCC 术后早期复发因素并采取相应措施,是进一步提高疗效的关键,是个性化医疗和精准医疗的需要。近年来,随着肿瘤个体化精准治疗的发展,影像组学应运而生。影像组学从海量图像中提取人眼无法识别出的深层次、高通量的定量特征,在高保真的高维数据空间中评价肿瘤生物学行为的异质性,而肿瘤生物学行为的异质性与肿瘤复发和转移密切相关。影像组学方法可以作为肿瘤的虚拟活检技术,在肿瘤的检测、诊断、预后分析和评估疗效[6,7]等方面表现出巨大潜力。基于此,本研究旨在建立基于T2WI 的影像组学自动化预测模型,并探讨其用于预测肝癌射频消融术后早期复发转移的可行性,为肝癌精准治疗提供参考。
1.1 一般资料 回顾性连续收集自2015 年1 月-2021 年3 月解放军总医院第四医学中心收治并行腹腔镜辅助超声引导下射频消融治疗的140 例HCC 患者纳入队列研究,并随机将80%的患者纳入训练集,20%的患者纳入测试集。140 例患者中男126 例,女14 例;年龄30~91 岁,平均年龄(57.86±10.10)岁。肝功能Child-Pugh 分级:A 级134 例,B级6 例。纳入标准:①经临床或穿刺活检病理证实为早期HCC 患者;②HCC 患者于我院接受首次RFA 治疗;③所有患者术前1 周均在我院行MRI 上腹部动态增强检查。排除标准:①影像学或临床资料不全或失访者;②消融失败或曾行其他手术治疗者;③合并其他肿瘤疾病者。
1.2 早期复发的定义及随访方案 早期复发[8]是指肝癌RFA 术后1 年或1 年内发生肝内复发或肝外转移。肝癌RFA 术后的复发及进展评判如下[9]:①局部肿瘤进展:肿瘤完全消融后,消融灶的边缘出现新的病灶,新病灶与消融灶相连;②肿瘤完全消融后,肝内其它部位出现新的病灶;③远处转移:出现肝外的转移灶。肝内局部复发、肝内新病灶和肝外转移,统称为复发。所有患者RFA 术后1 个月内复查超声造影、增强CT 或MRI,并检测肝功能及肿瘤标志物,后每间隔3 个月定期规律随访,通过电话、门诊、住院复查等方式进行随访。随访终点:从HCC 患者首次RFA 后随访至发现HCC 复发,截止时间至少为术后1 年。
1.3 MRI 图像的获取及分割 从我院PACS 系统下载患者的MRI 图像,以DICOM 的格式保存,选取MRI 扫描最早成像且能清晰看到肝癌病灶的T2WI序列,导入到ITK-SANP 软件(Version 3.8,来源:http://www.itksnap.org)中,对整个肿瘤轮廓进行逐层勾画,勾画时注意避开血管及周围正常肝脏组织。将所勾画轮廓融合形成一个三维感兴趣区域,获得感兴趣区域容积(volume of interest,VOI),由另一名从事腹部诊断工作10 年的放射科医师审查分割图像,对有异议的VOI 通过讨论达成一致,见图1。患者的检查方法及参数:采用Siemens Skyra3.0 T超导型磁共振扫描仪及体部相控阵表面线圈。扫描前进行呼吸训练,T2WI 采用快速自旋回波序列,TR 2400 ms,TE 87 ms,层厚6 mm,层间距1.5 mm,矩阵320×320,FOV220 mm×220 mm,NEX 为1。
图1 肝细胞癌的手动分割勾画VOI 示意图
1.4 MRI 图像的预处理及影像组学特征提取 在联影智能科研平台系统V1.0(上海联影智能医疗科技有限公司)(以下简称联影智能科研平台)上将原始影像经wavelet 滤波器进行图像滤波处理,然后利用联影智能科研平台从滤波后的T2WI 图像提取影像特征。提取的影像组学特征主要有7 组共734 个:形状特征14 个,灰度统计量特征144 个,灰度共生矩阵(gray level cooccurence matrix,GLCM)特征168个,灰度游程矩阵(gray level run length matrix,GLRLM)特征128 个,灰度区域矩阵(gray level size zone matrix,GLSZM)特征128 个,邻域灰度差矩阵(neighbouring gray tone difference matrix,NGTDM)特征112 个,灰度相关矩阵(gray level dependence matrix,GLDM)特征40 个。
1.5 影像组学特征选择及模型的建立 首先,通过分析组间相关系数(interclass correlation coefficient,ICC)对两次勾画的VOI 观察者间一致性进行评价,仅保留两次勾画VOI 的ICC≥0.75 具有较高可重复性的影像组学特征;然后,对不同维度的影像组学特征进行Z-score 归一化处理。所有数据按8∶2 的比例随机分为训练集及测试集;在训练集中使用方差阈值法、K 最佳筛选出差异有统计学意义的特征。最后,使用LASSO 回归操作并提取非零系数的影像组学特征纳入接下来的研究。基于LASSO 回归的结果,在训练集中分别建立逻辑回归(logistic regression,LR)、支持向量机 (support vector machine,SVM)、随机森林(random forests,RF)模型以实现肝细胞癌RFA 术后早期复发的预测[10-12]。
1.6 统计学分析 使用联影智能科研平台进行数据分析以及放射学统计分析。采用方差阈值法、K 最佳法和LASSO 回归法进行特征值选择,采用ROC 曲线来评价模型的预测性能,并计算AUC 值、准确率、敏感度和特异度,且当敏感度和特异度最大时,选择临界值作为临界点。临床资料采用SPSS 22.0 软件进行统计学分析,正态分布的计量资料以()表示,比较采用t检验。计数资料以[n(%)]表示,比较采用χ2检验。P<0.05 为差异有统计学意义。
2.1 患者一般资料 根据随访结果,研究对象分为RFA 术后1 年内复发组39 例,未复发组101 例;两组患者按照随机分配原则分为训练集112 例,测试集28 例,训练集和测试集患者的基本特征见表1。
表1 训练集和测试集患者的基本特征[,n(%)]
表1 训练集和测试集患者的基本特征[,n(%)]
注:※肿瘤位置特殊指瘤灶邻近膈肌、胆囊、胃肠、胆管或位于第一肝门区、肝包膜下等部位
2.2 筛选最佳的影像组学特征 对每个患者提取影像组学特征共提取734 个,对2 次勾画的VOI 进行一致性分析,仅保留ICC≥0.75 的特征,剔除112 个特征;在训练集进行方差阈值分析,以P>0.05 为标准,剔除1 个特征;使用K 最佳分析,以绝对值>0.05为标准,剔除541 个特征;最终使用LASSO 回归分析,利用5 折交叉验证中最优的Lambda 值,选择最佳影像组学特征子集,共筛选出8 个影像组学特征,筛选流程及系数分布见图2 和图3。
图2 LASSO 模型选择影像组学特征
图3 LASSO 降维后8 个惩罚系数非零的影像组学标签及其系数
2.3 机器学习构建影像组学的预测模型 基于筛选出来的8 个最稳定的影像组学特征建立LR、SVM、RF 分类器的预测模型,3 种分类器影像组学模型在训练集和测试集的诊断效能见表2;所构建的3 种影像组学预测模型在训练集和测试集中的ROC 曲线见图4。
图4 训练集及测试集基于LR、SVM、RF 分类器的ROC 曲线
表2 3 种分类器影像组学模型在训练集和测试集的诊断效能
肝细胞癌的预后与年龄、性别、肿瘤大小、肿瘤位置、微血管浸润(microvascular invasion,MVI)、病理分级以及转移复发等多种因素有关,尤其以转移复发为重要的独立影响因素。因此,有效预测HCC患者射频消融术后的早期转移复发有助于临床医生选择合适的个性化治疗方案,改善早期肝癌患者的预后,提高患者的总体生存率[13]。MRI 图像蕴含着大量的信息,利用影像组学技术对肿瘤整体进行检测,能够更为全面的了解肿瘤的特性,而且减少了肿瘤患者的有创检查,为HCC 患者的预后提供了一种新的诊断方法和思路。
影像组学已经在肝癌复发预测中得到了广泛的应用。此前有多项研究表明,利用影像组学技术能够对肝癌根治性切除术[14-16]、肝移植术[17,18]以及肝癌射频消融[19,20]术后的早期复发进行预测,所构建的模型均有较好的预测性能。Hui T 等[21]使用术前MRI 提取290 个纹理参数,以预测手术切除后730 d 内HCC 患者的复发情况。结果表明,基于增强MRI 的平衡期纹理特征做出了最大贡献,预测准确率达84%。Yuan C 等[22]通过提取CT 门脉期图像的纹理特征,证实了纹理特征与HCC 射频消融术后的早期复发密切相关,且研究发现将临床病理因素和影像组学特征联合构建的复发预测模型,其对RFA 治疗后早期复发的预测效果明显高于单纯临床因素模型(P<0.0001)。
基于以上的研究基础,本实验从MRI 的T2WI影像上筛选了一系列影像组学特征,最终选择了8个最具潜在预测价值的影像组学特征。其中有3 个为一阶统计量(firstorder)特征,1 个为灰度区域大小矩阵特征,1 个为灰度相关矩阵特征,3 个为灰度长度游程矩阵特征。Firstorder statistic 代表了灰度级直方图信息,描述图像中灰度级的全局分布;GLSZM代表了量化图像中的灰度级区域;GLDM 量化图像中的灰度依赖,描述了一个体素灰度的次数和其邻域中的相关体素;GLRLM 则可量化VOI 内灰度的游程。这些影像组学特征囊括了一阶统计量特征和纹理特征,更全面的反映肿瘤的异质性,能够作为肝癌RFA 术后早期复发的独立预测因素。
基于相同的序列和特征降维方法,不同的机器学习模型诊断效能有一定差异。建立机器学习分类模型可以进一步挖掘被保留的影像组学特征间的相关信息,通过肉眼无法识别的细微特征对疾病进行诊断、鉴别和预后预测。本研究基于LR、SVM 和RF3 种分类器模型性能的对比,结果显示3 种分类器模型在训练集和测试集中均表现出了较好的预测性能,都能有效预测肝癌RFA 术后早期复发。其中,本研究构建的3 种预测模型的稳定性比较结果为:RF>SVM>LR。虽然基于RF 分类器构建的肝癌RFA术后早期复发的T2WI 影像组学预测模型在训练集中特异度和准确率低于LR 和SVM,但差距较小。RF 模型在测试集中的整体表现较另外2 种预测模型更优。提示本研究构建的3 种预测模型,基于RF分类器构建的预测模型不仅具有较好的诊断效能,还具有良好的稳定性,在实际应用中,LASSO 筛选特征和RF 进行分类的有机结合,可以在影像组学的研究中有效协作[23,24]。
本研究存在一定的局限性:①模型的可重复性差,本研究ROI 全部为人工勾画,部分肝癌病灶与正常肝组织分界不清,在MRI 图像上分割肿瘤时容易导致分割不准问题;②本研究对T2WI 进行影像组学分析,结果中体现出来的信息及预测效能有一定的局限性,在以后工作中应继续收集病例,以期获得标准化、大样本量的影像数据,继续对功能成像及增强扫描图像进行更加全面的影像组学分析。另外,本研究旨在选择那些对肝癌RFA 治疗后早期复发最有预测价值的影像特征,而通过LASSO 降维算法选取的8 个影像组学特征参数,可能会拒绝一些潜在有预测价值的特征参数。
综上所述,基于治疗前T2WI 影像组学的预测模型在预测肝细胞癌预后方面具有较高的价值,可为肝癌RFA 术后早期复发预测提供新的手段,具有较好的临床应用前景。