崔达华 ,赵 莹,刘爱连,武敬君,郭 妍,李 昕,吴艇帆,崔景景,左盼莉
(1.大连医科大学附属第一医院放射科,辽宁 大连 116011;2.通用电气药业(上海)有限公司,上海 200000;3.慧影医疗科技(北京)有限公司,北京 100080)
肝细胞癌(Hepatocellular carcinoma,HCC)的主要治疗方式有手术切除、肝移植、消融术、经肝动脉化疗栓塞、化学药物全身治疗等[1]。肝切除术是HCC的重要治疗手段,但根治术后5 年内肿瘤复发率高达70%[2]。HCC 患者的预后预测由于肿瘤病灶内部异质性而具有很大难度[3]。传统的影像手段仅能够凭借医师个人经验获取常规影像特征,忽略了更多肉眼无法分辨的有价值的影像特征,因此难以全面客观地对HCC 的预后进行术前预测。影像组学是近年来研究较为广泛的一种影像定量评估手段,能够将图像转化为多维度定量参数,更全面客观地反映肿瘤内部特征。影像组学特征能反映肿瘤的生物学特性,与肿瘤的预后密切相关[2]。最近研究指出,CT影像组学预测模型具有术前预测HCC 患者3 年生存期的价值[4],但动态增强MRI 影像组学对HCC 术后3 年复发的预测价值尚未见报道。本研究拟探讨动态增强MRI 影像组学列线图预测HCC 切除术后3 年复发的价值。
回顾性纳入2007 年1 月—2016 年9 月我院符合以下标准的HCC 患者(图1)。纳入标准包括:①接受部分肝切除术并通过术后病理确诊为HCC;②术前2 周内行腹部1.5T MRI 平扫及L 肝脏快速容积采集(Liver acceleration volume acquisition,LAVA)动态增强扫描。排除标准包括:①在MRI 检查前接受任何抗癌治疗(包括放疗、化疗、生物治疗及介入治疗);②图像质量差,信噪比低或运动伪影严重;③临床资料不完整;④术后3 年内失访。最后80例患者(90 个病灶)纳入研究,男66 例,女14 例,年龄36~81 岁,平均(57.9±10.0)岁。90 个HCC 病灶以5∶2 随机分为训练集和测试集,最终,64 个纳入训练集,26 个纳入测试集。
收集患者相关临床资料,包括性别、年龄、乙型肝炎病史、肝硬化病史、甲胎蛋白(AFP)(正常水平:<5.8 ng/mL)、癌胚抗原(CEA)(正常水平:<5 ng/mL)、丙氨酸氨基转移酶(ALT)(正常范围:9~50 U/L)、天冬氨酸氨基转移酶(AST)(正常范围:15~40 U/L)、γ-谷氨酰转肽酶(GGT)(正常范围:10~60 U/L)、白蛋白(ALB)(正常范围:40~55 g/L)、总胆红素(TBIL)(正常范围:5.1~19.0 μmol/L)和Child-Pugh 等级(A 或B)。
图1 HCC 患者招募流程。Figure 1.Recruitment process of patients with hepatocellular carcinoma.
所有HCC 患者在切除术后至少随访3 年,通过增强CT 或MRI 扫描定期监测复发情况,随访截止日期为2019 年9 月。复发标准:本院CT 或MRI 检查或病理学检查确定为HCC 肝内复发或远处转移。HCC 病灶中复发49 个(训练集35 个,测试集14个),未复发41 个(训练集29 个,测试集12 个)。
本研究采用1.5T MR 扫描仪(Signa,HDxt,美国GE 公司),患者仰卧位,采用8 通道腹部线圈,行上腹部MRI 平扫和动态增强扫描。所有患者在扫描前禁食4~6 h。扫描参数如下:①T1WI:TR/TE=400 ms/8.0 ms,FOV=320 mm×320 mm,矩阵=320×192,NEX=2.0,层厚=5.0 mm;②T2WI:TR/TE=5 000~7 000 ms/125 ms,FOV=320 mm×320 mm,矩阵=320×192,NEX=4.0,层厚=5.0 mm;③LAVA 动态增强扫描:经肘静脉高压注射器团注对比剂Gd-DTPA(钆喷酸葡胺注射液,德国Bayer Schering Pharma AG),0.1 mmol/kg 体质量,速率2.5 mL/s,分别于注药后40 s、70 s 及90 s 后扫描,获得动脉期、门静脉期及延迟期图像。
首先,由具备2 年MRI 读片经验的观察者1 使用ITK-SNAP 软件,于增强3 期MR 图像的各个层面逐层手动勾勒HCC 病灶边缘,随后由具备10 年MRI 读片经验的观察者2 检查修订,并保存三维感兴趣区(Volume of intertest,VOI)(图2)。再将DICOM 格式的增强MR 图像和保存的VOI 传输至Radcloud 平 台(Huiying Medical Technology Co.,Ltd,北京,中国)。
图2 女,60 岁,肝右叶HCC。图2a~2c 分别为轴位、矢状位和冠状位动脉期图像,在轴位图像上逐层手动勾勒HCC 病灶边缘;图2d 为病灶融合后的三维示意图。Figure 2.A 60-year-old female confirmed with HCC in the right lobe of the liver.Figure 2a~2c:The axial,sagittal and coronary images on the arterial phase,respectively.The lesion was manually delineated around the edge in axial image on each slice.Figure 2d:Three-dimensional diagram of the lesion after fusion.
基于Radcloud 平台对病灶提取增强3 期各1 029个影像组学特征,包括一阶特征(描绘多个体素值的空间分布)、形状特征(描绘形状和大小)、纹理特征(灰度共生矩阵(GLCM)、灰度运行长度矩阵(GLRLM)、灰度级区域大小矩阵(GLSZM))以及高阶特征(经指数、平方、平方根、对数和小波变换)。
采用最大相关最小冗余(Maximal relevance and minimal redundancy,mRMR)算法、最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,LASSO)方法进行特征降维,采用逐步回归方法将筛选得到的影像组学特征代入多变量Logistic 回归分析,得到有意义特征的各自回归系数进行加权,分别构建基于动脉期、门静脉期以及延迟期的影像组学评分(Radscore),并利用十折交叉验证方法对结果进行验证。对预后相关临床因素进行多变量Logistic 回归,采用自动向后剔除方法,逐步回归迭代得到有意义的临床因素(包括性别、肿瘤大小、病理分级),构建临床评分模型。然后联合上述得到的预测效能最佳的期相的Radscore,绘制列线图,并通过决策曲线分析(Decision curve analysis,DCA)评估其临床应用价值。
Kolmogorov-Smirnov 检验计量资料是否符合正态分布,符合正态分布的计量资料用均数±标准差()表示,不符合正态分布的计量资料用中位数(P25,P75)表示。计数资料采用χ2检验进行比较,计量资料采用独立样本t 检验或Mann-Whitney U 检验进行比较。P<0.05 为差异有统计学意义。通过ROC 曲线评估构建的动脉期、门静脉期以及延迟期的Radscore 的预测效能,基于Delong 检验得到3 个不同期相下效能最佳的Radscore。通过ROC 曲线评估列线图的预测效能。
所有统计分析均通过R studio(Version 1.0.143-C 2009-2016 R studio)软件包进行处理。
男66 例,女14 例,年龄36~81 岁,平均(57.9±10.0)岁。69 例单发,21 例多发,共90 个HCC 病灶,肿瘤大小0.70~11.64 cm,平均(3.59±1.99)cm。训练集中复发和未复发组间的AFP 水平、病理分化程度差异有统计学意义(P<0.05),其余特征差异无统计学意义(P>0.05);测试集中复发和未复发组间的总胆红素差异有统计学意义(P<0.05),其余特征差异无统计学意义(P>0.05)。
经mRMR 算法和LASSO 方法降维后,分别构建基于3 个期相的组学评分模型,通过Delong 检验,经动脉期筛选出9个最有预测价值的影像组学特征构建的影像组学评分模型最优(表1,图3),Radscore=0.196+0.243×特征7-0.141×特征8-0.172×特征3-0.090×特征4-0.298×特征5-0.240×特征6-0.076×特征2-0.077×特征1+0.356×特征9(表2),相应的影像组学评分效能见图4,表3。
纳入分析的临床因素包括性别、年龄、乙型肝炎病史、肝硬化病史、AFP、CEA、ALT、AST、GGT、ALB、T-BIL水平以及Child-Pugh 等级(A 或B)。12 个临床因素经逐步回归迭代得到3 个与预后相关的临床危险因素,分别为性别、肿瘤大小和病理分化程度,建立相应的临床评分模型(表4),临床评分模型效能见图4,表3。
训练集中基于动脉期构建的影像组学评分的预测效能最优,联合动脉期影像组学评分和临床评分来构建列线图(表5,图5),列线图的效能见图4,表3。列线图的诊断效能显著优于临床评分模型的诊断效能(P=0.019),但并未显著优于影像组学评分(P=0.799)。决策曲线分析表明,加入影像组学评分之后的列线图模型比未加入影像组学评分的临床评分模型的临床应用价值高(图6)。
表1 基于3 个期相建立的影像组学评分模型的预测效能
表2 基于动脉期图像筛选的影像组学特征
表3 影像组学评分、临床评分模型及列线图的预测效能
图3 LASSO 模型选择的影像组学特征。图3a:LASSO 模型中调节参数(λ)的选择。顶端数值表示相应的特征数,本研究取左边第1 条垂线对应的最佳λ 取值,选择得到了具有非零系数的9 个特征。图3b:随着调节参数(λ 值)变化,不同影像组学特征LASSO 系数的变化情况。Figure 3.Selection of radiomics features by the LASSO regression model.Figure 3a:Tuning parameter (λ) selection in the LASSO regression model.The value on the top represented the number of radiomics features.We chose the optimal values of the LASSO tuning parameter(λ) indicated by the first vertical lines on the left,and selected nine nonzero coefficients.Figure 3b:The LASSO coefficients of different radiomics features varied with the log(λ).
表4 临床危险因素
表5 列线图的构建因素
图4 训练集(图4a)和测试集(图4b)的影像组学评分、临床评分模型及列线图的ROC 曲线分析。Figure 4.The ROC curves of the radscore,clinical score and nomogram in the training(Figure 4a) and testing set(Figure 4b).
图5 预测HCC 切除术后3 年复发可能性的列线图。每个变量对应的预测点在列线图最顶端的比例尺上。将所有变量的预测点相加,投影在列线图底部刻度上的总点数代表术后3 年复发的可能性。Figure 5.The nomogram predicted the recurrence of HCC within three years after hepatectomy.Each variable corresponded to a predicting point on the scale at the top of the nomogram.After adding up all the points,the total points projected on the scale at the bottom of the nomogram represented the probability of the recurrence of HCC within three years after hepatectomy.
图6 基于动脉期的影像组学评分、临床评分模型和列线图的决策曲线分析。Figure 6.The decision curve analysis for the radsore based on the arterial phase,clinical score and nomogram.
HCC 是世界第三大癌症致死原因,手术切除是肝脏储备功能良好的Ⅰa、Ⅰb 和Ⅱa 期HCC 的首选治疗方式,但HCC 患者预后较差,其术后5 年的复发和转移率可达40%~70%[1,5],严重阻碍患者生存期延长和预后改善。影像学检查和血清肿瘤标志物检查是监测HCC 术后复发的主要方式。MRI 具有较高的软组织分辨率,能够实现多序列、多参数成像,在HCC 的诊断及鉴别诊断方面展现出更多优势。传统影像学图像特征,如边缘强化、瘤周实质成分强化、卫星灶和肿瘤大小等,虽然对HCC 术后复发的风险具有一定的预估价值,但是忽略了病灶内部很多潜在特征[6]。影像组学将医学图像转化为高通量的定量数据,全面挖掘病灶内部微观信息,定量描述肿瘤内部异质性特征[7],为术前预测HCC 术后复发提供定量信息,以达到精准、个体化诊疗的目的。影像组学特征具有预测HCC 的总生存期、复发和治疗反应的潜在价值[8]。刘璐璐等[4]及Zhou 等[9]研究表明,CT影像组学在术前预测HCC 术后复发及1 年、3 年生存期方面具有一定的价值。列线图可结合多个临床因素,将复发风险预测模型的复杂公式简化,为个体化的临床治疗决策提供可视化的参考依据[10]。列线图已经应用于肝内胆管癌、胃癌、乳腺癌和肺癌等多种癌症的预后预测[11-14]。最近研究表明,基于增强MR 联合临床危险因素和影像学特征的列线图可在术前预测HCC 术后早期复发[8]。
本研究基于动脉期构建的影像组学评分的诊断效能最优,最终选择联合动脉期影像组学评分和与临床评分来构建列线图。刘璐璐等[4]应用影像组学模型预测原发性肝癌3 年生存期的研究也表明,基于CT 动脉期测试集模型的曲线下面积(AUC)(0.861)高于门静脉期的AUC(0.750),动脉期预测模型的泛化能力高于门静脉期。
测试集中,列线图模型与影像组学评分对HCC切除术后3 年复发的预测效能相近(AUC 分别为0.830 和0.820),经Delong 检验,二者AUC 无显著统计学差异(P=0.799),提示影像组学评分与列线图模型预测效能相当。加入临床因素在一定程度上提升了列线图的诊断效能,但并无统计学意义,考虑这可能与本研究中样本量较少有关,同时笔者认为常规临床危险因素仍然具有一定的参考价值,故保留在最终的列线图模型中。本研究中有统计学差异的临床危险因素在训练集和测试集不一致,可能是导致临床评分模型在测试集中效能不高的原因,但是,即使是在训练集中有统计学差异的临床危险因素,也未能显著提升列线图模型在训练集中的预测效能,可见临床因素对列线图模型没有太大贡献。该结果与Zhou 等[9]研究结果类似,在基于CT 影像组学模型术前预测HCC 术后早期复发的研究中,影像组学模型的预测效能(AUC=0.817)与联合临床因素的预测模型的预测效能(AUC=0.836)差异无统计学意义(P=0.164),Zhou 等经共线性分析指出,纳入研究中的临床因素与影像组学特征的相关性不高,临床因素在联合模型中相关性低可能是因为临床因素对联合模型的贡献远小于影像组学特征。本研究中,临床评分模型与列线图模型的AUC 有统计学差异(P=0.019),表明在单纯临床危险因素中加入影像组学评分可显著提高术前预测HCC 切除术后3 年复发的效能。DCA 表明,加入影像组学评分后的列线图模型比单独临床评分模型的临床应用价值高,可辅助临床医生术前预测HCC 晚期复发的可能性,优化患者术前的治疗决策。
本研究属于回顾性单中心研究,样本量较少,预测效能有限,有待进行更大样本量的研究;其次,本研究尚未将HCC 患者术后3 年内的进一步抗肿瘤治疗纳入预测模型;再次,多参数MRI 和多模态影像数据会涵盖HCC 病灶的更多信息,故基于多参数MRI 和多模态影像数据的影像组学研究将会为肿瘤的预后提供更高价值,值得进一步深入研究。
综上所述,基于术前动脉期MRI 的影像组学列线图可以用于预测HCC 切除术后3 年复发,影像组学评分的预测效能与列线图模型的预测效能相当。