何颖 周显军 陈鑫 朱呈瞻 董蒨
(青岛大学附属医院,山东 青岛 266003 1 小儿外科; 2 肝胆胰外科)
肝细胞癌是常见的原发性肝脏肿瘤,占肝脏恶性肿瘤的75%~85%[1-2],肝细胞癌患者术后复发率高,预后较差[3-4]。微血管侵犯是影响肝癌患者术后早期复发和长期生存的重要因素[5-6]。因此,术前预测微血管侵犯情况对肝细胞癌患者治疗决策的选择及综合预后评估有重要的临床价值。但术前不能通过影像学检查直接检测到肝癌微血管侵犯情况,并且微血管侵犯术前病理活检的效果也不尽人意,从而限制术前对肝癌患者微血管侵犯情况的评估。
在肿瘤学领域,影像组学正在成为预测肿瘤异质性的重要工具,利用影像组学,可将传统医学图像转化为高维、定量和可开发的图像数据,从而建立肿瘤预测模型来定量描述肿瘤表型和肿瘤微环境[7-8]。研究表明,影像组学在评估肝细胞癌患者的总生存期、肿瘤复发以及治疗反应等方面具有重要的应用价值[9-10]。目前,影像组学已成功应用于鼻咽癌、非小细胞肺癌和直肠癌等肿瘤的研究[11-13]。最近的研究表明,基于增强CT的影像组学模型可以高效、无创地预测微血管侵犯情况,为肝癌患者术前是否存在微血管侵犯的明确诊断提供了可靠的依据[14-15]。本研究旨在建立并评估基于CT影像纹理特征的影像组学列线图,以预测肝细胞癌患者术前微血管侵犯发生情况。
选取2013年1月—2018年12月于我院肝胆胰外科接受肝切除术的271例肝细胞癌患者的临床资料。患者纳入标准:①术后病理学检查证实肝细胞癌的患者;②肝切除术前2周行上腹部CT增强扫描检查,扫描范围从肝脏的顶部到双肾下缘的患者。患者排除标准:① CT图像质量差,无法识别或图像缺如的患者;②术前行其他抗肿瘤治疗的患者;③CT影像特征提取过程中存在误差的患者。患者按照3∶1的比例随机分为训练组(n=203)和验证组(n=68)两组,训练组用于建模,验证组进行模型预测效能的评估。患者的一般资料见表1,组间一般资料比较差异均无显著性(P>0.05)。
患者均使用CT(德国西门子,美国GE医疗)检查获得上腹部的三期增强扫描图像。扫描范围从肝脏的顶部到双肾的下缘。扫描参数设置为:电压120 kV,电流200~350 mA,扫描层厚5 mm,层间距5 mm,矩阵512×512。
由两名具有10年以上工作经验的放射科医师使用ITK-SNAP(版本3.6.0. http://www.itksnap.org)对纳入患者的CT图像中动脉期、静脉期、延迟期肿瘤区域进行分割勾画。2周后,由其中一名放射科医生随机选取50例肝细胞癌患者,再次勾画ROI,评估ROI的组内差异。另一名放射科医生对随机选取的50例肝细胞癌患者独立进行肿瘤区域绘制,以评估肿瘤区域的组间差异。当观察者内部和观察者之间绘制肿瘤的组间差异值和组内差异值均超过0.75时,认为该特征具有良好一致性。
使用3D Slicer软件(版本:v.4.10.2 https://www.slicer.org/)中的radiomics包进行图像预处理以及特征提取。影像组学特征主要包括一阶统计特征(Firstorder)、形状形态特征(Shape)、基于灰度共生矩阵的特征(GLCM)、邻域灰度差值矩阵特征(NGTDM)、灰度游程矩阵特征(GLRLM)、灰度大小区域矩阵特征(GLSZM)、基于灰度依赖矩阵特征(GLDM)以及小波和拉普拉斯变化(Log)。
使用最小冗余最大相关算法和最小绝对收缩和选择算子算法对影像组学特征进行降维筛选,选择出具有最佳鉴别价值的影像组学特征计算影像组学特征评分。
基于影像组学特征评分构建影像学模型,将多因素分析获得的有差异的临床危险因素构建临床模型,通过Logistic多元回归分析构建联合临床危险因素和影像组学特征评分的联合模型,并绘制联合模型训练组的列线图。通过ROC曲线分析评价临床模型、影像学模型、联合模型这3个模型在训练组和验证组中预测肝癌微血管侵犯的效能,计算相应曲线下面积(AUC)以及95%CI、灵敏度、特异度。绘制校准曲线和决策曲线。通过Delong检验比较各个模型预测效能差异是否具有统计学意义。
使用Python 3.8(https://www.python.org/)进行统计学分析,连续变量以M(P25,P75)表示,分类变量以百分比(χ/%)表示。连续变量使用Mann-WhitneyU检验。分类变量使用卡方检验或Fisher精确检验。使用R语言的“RMS”和“RMDA”软件包分别获得列线图和决策曲线。以P<0.05为差异具有显著性。
从肝脏肿瘤分割区域中动脉期、静脉期、延迟期每一期分别提取到1 130个特征,采用最小冗余最大相关算法和最小绝对收缩和选择算子算法对所提取的影像学特征进行特征选择,最终获得16个影像组学特征并计算相应评分。
表1 两组患者的一般资料比较
影像组学特征评分=log-sigma-0-5-mm-3D_GLRLM_RunLengthNonUniformityNormalized×-7.421e-1+wavelet-LHL_GLSZM_LargeAreaEmphasis×1.279e-9+wavelet-HLH_GLSZM_LargeAreaHighGrayLevelEmphasis×1.286e-13+wavelet-HHH_Firstorder_Variance×1.174e-2+wavelet-HHL_GLDM_LowGrayLevelEmphasis×-4.336e-2+V_original_Shape_Elongation×-1.198e-1+wavelet-LHL_NGTDM_Busyness×3.707e-5+wavelet-LLH_GLSZM_SizeZoneNonUniformity×1.720e-4+wavelet-HHL_GLSZM_LargeAreaLowGrayLevelEmphasis×2.411e-10+wavelet-HLL_GLCM_InverseVariance×-2.736e-1+wavelet-HLL_GLSZM_ZoneVariance×2.971e-10+D_wavelet-LHL_GLRLM_LongRunEmphasis×3.142e-3+wavelet-LHH_GLCM_Imc×2.124+waveletLLL_GLDM_LargeDependenceLow-GrayLevelEmphasis×-1.276e-3+wavelet-LLL_GLCM_JointEnergy×-7.959e-1+original_GLRLM_LongRunLowGrayLevelEmphasis×-7.867e-3+1.037
对训练组影像组学特征评分和临床因素进行单因素二元回归分析显示,BMI、肿瘤直径、乙肝表面抗原、甲胎蛋白、血小板/淋巴细胞、影像组学特征评分与微血管侵犯的发生相关(P<0.05)。多因素二元回归分析结果显示,影像组学特征评分、肿瘤直径、甲胎蛋白为肝癌微血管侵犯发生的独立预测因子(P<0.05)。见表2。
表2 训练组的临床危险因素和影像组学特征评分的单因素和多因素回归分析
在训练组中,联合模型的列线图如图1A所示,联合模型的AUC为0.80(95%CI=0.75~0.85),特异度为0.84,灵敏度为0.69;临床模型的AUC为0.72(95%CI=0.67~0.77),特异度为0.86,灵敏度为0.59;影像学模型的AUC为0.71(95%CI=0.65~0.77),特异度为0.84,灵敏度为0.52。见图1B。联合模型预测微血管是否侵犯效能显著优于影像学模型(Z=-3.18,P<0.05)和临床模型(Z=3.70,P<0.05),临床模型的预测效能与影像学模型无显著差异(P>0.05)。
验证组的ROC曲线显示,联合模型的AUC为0.75(95%CI=0.65~0.85),特异度为0.81,灵敏度为0.59;临床模型的AUC为0.70(95%CI=0.60~0.78),特异度为0.83,灵敏度为0.56;影像学模型的AUC为0.62(95%CI=0.50~0.74),特异度为0.78,灵敏度为0.47。结果见图1C。联合模型的预测效能与影像学模型和临床模型相比较差异均无显著的统计学意义(P>0.05)。同样的临床模型的预测效能与影像学模型相比较差异没有显著的统计学意义(P>0.05)。
A为联合模型训练组的列线图,B、C分别为训练组和验证组中影像学模型、临床模型、联合模型预测微血管侵犯效能的ROC曲线
训练组和验证组的校准曲线显示出良好的一致性(图2A、B)。决策曲线分析表明,加入影像组学特征评分之后的列线图模型临床应用价值高于影像学模型和临床模型(图2C、D)。
A:训练组校准曲线,B:验证组校准曲线,C:训练组决策曲线,D:验证组决策曲线
影像组学研究的重点是通过使用计算机算法提取大量定量特征来分析图像特征,这些特征可以提高医学图像的预测性能。本研究使用最小冗余最大相关算法和最小绝对收缩和选择算子算法两种特征选择方法识别出最强的特征。同时使用十倍交叉验证减少模型过拟合。最小冗余最大相关算法和最小绝对收缩和选择算子算法能够适用于在相对小的样本容量下分析大量的影像组学特征集,并避免过拟合,从而有助于减少数据噪声的干扰。该技术在临床的多项研究均有应用[16-17]。
本研究最终选择了与微血管侵犯相关性最强的特征计算影像组学特征评分,构建逻辑回归模型并优化,结果显示影像学模型的训练组AUC为0.71,验证组AUC为0.62,提示影像组学特征评分具有预测肝癌微血管侵犯的能力。同时,在单因素和多因素回归分析中,影像组学特征评分均P<0.05,表明影像组学特征评分具有显著的独立预测肝癌微血管是否侵犯的能力,与之前的研究结果一致[18]。影像学研究表明微血管侵犯与许多因素密切相关,包括肿瘤体积大小、肿瘤数目、肿瘤边缘不光滑、组织学病理分级、肿瘤的大体分类、瘤周强化等[19-21]。本研究中在将单因素结果中P<0.05的临床因素纳入多因素回归分析后,结果显示肿瘤直径、甲胎蛋白和影像组学特征评分具有独立预测肝癌微血管侵犯的能力。本研究显示,肿瘤直径有意义的截断值为5 cm,甲胎蛋白有意义的截断值为200 μg/L,也与之前的研究结果一致[19-21]。LEI等[22]在米兰标准下建立了具有代表性的动态磁共振成像特征的列线图模型,预测乙肝病毒相关性肝细胞癌患者微血管侵犯的发生情况,该模型包括肿瘤直径、数量、血管状况、血清甲胎蛋白水平、血小板水平、乙肝病毒核酸载量等危险因素,结果显示了令人满意的预测效率,其AUC在训练组中为0.81,在验证组中为0.80。
本研究中,无论是在训练组还是在验证组,结合影像组学特征评分、肿瘤直径和甲胎蛋白建立的联合模型在回归模型中AUC表现均优于影像组学评分模型和临床模型;临床模型对微血管侵犯预测能力和影像学模型并无明显差异;最后绘制校正曲线对模型性能进行评价,计算得到预测模型的均方误差为0.018,评价结果显示模型预测性能较好,表明影像组学方法对预测肝癌微血管侵犯具有一定效能。根据决策曲线对患者的临床净获益进行分析,显示当阈概率在0.10~0.75时,患者的临床模型和联合模型净获益均较高,表明模型的安全性较好。
目前CT和MRI等影像学工具已经被证实具有诊断或者预测肝癌微血管侵犯的作用[23-25],也说明影像组学方法具有稳定性和可重复性的特点。本研究采用影像组学的方法,对肝癌患者微血管侵犯状况进行术前的无创预测,但是本研究仍有很多不足之处:①本研究为单中心研究。虽然所有CT图像都是使用统一的扫描仪和标准化的图像采集序列获得的,但为了减少结果的偏差和方差,并提高模型的稳健性,还需要进一步确认来自其他机构患者的数据。②本研究采用的是手工方式绘制二维ROI,比较费时,也不便于临床应用,因此,实现影像病变区域分割的智能化将是影像组学未来研究的重点内容。③影像组学特征和生物学行为之间的复杂联系很难完全阐释清楚,或许将来可以借助影像基因组学相关指标特征,来进一步明确影像组学特征和生物学特性之间的潜在相关性。
综上所述,本研究基于肝细胞癌患者术前CT影像的影像组学特征及相应临床危险因素,构建肝细胞癌患者微血管状况的预测模型,分析显示该模型效能评价良好。
利益冲突声明:所有作者声明不存在利益冲突。
ConflictsofInterest: All authors disclose no relevant conflicts of interest.
伦理批准:本研究涉及的所有试验均已通过青岛大学附属医院医学伦理委员会的审核批准(文件号QYFYWZLL26949)。
EthicsApproval: All experimental protocols in this study were reviewed and approved by The Medical Ethics Committee of The Affi-liated Hospital of Qingdao University (Approval Letter No.QYFYWZLL26949).
作者贡献:董蒨、朱呈瞻、何颖参与了研究设计;何颖、周显军、陈鑫参与了论文的写作和修改。所有作者均阅读并同意发表该论文。
Contributions: The study was designed byDONGQian,ZHUChengzhan, andHEYing. The manuscript was drafted and revised byHEYing,ZHOUXianjun, andCHENXin. All the authors have read the last version of the paper and consented to submission.