杨 鸣,郭盛仁,周菊英(通信作者)
(1 苏州大学附属独墅湖医院放疗科 江苏 苏州 215000)
(2 苏州大学附属第二医院放射科 江苏 苏州 215004)
胃肠道间质瘤(gastrointestinal stromal tumor,GIST)是消化道最常见的原发间叶组织肿瘤[1],几乎所有GIST 均有恶性潜能[2]。通常低度恶性潜能的GIST 可行手术或定期复查处理,高度恶性潜能的GIST 需在术前或术后使用伊马替尼等药物治疗[3],因此术前准确预测其危险度分级有重要意义。本研究基于常规CT 平扫及增强扫描图像开发和验证影像组学模型,探讨该模型用于预测GIST 危险度分级的价值。
回顾性分析2017 年1 月—2020 年12 月间苏州大学附属第二医院行常规CT 平扫和增强检查,并经手术病理证实为GIST 的176 例患者。参照美国国家卫生研究院2008 年改良版分级标准,分为低度恶性潜能组(极低危险18 例及低危险65 例)和高度恶性潜能组(中危险41 例及高危险52 例)。176 例患者中男性84 例,女性92 例;年龄24 ~85 岁,平均年龄(60.34±11.85)岁。纳入标准:①经手术病理确诊且危险度分级明确;②CT检查前未接受任何相关治疗(如穿刺活检和靶向药物);③病灶直径大于1 cm;④手术与CT 检查间隔不超过1 个月。排除标准:①病灶为复发或转移灶;②CT图像不完整,质量不佳者。
入组患者均采用GE 64 排螺旋CT(Discovery CT 750 HD)进行扫描。扫描前约2 h 口服阴性造影剂充盈胃肠道。先行平扫,随后采用高压注射器经肘静脉注射对比剂碘海醇(浓度为300 mgI/mL),剂量为0.5 g/kg。采用团注跟踪技术监测腹主动脉(腹腔干水平)CT 值,动脉期扫描在监测点CT 值达到150 HU 后8 s 进行,静脉期扫描在动脉期扫描完成后35 s 进行,延迟期扫描在静脉期扫描完成后120 s 进行。扫描参数:自动管电流,管电压120 kV,层厚5 mm,层间距5 mm,准直器宽度64×0.625 mm。
将0.625 mm 薄层图像从PACS 系统中以DICOM 格式导出,使用Mazda 软件(Version 4.8)对图像进行分割。选择病灶显示最清晰的时期,在肿瘤最大层面勾画感兴趣区(ROI)(包含肿瘤内部的坏死囊变、血管及钙化部分),随后复制ROI 至其他时期,不吻合的部分进行微调。每个ROI 可提取279 个特征,先使用Mazda 软件自带的筛选方法(费希尔参数法、分类错误率联合平均相关系数法和交互信息法)对每个时期的特征进行初步降维获得30 个特征。然后采用LASSO(least absolute shrinkage and selection operator regression)算法将4 个时期共120 个特征进一步降维;最后使用Mann-Whitney U检验及多重共线性检验,验证LASSO 算法获得的特征。将最佳特征集纳入逻辑回归获得影像组学模型。
采用R 软件(Version 4.0.3)进行数据分析。使用C 统计量(C-index)评价模型区分度;使用Brier 评分评价模型的校准度。利用加强Bootsrap 法(重抽样1000 次)对模型进行内部验证,获得校准后的C-index 及Brier 评分。以P<0.05 为差异有统计学意义。
LASSO 算法降维获得12 种非零系数特征(图1),经Mann-Whitney U 检验及多重共线性检验后获得10 种特征(表1),即最优特征集。
表1 最优特征集[M(Q1,Q3)]
图1 不同λ 取值下的均方误差图
模型C-index 为0.943,95%置信区间为0.911 ~0.976,Brier 评分为0.093,95%置信区间为0.065 ~0.121,模型特异度为0.892,灵敏度为0.860,准确度为0.875。校准后的C-index 为0.928,校准后的Brier 评分为0.112。模型校准曲线见图2。绘制模型预测高低度恶性潜能的ROC曲线显示AUC值为0.943,截断值为0.537(图3)。
图2 模型校准曲线图
图3 影像组学模型ROC 曲线图
CT 检查是GIST 患者的首选检查方法,一些CT 征象可用于预测GIST 的危险度分级[4],但这些征象的应用很大程度受到医师经验的影响。Liu 等[5]利用CT 图像进行直方图分析显示动脉期直方图参数最大频数有最大的AUC 值0.811。Chen 等[6]基于静脉期图像使用支持向量机构建的模型AUC 值为0.867。Zhang 等[7]基于动脉期图像使用随机森林法构建的模型AUC 值为0.935。任采月等[8]基于静脉期图像使用LASSO 算法构建的模型AUC 值为0.91。上述研究均表明基于CT 图像的纹理分析或影像组学可以用于GIST 危险度分级的预测,但这些研究大多是利用单个时期图像进行,因此提供的信息量可能相对有限;此外,部分研究选取纹理特征种类单一,样本量相对较小,也可能会影响结果的准确性和稳定性。
本研究利用平扫、动脉期、静脉期及延迟期图像构建模型,结果显示该模型具有较好的区分度和校准度,C-index 为0.943(二分类变量中,C-index 和AUC 值相等),均高于上述诸研究AUC 值;Brier 评分为0.093(Brier 评分指预测概率与实际概率的一致程度,范围是0 ~0.25,其值越小校准度越好)。进行内部验证后模型仍具有较高的C-index 和Brier 评分,分别为0.928 和0.112。这表明基于常规CT 平扫和增强图像构建影像组学模型对GIST 危险度分级的预测价值高于单个时期图像构建的影像组学模型。
纳入模型的10 个特征中,Horzl_RLNonUni 是指0°方向游程长度不均匀性,其值越低,图像的纹理粗细越均匀[9],本研究中低度恶性潜能组Horzl_RLNonUni值均低于高度恶性潜能组,表明低度恶性潜能组纹理粗细更均匀,这与宋慧玲等[10]使用RLN 对乳腺癌新辅助化疗效果的预测结果相仿。Entropy 可以反映图像信息复杂程度,熵值越大,图像越复杂。研究表明Entropy 值越大肿瘤侵袭性越高[11-12],这与本研究结果一致,高度恶性潜能组Entropy 值均高于低度恶性潜能组;Correlate 可以反映图像中局部区域的灰度相关性,Correlate 值越大,图像灰度越均匀。本研究高度恶性潜能组的动脉期S(4,-4)Correlate 和静脉期S(5,-5)Correlate 值均高于低度恶性潜能组。可能的原因是高度恶性潜能GIST 微血管再生较丰富,导致局部区域灰度较均匀[13]。Teta2 表示中心像素周围邻近像素灰度加权和,本研究中平扫高度恶性潜能组Teta2 值较高,可能的原因是平扫时高度恶性潜能组密度较高。Perc.90 表示从直方图左边开始,小于第90%体素区间内的平均灰度值,本研究中高度恶性潜能组较低,由于GIST 多为渐近性强化,因此延迟期强化对比度差异更大,另外高度恶性潜能GIST 易坏死囊变,因此平均灰度值较低。
本研究局限性:第一,本研究是一项单中心回顾性研究,选择偏倚不可避免,有待多中心前瞻性研究进一步验证;第二,由于样本量相对较少,本研究未对不同部位GIST 的危险度分级进行研究,GIST 的发生部位与其危险度分级相关,因此利用影像组学对不同部位GIST的危险度分级进行预测有待开展;第三,本研究是基于GIST 最大横轴位图像勾画的2D-ROI 进行,较3D-ROI可能会遗漏一些纹理特征信息。
综上所述,基于常规平扫和增强CT 图像构建的影像组学模型对GIST 危险度分级具有较高的预测价值,可作为一种影像学生物标记物,为临床医师制定治疗方案提供帮助。