徐家军,李 琼,张 虎,唐晓磊,刘希胜
(1.南京医科大学第一附属医院 放射科,江苏 南京 210029;2.芜湖市第二人民医院 医学影像科,安徽 芜湖 241000;3.皖南医学院第二附属医院 转化医学中心,安徽 芜湖 241000)
胃癌位列全球恶性肿瘤发病率第5位、病死率第4位[1],在我国初治胃癌患者仍以进展期居多[2],根治性胃癌切除术仍为首选治疗方案,但5年生存率却较低。目前已有多项研究表明,新辅助治疗在降低胃癌分期、减灭微转移灶等方面具有潜力[3-5]。中国临床肿瘤学会胃癌诊疗指南推荐对于T3-4/N+的患者在术前进行新辅助治疗[3]。因此,在术前建立预测模型识别胃癌临床分期对临床决策有重要的指导意义。双能CT(dual energy computed tomography,DECT)能谱成像具有多参数成像特点,其碘图及低能级的虚拟单能量图像可客观定量地评估肿瘤浸润胃壁的深度和淋巴结有无转移,诊断效能高于常规增强CT,为术前胃癌临床分期提供了一种更加有效的检查手段。本研究基于DECT构建随机森林(random forest,RF)模型探讨其在胃癌术前临床分期中的价值,为临床决策提供参考。
1.1 研究对象 收集2018年12月~2021年7月于南京医科大学第一附属医院行DECT扫描的胃癌患者200例,男149例,女51例,年龄26~79岁。纳入标准:①病理证实为胃癌,并接受胃癌根治术;②术前接受过DECT检查、胃充盈良好的增强图像;③术前无新辅助化疗、放疗等治疗史。排除标准:①病灶难以分辨或胃周脂肪薄弱无法准确测量影响评估;②碘对比剂过敏或肾功能不全、恶病质者;③同时合并其他恶性肿瘤或转移者。200例患者中,Ⅰ+Ⅱ期95例、Ⅲ期105例,按3∶1随机分成训练集、测试集,训练集150例(Ⅲ期组79例、Ⅰ+Ⅱ期组71例),年龄(62.01±10.84)岁;测试集50例(Ⅲ期组26例、Ⅰ+Ⅱ期组24例),年龄(61.04±10.23)岁。
1.2 检查方法 患者禁食6~8 h,扫描前5~10 min饮水800~1 000 mL,并进行呼吸憋气训练。采用Siemens Definition Flash双能CT机,扫描模式为双能量、双期增强,A球管电压100 kV、管电流220 mAs,B球管电压150 kV、管电流110mAs,开启实时动态曝光剂量调节,螺距1.15,球管旋转时间0.5 s,矩阵512×512,扫描层厚5 mm,并以1.5 mm自动薄层重建。通过静脉留置针高压注射非离子型碘对比剂优维显1.5 mL/kg(300 mgI/mL),流速3.0 mL/s,将阈值感兴趣区(region of interest,ROI)置入腹主动脉,在腹主动脉CT值达到100 HU后延迟10 s和40 s后分别行动脉期(arterial phase,AP)、静脉期(venous phase,VP)扫描。扫描范围自膈肌至胃下缘层面。0.6融合图像:由100kV和Sn150kV的数据以0.6加权系数融合而成(即相当于120 kV常规CT图像)。
1.3 图像分析 使用Liver VNC软件,先将图像归一化操作,即在肿瘤轴位最大层面腹主动脉画ROI,可分别获得AP和VP碘图。根据Küpeli等[6]标准,在癌周脂肪组织距胃壁约1 mm处沿其浆膜走行区和远离胃癌正常胃周脂肪组织区分别划取条形或圆形ROI(25~50 mm2),宽度≤5 mm,然后在双期图像上分别测量癌灶、胃癌周围脂肪组织及正常胃周脂肪组织的的碘基值、融合图像CT值和VP 70 keV单能量图像CT值、最厚径与最大径。避开血管、坏死或气-液平交界面存在的伪影区。ROI确定后可获得双期融合图像的CT值以及相对应的碘值(iodine concentration,IC)、标准化碘值(normalized iodine concentration,NIC)(NIC=IC肿瘤/IC腹主动脉)及VP 70 keV单能量图像CT值。两名有6年、10年丰富胃癌诊断经验的医生进行独立阅片和测量,意见分歧时共同协商决定。同一病例在双期图像上划取的ROI形状、位置及大小尽量相同,分别测量2次取其平均值,见图1。
患者男性,66岁,胃癌。A~C.动脉期碘图,IC癌灶-AP、IC癌脂-AP、IC正脂-AP分别为2.0、0.0、0.0 mg/mL,对应NIC值及融合图像CT值分别为0.21、0.00、0.00和76.20、-99.50、-93.40 HU;D~F.静脉期碘图,IC癌灶-VP、IC癌脂-VP、IC正脂-VP分别为4.0、0.0、0.0 mg/mL,对应NIC值及融合图像CT值分别为0.78、0.00、0.00和86.70、-80.30、-96.80 HU;G~I.静脉期70 keV单能量图,单癌灶-VP、单癌脂-VP、单正脂-VP的CT值分别为107.80、-85.40、-99.10 HU。
1.4 模型的建立与验证 本研究使用训练集来构建RF模型,使用独立测试集进行验证。首先将所有的临床及影像变量纳入单因素分析,筛选单因素分析中P<0.2[7]的变量纳入RF模型中进行特征筛选。该模型使用平均下降基尼指数(mean decrease gini index,MDGI)来评估变量的重要性。Gini指数是计算每个变量对分类树上每个节点观测值的异质性的影响,并以此来衡量各变量的重要性,Gini值越大对应变量的重要性越大,并以此得到重要性排序。
2.1 训练集和测试集单因素分析 训练集中的AP胃癌的癌灶IC值(IC癌灶-AP)、胃癌周围脂肪组织IC值(IC癌脂-AP)、NIC癌灶-AP、NIC癌脂-AP、融合图像癌灶的混合能量CT值(混癌灶-AP)、混癌脂-AP、混正脂-AP和IC癌脂-VP、NIC癌脂-VP、混癌灶-VP、混癌脂-VP、混正脂-VP、70 keV单能量癌灶CT值(单癌灶-VP)、单癌脂-VP、单正脂-VP及最厚径、最长径的P值均<0.2,见表1。
表1 训练集和测试集中患者的临床、影像定量参数资料单因素分析
2.2 RF模型的建立与验证 本研究将所有的临床及影像变量经单因素分析后,将P<0.2的候选变量纳入训练集并采用RF算法筛选出5个变量:IC癌脂-VP、最厚径、NIC癌脂-VP、最长径、单癌脂-VP,进行模型构建,其Gini值依次分别为0.201、0.197、0.190、0.159、0.141。通过十折交叉验证的方法发现,联合使用这5个变量的模型综合预测效能较高,训练集和测试集术前预测Ⅲ期组和Ⅰ+Ⅱ期组胃癌的曲线下面积(AUC)分别为0.924、0.917,见表2、图2。
表2 RF模型训练集及测试集预测临床分期的ROC曲线
图2 RF模型训练集(A)与测试集(B)的ROC曲线
本研究基于DECT定量参数构建RF模型,对胃癌术前临床分期进行了研究,RF模型对胃癌术前临床分期有较好的鉴别能力,区分Ⅲ期与Ⅰ+Ⅱ期胃癌的AUC>0.9。为了更好地适应临床胃癌初诊治疗决策和个体化精准医疗需求,2016年10月的第8版胃癌TNM分期系统新划分出了临床分期(cTNM)[8],本研究以此为依据将cT3-4aN+M0列为Ⅲ期,而cT1-2NanyM0与cT3-4aN0M0则列为Ⅰ期+Ⅱ期。目前,对于无远处转移的Ⅲ期胃癌国内、外指南[3,9]均推荐在手术前进行新辅助治疗,通过降低局部和远处复发风险来改善患者的总生存期,还可提高局部晚期胃癌患者的病理完全缓解率,是患者预后的独立预测因素[10]。
DECT突破了以往常规增强CT在胃癌术前分期诊断方面的局限性,不仅可以获得胃癌的形态结构信息,而且利用多参数成像可定量评估癌肿浸润胃壁的深度及淋巴结有无转移。碘图可对组织内的碘含量进行直观伪彩显示,且人眼对色彩的敏感性优于灰阶图像。严映等[11]研究发现,利用DECT静脉期碘图的浆膜高强化征可区别T3与T4a期胃癌,且阳性诊断率高于融合图像(P<0.05)。另外具有高对比噪声比的低能级单能量图像,可优化显示低对比度组织结构的细节。王学东等[12]研究显示,静脉期DECT的低能级单能量CT值、IC值及NIC值可鉴别T2与T3期胃癌,联合NIC和单能量CT值可使诊断效能进一步提升。前期研究显示,DECT静脉期的定量参数诊断效能高于动脉期,与本研究的结果一致。可能由于动脉期主要反映肿瘤功能性微血管的血供特点,而静脉期反映的是肿瘤血供平衡及部分非功能性新生血管,碘对比剂受限于肿瘤组织周边纤维成分的阻隔而廓清延迟,所以静脉期的碘值能更准确地反映肿瘤内部的碘含量及其分布情况。有研究表明,浸润深度可作为早期胃癌淋巴结转移的独立预测因素[13]。另有学者通过测量静脉期甲状腺乳头状癌原发灶的碘基值可预测颈部中央组淋巴结的转移[14]。王睿等[15]研究显示,胃癌的T分期、最厚径及静脉期NIC值是影响淋巴结转移状态的独立预测指标,可提高术前诊断N分期的准确性。胃癌的最大径、最厚径代表肿瘤累及的范围和浸润的深度,而胃壁间的毛细淋巴管最终汇入淋巴管道丰富的浆膜下层,随着癌肿浸润深度的增加,与毛细淋巴管网的接触面越大,淋巴结转移的概率也会升高。
RF是基于决策树的一种集成学习方法,其处理大数据能力较强,对多元共线性不敏感,可很好地预测多达几千个变量,且在分类预测方面具有稳定、易操作、精确和不易过度学习等优势。在综合预测效果方面RF模型优于Logistic回归模型[16]。且相较于支持向量机、人工神经网络等机器学习运算法则,RF也具有优势[17]。徐青青等[18]利用门脉期CT图像纹理特征构建的RF模型在鉴别结直肠癌KRAS基因突变最终模型的AUC为0.93,留组交叉验证显示平均AUC为0.81。近来有学者采用RF算法构建的基于静脉期DECT影像组学模型和组合模型在诊断胃癌浆膜侵袭方面均表现出较高的诊断效能,在训练集和测试集队列中,影像组学模型AUC分别为0.90、0.90,组合模型AUC分别为0.93、0.93[19]。本研究建立的RF诊断模型也有着较高的诊断效能,训练集和测试集AUC值分别为0.924、0.917,与既往研究结果相似,具有临床实用性。
本研究存在一定的局限性。首先,研究纳入的样本量较小,故需要纳入更多患者进行结果验证;其次,研究缺乏外部验证,故模型的泛化能力优势尚不得知,后续需收集独立的外部数据进行结果验证。
综上,本研究通过RF算法对变量进行了筛选、去冗余,并构建及内部验证了胃癌新辅助治疗诊断模型,为临床决策提供了一种新思路和参考依据,使得患者在个体化治疗中受益。