张天奇,王芊婷,李明洋,苗政,付宇,刘统
结直肠癌(colorectal cancer,CRC)是常见的高死亡率癌症之一[1],其中直肠癌患者约占27%~58%[2]。影响直肠癌预后的主要因素包括原发肿瘤分期、淋巴结转移状态、环周切缘状态等[3]。我国结直肠癌诊疗指南及欧洲肿瘤学会直肠癌指南指出[4,5],未突破肌层外(T1-T2期)与已突破肌层外(T3-T4期)的直肠癌应采取不同的治疗方案,对于未突破肌层外的直肠癌仅需切除原发肿瘤,保证足够切缘,切除直肠系膜内淋巴脂肪组织及可疑阳性的侧方淋巴结;而已经突破肌层外的直肠癌则应扩大切除范围并进行区域淋巴结清扫。因此,术前准确鉴别直肠癌T1-T2期与T3-T4期,对制定患者个性化诊疗方案具有重要临床意义。
影像组学作为图像分析的一种新方法,目的是从传统影像检查所获得的图像数据中提取高通量的影像组学特征,并从中找到可以反映底层组织生物学信息的特征,通过分析和建模后达到预测患者临床终点、病理类型、基因表达、肿瘤行为等目的[16],建立了图像与精准医疗的“桥梁”。基于影像组学方法建立直肠癌精准诊断模型已成为研究热点之一[17,18],为直肠癌的临床诊治决策提供了新的思路和方法。目前,基于IVIM功能图像建立影像组学模型进行术前直肠癌T分期方面的研究鲜有报道。因此,本研究拟建立基于术前IVIM功能图像和高分辨T2WI图像的多参数影像组学模型,旨在探讨其对直肠癌术前T分期的预测价值。
1.研究对象
回顾性纳入2019年1月至2020年1月共113例直肠癌患者。病例纳入标准:①术前2周内进行了包含IVIM序列的高分辨率直肠MRI扫描;②术后病理结果证实为直肠癌。病例排除标准:①有其他肿瘤病史(2例);②术前高分辨率MRI图像质量不佳(22例);③术前行放疗或化疗(5例);④临床信息缺失(1例)。最终有83例患者纳入本研究(T1:T2:T3:T4=6:16:47:14),同时搜集患者临床信息以进行后续分析。将患者分为肿瘤未突破肌层外组(T1+T2)与肿瘤已突破肌层外(T3+T4)组,两组比例为(T1+T2):(T3+T4)=22:61。本研究获得我院伦理委员会的批准,由于是回顾性研究,因而未进行患者知情同意书的签署。
2.MRI检查方法
所有患者在检查前禁食4 h以上,检查前1 h使用开塞露清洁肠道。MRI检查均采用3.0T MRI扫描仪(Discovery MR750,General Electric Company),采用自旋回波序列,扫描参数: TR 2800 ms,TE 59.8 ms,层厚4.0 mm,层间距1.0 mm,矩阵256×256,视野34 cm×34 cm,翻转角90°,b值分别取0、25、75、125、150、175、200、400、600、800、1000 s/mm2。
3.影像组学研究流程
图1 根据美国癌症联合委员会(AJCC)的肿瘤分期系统(第八版)绘制的直肠癌T分期示意图。Tis:原位癌,肿瘤只存在于上皮或固有层中,未侵及黏膜层;T1:肿瘤已侵及黏膜下层,但未侵及固有肌层;T2:肿瘤已侵及固有肌层,但未侵及浆膜下层;T3:肿瘤侵及浆膜下层,但未突破浆膜层;T4a:肿瘤突破浆膜层;T4b:肿瘤侵及邻近器官或结构。 图2 病灶分割示意图。a) 高分辨率T2WI序列病灶勾画;b) DWI(b=1000s/mm2)序列病灶勾画。
感兴趣区的分割:由两位放射科医师(医师A有4年腹部影像诊断经验,医师B有6年腹部影像诊断经验)对肿瘤原发灶进行二维图像的逐层勾画,在勾画图像时两位医师对于患者最终的病理结果均不知晓。使用ITK-SNAP(V3.6.0,www.itksnap.org)软件进行感兴趣区(regions of interest,ROI)勾画,具体方法如下:①IVIM功能序列ROI勾画:在DWI(b=1000 s/mm2)图像上逐层沿肿瘤边缘(高信号)进行勾画,并将ROI映射到ADCmap、Dmap、fmap功能图像中;②T2WI序列ROI勾画:逐层勾画肿瘤的轮廓(高或稍高信号,图2)。
使用RIAS(www.riascloud.com)[19, 20]软件进行影像组学特征提取和分析建模,在ADCmap、Dmap、fmap、T2WI、DWI(b=1000 s/mm2)图像中分别提取了1427个影像组学特征,最后每例患者的图像都提取了7135个影像组学特征。提取所得的影像组学特征分为以下两类:①基于特征类,包括一阶统计量特征、形状特征、纹理特征等;②基于过滤器类,包括小波变换、拉普拉斯变换、对数特征、指数特征、分形维数特征等。
通过对组内相关系数(intra-class correlation coefficient,ICC)的计算来评估组学特征的稳定性。从每个序列中随机选择20例患者用于ROI的稳定性评价。采用观察者内ICC评估同一位医师间隔一周的两次分割计算的一致性,采用观察者间ICC评估两位医生的第一次分割计算的一致性。当ICC不低于0.75时,则认为被分析的组学特征具有较好的再现性和可重复性。影像组学特征进行特征筛选前,在训练组中进行特征标准化后映射到验证组,以保证验证组特征的独立。
特征筛选和模型的构建:将上述单序列中的每组影像组学特征采用最小绝对收缩算子算法(least absolute shrinkage and selection operator,LASSO)进行降维,以选择对诊断直肠癌T分期最有价值的特征,得到T2WI序列特征11个、DWI序列特征7个、ADCmap序列特征32个、Dmap序列特征2个、fmap序列特征23个。随机选取70%的病例作为训练组用于建立模型,剩下30%的病例作为验证组进行模型验证。每个序列(T2WI、DWI、ADCmap、Dmap、fmap)均采用逻辑回归(logistic regression,LR)作为机器学习模型,分别建立T分期预测的单序列R评分(单序列模型)。再将每个单序列降维后得到的影像组学特征进行融合,再次使用LASSO进行降维,最终得到多序列融合后的最有价值的影像组学特征32个,同样采用逻辑回归模型构建多序列融合的T分期预测R评分(联合模型)。
图3 特征的筛选及评价。a)用10折交叉验证的方法寻找LASSO的超参数lambda, 模型偏差最低点对应的横坐标为最优的lambda值(虚线); b)图像每条彩色的线代表特征的系数随lambda值的变化曲线,通过图3a寻找到的lambda值(虚线)来确定系数不为0的参数,并将该参数用于最后的模型构建;c)模型特征权重系数柱状图,表示每一个特征在逻辑回归模型中的系数值,系数为负表示特征与模型负相关,系数为正表示特征与模型正相关,且系数绝对值越大,相关程度越大;d)SHAP图中的每一个点可以反映出每一个样本中代表特征对模型的贡献程度。每个点代表1例患者(红色为阳性,蓝色为阴性),SHAP value中0左侧的点表示该患者所代表特征对模型影响为负,0右侧的点表示该患者所代表特征对模型影响为正。
4.统计学分析
采用RIAS软件进行统计学分析。对于人口学信息中的数值变量首先进行正态分布检验,符合正态分布的数据采用t检验进行组间比较,而不符合正态分布的数据采用曼-惠特尼U检验进行组间比较。对于分类变量,均使用卡方检验进行组间比较。影像组学模型的诊断效能采用受试者工作特征(receiver operating characteristic,ROC)曲线、敏感度、特异度等共同评价。使用临床决策(decision curve analysis,DCA)曲线评估影像组学模型的临床应用价值。以P<0.05为差异有统计学意义。
患者的一般临床信息及病理特征见表1。在训练组中(T1+T2)与(T3+T4)患者的所有临床信息差异均无统计学意义(P>0.05),但在验证组中CEA(P=0.049)及肿瘤原发灶位置(P=0.026)在(T1+T2)与(T3+T4)两组间差异有统计学意义,笔者考虑这可能是由于验证组中患者量较少导致的偏倚,进一步分析训练组与验证组间的各项临床信息,结果显示差异无统计学意义。
通过LASSO算法选择单序列中预测价值最高的影像组学特征,再将每个单序列降维后得到的影像组学特征进行融合,再次使用LASSO算法进行降维,最终得到多序列中最有价值的影像组学特征32个,联合模型特征的筛选过程及评价结果见图3。
使用逻辑回归方法建立联合模型,联合模型中所有患者的Rad评分及验证组中患者的Rad评分见图4。在训练组及验证组中,分别绘制了高分辨率T2WI、DWI、ADCmap、Dmap、fmap各单序列模型及联合模型的ROC曲线(图5),各模型训练组与验证组的敏感度、特异度、准确率、F1分数等见表2,其中联合模型在验证组中的敏感度为0.810,特异度为0.750,准确度为0.800,阳性预测值为0.944,F1分数为0.872。
通过ROC曲线分析各模型预测T分期的效能(图5),其中联合序列模型在验证组中的曲线下面积(area under curve,AUC)为0.929 (95%CI:0.78~1.00),高于其他单序列模型的AUC,表明联合模型的诊断效能高于其他单序列模型。DCA曲线显示在0.61~1.0的阈值范围内(图6),联合模型的净收益较大。
直肠癌的发病率、死亡率均较高,给家庭和社会带来沉重负担[21],术前对直肠癌进行准确的分期,制定个性化诊疗方案,对提高患者生存率、改善疾病预后、降低社会医疗负担具有重要意义。相关指南推荐使用高分辨率MRI检查用于直肠癌的分期[4],但由于影像科医生阅片经验差异和图像质量等方面的原因,术前T分期诊断准确性仍有待提高。影像组学方法从医学影像中全面深入地挖掘高维度、深层次信息,分析影像特征与临床数据等信息的关联,以建立疾病的预测模型,进一步深化了医学影像检查的临床作用,作为一种非侵入的检查手段,可以在一定程度上降低医疗成本,更有可能成为临床决策辅助工具[22]。近年来,影像组学技术在结直肠癌诊疗中的应用覆盖了结直肠癌诊疗的各个阶段,体现了影像组学方法在结直肠癌精准诊断方面的巨大潜力[22,23]。
表1 患者临床及病理特征 (n,%)
表2 相关模型在训练组及验证组中的诊断效能
图4 联合模型中所有患者的Rad评分及验证组患者的Rad评分,label0表示阴性(T1+T2),label1表示阳性(T3+T4)。a) 所有患者的Rad评分;b) 验证组患者的Rad评分。 图5 训练组及验证组的ROC曲线。a) 训练组中各单序列模型及联合模型的ROC曲线;b) 验证组中各单序列模型及联合模型的ROC曲线。 图6 DCA曲线。
本研究将IVIM功能图和高分辨T2WI进行融合,建立了影像组学模型,联合了多序列的组学模型在验证组中的敏感度为0.810,特异度为0.750,准确度为0.800,阳性预测值为0.944,F1分数为0.872,AUC达到0.929(95%CI:0.78~1.00),表明本研究所构建的多参数MRI组学模型在直肠癌T分期术前评估方面具有较高的应用价值。
由于IVIM包含ADCmap、Dmap、fmap等多个功能图像,对于功能图像ROI的勾画方式,笔者做了如下考虑:IVIM功能图像糅合了11组b值的病灶信息,是经过后处理所获得的功能图像,在后处理过程中为实现其反映灌注、扩散信息的目的,导致解剖信息的丢失,不利于观察及对病灶的手动分割。DWI(b=1000 s/mm2)序列所采集的图像,能够提供较为清晰的解剖信息,更利于观察和分割病灶[10,24]。同时,ADCmap、Dmap、fmap图像是经软件处理后同步生成的,所以这三种图像上的位置信息均可以与DWI图像中的位置实现对应。综上考虑,笔者选择了将DWI序列中所勾画的ROI映射至IVIM功能图像中的方法。在既往有关IVIM序列的大多数研究中,在后处理软件中勾画病灶后,由软件得出相应测量值,将此测量值作为一项预测因素,这种研究模式并没有完全挖掘IVIM序列图像中蕴含的信息。而影像组学方法可以将图像信息最大化利用,以挖掘更多价值。同时,相较于在后处理软件上勾画病灶,本研究中病灶ROI的勾画并没有将研究过程过度复杂化。在分析了使用不同序列建立的模型后,笔者发现使用T2WI序列建立的模型与最终的融合模型的敏感度、特异度比较接近,且本研究中T2WI模型的评价结果与既往文献报道的报道结果相近[25,26],但T2WI模型的AUC低于融合模型。在Sun等[26]的研究中,从T2WI序列中提取了256个影像组学特征并建立了评估直肠癌T分期的模型,所建立的预测模型AUC值为0.852(95% CI:0.677~1),低于本研究建立联合模型的诊断效能。同时,相较于完全依赖影像医师人工进行评价的T分期研究[27](准确度为78%,敏感度为86%,特异度为65%),本研究联合模型的诊断效能较高。相较于传统仅选择T2WI序列或DWI序列的直肠癌T分期研究,本研究构建的联合模型中既保留了T2WI及DWI序列中的肿瘤形态学信息,同时通过IVIM功能图像增加了模型对肿瘤灌注和扩散的分析,从更多层面反映了肿瘤内部的异质性及肿瘤的行为、特点[28],这可能是本研究建立的联合模型较既往研究中其他模型诊断效能有所提高的原因之一。
本研究存在以下局限性:①本研究仅搜集了本院检查的83例直肠癌患者,样本量较小,导致了验证组可能的偏倚,在后续研究中笔者将进一步扩大样本量并搜集更丰富的临床信息,从而确定他们之间的相关性;②所有患者的MRI图像均来源于同一生产厂商(GE),模型的泛化能力可能受限,其他设备厂商的数据代入到我们所构建的模型内,效能未知;③在IVIM相关研究中,有研究者指出较低的b值范围(<100~200 s/mm2)所得到的图像至关重要[29],但对于临床工作中应使用b值的数量和数值还没有相关的共识或规范公布,因此本研究中选取的b值可能并非最佳值。在未来的研究中,笔者将扩大样本量并改良实验设计,进一步探究相关问题。