肖园园 景德龙 韩忠杰 娄晶
结直肠癌(colorectal cancer,CRC)是最为常见的消化系统恶性肿瘤之一,其发病率及死亡率在国内癌症中逐年增高,分别位于第三位和第二位[1]。目前诊断CRC 最有效的方式依然是肠镜下活体组织检查,存在出血、穿孔等风险,影像学检查能够直观、全面地显示CRC 的部位、形态、大小、周围侵犯及远处转移等情况,是临床诊疗过程中的重要一环,传统术前影像检查方法包括CT、MRI 和PETCT 等,但是这些检查对CRC 异质性描述效果不甚理想。近年来,影像组学作为一项非侵入新兴技术在肿瘤学领域备受关注,多项研究表明,影像组学可以应用于各种肿瘤的TNM 分期、组织学分级、疗效评价和预后评估[2-3],其在CRC 诊疗过程中也广泛应用,本文就近年来影像组学技术在CRC 诊疗中的研究进行总结及探讨。
影像组学是一个新兴的转化研究领域,旨在通过从传统的医学影像(如CT、MRI 和PET-CT 等)中高通量地提取大量医学影像特征,将这些影像特征转化为高维数据,运用专门的计算机软件筛选出定量的、可挖掘的影像特征用以评价肿瘤时间上、空间上的各种异质性,从而为指导临床决策提供数据支持[4]。
影像组学工作流程主要包括:(1)数据采集。包括医学图像、临床数据及分子数据,获取图像后,应对图像进行预处理,以提高图像质量[5]。(2)图像分割。通常包括手动、半自动、自动三种方式,以获取病灶感兴趣区域(region of interest,ROI)。(3)特征提取及降维,即从分割的ROI 中提取影像组学特征,包括形状特征、直方图特征、纹理特征及基于过滤器的特征(如小波特征、Gabor 特征等),为防止过拟合,需采用聚类分析法、主成分分析法(principal component analysis,PCA)等机器学习方法降维[6],去除冗余、不稳定的特征,选取高性能的特征。(4)模型构建、分类及验证,建立预测/分类模型常用方法有逻辑回归分析、K 近邻算法(k-nearest neighbour,KNN)、支持向量机(support vector machine,SVM)、深度学习等[7-8],构建的预测模型需要进行训练和验证。
近年来,影像组学技术在CRC 诊疗中的应用主要集中在以下几方面:(1)评估术前TNM 分期;(2)预测CRC 的Kirsten 大鼠肉瘤病毒癌(Kirsten rat sarcoma viral oncogene,KRAS)基因突变;(3)预测患者复发、转移及生存;(4)预测局部晚期直肠癌(locally advanced rectal cancer,LARC)在新辅助放化疗(neoadjuvant chemoradiotherapy,nCRT)后的病理完全缓解(pathologic complete response,pCR)情况。
对于早期(T1、T2期)CRC,可直接选择手术切除;而对于局部进展期(T3、T4期)病变,多先行nCRT 降期之后再行全系膜切除术(total mesorect excision,TME)。因此,CRC 患者术前精准评估TNM 分期对治疗方案的选择参考意义重大。Liang等[9]对494 例CRC 患者的CT 图像进行纹理分析,提取了16 个纹理特征作为肿瘤T 分期的独立预测因子,结果显示训练集和验证集的ROC 曲线下的面积(area under curve,AUC)分别为0.792 和0.708。Meng 等[10]对345 例行多参数磁共振成像(MP-MRI)检查的CRC 患者进行肿瘤分化程度评估,结果显示,采用最大相关最小冗余(maximum relevance and minimum redundancy,MRMR)算法和最小绝对收缩和选择(least absolute shrinkage and selection operator,LASSO)算法构建的影像组学特征可用于评估肿瘤分化程度,其AUC 为0.720[95%CI(0.621,0.819)],从而证明了基于MP-MRI 的影像组学特征具有无创性评估直肠癌组织病理学的潜力。张天奇等[11]回顾性分析了83 例CRC 患者的高分辨T2WI 和磁共振体素不相干(IVIM)功能图像,提取1 427 个影像组学特征,通过LASSO 算法进行降维后得到32 个对病理分期最有价值的组学特征,采用逻辑回归模型建立单序列及联合序列Rad 评分,经验证表明,联合序列Rad 评分的诊断效能最佳,AUC 为0.929[95%CI(0.78,1.00)],敏感度、特异度分别为0.81、0.75。上述研究均表明,通过筛选独立的预测因子,建立合适的影像组学模型,可用于CRC 术前预测TNM 分期,为临床决策提供理论支持,而目前相关研究多为回顾性单中心研究,图像来源单一,构建的影像组学模型泛化性差,纹理特征筛选及模型建立,仍需进一步多中心研究支持。
近年来,基因检测技术不断发展,精准医学体系逐渐成熟,将肿瘤的医学图像和基因表达相匹配是精准肿瘤学发展的重要研究方向。目前,对于CRC 研究较多的是KRAS 基因突变。大约40% CRC患者存在KRAS 基因突变,且对于西妥昔、帕尼单抗等抗表皮生长因子抗体(epidermal growth factor receptor,EGFR)靶向药物具低反应性的特点[12]。有研究表明,抗EGFR 靶向治疗的预后预测与特异性KRAS 基因相关,KRAS 基因突变提示抗EGFR靶向治疗存在不良反应,如果采用抗EGFR 治疗,不仅会产生较差的治疗效果,而且会导致生存期缩短[13]。因此,CRC 患者如果进行分子靶向药物治疗,进行KRAS 基因检测非常有必要。樊芮娜等[14]基于MR T2WI 影像组学特征构建影像组学模型、临床模型及影像组学-临床联合模型,评价各模型预测CRC 患者KRAS 基因亚型的效能,结果联合模型预测KRAS 基因亚型的AUC 显著高于临床模型(P<0.05)。此外,KRAS 基因突变与CRC 肝转移患者的特定复发模式密切相关[15],将影像参数与KRAS 状态相关联,比定性影像评估具有显著优势,可以更好地指导癌症治疗,预测治疗反应。Granata等[16]首次采用CE-MRI 成像评估了大鼠肉瘤(rat sarcoma,RAS)基因突变与肝转移患者影像组学数据的相关性,该研究联合了T1WI 和T2WI 多序列图像,基于病变形态学的纹理特征和参数,对每例患者进行单因素和多因素分析,结果,使用单因素分析,获得的准确率并不令人满意,而采用多因素分析和分类方法,仅以纹理特征作为预测因子的KNN算法就达到了最优结果(AUC=0.84),值得注意的是,该研究影像数据来自两台不同型号的MR,可能存在采集参数间的差异,缺少影像组学特征与除病变形态学之外的其他临床预后因素的相结合。
CRC 患者术后局部转移是影响临床治疗是否获益的重要因素,其中淋巴结转移(lymph node metastasis,LNM)是CRC 的主要转移部位,也是导致术后复发和死亡的重要原因,因此术前准确预测淋巴结转移至关重要[17]。李梦蕾等[18]在767 例CRC 患者中,基于增强CT 门静脉期图像的影像组学特征和临床危险因素进行CRC 淋巴结转移的个体化术前预测,单独提取了周围淋巴结的影像组学特征,构建了6 个预测模型进行比较,结果表明临床-原发灶-周围淋巴结联合模型为最佳模型,使AUC 从0.697 0 增加到0.730 5,依据此最优模型生成列线图可实现预测模型可视化,从而实现临床医生术前对CRC 的淋巴结转移风险进行个体化预测。Inchingolo 等[19]提及一项研究中前瞻性地将CRC 转移淋巴结病理和MRI 图像进行了节点到节点的匹配和标记,成功开发了一个新的预测模型能够准确识别LNM,该模型在训练集和测试集中的AUC 值分别为0.846 和0.733,此外该模型还可以进一步区分转移性淋巴结和肿瘤沉积物,表明影像组学可以对CRC 患者区域LNM 早期识别提供可靠的证据,为进一步的前瞻性研究提供了新的研究思路及方法。结直肠癌肝转移(colorectal cancer liver metastases,CRLM)在约25% 的CRC 患者中发生,更为常见的是同步性转移(14%~17%)而不是异时性转移(8%~15%)[20]。Lee 等[21]利用卷积神经网络(convolutional neural networks,CNN)分析Ⅰ~Ⅲ期2 019 例CRC 患者的肝脏CT 影像学特征,预测CRLM 的5 年异时性转移(5-year metachronous liver metastasis,5YLM),使用VGG16 卷积神经网络模型提取肝脏影像特征并进行预处理,PCA 降维后并将第1 主成分(PC1)至第10 主成分(PC10)等新特征集作为预测模型的成像特征,将具有PC1 和临床特征(年龄、性别、T 分期、N 分期)的模型进行关联性研究,结果临床-影像组合模型预测CRLM 5 年异时性转移的性能最高(平均AUC 为0.747),但是该模型中,肝脏影像学特征缺乏对5 年死亡率额外的预测能力(平均AUC 为0.690),而且缺少同时包含腹部CT 图像和临床信息的开放性数据库,导致模型泛化能力差。
影像组学技术也被用来预测CRC 患者的生存预期,进而帮助临床进行治疗选择和患者分层。诸多学者发现一些影像组学特征与无进展生存期(progression free survival,PFS)和总生存期(overall survival,OS)相关[22-23]。最近的一项研究中,Lv等[22]回顾性分析196 例经病理证实的CRC 患者(Ⅰ~Ⅳ期)的18F-FDG PET-CT 影像资料,术前临床因素、血清肿瘤标志物和PET-CT 影像特征被纳入PFS 分析,研究中构建了一个预测各期CRC 患者预后的原始模型(M1),通过基因18F-FDG PETCT 影像组学模型(M2)对Ⅲ期CRC 患者的PFS 进行单独评估,结果临床-生物学-影像学综合模型M1 预测PFS 效果最佳[C 指数0.780,95%CI(0.634,0.877)],肿瘤标志物糖类抗原19-9(carbohydrate antigen 19-9,CA19-9)对M1 模型的预后预测贡献最大,而影像组学特征对M2 模型的预后影响更大,因此利用术前18F-FDG PET/CT 影像组学可以准确预测CRC 预后,对协助CRC 个体化精准治疗的管理和决策具有潜在价值,期待尝试进行前瞻性研究,以进一步验证该模型,并研究分阶段(如ⅢA、ⅢB、ⅢC)患者的预后。
目前,nCRT 降期之后行TME 是LARC 的标准治疗方案,10%~25%的患者在放化疗后实现pCR,这些对放化疗反应良好的患者,可实施仔细定期监测的观望策略[24],因此,术前预测准确的nCRT 效果,对于制订个体化诊疗方案至关重要。预测和评估nCRT 治疗效果的首选影像检查是MRI,MRI 影像组学技术已经在无创预测LARC 患者nCRT 后病理完全缓解方面得到了普及,目前相关研究中多存在一定的局限性,比如用于验证的患者数量不足,或者缺乏与放射科医生MRI 判读的比较等。一项对114 例LARC 患者的研究表明,基于T2WI 的影像组学模型在预测pCR 方面的诊断效果优于T2WI 和弥散加权成像(diffusion weighted image,DWI)的定性评估[25]。为了测试影像组学技术在CRC 患者中的稳定性,Shahzadi 等[26]表明,只有一项研究可以用于外部验证,提示该研究总体上缺乏可重复性,需要进一步标准化,才可作为一种有用的临床工具。Shin 等[27]回顾性分析898 例LARC 患者,评价基于MRI 数据的影像组学模型预测LARC 患者nCRT 后pCR 的效果,并将其与放射科医生的视觉评估进行比较,该研究主要采用了T2WI、表观弥散系数(apparent diffusion coefficient,ADC)序列,同时进行了大规模验证来评估上述模型,结果显示T2WI 模型、ADC 模型和两者联合模型的AUC 分别为0.82、0.79 和0.82,T2WI 和联合模型之间没有差异,而ADC 模型的表现不如联合模型,T2WI 模型对肿瘤回缩分级的分类性能优于放射科医生分类性能,其敏感度(80.0%)较高,特异度(68.4%)较低。以上研究均表明基于MRI 数据建立的影像组学模型可用于评估LARC 患者对nCRT 的pCR,为选择器官保留策略的患者提供有价值的信息,但未来应该集中在标准化MR 协议的多中心研究上,以验证和测试影像组学模型的可行性及其在日常临床实践中的潜在用途。
影像组学在CRC 术前分期、基因突变预测、预后预测及新辅助治疗效果评估方面已取得阶段性研究成果,然而,对复发风险高的患者进行整体辅助放化疗的获益评估是临床的一大挑战[28],CRC Ⅲ期患者是全球公认的可以从放化疗中获益的患者,而对于具有其他临床危险因素的Ⅱ期患者,放化疗的优势仍存在争议,下一步研究的主要领域应是侧重评估影像组学在对可能受益于辅助放化疗的非转移性CRC 高危患者进行分层方面的表现。尽管目前影像组学技术在CRC 诊疗中具有良好价值,但应该注意的是,影像组学技术在常规实施之前,仍面临诸多挑战:医学影像数据缺乏标准化和验证,预测模型泛化能力不足,缺乏前瞻性多中心研究等。因此,亟需制定并严格遵守标准化的图像采集和重建方案,引入新理论,如FAIR 数据管理准则[29],构建标准化医学影像数据库,同时通过增加数据样本量和数据多样性以提升模型的泛化性,因此未来的发展方向是多中心研究,即通过联合多中心数据可解决样本量和多样性的问题[30]。笔者认为,通过国内外学者的共同努力,随着人工智能技术的不断发展,影像组学技术可以在CRC 诊疗中实现从临床研究转化为临床常规实践,从而促进CRC 的个性化精准治疗。