王东,周川,王超,张云峰,郭盛,周逢海*
膀胱癌(bladder cancer, BCa)是泌尿系统最常见的恶性肿瘤,在全世界恶性肿瘤的发病率中排名第12 位,死亡率排名第14 位,主要发生在移行上皮[1]。BCa 容易发生在65 岁以上的患者,复发率在50%~80%之间[2]。BCa的临床决策和随访管理主要取决于是否有肌肉浸润、肿瘤的准确分期以及病理分型[3-4]。目前BCa检测的金标准是膀胱镜活检,但成本昂贵和侵入性特征制约了膀胱镜检查的广泛应用,而且膀胱镜对低级别肿瘤的检测精度仍然相当有限,敏感度只有61%[5-6]。医学影像具有快速成像、便捷、无创的特点,是临床上评价BCa 的有效检查手段之一,但影像科医师通过肉眼及主观经验对肿瘤的评估难以挖掘其内部与病理、免疫及生物学行为等相关的深层次信息,对BCa的评估价值依然有限。
近年来,一些研究者提出了影像组学在BCa 精准医学发展中的潜在用途。影像组学源于计算机辅助检测或诊断(computer-aided detection or diagnosis,CAD)系统,是将影像定量分析与机器学习方法结合起来,被认为是CAD 的自然延伸[7]。机器学习是其常用的方法,而深度学习的出现推动了精准医学方法在膀胱肿瘤诊疗中的实际应用。深度学习和影像组学在BCa的早期筛查、诊断和治疗方面取得了显著进展。然而,仍面临一些挑战,包括数据获取和标注的困难、模型的泛化能力和解释性不足等。本文对基于机器学习建立的影像组学及深度学习在BCa精准诊疗研究进展进行综述,旨在为进一步研究提供参考。
影像组学是定量图像分析中的一个新兴领域,旨在将图像的大规模数据挖掘与临床和生物学端点联系起来[8]。影像组学是一种高通量的定量特征提取方法,逻辑回归、支持向量机等传统机器学习方法是影像组学研究中最常用的工具[9]。影像组学可以挖掘多模态医学图像中包含的信息,包括CT、MRI 和超声(Ultrasound, US),然后对这些海量图像进行综合分析以提取表型特征(也称为影像组学生物标志物),并探索患者预后与这些提取的特征之间的关系,从而帮助临床医师改进临床决策[10]。
BCa 的诊断和临床分期通常通过膀胱镜活检或组织学评估来进行[11]。近年来,影像组学技术在BCa准确分级和分期方面显示出潜力。ZHANG 等[12]建立了基于CT 的影像组学模型预测BCa 的病理分级,研究者将145 名接受CT 尿路造影且术后病理证实为BCa 的患者随机分为训练组和验证组,发现在影像组学预测模型诊断BCa 病理分级的AUC 值在训练组和验 证 组 分 别 为0.950(95%CI:0.912~0.988)和0.860(95%CI:0.742~0.979)。表明基于CT 的影像组学模型可以区分高级别和低级别BCa,具有良好的诊断性能。MRI 具有良好的组织分辨率和空间分辨率,从弥散加权成像(diffusion weighted imaging,DWI)提取的影像组学特征在BCa 病理分级的术前预测方面表现出了一定的临床价值。ZHANG 等[13]提出了一种基于影像组学使用纹理特征进行肿瘤分级的方法,他们对61 名BCa 患者(高级别组29 名,低级别组32名)进行了回顾性研究,发现使用最优特征子集的SVM 分类器在BCa 分级中取得了最佳性能。表明使用DWI 和 表观扩 散系数(apparent diffusion coefficient, ADC)图纹理特征的影像组学结合支持向量机分类器,可能有助于BCa术前分级。FENG等[14]评估了基于高b值DWI的影像组学特征对BCa分级的可行性,并比较了高b 值DWI 相对于标准b 值DWI 的可能优势。结果表明,与从传统ADC(b=1000 s/mm2)图中提取的特征相比,从高b 值ADC(b=1700 s/mm2)图中提取的影像组学特征可以提高BCa 诊断的准确性。经腹US 是诊断BCa 的医学影像技术之一,US 可以无创地识别BCa 的位置、大小和形状[15]。GAO 等[16]基于US 图像获取影像组学特征,并建立了两种预测模型进行BCa分期和病理分级的评估,结果显示肿瘤分期预测模型的AUC在训练队列中为0.94,在验证队列中为0.84,病理分级模型获得的AUC在训练队列中为0.84,在验证队列中为0.75,两种模型都显示出良好的预测能力。这表明基于US图像的影像组学模型的开发有望为肿瘤分期和病理分级提供一种无创、经济、可靠和有效的术前预测工具。
淋巴结(lymph nodes, LN)转移是BCa 患者的不良预后因素。因此,准确预测BCa 患者的LN 转移可以改善医疗决策[17]。在临床实践中,MRI和CT常常被用于评估BCa 患者的术前LN 分期,但CT 或MRI 检测恶性LN 的敏感度相对较低(31%~45%),导致部分患者的分期结果不够准确[3]。WU等[18]基于MRI的影像组学特征进行BCa LN 转移的术前预测,结果显示影像组学特征在cN0 亚组中显示出良好的区分度,AUC 为0.8406(95%CI:0.7279~0.9533),提示从MRI 图像中提取的影像组学特征具有术前预测BCa LN转移的可行性。为了评估定量影像组学特征在检测BCa LN转移方面的性能,GRESSER等[19]筛选了1354名接受根治性膀胱切除术并进行LN 切除的BCa 患者,利用术前CT 图像的影像组学特征开发了一种用于BCa 患者pN 状态分类的机器学习模型,将放射科医生的评估与基于影像组学的分析进行了比较,并使用手动和自动分割来检测BCa 中的LN 转移,结果显示手动分割的影像组学特征和放射科医生评估组合模型的AUC 达到了0.81(95%CI:0.71~0.92;P=0.63)。表明利用影像组学特征诊断和辨别结节状态有较高的准确性,目前基于人工LN 分割的模型表现优于自动分割方法。
然而,STARMANS 等[20]基于CT 的影像组学对病理性LN 状态进行了术前预测,为了探究利用影像组学来区分cT2-T4aN0-N1M0 肌层浸润性BCa(muscle invasive BCa, MIBC)患者的pN+(检测到一个或多个LN 转移)和pN0(未检测到LN 转移)的准确性,他们共纳入209 名患者(159 名pN0;50 名pN+),但发现创建的7 个影像组学模型中的影像组学特征在pN0 和pN+患者中差异均没有统计学意义,表明MIBC 患者的LN影像组学特征与pN状态之间没有关联。但因较大的CT切片厚度可能会漏掉较小的LN而导致影像组学模型表现不佳,因此还需要更深入的研究进行验证。
明确区分MIBC 及非MIBC(non-MIBC, NMIBC)对于BCa患者的治疗前决策、治疗后预后及后期临床管理至关重要。CT 和MRI 有助于术前肿瘤分类,MRI 能够提供明确的软组织对比度,相比CT 更能区分MIBC和NMIBC[21]。MRI 的T2WI 能够显示肿瘤深度(NMIBC与MIBC)和累及的膀胱外组织范围[22],然而其诊断准确度(64.7%~83.0%)并不令人满意[23]。一项系统评价研究了影像组学在预测MIBC 方面的诊断效能,结果显示影像组学预测MIBC的敏感度和特异度分别为82%(95%CI:77%~86%)和81%(95%CI:76%~85%),HSROC的AUC为0.88,表明影像组学在预测MIBC方面有较高的诊断性能[24]。ZHENG 等[25]及ZHANG 等[26]基于MRI 和CT 开发的影像组学模型也证明了这一观点。LIU等[27]探索了三参数MRI能否为影像组学预测提供更多的诊断价值,研究者尝试将动态对比增强(dynamic contrast-enhanced, DCE)三维特征整合到影像组学模型中,他们利用从T2WI+DWI(模型一)、T2WI+DCE(模型二)和T2WI+DWI+DCE(模型三)的序列组合中提取的影像组学特征构建了三个预测模型,结果显示三种模型在交叉验证中的AUC 值分别为0.888、0.869 和0.901,三参数模型的性能明显优于两个双参数模型,表明基于三参数MRI的影像组学模型可以为肌肉侵袭的识别提供额外的诊断价值。
膀胱肿瘤的侵袭性和预后往往与特定细胞表达的蛋白分子有密切关联,其中包括Ki-67 和CD8A 等蛋白。这些蛋白通常被用于评估肿瘤的增殖活性以及免疫细胞的浸润情况,从而提供关于膀胱肿瘤侵袭性程度和预后的重要信息。最近有研究指出,影像组学在BCa 术前上述蛋白的预测中均有较高的价值。有研究者构建了基于MRI 的影像组学特征用于预测BCa 术前的Ki-67 表达状态,结果显示构建的影像组学特征在预测Ki-67 表达方面具有良好的性能[28-29]。ZHENG 等[30]使用影像基因组学来预测BCa 中CD8A 表达,该研究表明影像组学特征可能有助于在术前预测BCa患者中CD8A的表达,CD8A是包括BCa在内的多种癌症中有用的预后因素,CD8A 表达低的患者容易出现较差的生存结果,因此通过构建基于MRI的影像组学特征研究CD8A 与肿瘤微环境之间的关联,有助于预测预后和免疫治疗敏感性。上述研究[28-30]提示影像组学特征可以提供额外的术前信息,有助于临床实践中的治疗决策,但仍需收集大量术前BCa 患者MRI 影像组学特征,以进一步评估模型在预测相关蛋白表达方面的性能。
早期对治疗效果和反应评估可以帮助临床医生决定是否在最佳阶段停止化疗。高复发率是BCa 最关键的特征,MIBC患者术后复发率达50%,NMIBC患者术后前两年复发率可达61%[31-32]。因此,术前预测BCa复发的可能性有助于早期干预、制订科学的治疗方案,进而延长患者的生存期及提高生存质量。多项基于CT、MRI的研究表明,影像组学能有效预测BCa疗效和总生存期[33-35]。肿瘤突变负荷(tumor mutation burden, TMB)是反映BCa 免疫治疗的一种新兴预后生物标志物。TANG等[36]研究了CT影像组学特征在预测BCa 患者TMB 状态方面的价值,他们基于影像组学特征进行无监督分层聚类分析,采用logistic 回归和LASSO 回归等建立TMB 预测模型,结果显示模型的AUC 达到0.853,这表明基于盆腔CT 影像组学特征的预测模型具有预测TMB 的良好能力。但该研究是样本量相对较小的回顾性研究,需要更大样本量的多中心研究进行验证。此外,目前影像组学对于BCa患者TMB 的预测能力所依据的生物学解释尚未得到充分阐明,因此仍需要进一步深入的研究来加以厘清。
影像组学在评价BCa 患者的疗效方面发挥了重要作用。CHOI 等[37]的研究证实结合临床和成像预测因子对肿瘤异质性进行影像组学量化,可能有助于预测MIBC 患者对新辅助化疗的治疗反应,为临床制订治疗方案及预后监测提供帮助。PARK 等[38]基于CT图像特征建立影像组学模型,以预测接受PD-1/PD-L1 免疫疗法治疗转移性尿路上皮癌患者的疗效和生存结果,发现基于影像组学的模型在预测免疫治疗结果方面表现良好,并且在独立验证集中显示出与生存结果的显著相关性。综上所述,BCa 影像组学在BCa 疗效评价中扮演着重要角色。它可以预测治疗反应、监测疗效、个体化治疗规划,并在长期随访中发挥作用。然而,为了更好地应用于临床实践,还需要进一步研究和验证,以提高其准确性和可靠性。
深度学习是人工智能的一个分支学科,它使用一种称为人工神经网络的机器学习技术从大型数据集中提取模式并进行预测。深度学习是一种表示学习方法,其中复杂的多层神经网络架构通过将输入信息转换为多层次抽象来自动学习数据表示[39]。与影像组学采取支持向量机、随机森林等传统统计模型进行分类和预测不同,深度学习可以直接使用卷积网络(convolution neural network, CNN)来提取特征进行分类和预测,CNN 是最常用的深度学习网络。CNN 是一类包含卷积计算的前馈网络的模型,主要用于提取图像处理的空间特征,它的主要优点之一是能够自动将第一隐藏层中的低级特征(例如线条)合并为下一隐藏层中的高级特征(例如形状)[40]。
早期诊断对于降低BCa的死亡率至关重要,有研究者基于深度学习在膀胱肿瘤中的诊断效能进行了研究。ZHENG 等[41]提出了一种基于深度学习的弱监督模型用于膀胱肿瘤的诊断,结果表明诊断模型能准确地区分BCa 与正常病理图像(AUC 接近1),在外部验证集的准确率为98.7%(AUC=0.993)。此外,多位学者[42-44]对深度学习提高膀胱镜诊断膀胱肿瘤的准确性也进行了深入研究,涉及的深度学习网络主要为CNN;研究者们分别建立了适合各自研究的深度学习模型,结果证实基于深度学习的膀胱镜检查可以提高BCa在临床实践中诊断效能,具有较好的研究及应用前景。
BCa 患者的治疗选择取决于是否存在肌肉浸润,内壁(inner-wall, IW)和外壁(outer-wall, OW)以及肿瘤解剖边界的精确分割对于改进MIBC的计算机辅助诊断至关重要[45]。因此从MRI 和CT 图像中分割出膀胱壁对于肿瘤的早期发现和辅助诊断具有重要意义。YU等[46]提出了一个级联路径增强U-Net网络,他们使用T2WI 扫描对膀胱进行多区域分割以提高IW、OW 和BT 的分割精度,研究发现该模型可以提高IW、OW和肿瘤的分割精度。MA等[47]开发基于U-Net的深度学习方法(U-deep learning, U-DL),用于CT 尿路造影中的膀胱分割,他们比较了深度学习卷积神经网络结合水平集的方法和U-DL,发现U-DL 能够提供更准确的膀胱分割,并且更加自动化。尽管这些模型取得了成功,但对于多区域膀胱的分割,特别是在MRI 和CT 应用中仍处于初级阶段,自动分割膀胱壁仍面临一定挑战。
ZOU 等[48]基于T2WI 图像的深度学习方法提出了一个多任务BCa 肌肉侵袭预测(multitasking BCa muscle invasion prediction, MBMIP)模型来区分MIBC和NMIBC,发现在多中心测试中,MBMIP模型的准确度、敏感度和特异度分别为84.6%、66.7%和87.9%。ZHOU 等[49]的研究表明基于MRI 的深度学习在BCa 病理分期预测中具有较高价值,他们在深度卷积神经网络(deep convolutional neural network, DCNN)结构基础上提出了一种创新性的深度学习模型PENet,研究证明PENet 在BCa 分期方面比DCNN 算法表现更好,可提高BCa分期预测的准确性。
对于NMIBC患者,准确预测复发对制订个性化的治疗方案和随访管理非常重要。LUCAS 等[50]研究了基于深度学习将数字组织病理学切片与临床数据相结合预测NMIBC患者无复发生存期的价值,结果显示数字组织病理学切片与临床数据联合模型预测1 年和5年复发的AUC分别为0.62和0.76,高于仅使用数字组织病理学切片的模型(AUC 分别为0.56 和0.72)和多变量逻辑回归(AUC 分别为0.58 和0.57),表明与仅使用临床数据或图像数据的模型相比,基于深度学习的联合模型能够提高NMIBC患者复发(5年内)预测的准确性。
与无复发生存期相同,疗效评估同样影响最佳治疗方案的选择。WU等[51]比较了基于迁移学习的不同深度学习-卷积神经网络(deep learning-convolutional neural networks, DL-CNN)模型在BCa治疗反应评估中的性能,发现DL-CNN 可以有效地预测BCa 对化疗的反应。CHA 等[52]开发了一种基于CT 的计算机化决策支持系统(computerised decision support systems T, CDSS-T)用于MIBC 治疗反应评估,该系统使用DL-CNN和影像组学来估计患者对新辅助化疗完全反应的可能性,结果发现单独使用CDSS-T 评估病理性T0 疾病的平均AUC 为0.80,不使用CDSS-T 的医生的平均AUC 为0.74,使用CDSS-T 的医生的平均AUC 为0.77。上述研究结果[51-52]表明,深度学习能提高临床医师预测BCa 对新辅助化疗反应的诊断准确性。
影像组学和深度学习在BCa 的临床应用中都具有独特的价值。影像组学可以提供直观的图像信息,帮助医生做出决策。而深度学习则能够通过自动学习和特征提取,实现更精准和高效地BCa诊断和预测。为了比较影像组学与深度学习在预测MIBC状态方面中的价值,LI等[53]基于T2WI比较了影像组学、单任务深度学习和多任务深度学习方法,发现三个模型在训练组(AUC分别为0.920、0.933、0.932)和测试组(AUC分别0.844、0.884、0.932)中均表现出高性能,多任务深度学习方法在MIBC 的术前预测方面显示出比影像组学和单任务深度学习模型更好的预测能力,这为开展进一步相关研究提供了新的思路。但该研究属于小样本研究,结果需要在未来的研究中使用多中心大样本量来验证。此外,研究中仅使用了T2WI图像,成像信息有限,整合其他序列是否可以提高诊断性能仍需进一步研究考证。未来的研究影像组学和深度学习的综合应用,有望进一步提升BCa的临床诊断和治疗水平。
基于机器学习建立的影像组学和深度学习方法能够提高肿瘤分类、病理分型和术前预测等的准确性,为膀胱肿瘤的精准诊疗提供无创可行的新方法。但目前影像组学和深度学习在实际的临床应用中仍存在以下几点局限性:(1)目前的研究仍存在技术性的缺陷,大量依赖医学影像数据和数据处理能力容易导致模型过拟合。此外,由于缺乏标准化的分析方法,从不同研究中获得的结果可能很难进行比较和评估。(2)目前大多数研究是小样本、单中心的研究[54],模型缺乏外部验证,产生的结果有待进一步证实,未来应基于大样本数据进行多中心、前瞻性验证,以优化研究模型提高实验结果的可靠性。(3)目前影像组学在BCa中的应用仍处于宏观层面,尽管最近有研究提出将基因组学与影像组学进行整合作为有创性活检的替代方式,但进一步验证其在BCa中的临床应用研究甚少。
综上所述,影像组学和深度学习研究尚处于初步阶段,尽管在临床诊断、疗效评估和预后预测方面取得研究成果,但仍存在局限和不足。相信随着大数据和精准诊疗时代的到来,影像组学模型将在为膀胱肿瘤患者提供优质化医疗中提供帮助。
作者利益冲突声明:全体作者均声明无利益冲突。
作者贡献声明:周逢海设计本研究的方案,对稿件重要内容进行了修改,获得了甘肃省重点研发计划基金项目资助;王东起草和撰写稿件,获取、分析本研究的数据;周川、王超、张云峰、郭盛获取、分析本研究的数据,对稿件重要的智力内容进行了修改,其中周川获得了甘肃省自然科学基金项目资助,王超获得了甘肃省人民医院院内科研基金项目资助;全体作者都同意发表最后的修改稿,同意对本研究的所有方面负责,确保本研究的准确性和诚信。