李松 何屹
前列腺癌(Prostate cancer,PCa)是欧美国家最常见的男性肿瘤,发病率和死亡率高居前列,我国PCa的发病率也在逐年增加,导致了巨大的社会和经济成本。2020年有大约140万男性被新诊断为PCa,其中大约37.5万例PCa患者可能因此而死亡[1]。但由于PCa起病隐匿,发展缓慢,早期不易发现,当肿瘤体积增大压迫尿道引起下尿路梗阻症状又易与良性前列腺增生相混淆[2]。如果能早期发现PCa,患者的治愈率可达到95%以上[3]。又由于PCa患者中只有部分病例具有临床意义,因此筛选出该部分患者对于避免过度诊断和过度治疗至关重要。目前诊断PCa主要依靠病理活检穿刺,但影像学检查,MRI尤其是多参数磁共振(multiparametric magnetic resonance imaging,mpMRI)作为诊断工具具有不可替代的作用,在PCa的诊断、分期、治疗决策和随访中发挥着越来越大的作用[4-5]。通过mpMRI可以减少PCa过度诊断,实现更好的病变检测、病变分类和体积量化。为临床医生做出是否需要行前列腺穿刺活检提供精准的依据。虽然mpMRI是一种强大的成像方式,但是也有其局限性。不同机构的图像采集技术和设定的差异均会导致成像质量发生变化,这就可能使得图像的异质性增大。并且由于mpMRI需要放射科医生对于多幅图像审查、权衡、耦合,这不仅增加了放射科医生的额外负担,同时也使阅片的过程复杂化,此外,各种良性前列腺病变与PC图像上存在相似部分,诊断的准确性受限于读片医生的专业性和经验[6-7],从而影响mpMRI在PCa中,尤其是早期PCa中的诊断正确性。总之,mpMRI的诊断效能会受到受试人群、MRI执行、放射科医生经验、是否考虑其他临床指标的影响[8]。为了mpMRI的高质量执行和报告,计算机辅助检测(computer-aided detection,CAD)系统在PCa诊断中显示出良好的性能,而基于AI的CAD系统在PCa检测具有巨大的潜在价值[9]。
1.1 机器学习(machine learning,ML) ML是AI的一个重要分支,其是基于统计技术的编程,包括了无需显式编程即可学习和预测特定任务的算法。与经典的算法相比,其无需进行特定的编程,能够自行利用接触的大量新数据并随着时间推移进行自我改进学习。主要包括三种不同类型的ML算法[10]:(1)监督学习:特征是学习过程之前需要进行训练数据的标记;(2)无监督学习:特征是未对训练数据进行初步的人工划分;(3)强化学习:特征是能从错误和成功中自行学习,但需要持续的反馈。长期以来,这些ML技术一直都是CAD应用程序的主要技术[11]。ML能够随着时间的推移学习和改进其任务,同时暴露于大数据和新数据[10]。ML算法通过提取和利用特征来学习和预测[12]。在前列腺MRI领域,这些特征主要是从T2加权序列和具有ADC图的DWI中提取的。图像特征选择属于放射组学领域。放射组学从感兴趣区域(region of interest,ROI)中提取定量特征,例如可疑病变的注释,以描述 ROI的独特属性,ML算法的学习任务就会选择并使用这些重要的特征。
1.2 深度学习(deep learning,DL) DL是机器学习的一个特定子集,这种方法是利用算法,在结构上模仿人类的神经结构[13]。在医学成像分析中的应用,数据被转换为特征向量,从影像中导出构成网络的输入神经元。在输入和输出之间,可以增加可控数量的隐藏层,这些隐藏层也是由具有各种结构的神经节点构成。每个由数值代表的节点都与不同强度的其他层中的节点相连,从而编码最终结果的输出神经元[14]。DL不需要先验特征提取,因为该算法在训练期间学习提取复杂和抽象的特征[10]。DL算法可以分为利用一维特征输入的典型算法,或利用二维和三维特征输入的卷积神经网络(convolutional neural networks,CNN),例如前列腺mpMRI序列,CNN常用于医学图像分析[15],在结构上包括输入层,散布在池化层中的卷积层,然后是标准的多层神经网络中的全连接层,最后是输出层。CNN利用局部感受野、权重共享和二次采样三种机制,显著增加了模型的识别能力。
目前,人工智能在前列腺肿瘤上的研究主要包括对前列腺器官的分割分区、对前列腺病灶的病变检测定位与病变分类[11,14]。
2.1 前列腺的分割分区 MRI上前列腺的分割具有重要的临床用途,包括准确评估前列腺的体积大小,确保血清前列腺特异性抗原密度(prostate-specific antigen density,PSAD)的准确性;手工描绘前列腺器官费时费力,而且人为误差大。基于DL的AI解决方案为分割前列腺及分区显示出不错的结果。WANG等[16]的研究中,使用3D全卷积网络开发的T2加权MRI的全自动前列腺分割模型。AI模型与手动分割之间的Dice相似系数(Dice Similarity Coefficient,DSC)为0.88。GEOFFREY等[17]基于DL开发了ProGNET,对T2加权MRI进行的自动分割前列腺,在回顾性分析中优于U-Net,并进行了前瞻性队列研究,ProGNET(DSC=0.93)优于放射技术人员(DSC=0.9)。并且ProGNET每个案例的分割仅需35 s,明显优于放射技术人员。SANFORD等[18]利用2D和3D架构结合迁移学习的DL方法在648例患者的研究中,对整个前列腺和移行带(transition zone,TZ)分割。最终整个前列腺和TZ的平均DSC分别为0.931和0.89,均表现出了不错的性能结果。前列腺的分割是AI在前列腺MRI中最常见的研究应用。而且目前也有部分算法获得FDA批准在美国面前用户使用。拥有强大的前列腺分割AI算法能够减少活检准备时间,并且可以利用PSAD实现风险分层。还能提高前列腺病变检测和分类的效能。
2.2 前列腺病灶的病变检测 PCa检测算法可以通过向读者呈现带有概率图和/或分割的可疑区域来帮助自动化前列腺MRI评估。识别前列腺内病变位置有助于手术和靶向活检的计划、放射治疗剂量与毒性计算,以及预测癌症特异性生存期和预后情况[19]。WU等[20]利用深度神经网络开发了一种PCa自动定位网络,与人工标记的结果相比,平均误差<1.64 mm,误差约为6%。ISHIOKA等[21]利用U-net和ResNET架构来检测靶向活检确认的PCa病变,并在两个人群中进行了测试,该模型的PCa检测的AUC分别为0.636和0.645,其有可能提供可重复的解释以及更高水平的标准化和一致性。EETHARAMAN等[22]将MRI与接受过根治性前列腺切除术患者的数字病理相配对,获得真实的癌症标签,基于卷积神经网络模型,创建了SPCNet,实现了对PCa的检测和定位,且效能与放射科医生相接近,并能帮助识别放射科医生错过的病变。YANG等[23]利用3D Retina U-net提出了一种全自动PCa检测系统,该系统可以对mpMRI的PCa病变定位,分割,并且在ProstateX数据集和IVO数据集中均显示出优异的结果[24]。
2.3 前列腺病灶的病变分类 前列腺内病变分类AI模型用于对图像进行分类或对预先注释的ROI进行分类,范围从二分类(临床有意义PCa和临床无意义PCa)到多分类分级。使用ML对病变分类,大致的工作流程是MRI检查用作输入,可疑区域由专家读者手动或半自动注释并用于提取图像特征。图像特征包括语义特征,如大小、形状和血管分布,以及通过定量描述ROI异质性的不可知特征[25],图像的特征可以通过临床变量进行延伸扩展。之后,与输出标签关系密切的特征被选择并用于ML分类模型。该算法的输出是两个类别的预测分数,例如恶性与良性病变,用于注释ROI。KAN等[26]的工作中,回顾性收集了单个中心的数据,对内部测试集的验证产生了PCa表征的每个病变AUC为0.83。但是,在外部队列上进行测试时,每个病变的表现下降至0.67的AUC,表明外部验证对于稳健的表现评估的重要性[26]。与ML相比,DL不需要特征选择,因为特征是在训练期间学习的。ROIs包括病变或前列腺周围的斑块或体积,并且可以根据临床特征进行扩展。选定的ROI被输入至DL分类算法中,在该算法中提取特征并为相应的输入预测结果。ZHAO等[27]回顾性收集了多中心共1,861例患者,开发了基于双参数磁共振的DL模型,用于鉴别良性和恶性病变。在外部验证队列中,DL模型与放射科医生基于前列腺成像和报告及数据系统的性能无显著差异。或者,DL可与ML相结合,其中DL方法用于特征提取和ML算法用于分类。ELENA等[28]使用ML与DL技术对mpMRI数据预测PCa的侵袭性,一方面从T2w图像和病变的ADC图中提取放射组学特征,并将其提供给各种ML模型。同时使用多个DL架构来直接分析原始图像。结果显示在T2w数据上训练的ML和DL框架实现的性能高于ADC或ADC+T2w。最佳的ML给出的AUC为0.795,最佳的DL给出的AUC为0.875。同时,评估侵袭性对于PCa诊疗比较重要。组织病理学分级由国际泌尿病理学会(International Society of Urological Pathology,ISUP)[29]定义。临床非显著PCa患者(Gleason score<7)符合主动监测的条件,而具有更高级别病变(Gleason score≥7)的男性则建议接受侵入性治疗,例如根治性前列腺切除术或放疗[30]。BRUNESE等[31]利用深度学习架构自动区分不同的Gleason评分PCa和健康患者。对Gleaso分数预测的准确度范围为0.96~0.98。CAROLE等[32]提出了一种基于CNN的新型端到端架构ProstAttention-Net,其具有一种注意机制,能够联合执行PCa病变的多类分割和前列腺分割,对PCa的自动GS分级kappa系数达到(0.418±0.138),优于目前最先进的分割架构。
除此之外,AI在前列腺的临床实践的各个阶段均有所应用。ML已经应用于PCa的组织病理学诊断、放疗计划的制订,治疗方案的推荐,术前干预,动态检测以及患者随访等各个方面。
随着AI技术的不断探索和算法的不断发展,AI表现在MRI的诊断效能的潜力是巨大的,并且在PCa患者的临床应用中的作用也是巨大的。目前的研究已经表明AI在前列腺MRI的应用从病变诊断和病变分类到侵袭性的评估均有较大的进展。但是AI若要应用于临床还存在较多的问题,最终模型实际应用是否对大多数PCa患者具有适用性,需要多中心大样本的实验才能了解其效能,毕竟不同地区、不同等级的医院磁共振的机器不同,电脑对于AI的适配性以及人员对于AI软件的使用均可能会影响最终的结果。其次,AI软件的使用也要有规范的使用规则和限定的使用范围,对于患者的数据不能无限制的收集,其中的医学伦理也有待审核。希望能随着AI的发展,在减轻工作量的同时能够帮助临床医生快速而又准确的诊断。