李冰冰,武志芳,杨 帅,崔曹哲,李肖萌,吕豆豆,胡凌志
1.山西医科大学第一医院核医学科,山西 太原 030001;
2.分子影像山西省重点实验室,山西 太原 030001;
3.分子影像精准诊疗省部共建协同创新中心,太原 030001
肺癌是常见的恶性肿瘤,全球发病率及死亡率位居高位,也是中国癌症相关死亡的首要原因[1]。肺癌是具有高度异质性的恶性肿瘤,其中非小细胞肺癌(non-small cell lung cancer,NSCLC)约占85%。目前,18F-FDG正电子发射体层成像(positron emission tomography,PET)/计算机体层成像(computed tomography,CT)技术实现分子影像与解剖影像的有机融合,已成为肺癌诊断、分期与再分期、疗效和预后评估的最佳方法[2]。近年来,随着大数据分析和人工智能(artificial intelligence,AI)等前沿技术在医疗领域的应用,兴起的深度学习(deep learning,DL)技术凭借高效自学习的特性解决了临床工作中的诸多难题,在肺癌患者PET/CT诊疗过程中,利用卷积运算架构提高图像质量和重建速度,实现病灶精确分割,在早期预测治疗灵敏度及预后评估等方面发挥独特优势,有望成为诊疗监测的辅助工具。
AI是一个广泛的研究领域,旨在模拟人类智能的计算机系统[3]。其中机器学习(maching learning,ML)是AI的一个重要分支,通过分析原始数据,开发能够检测行为模式的算法,从而建立预测模型。近年来,DL已成为ML领域的一个热点,它是传统人工神经网络(artificial neural network,ANN)技术上的扩展。DL通过多层非线性神经网络将低层次特征组合形成抽象的高层次特征,自动学习更复杂、更高维度的特征信息,提取相关特征,最终实现图像自动分析[4]。DL的基本框架是神经网络,早在1998年Lecun等[5]提出神经网络雏形LeNet,使用反向传播算法训练多层神经网络为DL奠定了基础。随着任务的复杂化,计算机处理能力不断提升,逐渐涌现出更多优秀的DL算法。
卷积神经网络(convolutional neural network,CNN)[6]由卷积层、池化层和全连接层组成,通过反向传播算法和梯度下降设计用于自动和自适应学习特征的空间层次结构。自2012年CNN在ImageNet图像分类竞赛中取得冠军以来[7],一直在计算机分类任务中占据主导地位,是医学图像领域应用最广泛的算法。在CNN的基础上,为避免网络层数加深造成梯度爆炸等问题,进一步引入残差神经网络(residual network,ResNet),增加直连通道简化学习任务,用于图像分类[8]。对抗生成神经网络(generative adversarial network,GAN)主要用于图像重建。U-Net是医学图像分割最常用的架构[9]。而Transformer[10]和图神经网络(graph neural network,GNN)[11],前者分割针对纹理和结构差异较大的目标,后者适合图结构数据的分类。
PET/CT利用示踪剂在体内的分布间接反映代谢信息,注入低剂量示踪剂可以降低受检者辐射剂量,但也会导致低信噪比的图像生成。近年来,PET/CT的低剂量采集与重建倍受关注,DL在改善图像质量上的应用也愈加广泛。Xu等[12]使用ResNet将1/200剂量的PET图像重建为全剂量PET图像,保持分辨率的同时显著去噪。Zhou等[13]提出基于CycleGAN结构的循环Wasserstein回归对抗训练框架,保留最大标准摄取值(SUVmax)和平均标准摄取值(SUVmean),提高低剂量PET图像质量。Häggström等[14]利用DeepPET技术输入PET正弦图数据直接生成PET重建图像,重建速度比有序子集最大期望值法(ordered subsets expectation maximization,OSEM)和滤波反投影(filtered back projection,FBP)等标准迭代方法快100倍和3倍。总的来说,基于DL的图像重建算法在改进图像质量方面取得了较好的效果。
病灶检测和分割是计算机辅助诊断肺癌的重要步骤,临床上以高年资医师手动分割结果为基准,成本高、耗时长,加之肺癌异质性的影响,容易引起观察者之间和观察者内部的分歧。近年来,DL凭借卷积运算为医师提供了更快捷、可重复性更高的结果,被认为是检测与分割任务中的鲁棒工具。Teramoto等[15]和Zhang等[16]利用基于主动轮廓过滤器和多尺度掩模的CNN,自动检测18F-FDG PET/CT图像中的肺结节,假阳性率从72.8%降至4.9%,准确度达90.0%,可以有效且准确地检测肺结节。Leung等[17]证明了U-Net分割小肿瘤的能力(最小横截面为1.83 cm2),骰子相似系数达0.74。Li等[18]提出了基于DL的变分方法,设计具有V-Net的3D全卷积网络(fully convolutional network,FCN),使用分裂Bregman算法的最小化变分模型,实现精确的多模态肿瘤分割。Fu等[19]介绍了基于DL具有多模态空间注意力模块的PET/CT分割框架,骰子相似系数优于现有PET/CT肺癌分割方法约7.6%。基于DL的PET/CT图像肿瘤检测和分割任务取得显著成效。
肺癌的准确分期及组织学分型对确定治疗方案具有重要意义,但其依赖于组织活检,侵入性检查存在出血、气胸等风险[20]。近年来,DL作为低风险和非侵入性的方法,凭借其出色的图像分析能力逐渐应用于PET/CT肺癌分期及分型中。Kasinathan等[21]提出了基于多层CNN(M-CNN)的肺癌PET/CT分期分类器,准确度达97.0%~99.1%。Kirienko等[22]开发了基于CNN的算法,用于PET/CT图像上T1-T2或T3-T4的肺癌分期,训练、验证的准确度分别达87%和86%。这表明CNN在评估肺癌T分期方面具有良好性能。Wang等[23]的研究证明,基于PET/CT的CNN在预测NSCLC的纵隔淋巴结受累方面也颇有价值,并与经典ML方法及医师主观性判断进行比较,结果显示CNN的诊断特异度达0.88,曲线下面积(area under curve,AUC)达0.91,经典ML诊断AUC为0.87~0.92,CNN和经典ML方法性能差异无统计学意义。但与医师相比,基于AI算法具有更高的灵敏度,但特异度低。Han等[24]收集867例腺癌和552例鳞癌患者的PET/CT图像,以8∶2分成训练集和测试集,共提取688个特征,分别构建多种ML模型和VGG16 DL模型用于NSCLC组织学亚型分类,结果表明VGG16 DL模型(AUC=0.90,准确度=0.84)性能优于现有的支持向量机(support vector machine,SVM)模型(AUC=0.86,准确度=0.79)。此外,尽管有大量用于鉴别肺癌组织学亚型的算法研究,但多为影像组学与ML,基于DL算法在肺癌亚型分类及远处转移上的应用仍有待开发。
表皮生长因子受体(epidermal growth factor receptor,EGFR)、Kirsten大鼠肉瘤(Kirsten rat sarcoma,KRAS)、间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)以及程序性死亡受体配体1(programmed death-ligand 1,PD-L1)表达状态与NSCLC患者的预后密切相关[25-26],自新型靶向药物获得美国食品药品监督管理局(Food and Drug Administration,FDA)批准,靶向药物治疗大大改善了肺癌患者的预后。然而传统靶点的检测依赖于有创的活组织病理学检查。近年来,基于单克隆抗体(monoclonal antibodies,mAb)和酪氨酸激酶抑制剂(tyrosine kinase inhibitor,TKI)的靶向PET可以通过非侵入性的方法辅助检测阳性靶点[27],尽管目前没有研究证明18F-FDG PET/CT能进行靶点成像,但有研究[25,28]使用18F-FDG PET/CT图像训练DL模型进一步预测靶点表达状态。
Chen等[25]使用ResNet 20、32和50架构分别构建PET ResNet模型,CT图像构建ResNet 32模型,用堆叠泛化方法构建SVM模型(Stack PET/CT&Clinical模型),分别预测肺癌患者EGFR突变状态并评估性能,结果显示Stack PET/CT&Clinical模型表现最佳(AUC=0.85±0.09),灵敏度、特异度分别为0.76、0.85。尽管该研究在模型性能比较中表现最佳的是ML模型,这其中不乏有多模态数据的贡献。Mu等[28]开发的基于18F-FDG PET/CT的DL模型,通过DL评分(DLS)对EGFR突变状态分类并验证,结果表明DLS在训练集、验证集和外部测试集中的AUC分别为0.86、0.83和0.81,准确度分别为81.1%、82.8%和78.5%。总而言之,基于DL的模型将有助于医师非侵入性预测患者基因突变状态,识别可能受益于靶向治疗或免疫治疗的肺癌患者,从而实现更高效、更方便的精准医学。但目前多数研究[28]集中于预测EGFR及PD-L1的表达,预测其他种类突变的研究仍待进一步开展。
由于肺癌具有异质性,个体之间的治疗效果呈现多样化,因此,如果可以早期预测个体对治疗的灵敏度,对制订治疗方案将有很大的帮助。一些研究已证明DL可以预测治疗反应,如免疫疗法、化疗和放疗。Mu等[29]采用小ResCNN对NSCLC患者的18F-FDG PET/CT图像和临床资料进行分析,通过DLS预测PD-L1表达状态,进一步用于预测患者从免疫治疗中获得的持续临床益处(durable clinical benefit,DCB)和生存率,结果表明DLS与临床特征相结合能够准确地预测DCB、无进展生存期和总生存期(C指数为0.70~0.87)。Baek等[30]发现相较传统的基于PET的代谢参数,如代谢肿瘤体积(metabolic tumor volume,MTV)、糖酵解总量(total lesion glycolysis,TLG),或影像组学方法,PET/CT上U-Net分割算法模型具有更高的生存预测能力。简而言之,基于DL算法的模型可以在早期识别高进展和高死亡风险的肺部肿瘤。
总之,DL算法应用于肺癌18F-FDG PET/CT,无论是在诊断还是治疗,或是预后预测等方面,均展现出其独有的优势,但M分期、组织学亚型及治疗灵敏度预测等仍有待完善。且临床实施之前仍需面对和解决某些限制与障碍。首先,数据是DL最关键和最核心的部分,DL通常需要大量数据去避免过拟合,并由专业人员进行标注,以确保可信度,此过程昂贵且耗时。其次,DL技术的算法过程缺乏透明度,“黑匣子”性质难以提供理论支持和影像学依据,并且诊断结果的可解释性较差。此外,许多研究的回顾性方式以及主观性带来的偏差,都会影响其准确度。因此,未来仍需通过完善数据采集标准、扩充数据量、设计多中心研究等方法避免可能的偏差,进一步拓展其应用。
随着AI等前沿技术和医疗大数据分析的不断进步,DL现如今虽然处于起步阶段,但在目前的研究中已展现出其巨大的潜力,将来有望为精准医疗提供更多的便利。