王清扬,王书浩,钟定荣*
[1.北京协和医学院研究生院,北京 100006;2.中日友好医院病理科,北京 100029;3.透彻未来(北京)科技有限公司,北京 100102]
肺癌是全球癌症相关死亡的主要原因,据统计2020年有近180万人死于肺癌[1]。而中国,肺癌死亡率在男性和女性中均占首位,肺癌病理诊断为临床诊疗提供十分重要的参考指标。病理学是用以确定肺癌最终诊断的基本工具,有效和准确的病理诊断对于患者的后续治疗至关重要。传统病理诊断由经验丰富的病理学家在显微镜下逐一评估所有切片,此过程耗时长、主观性强,经验不足的病理医师可能出现漏诊、误诊,因此提高诊断的准确性和稳定性是一项挑战。
人工智能(AI)自提出起,为现代社会带来了前所未有的机遇。病理领域AI研究最早可追溯到20世纪60年代,Mendelsohn等[2]首次尝试将图像分析算法应用于细胞图像分析血液成分并帮助诊断一系列疾病,并获得了成功。全切片数字扫描图像(WSI)的出现加速了数字病理学的发展。WSI是一项涉及高速、高分辨率数字采集图像的技术,使病理学家可以在计算机显示屏上查看生成的全视野数字切片用于病理诊断,从而摆脱了传统显微镜在使用环境和操作上的限制[3]。Mukhopadhyay等[4]的研究结果表明WSI在外科病理的初步诊断中不逊于传统显微镜,自动图像分析方法在提高诊断精度和减少人为错误方面表现出巨大潜力。随着先进深度学习算法的开发,AI已开始尝试帮助病理学家完成一些具有挑战性的诊断任务,如肿瘤分型、肿瘤转移检测、量化有丝分裂和炎症[5]。最近,利用计算机辅助图像分析来预测肺癌预后已成为令人振奋的新方向,现代数字病理学的快速发展预示着临床病理诊断模式正在发生转变。本文将介绍具有应用前景的病理图像分析AI算法,并回顾AI在肺癌组织病理诊断、PD-L1免疫组化表达评估、分子病理检测以及肺癌预后预测的 应用。
AI能超越人眼观察的区分度,提炼图像中更多有价值的信息。病理学领域的AI模型经历了从专家系统发展到传统的机器学习,再到深度学习的过程。常用的AI算法包括人工神经网络(ANN)、卷积神经网络(CNN)、递归神经网络(RNN)等,其中CNN已广泛用于图像分类和病理图像分析,如肿瘤区域和转移检测[6-7]。这些算法可能存在学习时间长、容易过拟合及结果的不可解释性等问题,以下介绍的两种具有应用前景的算法可能改变 现状。
1.1 生成对抗网络生成对抗网络(GAN)在数字病理学中的使用频率也逐渐升高。GAN是一种特殊类型的神经网络模型,由生成器网络和判别器网络组成并在相互竞争时同时进行训练,在竞争中实现各自优化。在相关研究报道中,GAN及其扩展的应用有效地提高了医学图像分割的准确性,为解决许多具有挑战性的组织病理学图像处理问题开辟多种途径,如颜色归一化、虚拟染色、图像增强、油墨去除、特征提取、细胞核分割等[8]。GAN还可用于少样本的数据增强,Tekchandani等[9]提出将GAN用于计算机断层扫描(CT)图像中纵隔淋巴结肺癌转移检测,不仅能显著减少可训练参数,还能解决过拟合问题(AUC 0.95)。 Teramoto等[10]使用GAN来提高深度卷积神经网络(DCNN)肺癌细胞学分类模型的精度,结果使用GAN之后准确率较前提高了约4.3%,证实了GAN在仅获得有限数据的情况下也能有效提高模型 精度。
1.2 可解释的深度学习技术病理学常用的AI算法普遍存在域适应性差和可解释性差的问题,很多情况下研究人员也无法解释模型是如何做决定的,因此常被认为是“黑匣子”,这可能会对诊断结果产生深远的影响[11]。可解释的深度学习技术(XAI)代表了解释性分析模型的新方向,有很好的应用前景。XAI是指从机器学习模型中提取相关知识,这些知识涉及数据中包含的关系或模型学习到的关系,为提高AI的信任度、透明度及促进AI稳定发展提供了希望[12]。近年来XAI开始尝试应用于病理图像分析,例如Palatnik等[13]训练了一种XAI模型,并在淋巴结转移组织WSI组成的数据集上进行二元分类。其观察结果表明高解释权重的区域在热图中具有良好的一致性,且热图与病理专家医学分割一致,这将有助于进一步深入了解用于病理图像诊断的神经网络决策的内部工作 原理。
2.1 组织病理诊断靶向治疗和免疫治疗对肺癌的准确分类及良恶性疾病的鉴别提出了更高的要求。形态学评估仍然是分型的基础。然而,AI组织学病理模型的训练通常需要病理学家耗费大量时间与精力标注。2019年,Wei等[14]提出了一种用于肺腺癌WSI上的主要和次要组织学亚型进行分类的深度学习模型。该模型由病理学家大量注释后训练,在独立测试集上其kappa得分为0.525,略高于病理学家kappa得分0.485,与三位病理学家对主要亚型进行分类的一致性为66.6%。近年来,为了减轻病理学家的注释负担并避免选择偏差,无标注或少量标注的AI模型越来越受推崇。2021年,Chen等[15]开发了一种无注释训练神经网络模型,该模型在肺腺癌和鳞状细胞癌分类的测试集受试者操作特征曲线下面积(AUC)分别为0.9594和0.9414,并且模型突出显示的关键区域与病理学家确定的癌症区域高度对应。该方法通过减少对详细注释的需求,为病理人工智能研究取得更快进展铺平了 道路。
在小活检标本中识别肺癌亚型同样是确定合适治疗方案的重要组成部分,但如果没有特殊和/或免疫组化染色的帮助,难度更大。Yang等[16]利用经支气管肺活检(TBLB)标本开发了AI模型来分类肺癌的多项模式,模型宏观平均AUC为0.90;Kanavati等[17]在由TBLB标本构成的训练集上训练了一个模型,用于腺癌、鳞状细胞癌、小细胞肺癌及非肿瘤的分类,测试集AUC在0.94到0.99之间。基于小活检标本的组织病理学诊断是目前最具成本效益的方法,并且该领域可以从基于AI的工具中受益,以帮助病理学家完成临床工作流程。
总之,自动图像分析方法在提高肺癌分型诊断精度和减少人为错误方面具有巨大潜力。
2.2 PD-L1免疫组化表达评估在某些情况下病理学家需要分析重复的任务,如计数核分裂或某些免疫组化标记阳性的细胞。AI可能使这些过程自动化,并提高诊断的准确性和工作流程的效率,包括Ki67阳性细胞计数、乳腺癌HER2表达、结直肠癌微卫星不稳定(MSI)判读等。在肺癌治疗方面,免疫组化检测肿瘤PD-L1状态已成为筛选非小细胞肺癌患者受益于程序性细胞死亡配体1(PD-1)/及其配体(PD-L1)抑制剂的常规方法。PD-L1肿瘤比例评分(TPS)是指部分或完整膜染色(≥1+)的肿瘤细胞占样品中所有活肿瘤细胞(阴性和阳性)的百分比,其评估具有一定挑战性,因为PD-L1在肿瘤细胞和各种免疫细胞中都同时表达。不同病理学家的手动评分可能会产生不一致的结果,尤其当TPS较低时,病理学家的评分可能是内在错误来源[18]。最近,许多类型的研究已经证明了基于深度学习的方法能够自动估计PD-L1状态。Cheng等[19]探索并优化了3种不同的AI模型用于自动分析肺癌患者PD-L1免疫组化表达。其中2种在PD-L1(SP263)中实现了高度准确的性能,准确度和特异性分别为96.4%和96.8%。Hondelink等[20]开发的基于深度学习的TPS算法,与参考分数(79%)的一致性与病理学家之间的一致性(75%)相似。这些结果并不令人感到意外,因为与细胞病理学家的视觉估计相比,使用软件对数字化细胞块材料中的细胞数量进行定量分析更为可靠[21]。与人工估算相比,AI可以获得TPS的精确值而不是近似范围,其可以作为日常病理诊断“评分助手”,通过预先筛选PD-L1切片并将定量值作为第二意见提供给病理 学家。
2.3 分子病理检测目前对靶向药物种类选择上和肿瘤免疫治疗应用的前提是必须进行相关的肿瘤分子病理相关检测,然而周转时间短、组织使用和高成本可能成为分子病理检测流程的瓶颈。对肿瘤组织进行分子生物标志物检测前需要病理学家显微镜下估测送检组织切片中肿瘤细胞百分比,这一过程有可能引入观察者间的变异性,并影响后续分子检测的质量。对此Hamilton等[22]开发并验证了名为TissueMark系统的自动图像分析方法,其结果自动识别肿瘤区域与相同的EGFR突变状态高度一致,并且对肿瘤百分比测量值的细胞计数自动分析与基准肿瘤细胞计数有显著相关性(P<0.001)。该系统将有助于保证样本质量及肿瘤DNA充足性。
组织学图像中包含的表型数据能反映分子改变对癌细胞行为的总体影响,并能为疾病的侵袭性提供实用的视觉解读。Fu等[23]对28种癌症进行了泛癌种计算组织病理学(PC-CHiP)分析发现:肿瘤形态与其分子组成之间的联系可以在每种癌症类型和几乎所有类别中找到,这些分子改变包括全基因组重复、个体染色体非整倍体、局灶性扩增和缺失及驱动基因突变等。在肺癌方面,Kadota等[24]通过组织学观察和分子检测研究发现,肺腺癌中含黏液的组织类型与KRAS突变相关,而ALK的表达与腺癌中的印戒样细胞形态密切相关,EGFR突变则与贴壁型腺癌类型相关,提示肺癌组织形态学改变与基因改变是有关联的。基于此Coudray等[25]通过AI不但建立了非小细胞肺癌的识别模型(图像块预测准确性达96.1%),还对存在基因突变和缺乏基因突变的WSI深入分析找出差异后,成功预测EGFR、STK11、FAT1、SETBP1、KRAS和TP53的突变,其中EGFR突变预测准确性达80%,STK11突变预测准确性最高(AUC 0.85)。Kather等[26]利用包含多种实体肿瘤的5000多名患者的组织切片,开发、优化和外部验证了一个深度学习管道,并在肺腺癌中检测到TP53、KEAP1、PDGFRB、FGFR2及FBXW7突变(AUROC 0.60-0.78)。在国内将AI应用在肺癌基因预测方面的研究还非常少,2020年王荃等[27]利用非小细胞肺癌HE染色的WSI开发了EGFR基因突变风险预测模型,在测试集上其AUC为0.72,准确率为70.8%。总之,基于组织病理学的AI在肺癌基因预测方面前景广阔,但目前研究的病例数普遍不多,预测值偏低,模型还有待 改进。
最近研究发现,使用计算机算法对组织病理图像进行系统分析可以揭示解码肺癌肿瘤发展和进展的隐藏信息,从而对疾病预后进行预测。在2016年Yu等[28]利用基于定量特征的组织病理学图像分类器成功预测I期肺腺癌和肺鳞状细胞癌患者的生存结果(AUC>0.75)。Luo等[29]利用计算机算法从HE染色病理图像中提取并确定与肺浸润性腺癌和鳞状细胞癌预后显着相关的形态特征,并以此开发了肺癌患者预后预测模型。Wang等[30]使用DCNN算法开发了肺癌病理图像的自动肿瘤区域识别系统,其提取了 15个与肺腺癌患者的生存结果显著相关的肿瘤形状和边界特征,为肿瘤形态与患者预后之间的关系提供了新的见解。此外,一些研究表明AI对肿瘤微环境相关特征进行学习并以此开发的模型也能达到预测患者生存的 目的[31-32]。
虽然可以基于组织病理学以完全自动化的方式对肿瘤预后进行预测,但仍无法与完整的分子和临床检查相比。因此组织病理学改变是潜在分子改变的反映,而不是独立特征[23]。随着技术和分析方法的进步,可以将肿瘤组织病理分析与分子分析和所有其他临床检查结果相结合,全面描绘疾病机制、肿瘤分级和患者预后,并最终指导精准化治疗方案的制定。
随着医院病理数字化项目的推进和患者及家属对数字化切片的广泛认可,人工智能病理在医院会得到广泛应用,特别是在发病率和死亡率居高不下的肺癌领域。在大医院,协助培养年轻医生的亚专科培训和研究生的科研研究,在中小医院将起到重要的辅助诊疗作用,并提高诊断的准确性,赋能分子生物方面的靶向及免疫治疗预测,减少不必要的检测,并提高阳性检出率,节约社会医疗资源。在量化方面,不论是免疫组化还是分子检测,都能大大提高准确性和一致性,在整合诊断和治疗策略方面,人工智能都会发挥重要作用。
AI非常善于发现高维数据中的复杂结构,非常适合病理数字图像分析,近年来用于肺癌病理图像分析的AI研究正迅速增加。对于相对简单的任务,一些AI模型已能接近病理专家水平,而涉及多医学中心、大样本量及多模态的AI模型还需进一步研究。目前在某些任务中AI的表现可以与病理专家相媲美,但其想要在临床实践中广泛开展仍面临许多重大挑战。尽管数字化病理研究在逐年增加,但普遍数据量较少,无法真正评估模型的普遍性,因此未来AI病理模型还需要囊括更大的数据集,甚至是多中心、不同国家的患者群体,或是联合模型应用[33]。此外,AI应用于临床实践之前还需要考虑道德、隐私和网络安全等方面的问题。
随着精准医疗及个体化治疗需求提出,病理学家的任务不仅限于在显微镜下分析组织,还需要整合不同来源的临床数据、影像学结果以及患者的具体情况,为临床提供更多相关信息以利于患者后续治疗方案选择及预后评估。然而目前大多数病理领域AI研究较单一,临床价值有限。2017年Yu等[34]提出了一种整合组织病理学及转录组学的模型,在对肺腺癌I期患者预后预测中的表现(AUC>0.81)优于单一的基因表达或组织病理学模型。2022年Qin等[35]开发的基于多种临床特征的肺癌EGFR突变预测的ANN模型(包括年龄、性别、吸烟史、血清肿瘤标志物水平、18F-FDG PET/CT显像最大标准化摄取值、病理结果、CT图像和EGFR突变状态),其结果发现女性、腺癌、胸膜凹陷和病理性支气管气相是EGFR突变型存在的阳性预测因子;构建的3种模型预测EGFR突变状态AUC分别为0.91、0.86和0.71。在未来,用于肺癌诊断和预后预测的多模态AI模型或可为该领域提供一个颇具前景的研究方向,并将有助于推进精准肿瘤医学 发展。
AI有潜力革新病理学领域,其将改变病理服务的管理方式并满足精准医疗时代的需求。随着AI技术的改进和发展,在未来数字病理将发挥主导作用,使诊断更加高效和准确,帮助病理学家满足越来越多患者的需求并帮助临床增加疾病的治疗选择范围。