张诗雨 综述 段 华 审校
(首都医科大学附属北京妇产医院 北京妇幼保健院妇科微创中心,北京 100006)
子宫内膜癌为女性生殖系统三大恶性肿瘤之一,发病率在全球范围内呈持续上升趋势[1,2],早期诊断可能降低死亡率,提高无病生存率,故此,亟待确立高效的筛查途径来实现子宫内膜癌的早期诊断[3]。部分指南认为经阴道超声检查(transvaginal ultrasound,TVS)可以作为子宫内膜癌的一线影像学检查[4~6],但其特异度较低,并且有一定的操作者主观评判以及仪器误差。对于子宫内膜癌筛查取样方式,多数指南推荐门诊一次性子宫内膜取样器和细胞学制片[3]。不能单独将经阴道超声检查用于对子宫内膜癌的筛查,需结合子宫内膜微量组织病理检查或子宫内膜细胞学检查[7]。
人工智能作为计算机科学的一个分支,经历了感知器数学模型,反向传播(back propagation,BP)算法,正迎来第三次发展高潮——深度学习[8,9]。人工智能系统逐渐应用于医学领域,尤其在疾病的筛查及诊断方面表现突出[10~12]。本文对人工智能在子宫内膜癌筛查工作中的研究进展进行综述,旨在为人工智能辅助决策系统应用于子宫内膜癌筛查提供参考。
将子宫内膜癌发病风险人群分为低、中、高风险的风险预测模型有助于制定个体化的癌症预防策略[13]。但繁杂的临床数据以及各种主观因素导致预测模型难以建立,所创模型的准确度有待商榷。多项研究将人工智能技术应用于发病风险人群分类,通过搜集人群信息数据创建的多种数据模型可以协助进行风险预测,提出干预措施来降低子宫内膜癌风险,如饮食和运动改变、孕激素或抗雌激素治疗、胰岛素降低治疗和定期的子宫内膜活检[14]。Hüsing等[15]使用欧洲癌症和营养前瞻性调查队列(EPIC)201 811名女性(大多数年龄30~65岁)数据建立子宫内膜癌预测模型,包括子宫内膜癌855例(0.4%),曲线下面积(area under the curve,AUC)为0.77。Pfeiffer等[16]使用前列腺癌、肺癌、结直肠癌和卵巢癌筛查试验(PLCO)和美国国立卫生研究院AARP饮食与健康研究(NIH-AARP)146 679名50岁以上女性的数据建立子宫内膜癌预测模型,其中子宫内膜癌1559例(1.1%),使用护士健康研究队列进行验证,AUC为0.68。Har等[14]使用PLCO试验78 215名女性的数据,其中961例(1.2%)入组5年内发生子宫内膜癌,建立机器学习模型用于子宫内膜癌筛查,测试AUC为0.96。进一步将机器学习模型与15名临床医生(包括妇科肿瘤学专家和初级保健医生)对100名女性进行子宫内膜癌风险分层进行比较,在识别高于平均风险女性方面,随机森林模型比临床医生好2.5倍,神经网络模型比临床医生好2倍。Wang等[17]回顾1922例子宫内膜活检、诊刮或子宫切除术资料,其中良性1552例,子宫内膜癌370例,结合3种最佳机器学习方法,即逻辑回归、梯度提升决策树和随机森林,建立模型,并在1个内部验证队列和2个外部验证队列中进行验证,结果显示,总子宫内膜癌预测的AUC分别为0.9346、0.8341和0.8649,Ⅰ期子宫内膜癌预测的AUC分别为0.9347、0.8073和0.871。
针对不同的风险群体,建议采用不同的筛查和辅助治疗策略。筛查风险分层对于个体化治疗非常重要,基于一定数量的子宫内膜癌临床数据所构建的人工智能决策系统可以以较高的准确率进行人群筛查,以期对子宫内膜癌做到早发现、早诊断。
子宫内膜细胞学检查是目前临床上使用较广泛的子宫内膜癌筛查方法之一,具有操作简易、能够在门诊完成、并发症风险较低、标本合格对于内膜厚度的要求较低等优势[18]。Li等[19]建立自动识别和诊断子宫内膜细胞团病理图像的人工智能系统,使用113个子宫内膜样本(恶性42个,良性71个)构建包括15 913个图像的数据集,用细胞神经网络捕捉子宫内膜细胞团的特征,构建以DenseNet201为骨架的DL模型对良恶性细胞群落进行分类。使用经过训练的U-Net从15 913张图像中提取出39 000个子宫内膜细胞团图片,其中26 880个为训练集,11 520个为测试集,其余300个良性和300个恶性图片为验证集,测试集准确率93.5%,特异性92.2%,敏感性92.0%。该系统可显著提高医生的工作效率,适用于大规模开展筛查和诊断工作。
Pouliakis等[20]建立基于细胞核区分子宫内膜良恶性疾病的人工筛查系统,纳入222份经组织学证实的液体细胞学涂片(良性117例,恶性62例,增生伴或不伴异型43例),共收集22 783个细胞核,其中50%为训练集,用于构建分类回归树(classification and regression trees,CART)模型,剩余50%为测试集,其准确率85%,特异性90.68%,敏感性72.05%。该系统突出了子宫内膜细胞核形态的诊断特征,为子宫内膜癌的筛查提供了新的思路及方法。
不同于子宫内膜细胞学检查,子宫内膜微量组织病理检查所取得的标本量更多,准确率更高,但其对子宫内膜厚度的要求也更高,取材不足可致假阴性[21]。Pergialiotis等[22]回顾178例绝经后女性的子宫内膜诊刮病理结果,包括106例恶性,72例正常,使用人工神经网络的总准确率高达85.4%,敏感度为86.8%,特异度为83.3%,使用分类回归树分别为77.5%、78.3%和76.4%,使用回归分析仅为72.5%、76.4%和66.7%。
子宫内膜癌的分子分型包括DNA聚合酶ε(DNA polymerase epsilon,POLE)突变型、微卫星不稳定高突变型(microsatellite instability-high,MSI-H)、低拷贝数变化型(copy number variation-low,CNV-L)和高拷贝数变化型(copy number variation-high,CNV-H),可能成为个体化治疗的目标[23,24],确定分子亚型和单基因突变可以补充和完善组织学分类,但这些信息的可用性受到测序时间和成本的限制。人工智能有可能根据组织病理学图像预测子宫内膜癌的分子分型,有助于风险分层和个性化管理。Hong等[25]使用癌症基因组图谱(TCGA)和临床蛋白质组肿瘤分析联盟(CPTAC)的福尔马林固定石蜡包埋HE染色玻片,共纳入456例496张玻片,并注释亚型和基因突变信息,形成TCGA-CPTAC混合数据集,随机分为训练集、验证集和测试集,以此为基础开发多分辨率深度卷积神经网络模型Panoptes,其中最佳结构模型对子宫内膜样和浆液性组织学亚型进行分类的AUC为0.969,对分子亚型CNV-H有非常高的精确度(AUC 0.934),还可以准确识别来自组织学子宫内膜样癌的CNV-H样本(AUC 0.958),以及CNV-L(AUC 0.889)、MSI-H(AUC 0.827)、CNV-H标志基因TP53突变(AUC 0.873)、PTEN(AUC 0.781)、FAT1(AUC 0.835)和ZFHX3(AUC 0.824),认为该模型可帮助病理学家在无需测序的情况下确定子宫内膜癌的分子亚型和突变,具有临床应用潜力。
近年来,人工智能、机器学习以及深度学习方法在子宫内膜癌筛查研究中的应用显示出了彻底改变其筛查和诊断的潜力,人工智能和机器学习技术在妇科肿瘤中的潜在优势可以大大提高癌症诊断的准确性和有效性,减少诊断延误,并可能消除不必要的侵入性手术操作。结合发病风险人群分类、子宫内膜微量组织病理检查、子宫内膜细胞学检查的人工智能筛查技术,可提高子宫内膜癌筛查的简便性和可接受性,简化子宫内膜癌筛查流程,提高国内子宫内膜癌筛查诊断的效率和质量,助力人工智能在妇产科学的推进。作为数据驱动的科学,人工智能为发展充满精准肿瘤学机遇的健康系统铺平了一条充满希望的道路。