王嘉旭 薛鹏 江宇 综述 乔友林 审校
宫颈癌在全球女性恶性肿瘤中占第四位,2020年全球有超60万新发和34万死亡病例[1]。2015年中国约有11万宫颈癌新发和3万死亡病例[2],发病率和死亡率呈逐年升高趋势,宫颈癌防治已刻不容缓。2018年,世界卫生组织(WHO)发起并制定了2030年全球消除宫颈癌防控策略[3],其目的是进一步扩大对宫颈癌的预防、筛查和治疗。尽管筛查是有效的防治策略[4],但国内基层的从事宫颈细胞学专业人员和阴道镜医生资源能力有限,一定程度上制约了宫颈癌筛查[5]。因此,如何提升细胞学和阴道镜医生的诊断水平成为国内宫颈癌筛查中的难点。
近年来,随着人工智能(artificial intelligence,AI)的迅速发展,其在医学图像领域已经获得广泛的应用[6-8]。本研究将对AI的发展情况,AI辅助宫颈细胞学检测和阴道镜诊断系统的最新研究进行综述。
近年来,AI得到迅速的发展,机器学习被广泛地应用于图像识别等领域。作为机器学习的重要分支(图1),深度学习在图像识别领域中表现出优异的性能[9]。深度学习是一种通过组合低层次特征形成高层次特征,进而发现数据内在特征的多层次神经网络模型[10](图2)。目前,已有多个深度学习算法模型用于细胞学和阴道镜图像分类中[11]。
图1 AI、机器学习和深度学习关系
AI辅助诊断系统的建立和验证大致包括以下步骤:1)对于患者的宫颈细胞学组织,采用ThinPrep 或其他液基细胞学制片方法,在经过自动移液、梯度离心、细胞沉降、固定以及染色冲洗等规范化处理后制成液基细胞涂片,使用显微镜拍摄生成数字化液基细胞学图像[12-13];2)对于阴道镜图像,亦包括生理盐水图像、3%~5%醋酸染色图像和碘染色图像;3)将患者的宫颈细胞学或阴道镜图像分为训练集和验证集,根据病理诊断的金标准结果对图像进行标注;4)AI 通过训练集数据建立图像和标注的关系,进而实现对验证集图像的自动标注[14](图3),再根据模型预测结果计算相关统计指标[15](图4)。
图3 图像标注模型的一般框架
Bao等[13]研究对2 145例患者的细胞学图像进行AI 模型的训练和验证,测得模型检出宫颈上皮内瘤变(cervical intraepithelial neoplasia,CIN)2 级及以上(CIN2+)病变的受试者工作特征曲线下面积(area un⁃der the curve,AUC)为0.762;之后又对703 103例患者的细胞学图像进行AI 模型的训练和验证,测得该模型检出CIN2+病变的灵敏度为90.1%[16]。Wentzensen等[12]研究对602 例患者的细胞学图像进行模型的训练和验证,测得模型检出CIN3 级及以上(CIN3+)病变的AUC 为0.74。Yu 等[17]研究对1 839 例患者的细胞学图像和HPV 检测结果进行模型的训练和验证,测得该模型检出CIN2+病变的AUC为0.71,见表1。
图4 AI模型的建立及验证流程
Hu 等[18]研究对9 406 例患者的子宫颈造影图像进行模型的训练及验证,测得模型诊断CIN2+病变的AUC为0.91。Yuan等[19]研究对22 330例患者的电子阴道镜图像进行模型的训练及验证,测得子宫颈病变等级分类模型的灵敏度为85.38%,宫颈病变区域预测模型的醋酸染色和碘染色图像的准确度分别为95.59%和95.70%。Cho 等[20]研究对791 例患者的光学阴道镜图像进行2 个AI 模型的训练与验证,使用CIN 分类时模型的平均准确度分别为48.6%和51.7%;使用鳞状上皮内病变(squamous intraepitheli⁃al lesion,SIL)分类[21]时,模型的平均准确度分别为71.8%和74.4。Miyagi 等[22]研究对253 例患者的阴道镜图像和临床信息进行AI 分类模型训练和验证,测得AI 模型的灵敏度为95.6%、特异度为83.3%。Xue等[15]研究对19 435例患者的电子阴道镜图像和临床信息进行模型训练和验证,并与阴道镜医生的诊断结果进行比较,结果显示CAIADS模型的诊断结果与病理诊断的一致程度(82.2%)优于阴道镜医生的诊断结果(65.9%),见表2。
表1 AI辅助诊断系统在宫颈细胞学检测中的性能
表1 AI辅助诊断系统在宫颈细胞学检测中的性能(续表1)
表2 AI辅助诊断系统在阴道镜诊断中的性能
3.3.1 优势 1)AI 系统具有较好的诊断性能:国内细胞学和阴道镜医生的诊断水平参差不齐,诊断质量很大程度上受制于医生水平等主观因素,而AI系统可避免主观因素的影响并发现图像中的隐藏特征[9],具有较好的诊断性能;2)AI系统可提高宫颈癌筛查诊断的质量和可及性:中国是人口大国,进行细胞学筛查和转诊阴道镜的患者例数较多,AI系统对细胞学和阴道镜图像的处理速度较快,可减少临床医生的工作负担,缓解医疗资源的紧张程度,提高宫颈癌筛查的可及性[7]。
3.3.2 局限性 1)诊断性能问题:尽管AI 系统优于低年资阴道镜医生的诊断,但在诊断过程中仍存在误诊及漏诊的情况,AI 系统的主要用途是辅助医生进行诊断[23],并在一定程度上控制误诊和漏诊。2)AI 系统的验证:上述部分研究[18-20,22]的样本量较小,且采用内部验证对系统的性能进行检验,部分研究[18-19]为了提高阴道镜辅助诊断系统的性能,未采用CIN或SIL分类标准。Liu等[24]研究表明,现有很多评价AI 系统诊断性能的研究质量过低,不足以得出明确的结论;为证明AI系统的性能,需要更加具有说服力、设计更加完善的前瞻性临床试验加以验证。3)AI算法局限性:目前,大部分研究均是在深度学习算法基础上进行开发,训练过程较易受到隐藏的混杂因素影响,而且需要较大的数据量;另外其主要计算法是对图像进行识别,无法充分利用患者信息。
近年来,国内AI、云计算、5G等领域均取得较为迅速的发展,也为宫颈癌的防治带来新的发展机遇。推动AI系统在辅助医生进行宫颈癌诊断方面的应用,可有效减轻医生负担、提高诊断效率的同时提升基层医生的诊断水平。结合宫颈HPV筛查自取样技术和基于低延迟网络技术的远程诊断技术,可极大地减少患者前往医疗机构的次数,简化宫颈癌筛查流程,提高宫颈癌筛查的简便性和可接受性。基于AI辅助诊断系统的宫颈癌筛查诊断模式将有效提高国内宫颈癌筛查诊断的效率和质量,助力健康中国战略的推进,同时也会走向世界,为推动WHO提出的《加速消除作为公共卫生问题的宫颈癌的全球战略》贡献中国力量与中国智慧。