《人工智能辅助宫颈细胞学诊断技术的应用及质量控制专家共识》解读

2024-05-27 10:54:47张小松
中国妇幼健康研究 2024年3期
关键词:阅片细胞学共识

张小松,杜 芸,董 燕,毕 蕙

(1.北京大学第一医院妇产科,北京 100034;2.河北省肿瘤医院细胞学室,河北 石家庄 050011;3.中国妇幼保健协会人工智能项目办公室,北京 100089)

宫颈癌是威胁女性健康的主要恶性肿瘤之一,据统计2020年全球新发宫颈癌60.4万例,死亡34.2万例,中、低收入国家是高发地区[1]。2016年我国宫颈癌新发病例11.93万例,死亡病例3.72万例[2],位居女性恶性肿瘤死亡顺位第6位[3]。

宫颈癌筛查是宫颈癌防控的主要措施之一,随着人工智能(artificial intelligence,AI)技术的发展,AI辅助宫颈细胞学诊断技术已经开始在宫颈癌筛查工作中使用,为促进宫颈癌筛查工作的开展提供了更多的选择性。为进一步提高和规范AI辅助宫颈细胞学诊断技术的工作质量和应用,2023年12月中国妇幼保健协会和中国妇幼保健协会妇女病防治专业委员会共同发布了《人工智能辅助宫颈细胞学诊断技术的应用及质量控制专家共识》(以下简称《共识》)[4]。本文旨在对《共识》进行解读,便于相关专业人员在工作中进一步理解和实践。

1 关于《共识》的背景和意义

宫颈癌作为威胁女性健康的主要恶性肿瘤,其主要病因已经明确,即高危型人乳头瘤病毒(high-risk human papillomavirus,HR-HPV)的持续感染。目前,随着HPV预防性疫苗的应用,我国宫颈癌防控已经逐步形成了三级预防体系:一级预防措施包括健康教育和HPV疫苗接种,二级预防措施是宫颈癌筛查,三级预防措施主要是治疗宫颈浸润癌[5]。宫颈癌筛查仍然是宫颈癌防控的主要措施之一。宫颈癌筛查方法主要包括HPV检测和宫颈细胞学检查,两种方法既是初筛方法,也是分流方法。宫颈细胞学检查的质量在宫颈癌筛查工作中十分重要,其主要与细胞学医生的能力和水平有关。由于我国幅员辽阔,不同地区医疗水平不同,细胞学医生水平参差不齐,尤其是基层地区,细胞学医生的数量和能力有所欠缺,影响了当地宫颈癌筛查的质量[6-7]。

2020年11月,世界卫生组织(World Health Organization,WHO)正式发布了全球首个消除宫颈癌的战略,即《从公共卫生问题中加速消除宫颈癌的全球战略》,提出了2030年全球宫颈癌防控“90-70-90”目标,其中目标之一是70%的女性在35岁和45岁各接受一次高质量的宫颈癌筛查[8]。我国积极响应WHO“加速消除宫颈癌”的全球战略,并于2023年由10个部委联合发布了《加速消除宫颈癌行动计划(2023—2030年)》[9],也提出我国宫颈癌筛查的目标是2025年适龄妇女宫颈癌筛查率达到50%,2030年达到70%。相关研究显示,2018—2019年35~64岁女性宫颈癌筛查的覆盖率仅为36.8%[10],距70%的筛查目标仍有较大差距。因此,为实现上述目标,宫颈癌筛查的质量和效率需要进一步提升。

在此背景下,AI辅助宫颈细胞学诊断技术的发展及应用,有望成为促进我国高质量高效率开展宫颈癌筛查工作的措施之一。我国《加速消除宫颈癌行动计划(2023—2030年)》中也提出探索人工智能、互联网等新技术应用于宫颈癌筛查和诊疗服务[9]。《共识》发布主要的目的就是在当前形势下,为AI辅助宫颈细胞学诊断技术在实际工作中的应用及质量控制提供参考。

2 关于AI辅助宫颈细胞学诊断技术的定义

在《共识》中对于AI辅助宫颈细胞学诊断的定义进行了阐述。首先,AI辅助宫颈细胞学诊断系统仍然属于病理学图像诊断,且属于医疗器械范畴。我国对于AI医疗器械也有相关定义,是指“基于医‘疗器械数据’,采用人工智能技术实现其预期用途(即医疗用途)的医疗器械”[11],从其定义中可以理解AI医疗器械既包括“AI独立软件”医疗器械,也包括“AI组件”医疗器械,后者也称医疗器械嵌入式软件[12]。AI辅助宫颈细胞学诊断技术包括软件和硬件部分,主要是由扫描工作站、数字诊断和数据存储三部分组成,因此属于含有病理图像AI分析软件的医疗器械。《共识》还参考了其他相关专家共识[13]对AI辅助宫颈细胞学诊断的定义。

需要注意的是目前AI辅助宫颈细胞学诊断技术还是属于辅助诊断,没有诊断权限,意味着AI辅助细胞学是筛选出阳性或阴性细胞,但最终需要细胞学医生进行诊断,并出具报告。

3 关于AI辅助宫颈细胞学诊断技术的应用场景

AI辅助宫颈细胞学诊断系统需要准确分割细胞核,通过特征提取和分类来判断细胞是否有病变。目前主要的核分割算法包括简单线性迭代聚类(simple linear iterative clustering,SLIC)方法、基于区域的分割方法、卷积神经网络(convolutional neural networks,CNN)和聚类方法[14]等。随着AI辅助宫颈细胞学诊断技术的开展,相关应用场景的探讨也日益增多。

3.1 关于AI辅助宫颈细胞学诊断技术的准确性

王娜等[15]研究者对于202例宫颈液基薄层细胞学标本采用多流CNN细胞分类算法进行判读,并与人工判读结果进行比较,结果显示多流CNN二分类和多分类算法的符合率分别为68.13%和73.08%。二分类算法的灵敏度、特异度、阴性预测值分别为100.00%、62.09%、100.00%;多分类算法的特异度相对较高,未见上皮内病变细胞或恶性细胞(negative for intraepithelial lesion or malignancy,NILM)、无明确诊断意义的不典型鳞状细胞(atypical squamous cells of undetermined significance,ASC-US)、低级别鳞状上皮内病变(low-grade squamous intraepithelial lesion,LSIL)、高级别鳞状上皮内病变(high-grade squamous intraepithelial lesion,HSIL)、非典型鳞状细胞不除外鳞状上皮内高度病变(atypical squamous cells-cannot exclude HSIL,ASC-H)分别是96.55%、73.75%、98.29%、98.90%、99.45%。Bao等[16]基于188 542例宫颈样本,深度学习模型诊断HSIL及以上病变的灵敏度为90.10%,且发现模型阅片水平相当于经验丰富的细胞学专家,甚至具有更高的特异度。朱孝辉等[17]分析了16 317例基于深度学习模型的AI诊断宫颈上皮内病变的样本及资料,结果显示AI辅助诊断系统预测宫颈上皮内病变灵敏度为92.90%,预测其他病变灵敏度为83.55%,阴性样本特异度为87.02%;而细胞病理医生运用AI辅助诊断系统分别为99.34%、97.79%及99.10%。Xue等[18]对3 514名妇女的研究结果显示,AI液基细胞学的敏感性与人工阅片相似(86.49%vs.83.78%,P=0.744),但在检测宫颈上皮内瘤样病变(cervical intraepithlial neoplasia,CIN)2级及以上时高于HPV16/18分型(86.49%vs.54.05%,P=0.002)。虽然AI液基细胞学的特异性显著低于HPV16/18分型(51.33%vs.87.17%,P<0.001),但其检测CIN2及以上病变的特异性高于人工阅片(51.33%vs.40.93%,P<0.001)。Wilbur等学者[19]对12 313例宫颈细胞涂片采用人工阅片和AI辅助宫颈细胞学诊断阅片进行比较,结果发现与人工阅片相比,AI辅助宫颈细胞学诊断组的HSIL阳性灵敏度增加了19.6%,LSIL阳性灵敏度增加了9.8%,但特异度略有降低,对于非典型鳞状细胞(atypical squamous cells,ASC)阳性的灵敏度和特异度无统计学差异。

从上述研究可以看到,与传统的人工阅片相比,AI的敏感性相当或略高,特异性有些研究提示略低,有些研究提示显著增高。研究结果的差异与研究采用的AI方法和研究设计不同有关,但总体来说AI的准确性与人工阅片相当或略高,特异性有待进一步研究。

3.2 关于AI辅助宫颈细胞学诊断技术的效率

由于宫颈细胞学检查需要病理细胞学医生阅片后做出诊断,结果容易受主观因素影响,因此细胞学医生的能力和临床经验十分重要。此外,由于宫颈癌筛查的工作量巨大,细胞学医生容易疲劳,也会影响诊断结果的判断,因此在细胞学阅片中要求细胞学医生每天阅片不超过100张[20],但又会影响工作效率。而AI辅助细胞学诊断不存在人员疲劳的问题,且数字诊断标准统一,可以避免上述问题的发生。

国内也有相关研究的报道,朱孝辉等[17]研究结果提示,细胞病理医师运用人工智能辅助诊断系统比人工阅片节省约6倍的阅片时间。郭晓等[21]报道2 719例细胞学图片由2名细胞病理医师阅片需要227h完成,而AI辅助阅片用时136h,节省了时间。因此,效率增加是AI的优势之一。

3.3 关于AI辅助宫颈细胞学诊断技术的应用

AI辅助宫颈细胞学诊断技术作为宫颈细胞学辅助诊断工具,应按照宫颈细胞学检查管理及质量控制要求,应用于宫颈癌机会性筛查及组织性筛查中,可以作为初筛,或HPV检测分流及HPV联合筛查的方法,但需要病理医师最终确认诊断。考虑到AI辅助宫颈细胞学诊断技术具有工作效率高,不存在阅片疲劳及诊断标准统一的优势,更适宜应用于工作量大的人群组织性筛查或筛查数量较大的机会性筛查中,尤其是在细胞学医生能力不足和数量缺乏地区。

目前国内外对于人群组织性筛查也有相关研究报道。有学者应用云技术和人工智能的自动化细胞学诊断平台对湖北省83个县(市)的年龄在20~72岁的703 103名女性进行宫颈癌筛查,结果显示以宫颈活检组织病理学结果作为金标准,AI自动化诊断平台的敏感性和特异性分别为99.18%和44.42%[22]。而阴性预测值和阳性预测值分别为41.27%和99.28%。与人工阅片相比,在NILM、ASC-US、ASC-H、LSIL、HSIL的诊断一致率分别为99.10%、87.49%、84.15%、85.31%和94.20%。与单纯HPV检测相比,Parham等[23]学者在本地区宫颈癌筛查工作中,采用HPV检测加上自动视觉评价算法的方法,结果显示人类免疫缺陷病毒(human immunodeficiency virus,HIV)阳性且HPV16阳性的女性宫颈癌前病变及以上级别的检出风险由48%增加到72%。

4 关于AI辅助宫颈细胞学诊断技术的质量控制

质量控制是保证宫颈癌筛查质量的重要措施之一。对于人工阅片的宫颈细胞学的质量控制主要包括管理、人员能力建设及宫颈细胞学制片阅片等[20]。对于AI辅助宫颈细胞学诊断技术来说,除上述质量控制内容和人工阅片相同,《共识》也进行了详细的阐述。对于AI硬件和软件系统的质量控制也应包括在其中,但目前实际工作中由于AI系统采用的方法不同,相关的参数并不统一,另外不同系统采集细胞学图像的质量也不统一,因此亟需统一AI辅助宫颈细胞学诊断技术系统的参数和细胞学图集。

综上所述,《共识》对于人工智能技术在宫颈癌筛查中的应用和质量控制提供了参考,大规模人群的组织性筛查更能充分发挥AI辅助宫颈细胞学诊断技术高效率、诊断标准统一的优势,但仍然需要在质量控制、信息管理等方面进行深入探讨,并需要更多真实世界的研究数据提供更全面的循证医学证据。

猜你喜欢
阅片细胞学共识
高、低年资住培医生应用人工智能检出脑转移瘤的价值
《住院医师规范化培训教学阅片指南(2022年版)》解读
ORH方法在评价肋骨骨折多阅片者诊断试验中的应用*
共识 共进 共情 共学:让“沟通之花”绽放
论思想共识凝聚的文化向度
商量出共识
人大建设(2019年12期)2019-11-18 12:11:06
SP-1000i全自动推片染色仪及CellaVision DM96自动阅片仪在形态学检验人员镜下比对中的应用
质核互作型红麻雄性不育系细胞学形态观察
肺小细胞癌乳腺转移细胞学诊断1例
别让“PX共识”在爆炸中瓦解