王凯怡 赵亚丹 谢慧君 邓再兴
宫颈癌是严重威胁女性生命健康的恶性肿瘤之一。据统计,全球每年死于宫颈癌的人数超过27.5 万人。由于早期实施了HPV 疫苗接种和宫颈癌筛查,截止至2020 年5 月宫颈癌的发病率和死亡率均明显降低[1]。但由于发展中国家子宫颈病变的筛查和诊断技术水平参差不齐,早期诊断难以进行,宫颈癌仍严重威胁女性的生命健康[2-3]。早期准确的筛查可以有效降低宫颈病变的发病率[4]。虽然一些发达国家的宫颈癌发病率和死亡率呈下降趋势,但我国仍处于上升趋势,宫颈癌筛查覆盖率仍然很低[5]。限制中国宫颈癌筛查项目扩大的主要原因是缺乏训练有素的病理医师,在不发达地区尤为明显[6]。同时,国内基层医院专业人员(包括能从事阴道镜检查的医师)人力不足,能力有限,不能满足大规模宫颈癌症筛查的需求[7]。近年来,人工智能(artificial intelligence,AI)技术发展迅速,已广泛应用于医学图像识别和分析领域[8-9]。在宫颈癌筛查过程中,AI 辅助系统阅片具有减少工作量、节约医疗资源、提高宫颈癌筛查效率等优势,但AI辅助系统也存在误诊、漏诊现象[10],亟需对AI 辅助系统的效能进行深入研究,提升AI 辅助系统的灵敏度。本研究通过分析湖州市妇幼保健院1 994 例宫颈薄层液基细胞学涂片样本的临床数据,探讨AI 辅助系统在宫颈薄层液基细胞学研究中的应用价值。
1.1 对象 收集2022 年7 月至2023 年2 月湖州市妇幼保健院的1 994 例宫颈薄层液基细胞学涂片样本。所有样本均有明确诊断的宫颈薄层液基细胞学检测(cervical thinprep fluid-based cytologic test,TCT)结果。纳入标准:年龄≥18 岁。排除标准:(1)处于妊娠期、哺乳期或生理期;(2)有宫颈疾病治疗史或其他恶性肿瘤病史;(3)有免疫系统疾病。本研究经本院医学伦理委员审查通过(批准文号:2021-R-016),所有患者均知情同意。
1.2 宫颈薄层液基细胞学制片 宫颈薄层液基细胞学涂片按照杭州海世嘉生物科技有限公司液基细胞学检测的说明采样,用特制的宫颈刷和保存瓶收集宫颈外口和脱落的细胞,按照规定操作制片。采集的样本均保存在细胞保存液(杭州海世嘉生物科技有限公司,备案号:浙杭械备20140159号,规格:10 mL/瓶)中。
1.3 细胞学诊断标准 为验证AI 辅助系统在TCT 中的价值,采用目前国际广泛使用的TBS2014 分级系统进行细胞学诊断。诊断结果具体描述为:(1)未见上皮内病变或恶性细胞(negative for intraepithelial lesion or malignancy,NILM);(2)意义不明的非典型鳞状细胞(atypical squamous cells of undetermined significance,ASC-US);(3)不典型鳞状细胞,不能排除高度上皮内病变的不典型鳞状细胞(atypical squamous cells,cannot exclude hsil,ASC-H);(4)低度鳞状上皮内病变(low grade squamous intraepithelial lesion,LSIL);(5)高度鳞状上皮内病变(high grade squamous intraepithelial lesion,HSIL);(6)鳞状细胞癌(squamous cell carcinoma,SCC);(7)未明确诊断意义的非典型腺癌(adenocarcinoma glandular carcinoma,AGC),其中ASC-US 及以上认定为阳性涂片。
1.4 方法 对比病理医师人工阅片(人工阅片)、宫颈薄层液基细胞AI 辅助诊断系统[锟元方青(湖南)医疗科技有限公司,系统包括:(1)宫颈细胞学玻片扫描分析系统,注册证编号:湘械注准20212220685,型号规格:F.Q.CytoSense 40P;(2)宫颈细胞学智能分析软件,注册证编号:湘械注准20222210389,型号规格:FQPATH-CC)]筛查(AI 阅片)以及AI 阅片基础上病理医师复查(AI 辅助阅片)3 种阅片方式的宫颈癌筛查结果,记录3 种阅片方式的阅片时间。人工筛查团队由2名细胞学阅片经验丰富的病理医师组成。在AI 辅助筛查的基础上,病理医师复查阅片中判断结果不一致的涂片,以病理医师的复查结果为准。宫颈薄层液基细胞AI 辅助诊断系统利用计算机图像识别技术,通过AI 系统的学习,对细胞学涂片进行可疑病变细胞的识别、抓取和分类,进而给出细胞学涂片的诊断结果。
1.5 阴道镜活检 阴道镜下宫颈活检由本院妇产科专职阴道镜医师进行,按四象限取样进行常规活检,取可疑病灶组织进行病理组织活检。病理诊断采用宫颈上皮内病变(cervical intraepithelial neoplasia,CIN)命名系统,包括阴性(慢性宫颈炎、宫颈息肉等)、CIN 1级、CIN 2 级、CIN 3 级、SCC。不同部位有不同级别的病理诊断结果,以级别最高者作为最后诊断结果。
1.6 统计学处理 采用SPSS 25.0 统计软件。不同TCT 结果下不同年龄段(根据2012 年美国阴道镜检查和宫颈病理学学会指导方案将年龄分为18~29 岁及≥30 岁两个年龄段[11])样本3 种阅片方式阳性率比较采用χ2检验。以阴道镜活检≥CIN 1 级为金标准,分别计算3 种阅片方式的灵敏度、特异度等指标(灵敏度是指有组织学诊断为阳性的患者中,TCT 结果为阳性的比例;特异度是指有组织学诊断为阴性的患者中,TCT 结果为阴性的比例)。采用McNemar 检验比较3 种阅片方式的灵敏度、特异度。3 种阅片方式的阅片时长以表示,组间比较采用Brown-Forsythe 检验,两两比较采用Tukey 检验。P<0.05 为差异有统计学意义。
2.1 所有样本诊断结果汇总分析 1 994 例样本中,活检结果≥CIN 1 级共102 例,总体阳性率为5.12%,其中CIN 1 级82 例,CIN 2 级10 例,CIN 3 级10 例。使用3种阅片方式,TCT 结果≥ASC-US 为192 例,阳性率为9.63%;TCT结果≥LSIL为98例,阳性率为4.91%,见表1。
表1 所有样本诊断结果汇总分析(例)
2.2 不同TCT 结果下不同年龄段样本3 种阅片方式阳性率比较 1 994 例样本中,TCT 结果≥ASC-US 时,人工阅片、AI 阅片和AI 辅助阅片阳性率分别为9.63%、38.52%和9.93%。其中≥30 岁组样本AI 阅片阳性率高于18~29 岁组,差异有统计学意义(P<0.05);而18~29岁和30 岁组人工阅片和AI 辅助阅片阳性率比较差异均无统计学意义(均P>0.05)。TCT 结果≥LSIL 时,人工阅片、AI 阅片和AI 辅助阅片阳性率分别为4.91%、24.42%和6.92%。18~29 岁和30 岁组人工阅片、AI 阅片和AI 辅助阅片阳性率比较差异均无统计学意义(均P>0.05),见表2。
2.3 不同TCT 结果下3 种阅片方式的灵敏度及特异度比较 以阴道镜活检≥CIN 1 级为金标准,TCT 结果≥ASC-US 时,人工阅片、AI 阅片和AI 辅助阅片的灵敏度分别为100.00%、98.04%和95.10%,特异度分别为95.30%、64.69%和94.66%。AI 阅片与人工阅片、AI 辅助阅片的特异度比较差异均有统计学意义(均P<0.05)。人工阅片与AI 辅助阅片的灵敏度、特异度比较差异均无统计学意义(均P>0.05)。TCT 结果≥LSIL 时,人工阅片、AI 阅片和AI 辅助阅片的灵敏度分别为66.67%、83.33%和82.35%,特异度分别为98.78%、78.75%和97.15%。人工阅片与AI 阅片和AI 辅助阅片的灵敏度比较差异均有统计学意义(均P<0.05),AI阅片与人工阅片、AI 辅助阅片的特异度比较差异均有统计学意义(均P<0.05),人工阅片与AI 辅助阅片的特异度比较差异无统计学意义(P>0.05),见表3。
表3 不同TCT结果下3种阅片方式的灵敏度及特异度比较(%)
2.4 3 种阅片方式的阅片时长比较 人工阅片、AI 阅片、AI 辅助阅片的总阅片时长分别为49.92、63.76 和24.58 h,平均阅片时长为(90.12±17.52)、(115.12±3.18)、(44.37±13.19)s,3 种阅片方式的平均阅片时长比较差异有统计学意义(F=15 674.730,P<0.001),两两比较显示,平均阅片时长AI 辅助阅片<人工阅片<AI 阅片。与人工阅片比较,AI 辅助阅片的总阅片时长减少25.34 h,总阅片时长减少率(总阅片时长减少率为人工阅片和AI 辅助阅片总时长的差值除以人工阅片总时长)为50.76%(25.34/49.92);平均每张涂片减少45.75 s,平均阅片时长减少率(平均阅片时长减少率为人工阅片和AI 辅助阅片平均时长的差值除以人工阅片平均时长)为50.77%(45.75/90.12)。
随着AI 深度学习技术的改进和计算能力的提高,AI 在解释复杂图像方面取得较大进步。研究人员开始将这些先进的技术应用于病理图像分析,但是大多数的努力都集中在组织病理学上,细胞病理学仍然是最初的病理学领域[10]。随着数据集的扩展和计算机性能的提高,通过大数据学习的计算机系统使AI 辅助病理学阅片成为可能。有研究显示AI 辅助阅片系统不仅具有较好的灵敏度和特异度,同时能够显著提升阅读效率[10]。在细胞学诊断过程中,人工辅助阅片与人工阅片的总体符合率为68.3%(95%CI:66.6%~70.1%),两种阅片方式的检测结果基本一致[12]。Zhang 等[13]利用卷积神经网络系统对细胞学图像进行扫描,其准确度可达98%。本研究表明,病理医师使用AI 辅助诊断系统时可以达到人工阅片的检测灵敏度和特异度。
CIN 与宫颈癌密切相关,在CIN 1 级患者中有22%~32%的病变会持续存在,仅有1%~11%左右的病变会发生恶性进展[14]。本研究显示,1 994 例样本中,CIN 1 级82 例,CIN 2 级10 例,CIN 3 级10 例,表明19.6%(20/102)的患者已经发生癌前病变,比之前报道的癌前病变比例[14]高。因此,前期的筛查与预防对于宫颈癌变的后期治疗及控制是至关重要的。
TCT 是宫颈癌筛查的重要手段之一,是基于一种薄层液基细胞的系统性检测技术[15]。TCT 筛查过程中将取出的样本迅速放入细胞保存液中,使用全自动制片仪器将细胞固定在载玻片上,有效提高细胞的检出率[16]。邵洪兰等[17]在206 例适龄女性中进行TCT,11 例检测阳性,阳性率为5.34%,曹蕾等[18]在318 例TCT 筛查样本中检测到106 例阳性样本,阳性检出率为50.31%。两组数据总体的阳性率相差较大主要受研究人群、样本量、病理医师主观诊断、阳性判定标准等因素的影响。本研究在1 994 例宫颈薄层液基细胞学样本中检测到TCT 结果≥ASC-US 样本192 例,阳性率为9.68%,≥LSIL 样本98 例,阳性率为4.91%。
AI 阅片针对每一张涂片进行全面扫描,并进行图片处理分析,总阅片时长较人工阅片更长,而AI辅助阅片只需要在AI阅片的基础上对存在异议及阳性的涂片进行复查,这样大大降低了人工阅片的时间,排除了在阅片过程中产生的部分主客观因素的影响。有研究表明,AI 辅助阅片包括扫描切片及分析过程仅用时162 h(6.75 d),而人工阅片的总用时为256 h(10.7 d),花费时间缩短了36.71%,同样表明了AI 辅助阅片显著缩短病理医师的阅片时间,提高阅片效率[19]。因此,通过AI 辅助阅片可排除大量阴性样本,细胞学病理医师可以把大量时间花费在有异议样本及阳性样本上,大大提高了阅片的准确度及阅片效率。
综上所述,在TCT 结果≥ASC-US 和≥LSIL 两种判读结果下,AI 辅助阅片具有与人工阅片一致的灵敏度和特异度,病理医师通过AI 辅助系统进行阅片,平均每张涂片减少50.77%的阅片时长。因此,AI 辅助系统在宫颈薄层液基细胞学研究中具有重要的应用价值,可以大幅缓解相关专业病理医师资源匮乏的状况,值得在宫颈癌前病变筛查过程中推广。