陈亮辉,李 婷
食管癌是上消化道主要的恶性肿瘤之一。2018年食管癌发病率在全球恶性肿瘤中位居第七位,是所有癌症死亡的第六大原因[1],多数患者就诊时已达到癌症中晚期[2]。早期食管癌及癌前病变在内镜下治疗可以达到90%以上的治愈率[3],改善患者的预后。然而,内镜医师的临床经验、专业水平以及病变大小等因素限制了早期食管癌内镜下的检出率[4-7]。人工智能(artificial intelligence,AI)与消化内镜成像技术结合后,可以对大量内镜图像进行学习、训练,分析内镜图像与疾病诊断之间的关联,从而达到模仿人类认知的水平,帮助医师完成快速、精准的诊断。Babu P等[8]的一项系统性评价表明,运用卷积神经网络算法(convolution neural networks,CNN)的人工智能辅助诊断食管癌的合并准确率为87.2%,敏感性为87.1%,特异性为87.3%。
本文综述近几年人工智能在评估食管癌前病变和食管肿瘤方面的研究文献,重点探讨了AI在评估不同类型内镜图像上的应用,以及他们的优缺点,以期为医生和计算机之间的协作以及这项技术在临床实践中的应用提供参考。
1.1 辅助识别巴雷特食管异型增生和早期食管腺癌
巴雷特食管(Barrett’s esophagus,BE)是食管腺癌最重要的危险因素之一,80%的食管腺癌发生在BE基础上[9],所以BE的筛查和诊断非常重要。BE黏膜的癌变是一个逐步发展的过程,然而对于普通内镜医师来说,评估所有发展过程的病变,即区分无异型增生BE、低级别/高级别异型增生BE和早期腺癌,可能非常困难[10]。内镜医师对BE早期异常识别的水平存在差异,病检取材部位阳性率低,导致漏诊时有发生[11]。
此外,通过早期检测适合内镜下治疗的BE及早期食管腺癌,患者的预后可能会从根本上得到改善。目前已经发展出很多种先进的内镜技术,如放大内镜、电子染色内镜、色素内镜、共聚焦激光显微内镜、容积式激光内镜等,但大多数都是昂贵且耗时的,需要有一个很长的学习过程,一些技术只有专家和熟练的内镜医师才能使用[12]。因此,人工智能将为早期食管癌的检查提供一个很好的辅助工具。
1.1.1 在白光内镜和窄带成像中的应用
高清晰白光内镜(white-light endoscopy,WLE)是初步识别BE异型增生的最佳选择[13],人工智能可以提高普通内镜医师对BE异型增生的诊断准确性。de Groof等[14]开发了能够满足临床实时应用的深度学习辅助诊断系统,该AI 系统使用1 704例BE异型增生和非异型增生患者的高清WLE图像进行训练后,区分图像为BE肿瘤和非异型增生的准确率为89%,敏感性为90%,特异性为88%,其诊断的准确率高于普通内镜医师,同时可标注肿瘤活检的最佳位置,标注结果与内镜专家有很好的一致性。因此,使用AI辅助内镜诊断可帮助较低年资内镜医师识别 BE早期瘤变,并协助他们定位活检部位。van der Sommen等[15]构建了一个通过对病变部位颜色和纹理特征进行学习的计算机辅助诊断系统,其诊断早期肿瘤病变的敏感性和特异性均为83%。Ebigbo等[16]研发了一种基于深度学习的计算机辅助诊断系统,在两个WLE图像数据集中测试,其诊断早期食管腺癌的敏感性/特异性分别为97%/88%和92%/100%,在窄带成像(narrow-band imaging,NBI)数据集中的敏感性/特异性为94%/80%,该系统还显示了病变定位能力,与内镜专家分析结果的面积符合率达到72%。然而,以上研究存在一个相同的问题,即训练阶段和验证阶段使用的图像数据集是相同的。
Hashimoto的研究组建立了一个AI系统,用916张BE肿瘤(高度异型增生/T1肿瘤)WLE/NBI图像和919张正常BE图像进行预先训练,随后以“异型增生”或“非异型增生”的二分类进行微调[17]。该AI系统验证阶段使用了另外458张测试图像,其检测出早期肿瘤的准确率为95.4%,敏感性和特异性为96.4% 和94.2%,能够以较高的精度(平均精度为0.7533)定位异型增生区域。
de Groof等[18]前瞻性收集了40例异型增生BE和20例非异型增生BE患者的白光内镜图像作为训练数据集。由内窥镜专家对肿瘤图像进行勾画,将至少4个圈定区域的重叠区定义为“最佳点”。他们开发的模型通过对BE图像颜色和纹理特征的训练,从最佳点中提取正面特征,从非异型增生图像中提取负面特征。该系统对肿瘤检测的准确性可达92%,敏感性、特异性为95%和85%。
1.1.2 在容积式激光显微内镜中的应用
容积式激光显微内窥镜(volumetric laser endomicroscopy,VLE)是使用光学相干断层扫描产生实时显微横截面的成像技术,它能对食管壁层深达3 mm处的病变进行识别。内镜医师必须对大量复杂的图像信息进行分析,人工智能辅助则有助于对病变的快速识别。Swager等[19]使用60张VLE图像对他们的辅助诊断系统进行交叉验证,其检测早期肿瘤性病变的敏感性为90%,特异性为93%。随后,该小组又评估了采用多帧VLE图像人工智能对早期肿瘤病变自动识别的可行性,用3 060帧VLE图像对多帧人工智能诊断系统进行测试,与采用单帧图像的相比,多帧图像诊断系统有更高的曲线下面积(P<0.001),AUC中位数为0.91,图像分析总用时为3.9 s[20]。
1.1.3 在内镜实时诊断中的应用
早前的大多数研究都是通过使用高质量、静态的内镜图像来实现的,这可能不能准确地反映临床实践的真实情况。Seghal等[21]收集了非异型增生和异型增生BE患者的高清内镜视频,使用了嵌入视频处理器的实时图像映射技术的软件算法,以内镜专家对图像的评估构成系统的决策树,结果模型的准确率提高到92%,灵敏度和特异度分别为97%和88%。随后,非专家人员使用该决策树,在训练前后解读了相同的视频。在经过正式训练后,非专家组发现异型增生的准确率明显提高,敏感性从71%提高到83%。Ebigbo等[22]开发了一个能实现图像快速分析和概率预测人工智能诊断系统,并依据癌症发生的概率呈现彩色密度分布图。该系统从实时内镜影像中随机提取图像,检测早期食管腺癌的敏感性为83.7%,特异性为100.0%,准确率为89.9%。
1.2 辅助识别早期食管鳞状细胞癌
我国食管癌以食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)为主要亚型,占食管癌的90%以上,5 a总生存率<20%。因此,食管鳞癌及癌前病变的早期诊断对提高患者治疗效果和预后至关重要[23]。内镜检查为食管癌及癌前病变筛查的常规手段,人工智能在有效提高内镜筛查的灵敏度与诊断的准确率上能起到积极作用。
1.2.1 在白光内镜和窄带成像中的应用
Guo L等[24]开发了一个辅助食管癌诊断的人工智能系统,可实时对早期食管鳞癌和癌前病变进行自动识别。该系统使用6 473张癌前病变、早期食管鳞癌和非癌性病变的NBI图像进行训练,并使用内镜图像和视频数据集进行了验证。该系统为每个图像生成一个概率热图,黄色表示癌变的可能性很高,蓝色表示非癌性病变。该系统对1 480张癌变NBI图像的敏感性为98.04%,对5 191张非癌性NBI图像敏感性为95.03%,曲线下面积为0.989。在27个非放大视频中,每帧的灵敏度为60.8%,每病变的灵敏度为100%。对于20个放大视频,每帧的敏感度为96.1%,每病变的敏感度为100%。对于正常食管影像(包括33段影像),每帧特异性为99.9%,每例特异性为90.9%。在识别内窥镜图像和视频数据集中的癌前病变和早期食管鳞癌上有很高的灵敏性和特异性,该系统在内窥镜辅助诊断上有广阔的应用前景。
日本的Ohmori研究小组开发了一个用于检测和鉴别浅表食管鳞癌的系统[25]。训练数据集包含非放大和放大的正常食管病变及浅表食管鳞癌图像,验证数据集由另外135名患者的内镜图像构成。该AI系统在非放大NBI图像的敏感性、特异性和准确性分别为100%、63%和77%;在放大内镜图像组的敏感性、特异性、准确性分别为98%、56%和77%,诊断性能优于经验丰富的内镜医师。Cai等[26]开发了一个使用深层神经网络(deep neural network,DNN)的计算机辅助诊断系统,可在普通白光内镜成像下定位并识别早期食管鳞癌,训练和验证过程采用不同的图像数据集,结果该系统的敏感性、特异性和准确率分别为97.8%、85.4%和91.4%,正预测值和负预测值为86.4%和97.6%,优于低年资内镜医师,且具有实时病灶标注提示功能,帮助内镜医师检测出之前忽略的病变。AI 对提高低年资内镜医师识别早期食管癌的能力具有较高的价值。由Horie等[27]开发的运用CNN的人工智能系统检测食管癌的灵敏度达到98%,并能够检测出所有<10 mm的食管癌病变。区分浅表或晚期食管癌的准确率达到了98%,对食管鳞状细胞癌和食管腺癌的诊断准确率分别为99%和 90%。这些结果证明了人工智能能够快速分析大量的内窥镜图像,从而在将来的临床实践中提高对早期食管癌检测的能力。
1.2.2 在内窥镜系统中的应用
内窥镜系统是一种通过活体染色对食管上皮细胞进行实时评估的放大内镜技术。内镜医师可以清楚地观察到食管黏膜上皮细胞,达到与病理诊断相似的效果[28]。但是,内窥镜医生若想独立地完成实时检测,需要具备坚实的病理学基础,这显然是不实用的。因此,人工智能可辅助其虚拟实现组织病理学的诊断。Kumagai等[29]应用深度学习技术探索一种用内镜检查取代组织活检的人工智能,该系统对55例患者(27例ESCC和28例非肿瘤病变)中的1 520张经染色的图像进行测试,人工智能在27例鳞状细胞癌中正确诊断了25例,敏感性为92.6%;28个非癌性病变中有25个被诊断为非恶性,特异性为89.3%,总体准确性为90.9%。
1.3 AI在预测食管癌浸润深度和分型中的应用
内镜下治疗比外科食管癌根治术的并发症少,所以推荐M1或M2期食管癌为内镜下治疗的绝对适应证[23]。因此,准确地识别浸润深度对于避免过度治疗,从而提高术后生活质量是至关重要的。近年来,人们发现食管鳞状上皮内乳头状毛细血管袢(Intra-epithelial papillary capillary loop,IPCL)在内窥镜下的形态学改变与肿瘤浸润深度相关[29]。根据日本食管学会提出的基于放大内镜的IPCL分型法,不同的IPCL分型代表不同的病变和浸润深度,然而分类仍然需要内镜医师有足够的经验。因此,运用AI技术辅助诊断将提供一个更有效、更客观的解决方案。
日本Tokai等[30]评估了AI系统测量食管鳞癌浸润深度的能力。作者收集了1 751个ESCC图像和浸润深度信息,以此来训练他们开发的运用CNN的人工智能诊断系统。随后,该诊断系统和13名内镜专家审查了55例患者的291张测试图像,其诊断ESCC的准确率为95.5%,预测浸润深度的准确率为80.9%,灵敏度为84.1%。该系统对ESCC浸润深度的诊断准确性高于内镜专家,可作为ESCC评估的辅助工具。Everson研究小组开发了一种能够对内镜图像中肿瘤或非肿瘤形态实时分类的AI系统[31]。采用CNN技术,通过使用17例患者的7 046张放大NBI图像进行训练,正常的IPCL被分为A型,异常者分为B1-3型,对IPCL形态的正常/异常分类准确率为93.7%,敏感性为89.3%,特异性为98%。该系统以实时方式运行,诊断预测时间在26.17 ms 到37.48 ms 之间。然而,目前所开发的模型还不能对所有的特定亚型进行分类。
人工智能技术与内镜检查相结合,通过算法在大量的内镜图像或视频中进行训练,可以达到专家级别的诊断水平,有效减少食管癌及癌前病变的漏诊,实现快速、准确的诊断[32]。人工智能技术将会为医疗资源缺乏、水平欠佳的地区获得顶尖医疗技术提供一个很好的途径,并惠及当地民众,实现优质医疗资源的共享。AI辅助诊断系统可作为医师完成内镜下准确诊断的重要辅助手段,同时也为未来培训低年资内镜医师提供了一个有效的工具。
尽管AI在辅助肿瘤诊断领域取得了一定成果,但在向临床实践转化的道路上仍面临诸多挑战[10,33]。首先,大多数研究通常只收集高质量的内镜图像构成训练数据集,而病变部位被黏液、胆汁覆盖的低质量图像被排除。这种做法可能会导致模型的过度拟合[34-35],从而夸大了AI系统诊断的准确度。其次,因为大多图像数据集是回顾性的,病变部位有比较典型的特征,而更多的非典型病变则可以用来改善AI模型的性能。人工智能模型应该通过使用完全独立的训练数据集和测试集进行评估,以反映系统的实际性能[36]。AI在收集使用患者数据时,应遵守伦理道德和相关法律,避免泄露患者隐私,研究人员应开发以达到患者最佳服务满意度为中心的AI诊疗技术。
未来AI诊断系统能否代替内镜医师做出诊断,尚需在未来继续检验。但可以肯定的是,AI可以协助内镜医师完成食管癌的诊疗工作,减轻医师的临床工作量,同时缓解医疗资源分布的不均衡。目前,已有基于人工智能的三类医疗器械获得我国药品监督管理局的审批,这些产品可以帮助医生完成复杂的医学判断,协助其作出诊断。随着研究的不断深入,相信人工智能技术也将在食管癌筛查、诊断和治疗等临床实践中得到逐步应用。