褚庆玉,贾山移,冉玲华
1 重庆市人民医院,重庆400014;2 重庆慎安医院
人工智能(AI)是借助计算机模拟某些思维过程和智能行为的过程,“数据驱动”深度学习(DL)的问世为AI研发带来了革命性的动力。AI能从海量的大数据中提取特征病变,通过计算机迅速地做出医学判定[1]。计算机运算能力受计算机硬件、运算方法制约,目前DL算法包括深度神经网络、卷积神经网络(CNN)、深度置信网络和递归神经网络等[2],其中CNN被最广泛地用于医学图像识别。而DL算法在图像识别准确性上,已经可以有超越人类的表现[3]。在消化内镜领域,医师需要处理大量的内镜图像,导致工作量大,同时漏诊率高。AI给胶囊内镜(CE)带来一种全新的诊疗体系,全面提升了内镜检查效率及诊疗水平。近年来,大多数CE对AI的研究主要分为计算机辅助检查系统(CADE)和计算机辅助诊断系统(CADX)两类[2]。CADE旨在检查、定位胃肠道(GI)病变,而CADX则专注于GI病变的识别;此外,计算机辅助跟踪系统(CADM)的研发,用于评估CE检查过程的完整性,提高病灶的识别,提高内窥镜检查质量。虽然,AI在临床中的应用中发挥了前所未有的优势,但仍存在不足。本文就AI在CE中的应用及存在的不足综述如下。
1.1 CADE 在内镜检查中,检查结果受阅片医师的水平、追踪模式等多因素制约,往往导致诊断结果的偏差。而CADE检查系统不受上述因素的限制,对可疑病变提高检出率,是目前CE检查的主要方法。目前,CADE已广泛应用于胃癌、小肠疾病、大肠息肉的检查。有学者基于CNN模型来检测胃癌,总体准确性为92.2%;但是受胃解剖结构影响,可导致其阳性预测值不理想[4]。多项研究显示,AI为小肠胶囊内窥镜(SBCE)检查小肠病变带来了突破;AI在自动检测SBCE图像方面的潜力,主要应用于肠出血、缺铁性贫血、克罗恩病的诊治、肿瘤的检测、腹痛的诊断,并有助于急性消化道出血的治疗[5]。最近,一项研究对6 970例患者的113 426 569张图像进行病灶分析,AI显示出比胃肠病学专家更高的敏感性,并显著缩短了对每例患者的图像分析时间[6]。一项针对1 058例患者的前瞻性随机对照试验(RCT)结果显示,CADE能提高息肉和腺瘤的检出率(29.1%,20.3%),患者平均息肉、腺瘤数目分别为0.53、0.31个[7]。这表明高性能实时息肉自动检测可以在实际临床环境中改善检出率,AI在SBCE检测息肉方面表现出良好的性能。
目前,在大多数CADE研究中,敏感性被视为降低病变遗漏率的主要因素之一[8]。但假阳性率随CADE高敏感性而增加,这可能影响内镜检查结果的判断,特别是在筛查人群中[9]。因此,高灵敏度和低假阳性率之间的平衡将是未来研究的重点。
1.2 CADX CADX可以通过应用自动图像分析来提高病变光学诊断和靶向活检的准确性,已被用于食管癌、幽门螺杆菌(HP)感染和早期胃癌的检查。有学者报道了一种基于CNN的食管癌识别模型,该模型可以将浅表食管癌与晚期癌区分开,准确性达98%[10]。针对HP感染的研究也表明,与内镜医师相比,CADX的准确性更高[11,12]。有学者将一种CADX系统应用于识别实时放大的NBI中,其对胃癌诊断的准确度≥96.3%[13]。最近,一种CNN-CAD预测胃癌的浸润深度系统成功研发,临床结果显示其准确性(89.16%)、特异性(95.56%)明显优于经验丰富的内镜医师[14]。
已发表的研究表明,CADX在GI检查时可自动识别腺瘤性息肉和非腺瘤性息肉,此结论引起了内镜医师的广泛关注[15,16]。最近,一种使用窄带成像(NBI)内窥镜视频鉴别腺瘤性和增生性小肠息肉的CADX系统研发成功,对106例包含小息肉的患者进行测试,该模型在区别腺瘤和增生性息肉的总体准确性、敏感性、特异性分别为94%、98%、83%[14]。最近,一项实时CADX和带有染色或NBI图像的前瞻性研究表明,CADX达到“诊断分离”策略,是目前最有价值的内窥镜创新合并,对小型腺瘤的发现率﹥90%[17]。另外,CADX具有实时发现息肉的良好临床表现[18]。随着研究的深入,有一些研究试图将AI应用于炎症性肠病。最近研发的一种CADX系统,可以识别正常黏膜、病变黏膜,诊断溃疡性结肠炎患者的准确性、特异性分别为91%、97%[19]。
1.3 CADM 随着研究的深入,自动结肠镜检查系统问世,该系统可以检测肠管表面微小息肉,并且可以描述病变的大小、形态[20]。近年来,在CE中应用CNN的研究激增。但是,多数已发表的研究集中在GI病变的诊断或检査的质量控制以及监督检查的完整性,而忽略检查时间及图像的质量。CE的检查时间以及收集图片的清晰度,是改善内窥镜检查的基础。Wu等[21]研发了一个实时质量改进系统WISENSE以监控CE盲区,对检查过程进行计时并在CE检查期间自动生成照片;将WISENSE用于324例患者的RCT研究显示,WISENSE组的盲点率(5.86%)低于对照组(22.46%)。在结肠镜检查领域,AI充分发挥智能的潜力。最近一种自动质量控制系统(AQCS)问世,该系统不但可以定时停药,还能监督药物稳定性以及评估肠道准备和检测结直肠息肉。临床试验表明,AQCS可以使息肉和腺瘤的漏诊率降到16.5%,且能延长给药撤药时间[22]。
2.1 数据因素 每个系统收集的图像均是高质量的内窥镜图像构建数据库,对于低质量或无法识别的图像未纳入数据库,数据库图片的过度模拟化导致检查结果存在一定的误差。在这种情况下,系统诊断的准确性可能被夸大。同时,静态高质量图像的良好性能并不能确保在动态视频中获得成功。因此,可以考虑运用加强数据集的方法,增加数据集的大小,在一定程度上避免过拟合现象的发生,从而使系统更加稳定。同时,为便于在CE检查过程中进行实时评估,采用未经处理的图像对CNN进行训练和(或)测试是更理想的方法。此外,数据库收集的回顾性研究不能涵盖所有病变的形态特征,而捕获图像的病变往往没有最典型的病变特征,导致一些具有临床价值的非典型病灶被忽略,导致较高的选择偏倚[23]。因此,系统数据集的构建应包括具有各种形态学特征的GI病变。
2.2 实验样本因素 当前大多数研究通过诊断测试评估AI辅助系统,结果在很大程度上受到样本数量、质量的影响。测试集和数据集在患者或病变级别应完全独立。考虑到数据偏斜度对AI的影响,应根据疾病分类、人群等因素来确定测试数据集的分布,以确保结果的合理性和充分性[24]。
2.3 研究方法因素 首先,应将患者的风险分级纳入当前CNN的模型中,以提高在高风险人群中的诊断,同时减少普通人群的误诊率。上述问题都是可能导致AI在CE应用中存在的不确定因素。此外,一些前瞻性研究采用单一方法进行,所以无法对AI系统进行确切评估[25]。其次,先前研究的结果指标主要集中在技术指标上,如敏感性、特异性、阳性预测值、阴性预测值,而这些指标很容易受到测试人员分布的影响。最后,评判DL各种算法的性能没有“黄金”法则,而是依据实验者对系统的熟练程度,算法的不同也是导致实验误差的原因。
2.4 技术因素 目前,大多数研究仍集中在早期系统开发和可行性研究上,而后期产品开发未能跟进[26]。因此,医学界、计算机科学家行业之间更紧密的协作对促进AI在医疗产品中的临床应用至关重要。考虑到当前医疗资源和医师能力的不平衡,将AI技术集成到当前医疗系统中是改善工作流程的理想方法。
随着CE新技术的发展,智能融合是CE发展的趋势,而最具潜能的是与光活检和刷检的结合,解决CE病理检查的局限。光活检具有高分辨率、高灵敏度、高精确度且无损伤、安全等优点,而细胞学刷检方法简便、诊断快捷、报告迅速。在AI技术的发展,光活检、刷检与CE结合,使内镜病理检查快捷、精准。随着技术的进步,具有先进治疗功能的智能CE(组织病检、携带药物、控制释放)应用于临床并造福患者。5G时代来临,互联网新技术与医疗领域融合的逐渐深入,CE将在医疗影像大数据分析、远程诊疗等方面持续发力,利用大带宽、低时延、高速率的天然优势将促进跨屏、跨空间的远程医疗快速普及,让优质的医疗资源得以在更大范围共享,助力消化道疾病的诊治。随着科技的进步,AI将为CE提供更为广阔的发展空间。在不久的将来,CE与智能手机融合,CE检查不需要在医院进行,患者购买内镜设备后与智能手机结合,将检查图像上传,远程进行图像识别及诊断,提高CE检查的灵活性、智能性。随着科技的进步,AI辅助系统将提高内镜的诊断率、诊疗效率,降低医疗费用,新的智能技术对内镜提出了挑战。AI、机器学习、CE技术的融合迫在眉睫,可能对当前技术的未来产生深远影响,对提高患者的诊治水平具有重要意义。