中国医院协会介入医学中心分会
食管癌居中国恶性肿瘤发病率第六位,死亡率第四位,是我国常发、危害重大的疾病[1]。
全球每年新增食管癌患者近50%来自于中国,90%为食管鳞癌[2]。食管癌具有高浸润性和淋巴结跳跃性转移的特点,早期症状隐匿难以发现,中晚期食管梗阻、病灶浸润和转移严重影响患者生活质量及生存预后。食管癌的主要治疗方法如手术、化疗、放疗及靶向治疗等已在我国广泛推广,但我国患者的五年生存率仅为30.3%,是我国必须自主攻克的重大疾病[3-4]。因此,如何早期诊断及精准治疗是食管癌临床诊疗的重大难题,是提高五年生存率的关键[3]。
人工智能(artificial intelligence,AI)是研究开发用于模拟、延伸和扩展人类智能的理论、方法、技术与应用系统的交叉学科,旨在让机器能够像人一样学习、推理和自我修整[5]。在2018年世界分子影像大会上,斯坦福大学Sanjiv Sam Gambhir教授从医生角度对AI做出了解读,称AI是指让计算机做人类认为智能的事情。而在更早的1956年,Dartmouth大学学者MaCarthy在一次关于“复杂信号处理”的研讨会中第一次提出AI这一术语。在随后60多年的发展过程中,不同学科背景的研究人员对AI进行了各自不同的理解,因此,AI领域共产生了三大学派:符号主义学派、连接主义学派和行为主义学派,其中,符号主义学派主张基于公理和逻辑体系实现人工智能;连接主义学派认为AI源于仿生学,主张模仿人类的神经元,用神经元连接机制实现人工智能;而行为主义学派认为AI源于控制论,其基础是“感知—行动”的反应机制[6]。近年来,随着计算机相关学科的跨越式发展,计算机的运算和存储能力得到大幅度提升,连接主义学派提出的人工智能技术得到了快速发展,也得到了学术和工业界的广泛认可,同时为医学图像分析和临床应用等领域提供了强有力的技术手段。下文的AI特指连接主义学派提出的用于图像分析的方法技术。
随着AI技术的日臻成熟和医学影像数字化的发展,AI在医学领域得到了广泛的研究应用,主要体现在疾病术前诊断、治疗疗效评估和预后预测等方面。在疾病诊断方面,AI自动诊断系统对糖尿病视网膜病变、肿瘤原发灶和脑肿瘤病理类型等多种疾病的诊断精度接近临床专家水平,能够提高诊断的准确性和效率,辅助进行临床诊断工作[7-9]。AI辅助胶囊内镜阅片极大地提高了工作效率和病灶的检出率,已经广泛应用于临床[10]。在治疗疗效评估方面,多项研究工作表明,AI模型能够良好地预测评估结直肠癌、宫颈癌等肿瘤的新辅助治疗疗效,辅助指导临床治疗决策[11-12]。此外,AI模型在肺癌和肝细胞癌等癌症患者生存期等预后信息预测方面的成效也得到了验证[13-14]。其中,基于医学影像大数据和AI技术的影像组学在临床精准诊疗的应用最为成熟[15]。综上所述,AI技术在医学领域已经开展了广泛的基础和应用研究,将有助于改善临床诊疗水平,提高医疗资源配置效率,助力精准医疗。
专家组认为食管癌临床诊疗的AI问题识别包括以下四个方面。
研究表明早期食管癌患者的五年生存率显著高于中晚期患者(85% vs 20%),因此,早期诊断食管癌是改善其预后的重要途径[16]。《美国国家综合癌症网络指南(National Comprehensive Cancer Network Guideline,NCCN指 南)》[17]及《中国癌症筛查及早诊早治指南》[18]将内镜辅以卢戈氏碘染色及靶向性活检病理筛查作为食管癌的最佳筛查方案。其中,普通白光内镜(white light imaging,WLI)是常用的内镜检查方法。然而,由于早期食管癌隐匿的特性,内镜检查容易导致病灶漏诊[19]。其他检查方法包括放大内镜(magnifying endoscopy,ME)、窄带成像(narrow band imaging,NBI)和激光共聚焦显微内镜(confocal laser endomicroscopy,CLE)等[20],图1为典型的早期食管癌内镜图像。尽管NBI较WLI和色素内镜可以明显提高早期食管癌检测率,但对操作者要求高,经验不足的医师敏感性明显低于高年资医师(53%vs 100%)。因此,开发AI辅助工具对减少经验差异的影响具有重要意义[21]。
图1 早期食管癌的内镜诊断
1.病灶分级及分期
食管癌侵犯深度和是否淋巴结转移是决定治疗决策的重要标准。其中,内镜下超声是目前NCCN指南推荐食管癌淋巴结转移的准确的检测手段[17],但由于探测深度有限、存在主观性、技术要求较高,且为入侵式检查,尚未成为术前常规检查在临床中应用。而食管癌容易发生跳跃性转移,淋巴结转移比例高达58%~64.2%[22]。因此,在术前准确判断食管癌淋巴结是否存在转移对于治疗决策尤为关键。基于液体活检及影像组学用于诊断食管癌淋巴结转移是目前的研究热点之一。
2.危险分层
食管癌治疗决策的首要环节是对患者进行预后预测,从而实现危险分层,指导医师选择相应的治疗方案。目前,NCCN推荐在诊疗过程利用多种影像进行分期、随访,包括颈胸部CT增强图像及MR增强图像、全身PET-CT影像;利用术后病理图像判读进行术后分期[17]。基于影像及术后病理的解剖学肿瘤TNM分期(tumor node metastasis)是目前临床诊疗的预后预测体系,但由于无法体现生物学特性、主观性强等缺点,通常不够准确。基因是肿瘤内分子异常的根源,影像及病理等临床图像是肿瘤组织及细胞的形态学表征,可以体现肿瘤异质性[23],随着AI技术在食管癌影像、病理图像及基因层面的广泛应用,以上研究材料中蕴含了大量与肿瘤生物学特性的信息,如何利用AI技术量化食管癌基因数据及临床图像的生物特性,进而预测其预后价值是目前食管癌AI应用的关键问题之一。
针对特定治疗方式的疗效预测的临床价值更为明确。由于70%~90%的患者就诊时已发展为局部晚期,单纯手术效果不佳[24],因此根治性放化疗和术前新辅助放化疗是目前NCCN指南推荐的主要治疗方式[17]。目前大部分研究主要针对局部晚期食管癌以上两种治疗模式,利用现有临床数据进行疗效及预后预测研究,为临床决策提供明确的指导方案。
随着二代测序技术在肿瘤研究的广泛应用,海量的肿瘤基因数据在此过程中得以积攒,如何从中挖掘反映肿瘤关键生物学特性的基因,解析量化肿瘤微环境中复杂的分子通路网络,从而用于评价临床疗效及预测生存结局,已成为目前的研究热点。对于食管癌,由于其常见基因突变少见及变异度大,常规分析方法往往难以发现,而AI分析可为此提供解决方案。
1.操作前准备
(1)常规禁食禁水6~8 h,中晚期食管癌患者为避免食管潴留对图片质量的影响,建议禁食12 h,甚至更长时间。(2)预定活检时,抗凝药物、抗血小板药物等必要时提前一定时间中止服用(华法林3~4 d,阿司匹林2 d,噻氯吡啶 5 d等)。(3)为避免黏液对图片的影响,检查前半小时,我们推荐服用蛋白酶0.5 g + 西甲硅油1 mL + 碳酸氢钠1 g +水50 mL。(4)检查前5 min,为抑制食管蠕动与紧张以及胃液分泌对食管的影响,最好肌注解痉药(70岁以上慎用,青光眼、前列腺增生肥大症禁用)。
2.数据来源
采集设备应当包括国内市场占有率超过5%的消化内镜品牌,采集设备须确保处于设备的有效期内,数据需来自多中心内镜中心,医疗机构层次、地域、患者特点具备多样性,以保证AI普适性[25]。
3.采集过程
实施消化内镜影像采集的医师须是熟练内镜操作并通过考核的医师,具备500例以上的内镜操作经验,经过副主任级别医师(操作经验> 3 000 例)的培训,且学习和预录入例数分别不低于20例,录入结果经3名副主任医师评定合格后方可独立采集数据[25]。采集过程注意事项包括:(1)操作时间不少于5 min。(2)每隔5 cm进行间隔观察。(3)发现可疑病灶,至少摄图9张(方便后期训练AI建模):白光镜下远观、近观、典型边界;电子染色下远观、近观、典型边界;卢戈氏碘染下远观、近观、典型边界;必要时进行放大,结合IPCL分型进行诊断。(4)为避免活检后破坏表面结构,不利于白光和染色+放大对病变的判断,从而影响AI建模,活检必须在白光和染色+放大观察后,且已经充分留图后进行。病灶图像应当使用JPEG 等标准格式的原始数据,图像分辨率不低于512像素×512像素。
4.图像质量评定及病灶分类
首先排除质量较差的图像,如晕状、模糊、无法对焦或黏液较多,明显影响评估。图像病灶的分类标准为:(1)肿瘤,金标准为活检病理;(2)良性病变,标准为病理或随访2年不变或至少8名经验丰富(操作经验> 3 000例)的内镜医师共同确认具有明确的良性表现;(3)假阳性病灶,包括皱褶、残渣、气泡等。
5.标注过程
建议标注应由至少3名医师独立完成,并通过汇总统计病灶的检出、分类、定位的准确性,标注团队应至少包括标注医师、标注组长、仲裁专家三类医师,建议标注医师由至少3年以上内镜操作经验且操作1 000例以上的医师担任,标注组长由至少5年以上内镜操作经验且操作3 000例以上的医师担任,仲裁专家由至少8年以上内镜操作经验且操作3 000例以上的医师担任,各批次标注任务由多位标注医师独立完成,并经标注组长、仲裁专家审核方可用于AI训练。结合病灶检出分类定位流程[25]。标记方法分两种,包括:(1)粗标记,主要是使用矩形方框包含病灶,方框边尽量靠近病灶边缘;(2)精细标记,对病理对应部位的图像手工勾画病灶轮廓。
采用胸部及上腹部平扫及增强扫描,扫描范围覆盖食管癌区域淋巴结,从锁骨上窝淋巴结到腹腔干淋巴结。患者取仰卧位,检查前口服800~1 000 mL生理盐水充盈胃腔,一次屏气完成全程扫描。一般采用常规剂量,120 kV,160~280 mAs或自适应电流,矩阵512×512,重建视野> 350 mm,重建层厚≤5 mm,近年来大部分研究采用薄层(1~2 mm),标准算法重建。肘静脉注射CT非离子型造影剂,按照1.5~2 mL/kg计算总量,流速3 mL/s,接着以同样流速注射20~30 mL生理盐水,优化增强效果且最大程度避免上腔静脉及右心系统的射线硬化伪影。通常进行双期增强,动脉期与静脉期分别为30~40 s和 60~80 s。
食管腔常常处于闭合状态,食管癌组学研究普遍使用动脉期图像进行标注,原因可能为动脉期病灶明显强化,与周围正常组织有较大密度差异。淋巴管侵犯是食管癌不良预后的独立影响因素[26]。有研究表明,存在淋巴管侵犯时,肿瘤静脉期(60~80 s)强化幅度可能会增加,因为其反映了造影剂在组织间隙中的扩散[27]。因此,采用静脉期图像进行标注可能会获得更有价值的预后相关特征。
图像标注包括粗略标注与精细标注[28]。粗略标注常被用于目标检测等对病灶边界标注要求较低的任务。而食管位于一个不规则纵隔空间内,与周围正常组织紧密相邻,常常无法区分,因此,当前食管癌CT组学研究普遍采用精细标注,沿肉眼可见的食管肿瘤边缘或食管结构进行勾勒,根据研究目的勾画病灶最大横断面的感兴趣区(region of interest,ROI),连续若干最大横断面的 ROI,或整个肿瘤的感兴趣容积(volume of interest,VOI)。以ITK-SNAP软件为例,勾画前将图像调整至最佳窗宽(250~350 HU)、窗位(40~60 HU),确定病灶位置及范围;早期病变定位困难,可结合胃镜、食管造影及PET/CT等检查,再通过三维多角度观察确定病灶位置。勾画时沿肿瘤轮廓进行手动分割,避免将食管腔内气体、液体、导管等结构纳入ROI范围内。可通过阈值法移除小于-50 HU或大于300 HU的结构。此外,动脉期图像标注时需注意避开走行于右后方的奇静脉,可结合静脉期图像辨认其轮廓。食管病变周围的肿大淋巴结常常与肿瘤无法区分,需根据研究目的选择是否包含周围肿大淋巴结或尽可能避开。图2为食管癌ROI示例。
图2 食管癌CT精细标注示意图
患者检查前禁食至少4~6 h,4~6 h内禁止喝含糖饮料,不输含葡萄糖的静脉输液或静脉营养;测量身高体重;测定血糖,血糖不能高于11.1 mmol/L;注射18F-FDG前平静休息10~15 min,静脉注射18F-FDG的量通常为0.1~0.2 mCi/kg。因显像仪器不同,剂量可以适当调整。
患者注射显像剂后在安静避光的房间休息60 min,于显像前排空膀胱,取下身上的金属等高密度物品。患者体位为仰卧位双手抱头,注射18F-FDG 60 min后开始显像,扫描范围一般为颅底至大腿中段,采用CT进行定位扫描,PET使用3D采集,利用CT数据进行衰减校正,一般采用低mA/s(X射线管电压为120 kV,电流峰值为20~120 mA)。PET图像重建采用有序子集最大期望值迭代法进行(ordered subset expectation maximisation algorithm,OSEM)重建,矩阵大小为 128×128 或者 256×256,体素大小一般为 4×4×4 或者 4×4×5 mm。
图像标注方面,建议对CT和PET图像同时进行ROI勾画,ROI包括肿瘤原发灶、转移淋巴结、远处转移灶,或根据研究需要的相应ROI(如特定正常等)。
MRI检查尚未被常规应用于食管癌诊疗中。近来报告的两个食管癌MR组学研究,一个采用西门子的T2-TSE-BLADE和增强StarVIBE序列对整个肿瘤进行图像标注[29];另一个采用飞利浦的T2W-和SPAIR T2W序列对最大横断面肿瘤进行标注[30]。这些序列有较高的组织分辨率,可反映病变内部丰富的组织成分差异。与CT图像标注一样,在MRI图像上进行标注,应尽可能包含所有可见肿瘤信号区域,沿着病灶边缘进行勾画,避免包括腔内气体、液体及胸椎;根据研究目的,考虑是否包括肿瘤周围淋巴结。
需要采集研究时间点(如接受抗肿瘤治疗前3周内)完成相应活检或手术,从而取得肿物等组织,完成福尔马林固定、石蜡包埋、切片、染色,利用高通量全切片数字扫描仪对其进行扫描,建议放大倍数设定为40×物镜,以0.23 μm/像素的分辨率获得病理全切片图像。需要病理医师排除存在大量空泡、折痕、染色不佳及肿瘤成分<1%的病例。利用自动化算法对病理图像进行染色标准化,提高各病理切片的颜色表征的一致性。以上所有图像及信息保存时采用研究号匿名化处理。
病理图像的标注极为重要,根据既往研究经验[31-32],建议对病理图像进行区域划分:针对不同细胞组织分类,比如脂肪组织、背景、癌巢、坏死、淋巴细胞、平滑肌、黏液腺、正常黏膜上皮[32];针对肿瘤微环境的不同区域分类,如癌巢、癌巢坏死区域、癌内淋巴细胞浸润区域、基质淋巴细胞浸润区域[31]。
关键影像特征的提取和筛选AI模型的构建至关重要。定量影像特征包含影像组学特征和深度学习特征。Robert Gillies等在非小细胞肺癌预后研究中整理归纳了影像组学特征,主要包含一阶统计量特征、形状大小特征、纹理特征和小波分量特征,研究表明影像组学特征与患者预后及分子信息具有较好的相关性[33]。与影像组学特征相比,深度学习特征是针对某个特定的临床诊疗任务由深度学习模型从感兴趣区域中自动学习到的,其具有较强的特异性,往往能够针对该任务具有较好的预测性能。通常,深度学习模型中最后的全连接层被当作深度学习特征。此外,影像组学特征是根据人为设计的数学公式从感兴趣区域中计算出来的,往往具有良好的可解释性;而深度学习特征是AI模型从感兴趣区域中自动学习到的,其可解释性较差。此外,不同成像设备、参数和重建参数对影像特征影响较大;而在不同中心间标准化成像采集平台和参数是不实际的[34]。影像和特征的标准化,如ComBat标准化[35],可以在一定程度上校正由不同成像协议造成的影像特征差异。
高维特征通常包含了大量不相关和冗余的信息,这容易导致AI模型的过度拟合现象,即模型对未见过的数据(外部验证集)的表现性能差。因此,特征筛选有助于提升AI模型的稳定性和泛化性。在基于医学影像的AI研究中,最小绝对收缩选择算子(the least absolute shrinkage and selection operator,LASSO)[36]和最大相关最小冗余(maximal relevance and minimal redundancy,MRMR)[37]是最常用的特征筛选算法。由于医学影像样本量较小,影像特征在单一研究入组的数据集中的分布情况和全数据集中有所偏差,因此,应融合多种特征筛选算法结果或者一种特征筛选算法在不同子样本中的结果,以增强特征筛选结果的稳定性和有效性[8]。
建议:在食管癌AI应用研究中,图像标准化和特征标准化可以缓解图像采集和重建参数对影像特征的影响;在构建AI模型前,可筛选出对不同图像采集和重建参数稳定的影像特征,以增强AI模型的泛化性能;融合多种特征筛选算法结果和单一算法在不同子样本中筛选结果可增强筛选到关键特征的稳定性和有效性。
目前,医学领域常用的AI算法主要分为传统机器学习算法和深度学习算法。传统机器学习算法是基于特征工程开展研究,需要根据领域内专家的经验知识进行特征的量化设计。通常来说,传统机器学习算法更加适用于小样本量的研究,且训练时间较短。常见的传统机器学习算法包括逻辑回归、支持向量机(support vector machine,SVM)、随机森林(random forest)、朴素贝叶斯(naive Bayes)等。深度学习算法是基于数据驱动的,具有强大的特征学习能力,可以从数据中充分挖掘到可表征分类任务的有效特征,同时避免了传统机器学习算法中特征设计、提取和筛选等繁琐的过程。与传统机器学习算法相比,深度学习算法往往需要更大的数据量、更高的计算机算力、更长的模型训练时间。目前,深度学习算法已在诸如目标检测、识别、跟踪等多种场景下的计算机视觉任务中达到最先进水平(state-of-the-art)[38-40]。典型的深度学习算法包括卷积神经网络(convolutional neural networks,CNN)、循环神经网络(recurrent neural networks,RNN)、深度置信网络(deep belief network,DBN)等。其中,CNN是目前医学影像分析领域最常用的深度学习算法,在该算法中,卷积层编码医学图像的局部信息;池化层抽取关键特征,减少特征空间大小,同时有效地减少计算量;非线性的激活层使得该模型学习输入特征与输出特征之间的非线性映射关系。通过卷积层、池化层和激活层的交替堆叠,CNN避免了AI模型构建过程中繁琐的特征提取和筛选步骤,而隐式地从医学图像中挖掘关键的影像特征。
在机器学习模型训练时,最好在训练集中采用K折交叉验证的方式寻找最优的模型参数以构建机器学习模型;迁移学习(transfer learning)通常被用于训练深度学习模型,以解决医学影像样本量小的问题,即首先在大样本量的数据集上训练深度学习模型,然后在入组数据集中对预训练模型进行微调(fine tune)。迁移学习的有效性在乳腺癌分类和淋巴结检测工作中得到了很好的验证[41-42]。在模型验证时,除了内部验证集,来自不同中心的外部验证集也是不可或缺的。同时,一些性能指标常被用来评价模型的优劣,如准确率、曲线下面积、特异性、敏感性、阳性和阴性预测值等。
建议:在医学影像样本量小时,采用传统机器学习算法或迁移学习构建AI模型;采用多中心的外部验证集对模型的泛化性进行验证。
1.AI在食管癌内镜早期诊断中的应用
使用WLI及NBI内镜高质量的静态图像训练AI,由于训练数据质量较高,其检测食管癌的敏感性达到98%[43],准确性与专家无差异,且速度更快(22 s vs 210 min),可以显著提高临床工作效率[44]。在更接近临床实际的动态内镜视频测试下,AI检测肿瘤的准确性仍然优于高年资的内镜医师(88%vs 75%)[45]。在诊断虚拟的漏诊浅表性食管癌病例中,AI模型敏感性明显优于医师(85.7% vs 75%),证明AI技术能降低食管癌漏诊率[46]。2002年内镜专家总结消化道早期病变的分类方法,将食管黏膜表面微血管变化(intraepillary capillary,IPCLs)作为诊断组织异型性的唯一可靠征象[47]。基于ME-NBI数据训练的AI模型鉴别正常与异常IPCL的准确性达到93.7%[48],提示基于IPLC形态学的AI系统有利于实现食管癌早期诊断。细胞内镜通过放大500~900倍的内镜观察消化道表面上皮细胞,可以在非活检情况下实现消化道病理检查,利用细胞内镜图像训练AI模型,其鉴别诊断食管良恶性病变的准确性达到90.9%,可望辅助内镜医师独立开展食管癌诊断[49]。最大规模训练测试数据(84 424例)的上消化道内镜AI研究,其前瞻性内部验证的准确性为92.7%,外部验证的准确性为91.5%~97.7%,接近专家级医师(94.2% vs 94.5%),但是该研究中食管癌仅占27%,而其中早期食管癌的比例未知,因此该系统对早期食管癌的检测诊断效能有待进一步分析[50]。
建议:由于同步使用AI进行内镜检查可能会影响医师的判断,比如医师过度信赖AI的准确性导致专注度降低,建议仅在常规胃镜检查后使用AI作为第二阅读者处理保留的图像或视频,为医师指出额外的病灶,以降低漏诊率[51-52]。如果AI由大数据训练,并且经过前瞻性多中心数据充分验证,检测、诊断效能至少达到专家级内镜医师水平,可以考虑将其融合到内镜实时检查过程,以提高工作效率以及指导更有针对性的活检。
2.AI技术在预测食管癌侵犯深度方面的应用
食管癌侵犯深度是决定治疗决策的重要标准之一。对于食管癌局限于黏膜固有层或黏膜肌层(T1a)可以采用内镜切除,侵犯黏膜下层(T1b)则往往需要接受手术治疗[53]。常规内镜诊断食管癌侵犯深度的准确性分别仅为65.3%~71.4%[54],虽然内镜超声对T1a分期诊断的敏感性和特异性达到85%和87%,但是主观差异较大[55]。基于内镜静态图像训练的AI区分浅表型食管癌浸润深度(黏膜下层上1/3、中1/3、下1/3)的准确性达到91.0%,与经验丰富的医师接近(89.6%),该研究提示AI可望用于判断食管癌侵犯深度[56]。为了进一步提高AI的实用性,另有团队使用常规及放大内镜视频训练AI模型,虽然这些数据包含清晰度欠佳的非聚焦图像,AI判断肿瘤侵犯深度的准确性仍然优于内镜专家(87%~89% vs 84%~85%),提示AI在预测侵犯深度方面具有重要应用前景[57]。
建议:目前单中心小样本研究证明AI判断食管癌深度方面具有较好的准确性,可为内镜医师提供参考,其泛化性和实用性有待多中心前瞻性研究进一步验证。
CT在食管癌临床应用更为广泛,因此基于CT的影像预测模型的可推广性具有一定优势。首先在淋巴结转移预测方面,通过传统的Logistic回归方法(logistic regression,LR)对术前临床、影像及病理特征进行筛选,建立模型可预测食管癌淋巴结转移[58-62],其AUC值为0.758~0.820。在此基础上通过人工神经网络方法(artificial neural network,ANN)建立模型,其诊断准确性及AUC值均明显优于LR模型(ANN vs LR:准确性0.907 vs 0.745,P<0.001;AUC 值 0.915 vs 0.868,P<0.001)[63]。Wu等[64]基于影像组学方法预测淋巴结转移的ROI选择绝大部分是影像可见食管肿瘤组织,选择术前动脉期CT肿瘤最大层面作为ROI来建立临床影像组学模型预测食管癌淋巴结转移,内部及外部验证集的AUC值分别达0.874、0.851。需要指出的是,目前的食管癌淋巴结组学研究均选用术前肿瘤作为ROI来预测个体是否存在淋巴结转移,尚未对淋巴结特征进行挖掘。肠癌及肺癌淋巴结转移预测的研究表明[65],直接以淋巴结作为ROI建立模型,其诊断性能优于以肿瘤作为ROI的模型。然而,淋巴结ROI尚未应用于食管癌的淋巴结影像组学研究中,原因可能为淋巴结ROI的人工分割工作繁琐。实现对单个淋巴结是否存在肿瘤转移的个体预判,特别是诊断难度大的细小淋巴结,对术前评估尤为重要。
在疗效预测方面,Jin等[66]发现整合治疗前CT影像组学特征、放疗剂量学参数及患者一般信息,可预测食管癌根治性放化疗疗效,预测准确性 达0.708,AUC值 为0.689。Xie等[67]进 一 步改进影像分析的方法,通过细化解析食管癌原发灶7个子区域的CT影像,提取其影像组学特征,通过LASSO等经典的机器学习方法,构建影像组学预后预测模型,预测3年生存率的一致性指数(coincidence dense,C指数)为0.705~0.729,并发现筛选的影像特征与肿瘤拷贝数变异(copy number alterations,CNAs)显著相关。随着多种人工智能方法分析在多种肿瘤表征取得显著的效果,Hu等[68]对比了现有6种人工智能方法,用于分析161例接受新辅助放化疗的局部晚期食管鳞癌患者的完全缓解率,发现ResNet50-SVM方法的预测效能最高,AUC值达0.805~0.901,明显高于基于手工特征的影像组学模型(AUC值0.725~0.822);此外他们通过分析28例患者的RNA表达信息,发现细胞外基质及WNT信号通路基因异常与筛选的影像分数最相关,其次为TGF-β(transforming growth factorβ)和肽类激素(peptide hormone)信号通路基因等。
建议:亟待对淋巴结的影像组学特征进行细化研究,实现对淋巴结的个体化精准诊断。基于AI的CT图像预测方法入侵性小,但其稳健性及普适性仍需要在多中心、真实世界大数据中进行验证。
PET-CT作为同时反映肿瘤代谢与组织结构的功能影像,目前已广泛应用于临床。在根治性放化疗这一应用场景上,早在2009年,Javeri等[69]已发现治疗前肿瘤原始标准摄取值(initial standardized uptake value,iSUV)与胃食管癌的放化疗近期疗效和长期生存相关。2011年,Ganeshan等[70]将纹理分析技术用于治疗前PET-CT,将肿瘤异质性定义为肿瘤纹理紊乱,发现肿瘤异质性与SUV最大值和SUV平均值相关;肿瘤异质性越高,分期越晚,并且可独立预测患者生存。而在术前新辅助放化疗的领域,Cao等[61]发现基于PET-CT的影像组学模型与肿瘤同期放化疗后近期退缩密切相关。Kukar等[71]认为治疗前后PET-CT食管腺癌SUV差值少于45%与新辅助放化疗后疾病残留有关,阳性预测值为91.7%。Beukinga进一步用机器学习方法获得治疗后PET-CT的影像组学特征,发现结合T分期及治疗后PET-CT影像组学特征,可精准预测术前新辅助放化疗疗效。Ypsilantis等[72]引入CNN,从治疗前PET-CT中自动提取关键特征,用于预测食管癌新辅助化疗疗效,预测效能优于基于手工提取影像特征的传统机器学习算法。Xie等[73]进一步优化建模方法,在106例接受新辅助放化疗 +手术患者中,基于与生存密切相关的差异表达基因,进一步从海量影像特征筛选出与上述基因关联的关键特征,从而建立基因驱动的影像组学预测模型,并证实其优于未经过基因筛选的影像模型。这一方法为解决医学图像分析中的可解释性难题提供了新思路。
建议:需要针对食管癌关键临床问题,建立稳健、高效和高可解释性的AI分析模型,充分挖掘及解译PET-CT提供的功能和结构双源信息,以指导食管癌精准治疗。
由于MRI对软组织的分辨率更高,加之MRI扫描门控技术也可避免呼吸运动造成的伪影,因此适用于食管肿瘤及纵隔淋巴结的评估。Qu等[29]分析181例食管癌患者的治疗前MRI,发现基于MRI的影像组学诊断淋巴结转移的AUC值可达到0.82。Hou等[30]对68例根治性放化疗的食管鳞癌患者进行疗效预测,采用两种方法——支持向量机(SVM)和人工神经网络(ANN)构建模型,发现SPAIR-T2W和T2W均有较高的预测准确性,前者优于后者(0.843 vs 0.719)。
建议:受限于MRI在食管癌常规诊疗中的应用,基于MRI的人工智能研究尚处于起步阶段。MRI多参数成像能在AI研究中提供更多图像信息,用于食管癌淋巴结转移、放化疗疗效判断及预后预测。
近年来,随着高通量全切片数字扫描仪等可将传统病理玻片进行批量数字化,并转化为高分辨率的病理全切片图像的设备的广泛应用,数字化病理图像得到了推广。基于AI的医学图像分析技术为细化分析高清的病理全切片图像提供了契机。目前,AI已实现了对病理全切片图像中的肿瘤细胞及其环境中的其他细胞进行自动分割和量化分析,其在判断乳腺癌转移[74]、预测结直肠癌预后[32]及胶质瘤分子特征[75]等应用场景也显示出强大的潜力,因此也逐渐成为了近年来的研究热点。食管癌的病理学形态[76]及免疫组化特征[77]被证实与患者预后密切相关,但受限于病理医师短缺和人工判读的主观性,AI技术目前在食管癌病理分析的应用极少。2021年7月31日,本研 究 以“esophageal carcinoma”、“digital pathology”和“artificial intelligence”为关键词在PUBMED检索,未见相关研究,说明了巨大的需求缺口。
建议:将AI医学图像分析技术应用于辅助病理医师快速诊断食管癌淋巴结转移、预测食管癌预后及药物敏感性,是未来非常有前景的方向。
随着肿瘤基础研究的深入,AI辅助下的基因分析将进一步助益于肿瘤生物信息分析,提高生物信息分析探究肿瘤复杂的生物通路网络的能力,为基因信息在临床广泛推广应用打下坚实基础。Mourikis等[78]利用SVM构建了稳健的分析方法,利用34个已知癌症基因的生物学特性,明确了952个已知的驱动基因促使食管腺癌发展的辅助基因。Warnecke-Eberz等[80]从患者的治疗前RNA表达情况,筛选出17个基因用于准确预测新辅助放化疗疗效。此外,在甄别食管病灶[79]及淋巴结的良恶性上,AI辅助的基因分析均显示出强大的效能,例如Kan等[80]通过AI分析28例患者治疗前外周血中8 094个cDNA基因的表达情况,筛选出60个基因判断淋巴结转移的敏感性为88%,特异性为82%。
建议:将AI技术应用于食管癌基因信息分析,可更好地量化解析复杂的分子生物通路网络,有助于食管癌的精准诊疗。
虽然现阶段研究表明AI在食管癌早期诊断、精准分期及预后预测等方面取得了开拓性进展,但是,由于医学领域的特殊性和深度学习的局限性,AI在食管癌临床应用仍面临着重大挑战。首先,多中心前瞻性食管癌AI研究有待开展。目前大部分研究中食管癌AI模型都是在单中心回顾性数据集合上进行构建和验证的,由于AI模型强大的拟合能力,导致常常出现AI模型的过拟合现象,因此需要通过多中心前瞻性食管癌影像数据验证AI模型的泛化能力。其次,由于食管癌影像数据质量参差不齐,数据规范化和标准化亟需开展。在多个医学中心间,甚至同一个医学中心内部,食管癌医学影像采集设备、采集参数和重建算法等方面也存在差异,这导致了影像数据信号和质量的差异。同时,有监督的AI算法要求食管癌影像必须经过专家标注,这个过程会耗费大量的时间和精力。但目前多项食管癌AI研究没有明确的影像标注标准,影像质量和标注标准的差异将会影响食管癌AI模型在多个医学中心间的推广和性能发挥。此外,亟需建立相应的伦理道德规范及政策加强对数据安全问题的监管和保护。最后,目前的AI算法,尤其是深度学习算法的复杂性较高,可解释性较差。高可解释性的AI算法有利于提升临床医生的认可度,加速AI推广到临床诊疗中。因此,亟待研究高可解释性的AI模型算法。
1.早期诊断:计算机辅助系统
针对食管癌等消化道肿瘤早期诊断的AI系统,经过现实世界多中心数据验证,最先迈入临床应用阶段。部分内镜AI系统已经通过了国家药品监督管理局创新医疗器械审批,开始产业化道路,有望实现早期食管癌的同质化诊断。
2.术前分期及分级:智能化的分级分期系统
EUS和CT、PET-CT是目前食管癌分期分级诊断的常用方法,3种手段各有优势,互为补充,通过AI对上述方法进行整合,结合临床信息,建立计算机辅助诊断系统,实现治疗前精准分期,有助于精准分层治疗。
3.疗效预测:智能化的临床决策支持系统
针对根治性放化疗、新辅助放化疗、免疫治疗等特定治疗,基于临床常规图像(如病理、CT、MRI、PET-CT等)建立AI智能化的临床决策支持系统(treatment decision support system,CDDS)价值重大,在提高患者生存预后的同时,也能够节省巨大的医疗资源。首先,对根治性放化疗进行精准预测,有利于预先评估患者放化疗敏感性,指导研究者更好地设计临床试验人群,辅助医师进行治疗方案的制定:对于放化疗不敏感的患者,可能采取早期介入免疫治疗、抗血管生成,抑或减瘤手术配合术后辅助综合治疗等其他策略。其次,在新辅助放化疗之前,提前预判新辅助放化疗疗效,有助于筛选真正适合新辅助放化疗患者。最后,在新辅助放化疗之后及根治性手术之前,有利于及时在术前评估患者新辅助放化疗后肿瘤退缩的程度,助力手术方案的制定,比如对于完全退缩的患者,可能不再接受手术,而采取“观望(wait and see)”策略。
目前,基于AI的食管癌临床应用仍处于研究阶段,在AI逐步转化到食管癌临床日常诊疗的过程中,我们还面临着技术和伦理等方面的挑战。我们相信随着AI技术的不断发展、医工结合的不断深入,AI技术将更加契合食管癌临床诊疗需求,辅助临床医生实现食管癌的精准医疗。
共识制定人员(按姓氏拼音排序):
范 丽(上海长征医院)
房昭雄(中山大学附属第五医院)
何 波(昆明医科大学第一附属医院)
陆 遥(中山大学)
赖人旭(中山大学附属第五医院)
李 东(天津医科大学总医院)
李 丹(中山大学附属第五医院)
李坤炜(中山大学附属第五医院)
刘再毅(广东省人民医院)
梁明柱(中山大学附属第五医院)
马祥园(汕头大学)
曲金荣(河南省肿瘤医院)
单 鸿(中山大学附属第五医院)
宋 伟(北京协和医院)
施 俊(上海大学)
田 捷(北航-首医大数据精准医疗创新中心,中国科学院分子影像重点实验室)
唐彩华(中山大学附属第五医院)
容鹏飞(中南大学湘雅三医院)
张 帆(中山大学附属第五医院)
张亚琴(中山大学附属第五医院)
张帅通(北航-首医大数据精准医疗创新中心,中国科学院分子影像重点实验室)