刘秋蕊,赵宇
(四川大学华西医院 耳鼻咽喉头颈外科,四川 成都 610041)
喉癌是头颈部最常见的恶性肿瘤之一。据统计,全球每年约有18万人被诊断为喉癌,约9万人死亡[1]。近年来,人工智能在医疗卫生领域中的应用不断拓展,国内外众多学者逐渐聚焦于人工智能在喉癌早期筛查、诊断、治疗、预后预测等领域中的应用。本文就人工智能在喉癌诊疗领域中的应用现状进行综述,探索其未来发展的机遇与挑战。
电子纤维喉镜检查普遍应用于喉内的视诊和喉部疾病的诊断。电子纤维喉镜下早期发现喉部癌前病变或喉癌有助于尽早干预治疗,避免患者因延误诊断而失去保留喉发声和(或)通气功能的机会,有助于全面改善患者的生活质量、生存率和预后。然而,并非所有临床耳鼻咽喉科医生都具备足够的经验和能力来准确识别喉镜图像中的癌症征象,即使近年来新兴的喉镜下窄带成像技术(narrowband imaging technology,NBI)可帮助提高早癌诊断率[2],实际工作中仍存在误诊、漏诊现象。
基于此,众多研究团队尝试将人工智能技术与内镜图像诊断识别相结合。Ren等[3]学者基于卷积神经网络(convolutional neural network,CNN)算法进行喉部疾病筛查和诊断分类,将7 521例患者的19 433张图像,随机分为训练图像集、验证图像集及测试图像集(以验证算法的泛化能力),另从测试数据集中随机抽取500张图像,由12位耳鼻咽喉科医生组成的专家团与人工智能模型进行喉镜图片分类比赛。经训练与测试,基于CNN的人工智能模型对喉部5种状态(正常、小结、白斑、息肉、恶性肿瘤)分类的总体准确率优于耳鼻咽喉科医生(94% vs 86%,P<0.001),尤其是在声带白斑(91% vs 65%,P<0.001)和恶性肿瘤(90% vs 54%,P<0.001)的鉴别分类方面。而CNN模型仅需22.7 s即可完成所有分类,比临床医生的分类效率高500倍。另一项研究也利用CNN构建了喉癌诊断模型,其总体敏感性、特异性、准确度分别为73.1%、92.2%和86.7%,受试者工作特征曲线的曲线下面积为0.922[4]。
人工智能技术有潜力成为喉癌诊断的良好工具,既能减轻内镜医生的读图负担,又能高效、准确地完成喉癌的筛查和诊断。此外,在缺乏NBI技术的基层医院,应用此类人工智能技术可在节约设备成本的同时提高患者的诊断率,有助于提升偏远和农村地区的医疗质量。
术前影像学检查有助于评估喉癌的肿瘤体积、癌旁侵犯程度、颈部淋巴结良恶性鉴别等,错误的评估可能导致切除不彻底而导致肿瘤复发,或造成扩大切除而增加不必要的手术并发症和功能缺损。目前喉癌的主要影像学检查方法包括CT、MRI、PET/CT、超声等。
张惠柯[5]收集了经组织病理学证实的115例喉癌患者的颈部增强CT轴位图像(包括恶性淋巴结207枚和良性淋巴结359枚),纳入淋巴结中心性坏死、球形、环形或薄壁强化、淋巴门消失及增大淋巴结短轴径≥10 mm等指标,采用密集连接卷积网络构建了一种用于颈部淋巴结术前良恶性定性诊断的人工智能模型。经训练和测试,该模型对颈部淋巴结良恶性定性诊断的准确性、敏感度、特异性、阳性预测值、阴性预测值分别为83.8%、76.3%、90.5%、87.9%、80.9%,曲线下面积为0.842,平均每个淋巴结的诊断时间为0.625s,与Ariji等[6]的研究结果一致。而Santin等[7]则开发了一项基于深度学习的智能算法,用于检测CT图像中甲状腺软骨异常征象,后者是决定喉癌手术范围、放疗疗效和预后分级的重要指标之一。
遗憾的是,在实体肿瘤的人工智能辅助影像诊断方面,尚无研究构建专门的喉癌实体肿瘤诊断模型,但已有不少团队将计算机辅助诊断(computer-aided diagnosis,CAD)应用到食管癌[8]、乳腺癌[9]、前列腺癌[10]、肺癌[11]等的术前诊断中,未来喉癌领域的CAD值得期待。
尽管近年来放化疗和分子治疗逐渐受到重视和应用,手术切除仍然是治疗中、晚期喉癌的主要治疗手段。在保留邻近健康组织的同时最大限度地切除肿瘤可以同时满足良好的生存率和更少的术后并发症,因此,精确、快速的喉部病理学检查至关重要。
Zhang等[12]采集了45例喉癌患者的新鲜无标记手术组织标本,对每个标本分别进行受激拉曼散射(stimulated raman scattering,SRS)显微镜成像和苏木精-伊红(hematoxylin-eosin,HE)染色成像(各80张),由3位专业喉部病理学专家阅读SRS和HE随机混合图像。经分析统计,两种图像呈高度一致性。在此基础上,该研究利用18 750个SRS视野构建和训练了一种基于深度学习的剩余CNN模型。经评估,此模型在对33个独立手术标本的分类测试中获得较高的准确度。类似的,Halicek等[13]采用高光谱成像技术采集293份新鲜手术无标记组织样本图像,利用深度学习和机器学习成功构建了高准确度的头颈肿瘤病理诊断模型。
值得注意的是,上述两种人工智能病理诊断模型所依赖的成像技术均可以在新鲜的、未经处理的手术标本上自动、准确地诊断喉鳞状细胞癌,无需固定、切片或染色,这极大地缩短了术中、术后等待病理结果的时间,有助于更快地进行后续治疗决策,提高患者生存质量。
传统的喉癌实体肿瘤切除手术主要分为部分喉切除术,包括经口激光显微切除术(transoral laser microsurgery,TLM)和全喉切除术。由于喉部解剖结构的特殊性(非线性通道、多窦道与皱襞),喉癌手术存在微创切除时暴露困难以致难以根治,或根治切除时损伤范围广的问题。
2010年来,经口机器人手术(transoral robotic surgery,TORS)逐步被应用在喉癌外科治疗中。TORS是一种采用达芬奇外科手术系统的显微外科手术,由2个操作臂、1个内镜臂和1个中控台组成。术者在中控台手柄上进行手术操作,中控台内智能算法以高达1 300 次/s的运算通量实时处理术者在手柄上进行的模拟操作矢量数据,筛除混杂干扰,屏蔽术者生理手震等,将操作指令精确地传输到操作臂,以完成人手难以达成的更高精度更高准确度的手术操作,如精确的肿瘤安全边控制、亚解剖单位的拉拢缝合等[14],使手术医生在尽可能切除肿瘤的同时保留更多的喉部结构。2020年,Hanna等[15]发布了一项早期喉癌患者不同术式的预后分析研究,此研究回顾性地纳入了1 780例T1和T2期喉癌患者,其中186例患者接受了TORS,1 071例患者接受了TLM,523例患者接受了开放性手术。其结果显示,接受TORS的患者的肿瘤边缘性质、术后是否需要辅助治疗及总体生存率与TLM和开放性手术相比并无明显差异,表明TORS是治疗早期喉癌的可靠方案。More等[16]主导的一项临床随机对照实验则发现,与接受传统初级放化疗治疗的20例晚期口咽癌和声门上型喉癌患者相比,接受TORS治疗的20例患者在随后的6个月和12个月随访中获得了更优的安德森吞咽困难量表评分,说明经TORS治疗的患者,术后吞咽功能恢复更快、保留程度更高,这与陈伟等[17]的研究结论一致。以上研究均表明,TORS是治疗喉癌的一种安全有效的方案,在提升患者生存结局的同时能提供更优质的生存质量。
近年来,肿瘤综合治疗已成为国内外学者的共识,基于患者个性特征的肿瘤预防和治疗是未来肿瘤诊疗领域的发展趋势[18]。
Howard等学者采集了美国国家癌症数据库(national cancer database,NCDB)中自2014年初至2016年末登记诊断为口腔、口咽、下咽或喉鳞状细胞癌的共计32 987例患者信息,利用3种机器学习模型对每位患者进行辅助治疗模式推荐[19-21]。经验证,实际治疗方案与模型推荐治疗方案相匹配的患者的总体生存率显著高于非匹配患者,DeepSurv的HR为0.79(95%CI为0.72~0.85,P<0.001),RSF为0.90(95%CI为0.93~0.98,P=0.01),N-MTLR为0.83(95%CI为0.77~0.90,P<0.001),说明3种机器学习模型所推荐的综合辅助治疗方案均可显著提升患者预后。此外,3种机器学习模型均可准确识别仅接受RT治疗即可获得良好预后的患者,且DeepSurv在老年和年轻患者中仍能提供可靠的预测[22]。Smith等[23]则利用NCDB中cT1-T3a的喉鳞癌患者数据开发了一种基于机器学习的梯度提升算法,可识别cT1-3期中接受了初次非手术治疗后仍需进行挽救性全喉切除术的喉鳞癌患者,准确度为76.0%(95%CI为 74.5%~77.5%),曲线下面积为0.762。
喉癌患者的预后受到复杂多样的因素影响,目前对喉癌患者预后的分析多为各种回归模型,但这些模型只能处理相对较少的变量,且对变量间交互作用的分析较为粗糙和有限。
2005年,Jones等[24]开始尝试将人工智能神经网络应用于喉癌患者的预后预测。他们纳入了1 327例喉鳞癌患者,筛选识别了年龄、性别、肿瘤部位、组织学等十余种独立危险因素,分别构建了Kaplan-Meier生存分析模型、Cox比例风险模型和神经网络模型。经对比,神经网络模型不仅能绘制准确的生存曲线,其分析行为更为“多元”,对年龄和N分期曲线的差异更为敏感,且在各种分析环境下对各变量都有着更强的区分性能。2015年,来自德国莱比锡大学的计算机辅助外科创新中心的工程师与该校耳鼻咽喉头颈外科的肿瘤专家着手开发一种基于贝叶斯网络的临床决策支持系统(clinical decision support system,CDSS)。该团队旨在构建一套高精度、个性化、可交互、多学科支持、临床可读的治疗决策和预后预测系统,使外科医生通过CDSS设置单个患者数据后即可计算特定患者的治疗模式和预后预测[25]。该团队于2019年发布了代表TNM分期子网络(303个变量)的验证结果,模型准确率达100%,并提出了标准化建模、广泛模型的验证和交互等方面的研发建议。
随着人工智能技术的蓬勃发展和多学科交叉合作,人工智能技术在喉癌诊断、治疗决策和预后预测等领域都取得了良好的进展。但目前投入应用的人工智能技术仍存在较多不足,如图像识别模型较多且杂、缺乏行业统一的标准与规范,机器人辅助手术的手术范围、时长、出血及修复等与传统手术相比尚逊色良多,更有大部分技术尚缺乏临床应用场景验证,亦缺乏配套的国家法律法规和伦理规范,故人工智能在喉癌诊疗的实际应用还有海量工作有待完成。未来各科研工作者需在研发技术的同时携手建立行业规范,并着力推动技术落地,使人工智能技术与喉癌诊疗的结合尽快迈入实际的临床应用,造福患者。