人工智能在胰腺疾病新型诊疗模式中的应用及进展

2022-11-27 10:03陈鑫龙叶凯周文策

中国医学物理学杂志 2022年8期

陈鑫龙，叶凯，周文策

1.兰州大学第一临床医学院，甘肃兰州 730013；2.兰州大学第一医院普外科，甘肃兰州 730013；3.兰州大学信息科学与工程学院，甘肃兰州 730000；4.兰州大学第二医院普外科，甘肃兰州 730030

前言

胰腺是由外分泌组织与内分泌组织共同组成的器官，在消化与代谢中起到重要作用［1］。胰腺疾病主要包括胰腺炎症、胰腺恶性肿瘤以及胰腺囊性疾病等。急性胰腺炎（Acute Pancreatitis,AP）是最常见的急腹症之一，其病情变化多样，程度轻重不等，重症患者会出现各类并发症，甚至导致休克、死亡［2］。慢性胰腺炎症（Chronic Pancreatitis, CP）由于纤维化改变导致胰腺内外分泌功能紊乱，目前仍以对症治疗为主［1］。胰腺占位主要包括胰腺良性和交界性或低度恶性肿瘤［2-3］，高度恶性的肿瘤则以胰腺导管上皮癌（Pancreatic Ductal Adenocarcinoma, PDAC）为主［4］。良性肿瘤及部分交界性肿瘤可以长期随访观察，恶性肿瘤与分化差的肿瘤则需要进一步治疗，术前合并症、肿瘤分型及是否R0切除、术后并发症对于患者的预后有重要影响［5-6］。

人工智能（Artificial Intelligence,AI）是一种通过建立数学模型对数据进行分析并解决实际问题的方法，可以自动学习并识别数据，主要应用于探究各类因素间的复杂非线性关系。医学问题正是多种因素相互影响的复杂问题，因此AI 在分析医学问题方面大有前景［7-8］。AI 主要通过机器学习（Machine Learning, ML）中的传统统计方法与深度学习（Deep Learning, DL）方法解决医疗领域的难题。ML 是指系统通过输入数据而不涉及形成问题进行学习，医学方面常用的传统统计方法模型有：支持向量机（Support Vector Machines,SVM）、随机森林（Random Forests, RF）、Logistic 回归、人工神经网络（Artificial Neural Network,ANN）等以最大似然法为基础的模型；DL 则是利用模型、分析数据获得更高级别的特征，并根据特征分析得出结果，能够对数据中非常复杂的关系进行建模，最常用的DL 方法是卷积神经网络（Convolutional Neural Networks, CNN）、生成对抗模型（Generative Adversarial Network, GAN）等［9-11］。虽然AI 在胰腺疾病诊疗方面处于起步阶段，但已展现出在诊断、治疗、疾病预后等方面的广阔前景，并为精准医学发展、个体化治疗提供一条明确、可行的道路。本文将通过描述AI在胰腺疾病诊疗中的应用进展，为建立新型诊疗模式提供新思路。

1 AI与胰腺炎症

1.1 AI与AP

AP是一种常见的消化系统疾病，是由胆石症、高甘油三酯血症和饮酒等多种病因引发胰腺腺泡细胞内胰蛋白酶的过早激活，导致胰腺及周围组织自我消化，出现胰腺局部水肿、出血甚至坏死的炎症反应［12］。临床工作中关于AP 的严重程度及病情转归预测包括Ranson评分、Glasgow评分、APACHEⅡ评分等，但是这些评分系统的一个显著问题是它们会随着临床信息的变化而出现误差［13］。C反应蛋白、血尿淀粉酶、脂肪酶以及血细胞比容、尿液中胰蛋白酶原激活肽等标志物对于AP 虽然有预测作用［14-15］，但是与现有评分标准联系并不紧密。由于ANN以非线性方式工作，可以更好地利用现有数据描述风险因素之间的相互作用，因此它们是传统评分系统的良好的替代方案［16］。Pearce［13］使用ML 模型同时纳入APACHEⅡ评分系统数据与C反应蛋白数据，用于AP严重程度及病程预测。Andersson［17］首次纳入“到达急诊科前的疼痛持续时间”这一特征参数以及AP 病人入院时基线资料建立ANN模型预测转归为重症的可能性，两者均证明与AI 相结合预测模型效能优于传统评分。

1.2 AI 与重症急性胰腺炎（Severe Acute Pancreatitis，SAP）

20%～25%的AP 患者会进展为SAP。在SAP 进展过程中，腹腔感染起着重要作用，而且也是决定患者预后的重要因素之一［18-20］。临床实践中AP患者是否并发腹腔感染常根据白细胞计数、中性粒细胞百分比和C 反应蛋白等实验室检查判断，但是后者在SAP患者中普遍升高，很难将其用作确定是否存在腹腔内感染的指标［21］。Qiu 等［22］通过分析炎症和凝血参数并使用Logistic 回归模型（Logistic Regression Model,LRM）和ANN 模型构建预测早期腹腔内感染的可靠且实用的模型，及时预测AP 的严重程度与进展为SAP的可能。

约20%的SAP 患者会出现器官功能衰竭（Organ Failure,OF），并且有30%的OF 患者死亡，但是在OF发生之前，很难预测SAP 的最终临床结局［23］。Xu等［24］通过收集多中心数据并使用6 种不同ML 模型对数据进行重复验证，不同模型之间进行内部验证并建立预测性能良好的多器官功能衰竭（Multiple Organ Failure,MOF）预测模型。

SAP同样会导致多种并发症，这些并发症大多会导致严重后果，因此预测并发症的发生也是AI 与临床实践结合的重点［25］。门静脉血栓形成（Portal Vein Thrombosis, PVT）是AP 的血管并发症之一，PVT 可以累及所有门脉分支［26］，并产生局限性门静脉高压，导致胃或食管静脉曲张出血。它还可能导致患者肝衰竭、腹水、住院时间延长、死亡率升高［27］。Fei［28-29］分别通过径向基函数（Radical Basis Function, RBF）模型与反向传播（Back Propagation, BP）模型预测PVT，并证明两者效能均优于传统Logistic回归分析。SAP 患者在入院早期死亡率的预测一直未进行深入研究，应用单因素及多因素Logistic回归分析及ANN模型结合后构建仅有4个危险因素的AP早期死亡率的预测模型，其预测效能不劣于具有14 个危险因素的APACHEⅡ评分［30］。Keogan 等［31］通过CT 图像特征、临床数据及实验室检查训练新的ANN 模型预测AP 患者严重程度，该模型在预测受试者是否会超过平均住院时间方面优于传统评分系统。AI与临床数据相结合会提升关于AP 患者疾病严重程度、并发症发生率和死亡率的预测效率，然而一些研究显示出相互矛盾的结果，并且大多数算法仅与现有评分系统或模型之间进行效能对比，而没有在外部数据集上得到验证，因此，建立具有外部验证数据集的新型AI模型是进一步研究的重点［13,17,32-33］。

1.3 AI 与自身免疫性胰腺炎（Autoimmune Pancreatitis,AIP）

AIP 是一种自身免疫性疾病，以淋巴细胞浸润与纤维化为主，临床表现上会出现无痛性黄疸，影像学上也会出现“血管侵犯”的表现［34-35］，通过血清学以及影像学仅能鉴别出70%的AIP 患者，仅在57.7%的AIP 患者可以通过超声内镜引导下的细针穿刺活检（Endoscopic Ultrasonography-Fine Needle Aspiration,EUS-FNA）明确诊断。如何诊断AIP 并与PDAC 等恶性疾病相鉴别一直是临床实践的重点及难点［36］。现代CNN 通过使用AIP、PDAC、正常胰腺、CP 的EUS图像进行分析并辅助鉴别诊断，不仅防止PDAC的漏诊与误诊，而且及时指导医师应用免疫抑制剂或激素治疗阻止AIP进展为CP［37］。

1.4 AI 与复发性急性胰腺炎（Recurrent Acute Pancreatitis,RAP）

RAP 是指AP 两次或两次以上发作，发作之间疾病接近或完全缓解。17%～22%诊断为AP 的患者将来会复发，高达36% 的RAP 患者最终会进展为CP［38-40］。目前的干预措施并未证明能有效减少复发，因此准确预测RAP 的发病并将其与其他腹部疾病进行鉴别，避免其进展为CP 尤为重要［41-43］。通过将CT 影像特征纳入等距特征映射方法（ISOMAP）SVM 训练，成功将功能性腹痛、RAP 与CP 三者鉴别［32］。Chen 等［44］选择将AP 患者影像组学中的特征像素按照7：3 随机分配到训练集及验证集中，使用Logistic回归分析及SVM 预测AP的复发率及相关的危险因素。AI适用于解决胰腺炎症中各种非线性的复杂问题，不仅提高了原先诊疗模式下的准确度，降低误诊率，同时也为胰腺炎症新型诊疗模式的建立提供新思路。

2 AI与胰腺肿瘤

2.1 AI 与胰腺囊性肿瘤（Pancreatic Cystic Neoplasms,PCN）

PCN 主要包括导管内乳头状黏液瘤（Intraductal Papillary Mucinous Neoplasm,IPMN）、浆液性囊腺瘤（Serous Cystic Neoplasm, SCN）和黏液性囊腺瘤（Mucinous Cystic Neoplasm,MCN）、实性假乳头肿瘤（Solid Papillary Neoplasm, SPN）4 类［2］，IPMN、SPN、MCN 是胰腺恶性肿瘤的癌前病变［45］，其中以侵犯主胰管的IPMN恶变率最高，达70%［46］，因此Kuwahara［47］将已确诊IPMN患者的EUS图像输入CNN 进行训练，预测模型准确率达94%，远远优于人为诊断与传统Logistic 回归分析，做到及时、精确诊断癌前病变，避免其进展为恶性肿瘤。许多研究利用PCN 的CT、MR 影像学特征或放射组学数据，通过ML 算法建立出具有优异的鉴别、预测效能的模型，展现出AI在诊断囊性肿瘤方面优于传统诊断方法的准确性以及很大的潜力，不仅可以鉴别囊性病变的性质，同时也可以鉴别出不同亚型，根据这些结果选择手术，或密切随访，制定出适合每一位患者的治疗措施［3,48-54］。Kruita 等［2］将手术及EUS-FNA 获得的囊液进行肿瘤标志物以及淀粉酶检测，通过DL 模型进行学习、验证，并最终与现实结果进行对比，证明AI诊断模型对恶性和良性囊性病变高度敏感，可用于排除恶性胰腺囊性病变。

AI 算法不仅可以处理临床资料或影像学数据，也可以将两种数据结合，进一步提升ML 模型的适用范围及准确性。最近的研究表明生物标志物微小核糖核酸（miRNA）具有区分良性与高风险PCN 的潜力［55-56］，因此可以将肿瘤的影像学特征与miRNA 相结合预测囊性肿瘤如IPMN 的恶性潜能，对术后患者的血浆及组织进行全基因组miRNA 分析，根据术后诊断筛选出特异性miRNA，并分组收集组内不同患者的CT 影像学特征，两类变量相结合预测IPMN 的恶变风险，及时进行手术治疗，避免其进展为恶性肿瘤［57］。

2.2 AI 与胰腺神经内分泌肿瘤（Pancreatic Neuroendocrine Tumors,pNETs）

pNETs占整个消化道神经内分泌肿瘤的12%［58］。肿瘤的分级取决于Ki67指数和有丝分裂计数。为了帮助病理学家捕捉可能遗漏的切片中肿瘤组织位点，Niazi 等［59-60］将Ki67 抗体染色的活检的图像标记为像素点通过CNN模型区别为肿瘤区域和非肿瘤区域，利用转移学习强化模型区分切片中肿瘤和非肿瘤区域的能力，减少病理科医师的工作量并避免漏诊。不同分级的pNETs 在临床实践中的处理原则截然不同，其中G1/2 组可以进行胰腺部分切除术，而G3 组为了改善预后，常进行包括根治性手术切除和系统化疗在内的综合治疗策略［61-62］。Luo 等［63］分别使用DL 算法中的CNN 模型与传统ML 模型学习不同分级患者术前的增强CT 图像，并进行训练、验证、对比，证明CNN 模型在术前判断肿瘤分级及预后方面均更加吻合于临床真实情况。Gao 等［64］利用GAN训练不同分级肿瘤的核磁图像，并在扩充训练集中加入CNN 模型，有效避免了CNN 模型过度拟合的问题，最后进行交叉验证提高CNN模型的准确度。

pNETs在影像学上多表现为血管富集状态，这一发现表明肿瘤具有丰富的毛细血管网，并且最近的研究表明微血管密度与肿瘤预后密切相关［65-66］。Chen等［67］利用EUS图像描述不同患者的血管富集情况，通过多种ML 模型学习训练，进而设计一个具有预测肿瘤分级与预后的血管结构分析模式。手术切除是彻底治疗pNETs 的唯一方式，但是不同分级肿瘤术后复发率不同，术后整体复发率高，术后监测方面几乎没有共识。目前国际上大多数指南建议在根治性手术后的前3～5年进行合理的强化随访，并至少随访7年［68-70］。因此，Song 等［71］收集患者术前CT 影像学资料并使用深度学习放射组学（Deep Learning Radiomics, DLR）模型提取特征进行验证，并将临床指标添加到优化模型中再次进行交叉验证，成功预测患者术后的复发率并制定个体化的随访计划。

2.3 AI与胰腺癌（Pancreatic Cancer,PC）

PC 是预后最差的癌症之一［72］。在中国，PC 是死亡率最高的恶性肿瘤，早期发现是增加生存机会最有希望的方法［73］。如何早期诊断PC 一直是胰腺外科的重点与难点，尤其是当患者不存在或者仅有轻微症状，影像学仅发现细微病变时。目前已经有很多通过改良影像学技术以提升PC 检出率的研究［74-76］，但是将AI 与CT 图像相结合辅助诊断的研究还比较少。目前主要采用的研究方式是首先获得CT图像中具有诊断意义的区域，使用纹理分析方法提取定量特征，考虑到总体样本量较小，因此Qiu［77］选用线性SVM 模型进行交叉验证并训练，Si［78］则选用深度残差网络模型（ResNet）进行训练验证，Liu 等［79］在CNN 模型学习训练的基础上与临床资料、手术资料相结合，使得后者的诊断效能优于前两者，Liu 的参数训练集较前两者更为丰富，虽然SVM 是一种有效的小样本学习方法，但并不适合用于线性关系的分析。PC的发病情况在既往研究中证明与年龄有密切关系，随着年龄增长，发病率也逐渐增高［72］。Rajan等［80］通过前瞻性收集不同年龄阶段人群EUS 图像，证明随着年龄增长，胰腺形态越容易发生变化。Ozkan［81］进一步分年龄段收集PDAC 患者与正常人群的EUS 图像并提取合适特征，使用ANN 模型进行学习训练，其准确性及特异性均优于将年龄统一对比的模型。因此，根据年龄分组训练可以提高诊断模型整体的性能，也更符合临床诊疗的思路。在使用EUS 诊断PC 时，操作者的经验和主观因素对EUS诊断结果有较大影响［82］，尤其是在并发CP 的PC 患者中。Zhu 等［83］利用SVM 系统具有良好泛化能力并适合管理有限样本量简单分类问题的特点，将PC 患者与CP 患者EUS 图像按2:1 纳入样本并采集特异区域，通过SVM 进行学习验证并建立鉴别CP 与PC 的预测模型，Zhang［82］通过将正常人群、CP 患者、PC 患者EUS 图像同时纳入样本并进行SVM 学习训练，虽然样本总量小于前者，但其模型的敏感度与特异性均优于前者，证明预测模型的效能会随分组增多而提升。Das［84］通过ANN 模型分组训练NP、CP、PC 的EUS 图像数据，虽然样本量大于Zhang 的研究，但是其预测模型效能仅与Zhu 的模型相当，说明SVM 的泛化能力优于ANN 模型，更适于对小样本数据进行诊断鉴别。

AI 除了通过与影像学相结合提升诊断准确率，也可以通过血清学检验指标提高恶性肿瘤的诊断能力。既往关于多种血清学标记物联合诊断的研究结果表明虽然联合诊断灵敏性升高，但是特异性会降低［85-86］，与计算机算法结合后会有效避免这类情况的发生。Yang 等［87］利用多种PC 特异血清学标记物通过ANN 分组进行训练验证，证明ANN 模型在敏感性、特异性和准确率方面均优于传统Logistics回归模型。随着细胞外小泡（Extracellular Vehicles，EVs）研究的深入，发现EVs 中的长链RNA（EV long RNAs，exLRs）与肿瘤进展、肿瘤分型有关，并在癌细胞中富集［88-91］，但是与PC 的关系尚未明确。Yu 等［92］收集PDAC 患者、CP 患者以及正常人群血浆进行exLRs测序及通路分析，显示exLRs 在mTOR 信号通路和VEGF 信号通路等与PC 密切相关的通路中富集，选取特异的exLR 标记作为算法数据集并使用SVM 算法学习训练，分别进行内部及外部验证，最终得出以特异型exLR 为数据变量的诊断模型，可用于早期预测PDAC并进行鉴别诊断。

既往研究表明未经治疗的PC患者中位生存期约为3.5 个月，5年生存率仅为10%［72］。针对PC 预后的预测，Walczak［6］通过基于ANN 算法的模型，用于各种治疗决策，包括观察、辅助治疗、切除和切除联合辅助治疗，尽可能使患者获益。Chakraborty［93］利用从治疗前CT 扫描中提取的纹理图像特征进行最小冗余最大相关性以及朴素贝叶斯算法提取纹理特征并进行交叉验证，以预测PC 患者的2年生存率，优化患者治疗方案选择。淋巴结阳性率一直是临床实践中关于肿瘤预后的一个很重要的判断因素［94］。淋巴结比率（Lymph Node Ratio，LNR）是指阳性淋巴结除以检验的淋巴结总数，在食管癌、胃癌、结肠癌、乳腺癌、PC 等肿瘤预后预测方面具有重要作用［95-97］。Smith［98］由此设计两个使用交互式贝叶斯算法的模型，即通过术后患者的肿瘤病理与TM 分级预测LNR，并根据术后病理验证模型准确性，再利用前者的样本结合患者基线资料与肿瘤病理、是否行放射治疗等数据预测患者预后并取得优异的预测效能。虽然仅通过实验室检查、术后的病理情况［99］或影像学资料［100］可以设计出优秀的预测模型，但是纳入多种类型的数据进行分析或许能有效提高模型的准确性。Kaissis［101］回顾性收集PDAC 患者的MRI图像特征与临床数据，并与实验室检查相结合，通过RF算法监督学习，最终模型预测生存曲线与患者的实际生存时间几乎完全重叠，说明多种类型数据与正确的算法相结合可以极大提高模型效能。

胰腺术后并发症一直是临床治疗的重点和难点，权威机构的临床指南仍是各大医疗中心通过不断地总结治疗经验，归纳各类风险预测评分并进行改良，但是其准确性会随着临床治疗而产生变化［102］，而将AI应用于术后并发症预测则体现出很大的研究潜力。术后手术部位的感染（Surgical Site Infections,SSIs）不仅影响胰腺术后患者的恢复，同时也是所有外科医生共同面对的问题。目前，多项研究使用ML算法模型进行数据分析学习，术前数据作为算法输入，术后治疗方案用于确定是否发生术后感染，最后通过单一算法或多种算法结合构建新的算法模型预测术后感染发生率［103,104］。胰腺术后并发症以术后胰瘘（Postoperative Pancreatic Fistula,POFF）最为危险，并且是导致术后死亡的最大危险因素［102,105］，预防POFF 也是外科医生术后优先关注的问题。Han等［106］回顾1 769 位进行过胰十二指肠切除术的病人并提取出38 个临床变量，通过PF 和ANN 算法分别学习与训练，最后两种算法模型结合设计了临床决策工具预测POFF。既往的研究表明胰腺组织的弹性模量与POFF 关系密切［107-110］。Kambakamba［111-112］将胰瘘患者与无胰瘘患者1：1纳入研究，将这些患者术前的胰腺影像学纹理特征与胰瘘风险评分（Fistula Risk Score,FRS）相结合，通过ML算法分析验证建议预测模型。Mu 等［113］则是将所有的胰腺术后患者各项临床数据及CT 图像纳入研究，通过DL 训练，设计出胰瘘风险预测模型。两个研究得出的预测模型效能均优于FRS评分。

交界性可切除与不可切除PC 患者得到R0 切除的比例随着新辅助治疗、MDT 模式概念的提出越来越高。目前AI 已应用于多种肿瘤新辅助治疗，评估治疗疗效并预测预后［114-117］。De Geus 与Sharma［118-119］均通过决策分析方法证明基于新辅助治疗的管理改善了交界可切除PC 患者的预后，但是这些决策分析由于整体样本量很少，纳入的变量有限，其效能值得怀疑，因此需要大量数据与AI相结合，制定效能优良的预测模型，并在临床实践中为每一位患者制定个体化的化疗方案及手术选择。

3 总结与展望

在过去的10年里，AI在普外科领域取得了巨大进展，本文主要概述了AI在胰腺疾病方面的应用。过去虽然取得了重大进步，但是为了实现胰腺疾病精准医疗，还有许多困难需要解决。需要临床医生充分发挥各个学科优势，通过收集和处理临床资料，建立稳定准确的数据库。临床实践及诊疗思路不是简单的从数据到结果的过程，这就要求研究人员提出与医生临床思维类似、具有更强的可解释性的算法。同时，AI应该与研究人员及科学家的工作相结合，利用AI技术处理生物医学领域问题，将宏观与微观相结合，将临床资料与组学资料相结合。AI技术并不能代替医生进行决策，但是可以在减少医疗繁琐工作的同时改进目前的诊疗模式，以实现个性化医疗。