人工智能在慢性肝病领域中的应用研究进展

2023-01-05 20:21汤影子夏杰刘慧敏吕化杰郭茂耘
解放军医学杂志 2022年8期
关键词:肝病纤维化肝癌

汤影子,夏杰,刘慧敏,吕化杰,郭茂耘

1陆军军医大学第一附属医院感染科,重庆 400038;2重庆大学自动化学院,重庆 400044

慢性肝病及肝硬化在全球的死亡原因中居第11位,每年造成110万人死亡,其常见的原因包括乙型肝炎病毒(hepatitis B virus,HBV)感染、丙型肝炎病毒(hepatitis C virus,HCV)感染、酒精相关肝病及非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)等[1-2]。随着精准医疗的发展,以及医疗数据和数字图像数量不断增加,需要新的数据处理分析工具来帮助进行疾病的诊断、监测及疗效预测。近年来,人工智能(artificial intelligence,AI)在医疗领域取得了突破性进展,可通过模型及算法发现隐藏在数据中的循证医学逻辑,从而为患者提供个性化的诊疗决策。与传统统计模型相比,AI的优势在于可识别独特的模式并结合多种因素创建更精确的预测模型、风险分层及结果,特别适用于具有海量高维数据特征的临床数据分析及预测建模任务。在肝脏病学的临床实践中会产生多种数据格式,如电子病历、放射成像及肝脏病理资料等。AI在异质性、复杂性及重叠混杂因素数据处理方面具有明显优势,特别适用于慢性肝病领域的数据处理及分析[3]。本文对AI在慢性肝病领域的诊断、病变评估、协助治疗、疗效预测和预后,以及放射组学、病理学等方面的应用情况及研究进展综述如下。

1 AI的基本算法

数据、应用任务及算法是AI的3个关键组成部分。机器学习(machine learning,ML)是实现AI的核心技术,通过ML可以建立算法及预测模型高效、有效地识别大数据集中的模式,通过算法对样本数据特征进行学习,构建决策预测模型,实现对新数据的判决及预测[4]。

1.1 人工神经网络 人工神经网络是由大量神经元单元互联组成的非线性、自适应信息处理系统,具有如下特点:(1)人工神经元在数学上表现为一种非线性关系,可以提高容错性及存储容量;(2)通过神经元之间的大量连接模拟大脑的判断、预测及认知功能;(3)自学习、自组织、自适应性;(4)具有多个较稳定的平衡态,系统演化具备多样性。以上特点使人工神经网络成为当前类脑智能研究中的有效工具[5]。

1.2 深度学习 深度学习的概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层属性描述,以发现蕴涵在数据中的深层本质特征。深度学习的优势在于用更多的数据或是更好的算法来提高学习算法的结果,与传统神经网络相比,深度学习能够处理数据量更大、更复杂的问题[6-7]。

1.3 其他算法 支持向量机属于浅层模型,在解决小样本、非线性问题上具有优势。决策树能够直接体现数据的特点,易于理解及实现。随机森林利用多棵树对样本进行训练并预测,对于高维特征的数据集分类有很高的效率,准确率较高,容易实现。k-近邻是一种无建模过程的非线性分类器,也可用于回归,在处理样本量较大及维度较高的数据时有优势。

2 AI在电子病历系统中的应用

2.1 AI在肝病诊断分类中的应用 利用电子病历系统及大数据集,AI可以基于患者个体及人群的风险因素发现肝病的表型特征。利用模糊c均值聚类等方法创建的肝病诊断分类器分类精度高,敏感度、特异度及准确率均超过90%,用户友好,对数据的解释也容易理解,并可对肝病辅助诊断进行全局及局部解释[8-9]。Razali等[10]通过分析416例肝病患者及167例非肝病患者的临床数据,比较了贝叶斯点击及神经网络等数据挖掘算法在肝脏疾病预测方面的性能及精度,并指出为提高肝脏疾病预测结果的准确性,可将混合方法应用于今后的工作中。

2.2 AI在NAFLD中的应用 NAFLD现已取代慢性乙型肝炎成为我国第一大慢性肝病。利用AI技术细化疾病分型及判断预后可以优化临床实践,提高临床诊治效率。美国的Optum®研究纳入了超过8000万例患者的记录,针对非酒精性脂肪性肝炎(nonalcoholic steatohepatitis,NASH)及健康(非NASH)人群创建ML分类器,并用其预测NAFLD患者队列中的NASH。结果显示,所有ML模型(逻辑回归、决策树、随机森林及XGBoost)在识别NASH方面均表现良好,与现有非侵入性检测相比,敏感度提高[受试者工作特征曲线下面积(AUC)为0.83~0.88],且可使用纵向临床数据来识别个体的NASH风险[11]。NASHMap©ML模型纳入了两个真实数据集:美国国家糖尿病、消化及肾脏疾病研究所注册的一个子集(共704例经组织学证实为NASH及非NASH患者)及Optum®验证模型,包含14个临床及实验室参数,并对每个参数进行单独评估,以预测其在NASH诊断方面的强度,结果显示,NASHMap©模型能识别出879 269例未被Optum®模型诊断的NASH患者[11]。在识别NASH高危人群的基础上,有研究进一步开发了一种ML算法来识别NAFLD亚型,该研究纳入13 290例患者,通过评估临床、影像学及组织学等多项指标,使用无监督聚类算法将患者进一步划分为5种亚型,结果显示,占比较大的两个大组(占全体患者的87%)主要为拉美裔及非洲裔美国人群,这两组患者并发症较少,肝纤维化程度更低,疾病进展较慢,而占比较小的3组则表现为更严重的并发症以及更差的预后[12]。

2.3 AI在肝纤维化及肝细胞癌中的应用 肝活检是诊断肝纤维化的金标准,但由于其具有麻醉并发症、有创性、出血风险及取样错误等缺点,适用性受到限制。超声弹性成像诊断肝纤维化的准确性良好,但其对硬度的测量受多种因素的影响,如肝静脉充血、胆汁淤积、炎症、饮食、肥胖、腹水及观察者经验等,并最终导致弹性成像结果出现误差。因此迫切需要一种准确可靠的无创技术来诊断肝纤维化。Pu等[13]提出了一种优化后的朴素贝叶斯模型,该模型评估了1023例HBV患者的55个常规实验室及临床参数,其预测肝纤维化的准确性可与肝活检媲美(AUC为0.982)。Altay等[14]将基于关联分析的进化智能MOPNAR用于挖掘肝纤维化的规则,该算法可自行修改及调整,自动发现数值的关联规则,且不需要修改或更改数据,在敏感性、平均置信度、覆盖记录数等方面均优于比较方法。一项回顾性多中心研究收集了埃及71 806例HCV感染患者的实验室及组织病理学数据,构建了决策树算法来评估糖尿病合并HCV患者肝纤维化进展的预测因素,结果显示在16个预测因素中,甲胎蛋白是最具决定性的因素,其临界值为5.25 ng/ml,其次为年龄及血小板计数[15]。

Omran等[16]基于315例HCV相关慢性肝病患者的临床数据构建了一种预测肝细胞癌的决策树学习模型,通过数据挖掘发现隐藏的模式,以利用常规数据替代计算机断层摄影(computed tomography,CT)及肝活检。杨俭等[17]基于肝癌患者的真实数据建立了肝癌AI临床决策支持系统,采用多分类器融合模型计算治疗方案推荐系数,并分析受试者工作特征曲线,采用DeepSurv算法实现对生存风险及复发风险的预测,并进一步对比低、中、高风险组的Kaplan-Meier生存曲线,结果显示各风险组间差异显著,提示该系统能较准确地进行肝癌治疗方案推荐及预后预测。Rau等[18]在2200万例电子病历数据的基础上,建立了可预测2型糖尿病确诊后6年内肝癌发展的模型,并通过验证证实该模型对2型糖尿病合并肝癌患者的诊断正确率达75.7%,对不合并肝癌患者的诊断正确率达75.5%。

2.4 终末期肝病患者的病情管理及生存期预测终末期肝病指各种原因所致肝病的晚期阶段,其病死率高,预后差,为人类健康带来了沉重的负担。应用AI技术可以帮助医务人员对终末期肝病患者进行病情评估、随访、生存期预测,以及筛选更合适的肝移植候选者。Lin等[19]开发的ML监测系统涉及多层面分析,包括评估及诊断的各个方面,该系统的可视化界面提供了更易于理解的综合评估患者病情的方法,且有助于对急性死亡患者及姑息治疗患者进行分类,可帮助医务人员管理终末期肝病患者。Schoenberg等[20]采用随机森林算法对181例肝癌患者的26个临床参数进行处理,在此基础上根据风险剖面特征对测试数据进行分层,该模型对肝癌切除术后的无病生存期预测值为0.788,可用于筛选出哪些患者适合施行肝癌切除术而非肝移植。Kazemi等[21]采用多种ML算法(包括支持向量机、贝叶斯网络、决策树、多层感知器神经网络等)对902例肝移植患者的临床数据进行分析,以提取6个月生存期的有效特征,此模型的AUC及敏感度分别为0.90及0.81,识别出的影响因素的顺序接近临床试验。Hu等[22]采用北美多中心终末期肝病研究联盟队列,对肝硬化住院患者出院后90 d的再入院及死亡情况进行随访,评估多种AI技术预测其预后的能力,发现AI模型很难预测肝硬化患者30 d及90 d的再入院及死亡情况,其准确性等同于仅使用血清钠与终末期肝病模型联合评分生成的模型,提示尚需要更多的生物标志物来提高模型的预测能力。

2.5 AI在疑难肝脏疾病中的应用 药物性肝损伤是一种少见但重要的肝病,如何在电子病历系统中诊断及识别药物性肝损伤是一大难点。Heidemann等[23]提取并整理了一种从电子病历中识别约14个肝损伤术语及200个字符文本的搜索算法,通过计算机提取口述文本,然后对文本片段进行人工审查,可以快速识别出药物性肝损伤案例。

利用AI技术将临床数据与下一代基因测序分析整合有助于疑难肝病的诊断。有研究将在线人类孟德尔遗传数据库(online mendelian inheritance in man,OMIM)中单基因疾病的临床特征映射到国际疾病分类(international classification of diseases,ICD)编码库ICD-10,通过在患者电子病历中调用ICD-10,寻找OMIM中可能的疾病;同时将肝病相关致病基因突变进行标记,通过基因测序的结果筛查可能致病的突变,再返回OMIM寻找最佳的临床表型-基因型的配对,以此来发现罕见变异与孟德尔病表型之间的关联[24]。

3 AI在肝脏疾病影像诊断中的应用

影像组学与AI的融合可实现对疾病病理发展情况的整体性分析,展现细微的病理变化,在肝纤维化严重程度评估、肝脂肪变定性定量诊断、肝脏局灶性病变的鉴别及分类等方面具有明显优势。

3.1 疾病诊断及肝纤维化程度的评估 一项纳入19项研究的Meta分析探讨了AI辅助超声、弹性成像、CT、磁共振成像(magnetic resonance imaging,MRI)及临床参数在肝纤维化及脂肪变性诊断中的敏感度及特异度,结果表明,AI辅助诊断肝纤维化的综合敏感度、特异度分别为0.78、0.89,诊断肝脂肪变性的敏感度、特异度分别为0.97、0.91[25]。Gatos等[26]将基于硬度评估与支持向量机分类算法的计算机辅助诊断系统应用于超声剪切波弹性成像,该模型对85张超声图像(54张健康图像、31张慢性肝病图像)进行了量化,结果显示其准确率为87.0%,敏感度为83.3%,特异度为89.1%。有研究进一步采用优化后的神经网络算法识别并区分超声检查下不同的硬度值区域,结果发现该方法可将慢性肝病纤维化分期诊断准确率提高到95.5%[27]。Chen等[28]采用了4种经典分类器(支持向量机、朴素贝叶斯算法、随机森林、k-近邻)建立了一个决策支持系统,结果显示上述分类器明显优于以往的肝纤维化指数方法,其中随机森林分类器的平均准确率最高。

3.2 肝脏局灶性病变的鉴别及分类 肝脏局灶性病变的影像鉴别诊断和分类是临床的重点及难点,在超声、超声造影、CT及MRI图像中采用ML技术鉴别病变性质已取得明显进展[29-30]。Yasaka等[31]对460例患者的增强CT图像进行了回顾性研究,利用有肝脏肿块的3个CT时相(平扫、动脉期、延迟期)共55 536个影像图像进行了卷积神经网络模型监督训练,随后用100个肝脏肿块影像进行测试,结果显示其对肝脏肿块的鉴别诊断准确率达到84%。Schmauch等[32]采用367张超声图像及放射学报告通过监督训练构建了深度学习模型,其检测肝脏局灶性病变的AUC为0.935,判定病灶性质(良性/恶性)的AUC为0.916,但该模型仍需在大型独立队列中进一步验证。Guo等[33]提出了一种两阶段多视图学习框架,用于超声造影的肝肿瘤计算机辅助诊断:在第一阶段,分别对动脉期与门静脉期、动脉期与延迟期、门静脉期与延迟期3对图像进行深度典型相关分析,共生成6个视图特征;在第二阶段,将这些多视图特征输入到基于多核学习的分类器中。结果显示该框架的分类精度、敏感度、特异度分别为0.904、0.935、0.869。

3.3 监测肝癌的复发及疗效 肝癌术后早期复发是肝病治疗中的重点及难点,及时识别并对患者进行相应干预具有重要意义。AI辅助技术可以从放射图像中提取客观的量化数据,并揭示其与潜在生物过程的关联,在监测肿瘤复发方面发挥重要作用[34]。Vivanti等[35]收集并整合了病程中肿瘤的初始表现、CT影像及肿瘤负荷量,在此基础上设计出的肿瘤复发自动检测模型准确率达到86%。Morshid等[36]使用随机森林分类器预测了105例肝癌患者对经动脉化疗栓塞术的治疗反应,结果表明,结合了CT定量图像特征的模型预测准确率高于单独使用巴塞罗那临床肝癌分期模型(74.2%vs. 62.9%)。

4 AI在肝脏组织病理学中的应用

AI辅助病理已应用于肝纤维化、脂肪肝、肝细胞癌等患者。在NASH患者中,AI辅助病理工具(qFIBS)可用于识别及量化病理改变,包括脂肪变性、小叶炎症、气球样变及纤维化[37]。PathAI是一种基于ML的肝组织学评估方法,该方法使用3个随机对照试验样本来构建并验证深度卷积神经网络,以评估NASH的关键组织学特征,可准确地描述疾病的严重程度及异质性,并敏感地量化NASH的治疗反应,其预测结果与病理学专家的判断高度一致,并能够检测到手工病理分期未检测到的抗纤维化治疗效果,且与组织学进展一致[38]。Histindex是一种基于AI的二次谐波新技术,采用多光子成像技术,可用于定量评价肝脂肪变性[39]。Roy等[40]提出了一种基于深度学习的区域-边界集成网络,用于精确量化整个肝脏组织切片病理图像的脂肪变性,采用此方法进行脂肪变性测量,在像素水平及脂肪变性水平上与病理学家注释、影像学指标及临床数据均有很强的相关性。

在肝癌患者中,利用极限学习机联合多重全连接卷积神经网络进行肝细胞癌核分级,在不同分化阶段的肿瘤细胞分类方面表现出色[41]。Chen等[42]研究了卷积神经网络Inception V3用于肝癌切除后全视野数字切片的自动分类及基因突变预测,结果显示,其预测肿瘤恶性程度(良性/恶性)的准确率为96.0%,预测分化程度的准确率为89.6%。有研究利用深度迁移学习对28种癌症类型的17 355张苏木精-伊红染色的组织病理学切片图像进行组织病理学模式量化,并将其与匹配的基因组、转录组及生存数据进行关联,这种方法能准确地区分肿瘤类型,并能在空间上分辨肿瘤组织与正常组织[43]。这些发现显示了计算机视觉在表征肿瘤组织病理学分子基础方面的巨大潜力。

5 总结与展望

AI技术推广到临床实践尚面临以下主要问题:(1)缺乏用于模型开发及验证的高质量训练及验证数据集,尚需要建立高质量且可及的慢性肝病患者的研究队列;(2)大多数针对肝病开发的模型及算法尚缺乏在临床实践中的长期评估以及与传统诊断方法的直接比较,其在真实世界中的表现如何有待证实;(3)算法开发者与临床工作者之间的技术壁垒有待突破,AI输出结论的可解释性及透明度尚有待提高;(4)在医学伦理方面,如果AI应用过程中出现错误,其后果应由谁来承担,以及该如何保证患者的最大获益。这些问题尚需要进一步解决[44]。

由于AI技术自身不断进步以及生物医学问题本身固有的复杂性,AI在慢性肝病领域中发挥着越来越重要的作用,可以辅助肝病的诊断分类,预测慢性肝病患者纤维化风险,客观评估肝脏成像,以及进一步完善肝脏组织学评估等。未来AI技术将被用于开发更精确的模型,以预测及监测肝病进展及潜在的并发症。此外,AI可应用于药物研发、处理芯片数据及检测肿瘤微环境等,帮助肝脏肿瘤患者实现更加精准、个体化的治疗。

猜你喜欢
肝病纤维化肝癌
线粒体自噬在纤维化疾病中作用的研究进展
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
肝纤维化无创诊断研究进展
非酒精性脂肪性肝病的中医治疗
任何类型的咖啡都或能降低慢性肝病风险
GW7647对大鼠非酒精性脂肪性肝病(NAFLD)的治疗作用
XB130在肝癌组织中的表达及其对细胞侵袭、迁移的影响
胆汁酸代谢在慢性肝病中的研究进展
隐源性肝癌与病毒性肝癌临床特征比较
细胞因子在慢性肾缺血与肾小管-间质纤维化过程中的作用