机器学习在临床药物治疗中的研究进展

2022-12-29 00:31:26吴行伟刘馨宇龙恩武童荣生
中国全科医学 2022年2期
关键词:学者机器向量

吴行伟 ,刘馨宇 ,龙恩武 ,童荣生 *

近年来,随着临床信息系统的建立和完善,医疗数据的可用性不断提高。然而,影响药物治疗结果的因素繁杂,且各因素之间可能存在交互作用。因此,对药物治疗过程中产生的真实世界数据进行分析时,面临高维度、大样本、共线性等复杂问题。这些问题使得临床药师在复杂的临床状态下,难以对药物作用的效果和风险进行有效的早期识别和预测,从而影响药物治疗结果,导致疾病进程加快、负担加重、患病率和死亡率上升、住院时间延长[1-4]等问题出现。

机器学习作为人工智能的核心技术,由于其在处理高维度、大数据等方面的独特优势,越来越多地被应用于分析药物治疗过程中患者复杂的临床特征和用药情况。本文对机器学习在临床药物治疗中的进展和成果予以综述,内容包括药物处方和用药剂量、药物不良反应、药物疗效、耐药性、药物相互作用和用药依从性等,为临床医生及药学同行开展基于机器学习的预测模型研究提供方法和模式的参考。

1 机器学习概述

机器学习由计算机科学家Arthur Samuel于1959年提出,其被描述为“计算机在没有编程的情况下的学习能力”[5],可被理解为基于真实世界数据或以往的经验开发数据驱动的算法,以学习和模仿人类的行为[6]。根据学习方式的不同,机器学习分为有监督学习、无监督学习和强化学习等。监督学习即输入大量带有标签的样本数据以建立一个模型并得到相应输出值,主要被用来处理分类和回归任务,常见的算法有逻辑回归、支持向量机和K—邻近算法等[7]。无监督学习即通过输入无标签的数据来学习数据的内在结构和关联,其更多地被用来处理聚类和降维问题,常见算法包括K—均值聚类和期望最大化聚类等[8]。强化学习即根据状态和动作计算获益,将获益反馈到模型并对模型作出调整以获得最大的奖励信号,常见算法包括Q学习以及时间差学习等[9]。作为机器学习的分支之一,近年来深度学习在医学领域的应用取得了巨大成功。其通过在输入层与输出层之间使用隐藏层来对数据的中间表征进行建模,用于有监督或无监督的特征学习、表示、分类和模式识别等,常见算法有深度神经网络、循环神经网络和卷积神经网络等[10]。

2 机器学习在临床药物治疗中的应用

2.1 药物处方和用药剂量预测 在药物处方预测方面,尤其针对慢性病的逐步治疗模式,常使用序列模式挖掘和深度学习技术等方法来推断药物之间的时间关系,并生成规则来预测患者将会被处方的下一种药物[11]。WRIGHT等[12]学者使用序列模式挖掘方法,应用SPADE(Sequential Pattern Discovery Using Equivalence Classes)算法从药物类别和仿制药水平挖掘2型糖尿病患者药物处方的序列模式,该算法能够挖掘符合指南推荐的药物治疗模式且无需患者的所有用药史。在药物类别预测方面,SPADE能够预测出90%的患者所用的药物;在仿制药预测方面,能够预测出64.1%的患者所用的药物。BEAM等[13]学者将机器学习和自然语言处理相结合,以提取患者的合并症、用药史及医生的处方偏好。通过权衡患者和医生因素,研究影响安眠药处方模式的医患因素,以更深入了解医生的处方行为。YELIN等[14]学者使用梯度增强决策树推导的一种算法对尿路感染患者的数据进行分析发现,通过筛选抗生素耐药性的特征,推荐最佳的经验性治疗药物,通过该算法推荐的处方正确使用抗生素的概率比医生高4%,降低了药物错配风险。ROUGH等[15]学者根据住院患者的电子健康记录中的结构化信息,利用深度学习序列模型预测患者的特定用药顺序,该算法能够挖掘出与指南一致的药物治疗模式,因此,在入院时可以作为早期预警工具预测出院用药种类,以便监测即将处方的药物,减少重复用药或遗漏用药等。此外,朱立强等[16]学者采用非线性逻辑回归和支持向量机的方法建立了Ⅰ类切口手术患者使用抗菌药物合理性的评价模型,使抗菌药物预防使用率下降了7.41%,药物品种选用合理率提高了16.53%,使用疗程缩短了1.75 d。

对于个体差异大、治疗窗窄、毒性较强的药物,对给药剂量进行正确预测可在一定程度上减少不良事件的发生。MA等[17]研究者使用堆栈泛化框架集成了支持向量机、随机森林、近邻算法和梯度提升树4种算法,结合患者的临床特征和遗传数据预测华法林剂量,该算法适用于华法林低剂量维持治疗的患者,相比于其他患者,其在实际稳定治疗剂量20%以内的患者中预测能力提高了12.7%。ROCHE-LIMA等[18]学者使用7种机器学习方法,通过回顾性分析心血管疾病患者的临床特征和遗传数据来预测华法林的使用剂量,该研究以平均绝对误差和预测准确率来评估模型性能,结果显示,随机森林回归、多元自适应回归样条(multivariate adaptive regression splines,MARS)和支持向量回归的预测准确性优于其他算法。TAO等[19]学者建立了一种集成学习模型,以类似的衡量指标评价了模型对中国人群华法林使用剂量的预测性能。SU等[20]学者回顾性分析了2个重症监护病房研究数据库中的患者数据,使用随机森林、支持向量机、自适应增强算法、极限梯度增强和浅层神经网络5种机器学习方法,以部分凝血活酶时间作为预测因子来预测肝素的治疗效果,结果显示,浅层神经网络以最高的F1值作为预测肝素治疗效果的最适模型,该模型可用于优化患者的肝素剂量。此外,LEVY等[21]学者对接受抗心律失常药物多非利特治疗的患者的临床数据进行了分析,与多种监督学习方法比较,一种深度强化学习算法—Q学习算法以96.1%的准确度更好地预测了多非利特的使用剂量。

2.2 药物不良反应预测 药物不良反应不仅是药物开发失败和药物上市后撤市的主要原因,也是药物治疗失败和治疗被迫中止的原因。随着药物不良反应数据库的出现,有监督的机器学习算法已被广泛用于药物信息提取和药物不良反应的关系预测[22-23]。该类研究主要基于药物生物学特征、化学特征和表型特征等建立预测模型对药物不良反应进行预测[24]。

药物性肝损伤(drug induced liver injury,DILI)是最常见的不良反应之一,大量的基因表达数据为早期识别和准确预测DILI提供了有价值的信息。HAMMANN等[25]学者基于药物化学结构,构建了决策树、K-邻近算法、支持向量机和人工神经网络4种机器学习模型以预测DILI,其中决策树模型实现了89%的正确分类率。FENG等[26]学者基于Array Express数据库中的基因表达数据建立了深度学习模型来预测DILI,该模型在准确率、精确度和相关系数等方面均明显优于支持向量机模型,并通过外部数据集和动物实验对模型性能进行了验证。LAI等[27]研究者将结核患者的临床特征和基因组数据相结合,建立并比较了人工神经网络、支持向量机和随机森林3种模型对抗结核药物肝毒性的预测性能,其中人工神经网络表现最佳。DAVAZDAHEMAMI等[28]学者将时序药物警戒网络和机器学习技术相结合,预测8种常见高风险药物的药物不良反应,结果显示,梯度增强树识别药物不良反应的准确率高达92.8%。

2.3 药物疗效预测 在药物疗效预测时,常将患者临床症状和体征的改善,以及实验室检查指标的变化作为待预测结果,以评估药物疗效。此外,还可应用机器学习方法挖掘现有临床试验数据或电子病历系统中的数据来建立预测模型,对特定患者的特定药物疗效进行回顾性分析和前瞻性识别,从而对药物疗效进行精准评价。

CHEKROUD等[29]研究者筛选了抑郁症患者的25个临床特征并建立了梯度提升机模型,以评估患者使用西酞普兰治疗12周后症状是否缓解,该模型的预测准确率为64.6%。若将抗抑郁治疗反应的生物标志物作为预测变量,可能会获得更高的预测准确性。ATHREYA等[30]学者论证了将机器学习与药物基因组生物标志物相结合的可行性,以实现对两种新型抗抑郁药西酞普兰和依他普伦8周治疗效果的预测。SAKELLAROPOULOS等[31]学者将基因表达数据与药物反应相结合,构建了深度神经网络模型以预测癌症患者的药物治疗反应,并在多个临床队列上进行了外部验证,结果表明,深度神经网络在药物治疗反应预测方面优于传统的机器学习算法。JIANG等[32]学者建立了支持向量机模型,用于识别对5-氟尿嘧啶/奥沙利铂高度敏感的胃癌患者,该模型可将Ⅱ期和Ⅲ期胃癌患者进行准确分类,使用该模型预测的不同类别患者的5年无进展生存期和总生存期存在显著的统计学差异。

2.4 药物耐药预测 随着高通量测序技术的发展,药物基因组学相关数据库的建立和完善,以及电子病历系统中大规模数据集的累积,机器学习现已被广泛应用于抗菌药物和化疗药物等敏感性相关的基因型/表型预测、临床决策的制定和药物治疗方案的优化等方面[33]。

DAVIS等[34]学者建立了Ada Boost机器学习模型,用于识别鲍曼不动杆菌对碳青霉烯类抗生素、金黄色葡萄球菌对甲氧西林以及肺炎链球菌对β-内酰胺类抗生素和复方新诺明的耐药性,实现了88%到99%的准确率。另外,该研究还将结核分枝杆菌对异烟肼、卡那霉素、氧氟沙星、利福平和链霉素的耐药性进行了预测,实现了71%到88%的准确率。CHOWDHURY等[35]学者提出了堆叠的集成模型,以逻辑回归、决策树和支持向量机作为基线模型,基于蛋白质序列的相似性来预测结核分枝杆菌对卷曲霉素的耐药性;与最佳的基线模型支持向量机相比,集成模型预测准确性提高了2.43%。MANCINI等[36]学者建立了Cat Boost、支持向量机和神经网络3种机器学习模型,并集成了一个云平台来预测患者住院后发生多药耐药性尿路感染的风险。AN等[37]学者通过对58万余例癫痫患者的索赔数据进行分析,以预测患者在首次开具某种抗癫痫药物时耐药的风险,其训练的随机森林算法表现最佳。DORMAN等[38]学者研究了紫杉醇和吉西他滨的生长抑制浓度与基因表达之间的相关性,该研究使用多因素主成分分析筛选出“强关联”的基因,使用支持向量机来预测药物的敏感性,对紫杉醇和吉西他滨敏感性的预测准确率分别为70.2%和57.0%。

2.5 药物相互作用预测 在联合用药情况下,药物相互作用通常是导致药物不良反应发生和医疗成本增加的常见原因。因此,识别药物相互作用是减少药物不良事件和提高患者用药安全性的关键。虽然已有文献研究成果和可获取的药物相互作用数据库可为机器学习的应用提供基础,但对医疗数据中的药物相互作用研究仍较为缺乏。

CHENG等[39]学者通过整合药物相互作用数据库中的药物表型、治疗、化学和基因组学相似性,提出了一种异构网络辅助推理(Heterogeneous Network-assisted Inference,HNAI)框架,在该框架中应用了朴素贝叶斯、决策树、K-邻近算法、逻辑回归和支持向量机5种机器学习模型来预测药物相互作用,其中HNAI模型ROC曲线下面积为0.67。KASTRIN等[40]学者基于Drug Bank、KEGG和Two sides等5个药物相互作用数据库中药物间的拓扑和语义相似性特征,比较了分类树、K-邻近算法、支持向量机、随机森林和梯度提升机模型的预测效果,结果显示,随机森林和梯度提升机对Two sides网络的预测性能最佳。RYU等[41]学者建立了深度学习模型,通过输入药物-药物对或药物-食物对的名称及其结构信息,生成了86种药物相互作用,并对模型进行了外部验证,预测准确率平均为92.4%。

2.6 药物依从性预测 患者药物依从性差是普遍存在的问题。良好的用药依从性对于疾病的治疗和管理至关重要。有研究者尝试使用机器学习算法来识别药物依从性差的患者,从而有针对性地制订提高药物依从性的策略。

TUCKER等[42]学者采用决策树、K-邻近算法、朴素贝叶斯、支持向量机和随机森林模型,根据帕金森病患者使用非穿戴式多模式传感器接收的步态特征来建立预测模型,实现对患者用药依从性的远程监控。MOHEBBI等[43]学者基于连续葡萄糖监测信号,建立多层感知器和卷积神经网络模型对2型糖尿病患者使用胰岛素的依从性进行预测,结果显示卷积神经网络的预测性能最佳。LI等[44]学者使用机器学习方法识别使用降压药不依从的亚组人群,以制定针对目标人群的干预措施。WU等[45]学者采用30种机器学习方法建立了300个模型来预测2型糖尿病患者的用药依从性,以用药拥有率对患者的用药依从性进评价,结果显示,集成算法预测性能最佳。

3 小结

随着计算机技术的不断发展,机器学习在辅助临床药物治疗决策方面展现出了巨大的潜力。此类方法为医生和临床药师制订药物治疗策略、应对药物不良反应、监测药物治疗效果和优化药物治疗方案等提供了理想的工具。目前,机器学习在临床药物治疗方面的研究主要基于医院电子病历系统、基因组学数据库、药物相互作用数据库和药物不良反应数据库等,采用机器学习的方法,尤其是深度学习算法,建立临床预测模型以实现对目标人群或目标药物的预测。但由于目前我国医院电子病历系统等数据库缺乏规范系统的患者信息录入流程、有效的数据质控过程和数据孤岛等缺陷,总体数据利用率有待提升。

此外,医学机器学习是一项交叉学科,研究者常需掌握计算机、线性代数、概率论与数理统计等专业知识。因此,机器学习在医疗领域的广泛应用尚存在巨大的学科壁垒,常出现“医疗工作者不懂机器学习,计算机工程师不懂医学”的现象。开发医疗工作者简便易用的机器学习建模工具可能是缓解该问题的有效措施。

未来,随着高质量数据库的建立和新算法的开发,通过临床科研人员与计算机研究人员的有机协作,机器学习有望更多地应用于临床药物治疗的研究中。借助于优秀的机器学习算法和工具,可有效提高临床预测模型在临床实践中的实用性,提高诊疗效率,实现个体化治疗决策的智能化。

作者贡献:吴行伟负责文章的构思与设计,进行论文、英文的修订;刘馨宇负责文献/资料收集、整理,撰写论文;龙恩武负责文章质量的控制及审校;童荣生对文章整体负责,监督管理。

本文无利益冲突。

本文文献检索策略:

英文检索词:machine learning、supervised learning、unsupervised learning、semi-supervised learning、deep learning、drug、medicine、prescription、dosage、dose、ADR、adverse reaction、therapeutic effect/response、treatment effect/response、drug resistance、DDI、drug interaction、drug-drug interaction、compliance、predicting、predict、prediction,结合运算符(AND、OR和NOT)检索PubMed数据库,共检索3 352篇文献;中文检索词:机器学习、监督学习、无监督学习、半监督学习、深度学习、药物、药物处方、药物剂量、药物不良反应、药物疗效、耐药性、药物相互作用、用药依从性、预测,结合运算符(AND、OR和NOT)检索中国知网、万方数据知识服务平台和维普网,共检索104篇文献。检索时间为2010—2020年。

猜你喜欢
学者机器向量
机器狗
环球时报(2022-07-13)2022-07-13 17:18:39
学者介绍
管子学刊(2022年2期)2022-05-10 04:13:10
学者简介
向量的分解
机器狗
环球时报(2022-03-14)2022-03-14 18:19:44
学者介绍
管子学刊(2022年1期)2022-02-17 13:29:10
聚焦“向量与三角”创新题
未来机器城
电影(2018年8期)2018-09-21 08:00:06
学者介绍
向量垂直在解析几何中的应用