人工智能在心血管疾病中的精准医疗应用研究概况*

2018-09-10 11:16霍俊宇单其俊
关键词:医学精准人工智能

霍俊宇 单其俊

1 人工智能技术概述

2017年5月23~27日,谷歌公司围棋人工智能AlphaGo与世界排名第一的围棋手柯洁激战3场,以3∶0大比分取胜,震撼科技界。人工智能(artificial intelligence,AI)忽然成为讨论的焦点。近年来,人工智能在人类社会影响深远,甚至早已成为各个发达国家的发展战略[1],这种技术如今在语言识别、机器人以及军事刑侦等各个方面提供了新的发展机遇[2]。对于这种快速发展的趋势,我国国务院也在2017年7月印发《新一代人工智能发展规划》,此为人工智能的发展提供了一系列保障措施。

人工智能,顾名思义是就是人为制造的智能,其主要目标在于研究用机器来模仿和执行人脑的某些功能,并开发相关理论和技术[3],即利用机器来实现人的推理功能。人工智能技术是相对于传统计算机技术而言的,传统计算机技术的所能胜任的范围,永远局限于对其已输入的知识范围,而人工智能则可以在其基础上进一步模拟人类的学习过程,利用计算机高效的信息处理系统,从已有的命题知识出发产生新的命题知识,不断进行着自身学习,再整合输出,最后对新知识加以利用。这种思想自1956年提出之后,随着计算机技术的不断进步,在近20年已经逐渐应用于多个领域。而近些年在医学领域,基于人工智能原理的相关技术,也开始尝试应用。最有名的就是IBM公司于2007年研发的人工智能系统Watson,它以200本教科书、290种医学期刊、120 000页论文为基础,通过不断地自身学习与修正,最终在2013年10月18日正式上线,成为肿瘤诊断专家系统。在2016年,这个学习了海量医学临床知识的人工智能系统Watson仅用10 min左右就成功为一名60岁女性患者诊断出了很难判断的白血病类型,并向东京大学医学研究所提出了适当的治疗方案。

2 精准医疗与人工智能

2.1大数据为基础的精准医疗 在人工智能技术飞速发展的同时,目前在医学领域,医学模式也在逐渐由传统医学向精准医学(precision medicine)转变[4],在治疗中逐渐将个体基因的变异性、个人生活方式和环境都考虑在内,来进行疾病治疗和预防[5]。这种新兴的诊疗方法是相对于传统的常规医疗模式而言的。对于心血管疾病,如冠心病、心律失常等的常规治疗中,传统医疗模式下的临床医生往往在分析患者现有病情后,参考现有临床治疗指南,作出相对正确的诊断,继而选择出相对应的治疗方式,后期再根据患者的病情变化更换治疗方案或调整药物剂量。而在精准医学指导下,则可以通过对特定患者现有检查数据、本人生活环境和生活方式,以及相关人群的基因进行综合分析[6],来形成准确的心肌、血管甚至分子层面的病因病理诊断,再形成有针对性的高效化治疗方案,从而更加有效地治疗疾病。

在这种诊疗思维的指导下,大样本的病人相关信息,以及一系列组学数据将成为其诊断与治疗的重要依据,而这种大数据(big data)与医学的结合也正是精准医学发展的核心动力。通过整合分析患者完整的临床信息、生物信息、分子生物学信息,可以形成精准的诊断;通过对大样本人群的组学大数据与疾病类型进行分类筛选,可以形成精准的病因与治疗靶点;通过对患者个体化基因组的分析,则可以指导精准用药与相关风险预测[7]。在心血管疾病防治领域,也已有通过分析潜在数据模式,得出有效结论来提高医疗效果的应用。如利用髓过氧化物酶(MPO)早期识别心血管疾病高危患者,指导早期诊断冠状动脉相关疾病[8];服用华法林抗凝预防血栓形成前,通过检测CYP2C9、VKORC1基因多态性,判断疗效与不良反应风险[9]。这些正是基于分析样本人群的临床信息与分子生物学信息大数据,从而产生的相关临床实践。

2.2人工智能技术的价值 对于医学大数据,数据资料的价值体现,需要通过整合分析来产生新知识[10]。但目前,无论是人脑学习,还是利用传统计算机技术,临床工作者对这些医疗大数据的利用还十分有限。由于医疗大数据往往包括了大样本人群有关社会人口统计学、医疗状况、遗传学和治疗等各种相关信息,数据量和信息量都无比庞大。而这些具有规模性、多样性、高速性和价值性[11]的庞大数据集合常常也超过了典型数据库软件工具捕获、存储、管理和分析数据能力[12],更是人脑的分析推理所无法胜任的。而人工智能则正为这些分析难度大的医学大数据提供了分析与处理方式,它可以模拟人脑的思维和推理过程,借助计算机的高效处理能力,来帮助临床工作者组织数据、识别模式、解释结果,通过对医疗大数据的分析整合,产生新知识,进一步指导临床实践。而且在心血管病领域,疾病的诊断或是病情的转归原本就十分复杂,人工智能技术就更可以有其用武之地。运用这项技术,可以精确分析复杂的心血管图像数据,对某些不易识别的冠心病或心律失常形成准确的诊断;或是通过已有的患者实验室检查结果,对心血管疾病的患病风险与结局进行更准确评估和预测[13]。可以说,基于人工智能技术的大数据分析,能帮助心内科医生事半功倍,并不断缩短与精准医疗之间的距离。

3 人工智能的分类应用

目前人工智能的核心是机器学习(machine learning, ML),这是使计算机具有智能的根本途径。它通过使用归纳、综合而非演绎的办法,重新组织已有的知识结构,以获取新的知识或技能,使之不断改善自身的性能[14]。对于成功的机器学习来说,通常需要具有四个要素,即数据(可以包括文本、图片或是机构数据等)、转换数据模型、衡量模型好坏的损失函数,以及调整模型权重来最小化损失函数的算法。而由于其模型和相应算法的不同,往往又可以将机器学习分监督学习(supervised learning)、无监督学习(unsupervised learning)以及深度学习(deep learning)。

3.1监督学习 监督学习的原理就是通过已有标记的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的分析与判断。在临床工作中,这种方法可应用于心血管疾病的诊断与预测。比如,我们可以将血压、血脂、心肌酶谱、脑钠素、心电图QT间期等心血管疾病相关检查指标作为样本(已知相应生存、死亡或患病的结局),利用决策树(Decision Tree Model)[15]、朴素贝叶斯(Naive Bayesian Model,NBC)[16]等算法,最终,我们通过不断训练就可形成一个基于这些检查指标的预测最终结局是生存、患病或是死亡的计算模型。利用该模型,我们就可以反过来针对某一患者的相应危险因素指标,得到个体化的风险评估[17-18],来进一步有针对性的指导该患者的临床治疗。通过这种学习方式,可以利用最优模型很方便地实现对患者最终结局的推测,但这种对最优模型的依赖也会成为其限制所在。在监督学习中,小的训练数据集合训练往往会得到有偏差的模型,因此,要想利用这种办法进行精准的风险评估,需要大量临床数据资料为基础,不断提高其准确性。

3.2无监督学习 无监督学习则是另一种研究比较多的学习方法,它与监督学习的不同之处,在于训练样本并未被标记,而直接对数据进行建模。无监督学习里典型的例子就是聚类。聚类的目的在于把相似的东西聚在一起,而我们并不关心这一类是什么。因此,一个无监督学习算法通常需要学习的是如何计算相似度,从而实现后续的对一个群体的内在模式进行分析。这种方法对于精准分析原发性疾病的病因病理机制有着重要作用。例如对于心肌炎这类机制不明的疾病,如果很多临床患者具有相似的急性收缩性心力衰竭,我们可以分别做心肌活检,并通过免疫组化等技术描述其细胞组成,如分别计数T淋巴细胞、中性粒细胞、巨噬细胞、嗜酸性粒细胞等不同细胞,再通过无监督学习的方法得到其是否具有相似的细胞组成模式,从而在病理生理学层面分析其可能的发病机制,并指导与之对应的临床治疗[19]。 而经过无监督学习形成的分组,其后续价值及意义往往又可以利用有监督学习的方式进一步研究。相比之下,若仅仅只用有监督学习的方式对某一群体进行研究,则可能会完全忽略这种内在可能有关联的亚群。如Shah等[20]预测射血分数保留的心力衰竭患者的生存情况时,就是通过无监督学习的办法建模,利用46个可变因素将患者分为3个不同组,再用有监督学习的方式预测最终结局,并取得良好结果。这种学习模式的不足也显而易见,即对于结构复杂的数据资料,在未对样本进行标记的条件下,往往对初始群集的模式识别存在困难,而这也最终可能会导致聚类结果的偏差,因此在实际操作中常常还需要手动标记部分数据来优化算法。

3.3深度学习 深度学习是机器学习研究中的一个新的领域[21],也是目前的研究热点。其动机在于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据,尤其是图像数据。人脑的视觉系统的信息处理是分级的,从瞳孔摄入原始像素后,大脑皮层的一些细胞会做初步的处理,例如发现输入信号的边缘信息等,然后大脑就会根据这些边缘信息对整个输入像素信息进行抽象处理,进一步判断这些像素信息所组成的物体的形状等其他信息,完成后大脑皮层会对得到的信息进行更高层次的抽象处理,就可判断出眼前的物体具体是什么东西。深度学习就是通过模拟人脑视觉系统的分级处理,利用计算机通过深度信念网络(deep belief networks,DBN)[22]、卷积神经网络(convolutional neural networks,CNN)[23]等算法实现这个过程的建模,即从原始的输入图像出发,从原始的像素开始逐层学习特征,并在相关纹理特征、颜色特征、局部特征基础上进行统计、量化、编码或其它方法得出有意义的特征表示模型,来用于后续的图像识别。

这种技术目前在人脸识别领域已取得了巨大的成功。传统的基于机器视觉的人脸识别方法,往往受到表情、姿态及光照、背景等因素影响,而基于深度学习的人工智能技术,如FaceNet算法,就通过从海量的图像数据中学习到关于光照、表情、角度等不同的特性,最终在LFW(labeled face in the wild) 数据库的人脸识别中达到了99.63% 的准确率,甚至超过了人眼识别的结果[24]。

与人脸识别相类似的,这种基于深度学习的图像识别技术也完全可以在心内科的影像学诊断方面发挥巨大作用,尤其是心电图的诊断。对于心律失常以及其他很多心脏疾病的诊断,心电图的解读无疑是十分重要的[25],但目前现有的心电图自动识别技术,对于现实中情况多变的心电图读取往往存在巨大的限制,如难以识别干扰波形、易误读起搏器节律、无法区分早期复极与ST段抬高的心肌梗死,以及QT间期测量的可靠性有限等[26],很难达到人工读图的效果。对于上述这些缺陷,我们就可以类似的用深度学习的办法进行弥补, 即通过建模对大量临床心电图数据进行学习,从而识别干扰波、起搏器节律等种种富于变化的波形数据,最终实现模拟人脑的智能读图。如吴恩达的斯坦福大学机器学习小组就通过这种办法,用深度学习的方法训练建模,利用人工智能精确区分肉眼易混淆的波形数据,从而准确诊断14种类型的心律失常。除了心电图外,这种技术在其他心血管疾病的影像学诊断方面也同样可以有着巨大的应用前景,可大大改善目前影像数据依赖专家读取且易受干扰的现状。例如2013年,Carneiro等[27]就曾使用定制深度模型从超声波数据中准确追踪左心室心内膜,在超声波数据的自动分析应用方面取得良好的结果。在冠状动脉硬化性疾病诊断方面,我国的人工智能系统Airdoc在大量专家医生标注的胸部CT数据基础上,利用深度学习技术和图像处理技术,设计特定的深度神经网络和图像算法,可以从胸部CT数据中推导出冠状动脉硬化评分,为冠心病的诊断提供依据。

这种学习方法在实际操作中也存在一定挑战,由于深度学习通常是非线性的分析和多参数、多层次的分析,因此也与监督学习一样,需要更加大量的训练数据集合,这就需要多机构的数据共享,并与电子医疗档案相联系,利用所获得的庞大的医学图像大数据,避免训练模型的误差,提高精确度。

4 结语

现今,人工智能技术飞速发展,在部分医学领域也有所突破,这种技术为心内科医生整合和分析庞大的医学大数据,并指导临床治疗提供了可行的办法(图1)。这种新技术的应用将帮助人类在已有线索的基础上揭开新的知识,也将帮助临床医生更高效准确地完成临床实践工作,而这些都有望缩短我们与精准医学之间的距离。与此同时,随着人口老龄化及城镇化进程的加速,中国心血管病危险因素流行趋势呈明显上升态势,导致了高血压、冠心病等心血管病的发病人数持续增加[28]。而在我国打造健康中国的大时代背景下,庞大心血管疾病患病人群的诊断与治疗,越来越依赖数量众多的基层医院。但目前与大型医院相比,基层医院服务能力仍显单薄,难以满足广大患者的基本医疗需求。而人工智能技术也正可以帮助医生,很好地解决基层医院医生数量以及经验不足的问题。这项技术通过学习海量的专家经验和医学知识,建立深度神经网络,在临床中不断完善,就可以协助基层医生拥有专家的诊断能力,在未来为心血管疾病的高效化、精准化防治带来巨大帮助。

图1

猜你喜欢
医学精准人工智能
本刊可直接使用的医学缩略语(二)
精准防返贫,才能稳脱贫
医学的进步
预防新型冠状病毒, 你必须知道的事
2019:人工智能
人工智能与就业
精准的打铁
精准扶贫 齐奔小康
数读人工智能
精准扶贫二首