华伟 张妮潇
100037 中国医学科学院 北京协和医学院 国家心血管病中心 阜外医院心律失常诊治中心
医学领域的人工智能研究正在迅速发展,在医学的各个领域都得到了广泛的应用,包括肿瘤学、影像学、心血管病学和各种外科手术、康复治疗等[1]。《中国心血管健康与疾病报告2019》[2]指出,目前心血管病位居城乡居民总死亡原因的首位,占居民疾病死亡构成的40%以上。心脑血管病的住院总费用也在快速增加。我国心血管疾病负担日渐加重,严重影响公共健康,因此,运用高效、前沿技术手段进行心血管防治工作,以期降低医疗费用、提高诊疗效果显得尤为重要。心电图智能诊断、心血管影像智能分析、心血管疾病筛查等研究已经在国内外深入开展。本文以心脏电生理和起搏为切入点,阐述人工智能在心血管疾病诊疗领域的应用。
人工智能和机器学习是一组算法的总术语,它们允许计算机从数据中发现模式并做出决策[3]。目前,实现人工智能的技术手段主要是机器学习(machine learning)。机器学习是指从有限的观测数据中学习/“猜测”出具有一般性的规律,并将这些规律应用到未观测样本上的方法。传统机器学习的数据处理过程包括:数据预处理、特征提取、特征转换和预测[1]。比如,在监督学习中,研究者将临床资料,即年龄、性别、血压、血脂、心肌酶谱、心电图指标及基因序列等作为基础样本数据,利用机器学习中人工神经网络、决策树、支持向量机或朴素贝叶斯等算法,构建一个基于这些数据的心血管、全因等结局事件的预测模型。最终,我们通过该模型可以评估其他患者结局事件风险,为临床诊疗提供指导。这种有监督的学习模型的建立必须基于较大的数据集,耗时长,需要不断训练,才能提高其预测准确性[1]。然而,无监督的方法并不是为了确定结局事件的预测因素,而是通过多个特征将相似的患者分组,分析相似分组间个体的特征,并将其与结果或治疗反应联系起来,即试图从数据隐藏的信息中识别新的致病机制、基因型或表型[1]。在无监督学习中,目标是在没有人类反馈的情况下发现数据中隐藏的信息(图1)。
人工智能在心律失常领域中的应用非常广泛,最直接的实践是用于诊断。心电信号是最能直接反映心脏电活动的无创手段,在临床上较易获取,基于心电信号的智能研究和概述有很多[4-10]。中国人民解放军总医院心内科与第三方研究院进行合作,利用智能腕带或腕表监测患者的脉律持续至少14 d,自动分析并上传脉律数据。结果发现,在187 912人中,424人接收到“疑似房颤”的提醒;在262例有效随访中,227例确诊为房颤;确诊患者中,216例随后进入了一个使用移动设备的综合房颤管理项目,大约80%的患者接受抗凝治疗。对于诊断房颤,这项技术的阳性预测值是91.6%,并且可以为确诊房颤的患者提供后续的综合管理措施[11](图2)。对于多种心律失常,人工智能算法进行的诊断可能更高效。中国人民解放军总医院心内科采用体表12导联心电图图像作为数据基础,以高年资的心电图医生进行数据精标注,通过监督学习不断训练由卷积神经网络建立起来的模型,该模型在心律失常诊断方面的准确度与灵敏度都达到了95%以上[12]。Hannun等[4]开发了一个源于端到端深度神经网络(deep neural networks,DNN)学习的方法来区分诊断12种心律,分别是房颤/房扑、房室传导阻滞、二联律、房性期前收缩、心室自主心律、交界性心律、心电噪音、窦性心律、室上性心动过速、三联律、室性心动过速和文氏阻滞。研究者使用了来自53 549例患者的91 232份单导联心电图,将这个数据集划分为12个心律等级。当使用专业的心脏病专家一致认可的独立测试数据集进行验证时,DNN的受试者工作特征曲线下的平均面积为0.97,DNN的平均F1分(0.837)超过了心脏病专家的平均水平(0.780);当DNN的诊断特异性与心脏病专家的平均诊断特异性一致时,DNN的敏感性高于所有心律失常的心脏病专家诊断的平均敏感性。这些发现表明,端到端的深度学习方法可以从单导联心电图中对多种不同心律进行分类,具有与心脏病专家相似的高诊断性能。与12导联心电图相比,单导联或双导联动态心电信号虽然不能提供完整的心电信息,但是由于其监测时间长,在心律失常领域上仍具有一定的诊断意义[4, 13-14]。这些机器学习方法如果在临床得到证实,可以快速诊断心律失常,对紧急情况进行准确分类,降低误诊断率,提高临床心电判读效率。
图1 心血管人工智能技术流程[1]
基于机器学习的心电图数据可以有效预测房颤。广泛可用的数字心电数据和深度学习的算法为大幅度提高自动心电分析的准确性提供了机会。Attia等[15]将180 922例患者的649 931份窦性心律心电图分为3个数据集:训练集、验证集和测试集,利用深度学习算法构建和优化房颤预测模型,结果显示该模型诊断房颤的受试者工作特征曲线下的平均面积是0.9,敏感度、精确度分别是82.3%、83.4%。
机器学习同样可以用于协助临床医师发现新的疾病分类方法。肥厚型心肌病(hypertrophic cardiomyopathy,HCM)按照左室流出道有无梗阻,可以分为隐匿梗阻性、梗阻性和非梗阻性HCM;按照心肌肥厚部位,可以分为心尖肥厚性、右心室心肌肥厚性和孤立性乳头肌肥厚的HCM[16]。然而,这些分类方法没有直接与心脏电活动相关,对于预测恶性室性心律失常的风险来说,具有一定的局限性。Lyon等[17]根据85例HCM患者和38名健康志愿者的12导联心电图进行建模和聚类分组,分析每组内HCM患者的临床特征,结果发现QRS形态是确定分组的关键因素(图3)。如果仅仅依据QRS形态,HCM患者可以分为3组:QRS形态正常组、V4导联小r大S型组和V4~V6导联小r宽S型组。3组间心律失常危险因素及心肌肥厚无明显差异。如果以QRS形态和T波作为生物标记物,HCM患者可被分为4组:QRS形态正常伴T波倒置组、QRS形态异常伴T波直立组、V4导联小r大S型组和V4~V6导联小r宽S型组。4组中第1组HCM患者的恶性心律失常风险最高,室间隔和心肌肥厚的总体比例最高;第2、3组室间隔肥厚的比例较高。这些结果表明,伴有原发性T波倒置的HCM患者的心脏性猝死的危险评分较高,同时容易合并室间隔肥厚和心尖肥厚,为临床的疾病危险分层和诊疗提出了一个新的方向。
图2 基于心电信号的房颤移动式智能管理[11]
图3 利用聚类分析进行肥厚型心肌病新分类[17]
此外,人工智能算法可以协助选择最优、最安全的药物治疗方法。心室电复极化的显著延迟表现为体表心电图QT间期的延长,这样的延迟会诱发潜在的致命性室性心律失常。QT间期延长是药物研发中被广泛认定的心脏安全生物标记物[18]。目前临床前药物安全性分析包括膜片钳实验,以评价药物相关的阻断心脏复极化离子流的作用。但用膜片钳方法预测心脏复极延迟的灵敏度和特异度范围分别为64%~82%和75%~88%,而Bergau团队[18]使用支持向量机方法,发现对于77个药物亚分类,基因预测心室复极延迟的平均敏感度和特异度分别为85%和90%,这些基因主要涉及脂肪酸代谢、G蛋白、细胞内谷胱甘肽、免疫反应、细胞凋亡、线粒体功能、电子传递和丝裂原激活蛋白激酶相关的基因。所以,临床数据结合机器学习也可以增强心脏安全性预测,及早预防恶性心律失常的发生。因此,机器学习算法是一种强大而准确的疾病筛选工具。但是,目前一个已知的局限性是,算法模型不能完全解释结果背后的基本病理生理机制,无法解释输入端原始心电信号和输出端之间的病理生理相关性[19]。心脏病专家通常需要使用一致认可的心电图参数,如QRS时限、QT间期或T波形态,再将提取的这些心电图生物标记物输入算法模型进行训练。而目前深度学习无法做到提取这些具有生理意义的关键心电图指标。因此,心电图智能分析的挑战不一定是计算性的,而是大规模所需数字化信息数据集的可用性。
多项临床试验表明,心脏再同步化治疗(cardiac resynchronization therapy,CRT)可以降低心衰患者的发病率和死亡率[20]。然而,尽管所有患者符合植入标准,仍有大约30%的患者对CRT治疗没有反应[21]。基于无监督学习进行人群分类的一个应用领域是更精确地筛选适合接受CRT的患者。有研究纳入1 106例CRT患者,提取了包括流行病学资料、血清学检查、心电图、超声心动图、用药情况和就诊中心在内的50项基线资料,通过无监督学习将这些患者分为4组,4组患者间大多数临床基线和主要终点事件均有显著性差异,其中2组患者对CRT的反应较好,组内已知的CRT有反应的预测因子比例较高,主要终点事件的发生风险较低[22]。这些结果表明,整合多项临床参数的无监督学习可有助于筛选对CRT反应较好的人群。与传统CRT反应性的预测模型相比,机器学习的模型预测效果更优。Kalscheur等[23]比较了随机森林算法模型与传统CRT预测模型的预测效果,结果发现,对于CRT术后12个月的全因死亡风险或心衰住院风险,机器学习模型的预测效果优于通过束支阻滞形态联合QRS时限构建的模型的预测效果。目前这些算法的局限性均在于入选人群的特殊性,尚不清楚这些算法是否适用于所有CRT患者。此外,各个研究的随访时间不同,如果随访时间延长,是否会得到类似的结果也尚不清楚。所以,这些结果有待在其他研究人群中进行验证,如果适用于临床,将有助于医师在CRT植入前做出最优的临床决策。
人工智能算法可以优化远程随访。对使用心脏植入型电子设备(cardiac implantable electronic devices,CIEDs)治疗的患者进行远程监测有助于及早发现心律失常和设备的技术问题来改善患者的随访和预后。然而,由于医疗花费和医疗报销问题,CIEDs远程随访在临床实践中的应用推进仍然缓慢,另外,大量的远程跟踪和警报管理对于医生或有经验的管理人员来说比较耗时。法国的研究者Rosier等[24]开发了一种基于人工智能工具的房颤危险性分级警报系统,通过提取医疗记录构建模型,将房颤危险性分为低、中、高和极高4个等级,分析60例植入起搏器患者的程控记录,结合CHA2DS2-VASc评分与房颤持续时间,人工将房颤危险性分级,比较智能分级的安全性和有效性,研究结果发现,在智能模型中,98%的起搏器警报被正确分类,这项技术使人工工作量减少了84%,同时可以保证患者安全。随着临床数据集的扩展,机器学习算法的应用将进一步提高心脏电生理和起搏领域诊疗的精确性。
结合临床资料的机器学习工具可以帮助开发标准化的预测模型,帮助心脏电生理和起搏领域的专家制定针对患者的指导方案。与传统研究方法相比,它可以被认为是一种统计认知的扩展,利用人工智能来增强而不是取代医生做出临床决策,但重要的是医生要知道如何充分利用人工智能来验证他们的假设,执行大数据分析,并优化人工智能在临床实践中的应用。目前,这些模型还需要在多个临床数据集中进行验证,并不断扩大训练数据集,提高模型预测、诊断和分型等的精确性。
利益冲突:无