陈 程,孙 阳,夏云龙
人工智能指机器基于对数据的处理以完成通常需要人类认知功能才能完成的任务。在现代,人工智能已经可以通过挖掘高密度数据以完成对复杂模型的分类和抓取新颖的数据特征[1]。机器学习是人工智能的分支学科,可以通过算法在数据中学习,进一步识别数据中的非线性关系和高阶交互关系,而这在传统统计学中无法实现[1]。2020 年欧洲心脏病学会(European Society of Cardiology,ESC)大会上,人工智能被认为是心血管领域发展的前沿,将为心血管诊断和个体化治疗带来巨大的变革[2]。人工智能应用于心脏电生理并非是一个新兴的概念,早在20 世纪70 年代就已有通过人工智能对心电图进行自动分析[3]。近年随着大型电子数据库的建立,算法、软件及硬件的不断创新升级,人工智能在心脏电生理尤其是心房颤动(atrial fibrillation,AF)的应用不断进步[4]。本文将对人工智能分别在AF、心源性猝死、起搏等领域研究进展作一综述,同时对人工智能目前应用所遇到的局限以及未来发展方向进行总结和展望。
1.1 便携智能设备与AF 筛查 穿戴式光电容积描记器(wearable photo plethysmo graphic sensors,PPG)通过对脉冲频率和规律进行长期被动评估,进而识别AF 特征性的不规律脉搏。在Apple Heart 研究中,共有419 297 名参与者接受基于PPG 的苹果手表监测,其中2 161 名参与者识别到不规律的脉搏活动。随后对450名参与者进行连续1周的动态心电图监测,共有34% 的参与者最终诊断为AF,基于PPG 电子手表监测的阳性预测值可达84%[5]。在此基础上,Kardiaband 等对4 代和5 代苹果手表进一步升级,当手表上PPG 识别到不规则心率时,提示使用者利用手表表冠上的传感器记录单导联心电图。而在2 代和3 代苹果手表中,Kardiaband 利用PPG 和手表上的计步器持续监测使用者的心率和活动强度,当出现心率紊乱时提示使用者使用预先安装在表带上的感应器通过拇指描记I 导联心电图。这一算法在24 名带有植入式心脏监视器和阵发性AF 病史的患者上进行验证,结果提示该算法对发作1 h 以上的AF 敏感度达97.5%,对AF 发作时长的敏感度达到97.7%[6]。中国人民解放军总医院心内科联合华为公司也进行了类似的研究[7]。基于PPG技术的华为腕带和手表对187 912名参与者进行至少14 d 的持续脉律监测,最终有227 名参与者诊断为AF,其阳性预测值达92%。除此之外,通过智能手机摄像头进行无接触面部识别和指尖PPG 感应器也表现出对AF 筛查和诊断的潜力[8-12]。一项meta 分析发现通过结合上述技术,其敏感度和特异度可分别达94%和96%[13]。
另外,一种基于可手持设备的心脏监测系统可以用于症状性AF 的监测[14-15]。被测者在症状发作时通过手指触摸接收器,可在手机上实时监测并记录心电图。多个研究报道该种监测系统无论对于门诊患者还是住院患者,敏感度和特异度均可达90% 以 上[16]。Chen 等[17]通 过 同 时 装 有ECG 和PPG接收器的手环监测AF,结果提示该手环明显优于ECG和PPG设备,其准确性可高达97.5%。
可穿戴式智能设备由于体积较小,使用者携带方便,具有可长程纪录患者心电活动的特点,因此对可疑AF患者的监测、评估AF患者的AF负荷、射频消融术后长期评估及预防AF复发起至关重要的作用。另一方面,可穿戴式设备可广泛应用于门诊、住院部,甚至是在医疗水平欠缺的基层医院及社区医院,使患者可以在家庭中自主使用设备监测心率,减少不必要的开支并且节省了公共医疗资源。
1.2 深度学习与AF 诊断 深度学习是机器学习的一个亚型,相较于传统的监督机器学习,它的最大优势是可以更灵活的处理原始输入数据而无需人工对变量及特点进行识别整理。例如在自动心电图分析中,早先的监督机器学习依赖于传统心电学指标作为输入变量,而深度学习可自动处理原始心电图进而诊断窦性心律或各型心律失常,其准确性也与心脏病学家一致[18]。其中,卷积神经网络(convolu‐tional neuronal networks,CNNs)是深度学习最常用的方法学。梅奥诊所基于CNNs对12导联心电图进行分析,纳入超过18万名参与者的共计45万份心电图,通过超大数据集的机器学习和数据集内训练,从而识别阵发性AF患者窦性心律时的心电图特征,用以筛查未被发现的阵发性AF 患者[19]。该特征通常无法由临床医师肉眼识别,但可以有效的通过窦性心律心电图筛查潜在的AF患者,其模型结果显示当结合多份窦性心律的心电图进行诊断时工作特征曲线下面积可达0.90。该方法可有助于确定AF 筛查和指导不明原因卒中患者抗凝治疗。
1.3 人工智能与AF 表型 AF 是一种多种病因或混杂因素共同作用下产生的一种心律失常疾病,可表现出多种不同的表型。非监督下的聚类分析可以帮助AF表型的分类,进而作为临床AF评估和管理的补充。美国一项纳入9 749例AF患者的研究,通过聚类分析60种不同的临床指标将AF分为4种表型:①缺乏危险因素的AF;②合并有不良生活行为的年轻AF患者;③合并有快-慢综合征并植入起搏器的AF 患者;④合并有动脉粥样硬化疾病的AF患者[18]。此分型在其他队列中也得到了验证,不同表型的AF 有明显不同的预后。有趣的是,该表型分类并非基于传统临床AF 常用指标,例如左心房大小或AF 类型,而是以合并症为基础进行表型划分。这对指导AF的治疗有重要意义,提示AF的治疗不仅限于药物或基于射频消融的手术,而应该为包括治疗合并症及控制危险因素在内的综合治疗。另外,日本一项类似的研究以日本AF 患者为样本进行聚类分析,将表型分为:①年轻的阵发性AF患者;②伴有左心房增大的持续性AF患者;③合并动脉粥样硬化疾病的AF 患者[20]。该结果可能提示AF的表型在不同地区人群可能存在差异。
1.4 人工智能与AF 射频消融 随着AF 电生理标测和三维成像的快速进展,机器学习通过对此类数据不断训练和学习,给AF 的分类和患者个体化治疗带来新的信息。在一些研究中,机器学习通过对核磁共振(magnetic resonance images,MRI)图像模型中AF 患者左心房几何结构的深度学习和训练,可以识别心房肌中纤维化组织并预测未被射频消融干预的AF 驱动靶点[13,21-22]。然而,目前AF 标测系统自动识别的AF消融靶点常仍需要术者的进一步判断识别,而不同术者对同一消融靶点也可能得出不同的结论。因此,机器学习可能阐明AF 标测过程中仍存在争议的部分。近期,研究者将来自35 例AF 患者的175 000 份AF 标测图像放入深度CNNs 进一步训练,以识别射频消融的可能靶点。结果显示当以持续性AF 消融终止为终点时,其准确性可达95%[23]。
1.5 人工智能与AF 预后预测 AF 常常对左心房形态产生影响,主要表现为左心房容积和形状的改变。近期一项研究通过分析接受射频消融术后的AF 患者MRI 特征,通过机器学习定量分析并识别到19 个形态学特征可以用于预测AF 术后复发时间[24],并同时发现肺静脉短小且向侧方旋转的圆形左心房与AF复发显著相关。而另一项研究通过统计模型对AF 患者MRI 图像分析并挖掘相关变量,放入机器学习中进一步训练预测AF 复发,其结果示工作特征曲线下面积为0.71[25]。
目前,心电生理医生对于心律失常的诊断金标准仍为心脏电生理检查,但是该种方法仍然存有创伤,步骤复杂等缺点。目前随着人工智能与机器学习的不断进步,无创性的心电生理检查成为可能。心脏影像学通过与包括CNNs在内的机器学习相结合,显著提高了心脏核磁共振(cardiac magnetic resonance,CMR)采集速度、时间效率、图像重建质量、分辨率和分割的准确性[26-28]。同时,人工智能与CMR 三维重建图像结合可以有效定位心律失常起源部位以及心肌病变位置,这对于后续治疗特别是射频消融治疗带来巨大价值。目前,Amycard 01C系统(EP Solutions SA, Yverdon-les-Bains, Switzer‐land)和ECVUE 系 统(CardioInsight Technologies Inc., Cleveland, OH, USA)可以定位房性和室性心律失常并已商业化上市[29-30]。他们可以在整体视图上实时动态呈现心房以及心室电活动甚至AF发生情况并将其可视化,通过这项技术局灶AF 和转子均可呈现,这在传统电生理mapping 系统上是无法做到的。 另外,下一代非侵入性mapping 系统(View into ventricular onset,VIVO)也已被提出,该系统通过结合体表12 导联ECG 和心脏影像(CMR或CT图像),可以预测室性早搏电活动位置和室性心动过速病灶位置,其准确性可分别达85% 和88%[31]。随着心脏成像技术和体表标测技术的发展,ECG采集技术也取得了进一步的进步。ECG成像系统将体表标测(使用多达252 个电极代替标准12 导联)与非对比剂计算机断层扫描相结合,同时记录电极位置和心脏表面几何结构,通过逆向算法在患者心脏的三维重建模型图像上定位心房或心室异位的局部电活动[32]。
随着非侵入方法确定心律失常病灶的技术发展,部分研究者通过放射治疗的方法治疗心律失常(主要为继发于缺血性心脏病的室性心律失常)。Robinson 等[33]纳入难治性室性心动过速和伴有频发室早的心肌病患者,通过ECG 图像和心脏影像学解剖图像定位心脏疤痕区,随后给予局部定向放射治疗(stereotactic body radiation therapy,SBRT),可以有效减少患者心律失常发生负荷,减少后续抗心律失常治疗并显著提高患者生活质量,其6 月和12 月整体生存率为89% 和72%。另外,首个将SBRT 用于治疗左房存在纤维化的阵发性AF 患者的病例被报道,其结果证实了SBRT用于阵发性AF的有效性及安全性[34]。但上述技术仍需经过更大规模临床试验和长时间随访证实。
3.1 人工智能与心力衰竭CRT 植入患者的分型Cikes M 等收集1 106 例植入心脏再同步化治疗(cardiac resynchronization therapy,CRT)或植入型心律转复除颤器(Implantable cardioverter defibrillator,ICD)心力衰竭患者的全心动周期张力和容积指标,通过多核学习综合复杂心功能区域模式(每个心动周期共计1 623 个心动超声数据点)和大量临床资料,将患者分为4 个亚群[35]。其中2 个亚群对CRT 容积反应更好并在植入CRT 后获益最大。该算法也优于单纯以临床特征或心动超声指标的预测模型。
3.2 人工智能与预测心脏再同步化治疗反应 数个研究通过建立模型早期预测CRT 应答。Kalscheur MM 等[36]通过建立随机森林模型预测CRT 术后心力衰竭事件和死亡复合终点。模型共纳入45 个常见指标,结果提示该预测模型优于传统临床指标如束支阻滞形态和QTS时限(工作特征曲线下面积为0.74)。另一研究在回顾性队列中预测CRT 术后心脏超声变化[37]。研究者评估了各种机器学习算法和临床变量集,发现使用简单贝叶斯分类器创建的机器学习模型和只有9 个变量的机器学习模型比其他具有广泛特征集的模型表现更好。尽管机器学习模型相较指南推荐改善程度不大,但机器学习模型在预测反应和对无事件生存率的区分方面优于当前指南。Tokodi M 等[38]通过纳入33 个变量训练随机森林模型并建立SEMMEL‐WEIS-CRT 评分,以期预测CRT 术后患者1 至5 年全因病死率,结果提示机器学习训练模型对病死率的预测评估优于目前的临床风险评分。
3.3 人工智能与AF 卒中风险预测 另外,有研究团队通过基于随机森林结合CNNs的机器学习算法,分析已植入ICD 的AF 患者的AF 发作负荷,结果提示机器学习算法结合CHA2DS2-VASc评分对于AF患者卒中风险预测相较于单纯的CHA2DS2-VASc评分具有更好的预测能力,其工作特征曲线下面积可以由0.52显著提高到0.63[39]。
Chen 等[40]通过联合随机森林模型和非负矩阵分解法并纳入20 个心电图指标和15 个临床指标,以期明确和住院患者获得性长QT综合征全因死亡相关的危险因素。结果提示随机森林模型和非负矩阵分解法的联合使用可以有效提高模型的预测能力,C 指数从0.77 显著提高到0.89。另外,确定了包括肿瘤、血钾、血钙及JTc 间期在内的多种风险因子。
同样,Gary 等回顾性纳入Brugada 综合征患者共计149 名,研究发现晕厥、AF、QRS 时限和QTc间期为Brugada 综合征患者自发性室速和室颤的独立预测因子,而通过非负矩阵分解法可显著提高模型的预测能力,工作特征曲线下面积可由0.71 提升至0.80[41]。
尽管目前有大量关于人工智能及机器学习在临床应用的相关研究,但是仅有少数最终应用于临床实践[1]。人工智能在心电生理领域的应用仍存在诸多问题及局限性:①人工智能在临床的应用较应用于商业、经济及科技领域要更为复杂。人工智能模型在不断学习训练过程中在不断变化,只有经过长时间大样本量的不断训练模型才能相对稳定,才能通过政府监管机构的审批。另外,一旦人工智能产生错误的结果可能造成严重后果,例如漏诊严重的致命性心律失常可能造成患者死亡,以及人工智能在临床应用过程中存在的结果解释问题、患者隐私及相关法律问题都应得到重视。②基于人工智能的模型应具有普适性。许多人工智能模型基于特定人群如住院患者,以及基于回顾性分析,这均会导致训练出的模型无法应用于一般人群。例如,一项研究显示通过基于X 线深度学习诊断肺炎会受到来自于医院偏倚的影响而无法推广应用[25]。③机器学习方法学本身运算具有“黑箱子”特性,其运算过程并不透明,其如何通过数据得出结果并不能被人了解,这使得临床医生基于机器学习结果做出临床诊断时缺乏信心。因此,相较于“基于机器学习指导的临床决策”,临床医生更倾向于“基于机器学习建议的临床决策”。④当纳入统计模型的数据出现人为或非人为错误时,其得到的模型也将因此输出错误的判断和结果,而由于人类常常无法识别该种错误,这类错误常常具有隐蔽性[2]。⑤人工智能模型应结合临床环境,才能更好的应用临床实践。部分人工智能模型所纳入指标在临床中极少应用,甚至无法获取,即使模型本身具有可行性,但由于临床可操作性的限制也会影响模型的应用。
迄今为止,人工智能在心律失常方面的应用表现出了巨大的潜力。从笔者的角度,人工智能在分析基因和蛋白组学数据、组织学特征或探究药物在心律失常中的作用方向可以展现出更大的潜力。另一方面,人工智能模型的建立应该基于大范围、多中心和大样本量的数据进行。目前大多数人工智能模型常局限于单中心小样本量数据库,这会影响上文中提及的模型普适性。而通过大规模超大量的数据分析可以有效解决上述问题。