基于光电容积脉搏波的心房颤动识别方法

2020-12-12 04:03张悦陈真诚梁永波朱健铭
中国医学物理学杂志 2020年11期
关键词:特征参数脉搏房颤

张悦,陈真诚,梁永波,朱健铭

1.桂林电子科技大学电子工程与自动化学院,广西桂林541004;2.桂林电子科技大学生命与环境科学学院,广西桂林541004

前言

心房颤动(简称房颤)是一种常见的心脏疾病。房颤患者的体征包括脉律不齐、脉搏短绌、第一心音强弱不等、节律绝对不规整等[1]。在传统的房颤诊断中,医生通过查看心电图(Electrocardiography,ECG)判断房颤的发生,但此诊断方式带有主观性,且耗时耗力。Kora 等[2]基于ECG 使用Cuckoo Search 算法来实现自动识别房颤;王凯等[3]基于ECG 的自动心律失常检测模型能够有效监测心脏异常房颤信号的ECG 信号特征。对于房颤监测的困难主要在于阵发性房颤,此类房颤的特点是突发突止、持续时间短,24 h 动态心电图常作为首选的监测方法。李芳等[4]通过分析总结房颤的心电散点图特征,分析24 h 动态心电图来诊断房颤。武求花等[5]运用Lorenz-RR散点图(Lorenz散点图)与时间-RR 间期散点图(时间散点图)及逆向技术相结合的方法,快速识别不同发作时间的PAF,为临床提供更快更准确的心电诊断技术。

目前国内外对于房颤识别的研究大多基于ECG,但ECG 设备普遍有操作复杂、携带困难、价格较高、多通道等局限性。光电容积脉搏波描记法(PPG)是使用激光对待测流体或固体的体积进行检测与记录的方法,可以用来监测毛细血管中血液的体积变化[6]。有研究表明,PPG 信号与ECG 信号有很高的相关性[7]。PPG 方法采集信息容易、方便携带,相较于ECG 方法,PPG 更加擅长长期监测。本文从脉搏波波形中提取房颤相关特征参数,使用机器学习算法构建心房颤动识别模型,以探寻基于脉搏波识别房颤的有效方法。

1 房颤状态脉搏波分析

将心房颤动状态脉搏波与健康状态脉搏波的波形进行对比分析,可发现二者间有明显不同。主要区别在于房颤发生时脉搏波的脉冲宽度(Pulse-Width, PW)、峰峰间隔(Peak-to-Peak Interval, PPI)、收缩期面积(Systolic Area,SA)会明显与相邻时间下同类特征的平均值有较大差别。其中每次房颤发生时,PPI会出现一次低于、一次高于平均PPI值的情况;PW和SA都会出现一次明显低于平均值的情况。

通过查阅文献,本文还选取了增强指数(Augmentation Index,AI)、脉搏波上升导数最大处至重搏波峰值的时间间隔(Half Rise to Dicrotic Notch,HRDN)、拐点面积比(Inflection Point Area, IPA)3 种与房颤疾病相关的特征类型,这3类特征参数能作为受试者是否可能发生房颤的判断因素。

心房颤动的发生与高血压高度相关,心脏由于人体长期血压过高将造成心房电传导延迟、左心室肥厚、左心房功能异常、左心房扩大等现象[8]。血压的增高会导致动脉的老化进程加速[9]。动脉老化将引起动脉的僵硬度提升,脉搏波传导速度会随着动脉僵硬度的提升而加快,它的加速使得外周动脉到近端大动脉的反射波提前回传,最终使脉搏波波形变化[10]。AI可以定义为PT2/PT1,其中PT2是收缩压后期振幅,PT1是收缩压早期振幅。已有研究表明,脉搏波特征中的增强指数AI就可以反映出动脉僵硬度的变化,且容积脉搏波的AI与主动脉AI相关[11],故选用此类特征值。

有研究表明,脉压差的增大,将导致动脉牵拉的加重,血管壁弹性成分容易疲劳和断裂,这将造成内膜损伤,并很有可能进一步提高动脉僵硬和血管栓塞发生的可能性。内皮功能减退可能导致房颤的发生[12]。因此,将能够反映脉压的HDRN 列为房颤的判断因素之一[13]。

房颤病人与正常人的外周血管总阻力(Total Peripheral Resistance, TPR)有明显的区别[14]。有研究发现IPA能够反映TPR指标。IPA定义为脉搏波中第二个峰与第一个峰的面积之比(SB/SA),与脉搏波反射强度有较强的相关性。动脉系统中,各部分间阻抗不匹配将出现脉搏波反射。已知,有九成左右的TPR 存在于小动脉处,小动脉收缩将使得TPR变化,并造成阻抗不匹配,由此引发的脉搏波反射强度的变化将使IPA 发生变化[15]。本文所提房颤相关的各特征参数示意如图1所示。

图1 脉搏波的特征参数Fig.1 Characteristic parameters of pulse wave

2 实验过程

实验数据来源于美国麻省理工学院MIMIC公开数据库中房颤患者(通过ECG 确诊)以及健康人的PPG数据。数据经筛选、分段、归一化等预处理,得到6 857 例10 s 脉搏波数据段,数据样本中房颤状态PPG 样本共2 737 例,非房颤状态PPG 样本共4 120例。将样本数据分成房颤与非房颤两组并标记标签,提取PPG 数据中与房颤相关的6 类特征参数,使用BP 神经网络、随机森林、支持向量机(SVM)作为分类器对数据进行房颤的识别分类。通过对比分析各个分类器的实验结果,探寻效果更佳的识别房颤方法。

2.1 数据处理

MIMIC 数据库中下载的脉搏波数据经预处理后,得到归一化的PPG数据可视化样例(每段10 s,采样频率为125 Hz)如图2所示。将房颤状态的脉搏波数据标记为正类,非房颤状态的脉搏波数据标记为负类。

提取PPG波形中PW、PPI、SA、AI、HRDN、IPA共6 类特征作为分类器的输入项进行房颤识别分类实验。

虽然有一些研究表明MAOIs、TCAs、SSRIs、SNRIs在不同药物类型方面,以及同一类型不同药物方面有疗效间的差异,但大量的比较研究整体上没有发现在这些方面上的明显差异。而基于第二代抗抑郁药物(SSRIs和SNRIs)具有比第一代抗抑郁药物(单胺类氧化酶抑制剂和三环类抗抑郁药物)具有更好的安全性和耐受性,因此使用更为广泛,常被推荐用于急性期的初始治疗。

2.2 模型建立

本文使用BP 神经网络算法、SVM 算法、随机森林算法,以PW、PPI等6类特征参数作为输入,样本是否发生房颤现象作为输出,分别构建3 种分类器,并将对分类效果进行评估。

图2 不同状态下的脉搏波波形Fig.2 Pulse waveforms in different statuses

BP 神经网络属于多层前馈的神经网络,其含有输入层、一层及以上的隐含层和输出层。BP 神经网络的输入信号前向传递,误差反向传播,若输出层无法得到期望输出,则转向反向传播,通过预测误差对网络权值和阈值进行修正,可以使预测输出向期望输出持续逼近[16]。隐含层各神经元节点采用Sigmoid 函数作为激励函数。实验中,将BP 神经网络的隐含层设为两层,第一层含100 个神经元,第二层含50 个神经元;最大迭代次数epochs 设为20 000次时,BP 神经网络对于房颤脉搏波的识别率达到92.3%。

SVM 是一种常用的机器学习方法,在统计样本少的情况下,能够处理二分类的问题。SVM 的原理是找到一个最优分类超平面,其在能够达到分类要求和精度的基础上,还能够最大化分类面异侧的空白区域,可以完成线性可分数据的最优分类。

对于本文中关于发生房颤与否的二分类问题,T={(x1,y1), (x2,y2),…,(xn,yn)}是本次实验所使用的样本集。xi∈RP,yi∈{ -1, 1},i= 1, 2,…,n;P是各样本的维数;n是各样本的个数。超平面方程是:

其中,ω是权向量,b是阈值。经过归一化,若满足yi(ω⋅xi+b) ≥1(i= 1, 2,…,n),即可得出这个超平面对样本的分类已经完成[17]。本文选用高斯径向基作为内核,其计算复杂度低,且参数设置简单,广泛运用于各个领域的研究。本实验中,SVM 对于房颤识别分类的准确率达到89.1%。

将Bagging 集成构建于决策树基学习器上,并在决策树训练中加入随机属性的选择,即可构成随机森林。决策树模仿树的结构进行判断决策,属于较普遍的机器学习算法。生成一棵决策树,包括决策树生成、剪枝、特征选择三大内容。特征选择所表达的分裂标准将在很大程度上控制决策树的泛化误差,它是非常关键的一个部分。Bagging 基于自助采样法,是一种经典的并行式集成学习方法。Bagging在训练集合中,将样本有放回地随机抽取,每一轮的分训练集的样本,都是从训练集中抽取的N个样本。一轮训练集中,某一训练样本被抽取0 至N次。结果集的产生需要将每次抽取出的子集作为算法的输入,产生预测函数,再需要经过T轮循环。最后通过投票,解决预测函数的分类问题[18]。随机森林算法的主要参数设置中,在考虑模型的准确度与稳定度时,还需兼顾模型效率,我们将树的个数n_estimators设置为100;叶子节点上应有的最少样例数min_samples_leaf 设置为4;分裂内部节点需要的最少样例数min_samples_split 设置为8 时,随机森林识别房颤的分类准确率达到95.2%。

2.3 模型评估

数据集中有70%的样本作为训练集;15%的样本作为验证集;15%的样本作为测试集。训练集作为构建预测模型的基础,训练样本的数量将影响机器学习算法模型的预测能力。测试集作为检验模型性能的分析样本。

混淆矩阵中,TP(True Positives)是将房颤脉搏波判定为房颤;FP(False Positives)是把非房颤脉搏波判定为房颤;FN(False Negatives)是把房颤脉搏波判定为非房颤;TN(True Negatives)是非房颤脉搏波判定为非房颤。

通过以下公式进行性能度量:

在评价分类算法的指标中,准确率是最常见的衡量指标之一,分类器的准确率越高即表明该分类算法的效果越好。但由于本文的数据源中,房颤数据与非房颤数据的样本不平衡,还需引入精准率和召回率两个指标。如上文公式所示,精准率代表所有预测为正类的结果中,真实正类的比例。召回率代表所有真实正类中,预测正确的比例。同样,精准率和召回率的值越高,越能够表明该分类算法优质。本文还引入了F-Score 指标,它将精准率和召回率进行加权调和平均,能够为精准率和召回率提供一个综合的评判标准[19]。

3 结果分析

基于实验结果及评价指标可得如表1 所示的结果,随机森林模型的准确率最高,达到了95.2%,BP神经网络的准确率为92.3%,SVM 方法的准确率最低只有89.1%。通过对比能够反映综合评价指标的F-Score可以看出,随机森林的F-Score为93.9%,高于另外两个分类模型。且随机森林模型的各项指标与其他模型相比,均保持了较高的水平。

表1 各分类器的性能指标Tab.1 Performance indicators of each classifier

在ROC空间中,ROC曲线越凸向左上方,表明该算法所能达到的分类效果越好;ROC 曲线越靠近对角线,则分类器越趋向于随机分类器。笔者将3种分类器的分类效果进行比较,结果如图3所示。

Area Under the ROC Curve(AUC)能够准确反映分类器的性能,AUC 值越大,则此分类器的性能越好。如图3 所示,灰色虚线代表AUC=0.5,SVM 的分类结果更靠近虚线,其AUC=0.938,随机森林的ROC曲线最接近左上角即(0,1)点的位置,其AUC值达到了0.986。综合以上评价分析结果可得,随机森林模型对于房颤状态脉搏波的识别分类效果优于SVM和BP神经网络模型。

图3 接收者操作特征曲线Fig.3 Receiver operating characteristic curve

4 结论

本次研究结果表明,PPG信号可用于判定房颤的发生,是一种可行的替代ECG 检测房颤的方法;基于本文选用的6类脉搏波特征参数,使用机器学习算法对脉搏波进行分类,能够有效区别出脉搏波的房颤状态与非房颤状态。本文还通过准确率、精准率、召回率、F-Score、AUC 值等评价指标评估模型效果,结果表明,使用随机森林分类方法判别房颤发生的效果优于SVM 和BP 神经网络,其准确率达到了95.2%。

下一步工作中,可基于目前的研究,分析更多的特征点,尝试继续提升分类效果。由于本文所使用的临床数据来源于MIMIC 数据库,缺乏相关校准记录等信息,之后可使用精确的传感器自主获取数据,以期得到更好的房颤识别分类效果。

猜你喜欢
特征参数脉搏房颤
重载车辆轮胎模型参数辨识与灵敏度分析
基于视频图像序列的船用雷达目标检测和目标特征参数提取
脂肪酸与心房颤动相关性研究进展
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
房颤别不当回事儿
基于交通特征参数预测的高速公路新型车检器布设方案研究
用心感受狗狗的脉搏
光电式脉搏波检测系统的研究
预防房颤有九“招”
沈安娜:按住蒋介石脉搏的谍战玫瑰