基于自适应学习的心律失常心拍分类方法

2019-01-28 02:55:56王凯杨枢
中国医学物理学杂志 2019年1期
关键词:领域专家后验特征提取

王凯,杨枢,2

1.蚌埠医学院卫生管理系,安徽蚌埠233030;2.合肥工业大学信息与计算机学院,安徽合肥233009

前言

为降低心血管疾病引起的死亡率,心脏相关疾病的早期并发症检测与识别越来越受到医学领域专家的重视。心律失常是由心脏电脉冲引起的传导缓慢、阻滞或经异常通道传导的规律性心率异常[1]。在各种异常中,早期心室收缩(Premature Ventricular Contraction,PVC)是一种危害性较高的心律失常,通常是由心室的异位节律点发出激动波使心室提早收缩,即QRS综合波在P波前出现,是成人中广泛存在的心律失常形式[2]。临床上对PVC的评估和治疗相对较复杂,针对心血管系统疾病的自动识别,领域专家进行了大量研究。PVC在心电图(Electrocardiogram,ECG)上的生物特征主要表现为具有异常时序的心跳序列,通过使用已建立的疾病类别关联关系,能够在ECG记录中标记心拍序列,从所得序列中确定ECG信号的节拍属性,达到相关疾病的诊断与识别目的。

基于ECG的PVC心律失常分类方法,研究多采用时频分析技术、统计测量等混合方法。文献[3]应用动态贝叶斯网络进行PVC分类,分类过程中使用简单的决策规则,适用于嵌入式分类监测。文献[4]使用基于神经网络的分类方案检测PVC,比较了PVC聚类的学习和分类技能,提取了10个ECG结构特征,设计了一种用于PVC识别的低复杂度数据自适应方法。文献[5]着重于PVC检测的多层次学习模型,提出了一种使用多支路学习和支持向量机(Support Vector Machine,SVM)的PVC识别方法。文献[6]提出了基于神经网络的ECG模式识别方法,通过Nearest Neighbo(NN)分类器对PVC进行分类,并使用小波变换来提取心电图数据的形态学特征。文献[7]使用独立分量分析(Independent Component Analysis,ICA)进行特征提取,采用k-means和Fuzzy C-Means(FCM)分类器来识别PVC节拍。文献[8]采用贝叶斯正则化反向传播训练模型,通过优化多特征最优解模型,提高临床ECG信号标注的准确性。ECG心拍分类算法能够有效降低PVC心律失常的临床检测难度,简化记录和分析的工作量,逐渐成为领域专家研究的热点方向。目前基于ECG的心拍自动分类算法主要分为3大类:基于ECG信号特征识别的方法、分类器模型方法以及自适应模型分类过滤算法。

然而,上述方法在提取ECG信号特征时将信号波形的线性判别与聚类模型相结合,虽然在分类效果上有所提高,却降低了分类器的样本外点处理能力,无法有效处理变化的样本数据特征识别。本文提出一种面向PVC心拍分类的心电信号分类算法,重点研究基于自适应学习的PVC异常心拍分类特征提取模型,通过计算心拍关联后验概率,按估计置信度排序,获取极大似然概率估计。自适应分类器使用领域专家的标注信息,提高心跳标签系统的分类性能。根据AAMI指南[8]处理心拍分类,使用MITBIH心律失常数据库提供的心拍标签。训练分类器,动态调整分类器参数,提高整体分类效果。

1 方法

使用MIT-BIH心律失常数据库的非起搏器记录数据,每个记录包含两组ECG导联信号。采用0.1~100.0 Hz进行带通滤波,并以360 Hz进行采样。通过信号预处理,心拍分割获取规范化的心拍采样片段,通过特征提取以及概率权重排序,结合专家注释标注信息,构建自适应分类器,输出相关类的分类结果。

1.1 数据预处理

ECG信号中的噪声主要产生于以下几个方面:EMG噪声、电力线噪声、基线漂移和复合噪声[9]。不同患者的ECG信号显示出显著的差异,对计算出的信号振幅波动特征影响较大。执行归一化的预处理操作能够显著降低ECG信号的差异。本文将信号的均值设置为零,零均值信号计算如式(1)所示:

其中,y(t)是待计算的信号,是原始ECG,x是x(t)的算术平均值,L是信号长度。使用中值滤波器降低噪声。中值滤波器是一种简单的非线性平滑器,可以保持信号边缘光滑的同时抑制噪声。滤波信号计算如式(2)所示:

其中,Y(t)是滤波信号,y(t)是输入信号。应用级联低通滤波器从信号中去除频率分量低于0.5 Hz的信号数据,消除基线漂移和电力线噪声。基线漂移的频率分量通常低于 0.5 Hz,将频率限制调整为 2 Hz[10]。通过从适当延迟的输入信号中减去低通滤波器的输出,实现信号从低通滤波器到高通滤波器的平稳过渡。根据QRS复合波中R点的位置(根据滤波后的ECG信号建立每个心拍的R点,从R点右侧的100点开始分割)。R点的相关位置组成了MIT-BIH数据库的注释文件,所选择的心拍构成了一个7 000×200矩阵。

1.2 选取信号特征集

使用独立记录数据对系统进行测试,通过多个记录中的心拍子类估计其分类性能[11]。分类系统示意图如图1所示。系统选取的信号特征集主要包括表1的信号数据[12]。首先使用初始分类器处理输入ECG记录,产生初始的心拍子标签集;然后将标记的节拍提交给领域专家,根据分类需要更正标签信息,使用校正的标签计算分类器参数集合;最后组合新分类器的参数集合,生成自适应的分类器参数集合,系统使用已修改的参数处理剩余未注释的心拍数据。

1.3 心拍分类

采用基于线性判别的分类系统,输出后验条件概率,在单次迭代中训练分类器。基于自适应学习的心拍分类算法(Adaptive Learning of the heart Beat Classification,ALHBC)通过后验概率分析与计算、构造特征矩阵,以分类器参数的加权平均值以基础,动态调整最佳分类器参数阈值,输出具有异常时序的心跳分类集合。ALHBC算法的核心步骤描述如下。

图1 基于自适应学习的心拍分类系统原理图Fig.1 Schematics of heartbeat classification system based on adaptive learning

表1 自适应分类器特征集Tab.1 Adaptive classifier feature set

1.3.2 计算组合后验概率 为减少提交给领域专家的心拍数量,选择合适的自适应分类器心拍。使用公式(5)计算每个类中心拍的后验概率,并按降序排列,获取置信度最高的后验值Ri,计算公式见公式(6)。高置信度下的非自适应分类器产生的心拍,具有相对较高的Ri。为获取最佳自适应训练心拍,将Ri按升序排列,将数值较低的心拍交专家重新评估,最终输出组合后验概率最高的类。

设X为随机变量,ECG信号波形分布服从概率密度函数f(x,θ),利用公式(6)计算的最高后验概率,构造关于样本观测值的似然函数,极大似然概率估计表示如公式(7)所示:

1.3.3 计算特征矩阵 ECG特征提取与分类是一种涉及基线降噪、心拍分割及特征抽取等的复杂相关性过程。通过构建核心矩阵Z,定义并存储表1中的特征集合,该矩阵会随着输入向量的增加而进行动态更新。若X1,X2,…,XN∈RN与Y1,Y2,…,YM∈RN分别来自两个不同的训练组,核心矩阵Z=X∪Y定义如公式(8)所示,对应的协变矩阵CMZ定义如公式(9)所示:

针对核心矩阵,可进一步求解其特征值λ和特征向量y,分别定义如公式(10)、(11)所示,上式中α、β分别表示Xi、Yi的特征向量。若Z的元素总数为k,为便于将数据映射到约简的特征向量空间,分别将上式改写成公式(12)、(13)所示:

1.3.4 计算分类器参数加权平均值 获取自适应分类器的最佳参数μk和协方差Σ,选择合适的心拍,并将其提交给领域专家进行标签注释。在训练初始数据参数记录后,计算分类器参数加权平均值,使用公式(14)、(15)确定μ和∑k的加权平均值。

2 实验与分析

在获取后验概率估值后,使用交叉验证过程估计分类器的综合性能。为了获得性能测量的无偏估计,测试数据中包括不属于测试心拍分类信号的数据。将所有先验概率设为1/11,分类条件加权值设置为0.5,由领域专家标注的最佳分类自适应参数在1到500次心拍之间随机变动,以适应不同的分类信号采样。使用MIT-BIH心律失常数据库验证PVC心跳分类,不平衡比设置为1:100,其中选取200次正常心跳(NOR),200次右束支传导阻滞(Right Bundle Branch Block,RBBB),200次左束支传导阻滞(Left Bundle Branch Block,LBBB),200次心房早搏(Atrial Premature,AP)以及200次PVC作为信号的原始特征数据。

本实验包含两个子实验,实验一将所有心律失常心拍无区别地输入未知类,重点测试ALHBC算法对异常心拍的分类能力;实验二重点关注PVC的分类效果,在测试阶段添加未知心跳类型,检测算法对实验一中PVC类数据的分类能力。

实验一对样本中的原始数据进行特征分解,将特征集分别输入 SVM[13]、Back Propagation Neural Network(BPNN)[14]以及 Learning Vector Quantization(LVQ)[15]分类模型,并将分类结果与ALHBC算法结果进行横向比较,实验结果如图2所示。在本实验中,特征提取阶段输出60个特征集合,其中LVQ的准确度为85.31%,SVM准确度为87.44%,BPNN准确度为91.72%,ALHBC算法准确度为92.18%。结果表明通过集成特征提取阶段的ALHBC算法能够解决特征提取与分类数据的不一致问题。在非平衡数据条件下,对非线性流形结构数据具有相对较高的分类准确性。

图2 心律失常心拍分类结果Fig.2 Arrhythmic heartbeat classification results

实验二重点分析PVC的分类效果,在测试阶段添加未知心跳类型,选取实验一中分类效果较好的两种分类模型(ALHBC和BPNN),构建如表2所示的混淆矩阵,其中列数据表示实验预测类,每列总数为预测该类数据总数;每行表示数据的真实归类,每行总数为该类别数据实例总数。结果表明ALHBC算法针对的PVC异常心拍分类特征提取较其他分类更加接近真实数据分类。

表2 特征分类混淆矩阵Tab.2 Confusion matrix of feature classification

3 总结与讨论

本文提出一种自适应心拍分类算法,研究解决ECG形态变异性的分类指证,构建基于自适应学习的PVC异常心拍分类特征提取模型,实现ECG的自动分类问题。通过计算心拍关联后验概率,结合领域专家标注信息训练分类器,提高整体分类效果。研究结果表明,所提方法能够处理非平衡类数据特征提取的分类问题,特别针对非线性流形结构数据,能够有效提升小样本心拍的自适应分类器的准确性。

结合临床环境中的实际应用,本文的后续研究将围绕分类器参数的动态自适应调整问题,改进输入参数的初始簇最优解模型,减少所需领域专家的标签总数,提升模型用于复杂条件下的自主学习能力。

猜你喜欢
领域专家后验特征提取
良好睡眠,健康同行
基于对偶理论的椭圆变分不等式的后验误差分析(英)
贝叶斯统计中单参数后验分布的精确计算方法
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
社交网络中领域专家发现模型研究
软件导刊(2018年7期)2018-09-26 11:30:48
Bagging RCSP脑电特征提取算法
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
雷达学报(2017年6期)2017-03-26 07:53:04
基于科技文献库的领域专家群发现及其推荐方法
基于MED和循环域解调的多故障特征提取
基于贝叶斯后验模型的局部社团发现