一种基于压缩域的穿戴式心电信号直接特征提取与分类方法*

2018-12-10 08:55徐亦璐
传感技术学报 2018年11期
关键词:电信号心电准确度

华 晶,殷 华,徐亦璐,贾 晶

(江西农业大学软件学院,江西 南昌 330045)

世界卫生组织的研究报告表明,心血管疾病的发病率和死亡率比其他疾病都要高,已成为人类死亡的主要原因之一。心电信号ECG(Electrocardiosignal)是可穿戴式健康监测系统中检测和诊断心律失常等心脏疾病的重要指标之一。传统的诊断方式是医生根据自身的经验,通过看心电图对患者的病情进行分析与诊断。但是每个医生的业务能力不同,对于经验不足的医生而言,很难对一些病情做出正确的判断。此外,由于心律失常等心脏疾病种类很多,使得心电信号波形比较复杂,经常会产生各种各样的变异,其形状区别很不明显,即使是经验丰富的医生,也难以区分判别。而且面对长期大量的诊断工作,难免会出现纰漏,从而导致误诊,影响病情的预防或治疗[1]。因此,研究心电信号的自动分类辅助诊断技术具有十分重要的意义,是实现可穿戴式健康监测系统的重要基础。

由于穿戴式心电传感器只能携带有限的电池能源,而心电信号的采集、处理、传输等都会消耗大量的能源,低能耗便成为设计这类系统需要考虑的一个主要因素。近年来出现的压缩感知(Compressed Sensing)理论可以为可穿戴式健康监测系统低能耗工作方式的要求提供了有利条件[2-4]。在传感器节点端,它使用合适的测量矩阵对原始心电信号进行压缩采样,并将压缩后的心电数据发送至远程监控端。当远程监控端获得这些压缩数据后,需要通过重构算法恢复出原始心电信号,从而为医生提供用于分析和诊断的心电信号。

在参考文献[5]中,作者提出了一种基于压缩感知理论的K-means聚类算法,它结合K-奇异值分解方法对健康监测系统中的心电信号进行分类。该算法的分类准确度达到了99.98%,与现有的一些分类方法相比,分类准确度提高了11%。此外,与现有的一些聚类算法相比,该算法通过提高分类性能,使得聚类能耗降低了13%。Fira等[6]设计了一种ECG信号压缩感知方法,该方法使用具有标准正态分布的随机矩阵作为测量矩阵,对ECG信号进行线性测量,得到压缩测量值。然后使用基于心脏病理特定字典的基追踪算法重构信号,并且重构的ECG信号通过K-最近邻分类器(KNN)算法对8种类别的心脏疾病进行分类。实验结果表明,当重构PRD时为0.87时,该方法可以获得91.77%的分类正确率。

图1 穿戴式心电信号直接特征提取与分类方法框图

但是,上述这些方法都需要在进行分类之前,先使用重构算法恢复出原始心电信号,这可能会导致较高的计算复杂度高,不适合于具有实时性需求的可穿戴式健康监测系统。因此,我们尝试去研究是否能跳过信号重构这一步骤,在压缩域上直接对压缩后的心电信号进行特征提取与分类。经过研究我们发现这种思想是可行的,至少在某些应用中已经有相关研究成果。例如,文献[7]中,作者设计了一种基于粒子滤波的proof-of-concept跟踪器,其似然更新是基于smashed滤波器,该滤波器不经过重构这一阶段,直接估计相关性。当传感率为0.3时,跟踪器能收敛。文献[8]中,Braun等人检验了一种基于压缩数据执行分类任务的潜在技术。它通过采用一个随机的正交投影矩阵对MNIST手写数字数据进行压缩,然后再利用深度玻尔兹曼机对压缩数据进行训练。实验结果表明,相较于非压缩数据的0.99%错误率,这种方法在传感率为0.4时,能够获得1.21%的错误率。文献[9]中,GP Da等人提出了一种根据压缩心电信号进行心率估计的方法。它通过计算压缩心电数据和已知QRS模板的关系,从而实现在压缩域上检测QRS波位置。

基于上述研究基础,本文提出一种基于压缩域的穿戴式心电信号的特征提取与自动分类方法。跳过信号重构步骤,使用改进的主成分分析法在压缩域上直接对压缩后的心电信号进行特征提取,并基于最小二乘支持向量机半监督学习方法实现心电信号的自动分类。研究选用MIT-BIH心律失常数据库中的心电数据验证所提出方法的有效性。

1 压缩感知模型

压缩感知理论[10-12]突破了奈奎斯特定理对采样频率的限制,以远小于奈奎斯特的采样率对信号进行线性观测,得到的观测值数量远小于原始信号长度。

假设有一个长度为N的信号x,我们用一个M×N(M≪N)观测矩阵Φ对其进行线性变换,得到了线性观测值y:

y=Φx

(1)

式中:y∈RM×1是一个M维的向量,从而使得信号从N为降低为M维,但是,这少量的M个观测值却包含了原始信号x的主要信息。

2 心电信号直接特征提取与分类方法

2.1 整体设计

心电信号在压缩域上的直接特征提取与分类方法的原理如图1所示。首先,传感器节点采样编码端使用观测矩阵Φ对预处理后的心电信号x进行压缩采样,再通过无线网络将压缩后的测量值y传输至远程监测端。当远程监测端接收到心电信号的压缩测量值后,用改进的主成分分析方法直接对心电压缩值Y进行特征提取,得到心电信号的特征向量。然后设计一种最小二乘支持向量机半监督学习分类器,将所提取的特征向量作为分类器的输入,对不同类型的心电信号进行分类,最后得到分类结果。

2.2 改进的主成分分析特征提取法

心电信号主要包括P波、QRS波、T波和U波等几个特征波形。除QRS波之外,其他特征波并不一定出现在所有心律失常的心拍中,例如,室性早缩一般没有P波。因此,为了使特征提取方法具有鲁棒性,本文主要对QRS复波进行特征提取。通常,心电信号的特征提取可以在时域上进行。最常用的就是提取一些能直接从心电信号的波形上测量的特征参数,比如QRS波的宽度、RR间期等。但是,这些特征波形的形态特征参数仅包含了心电信号的部分信息,无法对整个心电信号进行充分的表示,造成其他有效信息的遗漏,使得最后分类的准确度受到严重的影响。因此,除了提取QRS波的一些常用的特征参数外,还将所有QRS波的采样数据应用于心电特征提取与选择中。但这些采样数据的数量通常比较多,因此,使用主成分分析方法PCA(Principal Component Analysis)对QRS波的采样数据进行主成分选择。

主成分分析法[13]是通过正交变换将原始数据转换成一组主成分的统计过程。这些主成分的数量小于原始变量的数量,但是能够表示原始数据的主要信息。这种变换可以使得第一主成分具有最大可能的方差,第二主成分具有次大方差,以此类推。

假设原始数据为X={x1,x2,…,xN},每个样本向量xi的维数为p,对样本进行标准化:

(2)

式中:

(3)

求相关矩阵R:

(4)

对R的特征方程|R-λIp|=0进行求解,得到p个特征根λ。再根据如下方差标准选取m

(5)

式中:中,φ为事先设定的常数。

对每个特征值λi求得相应的特征向量εi,并将特征向量转换为相应的主成分ui(i=1,2,…,m):

(6)

式中:u1为第一主成分,u2为第二主成分,依次类推,um为第m主成分。

由此可见,主成分分析法是根据方差的大小来选择主成分,但是,测量值的方差越高并不能代表可以更好地区分两组数据。例如,在两组数据中,其中一组数据的宽分布可能与另一组几乎完全重叠。这种情况也导致很大的差异,但是无法对数据进行分类。因此,本文对主成分分析方法进行了改进,在提取心电信号特征时,并非选择方差最大的主成分用于数据分类。相反,我们先计算两类数据的每个主成分的均值,然后再通过特殊主成分的方差对这些均值之差进行标准化。最后,根据标准化的结果选择值最大的多个主成分,将其和QRS波的宽度以及RR间期一起组成心电信号最终的特征向量,并以此作为分类器的输入。改进的主成分分析特征提取方法流程图如图2所示。

图2 改进的主成分分析特征提取法

2.3 基于最小二乘支持向量机半监督学习的心电信号分类方法

在很多实际问题中,难以对数据做标记,只有少量的带有标记的样本,因此,本文在最小二乘支持向量机(LS-SVM)算法的基础上,提出一种半监督学习分类方法(简称为SLS-SVM),通过在LS-SVM有监督的分类算法中加入对不带标记样本的训练学习,来增强分类效果,并将其应用于心电信号的分类中。传统的LS-SVM算法只是使用带标记的样本来寻找一个具有最大间隔的分隔超平面,使其能够最大程度地将待分类的两种类型的样本数据分隔开。而本文提出的最小二乘支持向量机半监督学习分类方法SLS-SVM则通过同时利用带标记的样本和不带标记的样本来寻找这个最佳的分隔超平面。

(7)

式中:由(w,b)可以确定一个分隔超平面;C和C*是由用户指定的参数,分别用于调节有标记样本和无标记样本在训练过程中的影响。

SLS-SVM算法的主要思想是:在训练学习过程中,对LS-SVM算法得到的分隔超平面不断地进行修改,通过切换该超平面两侧的一些不带标记示例的可能标记值,使其在带标记和不带标记的所有训练样本上间隔最大化,从而使得目标函数值减小,并得到一个新的分隔超平面。该算法主要可以分为以下几个步骤:

步骤1:设置参数C和C*,使用LS-SVM算法对带标记样本(x1,y1),…,(xn,yn)进行训练学习,得到一个初始的分类器,同时,对具有正标记值的不带标识的示例的数量numabnorm进行设置。

步骤3:重新对样本进行训练,获得一个新的分类器,由于此时不带标记样本的标记值很可能不够准确,所以C*的值要设置为比C小。然后,找到具有不同标记值的一组测试示例,并对其标记值进行交换。使得式(7)中的优化目标函数值最大程度减小,从而保证尽可能地减小对不带标记样本的分类误差。重复这一步骤,直到不满足条件结束。

3 实验与结果

3.1 评价指标

为了评估本文所提方法的性能,采用以下几个指标:

①灵敏度(Sensitivity):指所有真实目标心拍被正确检测出来的百分比。定义为:

(8)

式中:TP(True Positives)称为真阳性,代表真实目标心拍被正确检测出来的个数。FN(False Negatives)称为假阴性,代表非目标心拍被错判为真实目标心拍的个数,即漏诊的个数。

②特异度(Specificity):指所有正确检测出非目标心拍的百分比。定义为:

(9)

式中:TN(True Negatives)称为真阴性,代表非目标心拍被正确检测出来的个数。FP(False Positives)称为假阳性,代表真实目标心拍被错判为非目标心拍的个数,即误诊的个数。

③准确度(Accuracy):指正确检测出目标心拍和非目标心拍的总百分比。定义为:

(10)

3.2 实验设置

本文采用MIT-BIH心律失常数据库中的心电数据进行实验,对其中的两类典型心电信号进行分类,分别是:正常窦性信号(Normal,N)和房性早搏(APC,A)。实验中,以心电信号的每个心拍的R波位置为基准,取其前0.3 s和后0.3 s的心电数据组成原始的样本数据集。由于48组心电数据的样本数量太多,为了方便处理,对其进行抽样,得到一个样本总数为的中等规模的样本集,并在该样本集各类心电数据中随机抽取2/3的数据组成训练样本集,剩下的1/3的数据组成测试样本集。各样本集的分布如表1所示。

表1 MIT-BIH实验样本集数据分布

3.3 实验结果与分析

为了验证改进的主成分分析特征提取方法的性能,选用小波变换和主成分分析法作为对比算法。表2给出了分别基于小波变换(WT)、主成分分析法和改进的主成分分析法这3种不同的心电信号特征提取方法的分类结果。

表2 3种特征提取方法的分类结果比较

从表2可以看出,在训练样本集上使用SLS-SVM算法进行训练后,对测试样本集进行分类测试,基于改进PCA与SLS-SVM的心电信号分类方法的分类准确度分别为99.65%和99.54%,而基于WT与SLS-SVM的心电信号分类方法的分类准确度只有50.27%和49.90%,基于PCA与SLS-SVM的准确度分别为93.27%和92.48%。显然,改进PCA+SLS-SVM方法的分类准确度比WT+SLS-SVM和PCA+SLS-SVM方法的都要更高,而且这3种方法的灵敏度和特异度也遵循这一规律。因此,对于SLS-SVM分类器,用改进主成分分析方法所提取的特征更有利于心电信号的分类。

表3给出了各种主成分特征数量情况下的分类结果。由该表可以看出,当主成分特征的数量大于或等于4时,分类准确度基本都保持99%以上。因此,本文将使用改进主成分分析法得到的前4个主成分,以及QRS波宽度和RR间期2个特征,共6个特征构成心电信号的特征向量,作为分类器的输入。

表3 不同主成分特征维度的分类性能比较

为了检验本文所提出的SLS-SVM算法的分类性能,将其与其他几种心电信号分类方法进行比较:支持向量机SVM、最小二乘支持向量机LS-SVM、逻辑回归LR和人工神经网络ANN算法。先使用改进的PCA方法对实验样本集中的心电信号进行特征提取,然后分别采用SLS-SVM、SVM、LS-SVM、LR和ANN算法对训练样本集进行训练后,再对测试样本集中的心电信号进行分类,实验结果如表4所示。

表4 5种心电信号分类方法的分类性能比较

由表4可知,本章所提出的SLS-SVM算法的分类准确度最高,其分类性能相较于其他算法SVM、LS-SVM和LR更优,甚至要比基于神经网络ANN的心电信号分类器都要有更好的表现,这说明SLS-SVM算法在未标记训练样本的帮助下,获得了很好的分类效果。

为了验证本文所提出的压缩域上心电信号直接特征提取与分类方法的性能,将其与在非压缩域上特征提取与分类方法进行对比。表5给出了当训练样本集中有80%的未标记样本时,在不同传感率情况下两种分类方法的灵敏度、特异度和准确度。

表5 各种压缩比下的分类结果对比

由表5可知,传感率越大,两种方法的准确度均越高,也就是说,随着传感率的增加,分类器的性能越来越好。例如,当传感率SR为0.4时,两种方法的平均准确度分别为85.13%和91.86%;当传感率SR为0.8时,平均准确度分别为98.23%和98.94%。正如我们所预料的,与在非压缩域上的分类性能相比,SLS-SVM分类器在压缩域上的分类性能有所下降。例如,当传感率SR为0.5时,在非压缩域上特征提取与分类方法的准确度为96.11%,而在压缩域上直接特征提取与分类方法的准确度为92.39%。这是因为在压缩域上分类方法是对压缩后的心电信号直接进行特征提取与分类,跳过了心电信号重构步骤。然而,我们也很容易发现:随着传感率的增加,压缩域上分类的准确度非常接近于在非压缩域上的分类结果。例如,当传感率SR为0.7,0.8和0.9时,压缩域上分类的平均准确度分别为98.05%,98.23%和98.41%,与非压缩域上分类的平均准确度98.76%,98.94%和99.12%相差非常少。因此,我们可以得出结论,当传感率为0.7时,与在非压缩域上的心电信号分类准确度98.76%相比,本章所提出的压缩域上直接对压缩后的心电信号进行特征提取与分类方法的准确度可以达到98.05%。也就是说,与在非压缩域上对重构后的心电信号进行特征提取与分类的结果相比,虽然文章提出的压缩域上分类方法的准确度稍有些下降,但却可以压缩掉约30%的心电数据,非常适合于具有低功耗和实时性需求的可穿戴式健康监测系统。

4 结论

本文提出一种心电信号的直接特征提取与自动分类方法,不需要重构出原始心电信号,直接在压缩域上对压缩后的心电数据进行特征提取与分类。通过对MIT-BIH心律失常数据库中的心电数据进行仿真实验,结果表明,与在非压缩域上心电信号分类准确度相比,虽然分类的准确度稍有些下降,但却可以压缩掉约30%的心电数据。也就是说,在保证分类性能下降非常少的前提下,心电信号的数据量大大地减少,有效提高了自动分类的效率,非常适合于资源受限的可穿戴式健康监测系统。

猜你喜欢
电信号心电准确度
基于联合聚类分析的单通道腹部心电信号的胎心率提取
心电向量图诊断高血压病左心室异常的临床应用
基于非接触式电极的心电监测系统
穿戴式心电:发展历程、核心技术与未来挑战
基于Code Composer Studio3.3完成对心电信号的去噪
更正启事
幕墙用挂件安装准确度控制技术
基于随机森林的航天器电信号多分类识别方法
动态汽车衡准确度等级的现实意义
一款基于18位ADC的高准确度三相标准表的设计