卢清 李秋生 叶莉华 许德鹏
摘 要:多重分形理论只是对分形体几何支集上任意一点观察到的奇异指数作统计分析。多重分形关联研究的是具有不同奇异指数的两点之间的空间关联特性,是对多重分形单点统计的推广,两者特性具有一定的互补性。为此研究了一种多重分形及其关联特征进行组合的心电信号分类方法。首先对四种类型心电信号的多重分形及其关联特性进行分析并获得各自的特征。然后结合概率分布以选择合适的特征进行组合,组合后的特征送入支持向量机中分类。该方法在MIT-BIH心律失常数据库上进行了测试,经过20次训练测试得到97.90%的平均准确率。相比独立运用多重分形特征,该方法获得的分类准确率有明显提高。
关键词:心电分类; 多重分形; 多重分形关联; 支持向量机
中图分类号:TP911.7 文献标志码:A 文章编号:1001-3695(2023)10-020-3016-06
doi:10.19734/j.issn.1001-3695.2023.02.0082
ECG signal classification based on combination of multifractal and its correlation features
Lu Qing, Li Qiusheng, Ye Lihua, Xu Depeng
(School of Physics & Electronic Information, Gannan Normal University, Ganzhou Jiangxi 341000, China)
Abstract:The multifractal theory only performs statistical analysis on the singular exponents observed at any point on the geometric support of the fractal body. Multifractal correlation studies the spatial correlation characteristics between two points with different singular exponents. It is a generalization of single point statistics in multifractals. The two characteristics have a certain degree of complementarity. This paper investigated a method that combined the multifractal and its correlation features in the electrocardiogram (ECG) signal classification. Firstly, the method analyzed the multifractal and correlation characteristics of four types of ECG signals and obtained their respective features. Then it combined the probability distribution to select appropriate features for combination. The combined features fed into a support vector machine (SVM) for classification. This method tested on the MIT-BIH arrhythmia database and achieved an average accuracy of 97.90% after 20 training tests. Compared to independently using multifractal features, this method significantly improves the classification accuracy.
Key words:electrocardiogram(ECG) classification; multifractal; multifractal correlation; SVM
0 引言
心電信号(ECG)的分类技术在医学诊断、医学造影、院外监护等方面有着紧迫的需求[1,2]。它产生于以下需求:a)ECG信号类型纷繁、差异极大,同种类型不同个体、同一个体不同时间的ECG信号都有较大的区别,即使经验丰富的医生也极易产生误识、漏检、出错等现象;b)患有隐匿性心脏疾病的患者需要院外家庭进行心电监护,对病情进行预警和提醒;c)动态心电图长时间的记录保存着大量的心电图信息,它需要借助计算机自动识别技术以减少视觉检测的过程,提高医生的诊断质量。近年来,国内、外众多学者对心电自动分类技术进行了深入的研究[3,4],研究方向主要偏向于两种。a)手动提取特征,从时域和频域入手。时域方法只是简单地提取QRS波、T波、P波的振幅、持续时间、斜率和面积等参数信息,而不能探索信号的其他特征。频域方法包括小波变换[5]、经验模态分解[6,7]等。小波变换方法的分解层数和小波函数的选择将影响结果,而经验模态分解算法出现模态混叠的问题。b)使用神经网络,如卷积神经网络(convolution neural network,CNN)、长短期记忆(long short-term memory,LSTM)神经网络和生成对抗性网络(generating adversarial network,GAN)[8]等。Shu等人[9]提出了LSTM和CNN方法来检测四种类型的失常心律,即心房早搏(atrial premature beat,APB)、左束支传导阻滞搏动(left bundle branch block beat,LBBBB)、右束支传导阻断搏动(right bundle branch block beat,RBBBB)和心室早搏(premature ventricular contraction,PVC)。神经网络的使用虽然不需要人为主观地提取特征,但当数据量小时,很难学习到特征,而当数据集量大时,需要长时间的训练,这不利于实时检测。
心电信号是一种复杂的非线性混沌系统,以上方法都无法揭示ECG信号的非线性动力学本质。为了描述整体和部分之间的自相似性,文献[10,11]通过引入广义维数和多重分形谱,提出了分形几何的概念。许多学者将多重分形引入湍流、海浪和雷达回波领域[12,13]。非线性和混沌现象的ECG信号也可以通过分形理论来描述[14,15]。Wang等人[16]从多重分形方法中提取赫斯特指数,使用多重分形去趋势分析(multifractal detrended fluctuation analysis,MF-DFA)、多重分形去趋势移动平均互关联分析(multifractal detrended moving average cross-correlation analysis,MF-XDMA)和结合支持向量机(support vector machine,SVM)对APB和正常窦性心律(normal sinus rhythm,NSR)进行分类。叶莉华等人[17]采用基于集合经验模式分解(ensemble empirical mode decomposition,EEMD)和多重分形分析实现了ECG分类。多重分形理论只能通过对支集上任意点观测到的奇异指数进行统计分析,是分形体的宏观描述。多重分形关联(multifractal correlation,MFC)是多重分形的推广与深化,是分形体的微观描述。它描述了分形体几何支集上相距为d的两个点,观测到两个给定奇异指数的概率的大小,同时考虑奇异指数的空间关联性特征。多重分形关联分析在多重分形分析基础上,提供了分形体其他有效的微观特征。 文献[18,19]首先研究了多重分形关联理论,并将其应用于湍流研究。文献[20~22]将多重分形关联理论引入到海杂波特性分析和背景中微弱目标的检测。到目前为止,将多重分形关联理论应用于ECG信号分类的文献较少。
多重分形关联谱是从多重分形谱的基础上得到的,两者特性具有一定的互补性。因此,本文将研究一种多重分形及其关联特征进行组合的ECG信号分类方法,希望分类性能得到进一步提升。
1 多重分形及其关联分析理论
多重分形关联理论基于多重分形理论,因此其参数的计算与多重分形参数密切关联。
1.1 多重分形理论
多重分形描述了几何体在不同分形尺度下的生长过程。将几何体划分为多个分形子区域,子区域的面积记录为ε,子区域的总数记为Nε,第i个子区域的分布概率记为Pi(ε),则Pi(ε)与ε之间的关系为[10]
2 ECG信号的多重分形及其关联特性分析
基于多重分形及其关联特征组合的ECG信号分类的过程如下:首先对ECG信号进行预处理,然后对预处理后的信号进行多重分形分析及其关联特性分析,以获得各自的特征。结合概率分布以选择适合的特征向量。这两个特征向量进行特征组合,组合后输入分类器中进行分类。分类器是基于粒子群优化的支持向量机(SVM based on the particle swarm optimization,PSVM)。
2.1 数据预处理
数据来自MIT-BIH心律失常数据库[23]。该数据库可在PhysioNet官网免费获取,包含48条持续时间约30 min的双导联ECG信号记录,采样频率为360 Hz。该数据库总共提供了15种类型的心拍,除正常搏动(normal beat,NB)、LBBBB、RBBBB、PVC和起搏搏动(paced beat,PB)五种类型外,其余10种类型的心拍数量较少且分散。PB是患者在植入心脏起搏器后记录的信号,一般实验时不考虑PB。因此,选用NB、LBBBB、RBBBB和PVC用于分类。
将每条ECG信号记录分割成许多360个采样点的心拍。通过专家提供的注释文件来获得心拍类型和R峰的位置。然后截取R峰值位置的前100个采样点和后150个采样点,总共250个采样点为一个心拍。剩余的110个采样点将舍弃,因为在一个周期的开始及结束期间,ECG的波形几乎是直线。相同类型的心拍保存在同一个数据子集中,共保存了四种类型的心拍。为使数据分布均衡,避免分类中的偏差,實验中四种类型的心拍数量相同。所选ECG信号的记录和数量如表1所示。数据集的大小为20 000个心拍。随机打乱数据集的索引顺序,之后截取前10 000个索引对应的心拍为训练集,剩余的10 000个心拍为测试集。每次实验,每种类型的ECG信号的训练集和测试集的数量都不同。但这四种类型的训练集、测试集的总数是固定的,各为10 000个。这样保证了该算法的鲁棒性。
2.2 多重分形及其关联特性分析
多重分形关联分析的是多重分形相距为d的两点统计特性。ECG信号具有多重分形特性是其分析的前提,因此需要验证ECG信号的多重分形特性。
预处理后的四种ECG信号及其多重分形特性如图1所示。在图1(b)中,对于NB,质量指数τ(q)和q之间的关系近似线性,而其他三种ECG信号是凸函数关系。在图1(c)中,广义维数谱D(q)随着q从-40到40的变化而变化。特别是RBBBB的D(q)值变化最快,而NB的D(q)值变化最慢。在图1(d)中,四种ECG信号的多重分形谱f(σ)都是单峰的。同时,NB形状是一个右对称的钩状,呈负偏斜。RBBBB和PVC形状为左对称钩状,呈正偏斜。LBBBB的形状几乎是正态的钟形。结果表明心电信号具有多重分形特性,并且四种ECG信号的每种谱都有差异。
上述表明ECG信号具有多重分形特性,在此基础上继续分析ECG信号的多重分形关联特性。其特性是在参数ω=0.5的情况下进行的。图2和3给出了RBBBB和PVC的多重分形关联特性。从图2(a)、3(a)看出,在中间函数min{(q′,q″),1}的三维图中,整个平面上(q′,q″)分为两个区域。这两个区域是区域1(q′,q″)<1和区域2(q′,q″)>1。区域2的对应高度为1,在三维图中对应一个平台面。点(0,0)是一个鞍点。中间函数关于q′=q″平面对称。而相应的等高线图则关于直线q′=q″对称,图2(b)、3(b)是对应的关联矩指数(q′,q″,ω)。此时的(q′,q″,ω)已由多重分形分析中的矩指数τ(q)的二维曲线变为三维曲面。图2(c)、3(c)是相应的MFC谱,它关于平面σ′=σ″也是对称的。谱的中心到两翼有一个急剧过渡,刚好对应于尺度区域的相变。距离单元中,ECG信号的存在会引起MFC谱相对稳定的变化。与图2(c)相比,图3(c)的MFC谱有所收缩,其奇异指数范围、曲面纹理、相变、谱重心都有明显的差异。NB和LBBBB的多重分形关联特性同理分析。图4给出了四种ECG信号的MFC谱,在σ′=σ″平面的切片曲线。可见奇异指数的宽度及切片曲线顶点、高度等都不同。
3 ECG信号的多重分形及其关联特征提取
3.1 定义多重分形及其关联特征
结合相关文献[13,24],从质量指数τ(q),广义维数谱D(q)和多重分形谱f(σ)中定义了六个特征。从中选择合适的特征作为多重分形特征向量。
1)质量指数的对称度[13]
3.2 多重分形及其关联特征的选择
概率分布能描述参量的遍布情况。本文为选择合适的特征,利用了概率分布来分析四种ECG信号(数量如表1所示)的多重分形及其关联特征的分布。
图5是上述定义的六个多重分形特征的概率分布。图5(b)(d)(f)表明,RD,Δf2和skewσ在NB和PVC之间具有良好的分类能力。LBBBB与PVC,NB与RBBBB的重合度也很小。图5(c)显示Δf1对NB具有一定的分类能力。图5(a)(e)中,四个ECG信号中的Rτ和Rσ都几乎重叠,分类能力较弱。因此在特征选取中,舍弃Rτ和Rσ,选择RD,Δf1,Δf2和skewσ四个特征为多重分形的特征向量。然而,RBBBB和PVC,NB和LBBBB之间存在许多重叠区域,容易被误判,有必要从分形体中获得更多不同的特征。通过多重分形关联方法获得的特征将弥补这个缺陷。
图6是上述定义的六个多重分形关联特征的概率分布。图6(a)(b)(d)表明,R0、R和skewf对NB和LBBBB两类信号之间具有较好的分类能力。从图6(a)(d)中看出,PCV和NB的重叠面积非常小,RBBBB和PVC的重叠面积也不多,表明R0和skewf对这两种情况具有较好的分类能力。图6(e)中,PVC与其他三种类型的重合度较小,LBBBB与NB、RBBBB两类ECG信号几乎都没有重合区,表明Rf的分类能力较好,对这四种ECG信号都具有更好的分类能力。图6(c)中,skewσ′非常小,对四种ECG信号的区分能力较弱。图6(f)中,NB、RBBBB和PVC有许多重叠区域,可见skewσ′和S的分类能力较差。因此在特征选取中舍弃skewσ′和S,选择R0、R、skewf和Rf四个特征作为多重分形关联的特征向量。可见,这四个特征正好解决了多重分形特征分类中遇到的问题,弥补了缺陷。如果将多重分形关联特征组合到多重分形特征中,将提高分类精度。这进一步说明,多重分形关联是多重分形的推广,它可以从分形的局部部分挖掘到其他侧面特征。两者特征是一种互补关系。
4 实验结果和分析
本文采用了PSVM作为分类器。由于SVM分类器采用默认的网格优化来获得惩罚系数c和核函数的半径g。但网格优化对内核选择很敏感。本文使用粒子群优化算法[25]来获得最优c和g,粒子群算法可调参数较少,并且不需要选择核函数,种群规模设置为10,速度和种群更新系数均设置为0.6,进化次数设置为15。这些值都进行了适当选取。
4.1 实验的评估指标
实验验证将确定所提方法是否达到了足够的精度。混淆矩阵是一种常用的验证技术。计算以下评估指标:准确度Acc、敏感度Sen和阳性预测值Ppv[26]。
准确度是所有预测正确的心拍与心拍总数的比例:
4.2 多重分形特征组合不同的关联特征及参数ω对总性能的影响
将上述选取的多重分形特征向量和关联特征向量进行组合,并把PSVM作为分类器。图7给出了不同的多重分形关联特征组合到多重分形特征向量中对分类准确度的影响。设四个多重分形特征被记为A向量,数字1、2、3和4分别代表R0、R、skewf和Rf。单独利用多重分形特征A,分类准确率为95.93%,多重分形特征与单个关联特征的组合方法都至少提高了1.05%的分类性能,尤其Rf的組合对分类贡献最大,提高了1.59%。而本文利用的多重分形及其四个关联特征进行组合的方法实现了最高的分类准确率97.81%。
本文方法是在参数ω=0.5的情况下进行的。下面讨论ω的不同取值对最终分类结果的影响。由图8可看出,不同ω取值对结果影响不大,说明标度区域相变所引起的多重分形关联谱的边缘跳变,并未影响分类结果。其原因是不同类型的ECG信号的MFC谱的差异同时体现在区域1和2这两个区域,而ω的不同取值只是对这两个区域进行重新划分。它们之间的差异还是稳定存在的,从而使得多重分形及关联特征进行组合后,其分类的结果基本不受ω取值的影响。
本文方法的混淆矩阵和计算指标,如表2所示。NB是最容易区分的,其分类结果最好,而PVC的分类结果最差。42个PVC误判为LBBBB,29个PVC被误判为RBBBB。从图6(b)(c)和7(d)中看出,与LBBBB和RBBBB相比,PVC的RD,Δf1和Rf与其他三种ECG信号重叠的面积最多,最容易误判。四种心电信号单次实验的分类准确率为97.81%。阳性预测值从高到低依次是NB、RBBBB、LBBBB和PVC,同理敏感度从高到低依次是为NB、LBBBB、RBBBB和PVC。这表明,其他三种类型被误判为PVC的概率很高。PVC的识别能力最弱,但仍能达到95%以上。
4.3 不同方法及同类研究的性能比较
由于数据集是随机打乱的,需要多次重复实验以计算平均分类准确率,这里进行了20次实验。相同ECG数据集的条件下,与以下不同的方法进行了比较。运用独立的多重分形特征并使用PSVM的方法称为MFPSVM;将多重分形及其关联特征进行组合,并使用网格SVM的方法表示为CSVM;将多重分形及其关联特征进行组合,并使用KNN的方法表示为CKNN。文献[26]使用奇异值分解和相异性分析。将这两种方法获得的特征组合在一起,使用PSVM的方法称为SPSVM。 如表3所示,本文方法的平均准确度为97.90%,平均敏感度为97.95%,平均阳性预测值为97.99%。其分类平均准确度比MFPSVM高约2.05%,原因为多重分形关联谱是在计算多重分形谱的基础上得到的,两者特性具有一定的互补性。本文方法比CSVM高约0.41%,比CKNN高约2.86%,比SPSVM高约3.22%。
將本文方法与同类研究进行比较,如表4所示。在文献[27]中,从44条记录中选择42 773个心拍进分类,并采用三级融合包括特征层融合、决策层融合及得分层融合。尽管获得了稍高的分类率,但其特征描述及总体过程都复杂。文献[8]使用了Transformer和卷积的GAN。该模型需要很长时间来训练,这不利于实时检测。文献[16]采用了分形理论中的赫斯特指数作为其特征,样本数量只有121个,分类类型只有2种。文献[17]中数据只来自15条记录,训练集与测试集的样本数量比为4∶1,训练的数据较多,因为筛选了噪声较多的心拍为对象,所以使用EEMD能增强数据,EEMD的平均次数100次,耗时长,这些都不利于实时检测。与文献[17]相比,本文数据来自38条记录,心电信号未筛选,包含的噪声强度大小不等,更加丰富多样,训练集与测试集的样本数量比例较低,为1∶1,用于测试的数据更多,在不需要EEMD前提下,获得了更高的准确率,其只有8个特征用于分类,特征个数远远少于文献[27]。本文方法具有可观的优点和性能。
5 结束语
本文提出了两种非线性动力学分析即多重分形及其关联分析来研究ECG信号的分类。将多重分形关联理论应用于ECG信号分类的文献很少,本文很好地应用并研究了ECG信号的多重分形及其关联特性,关联特性补充了从宏观角度中获得的多重分形特性,利用概率分布分析多重分形及其关联特征,并据此选择各自合适的特征向量。然后在特征层组合该两个特征向量,以分类四种具有代表性类型的ECG信号,即NB、LBBBB、RBBBB和PVC。其讨论了多重分形特征组合不同的关联特征及参数ω对性能的影响。最后总共只有8个特征用于ECG分类,经过20次训练测试,得到97.90%的平均准确率。与单独运用多重分形特征相比,多重分形及其关联特征组合的分类准确率有较高的提升,且算法运算量增加不大。本文中的特征是人为定义的,因此可能存在更好的多重分形及其关联特征。另外心拍截取时,截取长度是固定的,未考虑ECG信号的变异性。这些问题需要在后续研究中加以考虑。
参考文献:
[1]Abhinandan R, Shobhit S, Dogra N, et al. Automated classification of multiple cardiovascular diseases from ECG signal[J].International Journal of Engineering and Technical Research,2020,9(5):445-448.
[2]李超.家庭式医疗健康监护系统的研究与实现[D].成都:电子科技大学,2020.(Li Chao. Research and implementation of family medical health monitoring system[D].Chengdu:University of Electronic Science and Technology of China,2020.)
[3]Mondéjar-Guerra V, Novo J, Rouco J, et al. Heartbeat classification fusing temporal and morphological information of ECG via ensemble of classifiers[J].Biomedical Signal Processing and Control,2018,47(1):41-48.
[4]Houssein E H, Kilany M, Hassanien A E. ECG signals classification:a review[J].International Journal of Medical Engineering and Informatics,2017,5(4):376-396.
[5]Afsar F A, Arif M. Robust electrocardiogram beat classification using discrete wavelet transform[C]//Proc of International Conference on Bioinformatics & Biomedical Engineering.Piscataway,NJ:IEEE Press,2008:1867-1870.
[6]Hotradat M, Balasundaram K, Masse S, et al. Empirical mode decomposition based ECG features in classifying and tracking ventricular arrhythmias[J].Computers in Biology and Medicine,2019,112:article ID 103379.
[7]Dutta S, Chatterjee A, Munshi S. Correlation technique and least square support vector machine combine for frequency domain based ECG beat classification[J].Medical Engineering & Physics,2010,32(10):1161-1169.
[8]Xia Yi, Xu Yangyang, Chen Peng, et al. Generative adversarial network with transformer generator for boosting ECG classification[J].Biomedical Signal Processing and Control,2023,80:article ID 104276.
[9]Shu L O, Ng E, Ru S T, et al. Automated diagnosis of arrhythmia using combination of CNN and LSTM techniques with variable length heart beats[J].Computers in Biology & Medicine,2018,102:278-287.
[10]Grassberger P. Generalized dimensions of strange attractors[J].Physics Letters A,1983,97(6):227-230.
[11]Hentschel H G E, Procaccia I. The infinite number of generalized dimensions of fractals and strange attractors[J].Physica D,1983,8(3):435-444.
[12]Yang Dixiong, Zhang Changgeng, Liu Yunhe. Multifractal characte-ristic analysis of near-fault earthquake ground motions[J].Soil Dynamics & Earthquake Engineering,2015,72:12-23.
[13]Li Qiusheng, Xie Weixin, Huang Jingxiong. Multifractal spectrum features based classification method for aircraft[C]//Proc of IET International Radar Conference.2016:1-6.
[14]Mishra A K, Raghav S. Local fractal dimension based ECG arrhythmia classification[J].Biomedical Signal Processing & Control,2010,5(2):114-123.
[15]Sankhari S. Analysis of multifractal behaviour of electrocardiograms:DFA method[J].ESRSA Publications,2013,2(6):3050-3055.
[16]Wang Jian, Jiang Wenjing, Yan Yan, et al. ECG classification using multifractal detrended moving average cross-correlation analysis[J].International Journal of Modern Physics B,2021,35(32):article ID 2150327.
[17]葉莉华,李秋生,卢清.基于EEMD与多重分形的心电信号特征提取与分类[J].信号处理,2023,39(1):143-153.(Ye Lihua, Li Qiusheng, Lu Qing. Feature extraction and classification of ECG signals based on EEMD and multifractal[J].Signal Processing,2023,39(1):143-153.)
[18]Meneveau C, Chhabra A B. Two-point statistics of multifractal mea-sures[J].Physica A Statistical Mechanics & Its Applications,1990,164(3):564-574.
[19]John O, Meneveau C. Spatial correlations in turbulence: predictions from the multifractal formalism and comparison with experiments[J].Physics of Fluids A,1993,5(1):158-172.
[20]关键,刘宁波,张建,等.海杂波的多重分形关联特性与微弱目标检测[J].电子与信息学报,2010,32(1):54-61.(Guan Jian, Liu Ningbo, Zhang Jian, et al. Multifractal correlation characteristic of real sea clutter and low-observable targets detection[J].Journal of Electronics & Information Technology,2010,32(1):54-61.)
[21]Hu Junyong, Li Qiusheng, Zhang Qianli, et al. Aircraft classification method based on EEMD and multifractal correlation[J].Progress in Electromagnetics Research,2021,104:159-170.
[22]Fan Yifei, Tao Mingliang, Su Jia. Multifractal correlation analysis of autoregressive spectrum-based feature learning for target detection within sea clutter[J].IEEE Trans on Geoscience and Remote Sensing,2022,60:1-11.
[23]George M, Roger M. MIT-BIH arrhythmia database[DB/OL].(2005-02-24)[2022-11-05].https://www.physionet.org/content/mitdb/1.0.0/.
[24]Li Qiusheng, Xie Weixin. Target classification with low-resolution surveillance radars based on multifractal features[J].Progress in Electromagnetics Research B,2012,45(45):291-308.
[25]Poli R, Kennedy J, Blackwell T. Particle swarm optimization[J].Swarm Intelligence,2007,1(1):33-57.
[26]陈甸甸,赵治栋.基于奇异值和相异度的心电身份识别方法[J].计算机仿真,2016,33(2):427-432.(Chen Diandian, Zhao Zhidong. Identification method of ECG signal based on SVD and dissimilarity analysis[J].Computer Simulation,2016,33(2):427-432.)
[27]Golrizkhatami Z, Acan A. ECG classification using three-level fusion of different feature descriptors[J].Expert Systems with Applications,2018,114:54-64.
收稿日期:2023-02-15;修回日期:2023-04-04
基金項目:江西省教育厅科技项目(190772);江西省研究生创新专项基金项目(YC2021-S739)
作者简介:卢清(1987-),女(通信作者),江西吉安人,讲师,硕士,主要研究方向为信号处理(txlq0807@163.com);李秋生(1976-),男,江西赣州人,副教授,硕导,博士,主要研究方向为智能信息处理、目标识别与跟踪;叶莉华(1997-),女,江西赣州人,硕士研究生,主要研究方向为智能信息处理;许德鹏(1976-),男,江西赣州人,讲师,硕士,主要研究方向为计算机应用研究与实验.