黄润新,张烨菲,郭春伟
(1.杭州电子科技大学 电子信息学院,浙江 杭州 310000;2.杭州电子科技大学智慧城市研究中心,浙江 杭州 310000)
由于社会的信息化飞速发展,人们对隐私和安全也愈发重视。然而,现有的识别方法存在诸多安全隐患,因此更具安全性和可靠性的识别技术的研究具有极大的必要性。基于心电图(Electrocardiogram,ECG)的身份识别是一种新型生物识别技术。相对于基于密码或身份证等的传统识别方法,ECG 是一种生物信号,信号具有特异性,而且不会丢失、遗忘或者被伪造。相对于目前市场较为成熟的指纹识别、声音识别和人脸识别生物识别技术而言,基于ECG 的识别是活体检测,不会被记录或者复制,具有更高的安全性和可靠性。不仅如此,心电信号具有长期稳定的特性和因人体的内在结构不同具有唯一性,心电采集技术的日益成熟也使得其应用实际成为可能。目前,由于基于ECG 的识别技术存在实际泛化性能差和识别性能差等缺陷,它难以真正大规模应用于实际市场。
自从2001 年Biel[1]首次证明了基于ECG 的身份识别技术的可行性,国内外众多学者和研究对ECG 识别技术做了诸多探索。根据目前的心电识别技术的特征提取划分,可以主要分为基准点特征提取方法和非基准点提取方法两个主流。
基准点特征提取方法主要是准确提取ECG 波形中多个有效的特征点。这些特征点包含个体丰富的身份信息,如P 波、QRS 波和T 波的波峰、波谷和起止点,提取各特征点之间的宽度、幅度等作为识别特征,然后通过不同的分类器进行身份识别。2001 年,Biel[1]提取12 导联ECG 的信号的宽度、幅度、斜率、间期等用作识别的特征。2003 年,Kyoso 等[2]通过标准的二导联的ECG 信号,以二阶微分提取波形的间期作为识别特征,然后利用马氏距离分类取得了较高的识别率。2005 年,汪莉等[3]利用小波去噪法对ECG 去噪,并根据差分阈值法提取P 波、QRS 波、T 波的特征点,提取了P 波幅度、QT 间期等8 个特征用于身份识别。采用BP 神经网络和改进的RBF 神经网络对10 个人共40 个ECG信号进行识别,识别率分别为60%和100%。2006年,Chan 等[4]通过对手指心电进行放大、去噪后利用后向差分算法检测R 点,提取PQRST 复合波,以最大相关系数或者最小的小波距离作为识别准则。实验表明,将两种识别方式结合可得到90.8%的识别率。2009 年,Fatemian 等[5]采用小波变换的预处理过程去除心电信号中的噪声和心率变异影响,提取心电模板作为特征参数,通过PCA 或LAD 对心电模板进行降维,然后输入到分类器中进行判别。对MIT-BIH、PTB 心电数据库中的健康个体进行实验,识别率为99.61%。2012 年,Sidek 等[6]提出使用鲁棒性较强的标准化QRS 波在不同生理条件下进行ECG 身份识别。具体地,提取30 个健康测试者在上楼、下楼等6 种日常活动下的ECG 信号,以R 点为基准提取QRS 波,并对其进行标准化。实验表明,同一个体不同生理条件下的标准化QRS波十分相似,使用和不使用标准化QRS 波技术的识别率分别为96.1%和93.4%。2015 年,Arteaga-Falconi[7]介绍了基于二阶导数的心电图信号R 峰值检测算法。这样的R 峰检测技术提供较低的平均时间误差和不大的计算量,然而之前提出的基于二阶导数的方法灵敏度很低。在这项研究中,引入一个新的机制在峰值检测器阶段解决上述问题,比较现有的算法也是基于二阶导数,结果显示改进了敏感性,同时保持了一个较低的平均时间错误。
非基准点特征提取方法是根据研究人员的人为先验和主观采用某种转换的手段提取出信号的特征,避免了基准点定位算法的不稳定性,从而保证提取到信号的内在特征。2004 年,Plataniotis 等[8]提出了根据信号自相关和离散余弦变换提取出ECG的非基准点特征,最后采用欧式距离和高斯似然函数距离进行辨识,14 个检测个体识别准确率可以达到100%。2006 年,陈添丁等[9]提取单周期的单导联ECG 并正规化,结合遗传算法和粒子群优化算法调整优化动态ECG 模型参数,拟合逼近真实ECG,将模型参数作为特征通过传递神经网络和概率神经网络两种分类器进行辨识。实验表明,30 个个体的最高识别准确率可以高达96%。2008 年,Agrafioti 等[10]针对Plataniotis 等[8]所提出的方法,在数据降维之前先进行一个模板匹配,减少了搜索空间。实验表明,利用模板匹配、自相关系数和线性判别分析的身份识别率可以达到100%。2010 年,Li 等[11]提出基于时间和倒谱信息的自适应ECG 身份识别算法。在时域,对ECG 信号进行hermite 多项式展开,并采用支持向量机分类;在同态域,从信号中提取倒谱,并用高斯混合模型进行建模。实验表明,融合时间和倒谱信息的自适应ECG 识别算法的识别率达98.3%,对等错误率0.5%。2012年,王利等[12]将单周期ECG 进行小波包变换得到的子带能量、ECG 波形、子带波形作为分类特征,将QT 数据库中的104 个样本及采集的46 个健康人样本作为实验数据,识别率分别为92.31%和95.65%。2014 年,洪源泉[13]等人结合马氏距离、小波距离、谱能量距离和相关距离算法,提出加权系数智能匹配识别算法和完整的心电识别系统。该算法基于不同的距离计算,计算复杂度大。
针对目前主流的两类特征提取ECG 识别算法,基准点特征提取方法有特征提取算法简单、计算复杂度小的优点,但是由于特征点定位算法的不稳定性,难以准确实现特征点定位,提取的特征不具有可信性。非基准点特征方法可以有效提取信号的隐含特征,但是特征提取算法复杂度高,难以用于大规模识别应用场景。此外,两类提取算法还存在人为的先验和主观,提取的特征并不完全。根据两类算法的缺陷,本文提出一种结合时频分析方法和神经网络模型的新型ECG 识别算法。
本文提出的识别算法主要包括基于希尔伯特振动分解[14](Hilbert Vibration Decomposition,HVD)的时频表示和卷积神经网络(Convolutional Neural Network,CNN)两个部分,其中在ECG 完成预处理后,对分割的ECG 片段采用HVD 得到各分量的瞬时频率和瞬时幅度,进而得到其转换的时频表示二维图像,以时频表示图作为CNN 的输入,通过CNN 自适应提取出ECG 信号中时域、频域和能量的综合特征,最后送入Softmax 分类器分类得到最终的识别结果。
综上,本文提出的基于HVD 和CNN 的新型ECG 识别算法具有以下优点:
(1)引入HVD 获取ECG 的时频表示图,可以提取出ECG 时域、频域和能量的综合特征,避免了人为先验和主观带来的局限性;
(2)结合CNN 作为ECG 的时频表示图的特征提取器,在实现特征提取操作的同时实现降维,简化了传统识别算法的特征提取过程;
(3)时频表示图和CNN 结合可以简化计算量,实现心电识别在大规模识别场景的应用,提高了识别算法的泛化能力。
为了提高心电识别的识别性能和实际泛化能力,本文提出了一种基于HVD 和CNN 的心电融合特征识别方法。首先通过心电信号的去噪和盲源分割的预处理获取到特定时间长的心电片段,其次通过HVD 获取心电片段各分量的瞬时频率和瞬时幅度得到心电片段的时频表示图,再次通过CNN 提取出ECG 的时域频域和能量的融合特征信息,最后通过分类器得到识别结果。本算法的识别框图如图1 所示。本文后续内容将依次介绍数据与方法、分析与讨论和结论3 大部分。
图1 本文心电识别算法流程
本文采用的数据资源来源于麻省理工计算生理学研究室成员创建的开源软件PhysoNetz[15]中的。Tatiana Lugovaya 贡献的ECG-ID 数据库[16](数据库网址为:http://www.physionet.org/physiobank/database/ecgiddb/)。该数据库包含来源于90个不同的志愿者(44名男性和46 名)310 个单导联ECG 记录,每个记录是以12 位分辨率的±10 mV 范围的采集装置采集,采样频率500 Hz。每个人的记录数从2 ~20 不等,此处本文采用的是每人2 个心电记录。每个记录包含去噪和未去噪的ECG,本文采用的是未去噪的ECG 记录。
ECG 的预处理过程如图1 所示,包括ECG 去噪和盲源分割两个过程。
在心电信号的采集过程中,不可避免会受到外界不同程度的噪声干扰。噪声有工频干扰、呼吸噪声以及采集装置的位置差异和采集环境的差异等多种来源。根据噪声的不同类型可以分为工频噪声、肌电噪声、运动伪迹、基线漂移等[17],因此心电信号的去噪极其必要。
本文采用本课题组吕梦娇提出的基于重叠组收缩阈值(Overlapping Group Shrinkage,OGS)算法[18]和平移不变的消噪算法[19]用于ECG 消噪。算法的消噪过程如下:
(1)选取小波基函数和分解层数,对循环平移后的含噪ECG 进行小波变换,获取各层的小波分解系数中的噪声标准差;
(2)获取各层小波分解系数并且估计噪声的标准差;
(3)确定OGS 算法中相关参数和算法迭代轮次,通过对消噪后的系数采用经验维纳处理修正OGS 对于幅值较大的小波系数的削弱误差;
(4)对处理后的小波系数采用OGS 阈值进行重构,并且对重构的ECG 进行逆向循环平移处理,得到消噪后的心电信号;
(5)对多次循环平移消噪后的心电信号取平均值得到最终的消噪信号。
为了能达到特征提取和识别匹配的高效,获取到单周期ECG 的常用方式是通过基准点定位的方法检测出相关的特征点,其中最主要的是ECG 的R峰值点定位。但是,目前的相关检测算法尚未成熟,会出现误检或者漏检问题,且算法相对复杂。因此,本文采用一种盲源分割技术,过程如下:
(1)确定窗口长度:为保证截取的片段至少含有一个完整的周期,本文初始设定窗口的长度为2 s;
(2)随机截取:以固定的窗口长度在ECG 上随机截取,截取的数据长度随采样频率变化,例如假设采样频率为F,窗口时长为2 s,那么截取的窗口长度为2F。
盲源分割的操作相对传统的特征点定位分割算法,算法计算复杂度小,划分数据高效,且重叠的检测在不同的时域波形和频域特征可同时达到增强数据的效果。图2 是原始含噪ECG 信号和去噪后的分割的对比。可见,采用基于循环平移的OGS 去噪算法能很好地去除ECG 的噪声。
图2 ECG 信号预处理示例
目前较为常见的ECG 特征识别算法主要分为基准点特征和非基准点特征两类传统特征识别算法。为解决两类算法的弊端,本文采用时频分析方法将一维的ECG 信号转换为时频域和能量融合的二维时频表示图。本文采用的时频分析相对传统特征提取算法,通过将一维ECG 数据转换为二维时频表示图,将ECG 内在的时域频域和能量的融合特征信息以图谱展示,保证了提取的特征是融合的特征而非人为主观或者先验知识的部分特征。
1.3.1 HVD
本文采用的时频分析方法主要是基于HVD 算法。HVD 算法是一种非线性、非稳定信号的时频分析方法,并成功应用于机械振动信号分析[14]。ECG信号本质是心脏的机械振动产生,因此ECG 信号也应属于振动信号的一种。出于这种考虑,本文将HVD 应用于ECG 信号的时频分析。
根据HVD 理论,幅度和频率具有非平稳特性。ECG 信号由若干谐波构成,则ECG 信号X(t)可以表示为:
式中,M 是谐波数目,Al(t)、fl(t)和θl分别代表瞬时幅度、瞬时频率和第l 层谐波的初始相位。当M=2 且谐波信号平滑,用希尔伯特变换将X(t)转换为解析信号。这里考虑解析信号由两个谐波信号构成,每个谐波信号在时域具有慢的可变幅度和频率。这种情况下,信号可以被建模成各组分信号的加权和,每个信号都有其瞬时频率和幅度函数,即:
其中i 代表虚数,A(t)表示解析信号的瞬时幅值,f(t)代表瞬时频率,具体定义分别为:
等式(3)表明A(t)由缓慢变化部分和快速变化(振动)部分组成,这些幅度与两个分量的相对相位角的余弦函数相乘。f(t)由等式(4)中幅值最大的谐波分量对应的瞬时频率和快速变化的非对称振荡分量组成,其频率超出信号分量的范围。应用同步检测加低通滤波或者定积分方法,可以获取各分量对应的瞬时频率。以后者为例,假设A1>A2,f2>f1,在区间[0 T=1/(f2-f1)]可以证明积分为0[20]。通常,使用上述瞬时频率值作为参考频率,可以通过同步检测估计瞬时幅度和初始相位。该方法将初始谐波信号分别与两个参考正交信号相乘,同相输出Z1(t)可以用等式(5)表示:
正交相输出Z2(t)表示为:
通过同相检测和低通滤波器滤除式(5)和式(6)后部分,可得瞬时幅值Ar(t)和相位θr:
采用的HVD 方法的第一步,可以获取最大的振动分量Xr(t):
使用信号筛选方法[21],从原始信号中减去最大分量,可以得到残差作为下一次迭代的初始信号:
通过上述过程的不断迭代,可以将原始信号划分成几个缓慢变化的振动成分,从两个连续迭代的结果的标准偏差的极限作为算法的停止条件。HVD算法的详细流程如图3 所示。
算法的整个过程为:
(1)基于希尔伯特变换计算非平稳谐波分析信号的瞬时频率f(t)和瞬时幅度A(t);
(2)估计最大部分的IF;
(3)通过同步检测和低通滤波,处理从最大分量中提取相应的包络和相位;
图3 HVD 算法流程
(4)从原始信号中减去最大幅度谐波分量,并获得残差值作为新的替代原始信号,等待下一次迭代准备;
(5)重复步骤1 ~步骤4,直到满足迭代停止条件。
通过上述过程,HVD 算法可以将原始的ECG信号分解成若干个振动分量,其中包括各个振动分量的瞬时幅度和瞬时频率。
1.3.2 时频表示
应用HVD 算法可以获取到原始ECG 信号的各个振动分量。HVD 分解算法中涉及到分解层数、低通滤波器的截止频率和图片尺寸3 个关键参数。参数设置不同,会直接影响最终的时频表示图。此处本文初始设定分解层数为4 层,低通滤波器截止频率为0.04,图片尺寸初始设定为150×150。
时频表示的步骤如下:
(1)确定低通滤波器截止频率F、HVD 分解层数L 和图片尺寸N×N 共3 个参数;
(2)应用HVD 算法分解原始信号,得到各个振动分量的瞬时幅度和瞬时频率;
(3)根据步骤(2)获得的瞬时幅度和损失频率,依次在同一尺寸为N×N 图中作出各个分量的图谱(图横轴时间,纵轴频率,不同的颜色表示幅度)。
对ECG 信号应用本文提及的时频分析过程,可以将一维的心电信号转换为二维的时频表示图。如图4 所示,是一示例预处理的2 s 时长的ECG 片段。通过时频分析,可以获得分辨率较高尺寸为150×150 的RGB 时频图。
图4 时频分析处理示例
传统的心电特征识别算法都包含特征提取和降维算法两个过程,算法复杂度高,且实际泛化能力差,仅仅能用于小规模数据。为此,本文采用目前较为成熟的CNN 作为特征提取算法。CNN 算法不仅能实现特征提取和降维操作统一,还能凭借其权重共享和池化等技巧有效减少中间参数,提高模型性能。传统的CNN 结构通常包含输入层、多重卷积层和池化层(下采样层)、全连接层和最终的输出层。
对于经过时频表示过程得到的ECG 时频表示图,输入的图片为150×150 的三通道图片,图片中的数值在0 ~255。为了增加学习速度和避免无法收敛,需对图片数据进行归一化处理。归一化处理公式见等式(11),其中S(t)代表时频表示图矩阵。
卷积层是通过相同的卷积核重复与数据矩阵作卷积提取特征,卷积最终得到输入信号的特征图。池化(有平均池化和最大池化两种,本文为最大池化)是特征从高维到低维的抽象操作,实现特征的降维。X 表示卷积或池化操作的输入,W 表示连接权重矩阵,b 代表偏置,Y 是卷积或池化的输出,“*”表示卷积符号,pool(·)代表池化操作。卷积操作可以由等式(12)描述,等式(13)表示池化过程:
CNN 结构中,网络的深度增加可以增加模型的表示和学习能力,但是在深度达到一定阈值时,即使有规范初始化、正则化和ReLU 激活函数等处理手段,也将面临梯度消失和模型难以收敛的窘境,导致最终模型性能退化。为此,本文采用2015 年Kaiming He 提出的一种新型的深层卷积神经网络结构-残差神经网路(Residual NetWork,ResNet)[22]。
ResNet 在神经网络不断加深时,准确率先上升再达到饱和,而进一步增加深度会导致模型性能变差。究其原因,在于深度增加不止测试集上误差增大,训练集也会增大。ResNet 通过转换学习目标实现全等映射直接将前一层的输出直接传到后面输出的思想。假设某段网络输入是x,期望输出是H(x),这里将输入直接传到输出,那么此时的学习目标是F(x)=H(x)-x,即以输出和输入的残差作为学习目标。传统的卷积层或者全连接层在信息传递时,存在信息丢失损耗的问题。ResNet 这种处理方法通过直接将输入信息绕道传到输出,保护了信息的完整性。同样,网络层数不会增加额外的参数和计算复杂度,减少了学习目标。残差网络残差块计算过程如图5 所示。
图5 ResNet 残差模块计算示例
为得到ECG 识别的深层网络结构,本文采用ResNet 代替传统深层CNN 结构[22]。本文采用的网络结构心电残差卷积神经网络(Electrocardiogram Residual NetWork,ECG-ResNet)模型如图6 所示。
图6 ECG 识别网络结构
该网络结构主要包括两种子模块,分别为残差块1 和残差块2。残差块1 是将模块输入直接连接到该模块的输出,不引入额外的参数。残差块2 引入1×1 卷积用作维数匹配。两个模块在特征图之间卷积核步长都为2。输入为150×150 的三通道图片,经过共16 层包含卷积和池化操作特征提取和降维操作,然后通过平均池化层转化为向量1×512的向量,增加一层90 个节点(对应识别的个体数)的全连接层,最后使用Softmax 分类器分类识别。相比于传统的特征提取方法,深层的残差卷积神经网络提取出更深层的隐含特征信息,能极大地增加ECG 识别的准确率和算法泛化能力。
本文采用混淆矩阵评估心电识别模型的性能。矩阵中的“行”为样本的预测类别,每一行的样本总数表示预测为该类别的样本数目;表格中的“列”为样本的实际归属类别,每一列的样本总数表示实际为该类别的样本数目,以不同颜色代表不同数值,即可得到混淆矩阵可视化图片,可以直观反映模型的性能。
正确率(Accuracy,Acc)的定义见表达式(14),Nr一次实验中分类正确的个数,NT一次试验中分类的总样本数。除了使用混淆矩阵外,本文采用10 折交叉验证的平均正确率(Average Accuracy,AA)和标准差(Standard Deviation,SD)作为实验中模型性能的评价指标。平均正确率和标准差分别是在10 折交叉验证实验中的10 次正确率的平均值和标准差。
本文采用配置为32 GB 内存、NIVIDA Quado P5000 图像处理单元以及Intel Xeon E3-1535M 处理器DELL Precision 7720 移动工作站,操作系统是Windows 10 专业版64 位操作系统。软件开发包括开源语言Python 及其深度学习库Keras[23]。
2.2.1 数据集生成
本文采用的数据是Physionet 数据库中的ECGID 心电数据集,每个个体挑选其两段20 s 的记录,共90 个不同的受试个体。本文采用的心电数据依次经过心电信号的预处理和时频分析处理,其中在预处理的盲源分割阶段每个个体分割出500 个心电片段,因此最终生成90×500 张RGB 时频图。由于本文采用的是10 折交叉验证法,因此在图片数据读入CNN 前,先采用分层抽样的方法将数据分成10 等分,每次选取其中1 等分作为测试集,另外9 等分作为训练集。
2.2.2 时频分析参数确定
本文时频分析中生成的图片数据对于整个识别系统有至关重要的影响。影响图片生成质量的参数包括时频分析阶段的低通滤波器系数和分解层数(谐波数)。为了能确定最优的低通滤波器截止频率,本文通过将ECG 数据依次以不同的截止频率和相同的分解层数4 层按2.2.1 部分的介绍生成图片数据,然后通过本文1.4 部分介绍的CNN 结构对图片数据处理和识别,根据其最优AA 和SD 选取出最优的低通滤波器截止频率。实验可选低通滤波器系数为0.01 ~0.05,最终得到的结果见图7。
低通滤波器的截止频率决定了基于HVD 方法的频域分辨率,对比实验结果发现,在截止频率参数为0.03 时,系统的平均识别率最大且标准差较小,此时性能最佳。
图7 不同截止频率参数的识别效果
为了能确定HVD 算法对于整个识别系统最佳的分解层数,本文通过将ECG 数据依次以不同的分解尺度(即谐波分量数)和相同的低通滤波器系数0.02 按2.2.1 部分介绍生成图片数据,然后通过本文1.4 部分介绍的CNN 结构对图片数据处理和识别,根据其最优AA 和SD 选取出最优的低通滤波器截止频率。实验可选的谐波分量数为2 ~6 层,本次实验结果如图8 所示。
图8 不同谐波数的识别效果
如图8 所示,在谐波分量数为2 ~4 时,模型识别率不断增加,标准差减小,即数据趋向稳定;在谐波分量数为4 ~6 时,模型基本保持稳定。可见,在谐波数适当增加时,可以提升图片的分辨率从而提高最终识别性能。谐波数增加到一定程度时,ECG 的主要频率成分的时频特征在时频图中得以显示,继续增加低频成分的次要特征信息不会对识别性能有所增益,甚至会由于过大的凸显低频成分在时频图中的特征信息导致模型性能下降。
2.2.3 网络结构对模型性能的影响
为了探究本文所采用的CNN 网络结构对整个识别系统的影响。首先,通过对2.2.2 部分确定的最优时频分析参数,将原始ECG 数据分别通过预处理和时频分析过程生成最优的时频图数据,以此作为本文最终的实验数据。然后确定候选的网络结构是文献[22]中提及的20 层的ResNet-20,34 层的ResNet-34,50 层的ResNet-50。通过比较相同数据集在相同条件下(时频参数相同,图片数据相同,训练算法,初始学习率和训练轮次相同)通过不同网络的训练的平均准确率、准确率标准差和一轮训练时间来确定出最适合本文的网络结构。网络的性能比较见表格1。
表1 多种模型在ECG-ID 数据集上的性能对比表
ResNet-20、ResNet34-20、ResNet-54 在 网 路层数增加时可以增加网络的表现力,模型性能都有所提升,但是由于数据集相对较小的问题,网络的训练时间由于本文网络相对ResNet 网络参数较多,所以训练时间较长,但是换来的是本文的网络结构得到最佳的识别性能,说明本文对原有的ResNet网络的精简是可行的。
2.2.4 模型最终性能测试
本文通过对时频分析参数的确定和CNN 网络结构的探究,确定了最适合本文的最终数据集和最终的CNN 网络结构。为了测试本文提出算法的最终模型性能,首先将最优的图片数据集按4:1 的比率划分训练集和测试集,通过50 轮的训练过程,得到的测试集识别性能见图9。从混淆矩阵图9 中,可以直观的看出本文提出的模型可以准确的将测试集数据分类识别出其真实标签。
图9 ECG-ID 数据库混淆矩阵图
为了能验证本文提出算法相对其他相关研究的性能差异,本文与4 个2019 年以内国内外的算法做出了比较与分析,得到如表2 所示的结果。观察可知:文献[4]是典型的基准点特征提取方法,方法基于相关系数和小波距离计算,算法计算复杂,只能应用于小规模识别场景,泛化能力差;文献[9]采用主要粒子群优化算法和概率神经网络,粒子群算法缺乏速度的动态调节且易陷入局部最优,不能有效解决离散及组合问题;文献[11]算法过程复杂,计算复杂度高,不能应用于大型识别场景;文献[24]引入了CNN 网络,但是小波变换本身依赖研究者的先验选择小波函数,且提取的特征没有综合时频域及能量的特征信息。本文提出的算法识别性能较比较的文献中的算法有明显优势,有效证明了本文所提算法的可行性。
表2 本文算法与相关研究的识别性能比较
本文提出了一种基于HVD 的时频分析和ECGResNet 结合的融合特征识别方法。首先对原始ECG预处理,用盲源分割方法替代算法难以精准定位的R 峰值点定位算法,且算法复杂度小、计算量少。其次,通过对预处理后的ECG 信号进行HVD 分解,进而转化为时频图。再次,以CNN 作为特征提取器自适应提取出ECG 的时频域及能量的融合特征信息,避免了基于人为先验和主观的方法特征遗漏的问题。本文引用目前在图片识别领域较为成功的残差神经网络并加以修正成适用于ECG 的识别网络模型,实验结果证明,本文提出的ECG-RestNet网络模型具有良好的识别性能。本文算法与相关算法比较的结果也能证明所提算法的优越性。然而,本文提出的算法缺少ECG 信号的质量评估算法,且存在算法时间相对较长的问题,因此笔者后续的研究方向有ECG 信号的质量评估算法、CNN 网络结构的优化以及主动认证算法[25]3 个方面。