基于心电-脉搏波的心血管疾病识别研究

2019-03-19 06:14陈倩蓉梁永波赵飞骏朱健铭陈真诚
中国医学物理学杂志 2019年2期
关键词:特征参数脉搏分类器

陈倩蓉,梁永波,赵飞骏,朱健铭,陈真诚

1.桂林电子科技大学电子工程与自动化学院,广西桂林541004;2.桂林电子科技大学生命与环境科学学院,广西桂林541004

前言

据统计,2012年我国农村居民的心血管疾病死亡人数占总死亡人数的41.09%,到2016年达到了45.01%;城市居民的占比也从41.52%增长到了42.61%[1-2],心血管疾病死亡人数连续几年占全球死亡人数的首位。动脉硬化是诸多心血管疾病的共同病理基础和独立预测因素[3-4],也是唯一最早出现的能够直接检测到的血管功能结构变化,它会导致动脉血管壁逐步增厚,逐渐失去弹性直至管腔狭窄、堵塞,引发心血管疾病[5]。目前临床上检查心血管疾病的方法主要有生化分析和影像检查[6]。生化分析是一种间接测量的有创方法。影像检查方法准确度高,但无法检测出早期病变,当冠脉出现堵塞时才能确诊。上述两种方法不仅费用昂贵,而且不适用于普查。因此,心血管疾病的识别对心血管疾病的防控有重要意义,也是现代社会对健康监测的迫切需求。

近年来,国内外许多学者通过脉搏波传导速度(Pulse Wave Velocity,PWV)检测动脉硬化,期望通过检测动脉硬化实现心血管疾病的早期筛查。Alty等[7]通过单点的指端脉搏波波形估计PWV,依据PWV对样本进行分类,有研究者通过指端光电容积脉搏波形态学特征评估血管生理状况[8]。张丽娜等[9]也研究了基于心电、脉搏波信号的动脉硬化无创检测方法,建立了基于自适应神经模糊推理系统的动脉硬化评价模型。日本有研究机构已经研制出动脉硬化仪,但由于其售价昂贵,没有得到广泛运用。

上述的研究中学者们通过动脉硬化筛查心血管疾病是可行的,但是由于动脉硬化程度随年龄的增长而加深,PWV也会随年龄的增长而加快,对不同年龄段的受试者使用同一个阈值是极不合理的。各个实验中获取PWV使用的脉搏波传导时间大相径庭,因此也就无法得知不同PWV对血管评估产生的影响。所以拥有一种低成本的心血管疾病早期筛查方法已经成为了现代社会的迫切需求。

因此,本研究提出一种低成本的适用于心血管疾病早期筛查的便捷方法。通过同时采集指端脉搏波信号与心电信号,提取3种PWV与心血管结构功能密切相关的脉搏波特征参数,基于含不同PWV的特征集分别建立心血管疾病识别模型,并通过对比PWV对血管评估的效果确定用于评估动脉血管功能结构的最优PWV。

1 PWV理论基础

目前,PWV是公认用于评估动脉硬化的指标,主要有两种测量方式获取PWV,其一是通过单点脉搏波与心电信号获取脉搏波传导时间,结合脉搏波传导路径获取PWV;其二是通过双端脉搏波获取脉搏波传导时间,结合脉搏波传导路径求得PWV。颈-股动脉PWV是评估动脉硬化的金标准,是通过上述方法二测量获取的[10],但由于其测量区域的限制,没有得到广泛运用。刘娜等[11]的研究表明单点PWV与冠状动脉狭窄数量密切相关,冠状动脉狭窄数量多少从侧面反映了动脉硬化程度,也证明了单点脉搏波波速与动脉硬化程度有密切联系。有研究表明动脉整体顺应性与颈-股动脉PWV的相关性很高[12],动脉整体顺应性与动脉结构功能联系紧密,也表明身体局部的PWV依旧可以反应身体的血管情况。

研究表明脉搏波及其微分波形上发现了与血管功能结构高相关性的变量,并发现了与动脉硬化密切联系的特征参数[13-17],因此,本研究拟通过心电信号与单点脉搏波信号获取上肢PWV,基于脉搏波特征参数借助机器学习方法建立动脉心血管疾病识别模型,并通过模型对比确定用于心血管评估的最优PWV。

2 实验

2.1 采集系统

本研究的采集系统主要包括心电传感器HKD-10A,红外透射式脉搏波传感器HKG-07B,心电信号预处理模块、脉搏波预处理模块、控制器模块、串口与上位机的波形显示与数据存储模块。心电信号预处理模块包括光电隔离电路、放大及电平抬升电路。脉搏波信号预处理模块包括放大及电平抬升电路。通过标准I导联方法结合HKD-10A心电传感器采集心电信号,选用HKG-07B透射式红外脉搏传感器获取受试者左手食指容积脉搏波,系统框图如图1所示。脉搏波信号和心电信号采样设置为500 Hz,通过12位模数转换,采集的数据由串口发送至上位机,通过上位机中的LabVIEW界面观测波形,存储数据。

图1 采集系统Fig.1 Acquisition system

2.2 采集流程

具体的数据采集流程如下:(1)控制室温在25℃左右,实验集中在春季和夏季进行,保持实验环境安静,实验前所有受试者静息20 min,并记录下受试者的年龄、身高、体质量等生理信息。(2)所有受试者都在平躺状态下同时检测左手食指的光电容积脉搏波和标准I导联下的心电信号,每个受试者都检测3组数据,每组1 min,实验过程中均保持沉默,身体保持平躺,身体各部位不得有任何位移。(3)考虑到血压计在测量过程中需要给袖带充气加压,造成血管变形,所以在第三组数据测试完成后用欧姆龙HEM-7201上臂式电子血压计在同一状态下测量3次血压。(4)将所测数据和生理信息归档保存。

2.3 数据统计

本研究共采集51人的波形数据并记录其生理信息,分为健康组与病患组两组,其中健康组有41人,病患组有10人。健康组是各项生理指标正常,没有心脑血管疾病或者相关症状,病患组是已经被医生确诊患有心脑血管疾病如冠心病、高血压等疾病并且在服药治疗的患者。表1是受试者的基本信息。

3 特征定义

如图2所示的是基于心电与容积脉搏波的特征参数定义,其中ECG为心电信号波形,PPG为脉搏波信号,VPG(Velocity Plethysmograph)为脉搏波的一次微分波形,APG(Accelerated Plethysmograph)是脉搏波的二次微分波形。图中ptto、ptta和pttm是3种脉搏波波传导时间,由心电信号与脉搏波信号获取,图中的脉搏波形态学参数包括Tpp、Tc、CT、Tm_b、Tm_c、Tm_d、Tm_e、Tm_a_b、Tm_a_c、Tm_a_d、Tm_a_e、Tm_b_peak和AI,其中AI是y与x的比值,仅由上述13个脉搏波形态学参数组成的特征子集设为P,分别由ptto、ptta和pttm及受试者心脏到左手食指的距离得到pwvo、pwva和pwvm。pwvo与特征集P组成的特征集为QO,pwva与特征集P组成的特征集为QA,由pwvm与特征集P组成的特征集为QM。

4 数据分析

由上述特征提取部分知,每两个连续周期的脉搏波可以提取一组特征参数,每个受试者保留30组特征参数的记录,51个受试者总计有1 530条特征参数记录,其中健康组1 230条记录,病患组300条记录,健康组病患组数据量之比接近4:1,所以存在样本不平衡的问题,为解决样本不平衡的问题,并且避免过采样导致的过拟合问题,每次建模都在健康组随机抽取300条记录与病患组全部记录组成新数据集,基于新数据集进行建模。

图2 特征定义Fig.2 Definition of features

5 结果

本研究基于PWV和脉搏波形态学特征参数分别使用K近邻学习(K-Nearest Neighbor,KNN)与支持向量机(Support Vector Machine,SVM)两种方法对样本进行分类识别。KNN属于常用的监督学习方法,其核心思想是以某种距离度量寻找测试样本与训练样本最靠近的k个训练样本,将这k个样本中占比最大的类别标记作为预测结果[18]。对于KNN,k是一个重要的参数,k值的选择影响着分类器的精度,所以首先要找出适合的k值。表2所示的是基于含不同PWV的特征集的最优k值对应的分类模型的准确率。

表2 基于不同特征集的KNN分类模型准确率Tab.2 Accuracy of K-nearest neighbor model using different feature sets

由表2可知加入pwvo和pwvm相比于pwva对分类准确率改善更明显,一方面表明pwvo和pwvm的加入对分类器的准确性有明显改善,另一方面说明pwvo和pwvm比pwva更能反映心血管生理状态,3个PWV参数中,pwvm是最适合用于评估心血管生理状态的PWV。

SVM分类的核心思想是在给定的训练样本空间找到一个可以把不同类别样本划分开的超平面。距离超平面最近的几个训练样本就是支持向量,支持向量到超平面的距离称为间隔,为了使分类器的泛化性能最好,要找出使得间隔达到最大的超平面,即为泛化性能最好的分类器[18]。由于本研究的样本数据量较小,所以选用SVM,它对于样本量小,非线性等问题能达到较好的分类效果,实际问题中,样本空间包括线性可分和线性不可分的情况,对于线性不可分的情况,若样本特征有限,则可以将原样本特征映射到更高维的空间,在映射的新空间中找合适的超平面。在这个过程中需要计算到原特征向量映射到高维空间的内积,由于在高维空间计算非常困难,解决方法是找到合适的核函数,在原空间借助核函数计算在新空间中的内积。用含有pwvm的特征集QM在运用不同核函数时得到的分类器预测的准确率如表3所示,由表3知,使用不同核函数分类器的分类准确率差异不大,当核函数为Sigmoid时,分类准确率达到最高,即84.20%。

实际应用中查准率与查全率是评估分类器性能的重要指标,特别是在疾病识别方面的运用,要在一定准确率的情况下尽可能提高查全率,P-R曲线以查全率为横轴,以查准率为纵轴,可以通过曲线直观反映出分类器的查准率与查全率,图3是k为19时的KNN分类模型与核函数为Sigmoid的SVM分类模型基于不同PWV特征的P-R曲线。基于含有pwvm特征集QM的SVM分类模型性能最好,SVM分类模型普遍比KNN分类模型准确率更高,pwvm对于心血管疾病识别模型性能有更大的提升。因此选取基于含有pwvm的特征集QM的SVM分类模型作为心血管疾病识别模型。

表3 不同核函数的SVM分类模型的准确率Tab.3 Accuracy of support vector machine model using different kernel functions

图3 两种分类模型的P-R曲线Fig.3 P-R curve of two models

6 结论

本研究自行设计了心电-脉搏波数据采集系统,记录了51个受试者的波形数据及生理信息,提取了16个特征参数,其中包括3种PWV和13个与心血管评估密切联系的脉搏波特征参数,基于脉搏波特征参数及不同PWV组成的不同特征集分别用KNN和SVM建立了心血管疾病识别模型,通过模型性能对比确定了基于特征集QM的SVM为最优的心血管疾病识别模型,也确定了用于评估心血管状况的最优脉搏波波速pwvm,说明心血管疾病识别模型有一定可靠性,为心血管疾病的低成本便捷筛查提供了新思路,为实现穿戴式心血管监测提供了基础。

猜你喜欢
特征参数脉搏分类器
重载车辆轮胎模型参数辨识与灵敏度分析
基于视频图像序列的船用雷达目标检测和目标特征参数提取
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
矿产地气法勘查中矿床特征参数研究
——以某铅锌矿为例
基于特征选择的SVM选择性集成学习方法
用心感受狗狗的脉搏
光电式脉搏波检测系统的研究
基于差异性测度的遥感自适应分类器选择