基于支持向量回归模型的血压预测方法

2022-01-09 05:19吴晓姣吴礼发
计算机技术与发展 2021年12期
关键词:沃斯噪声污染巴特

吴晓姣,吴礼发

(南京邮电大学 计算机学院,江苏 南京 210023)

0 引 言

高血压一直是一种较为普遍的疾病,它意味着一个人有更高的健康风险问题[1]。因为患有高血压的患者通常是没有显著的症状和信息,所以大多数人不能够及时意识到自己已患病。因此,它又被人们称为“沉默杀手”。总而言之,血压问题在日常生活中是不可忽视的,即血压的实时检测是必不可少的。血压是指从心脏向全身输送血液时对动脉壁的压力,这些动脉在心脏收缩时扩张,在心脏扩张时收缩,则血压被分为收缩压(systolic blood pressure,SBP)和舒张压(diastolic blood pressure,DBP)。

伴随着科技技术迅猛发展的趋势,传感器设备在医疗领域中的应用受到了广泛关注[2],并且使用其检测人体的生理参数也越来越得到大家的认可,其中生理参数包括心率、脉搏、血压等[3]。与此同时,使用传感器检测到的人的生理信号进行预测血压的研究也随之兴起[4]。

目前,针对预测血压的相关研究有很多[5]。Teng等人[6]首先获取人的光电容积脉搏波生理信号(photoplethysmography,PPG)并分析其某些特征与动脉血压(ABP)之间的关系,然后采用线性回归算法(LR)构建预测血压的模型,实验结果表明通过人的生理信号预测血压这一方法是可行的。Zhang等人[7]从32个人中获取7 000个生理信号的实例,并使用支持向量机算法构建预测血压的模型。实验在均值误差(MAE)方面的值分别为11.64和7.62,结果表明该模型的预测精度较低。Kachuee等人[8]则从MIMIC II数据库中提取1 000个人的心电图(ECG)和PPG信号,然后从这两个信号中提取实验所需特征,并使用机器学习算法构建预测血压的模型。实验预测SBP和DBP的MAE分别为11.17和5.35,实验结果表明增加了ECG信号之后预测精度有一点提高,但是该模型预测SBP的精度仍然较低。Su等人[9]从ECG和PPG信号提取实验所需特征,然后使用长短期记忆网络LSTM构建预测血压的模型。实验在均方根误差(RMSE)方面的值分别为3.73和2.43,结果表明该模型的预测精度良好。但是,该模型需要同时从ECG和PPG两个信号中提取特征,即实验需要对这两个信号进行同步性处理操作,则在信号处理之前就需要付出很多的努力,从而增加实验的任务量。Zadi等人[10]是从15个人中获取PPG信号,然后使用ARMA模型构建预测血压的模型。实验预测SBP和DBP的RMSE分别为6.49和4.33,实验结果表明该模型的预测精度良好,即仅使用PPG信号预测血压是可行的。Kurylyak等人[11]首先通过MIMIC II数据库的一部分数据来提取PPG信号的波形特征,然后研究分析这些特征与ABP之间的关系,最后使用人工神经网络(ANN)构建预测血压的模型。实验预测的SBP和DBP的MAE分别为3.80和2.21,实验结果表明该模型预测血压的精度较好。但是,该实验只从原始的PPG信号中提取相关特征。Yang等人[12]对原始的PPG信号、PPG信号的二阶导数提取相应的特征,然后使用SVR构建预测血压的模型。实验预测的SBP和DBP的MAE分别为13.40和6.90,RMSE分别为8.54和4.34。Slapnicar等人[13]首先从MIMIC III数据库中获取了510个人的PPG信号,然后从原始的PPG信号、PPG信号的一阶导数、PPG信号的二阶导数中提取相关特征,最后使用深度学习算法构建预测血压的模型。实验预测的SBP和DBP的RMSE值分别为9.43和6.88,实验结果表明该模型预测血压的精度一般,但是实验对于PPG信号提取特征较为全面。

针对上述预测血压研究存在的问题,该文提出一种基于支持向量回归模型(SVR)的血压预测方法。该方法仅考虑人的PPG信号,通过对PPG信号的处理分析并提取相关特征,然后再使用SVR构建预测血压的模型。

1 基于SVR的血压预测方法

1.1 问题定义

通过传感器设备获取某人在一段时间内的生理信号数据,预测血压的一般过程为:首先获取某人一段时间内的PPG和ABP信号,然后对PPG信号进行处理并提取特征Xt,同时对ABP信号处理获取SBP和DBP值,即标签Y,最后结合特征Xt和标签Y分别构建预测SBP和DBP值的模型,如图1所示。

图1 血压预测的一般过程

1.2 SVR回归原理

支持向量机(SVM)是一种在分类与回归分析中对数据进行处理的监督式机器学习模型,包括线性SVM和非线性SVM[14]。当数据是线性时,线性SVM可以通过寻找超平面来对数据样本进行处理操作[15]。然而,当数据是非线性时,线性SVM则不适用,此时非线性SVM将会被使用。非线性SVM主要是通过核函数将低维空间中的非线性问题转换为高维空间中的线性问题,从而再使用解决线性问题的方式来解决非线性问题。根据PPG和ABP信号之间的关系实现血压的预测,以及PPG信号属于人的生理信号是非线性数据,因此该文采用非线性SVM,即支持向量回归算法(SVR)来构建预测SBP和DBP值的模型。

给定某人一段时间内的PPG信号和SBP(或DBP)值组成的训练数据集T={(x1,y1),(x2,y2),…,(xN,yN)},其中xi表示PPG信号,yi表示对应的SBP(或DBP)值,i=1,2,…,N,则预测血压的SVR模型的公式为:

f(x)=wTx+b

(1)

SVR采用ε-不敏感损失(ε-insensitive loss)函数,该损失函数的公式为:

(2)

因此,预测血压的SVR模型可形式化为:

(3)

其中,z是模型输出f(x)与真实值y之间的差值,C是惩罚因子。同时,通过引入松弛变量ξi和ζi,式(3)可重写为:

(4)

引入拉格朗日乘子α、β、γ、σ可以将最优化问题转化为对偶问题,由拉格朗日乘子法得到拉格朗日函数为:

(5)

将式(1)代入上式中,再使用L分别对w、b、ξ、ζ求偏导,同时将每个偏导数置为0,计算得到:

(6)

(7)

C=γi+αi

(8)

C=σi+βi

(9)

再将式(6)到式(9)代入式(5)中就实现了将最优化问题转化为对偶问题。此时,SVR模型的对偶问题为:

(10)

将核函数κ(xi,xj)代入上式中,SVR模型的对偶问题变为:

(11)

同时令上式的值为0,则可以得到SVR模型的回归方程为:

(12)

其中b为:

(13)

κ(xi,xj)为:

κ(xi,xj)=φ(xi)Tφ(xj)

(14)

实验中使用的核函数是高斯核函数(RBF),它的公式为:

(15)

其中,σ>0表示高斯核的带宽,xi、xj表示特征向量。

1.3 血压预测方法

基于上述讨论,该文提出一种基于SVR的血压预测方法,如图2所示。

图2 基于SVR的血压预测流程

该方法的操作步骤如下:

(1)信号数据读取。读取某人一段时间内的PPG和ABP信号;

(2)PPG信号的数据过滤。通过数据过滤来消除PPG信号的噪声污染;

(3)信号的周期划分。ABP和PPG信号属于周期性数据,则需要对两个信号进行周期划分;

(4)PPG信号的特征。对已消除噪声污染的单个周期的原始的PPG信号、PPG信号的一阶导数、PPG信号的二阶导数提取相关特征;

(5)获取SBP和DBP值。从单个周期的ABP信号中获取对应的SBP和DBP值;

(6)训练模型。将已提取的PPG信号的特征结合SBP(或DBP)值,然后使用SVR构建预测SBP(或DBP)值的模型;

(7)测试模型。对于预测SBP和DBP值的两个模型进行准确率测试。

下面介绍图2中PPG信号的数据滤波处理。由于PPG信号是通过传感器设备获取,则在测量的过程中该信号容易受到外界的因素干扰而造成噪声污染[16]。主要影响测量PPG信号的因素有:(1)环境光的影响;(2)工频以及其他电磁的影响;(3)运动影响。这些都是测量PPG信号过程中会出现的问题,因此在使用PPG信号构建预测血压的模型之前需要对该信号进行数据滤波以消除噪声污染。Chowdhur等人[17]使用25 Hz的六阶巴特沃斯无限脉冲响应零相位滤波器消除PPG信号的噪声污染。师荣堃等人[18]则是先使用0.7 Hz~4 Hz带通滤波器对PPG信号进行初步滤波,然后再使用优化的全零直线型形态学滤波器消除该信号的基线漂移,最后再使用4 Hz的FIR低通滤波器消除前面操作带来的高频噪声。

巴特沃斯滤波器主要是由butter和filtfilt两个函数组成,其Python代码为:

b,a=scipy.signal.butter(N,Wn,btype,analog,output,fs)

datafiltter=scipy.signal.filtfilt(b,a,x,axis,padtype,

padlen,method,irlen)

其中,实验需要设置的重要参数为:

(1)N表示实验中采用的巴特沃斯滤波器阶数;

(2)Wn表示截止频率的归一化,0

Wn=2*cutoff/sample

(16)

其中,cutoff表示巴特沃斯滤波器的截止频率,sample表示信号的采样频率。

(3)btype表示滤波的类型,分为高通(highpass)、低通(lowpass)、带通(bandpass)和带阻(bandstop);

(4)b,a表示巴特沃斯滤波器的分子和分母的多项式,同时也是filtfilt函数的重要参数;

(5)x表示要过滤的信号数据,要求以数组的形式。

针对消除PPG信号噪声污染的处理问题,该文提出一种仅使用巴特沃斯滤波器对PPG信号消除噪声污染的方法。该方法将消除PPG信号噪声污染分为消除信号的基线漂移和高频干扰两个步骤,其中对于消除基线漂移使用巴特沃斯低通滤波器,对于消除高频干扰使用巴特沃斯高频滤波器。

2 实验结果与分析

2.1 数据库介绍

MIMIC III数据库(https://mimic.mit.edu/about/mimic/),其全称为Medical Information Mart for Intensive Care III(重症监护医学信息集市III),是由MIT麻省理工学院下属管理的一个公共临床数据库。它包含2001年至2012年在贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)重症监护病房住院的4万多名病人的生理信息数据,例如床旁生命体征(每小时记录1次)、检查结果、手术、用药、监护记录、影像报告和死亡情况(包括院内和院外)等等。由于它是从传感器中直接读取的生理信号数据,因此在实验过程中不方便查看和操作,则对于下载的信号数据需要通过WFDB工具箱[19-20]进行相应的处理操作。

2.2 评价指标

2.2.1 均值误差和均方根误差

均值误差(MAE)是指观测值和预测值的误差绝对值和占总样本数的平均值,因此MAE可被用来评估观测值和预测值之间的平均误差,并且MAE越小表示该模型的性能越好。MAE的公式为:

(17)

其中,N表示血压样本的数量,yi表示血压的观测值(SBP或DBP),ypred,i表示血压的预测值(SBP或DBP)。

均方根误差(RMSE)是观测值与预测值的误差平方和比上总样本数再取平方根,因此RMSE可被用来评估观测值与预测值之间误差的波动性,并且RMSE值越小表示该模型的性能越好。RMSE的公式为:

(18)

其中,N表示血压样本的数量,yi表示血压的观测值(SBP或DBP),ypred,i表示血压的预测值(SBP或DBP)。

2.2.2 Bland-Altman图

Bland-Altman图是通过计算出两种测量结果的一致性界限的一种性能评估方法,同时可以使用图形直观展示这个一致性界限。因此,实验中可以采用Bland-Altman图可视化预测值和观测值的一致性状况。

2.3 结果与分析

实验选择数据集的80%作为训练集,20%作为测试集,以及使用网格搜索方法寻找SVR模型的最优超参数组合。表1给出了文中预测血压的方法与其他相关文献的方法在MAE和RMSE值上的比较结果。

从表1中可以看出:

表1 文中方法与其他相关文献的方法的比较结果

(1)文中SVR模型的MAE小于文献[11]的ANN模型的MAE。由于在文献[11]中,实验只提取了原始的PPG信号的波形特征。而文中SVR模型除了对于原始的PPG信号提取特征外,还对于PPG信号的一阶导数和二阶导数提取了相应的特征。因此SVR模型对于PPG信号提取特征较全面一些,则该模型在预测血压的性能上较优于ANN模型。

(2)文中SVR模型的MAE和RMSE均小于文献[12]的SVR模型的MAE和RMSE。在文献[12]中,实验只是对原始的PPG信号以及其二阶导数提取特征,然后使用SVR构建预测血压的模型。而文中还对该信号的一阶导数也提取了特征,因此该模型在性能上较优于文献[12]中的SVR模型。

(3)文献[17]中GPR模型的MAE比文中SVR模型的MAE小一点,其RMSE值则大得多。在文献[17]中,实验是采用25 Hz的六阶巴特沃斯无限脉冲响应零相位滤波器消除PPG信号的噪声污染。而文中将消除PPG信号噪声污染分为消除基线漂移和高频干扰两个步骤,首先使用巴特沃斯低通滤波器消除该信号的基线漂移,然后使用巴特沃斯高通滤波器消除该信号的高频干扰。后面消除高频干扰的操作不仅消除PPG信号本身的高频噪声,而且还消除由于前面操作带来的高频噪声,比文献[17]中消除PPG信号噪声污染的操作较彻底一点。因此文中SVR模型在性能上较优于GPR模型。

图3 SBP的Bland-Altman图

图4 DBP的Bland-Altman图

综上所述,从与其他相关文献的MAE或RMSE值的对比以及Bland-Altman图可知,文中SVR模型具有一定的可行性,同时能够有效地预测出人的血压的SBP和DBP值。因此,该模型能帮助人们及时了解自身的血压情况,一旦血压出现异常情况能够尽早知晓。

3 结束语

针对血压预测问题,该文提出了一种基于SVR的血压预测方法,并使用MIMIC III数据库中的PPG和ABP信号数据实验验证了该方法的有效性。实验结果表明,基于SVR的血压预测方法的MAE和RMSE较小于其他相关文献的方法的MAE和RMSE,预测效果较好。但是,由于数据库数据的局限性和设备有限等因素,该文没有综合考虑个人的体征信息(如年龄、性别等),未来将考虑这一方面信息并构建更加精确的血压预测模型。

猜你喜欢
沃斯噪声污染巴特
热爱用尺量出来
噪声治理不应止于“民不举,官不究”
热爱用尺量出来
1/5欧洲人受噪声困扰
自己的歌
噪声污染公益海报设计
量一量你的热爱
丰富的能源
我的警犬巴特
晨练的男人