基于潜在空间特征的无袖带血压估计方法

2022-10-10 09:52樊艳梦杨学志王定良刘雪南马礼坤李龙伟

合肥工业大学学报（自然科学版） 2022年9期

樊艳梦, 杨学志, 王定良, 刘雪南, 马礼坤, 李龙伟

(1.合肥工业大学计算机与信息学院,安徽合肥 230601; 2.合肥工业大学软件学院,安徽合肥 230601; 3.智能互联系统安徽省实验室,安徽合肥 230601; 4.中国科学技术大学附属第一医院,安徽合肥 230001)

血压(blood pressure,BP)是诊断心血管疾病的一个重要生理指标[1-3]。但是,由于患者在治疗后对BP的监测和反馈不足,其BP无法得到有效控制,特别是在医疗设备不足的地区[4-5]。定期测量血压可以帮助患者更好地控制血压,避免更严重的心血管并发症[6]。基于袖带的血压计是最准确的无创血压测量设备,并已广泛用于各种场合[7-9]。但是,当患者需要连续监测血压时,牢固绑在手臂上的袖带传感器会使患者感到不适[10]。为此,近年来研究人员提出了无袖带的血压测量方法,其中最常见的是基于脉搏波传输时间(pulse transit time,PTT)的血压检测方法。文献[11]首先证实动脉血压与PTT相关;文献[12]使用心电图(electrocardiograph,ECG)和光电容积脉搏波(photoplethysmography,PPG)信号计算PTT并对每个受试者进行血压校准;文献[13]利用同时从脚趾和指尖测量的PPG信号来确定PTT。然而基于PTT的方法需要2个传感器同步采集生理信号,使得测量过程十分复杂。

本研究的重点集中在基于单一PPG信号的无袖带BP估计。PPG信号包含丰富的心血管信息,与血管硬化程度、血压和血流动力学等有密切关系[14-15]。许多研究人员通过提取PPG信号的特征来训练机器学习模型从而完成BP估计;文献[4]通过提取PPG信号的频域特征,将其作为神经网络的输入,建立BP估计模型;文献[16]从PPG波形中提取时域和频域特征并使用随机森林算法估计BP;文献[17]提取了57个特征,经特征选择后使用最小二乘支持向量机建立血压估计模型。然而上述研究仅在小型数据库上进行了验证,这些数据往往都是由研究人员自行采集的正常人的数据,缺少对高血压和低血压人群的实验验证,因此需要增加样本量,充分考虑实际应用需要。

心血管信息也包含在速度光电容积脉搏波(velocity plethysmography,VPG-PPG)的一阶导数和加速光电容积脉搏波(acceleration plethysmography,APG-PPG)的二阶导数中[18]。文献[19]从APG中提取特征,用偏最小二乘法回归估计收缩压(systolic blood pressure,SBP),其提取的特征与SBP的相关系数为0.78;文献[10] 基于VPG和APG分析压力-流量关系,提出由单个PPG估计BP的压力指数(pressure index,PI),并验证PI与SBP的相关系数为0.826;文献[20]从PPG、VPG和APG中提取多个时域和频域特征,并将其作为高斯过程回归(Gaussian process regression,GPR)的输入,在特征选择后建立BP估计模型。然而,在BP采集过程中,PPG信号可能会受到一些不稳定因素的干扰,使得从PPG、VPG和APG中准确提取特征变得困难[8,19]。因此一些不易受波形变化影响的特征提取方法被提出。文献[8]提取PPG相邻两峰之间的波形作为特征向量,这种特征提取方法称为基于整体(whole-based)的特征提取方法[21]。该方法可以更准确地提取特征,但是忽略了VPG和APG中包含的有用信息。

基于以上分析,输入具有鲁棒性和全面性的特征对训练出高精度BP模型具有重要意义,以往研究的BP估计的准确性还有待提高。为此,本文提取单周期PPG、VPG和APG波形作为原始特征向量,并利用梯度提升回归树(gradient boosting regression tree,GBRT)提取高阶交叉特征,较好地表达原始特征空间的非线性关系;另外,利用PPG信号的时频图作为卷积神经网络(convolutional neural networks,CNN)的输入,提取时频谱图中的深层特征;最后,通过GBRT和CNN提取的潜在空间特征可以充分表示出PPG信号中与血压有关的信息,并将其作为支持向量回归器(support vector regression,SVR)的输入,从而建立BP估计模型。

1 方法

本文提出的方法包括如下4个部分:第1部分是对PPG信号进行预处理,去除PPG信号的失真部分;第2部分是原始特征提取,提取单周期PPG、VPG和APG波形以及PPG信号的时频图作为下一部分的输入;第3部分是特征映射,利用GBRT和CNN提取潜在空间特征并用作SVR的输入;第4部分是训练SVR以建立BP估计模型。

本文方法的流程如图1所示。

图1 本文方法的流程

1.1 预处理

失真PPG信号示意图如图2所示。PPG信号在采集过程中可能会受到一些不稳定因素的干扰。因此,本文通过特征滤波的方法去除失真的波形段。

图2 失真PPG信号示意图

首先将PPG信号归一化;其次检测PPG的波峰和波谷,并计算一个PPG信号相邻波峰之间时间间隔作为特征指标d,得到一个特征序列;随后根据特征指标d设置自适应阈值,一个PPG信号所对应的特征指标d的特征序列以及该特征序列所对应的直方图如图3所示。从图3可以看出,未失真的波形段所计算出的特征指标d所在的直方图最高,而失真波形段所对应的d则不在该范围内,由此将上限阈值设置为最高的直方图的上限,而下限阈值设置为最高直方图的下限。检测每个周期波形的d值,若不在阈值范围内,则认为该周期波形失真,从而剔除失真的波形。

图3 特征阈值选择

1.2 原始特征提取

1.2.1 原始时域特征提取

PPG、VPG和APG分别反映了血管内的血容量、血容量的变化和血容量变化的加速度。血容量和血流速度密切相关,因此PPG、VPG和APG波形会受到产生血流的压力的影响[10]。因此,本文不仅提取单周期的PPG信号,还提取对应的VPG和APG的单周期波形作为原始特征向量。提取的单周期PPG、VPG及APG波形如图4所示,检测PPG的波谷并将其用作分割单周期PPG、VPG和APG的端点,从而得到单周期的PPG、VPG及APG信号。

图4 提取单周期PPG、VPG及APG波形

为了确保数据长度的一致性,通过在末尾补零的方法将提取的PPG、VPG和APG单周期信号的长度设置为200。根据PPG信号计算心率,得到UCI数据库的心率范围为每分钟48～125次心跳。此外,PPG的采样频率为125 Hz。因此,如果信号长为200,那么足以记录一个PPG、VPG和APG的完整周期。最后,将提取的PPG、VPG和APG连接起来得到长度为600的特征向量。

1.2.2 二维时频图特征

文献[22]研究了PPG和BP波形之间频率成分的相关性,并表明PPG和BP的前3个频率成分之间存在显著的线性回归关系。PPG信号的二维时频图如图5所示,本文对PPG信号作小波变换,小波变换选用的是Morlet小波,小波变换的尺度序列长度为256,由此可计算相应的尺度序列。然后由小波变换获得PPG信号对应的时频图。随后,将时频图用作CNN的输入,该CNN可以提取时频图的详细特征,并有效获取时谱图中的隐藏特征。

图5 PPG信号的二维时频图

1.3 潜在空间特征提取

1.3.1 梯度提升回归树

文献[23]提出梯度提升算法(gradient boosting),该算法是一种集成学习算法,基本思想是在每次迭代时构造一个新的基学习器[24],以使损失函数沿其梯度方向下降。假设输入数据为(xi,yi),i=1,2,…,N,其中:xi为特征序列;yi为相应的血压标签。需要通过最小化损失函数Q来确定第m次迭代的基学习器Tm,即

(1)

其中,fm-1为m-1次迭代后的模型。本文选择分位数损失函数作为GBRT的损失函数,因为分位数损失函数可以减少异常信号对损失函数的影响,它对于预测的区间十分敏感,即使在非均匀分布的残差下也能保持良好的性能,因此具有更强的鲁棒性。

此外,选择回归树作为包含K个节点的基学习器模型。假设共有M次迭代,可以得到最终模型fM(x)。GBRT算法总结为算法1,具体如下所述。

输入:(xi,yi),i=1,2,…,N;

输出:fM(x)。

1.初始化f为一个常量,并开始进行M次迭代

2.form=1 toMdo

3.计算负梯度。计算公式为：

(2)

4.用一棵回归树Tm拟合gm(xi) 并得到这棵树叶子节点Rmk,k=1,2,…,K

5.每次迭代后更新f。公式如下:

fm(x)=fm-1(x)+Tm

(3)

6.end for

7.M次迭代后得到最终模型fM(x)。

1.3.2 利用GBRT进行特征映射

GBRT在解决分类或回归问题时表现出很强的学习能力和更好的鲁棒性。在本文的研究中,使用GBRT进行特征映射以挖掘PPG信号的原始特征空间中的高阶交叉特征,从而更加充分地表达脉搏波与血压之间的复杂联系。使用GBRT进行特征映射的过程如图6所示。

图6 GBRT特征映射示意图

假设输入数据为(xi,yi),i=1,2,…,N。其中:xi为样本的特征序列;yi为相应的BP值。经过M轮训练后,得到M棵树,其中第m棵树具有Km个叶子。

当样本最终落在某棵树的某个叶子节点上时,新特征向量中该叶子节点对应的值为1,该树的其他叶子节点的值为0。然后对于第m棵树可以获得一个二值向量am=[v1v2…vkm],v可以表示为:

(4)

其中:j为1,…,Km中的一个值;Rj为树的第j个叶区域。经过M次迭代后每个样本可以生成一个新的特征向量[a1a2…aM]。

GBRT的特征映射可以理解为有监督的特征编码。从根节点到叶子节点的遍历代表了特征的组合规则。使用组合特征训练BP模型实质上是学习这些规则集的权重[25]。最终,提取的特征作为SVR模型的输入。

利用GBRT进行特征映射的算法总结为算法2,具体如下所述。

输入:(xi,yi),i=1,2,…,N;

输出:Ci,i=1,2,…,N。

1.在M轮迭代后可以得到M棵树,组成GBRT的特征映射模型

2.form=1 toMdo

3.某输入的样本经过第m棵树并最终落在该树的一个叶子节点。最终,根据该样本x所落下的节点位置可以得到一个二值向量αm,即

αm=[ν1ν2…νKm]

(5)

4.end for

5.最终得到新的特征向量,即

Ci=[α1α2…αM],i=1,…,N

(6)

1.3.3 利用CNN提取时频图的深层特征

将PPG信号的时谱图用作CNN的输入,使用CNN提取特征的过程如图7所示。在这项工作中,CNN模型包含3个CNN块和一个全连接层。每个CNN块均由1个卷积层、1个激活层和1个最大池化层组成。卷积层通过较小尺寸的滤波器提取细节特征。激活层使用线性整流函(rectified linear unit,ReLU)加速训练过程并防止出现梯度消失。另外,池化层可以提取主要特征并使特征图更小,以防止模型发生过拟合。卷积层和池化层将原始数据映射到潜在特征空间,而全连接层的作用则是将学习到的特征映射到样本标签空间。

图7 CNN特征提取示意图

最后,将CNN提取的时频图的深层特征作为SVR的输入。

1.4 SVR模型

由于PPG和BP之间存在非线性关系,因此本文使用非线性回归方法SVR来估计BP。本文利用GBRT和CNN提取潜在空间特征,并将其作为SVR的输入以建立BP估计模型。SVR是一种机器学习技术,它基于结构风险最小化原则,可以防止过拟合,并且SVR具有强大的泛化能力。本文用径向基函数(radial-basis function, RBF)作为SVR的内核函数。

2 实验结果与分析

2.1 实验设置

(1) 数据集。本文使用UCI-BP数据库[26]进行实验验证,其包含从MIMIC II数据库[27]收集的12 000条记录。这些数据是从多家医院的患者进行信号的采集而得到的,包括PPG、ECG和主动脉血压(aorta blood pressure,ABP)信号。其中,利用指夹式光电脉搏传感器从指尖采集24 s的PPG信号,并同时从主动脉有创地测量ABP信号,其信号采样率均为125 Hz。在这项工作中,本文提取了ABP的波峰和波谷,并将波峰和波谷的幅度平均值作为SBP和舒张压(diastolic blood pressure,DBP)。此外,本文计算ABP的平均值作为平均动脉血压(mean arterial blood pressure,MAP)。UCI血压数据库的样本分布图如图8所示。

图8 UCI血压数据库样本分布图

(2) 评估指标。本文使用平均绝对误差(mean absolute error,MAE)、标准误差(standard deviation of error,SDE)和均方根误差(root mean square error,RMSE)来评估结果,定义如下:

(7)

(8)

(9)

(3) 参数设置。参数选择折线如图9所示,通过固定其他参数仅调整一个参数并使BP估计的MAE最小,从而确定GBRT的最佳参数值。在本文实验中,用于DBP、MAP和SBP估计的基学习器的最佳数量设置为200、200和600,学习率分别为0.01、0.015和0.001,树的最佳深度为15。

图9 参数选择折线图

此外,本文中CNN选择Adam优化器,模型训练的批量学习大小为100,学习率为0.01。

2.2 实验验证

将GBRT和CNN提取的潜在空间特征作为SVR的输入,构建BP估计模型。本研究使用四折交叉验证进行训练以提高泛化能力。基于不同特征和模型的血压估计准确性的比较见表1所列。

表1 基于不同特征和模型的血压估计准确性比较

本文比较了使用原始特征和潜在空间特征的BP估计模型的性能。另外,将仅使用GBRT或CNN进行BP估计的实验结果作为比较对象。实验结果表明,潜在空间特征可以显著提高BP估计的准确性。

与仅使用GBRT的模型相比,由SVR使用GBRT提取的潜在空间特征构建的BP估计模型将MAE降低约6%。

同样,将CNN提取的特征输入到SVR中以构建BP估计模型,该模型的效果要优于仅使用CNN的BP估计模型。此外,由GBRT提取的特征训练的BP估计模型的性能比其他模型稍好,但与本文提出的方法相比,其BP估计的MAE增加了大约10%。但是,使用时频图作为CNN的输入来构建BP估计模型的效果最差,这可能是因为仅使用时频图无法充分表达PPG和BP之间的潜在联系。

DBP、MAP和SBP的Bland-Altman图[28]以及线性回归图如图10所示。图10中:图10a～图10c为Bland-Altman图;图10d～图10f为线性回归图。

图10 BP估计的Bland-Altman图以及线性回归图

从图10可以看出,DBP、MAP和SBP的估计误差大多在2 kPa之内。另外,估计的BP值与参考BP值之间的相关系数均大于0.7。但是有一些血压值很低的血压估计误差较大。为了评估模型对低血压(SBP≤12 kPa并且DBP≤8 kPa)、高血压(SBP≥19 kPa或者DBP≥12 kPa)、正常血压(除低血压和高血压外的范围)的估计效果,本文分别统计了不同范围内的血压估计情况,实验结果如图11所示。结合图8的分析可知,正常血压样本的数量最多,低血压样本的数量相对较少。因此，训练的血压估计模型能够学习到更多的正常血压和高血压样本的信息,从而对这两类的估计效果相对较好,而对于低血压来说,其训练样本所占比重较低,因此其血压估计精度比其他两类的稍差。

图11 不同血压范围的血压估计精度

此外,本文的方法还根据英国高血压学会标准(british hypertension society,BHS)进行评估,该标准根据累积误差百分比将BP预测结果分为3个级别。误差分布直方图如图12所示,分别计算了在4个BP估计误差范围的样本数,得到对应的MAE分布直方图。

图12 误差分布直方图

实验结果与BHS标准的对比见表2所列,根据BHS标准,本文所提方法的DBP和MAP的估计精度可以达到B级,并且SBP估计精度可以达到C级。

表2 实验结果与BHS标准的对比

2.3 对比试验

本文所提出方法与最近的研究方法的准确性比较见表3所列。

表3 本文所提出方法与最近的研究方法的比较

这些方法使用了不同的数据库,因此很难进行比较。为了保证公平性,本文在UCI-BP数据库上对所有这些方法的血压估计的准确性进行实验验证。实验结果表明,本文提出的方法优于最近的研究。其中文献[4]的方法表现最差,SBP的MAE达到1.76 kPa,与本文的方法相比,其MAE增加了50%。文献[4]提取了PPG的频域特征作为SVR的输入,以构建BP估计模型。然而,仅提取频域信息在表达PPG信号和BP之间的潜在关系方面表现较差。此外,本文方法比文献[8]的方法对SBP估计的MAE低15%,其使用基于整体的方法从PPG中提取特征向量,可以提高特征提取的准确性,并使用自适应Boosting回归估计BP。但是,自适应增强回归使用的是指数损失函数,该函数对异常值非常敏感,因此在嘈杂的样本上效果较差。此外,文献[7]和文献[20]的模型性能介于这2种方法之间。它们直接从PPG中提取时域特征作为机器学习模型的输入,但无法表示PPG信号的复杂结构特征。在这项研究中,本文致力于挖掘可能与BP相关的PPG信号的深层特征。

本文提取的潜在空间特征包括时域和频域2个方面。PPG及其导数信号的单周期波形作为原始时域特征,随后利用GBRT从原始时域特征中挖掘出高阶交叉特征,可以更好地描述信号的复杂结构特征。

此外,PPG信号的时频图被用作CNN的输入,以提取时频谱中蕴藏的深层特征。最后,将提取的潜在空间特征用作SVR的输入以构建BP估计模型。这项工作充分挖掘了与BP有关的信息,并且提取的潜在空间特征更全面地表达了PPG和BP之间的关系。与最近的研究相比,本文提出的方法比传统的机器学习算法具有更高的准确性,并且具有较强的泛化能力。

3 讨论

基于PTT的无袖带BP估计方法需要同步采集2个信号,这会给患者测量血压带来不便。因此,本文提出了一种基于单个PPG信号的BP估计方法。所提出的方法结合BP和PPG之间的非线性关系,充分挖掘PPG中与BP有关的信息,并利用SVR建立BP估计模型。

从PPG中提取准确有用的特征对BP估计具有决定性作用。通常PPG信号及其导数信号的时域和频域特征只能描述信号的一些直观特征,而不能描述信号更复杂的结构特性。但是,GBRT中每棵树的根节点到叶子节点的路径所代表的是不同的特征组合,因此可以得到可区分的特征。此外,CNN也可以在PPG信号的时频图中挖掘与BP相关的深层特征。因此,利用GBRT和CNN提取PPG信号中包含的高阶和深层特征,可以充分描述PPG信号中蕴含的与BP有关的信息,对提高血压估计的准确性具有重要意义。

实验结果表明，使用GBRT和CNN映射的潜在空间特征训练BP估计模型,可以使BP估计的MAE显著降低。此外,与其他最新方法的结果比较,本文所提出的方法在BP估计方面优于其他最新的方法。

然而,由于样本分布不均匀,低血压样本的数量较少,限制了血压估计模型对该类样本的血压估计精度。此外,本文中所使用的数据是对多家医院的患者采集的,有些数据可能会受到药物的影响。在本文研究中,忽略了药物的影响,而且数据库中缺少诸如年龄和性别等对血压估计有用的信息。

因此,在今后的工作中,本文将致力于提高BP估计精度,研究具有较强泛化能力的BP估计算法,并建立一个更完整的BP数据库,将基于PPG的无袖BP估计算法移植到实际应用中。

4 结论

本文提出了一种基于潜在空间特征的BP估计方法,该方法以PPG、VPG和APG单周期波形作为GBRT的输入,将特征映射到高维稀疏空间中。另外,利用CNN提取时频图的深层特征,并结合2种潜在空间特征,实现对PPG信号的充分表达。此外,考虑到PPG和BP之间的非线性关系,本文使用SVR构建血压估计模型。实验结果表明,该方法具有较高的BP估计精度。

本文所提出的方法在无袖带BP估计上提升了检测精度,但在样本分布不均匀的情况下,BP估计的准确性并不理想。例如BP值极高或极低的样本数量较少,以致模型在该类样本处性能较差。因此,后续的研究将致力于如何消除或降低样本分布对BP估计精度的影响。