基于LSTM模型的无袖带血压测量方法研究*

2023-03-23 07:44蒋泽宇赵宇波赵景波李清福
机电工程技术 2023年2期
关键词:脉搏网络结构直方图

蒋泽宇,赵宇波,赵景波,李清福

(1.青岛理工大学信息与控制工程学院,山东青岛 266520;2.山东产业技术研究院,山东青岛 266101)

0 引言

据世界卫生组织《柳叶刀》的《全球高血压流行趋势综合分析报告》显示[1],从1990 年至2019 年,30~79岁成年高血压患者人数从6.5亿人增加到12.8亿人,且呈现逐年上涨趋势。在调查东亚及东南亚人群中,对高血压的知晓率不足50%,这对于人口基数庞大且人口老龄化严重的中国,是一个亟需解决的问题。因此提高高血压的知晓率,找到一个便捷的、精准的血压测量方法变得十分重要。

血压测量方法可分为有创和无创两种方式。有创血压测量方法被誉为血压测量的金标准[2],但存在伤口感染的风险,不适用于日常血压测量。无创血压测量方法主要有张力测定法、恒定容积法、柯氏音法、示波法、脉搏波传播时间法以及脉搏波特征参数法[3]。柯氏音法和示波法的血压测量设备均使用袖带设计,长时间充放气会使被测者感到不适,而且设备携带不方便,无法实现连续血压测量。张力测定法、恒定容积法虽然可以实现连续测量,但仍需要对动脉施加一定压力,不利于长时间测量。因此,脉搏波传播时间法和脉搏波特征参数法脱颖而出,这两种血压测量方法适用于长时间的、随时随地的连续血压测量。但前者只考虑脉搏波传播速度和脉搏波传播时间来建立血压计算模型,研究表明[4],血压除了与脉搏波传播时间特征有关还与其他脉搏波特征存在很强的相关性。因此,需要考虑建立多个特征的血压计算模型来提高血压测量的准确度。脉搏波特征参数法基于光电容积描记技术(Photoplethysmography,PPG)获取人体的光电容积脉搏波,结合多个脉搏波特征参数建立血压计算模型,实现血压检测。这种方法常用于一些穿戴设备中,具有体积小、携带方便等优点。

PPG 是基于朗伯·比尔定律实现的[5],被广泛应用于脉搏波传播时间法和脉搏波特征参数法。其原理是:当LED 发出的绿光或红光照射到皮肤表面时,由于人体动脉血管中的血液是具有流动性的吸光物质,因此光线射到动脉时,不同时间段对光的吸收就会发生变化。经过这些吸光物质后,透射或反射出来的光线会被另一端的信号接收器接收,转化为电信号。最后按一定的频率进行采样,获得的波形为光电容积脉搏波[6],即PPG信号。

国内外对脉搏波特征参数法做了大量研究。Enric M[7]利用随机森林方法对血压进行测量,结果表明,加入PPG波形特征之外的个体信息(如年龄、体重、身高等)后在一定程度上可以提高测量的准确性。Gaurav A等[8]除了PPG 波形特征外还加入了心率变异性特征,结果表明,加入心率变异性特征可以提高测量的准确性。吴绍武[9]提取了15 个PPG 波形特征,并结合历史血压数据使用梯度推进机(Light Gradient Boosting Machine,LightGBM)进行血压测量,最终的结果满足AAMI 标准。上述文献虽然都加入PPG 波形特征之外的个体信息来提高血压测量的准确性,但未考虑到测量血压的时间这一重要因素。研究表明[10],人体血压会随时间变化呈现勺型、非勺型、反勺型。因此测量血压的时间对血压有重大影响,可以考虑加入此特征并结合其他个体特征以及PPG波形特征进行血压测量,进一步提高血压测量的准确性。

本文使用测量血压的时间、前一次测量结果以及当次PPG 波形特征进行血压测量。由于LSTM(Long-Short Term Memory,LSTM)算法对时间序列数据处理能力显著,不容易出现梯度消失和梯度爆炸的情况[11],且具有长期短期记忆能力。因此,本文使用LSTM 算法建立血压计算模型,并对比不同网络结构的LSTM 测量精度,找出最优的LSTM 网络模型。最后,与其他血压测量方法进行对比分析。

1 LSTM的基本框架

传统RNN 结构图如图1 所示,其隐藏层状态计算公式如下所示:

图1 传统RNN结构图

由于计算该时刻隐藏层信息时只用到上一时刻隐藏层信息和这一时刻的输入,因此传统RNN 无法实现长时记忆功能。

LSTM 内部结构图如图2 所示。相比传统RNN 结构,LSTM 内部增设了3 个门,分别对信息进行遗忘和记忆。3 个门分别为遗忘门、输入门和输出门[12],分别如式(2)~(4)所示。

图2 LSTM内部结构

式中:f(t)、i(t)、o(t)分别为遗忘门、输入门、输出门状态。

LSTM 除了比RNN 增加了3 个门来控制输入和输出信息之外,内部还包含了一个记忆细胞c(t),用来对之前重要的信息进行记忆[13],即长时记忆。该时刻记忆细胞的更新主要由两个阶段完成:

(1)遗忘阶段,经遗忘门后得到一组0~1的向量,0表示将无关信息全部遗忘,1表示将有用信息全部记住;

(2)短时记忆阶段,该阶段将h( )t- 1 和x(t)经过激活后得到一个候选细胞信息c~(t),输入门的作用是将c~(t)中有用的信息进行记忆[13]。

LSTM 内部结构和原理综上所述,通过增加多个门控状态来筛选输入信息并通过不断更新记忆细胞,从而实现长期记忆。相比较传统RNN,LSTM 对研究血压这种时间序列数据的优势突出。

2 数据处理与特征提取

2.1 数据预处理

本研究的数据是通过某公司的设备采集的,包含了542 个个体的数据信息。由于在采集数据过程中会受到测量环境光线干扰、被测人员肢体抖动、传感器运动等影响,采集的PPG 信号含有多种噪声[14],如高频噪声、低频噪声、无效噪声、随机噪声等。图3 为一段PPG 原始信号,由于受到不同频段噪声的干扰,导致该信号产生了基线漂移现象,需要进行降噪处理。降噪处理通常可以采用小波变换、傅里叶变换、中值滤波、维纳滤波等方法[15],由于小波变换可以将原始波形一些重要特征很好地保留下来[16],因此本文使用小波变换的方法去除噪声。具体步骤是:首先选用db8 小波将原始PPG 信号进行分解,然后将噪声所处的高频分量和低频分量置零,再设置软阈值将噪声进行滤波处理,最后进行小波重构。经小波变换处理完的PPG信号如图4所示。

图3 PPG原始信号

图4 小波变换后的PPG信号

2.2 特征提取

本研究提取的PPG 信号特征主要包括:PPG 信号峰值点、PPG 信号最大斜率点幅度、PPG 信号峰值点相对于PPG 信号起点的幅度、PPG 信号最大上升沿斜率点到PPG 结束点之间的面积、PPG 信号重搏波相对于PPG 信号起点的幅度、PPG 信号起点到PPG 重搏波节点之间的时间间隔与整个PPG 宽度的比值、PPG 信号起点到PPG信号结束点之间的时间间隔等42 个特征。一个波段的PPG波形信号特征如图5所示。

图5 一个波段的PPG波形信号特征

2.3 数据集分割

该数据集的数据总数为6 931 条,除PPG 信号特征外,该数据集还包含被测者的真实收缩压、真实舒张压、测量时间以及年龄等个体信息。收缩压频率分布直方图如图6所示,舒张压频率分布直方图如图7所示,年龄频率分布直方图如图8 所示。该数据集收缩压和舒张压范围分别为80~184 mmHg 和47~114 mmHg。年龄分布范围为25~87岁,平均年龄为64.9岁。

图6 收缩压频率分布直方图

图7 舒张压频率分布直方图

图8 年龄频率分布直方图

为了提高血压计算模型的泛化能力,本研究对542个个体的数据进行10 折交叉验证,且测试集个体的数据信息不包含在训练集中。将9折数据作为训练集,1折数据作为测试集,分别进行10次模型训练,取10次结果的平均值作为最后的测量结果。

3 实验设计与结果分析

由于人的血压会随测量时间变化发生不同程度的波动[10],所以将测量血压的时间作为一个重要信息加入模型进行训练。此外,历史血压数据也是一个重要特征[9]。本研究将测量血压的时刻、前一次测量结果以及当次PPG 波形特征一起放入LSTM 中进行模型训练,通过训练多个神经网络来确定LSTM 隐藏层层数和神经元数量,找出最优的LSTM模型。

本研究对比了不同网络结构的LSTM 模型,设置的隐藏层层数为1~2 层。分别搭建了8 组LSTM 模型进行血压测量,结果均采用10 折交叉验证方法取均值。不同网络结构的LSTM 模型参数如表1 所示。不同网络结构的LSTM 模型测评结果如表2 所示。不同网络结构LSTM 模型SBP 的MAE 测评结果曲线如图9 所示。不同网络结构LSTM 模型SBP 的SD 测评结果曲线如图10 所示。不同网络结构LSTM 模型DBP 的MAE 测评结果曲线如图11 所示。不同网络结构LSTM 模型DBP 的SD 测评结果曲线如图12所示。

图9 不同网络结构LSTM 模型SBP的MAE测评结果曲线

图10 不同网络结构LSTM 模型SBP的SD测评结果曲线

图11 不同网络结构LSTM 模型DBP的MAE测评结果曲线

图12 不同网络结构LSTM 模型DBP的SD测评结果曲线

表1 不同网络结构的LSTM模型参数

表2 不同网络结构的LSTM模型测评结果

从10折交叉验证的结果可以得到以下结论。

(1)对于1层隐藏层的LSTM 模型,随着神经元数量增加,SBP 和DBP 的MAE 和SD 总体呈现下降趋势。SBP的MAE 从神经元数为16 的4.586 mmHg 下降到神经元数为128的4.288 mmHg,下降了0.298 mmHg;SD从神经元数 为16 的6.392 mmHg 下 降 到 神 经 元 数 为128 的6.117 mmHg,下降了0.275 mmHg。而DBP 中,神经元数为16到神经元数为32 的MAE 和SD 几乎不发生变化。在此之后,随着神经元数量的增加,MAE 和SD 逐渐下降,从神经元数为32 的2.770 mmHg 和3.919 mmHg 下降到神经元数为128 的2.681 mmHg 和3.857 mmHg,MAE 和SD 分别下降了0.089 mmHg和0.062 mmHg。

(2)对于两层隐藏层的LSTM 模型,随着神经元数量的增加,SBP 和DBP 的MAE 和SD 呈现下降趋势。SBP的MAE 从神经元为{16,8}的4.658 mmHg 下降到神经元为{128,64}的4.303 mmHg,下降了0.355 mmHg;SD 从神 经 元 为{16,8} 的6.506 mmHg 到{128,64} 的6.130 mmHg,下降了0.376 mmHg。DBP 的MAE 从神经元为{16,8}的2.945 mmHg 下降到神经元为{128,64}的2.697 mmHg,下降了0.248 mmHg;SD 从神经元为{16,8} 的4.100 mmHg 下 降 到 神 经 元 为{128,64} 的3.865 mmHg,下降了0.235 mmHg。

对比结果发现,隐藏层数少,神经元数量多的模型表现较好。结果最优的模型的编号为4,该模型隐藏层数为1,神经元数为128,SBP 和DBP 的MAE 和SD 分别为 4.288 mmHg、6.117 mmHg 和 2.681 mmHg、3.857 mmHg。最终选择的LSTM网络结构如图13所示。

图13 LSTM网络结构

对于编号为4 的模型,取10 折交叉验证中的第1 折结果进行分析。收缩压计算误差频率分布直方图如图14所示。舒张压测量误差频率分布直方图如图15 所示。收缩压测量值和真实值分布图如图16 所示。舒张压测量值和真实值分布图如图17 所示。由图14 和图15 可知,测量的SBP 误差多数分布在-5~5 mmHg 之间,最大误差分布在-25~30 mmHg 之间;测量的DBP 误差多数分布在-5~5 mmHg 之间,最大不超过±20 mmHg。由图16和图17可知,SBP 和DBP 计算模型的决定系数R2分别为0.74 和0.83,决定系数R2均接近1,说明LSTM 模型的测量值接近真实值,尤其是在DBP测量上表现更为明显。

图14 收缩压测量误差频率分布直方图

图15 舒张压测量误差频率分布直方图

图16 收缩压测量值和真实值分布图

图17 舒张压测量值和真实值分布图

将本研究方法与其他深度学习方法进行对比,结果如表3所示。对比表3数据可以发现,本研究方法测量的SBP 的MAE 仅高于李帆等[17]使用LSTM 的测量结果,且数值相差不大,而本研究方法SBP的SD、DBP的MAE以及DBP 的SD 均低于其他血压测量方法。相比其他方法,本研究有效利用了时间与血压的关系并结合其他与血压有关的重要特征,最终测量的SBP 和DBP 的MAE 均小于5 mmHg,SD 均小于8 mmHg,符合AAMI 标准,同时获得了较高的测量精度。

表3 本研究方法与其他深度学习方法的对比

4 结束语

本文利用日间血压呈现勺型、非勺型或反勺型的特点,将测量血压的时刻、前一次血压数据以及当次PPG波形特征一起加入到LSTM 中进行模型训练。通过对比多个血压计算方法,最终发现基于LSTM 模型利用以上特征对血压进行计算可以获得较高的准确性,对于方便无扰、精准有效地预测高血压,有效降低高血压的发病率,提高高血压的知晓率有着重要意义。另外,由于高血压患者日间血压呈现非勺型、反勺型,在今后研究中可以利用这个特点,结合时间特征,先将高血压患者以及其他血压人群进行分类,再对不同人群进行血压测量,从而进一步提高血压测量的准确性。

猜你喜欢
脉搏网络结构直方图
符合差分隐私的流数据统计直方图发布
用直方图控制画面影调
用心感受狗狗的脉搏
《今日评说》评今日浙江 说时代脉搏
基于51系列单片机的穿戴式脉搏仪的设计
中考频数分布直方图题型展示
近红外可穿戴设备中脉搏波的呼吸率检测
基于空间变换和直方图均衡的彩色图像增强方法
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用