基于注意力机制及图循环神经网络的高血压预测系统设计

2022-05-11 08:57徐浩东王建锋
科学技术创新 2022年13期
关键词:邻接矩阵顶点加速度

徐浩东 王建锋

(西京学院,陕西 西安 710000)

1 概述

高血压是指以体循环动脉血压增高为主要特征,是常见的慢性病。除评估诊室血压外,患者还应注意家庭清晨血压的监测和管理,所以可穿戴设备可以提供持续的动态监测对控制血压、降低心脑血管事件的发生率带来了巨大的帮助。目前,可穿戴设备通常利用单模态数据进行血压预测[2],例如心电信号、加速度信号等,其预测效果尚未达到临床诊断的预期。本文提出了基于注意力机制和图循环神经网络的高血压预测系统,该系统将患者的多模态生理信号以图(Graph)的形式表征,已有的高血压检测研究表明,多种临床器械联合应用能够明显提高临床时间的检出准确率。同时,注意力机制的引入将会考虑患者间的个体差异性,当可穿戴设备佩戴在用户手腕时,传感器设备将持续动态地上传各项生理参数数据,云端服务器根据个体的差异调整模型,提高模型的病理分析能力。

2 研究内容

2.1 方案设计

系统的整体工作流程分为:线下模型预训练过程和在线模型训练测试过程。其中线下预训练过程步骤包括:a.搭建基于可穿戴设备、智能手机和云平台服务器的数据平台。包括存储层和数据处理层。b.采集可穿戴设备及其传感器测量的数据。数据包括PPG 数据,三轴加速度数据,心率、血氧饱和度、血压和体温。c.用户填写基本信息。数据包括姓名、性别、年龄等。d.由专业医护人员报告监护高血压事件发作的事件和表现。e.根据采集的传感器信息、静态信息和高血压发作事件报告建立基于图长短时记忆单元和注意力机制的深度神经网络,并将训练好的模型部署至云服务器。系统线下实施流程图如图1 所示。

在线训练测试步骤包括:a.采集可穿戴设备及其传感器测量的数据。数据包括PPG 数据、三轴加速度数据、心率、血氧饱和度、血压和体温。b.通过更新的数据和已填写的用户基本信息进行模型的测试,分析临床事件发作的风险。c.根据用户的报告,在已有模型上分别对用户报告的结果进行训练,建立针对各个用户独立的模型。系统在线实施的流程图如图2 所示。

图2 系统在线实施流程

2.2 数据表示及关系提取

医学临床的时序数据包括多种数据源,一般可表示为X={Xbase,Xwave}。其中,Xbase=[x1,x2, ...,xn],n∈N+表示临床静态数据,如性别、年龄等。Xwave为多通道时序波形或生理参数数据,可以表示为:

这里的m 表示通道个数,n 表示在时间t 内采样序列的长度。从不同通道采集到的序列代表着不同的物理意义。临床诊断任务表明将患者的多模态数据联合使用在预测准确率上比使用单一模态数据有明显提高。同时不同模态数据之间存在一定的关联关系,为了表征数据间的相互关系并提取深层的语义信息,本文引入图的概念。图是由顶点(Vertex)集合及连接顶点间的边(Edges)组成的一种数据结构。其定义为:

G=(V,E)

其中V={vi|i=1,2,...N} 表示所有顶点的集合,表示顶点的个数。E={eij|vi,vj∈V},|E|≤N2表示顶点与顶点之间所连接的边。图的表示形式有三种,分别为邻接矩阵、度矩阵和邻域。当顶点个数较为稠密时,邻接矩阵是比较合适的表达方式,本文也将利用邻接矩阵的形式表征多模态数据。邻接矩阵是一个元素为bool 值或权值的N×N矩阵,若图中存在一条连接顶点vi和vj的边eij,则aij≠0,否则为0,该矩阵的定义如下:

可穿戴设备及其传感器所采集的数据包括PPG 信号、三轴加速度数据、心率、血氧饱和度、血压、体温。临床医学诊断过程中发现多模态数据PPG 信号会受到运动伪轨迹的影响,因此它与三轴加速度信号直接相关,同时PPG 信号与心率和血氧饱和度也存在一定的关联关系,而与体温数据没有关联。本文利用无向图表示多模态数据,因此构造的邻接矩阵Aij是一个对称方阵,且主对角线元素均为0,横纵坐标表示的通道信号分别为PPG、加速度x 轴、加速度y 轴、加速度z 轴、血氧饱和度、血压、温度以及心率。若通道之间存在相互关系则权值表示为1,否则为0。邻接矩阵将和多模态数据一同作为参数送入Graph LSTM 网络中,网络将提取各数据间的语义信息。

2.3 图循环神经网络单元

公式中xt为t 时刻的输入通道向量,ht为当前时刻的

图3 Graph LSTM 内部结构

2.4 基于注意力机制的预测网络模型

神经网络模型主要包括Graph LSTM、位置编码器、多头自注意力模块以及预测模块,整体框架如图4 所示。

图4 神经网络模型框架

2.4.1 位置编码器

为了整合关于序列顺序的信息,模型将经过Graph LSTM 得到的隐状态向量加入位置编码[5]为时间戳提供相对位置信息,这样做的好处在于既符合临床诊断的一般规律也提高了模型的可解释性。通过位置编码器部分,将位置向量pt加到隐状态矩阵上,输出向量Pn的维度与Hwave保持一致:

静态信息Xbase经过嵌入后表示为Pbase,与多通道时序数据处于同一维度空间,因此在传入注意力机制之前所有数据可以使用矩阵P 来表示:P=(Pn,Pbase)。

2.4.2 多头注意力机制

这里的Wq、Wk和Wv为投影矩阵,不同多头注意力子层之间不共享投影矩阵参数,因此可以在不同空间中捕获输入向量之间的相互关系,自注意力层的输出通过拼接和经过全连接层的操作后将包括全局的向量特征,实现信息融合。经过多头注意力机制高血压患者的静态信息以及多模态动态数据可以用P*来表示:P*=(P*n,P*base)。为了预测高血压在某时间窗口病发与否,我们将经过多头注意力机制的输出张量P*转换为一个二维向量完成二分类任务。在这里,本文引入了个性化特征注意力整合方法,具体来说查询向量Query 由静态信息P*base得到,而键向量Key 则通过P*n得到。计算公式如所示:

3 研究总结

本文提出的基于注意力机制及图循环神经网络的高血压预测系统将多模态数据利用图的形式表示并转换成结构化数据,利用Graph LSTM 作为浅层网络提取多模态数据,提高了模型在预测高血压任务上的准确率和鲁棒性。其次,注意力机制的引入在原有模型的基础上进一步对特征向量进行融合,利用训练得到的注意力权重合理的分配计算资源,提高模型运行时的效率。静态信息和动态序列数据的共同作用,使得该预测方法可以根据高血压患者的特点做个性化诊断。

猜你喜欢
邻接矩阵顶点加速度
“鳖”不住了!从26元/斤飙至38元/斤,2022年甲鱼能否再跑出“加速度”?
过非等腰锐角三角形顶点和垂心的圆的性质及应用(下)
过非等腰锐角三角形顶点和垂心的圆的性质及应用(上)
天际加速度
创新,动能转换的“加速度”
死亡加速度
基于邻接矩阵变型的K分网络社团算法
基于子模性质的基因表达谱特征基因提取
数学问答
一个人在顶点