陈真诚,牛春望,朱健铭,梁永波
(1.桂林电子科技大学电子工程与自动化学院,广西桂林541004;2.桂林电子科技大学生命与环境科学学院,广西桂林541004)
呼吸是人体生理信息监测中的重要生理参数。近年来,人类呼吸道疾病的发病率一直在增加。随着社会的进步和医疗事业的发展,呼吸波信号的实时提取以及准确性研究日益受到广大科研人员的关注;呼吸波信号的高精度和高准确性提取对于临床实践、门诊监测、重症监护、压力测试和睡眠障碍调查具有重要的意义[1-2]。
光电容积描记法(PPG)是一种无创检测人体心血管脉搏波的光学方法,人体的脉搏波由人体心跳引起的动脉血容量的周期性脉动产生[3],PPG信号是一种复合信号,在0.007~1.5 Hz区间有五种不同的频率分量。这些频率的来源成分可能与呼吸、血压控制、体温调节、自主神经系统(ANS)和心脏同步脉搏波形有关[4]。
目前,通过PPG信号获取人体呼吸信号的方法主要有小波分析(Wavelet Approach)法,主成分分析(principal component analysis,PCA)法,经验模态分解(EMD)法等。在时频信号分析中,小波分析法可以很好地观察信号的局部特征,但是冗余度比较大,不具备自适应性[5];国外学者提出了PCA法,它是一种用于降低多元素维度的技术,使信息不会有太多的损失;但是对于非平稳信号具有一定的局限性,存在的运动伪影使最后提取呼吸的准确性比较低[4];EMD是Huang等人在1998年创造性提出的一种自适应信号时频分析方法,处理非线性非平稳信号时有良好的效果,呼吸波对PPG信号的缓慢调制的情况,使EMD算法的优势得到了很好地展现[6]。
MIMIC Database是美国麻省理工一个开放的大型数据库,记录了多样化和大量的重症监护病房患者详细的临床数据,这些去除身份的相关临床数据是由床边监视器获得的同时段的多路信号,包含ECG、PPG、RESP、ABP等;本研究采用了 MIMIC Database中15组重症监护病房患者的数据作为呼吸波提取方法研究的对象,采用的数据包含人体同时段的PPG信号和呼吸波(RESP)信号[7],其中 PPG信号用于数据源进行研究,RESP作为原始呼吸信号与PPG重构的呼吸信号进行对比。选用信号的采样频率是125 Hz、时间是60 s。PPG信号以及其主要的特征点见图1。
图1 PPG信号波形图Fig 1 PPG signals waveform
其主要特征点:A主波的顶点,B重搏波谷,C重搏波峰。
均匀呼吸下的RESP信号以及其主要的特征点见图2。
图2 RESP信号波形图Fig 2 RESP signals waveform
其主要特征点:A呼吸波的波峰,B呼吸波的波谷。
研究的整体思路框图见图3。
图3 整体研究思路框图Fig 3 Block diagram of overall research ideas
经验模态分解算法(EMD)是一种多尺度的分析算法,本质是通过数据中的时间尺度特征凭经验识别本征振荡模式,在对时频数据的分析处理时具有自适应性[1]。EMD算法将PPG信号分解为有限个IMF分量,每一个IMF分量都含有原先信号不同时间尺度的局部特征[8],低频 IMF分量代表着原始信号的渐变趋势或者缓变成分[6]。
IMF分量代表了数据中嵌入的振荡模式,由零交叉定义的每个周期中的IMF仅涉及一种振荡模式。据此定义,IMF分量不局限于窄带信号,对非平稳的信号同样适用[1]。运用EMD算法分解之后的IMF分量需要满足两个条件:
(1)在整个数据集中,极值的数量和零交叉的数量必须相等或最多相差一个;类似于静态高斯过程的传统窄带要求。
(2)在任何时间数据点上,由局部最大值定义的包络的平均值和由局部最小值定义的包络为零;理想情况下,数据的局部均值为零,将全部需求改为了局部需求,可以使瞬时频率不会受到不对称波形引起的波动[1]。
给定目标信号x(t),EMD算法分解过程如下:
(1)筛选过程中,令目标信号x(t)=h(t);
(2)找出h(t)的所有局部的极值,在最大值和最小值之间采用三次样条插值的方法计算出上部包络emax以及下部包络emin;
(3)计算出均值函数m(t)=(emax+emin)/2;
(4)得出目标信号和均值函数的差s(t)=h(t)-m(t);
(5)判断s(t)是否为 IMF分量,如果是,则进行下一步;否则令h(t)=s(t),重复(2)-(4)步,直至得出一个 IMF分量,r1(t)=s1(t);
(6)为了计算剩余 IMF分量,令x1(t)=x(t)-r1(t);
(7)重复上面的过程,可以得出第二个IMF分量r2(t);重复上述步骤,最终x1(t)是一个常值函数或者一个单调函数,分解IMF分量的算法完成;
可以得出,目标信号x(t)可以用各IMF分量之和以及残余分量zn(t)进行表示:
由于有限的信号长度以及不能完全确定端点处是否为极值点,则采用EMD算法对波形极值点进行三次插值时,信号两端的上、下包络可能出现幅值发散[9],导致两端的波形出现“畸形”,致使经验模态分解算法存在端点效应的问题。见图4,为了消除端点效应,目前主要使用对原始信号进行延拓的方法,比如镜像延拓、神经网络延拓等[9-10]。对于足够长的信号,也可以采用去除两端冗余的方法获取目标信号。
图4 原始信号和EMD算法分解重构信号Fig 4 Original signals,EMD algorithm decomposition and reconstruction signals
本研究选用MIMIC Database中提取的重症监护病房患者同时段的PPG信号和呼吸波(RESP)信号,采用滑动平均滤波法对PPG信号进行预处理。由于60 s的PPG信号全部呈现时挤压在一起不方便观察,故取10 s的数据进行对比,见图5。
滑动平均滤波法对N个非平稳非线性的数据,相邻一定长度的数据做局部平均,可以减少随机噪声引起的误差,使起伏的数据更加的平滑[11]。由图5可知,PPG信号在重搏波谷至重搏波峰的波形更加平滑,高频信号的干扰会影响结果的分析,采用滑动平均滤波方法对PPG信号进行预处理,可以较好的滤除PPG信号的基线漂移和高频信号的干扰。
采用经EMD算法对滤波之后的PPG信号进行分解,由图5可知,PPG信号的频谱主要在10 Hz以下,集中在0~5 Hz。本研究显示了各IMF分量10 Hz以下的频谱图,见图6。
图5 滑动平均滤波前后的PPG信号及其频谱图对比Fig 5 Comparison of PPG signals and their spectrograms before and after moving average filtering
图6 各个IMF分量及其频谱图Fig 6 Individual IMF components and their spectrograms
通过与原始呼吸信号(RESP)进行相关性的分析,选取与原始呼吸波信号相关性较高的IMF分量,由于原始呼吸波信号的频谱主要集中在1 Hz及以下,由图6可知,选取的与原始呼吸波信号相关性较高的 IMF分量是 IMF3、IMF4、IMF5、IMF6和IMF7。则这些相关性较高的分量之和就是重构之后的呼吸波信号,即PPG提取的呼吸波信号是由IMF3至IMF7的5个分量相加形成。
将PPG提取的呼吸波信号与原始呼吸波信号进行对比,结果见图7。
图7 原始呼吸波信号与PPG提取的呼吸波信号对比图Fig 7 Comparison of the original respiratory wave signals and the respiratory wave signals extracted by PPG
为了进行全面分析,本研究对PPG提取的呼吸波信号与原始呼吸波信号进行频域对比,结果见图8。
图8 原始呼吸波信号的频谱图与PPG提取的呼吸波信号的频谱图对比Fig 8 Comparison of the spectrograms of the original respiratory wave signals with the spectrograms of the respiratory wave signals extracted by PPG
对原始呼吸波信号和PPG提取的呼吸波信号采用AR模型进行功率谱密度分析,和FFT实现的传统方法相比,AR谱方法在频率分辨率方面有着显著的改善[12]。其功率谱图可以作为判断提取呼吸波的准确性因素之一[6]。原始呼吸波信号的功率谱和PPG提取的呼吸波信号的功率谱对比见图9。
呼吸速率的准确率是提取呼吸波准确性的重要指标,本研究的15组数据的呼吸速率的准确率见表1。
图9 原始呼吸波信号功率谱与PPG提取的呼吸波信号功率谱对比图Fig 9 Comparison of the power spectrum of the original respiratory wave signals and the power spectrum of the respiratory wave signals extracted by PPG
表1 原始呼吸波信号速率与PPG提取的呼吸波信号速率对比Table 1 Comparison of original respiratory wave signals rate and respiratory wave signals rate extracted by PPG
相关(Correlation)性与相干(Coherence)性都是衡量两个时间序列之间的相关程度,其中相关性是两个时间序列时域中的相似性;相干性是两个时间序列频域中的相关性。波形的相对相干系数(relative coherence co-efficient,RCC)的定义如下:
其中RXY(max)是原始呼吸波信号和PPG提取的呼吸波信号的相干系数最大值,RXX(max)是原始呼吸波信号的自相干系数最大值;结合两者基于AR模型的功率谱的相关系数进行分析。原始呼吸波信号与PPG提取的呼吸波信号数据分析对比见表2。
表2 数据分析对比Table 2 Data analysis and comparison
本研究通过对15组数据采用EMD算法从PPG中提取呼吸波信号,并与原始呼吸波信号进行对比。结果表明,呼吸速率的准确率均在90%以上,功率谱相关系数均在85%以上,相对相干系数同样表现出很高的相关性。PPG提取呼吸波的高准确性显示了该方法的优越性。