王 瑶,杨天顺,王金海,韦 然,赵晓赟
(1.天津工业大学 生命科学学院,天津 300387;2.天津大学 精密仪器与光电子工程学院,天津 300072;3.天津工业大学 电子与信息工程学院,天津 300387;4.天津市胸科医院呼吸与危重症医学科睡眠中心,天津 300222)
睡眠呼吸暂停是一种常见的睡眠呼吸紊乱症状[1]。伴随着呼吸间歇性地中止,呼吸暂停可导致人体血氧饱和度降低,增加心血管疾病、阿尔兹海默症等多种疾病的患病风险[2-3]。目前多导睡眠监测是呼吸暂停诊断的标准方法[4]。在多导睡眠监测中,需要记录脑电(electroencephalogram,EEG)、心电、呼吸气流以及血氧饱和度等多种生理参数,并需要综合分析这些生理参数来判定呼吸暂停的发生,此外,多导睡眠监测过程操作复杂,需要专业医师在睡眠实验室中进行,难以实现家用普及[5-6]。因此,研究者们尝试减少生理信号的采集种类[7-8],采用基于人工智能的方法实现呼吸暂停的自动检测,从而降低呼吸暂停的检测难度,为便携式呼吸暂停检测提供理论及技术支撑。
相对于心电、呼吸气流等其他信号,脑电信号因受内源性疾病(如呼吸不规律、心律不齐等)干扰较小,在呼吸暂停检测中得到了越来越广泛的应用[9-12]。研究中对呼吸暂停患者的脑电主要采取2 种分析方法:一种是常规方法,如时域分析、频域分析和时频域分析;另一种为非线性动力学的方法,EEG 是由低维混沌神经过程产生的,不同的大脑活动状态具有不同的非线性动力学特性,脑电非线性动力学分析已被成功地应用到癫痫诊断以及情绪识别等领域[13-15]。为了更好地表征呼吸暂停期间的脑电特性,越来越多的非线性动力学方法被用于脑电的特征提取。
Goshvarpour 等[16]对呼吸暂停患者脑电信号的最大李雅普诺夫指数(largest Lyapunov exponent)进行分析,发现呼吸暂停期间,脑电信号的最大李雅普诺夫指数低于正常时期。周静[17]对呼吸暂停患者脑电信号的关联维数(correlation dimension)进行分析,研究发现,呼吸暂停患者脑电的关联维数在各个睡眠阶段均低于正常人。然而,不管是关联维数还是李雅普诺夫指数,其对信号噪声、采样率、信号长度等因素都比较敏感[18-19],难以用作评估呼吸暂停脑电状态的稳定性指标。相比之下,基于时间序列复杂性的度量能在一定程度上解决上述问题[20],而且该方法所需数据量较少,更适合于有限长的脑电信号分析。
熵是一种广泛应用于非稳态脑电信号中的基于时间序列复杂性的度量方法,对此,天津工业大学团队[21-22]采用样本熵和近似熵的特征提取方法,使用机器学习模型对呼吸暂停事件和正常事件分类,取得了约90%的准确率。然而,样本熵和近似熵在定义向量相似性时使用Heaviside 函数,Heaviside 函数的不连续边界问题导致其对小参数比较敏感。与样本熵和近似熵不同,模糊熵引入模糊隶属函数代替Heaviside 函数。模糊隶属函数具备连续性和非突变性的特点[23-24],当小参数发生细微变化时,在指数函数规则下,对熵值的影响不大,因而有效地解决了熵变异问题,对噪声具有更好的鲁棒性,可以实现更精确的复杂性的度量。因此,本研究将模糊熵的算法应用到睡眠脑电特征提取中,并建立机器学习自动分类模型,以实现呼吸暂停事件的快速识别。
本研究所提出方法的技术路线如图1 所示。首先,对脑电信号进行预处理,建立用于实验的样本库;然后,使用基于模糊熵的算法对呼吸暂停脑电信号进行特征提取;最后,建立机器学习自动分类模型,对特征进行分类,从而实现呼吸暂停事件的自动识别。
图1 检测方法技术路线框图Fig.1 Block diagram of technical route of detection method
由于脑电信号幅值微弱,随机性强,极易受到噪声影响,所以在特征提取前需要对脑电信号去噪。研究证明,巴特沃斯滤波器可以有效地用于处理非平稳信号[25],因此,本研究采用了巴特沃斯滤波器对原始脑电信号进行滤波。其中,巴特沃思滤波器的阶数设置为4,通带频率设置为0.2~49 Hz。为了更精确地捕捉呼吸暂停期间脑电信号的变化,本研究按照脑电节律将脑电信号划分为delta[0.25~4)、theta[4~8)、alpha[8~12)、sigma[12~16)和beta[16~49)Hz 等5 个子带信号[12]。
模糊熵是衡量时间序列复杂性和规律性的一种分析方法[24],表达了当维数变化时,时间序列中产生新模式的概率大小,产生新模式的概率越大,序列越复杂,模糊熵的值也就越大。本研究中脑电模糊熵的定义如下:
对长度为N 的脑电信号{u(i)∶1≤i≤N},设嵌入维数为m,根据序列顺序重构生成一组m 维向量
式中:1≤i≤N-m+1,u0(i)定义为:
式中:n 和r 分别为模糊函数边界的梯度和宽度。
定义函数:
重复式(1)—式(5),构造m+1 维向量
最后得到脑电信号模糊熵为:
本研究中设置m=2,n=3,r=0.15×std(std 为脑电信号标准差)。这样,对于每个呼吸事件对应的脑电片段,计算得到5 个模糊熵特征。
为避免使用单一分类模型带来偶然性结果,本研究使用了k 最近邻(k-nearest neighbors,KNN)、支持向量机(support vector machines,SVM)和随机森林(random forest,RF)等3 种机器学习分类算法对呼吸事件进行分类,所有的分类算法都在MATLAB R2018b 中设计完成。
KNN 是一种广泛使用的机器学习分类算法[26]。它的基本思想是输出样本类别取决于该样本k 个近邻样本的属性,即在样本空间中,如果某个样本的大多数相邻样本都属于一个类别,则该样本也将被分类为这一类别。在本研究中,k 的值设置为7。
SVM 是基于结构风险最小化原则提出的一种机器学习方法,具有严格的理论和数学基础,适用于解决小样本、非线性和高维度的模式识别问题[27]。使用SVM 对目标进行分类的核心思想是寻求一个满足分类要求的最优超平面,使训练集中的点离超平面的距离尽可能的远。对于线性不可分离的数据,在SVM 中使用核函数将低维空间中不可分离的特征向量映射到易于分离的高维特征空间。
RF 是一种基于分类树的模型,具有良好的抗噪声和抗过拟合性能[28]。它的基本原理是有放回的在样本空间中抽取m 个样本,构建若干个相互独立的决策树。当有新的样本输入时,每个决策树都会给出一个该样本的分类结果,最终被最多决策树输出的类别作为随机森林模型的输出。
按照临床中各类呼吸暂停事件发病率的比例,本研究数据集中阻塞性、混合性和中枢性呼吸暂停事件的组成比例为6∶3∶1。将构建好的数据集以3∶1 的比例划分为训练集和测试集,其中训练集采用10 折交叉验证的方法对机器学习模型进行参数调优,测试集用来检验模型的分类效果。在模型的评价中使用了准确率(A)、灵敏度(S)和精确度(P)等指标。
(1)准确率表示分类结果的总体正确率:
式中:TP表示阳性样本中被模型预测为阳性的数量;TN表示阴性样本中被模型预测为阴性的数量;FP表示阴性样本中被模型预测为阳性的数量;FN表示阳性样本中被模型预测为阴性的数量。以下同理。
(2)灵敏度又称为查全率,表示所有在实际为阳性的样本中被预测为阳性的概率:
(3)精准度又叫查准率,表示所有被预测为阳性的样本中实际为阳性的概率:
为验证方法的可靠性,本研究使用了来自2 个独立数据库的脑电信号。其中,临床数据来自于天津市胸科医院睡眠监测实验室,共包含了30 名被试(7 名女性和23 名男性)的4 701 段脑电信号片段。受试年龄范围为37~78 岁;身体质量指数在19.82~39.26 kg/m2范围内;呼吸紊乱指数在8.2~68.9 范围内;采样率为100 Hz。公共数据库数据来自柏林圣文森特大学睡眠障碍监测实验室,共包含了25 名被试(4 名女性和21名男性)的3 200 段脑电信号片段。受试年龄范围为32~51 岁;身体质量指数在25.1~42.5 kg/m2范围内;呼吸紊乱指数在1.7~90.9 范围内;采样率为128 Hz。2 个数据库中的脑电采集都使用了C3-A2 和C4-A1 导联,并且由睡眠专家将脑电信号片段标记为呼吸暂停事件和正常呼吸事件。脑电信号片段如图2 所示。
图2 脑电信号Fig.2 EEG signals
图3 和图4 分别展示了从公共数据库和临床脑电数据中提取的模糊熵特征值。
图3 模糊熵特征值(公共数据库)Fig.3 Features of fuzzy entropy(public data)
图4 模糊熵特征值(临床数据)Fig.4 Features of fuzzy entropy(clinical data)
由图3 和图4 可以看出,对于子带信号delta、theta 和alpha,呼吸暂停期间的脑电模糊熵低于正常呼吸时期;对于子带信号sigma 和beta,呼吸暂停期间的脑电模糊熵高于正常呼吸时期。由此可见,脑电模糊熵特征能有效地表征呼吸暂停引起的脑电信号的变化。
考虑到脑电信号随机性强,不同个体之间差异往往比较大,为此本研究采用了2 个相互独立的数据库对所提出方法进行验证,表1 和表2 分别呈现了基于数据库和临床数据的结果。
表1 公共数据库分类结果Tab.1 Classification performance for public database
由表1 和表2 可以看出:
(1)基于双导联脑电信号,使用RF 模型在公共数据库和临床数据中取得的最高准确率分别为93.25%和94.50%;
(2)对比不同导联下的结果可以发现,使用双导联脑电信号的呼吸暂停事件检测效果要优于使用任何一种单导联脑电信号;
(3)对比不同分类器的结果可以看出,使用RF的效果优于KNN 和SVM;
(4)采用相同导联的脑电信号和分类器,对比基于公共数据和临床数据得到的评价指标可以看出,除了基于C4 导联脑电信号的评价指标的差距在5%左右,基于另外两组脑电信号的差距都不超过2%,这表明本研究所提出的方法具有一定的稳定性和可靠性。
为了客观比较基于模糊熵和文献中其他非线性动力学方法[17,21,29]的呼吸暂停事件的分类效果,本研究采用相同的模型评价指标,基于相同的脑电数据集,对本文提出的特征提取方法和文献中已有的方法进行验证,基于双导联脑电信号和RF 分类模型的结果如图5 所示。
图5 不同非线性方法结果对比Fig.5 Comparison of results of different nonlinear methods
由图5 可以看出,和基于脑电关联维数[17]的方法相比,本研究所提出的方法在2 个数据库中的结果波动较小,具有更好的算法稳定性;和样本熵以及LZ 复杂度[29]等方法相比,基于模糊熵的方法在准确率,精确度和灵敏度3 个模型评价指标中都有了显著提升。
本研究提出了一种基于脑电模糊熵的呼吸暂停事件检测方法。在该方法中,根据脑电节律将脑电划分成不同频率的子带信号,在子带信号中提取模糊熵特征,作为机器学习分类模型的输入,以区分睡眠呼吸暂停事件和正常呼吸事件。特征提取结果显示,模糊熵可以有效地表征呼吸暂停引起的脑电信号的变化;分类结果表明,随机森林模型在公共数据和临床数据中分别取得了93.25%和94.50%的准确率,并且具有更好的稳定性。该研究使用单一脑电信号实现了呼吸暂停事件的快速检测,可移植到便携式呼吸暂停检测设备中,以弥补医用多导睡眠监测无法家用普及的不足。