基于CNN与堆叠LightGBM的多模态OSA检测方法

2022-07-13 08:40林美娜郑和裕
自动化与信息工程 2022年3期
关键词:模态阈值卷积

林美娜 郑和裕

开发设计

基于CNN与堆叠LightGBM的多模态OSA检测方法

林美娜 郑和裕

(广东工业大学,广东 广州 510006)

提出一种基于血氧饱和度和心电图信号的多模态阻塞性睡眠呼吸暂停(OSA)检测方法。首先,提取血氧饱和度和心电图信号的经验特征,并利用皮尔逊相关系数获得最优特征集;然后,利用卷积网络(CNN)生成深层特征以挖掘不同模态间的潜在相关性;最后,构建堆叠的轻量级梯度提升机(LightGBM),以提高分类器检测精度。在公开数据集Apnea-ECG上进行四折交叉验证,平均准确性、敏感性和特异性分别为96.04%、96.44%和96.22%,相较于决策层融合有较高的分类性能。

阻塞性睡眠呼吸暂停;卷积网络;轻量级梯度提升机;血氧;心电图

0 引言

阻塞性睡眠呼吸暂停(obstructive sleep apnea, OSA)是一种常见的睡眠障碍[1],在睡眠时呼吸气流减少甚至停止数秒[2]。根据2019年柳叶刀呼吸医学杂志报导,全球30~69岁的人群中约有9.36亿人患有OSA[3]。因此,及时诊断和治疗OSA是必要的。目前,常用血氧饱和度(oxygen saturation, SpO2)和心电图(electrocardiogram, ECG)表征OSA[4],但SpO2下降存在延迟[5],而ECG反应迅速[6]。采用组合的SpO2和ECG有助于提高OSA的检测质量[7]。

近年来,许多专家学者提出基于SpO2和ECG信号特征组合的OSA检测方法。如,LI等[7]和PUNJABI等[8]提取SpO2和ECG信号的8个经验特征,并使用人工神经网络(artificial neural network, ANN)进行OSA检测。虽然考虑了不同信号的潜在相关性,但未进行特征选择,可能存在冗余特性;此外,数据集易受特征分布变化的影响,采用跨被试可减小此影响。

深度学习可得到更优的深层特征而被广泛应用于OSA检测。经MOSTAFA等[9]调查,近十年采用深度学习检测OSA的论文约有255篇。ERDENE-BAYAR等[10]分别使用一维和二维卷积网络对ECG进行OSA检测。VILLAR[11]评估深度学习的有用性以提高SpO2在OSA的自动检测能力。上述方法虽然可以实现OSA检测,但未考虑不同生理信号间的潜在相关性,检测精度受限。

特征生成在提高模型性能上可发挥重要作用[12]。BASTANI等[13]指出基于深度学习和树的方法可以提高特征的表征能力。HE等[14]指出轻量级梯度提升机(light gradient boosting machine, LightGBM)可以学习新的特征交互,增强特征表示,可利用其提取经验特征和深度学习生成的特征中更深层次的判别信息。

1 分类网络

1.1 问题描述

1.2 网络结构

本文提出的CNN和堆叠LightGBM网络结构流程及具体参数如图1所示。其中,LightGBM叶子数为8,树深为−1,估计器数量为50。对SpO2和ECG信号的原始数据预处理后提取经验特征,拼接后长度为133;将预处理后长度均为6000的片段输入CNN网络,提取每层卷积特征,与经验特征拼接输入Light-GBM;将融合结果与下层卷积特征及经验特征拼接,输入LightGBM,以此堆叠进行OSA检测。

图1 CNN和堆叠LightGBM的网络结构流程图

2 数据

2.1 数据集

本文使用Physionet[16]网站的公开数据集呼吸暂停-心电图数据库(apnea-ecg database, AED)[17],70条记录中8条包含SpO2和ECG,均来自不同的被试者,采样频率均为100 Hz,录制时间为401 ~578 min不等,注释“N”和“A”分别代表正常和OSA[17-18]。

2.2 数据预处理与划分

数据预处理:去除8条包含SpO2和ECG记录前后各30 s的异常信号,此时的原始标签相对原本标签位置向后推30 s;将数据切为不重叠的1 min片段,标注为A或N;对低于50%的SpO2进行线性插值以消除零电平伪影[11];采用卷积移动平均滤波器对ECG滤波,利用Christov方法[18]提取QRS波群,通过Hamilton方法[19]进行校验,计算两个R波的间隔并提取心率信号。

根据被试者不同,将8条记录划分为四折交叉验证,如表1所示。

表1 四折交叉验证的数据划分

2.3 特征提取

2.3.1 ECG特征提取及特征选择

为去除异常心率并滤除高频噪声,每隔2.4 s进行线性插值,使用周期图法[20]估计5min的心率信号的功率谱密度(power spectral density, PSD)和样本频率。设置阈值范围为0.005~0.03,间隔为0.002 5,提取5 min的PSD和样本频率特征。利用LightGBM进行四折交叉验证,不同阈值得到不同的受试者操作特征(receiver operating characteristic, ROC)曲线的面积曲线(area under the curve, AUC)和F1分数(F1-score),如图2所示。

图2 LightGBM对心率频率特征阈值范围实验结果

由图2可以看出,LightGBM对心率特征的最佳阈值范围在0.012 5~0.02之间。选择阈值为0.015,其平均ROC曲线如图3所示,AUC为94%,标准偏差为4%。

图3 阈值0.015对应的平均ROC曲线

表2 提取ECG的相关特征

2.3.2 SpO2特征提取

把SpO2片段的采样频率从100 Hz降低为1 Hz,提取一、二阶差分[24],得到向量长度为127。

一阶差分的表达式为

二阶差分的表达式为

式中:

3 实验结果与分析

3.1 实验环境

实验采用深度学习框架Keras,服务器CPU Intel(R)Core(TM)i5-6300HQ CPU @ 2.60 GHz,内存12 GB。

3.2 评估指标

使用准确性(accuracy, Acc)、敏感性(sensitivity, Se)、特异性(specificity, Sp)、平衡错误率(balance error rate, Ber)和AUC作为评估指标。

式中:

3.3 实验对比与分析

为验证本文模型能够挖掘不同信号间潜在相关信息,本文做4组实验:1)基于ECG的3层CNN网络模型,利用AED剩下的70 − 8 = 62条ECG记录训练CNN网络模型,再将本文划分的数据作为该模型输入;2)基于SpO2的3层CNN网络模型,即未加入堆叠LightGBM结构前的神经网络模型;3)基于SpO2和ECG的决策层融合(decision-level fusion, DLF);4)本文基于SpO2和ECG的CNN及堆叠LightGBM的网络模型。每组实验结果均为四折交叉验证的平均结果,前三组实验作为基线,如表3所示。

由表3可以看出:本文模型实验结果优于单独使用SpO2、ECG;与DLF模型相比,和分别提高了1.86%、1.15%,降低了1.15%;表明本文模型可以学习不同模态间潜在的相关信息,且效果优于决策层融合。

表3 不同网络模型的OSA检测性能对比

文献[25-26]使用AED数据的OSA检测性能对比如表4所示。

表4 不同文献的OSA检测性能对比

由表4可知:SHI等[25]利用支持向量机(support vector machine, SVM)对13个最优特征进行十折交叉验证;MEMIS等[26]利用SVM和级联方法保留用SpO2和ECG信号传达的时间信息,但实验结果均低于本文模型;说明与传统机器学习相比,本文模型更能学习不同模态间潜在的相关特征信息。

4 结语

为更好地挖掘和利用不同模态间的潜在相关性,本文提出一种基于CNN和堆叠LightGBM的多模态OSA检测方法。首先,对数据集进行跨被试划分;然后,提取SpO2和ECG经验特征集,并保留皮尔逊相关系数小于0.75的最优特征集;最后,使用CNN生成更深层的特征,结合最优特征集作为LightGBM分类器的输入,使用堆叠方法实现OSA检测。本文模型在公开数据集AED上的实验结果与决策层融合的模型相比,逐层特征融合效果优于决策层融合效果;与使用单独信号的结果相比均有提高,表明本文模型可有效挖掘SpO2和ECG间潜在的相关信息。因此,本文方法能够在跨被试数据集中实现较高的OSA检测性能。

[1] SATEIA MJ. International classification of sleep disorders-third edition: highlights and modifications[J]. Chest, 2014,146(5): 1387-1394.

[2] MOSTAFA S S, MENDONCA F, RAVELO-GARCIA A G, et al. Multi-objective hyperparameter optimization of convolu-tional neural network for obstructive sleep apnea detection[J]. IEEE Access, 2020,8:129586-129599.

[3] ADAM V Benjafield, NAJIB T Ayas, Peter R Eastwood, et al. Estimation of the global prevalence and burden of obstructive sleep apnoea: a literature-based analysis[J]. The Lancet Respi-ratory Medicine, 2019,7(8):687-698.

[4] American Academy of Sleep Medicine Task Force. Sleep related breathing disorders in adults: Recommendations for syndrome definition and measurement techniques in clinical research[J]. Sleep, 1999 22(5):667-689.

[5] DEVIAENE M, TESTELMANS D, BUYSE B, et al. Automatic screening of sleep apnea patients based on the SpO2signal[J]. IEEE Journal of Biomedical and Health Informatics, 2019,23(2): 607-617.

[6] OZEGOWSKI S, WILCZYŃSKA E, PIORUNEK T, et al. Usefulness of ambulatory ECG in the diagnosis of sleep-related breathing disorders[J]. Kardiol pol, 2007,65(11):1321-1328.

[7] LI HY, LI JX, NA B, et al. An IoMT cloud-based real time sleep apnea detection scheme by using the SpO2estimation supported by heart rate variability[J]. Future Generation Computer Sys-tems, 2019,98:69-77.

[8] PUNJABI M, PRABHU S. An ANN-based detection of obstructive sleep apnea from simultaneous ECG and SpO2recordings[C]//International Conference on ISMAC in Compu-tational Vision and Bio-Engineering, Springer, Cham, 2018.

[9] MOSTAFA SS, MENDONÇA F, RAVELO-GARCÍA AG, et al. A systematic review of detecting sleep apnea using deep learning[J]. Sensors (Basel), 2019,19(22):4934.

[10] ERDENEBAYAR U, KIM Y J, Park J U, et al. Deep learning approaches for automatic detection of sleep apnea events from an electrocardiogram[J]. Computer Methods and Programs in Biomedicine, 2019,180:105001.

[11] VAQUERIZO-VILLAR F, ALVAREZ D, KHEIRANDISH -GOZAL L, et al. A convolutional neural network architecture to enhance oximetry ability to diagnose pediatric obstructive sleep apnea[J]. IEEE Journal of Biomedical and Health Informatics, 2021,25(8): 2906-2916.

[12] DOMINGOS Pedro. A few useful things to know about machine learning[J]. Communications of the ACM, 2012,55 (10):78-87.

[13] BASTANI K, ASGARI E, NAMAVARI H. Wide and deep learning for peer-to-peer lending[J]. Expert Syst Appl, 2019,134:209-224.

[14] HE H, FAN Y. A novel hybrid ensemble model based on tree-based method and deep learning method for default prediction [J]. Expert Systems with Applications, 2021,176:114899.

[15] FRIEDMAN J H. Greedy function approximation: a gradient boosting machine[J]. Annals of Statistics, 2001, 29(5):1189-1232.

[16] GOLDBERGER A, AMARAL L, GLASS L, et al. Physio-Bank, PhysioToolkit, and Physionet: components of a new research resource for complex physiologic signals[J]. Circu-lation, 2000,101(23):215-220.

[17] PENZEL T, MOODY G B, MARK R G, et al. The apnea-ECG database[C]. Computers in Cardiology 2000. IEEE, 2000.

[18] CHRISTOV I I. Real time electrocardiogram QRS detection using combined adaptive threshold[J]. BioMedical Enginee-ring OnLine, 2004,3(1):1-9.

[19] HAMILTON P S, LIMITED E P. Open source ECG analysis software documentation[J]. Comput Cardiol, 2002(29):101-104.

[20] 黄英.周期图法的功率谱估计[J].中国西部科技,2013,12(9): 1-2,8.

[21] RICHARDS J E. The statistical analysis of heart rate: a review emphasizing infancy data[J]. Psychophysiology, 1980,17(2): 153-66.

[22] Heart rate variability: standards of measurement, physiological interpretation and clinical use. Task Force of the European Society of Cardiology and the North American Society of Pacing and Electrophysiology[J]. Circulation, 1996,93(5): 1043-1065.

[23] JEPPESEN J, BENICZKY S, JOHANSEN P, et al. Using Lorenz plot and cardiac sympathetic index of heart rate variability for detecting seizures for patients with epilepsy[J]. International Conference of the IEEE Engineering in Medicine and Biology Society, 2014,2014:4563-4566.

[24] KOLEY BL, DEY D. On-line detection of apnea/hypop-nea events using SpO2signal: a rule-based approach em-ploying binary classifier models[J]. IEEE Journal of Biomedical and Health Informatics, 2014, 18(1):231-239.

[25] SHI C, NOURANI M, GUPTA G, et al. Apnea MedAssist II: A smart phone based system for sleep apnea assessment[C]// IEEE International Conference on Bioinformatics and Bio-medicine, 2013,572-577.

[26] MEMIS G, SERT M. Multimodal classification of obstructive sleep apnea using feature level fusion[C]//IEEE Interna-tional Conference on Semantic Computing, 2017,85-88.

Multimodal OSA Detection Method Based on CNN and Stacked LightGBM

LIN Meina ZHENG Heyu

(Guangdong University of Technology, Guangzhou 510006, China)

A multimodal method of detecting obstructive sleep apnea (OSA) based on oxygen saturation and electrocardiogram signals is proposed. Firstly, the empirical features of blood oxygen saturation and ECG signals are extracted, and the optimal feature set is obtained by using Pearson correlation coefficient; Then, convolution network (CNN) is used to generate deep features to mine the potential correlation between different modes; Finally, a stacked lightweight gradient hoist (LightGBM) is constructed to improve the detection accuracy of the classifier. Four fold cross validation was performed on the public data set apnea ECG. The average accuracy, sensitivity and specificity were 96.04%, 96.44% and 96.22% respectively. Compared with decision-making level fusion, it has higher classification performance.

obstructive sleep apnea; convolutional neural networks; light gradient boosting machine; oxygen saturation; electrocardiogram

林美娜,郑和裕.基于CNN与堆叠LightGBM的多模态OSA检测方法[J].自动化与信息工程,2022,43(3):25-30.

LIN Meina, ZHENG Heyu. Multimodal OSA detection method based on CNN and stacked LightGBM[J]. Automation & Information Engineering, 2022,43(3):25-30.

TP391

A

1674-2605(2022)03-0005-06

10.3969/j.issn.1674-2605.2022.03.005

林美娜,女,1997年生,硕士研究生,主要研究方向:模式识别,生物信号处理。E-mail: meina.lin@mail.gdut.edu.cn

郑和裕,男,1996年生,硕士研究生,主要研究方向:模式识别,机器学习,生物信号处理。E-mail: zheng_hy1209@ qq.com

猜你喜欢
模态阈值卷积
基于BERT-VGG16的多模态情感分析模型
多模态超声监测DBD移植肾的临床应用
土石坝坝体失稳破坏降水阈值的确定方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
跨模态通信理论及关键技术初探
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
辽宁强对流天气物理量阈值探索统计分析