潘泽森,窦建洪,申东翔,李理,陈宇珂,黎振声,窦泽宁,黄智冕,谢恬
南部战区总医院 a.医学工程科;b.呼吸内科;c.神经内科,广东 广州 510010
多导睡眠监测(Polysomnography,PSG)是临床诊断睡眠呼吸暂停综合征(Sleep Apnea Syndrome,SAS)的金标准[1],也是睡眠医学发展过程中一项重要技术评价手段[2]。PSG是在专业的睡眠监测室中采用传感器技术记录患者在睡眠期间的脑电图(Electroencephalogram,EEG)、眼动电图(Electrooculogram,EOG)、肌电图(Electromyogram,EMG)、心电图(Electrocardiogram,ECG)、呼吸气流、胸腹呼吸运动、体位、血氧饱和度(Pulse Oxygen Saturation,SpO2)等生理信号,对其进行数据处理和分析得到睡眠结构图及标记呼吸事件,量化诊断指标[3]。医生根据定量指标判定患者SAS的严重程度,并提出合理化治疗方案。
随着生活水平的大幅提高,人们对睡眠疾病的关注度增加,提前发现并积极防治SAS是改善睡眠的重要手段。从1968年Hobson[4]提出了人类睡眠分期规则(即R&K分期规则)到2007年美国睡眠医学会(American Academy of Sleep Medicine,AASM)出版了《AASM睡眠及其相关事件判读手册-规则、术语和技术规范》[5],睡眠医学专家围绕PSG技术对各个参数的应用进行了详细的规范说明并在持续不断的更新中。根据目前临床使用的现状,PSG仪的特点是需由专业的医务人员在标准的睡眠监测室采集患者生理信息,分析计算并量化结果,提供详细分析报告,但技术要求高,患者睡眠质量受到干扰大,收费相对较贵。便携式睡眠监测仪患者可对监测环境进行选择,并且佩戴简便、费用不高,但采集数据量偏少导致分析结果不稳定[6]。针对睡眠监测仪存在的不足,本研究设计了一款一体式睡眠呼吸暂停监测系统,具有采样数据全、佩戴方便以及干扰睡眠少等特点,为临床早期SAS的筛查提供一套可行方案。
一体式睡眠呼吸暂停监测系统的硬件系统结构如图1所示,它是基于ATMega328主控芯片实现对一体式信号采集模块的数据处理并通过蓝牙将信号传输至上位机分析数据。一体式采集模块完成对原始信号的采集(包括表面电极采集EEG和EOG、温度传感器采集鼻气流的温度场变化、光电传感器采集耳垂的SpO2以及三轴传感器采集体动等),在前端完成滤波放大、模数转换等。利用I2C总线技术将数据传送至主控芯片,为保持电平一致性设计了由NMOS管和上拉电阻组成的电平转换电路。低功耗蓝牙(Bluetooh Low Energy,BLE)系统实现数字信号在主控芯片与上位机之间的传输,分析系统对信号进行多数据融合并基于深度学习算法(Convolutional Neural Networks Long Short-Term Memory,CNN-LSTM)的信号处理技术实现睡眠分期及呼吸事件识别,计算睡眠呼吸暂停低通气指数(Apnea-Hypopnea Index,AHI)完成SAS的预警。
图1 一体式睡眠呼吸暂停监测系统结构图
中央主控系统的芯片需满足功耗极低、集成度高、I/O接口≥4个、通用灵活、掉电保护、一定的抗干扰能力等特性,故本研究采用ATMega328芯片为数据的中转处理站。
ATMega328是一款集成了中央处理单元、存储器、输入输出接口、定时/计数器、时钟电路等电路的主控芯片,其AVR核具备丰富的指令集,32个寄存器且可与算术逻辑单元直接相连,同一时钟周期内一条指令可分别访问两个寄存器。先进的RISC体系结构,处理速度达20 MHz,内部有校准的振荡器,32 K的系统内可编程闪存,具有读写功能,接口类型包括I2C、 SPI、 USART[7]。
脑电是一种非线性、非平稳事变信号,其特点是采集难度大、频率范围低,幅值范围为5~100 μV,包括δ波(0~3.99 Hz)、θ波(4~7.99 Hz)、α波(8~13 Hz)、β波(>13 Hz)及K复合波、睡眠梭形波(11~16 Hz)和锯齿波(成串尖锐成三角状,2~6 Hz)[8]。
根据脑电信号特点本研究采用由一体式电极和Neurosky公司生产的TGAT1L64芯片及附属电路组成的脑电信号处理模块。一体式电极如图2所示,柔性电极能够与头皮无缝接触,无需对头皮进行特殊处理,操作方便简单。TGAT1L64芯片及附属电路由输入阻抗高及共模抑制比高的差分放大器、非线性度小和抗干扰能力强的带通滤波器及噪声低的模数转换器等电路组成,实现对脑电信号前端处理,采样频率为512 Hz[9]。
图2 一体式电极设计图
眼球的运动可以反映睡眠情况,其特点是垂直运动为同相偏转,水平运动为异相偏转[10]。它通过眼电来记录,幅值一般为-0.8~0.8 mV。本研究设计的两个采样电极为左右对称的水平结构且均位于前额眼睑上方,其中一个为参考电极,另一个为测量电极。眼电信号的预处理通过TGAT1L64芯片及附属电路来完成,特征提取以及模式识别在分析软件中实现。
人体鼻腔具有内壁血管丰富、内表面积大、加温速度快等特点,使得气道内温度场相对稳定与体温一致,基本在30~33℃之间浮动,并与呼吸动作呈正向相关性[11]。本研究利用该特点在鼻腔的呼出端设置数字温度传感器对呼吸气流进行温度的定量检测。
采用由DALLAS生产的总线式数字温度传感器DS18B20,使用简单无需另接其他电子元器件,测温范围在-10~85℃时的测量精度可达±0.5℃,其测量结果以多位数字量方式经I2C总线传送至主控芯片。检测的温度变化量是环境温度与呼出气流温度之差的绝对值,其测量值在传感器的可测分辨率范围内变化,采样频率高于呼吸频率约为100 Hz。在吸气时相进行环境温度的定标,若出现呼吸暂停则会出现一个平台期,接着进入下一个呼吸周期,根据平台期的时间长短来标记呼吸事件。
SpO2是血液中被氧结合的氧合血红蛋白(Oxygenated Hemoglobin,HbO2)的容量占全部可结合的血红蛋白(Hemoglobin,Hb)容量的百分比,它既是呼吸循环的重要生理参数,又是衡量SAS的关键指标值[12]。它是利用朗伯比尔定律,通过红光660 nm和红外光880 nm对波动的耳垂进行照射,其光吸收量会随血液容积变化而变化,传感器探测反射光强度值,再进行血氧标定曲线拟合,实现监测 SpO2。
本文采用集成化血氧模块MAX30102对耳垂血氧信号采集处理,它集成了一个660 nm红光LED、880 nm红外光LED、光检测传感器以及去噪电路,通过光信号发射及接收、AD转换、环境光干扰消除及数字滤波,利用I2C 技术读写其内部寄存器,将搏动的血氧转换为光强度数值,在上位机的分析系统通过算法处理计算出SpO2值及显示波形。
通过对体动信号的采集可实现睡眠运动状态的实时监测,为睡眠分期提供辅助决策依据[13]。本研究采用加速度传感器实现在静态或动态情况下有运动或停止出现的检测,同时根据设定动态阈值感知不同的睡眠姿态。
加速度传感器ADXL345将微型机械结构惯性传感器与信号处理电路集于一体,实现测量加速度并输出数字信号,其具有功耗极低、测量精度高等特点。根据不同的睡眠姿态,分析睡眠中动作,包括三个轴向运动分量,x轴为翻滚,y轴为伸展,z轴为直立,通过ADXL345检测其三个轴上的加速度,计算运动轴与测量轴之间的对应关系,从而得出睡眠过程人体运动情况。
本研究采用芯片蓝牙CC2540实现上位机分析系统与中央主控系统之间的信号传输。芯片集2.4 GHz射频收发和8051单片机一体,基于蓝牙低功耗4.0协议,具有睡眠模式功率消耗低及模式切换快等特点[14]。
原型睡眠呼吸暂停监测仪样机如图3所示,包括主控芯片ATMega328,由TGAT1L64芯片及附属电路组成的脑电和眼电信号采集模块,由DS18B20芯片及附属电路组成的呼吸信号采集模块,由MAX30102芯片及附属电路组成的血氧信号采集模块,CC2540芯片及附属电路组成的低功耗蓝牙模块,各个模组之间通过I2C总线控制技术实现信号传输。
图3 原型睡眠呼吸暂停监测仪样机
3.1.1 睡眠分期及脑电信号特征
根据AASM睡眠及其相关事件判读手册规则、术语和技术规范2.3版,睡眠分期分为五期:清醒期(W期)、N1期(非快速眼球运动期1期)、N2期(非快速眼球运动期2期)、N3期(非快速眼球运动期3期)、R期(快速眼球运动期)。睡眠各期的具有如下特点:W期大部分个体在闭眼时EEG会出现典型的α波,睁眼时表现为低振幅脑电,主要为混合的α波和β波(一帧中α波占50%以上)。EOG出现特征性快速眨眼,频率0.5~2 Hz。体动连续出现3次以上,且幅度和频度都较大。N1期从清醒状态到睡眠的过渡期,α波所占比例减少,代之以频率为4~7 Hz的低电压混合频率波(θ波),且占一帧的50%以上,该阶段常出现慢速眼动,体动时间在2 s内,频次减少。N2期被认为是真正睡眠的开始,该阶段会发生一个或多个与微觉醒无关的K 复合波和睡眠梭形波(当K 复合波结束1 s内出现微觉醒,则认为K 复合波与微觉醒相关)。N3期振幅>75 μV,频率0.5~2 Hz的慢波(δ波)占一帧的20%以上,睡眠梭形波可能持续,此时睡眠程度加深,不易被唤醒,基本无体动。R期出现变化的、不规律的、波峰尖锐的眼球运动,持续时间常<0.5 s,出现锯齿状,频率2~6 Hz的低电压、混合频率脑电波,体动变频繁,其持续时间加长[15]。
一般人的整晚睡眠中大概有4~6个睡眠周期,从上床就寝到入睡称为睡眠潜伏期,成年人一般约20 min。然后进入N1期,大约7 min后,即进入N2期;约30 min后,进入N3期,持续约数分钟至1 h;再回到N2期;入睡后70~90 min,进入R期睡眠5 min,接着再回到N2期,进入第二个睡眠周期。从第二个周期开始,NREM期时间逐渐缩短,而R期逐渐延长,一个周期时长约90 min;睡眠后半夜,NREM期出现越来越少,R期时间可长达1 h。成年人一夜睡眠中,R期约占15%~25%,N1期占5%~10%,N2期占30%~50%,N3期约占10%~20%[16]。
3.1.2 呼吸事件及信号特征
呼吸事件包括呼吸暂停、低通气和与呼吸相关的微觉醒,其中呼吸暂停事件是指口鼻温度信号曲线峰值较事件前基线值下降≥90%且持续时间10 s以上,低通气事件是呼吸气流信号峰值较基线下降≥30%且连续10 s以上,并SpO2较上一基线下降>4%[16]。本文通过鼻气流温度以及耳垂SpO2采样数据,对呼吸暂停事件和低通气事件进行分区标记。
3.2.1 信号预处理
信号噪声消除,删除原始数据中严重干扰部分;临床诊断专家进行人工数据标记,为特征信号比对提供依据;对采样数据进行片段,以30 s为一段,至少需要记录被测者6 h睡眠时长。
3.2.2 多传感器信号数据融合
由于呼吸事件发生的不确定性,采集信号之间的影响较为复杂,本文从5个不同维度的传感器收集表面目标的数据(EEG、EOG、鼻气流、SpO2和体动),对传感器的输出数据进行离散变换(包括时域和频域),提取代表目标数据的特征波形如K复合波、δ波、θ波、α波、β波、梭形波、锯齿波以及呼吸事件中鼻气流和SpO2下降曲线,其作为模型的信号输入提供训练和测试样本数据集。
3.2.3 基于CNN-LSTM的数据分类
本文采用CNN-LSTM即CNN在LSTM前端的混合模型,其中CNN用于解释输入的子序列,这些子序列一起作为序列提供给LSTM模型进行解释的算法[17-19]。CNN模型结构共5层:输入层(特征矩阵)、卷积层(卷积核与信号进行卷积运算)、池化层(最大池化压缩卷积输出)、全连接层(相应特征映射)、输出层(特征提取);LSTM模型结构共3层:输入门(CNN输出信号)、遗忘门(选择遗忘过滤无关信息)及输出门(预测),CNN的输出与LSTM的输入相连,共同完成时序信号的特征学习和遗忘,实现睡眠分类及呼吸事件的识别。
输入卷积网络的初始信号提取分类的重要特征,非线性激活层Relu函数滤波器矩阵与原始矩阵点积生成新矩阵,根据步长滑动滤波器获得激活图矩阵,池化层采用最大池化(Max Pooling)保留与每个特征高度相关的信息值压缩矩阵图,全连接层将特征图进行维度上的改变,采用softmax分类函数来得到每个分类类别对应的概率值。将CNN的输出作为LSTM的输入,在输入门完成内部状态更新,在遗忘门内自适应选择单元存储内容,最后输出分类结果。
临床诊断SAS的标准是在7 h夜间睡眠中,发生呼吸暂停大于30次或者大于5次[20]。而AHI是指平均每小时睡眠中发生呼吸暂停或低通气次数,根据AHI可将SAS分为轻(5~15)、中(16~30)、重(30以上)三类。以诊断标准为依据设定阈值函数,计算每晚呼吸暂停发生频次,超过阈值通过主控板上三色LED指示灯(低、中、高)报警,并将记录结果保存于数据库。
按照伦理标准要求结合临床实际,选取了10名不同严重程度的志愿者通过佩戴该装置获取实验数据。睡眠实验室操作人员只需将一体式电极粘贴至被测者前额,适当调节鼻气流传感器位置即可,无需进行复杂连线,操作简单快捷。被测者整体反映佩戴该装置体感较为舒适,且连接导线较少,睡眠状态和平时基本无差异,平均睡眠时间达7.5 h。其中1名被测者反映佩戴后有异物感,经过较短时间适应后很快入睡,导致该现象的主要原因是采集电极母版基质材料柔韧性不强,下一步项目组将在基材选择方面继续提高。其中2名被测者因体动幅度过大导致耳垂SpO2传感器脱落,装置会发出提示信号提醒操作人员重新连接。
本研究引入评价计算模型的指标包括准确率(Accuracy,ACC)、敏感度(Sensitivity,SEN)和特异性(Specificity,SPE),其计算指标包括真正例(True Positive,TP)表示模型预测正例样本正确的数量、真负例(True Negative,TN)表示模型预测负例样本正确的数量、假正例(False Positive,FP)、假负例(False Negative,FN)。计算公式为:ACC=(TP+TN)/(TP+TN+FP+FN);SEN=TP/(TP+FN);SPE=TN/(TN+FP)。
通过测试共获取的10个数据集,其中包含50个子数据集超过100000个数据片段,将90000个数据片段作为训练集,10000个数据片段作为测试集。初始化训练集后根据模型运算情况逐步优化调整,基本实现不同睡眠的分期,其中W期和N3期准确率为80%,N1、N2和R期准确率为75%,具体与专家分析的结果对比情况如表1所示。
表1 睡眠分期情况对比(%)
通过CNN-LSTM模型特征提取,在不断地迭代学习过程中识别分类呼吸事件,并计算AHI值。本装置与PSG相比情况具体如表2所示,AHI最大偏差值为4,但判读的严重程度相一致。
表2 PSG与本装置的 AHI对比
目前监测SAS主要受到设备测量参数多导致被测者体感舒适度差、参数的减少导致准确度下降、场地条件及操作者熟练度要求高等因素的影响。本项目通过一体式电极采集的数据,在基于CNN-LSTM模型分析下实现了不同睡眠的分期,同时计算AHI值及预警呼吸暂停严重程度,其中总体ACC为77.3%,AHI值最大偏差为4,与临床专家判读的结果一致性较好,有效地解决目前存在的困难,达到预期研制目标。
近年随着机器学习不断发展,基于深度神经网络的睡眠分期和呼吸事件识别相关研究取得较大进步,ACC也有明显的提高。Lakhan等[21]通过提取PSG中鼻气流信号,基于深度神经网络利用AHI值分界点实现二分类,再根据不同严重程度进行四分类,其最终判读的ACC为63.70%。Haidar等[22]通过采集鼻气流信号(960原始数据段),提取呼吸暂停低通气事件特征引入CNN模型实现二分类(正常与异常情况),ACC为74.7%。Haidar等[23]基于CNN方法对样本数据(样本数据69264个)包括鼻气流、胸腹运动等三个信号进行挖掘,实现正常呼吸、低通气以及阻塞型呼吸暂停三分类,ACC为83.5%。Dey等[24]基于CNN使用单导联ECG信号(6000样本片段)自动检测阻塞性睡眠呼吸暂停,消除了单独的特征提取和分类算法的要求,同样实现的是二分类(正常呼吸与呼吸暂停),ACC为98.9%。Michielli等[25]从Sleep-EDF 数据库中提取10名健康志愿者单道EEG(Fpz-Cz)信号,采用两个级联LSTM模型首先实现四分类(即W、N1-REM、N2、N3),再对N1-REM进行二分类,五段睡眠分期平均ACC为86.74%。Tsinalis等[26]基于时频分析提取单道EEG信号中不同睡眠阶段的特征,同时对不良信号进行修正,采用堆积稀疏自动编码对W、REM、NREM(N1/N2/N3)进行分类,平均ACC为78%。
对比上述文献实验结果,本分类模型具有一定的优点。首先临床专家判读的睡眠呼吸暂停的标准是基于多通道信号而实现的,在无睡眠状态参考下,呼吸事件的判读会导致偏差。本研究通过记录每个窗口不同信号之间的相互关系提取融合特征,作为CNN输入层数据,对模型分类性能提升有较大帮助。其次数据无需进行人为特征标注,充分利用模型特征输出典型特征遗忘非相关因素,有效节约标注时间,提高数据利用率。最后通过构建CNN-LSTM分类模型融合数据特征,挖掘PSG信号在不同睡眠阶段的相互关系,减少先验知识局限性的影响,达到较高的判定准确性。
本文设计了基于ATMega328为主控芯片的一体式睡眠呼吸暂停监测装置,从5个不同维度采集睡眠呼吸信号,根据信号特征对数据进行预处理后,利用低功耗蓝牙传输至上位机。睡眠呼吸暂停分析程序是采用基于CNN-LSTM的算法,先对采样数据进行片段化处理,再进行特征融合、波形提取及数据分类,并建立符合SAS诊断标准的预警机制。该装置实现了以极少导线连接、较高舒适度的睡眠监测,减少装置对监测期间睡眠的干扰,真实反馈睡眠呼吸情况。通过数据融合及深度学习技术在SAS判别的应用研究,正确认识SAS发生时序及进展,制定合理的治疗方案,采取有针对性的干预措施,对提高治愈率起到积极作用,同时极大节约专家判读时间。
本研究将多个一维的数据融合成一个多维的数据,根据不同特征信号发生的时序关系,标记发生呼吸事件所处的睡眠阶段,下一步将优化评分机制,通过权重值的设定减少严重程度的边际影响效应。固定窗口的时间序列也会受干扰信号的影响,导致模型在边缘值的判读上存在误差,下一步将采用滑动窗口采样技术来改善分类。随机选择的被测者呼吸暂停的严重程度不一,无法做到数据全覆盖,在三个关键AHI判读点还需更多的积累。未来将微型化的采集板与睡眠呼吸机建立关联机制,实现SAS患者治疗闭环管理,减少专家主观性和局限性,增加了程序智能化。