李倩云,夏斌
(上海海事大学 上海 201306)
基于EEG的睡眠数据的分类
李倩云,夏斌
(上海海事大学 上海201306)
睡眠研究对于人的身心健康和工作生活有着重要的意义。睡眠过程中不同状态的标注,是睡眠研究的一个基础工作。本文采用单通道的脑电信号数据,将数据输入到深度置信网络中进行特征表达和分类学习。通过利用39个晚上的睡眠数据进行测试,达到了82.26%的平均分类准确率。
睡眠;深度学习;EEG;DBN
睡眠是人类不可或缺的一项生理活动,人的睡眠时间占到了人类生命的1/3。正常人每天的平均睡眠时间是7.5小时。良好的睡眠是保证人类身心健康和工作生活的基础。睡眠障碍会导致人产生焦虑,抑郁等精神问题,还会引起心血管、内分泌等疾病进而影响工作能力,甚至导致车祸等严重事件的发生[1]。目前在医学领域、生物工程领域甚至是交通运输、军事安全、航空航天等领域,睡眠研究已然成为一个热点[2-3]。本项目旨在对睡眠阶段的分类进行研究,这对于临床上疾病的预测、诊断和治疗的意义最为重大。
1953年,N.kleinllan和Aserinasky把睡眠状态划分为两种:非眼球快速运动睡眠状态(non-Rapid Eye Movements,NREMS)、眼球快速运动睡眠状态(Rapid Eye Movements,REMS)。后来,为了方便研究,进一步将NREMS细分为4个周期(浅睡眠期S1、S2,深睡眠期S3、S4),而REMS作为一个周期[4]。在睡眠过程中,这几个周期相继出现,周而复始。睡眠分类的研究是正确认知睡眠状态和诊断各种睡眠相关疾病的基础性工作。
睡眠脑电是睡眠进行分期研究的重要工具。传统的睡眠数据分类方法基于1968年Rechtschaffen和Kales的R&K准则以及2007年美国睡眠医学会的AASM准则,主要是由专家对连续的整夜数据进行目测分析,然后在对各个睡眠阶段进行划分。这种方法耗时、繁琐,并且需要大量数据。相对来说后期的自动分类方法则显现出较大的优势。
深度学习根源于神经网络算法,“深度”源于其含有多层网。深度学习的方法是受到大脑的分层处理机制的启发发展而来的。典型的浅层的机器学习算法包括应马尔科夫模型、最大熵模型、支持向量机等,均为单层结构。因为其自身存在的局限性[5],从而激发了利用深度网络的动机。
Hinton等人在2006年提出的深度信念网络(DBN)[6]解决了BP算法训练多层网络时需要大量含标签的样本、收敛速度慢以及容易陷入局部最优的难题。自此以后,深度学习成为学术界关注的热点,在应用领域显示出巨大的优势。除了图像和语言方面,深度学习还应用在自然语言处理,搜索广告预测等方面。将深度学习算法用于时序信号的处理方面的成果相对较少。Kang Li等人[7]利用了DBN模型对不同情绪下的脑电数据进行分类研究,作者是将不同的通道分别建立DBN模型,得到低维的特征表达后再进行一个有监督的RBM的训练。DrausinWulsin等人[8]使用半监督的DBN方法,对不同病人的脑电数据进行分类,利用大量的无标签数据进行非监督预训练,然后利用有标签数据进行微调。
1.1原始睡眠数据
本文所使用的睡眠数据来自。这个睡眠数据库共包括39组数据,每组都是一个整夜的睡眠数据,来自于20个受试,其中一个受试一夜数据丢书,因此有39组数据。我们选择了Pz-Oz这个通道的信号来进行睡眠分类研究,这个信号的采样率是100 Hz。每个样本是30秒的数据,样本标签是由睡眠专家标定,本文中是对数据做6类分析,因此只保留样本中的AWAKE,S1,S2,S3,S4和REM阶段的所有样本。此时个子类样本比例如表1所示,由于清醒状态样本过多,去掉一些清醒状态的样本和状态转换样本,处理后的睡眠数据各子类样本比例如表2所示。表3展示的20个受试的睡眠数据的样本数,第13个受试只有一夜的数据,因此样本数较少。
表1 原睡眠数据各子类样本比例Tab.1 Ratio of samples for each sleep state of original data
表2 处理后睡眠数据各子类样本比例Tab.2 Ratio of samples for each sleep state after pre-processing
表3 每个受试睡眠数据样本数Tab.3 The number of samples of each subject
1.2数据处理
在本文中只选用了Pz-Oz通道的信号,图1展示了Pz-Oz通道6个睡眠阶段的时域图。图2中展示了与图1的6个睡眠阶段对应的0.5~25 Hz的频域图。经过计算可得,清醒状态能量比较高,S1状态信号能量下降,从S1状态一直到S4状态,信号能量越来越高,而从S4状态到REM状态,信号的能量有所下降。不同状态下,信号的能量不同。由于各个睡眠状态的主要体现在频域上,因此我们首先对原始时域数据进行了快速傅里叶变换(FFT),然后取0.5~35 Hz之间的频域数据,最后进行数据归一化,得到的数据就是即将用于训练DBN的频域数据。
图1 EEG通道6个睡眠阶段的时域信号图Fig.1 Timedomain signal of EEG channel of 6 sleep stages
图2 EEG通道6个睡眠阶段的频域信号图Fig.2 Frequency domain signal of EEG channel of 6 sleep stages
DBN是由多层网络组成的的概率生成模型,每层包括一个限制玻尔兹曼机(RBM),其中DBN无监督训练的过程是通过逐层训练RBM来实现的。RBM限制型玻尔兹曼机,是由一个显示层(v)和一个隐层来(h)组成的,如图3所示为一个RBM,同一层之间的单元之间没有连接,也就是说显层各单元之间没有连接,隐层个各单元之间也没有连接,但是不在同一层(也就是显层和隐层)的单元之间通过一个权重矩阵W连接。DBN包括多个RBM,如图4展示了一个典型的DBN模型,上一个RBM的输出是下一个RBM输入,逐层来训练RBM,直到所有的RBM训练完。所有的RBM连接在一起,顶层是标签层。无监督的预训练完成后,通过微调就可以完成DBN的训练过程。总结来说,DBN训练过程包括:无监督的预训练,无监督的微调过程和有监督的微调过程。
3.1方法
在本文中我们每次选用19个受试的睡眠数据作为训练集,剩下的一个受试的数据作为测试数据,这样可以得到每个受试睡眠数据的分类情况,同时我们还可以得到歌手是之间的睡眠数据之间的差异情况。我们使用的DBN网络共有5层,一个输入层,3个隐层和一个输出层,各个隐层单元数为500-200-100。首先,选择出训练集和测试集,然后分别随机化样本的顺序,将训练集分成包含50个样本的小批量数据进行训练,预训练阶段的参数设置:epoch=10,minibachsize= 1 000。预训练完成后,对整个DBN网络进行无监督的微调和有监督的微调,这个过程epoch=30。此时完成了整个训练过程,得到了DBN模型,最后就可以得到预测结果。
3.2结果
DBN分类结果见表4和图5,从图中可以看出,不同受试之间的准确率还是一定的差异的,这也间接提现了人与人之间睡眠的差异性,大部分受试的平均准确率在80%—95%之间,也说明DBN具有一定的稳定性。表4显示,所有受试的预测准确率均高于70%,最低为72.80%,最高为89.23%。DBN模型预测的平均准确率为82.26%。
图3 RBM结构图Fig.3 The structure of RBM
图4 DBN结构图Fig.4 The structure of DBN
表4 分类准确率Tab.4 Classification accuracy
图5 分类准确率柱状图Fig.5 Histogram of classification accuracy
表5 DBN分类结果的混淆矩阵Tab.5 Confusion matrix for DBN
表5展示了DBN分类结果的混淆矩阵,从表中可以看出AWAKE,S2和REM状态的分类准确率比较高,相对来说,S4的分类准确率为69.75%,但是S1和S3这两个状态的分类准确率却比较低。其中AWAKE、S2和REM状态最容易区分,大多能够预测准确说明EEG信号中存有这3个状态的信息,而相对来说 S1、S3、S4容易和其他睡眠状态混淆。S1
容易错分到REM状态和S1状态,S3容易错分到S2状态和S4状态,S4有部分错分到S2和S3状态。这说明各睡眠状态之间的分界不是很明显,在EEG信号中有相似特征的存在这就使得一些睡眠状态不容易区分出来。
通过前文的结果分析,说明DBN能够很好地提取到睡眠数据的特征,这个结果和浅层网络中经过特征提取后得到的结果是可以相比较的,但是本文中的方法不用经过手动的特征提取,直接将得到频域数据放到网络中,最大的优势就是省去了手动进行特征提取的步骤,这对于刚刚开始对睡眠数据进行研究的人来说是有很大的益处的。
[1]Breslau N,Roth T,Rosenthal L,et al.Sleep disturbance and psychiatric disorders:a longitudinal epidemiological study of young adults[J].Biological psychiatry,1996,39(6):411-418.
[2]Thorpy M J.Approach to the patient with a sleep complaint [C]//Seminars in neurology.2004,24(3):225-235.
[3]Lockley S W,Barger L K,Ayas N T,et al.Effects of health care provider work hours and sleep deprivation on safety andperformance[J].Joint Commission Journal on Quality and Patient Safety,2007,33(Supplement 1):7-18.
[4]Rechtschaffen A,Kales A.A manual of standardized terminology,techniques and scoring system for sleep stages of human subjects[S].1968.
[5]Hinton G E.Learning distributed representations of concepts [C]//Proceedings of the eighth annual conference of the cognitive science society,1986(1):12.
[6]Hinton G,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets[J].Neural computation,2006,18(7):1527-1554.
[7]Li K,Li X,Zhang Y,et al.Affective state recognition from EEG with deep belief networks[C]//Proceedings of the IEEE International Conference on Bioinformatics and Biomedicine. 2013.
[8]Wulsin D,Blanco J,Mani R,et al.Semi-supervised anomaly detection for EEG waveforms using deep belief nets[C]// Machine Learning and Applications(ICMLA),2010 Ninth International Conference on.IEEE,2010:436-441.
Sleep classification based on EEG
LI Qian-yun,XIA Bin
(Shanghai Maritime University,Shanghai 201306,China)
The research of sleeping is important for our people′s healthy,work and life.Labeling different stages of sleep data is the basic job in the study of sleep.In this paper,we used a single channel of EEG,and put the data into the deep brief networks to represent features and do the classification,the average accuracy is 82.86%based on 39 datasets.
sleeping;deep learning;EEG;DBN
TN0
A
1674-6236(2016)05-0026-03
2015-04-20稿件编号:201504229
上海海事大学基金支持(20120067)
李倩云(1989—),女,河北安国人,硕士。研究方向:信号与信息处理。