一种疲劳驾驶检测中的脑电信号通道选择方法

2022-11-24 07:19马玉良孙明旭张建海佘青山
中国生物医学工程学报 2022年4期
关键词:电信号识别率受试者

郑 赟 马玉良 孙明旭 申 涛 张建海 佘青山

1(杭州电子科技大学自动化学院,杭州 310018)

2(浙江省脑机协同智能重点实验室,杭州 310018)

3(济南大学自动化与电气工程学院,济南 250022)

4(杭州电子科技大学计算机学院,杭州 310018)

引言

疲劳是在长时间,高强度的工作条件下导致的一种生理现象,具体表现为注意力涣散、反应迟钝、预测能力下降等,很大程度上影响了人们的日常生活,而驾驶疲劳更是交通安全面临的重要问题之一[1]。随着驾驶疲劳引起的交通事故的增多,全球对这一问题的关注日益增加。目前已有许多研究人员针对长时间驾驶任务中驾驶员行为和生理信息的特点提出了一些有效的疲劳驾驶检测方法。

现有的疲劳驾驶检测方法可以分为三大类:基于车辆的、基于行为的和基于生理特征,也有一些方法结合了3 种类型中的两种或两种以上的。基于行为的方法利用驾驶者的可见指标,如面部特征、头部位置、注视方向等来检测驾驶员是否疲劳。此方法主要受限于驾驶员的某些特定状态,例如司机的头部发生扭动等情况[2-3]。生理方法取决于人体的生理信息, 如脑电图(electroencephalogram,EEG),心电图(electrocardiogram,ECG),眼电图(electro-oculogram,EOG),呼吸频率,肌肉电信号肌电图(electromyogram,EMG)。

在所有生理参数中,EEG 作为人脑活动的直接体现,可以快速反映出人的生理及心理变化过程,因此被广泛地用于疾病和心理状态的检测研究。此外,脑电信号具有良好的时间分辨率,因而是判断大脑活动的一个有力手段[4]。目前,国内外就基于EEG 的疲劳驾驶检测已开展了一系列的研究:Gao 等[5]使用基于EEG 的时空卷积神经网络对疲劳状态进行识别,通过引入核心块提取EEG 的时间依赖性,然后采用密集层融合空间特征,最终实现分类;付荣荣等[6]使用动态贝叶斯估计的方法进行疲劳驾驶识别研究,利用信息融合的方法动态估计疲劳驾驶状态;王斐等[7]基于EEG 的电极-频率分布图,搭建深度卷积神经网络,实现驾驶疲劳检测方法,并且通过迁移学习方法,将使用其他数据集进行训练得到的模型用于疲劳驾驶监测。Wang等[8]使用EOG 和EEG 进行特征融合的方法利用相关向量机(relevant vector machine,RVM)进行疲劳状态预测。Gao 等[9]使用EEG 和相对小波熵复合网络( relative wavelet entropy complex network,RWECN)实现对疲劳状态的识别。这些生理学方法具有较高的准确性。

总的来说,现有利用EEG 进行疲劳驾驶检测的方法已经取得了比较理想的结果。但这些方法仍采用32 通道或64 通道的脑电帽采集EEG 信号,过多的通道将引入较多干扰信息从而降低系统的鲁棒性[10-11]。因此,需要减少冗余通道以实现更精确的疲劳检测。目前减少冗余通道的主流方案是使用少数固定通道(4 个及其以下)的数据用于疲劳监测,这些固定通道在疲劳和正常状态下特征差异性较大[12]。比如Zhang 等[13]使用了O1 或者O2 通道就能达到87.05 %以上的识别率;Shabani 等[14]只使用了F8 通道就能够得到90.60 %的识别率。这类方法的优点就是:使用极少的电极简化实验设备,减少处理数据,大幅提升算法实时性。但是若固定通道数据采集不佳,则必然导致识别率下降,并且对于不同的设备使用同一种固定通道会造成识别率显著降低。另外一种减少冗余通道的思路是通道选择,通过算法筛选出最优通道,再使用最优通道的数据进行训练与测试[15-17]。这类方法相较于上一种方法的优点是:能够保证识别率不受不同受试者,不同时间和不同脑电采集设备的影响,在保证识别率的基础上极大提高了算法的鲁棒性。目前只有Chai 等[15]通过基于ICA 的通道选择方法来减少冗余通道数从而提高疲劳驾驶检测性能。据笔者所知,在疲劳驾驶检测领域尚没有文献通过通道选择的策略来固定最优通道以实现硬件的简化和分类效果的提升。

根据上述问题,本研究提出一种用于疲劳驾驶检测的脑电信号通道选择算法。首先提取多种特征,再对所有通道根据不同特征计算各自的标准差等多种统计学参数,并从中获得理想通道作为固定通道。通过模拟驾驶实验平台获得疲劳驾驶实验数据,以及疲劳驾驶的公共数据集[18],对于多个特征使用本研究提出的方法进行通道选择,最后使用多层感知超限学习机(hierarchical extreme learning machine,H-ELM)分类器和使用粒子群算法(particle swarm optimization,PSO)优化的H-ELM 分类器用于疲劳状态检测任务,并将结果与使用全通道的检测结果相比较。实验结果表明,本研究的方法可以只使用少数通道实现对疲劳驾驶状态的有效识别,相较于全通道的情况识别率有显著提高,并且能够适用于不同的脑电信号采集设备。

1 材料和方法

1.1 疲劳脑电特征提取

本研究将使用多个特征对脑电信号进行分类,分别是:5 个子频段的功率谱,集合经验模态分解(ensemble empirical mode decomposition,EEMD)所获得的有限个本征模函数(intrinsic mode function,IMF)的功率谱(power spectral density,PSD),经验模态分解(empirical mode decomposition,EMD)所获得的有限个本征模函数的功率谱和样本熵(sample entropy,SE)。

1.1.1 获取EEMD-IMF 分量

EMD 是一种经典的时频分析方法,也是一种自适应的时频局部化的分解方法[19-20],主要用于处理非平稳的信号,但是EMD 在分解时常常出现模态混叠的问题,这种混叠的后果会使IMF 分量不再具有原来的单一特征,从而失去了原有的物理意义。因此,Wu 等[21]提出了一种新的基于EMD 分解的改进方法,集合经验模态分解,可以有效消除模式混叠的现象。此方法的原理如下:利用零均值白噪声频谱均匀分布的统计特性,在原信号中加入白噪声,低频分量的极点分布发生变化,这样不同时间尺度的信号可以自动分离,从而避免模态混叠的现象,并且噪声经过多次的平均计算后会相互抵消,使得最后平均的计算结果消除白噪声带来的影响。本研究使用EEMD 来得到IMF 分量,具体的将每个时段的信号进行EEMD 分解,得到前3 个IMF 分量用来提取特征。

EEMD 的主要包括如下的步骤(包含了EMD 算法[21]):

步骤1:在原始信号[x(t),t=0,1,…,N]上每一次添加不同的白噪声n(t),满足E[n(t)]=0,,得到新的信号x'(t)=x(t)+n(t),并且记r1,1(t)=x'(t)。

步骤2:计算出信号r1,1(t) 的所有极值点(包括极大值与极小值),使用三次样条插值形成该信号的包络线eupper(t) 和elower(t) 。

步骤3:计算上下包络线的均值m1(t)

步骤4:r2,1(t)=r1,1(t)- m1(t), 然后回到步骤2。

步骤5:重复步骤2~4,直到序列内极值点的个数Ne和零点个数Nz满足以下关系(假设重复到了第k次)。

步骤6:令IMF1(t)=rk,1(t), 这是第一个IMF分量,再令r1,2(t)=x'(t)-IMF1(t),再回到步骤2。

步骤7:重复步骤2~6 直到标准差SD(l)满足

式中,ε表示标准差的阈值。到这一步为止,就完成了一次EMD 分解。

步骤8:回到步骤1,重复步骤1 ~7M次。再对相应IMF 分量之和取均值,得到最终的IMF 分量。

在上面的表达式中,ri,j(t) 表示了t时刻,迭代第j个IMF 分量的第i次结果。K是加入的白噪声序列中的幅值系数,σn(t)是具有噪声的标准偏差,它的值越小说明分解准确度越高。

1.1.2 功率谱

功率谱密度函数是一种描述信号能量的特征随频率变化关系的方法[22],简称功率谱,常用来分析脑电信号的特征,理由如下:根据前人的研究,脑电信号可以分为以下几种子频段[23]:δ(0.1 ~4 Hz),θ(4~8 Hz),α(8 ~13 Hz),β(13 ~36 Hz)和γ(36~44 Hz)。在疲劳和正常这两种状态下,不同频段的幅值具有明显的差异,因此已经有许多研究将这5 个子频段的信息作为特征[13-14,24]。在对脑电信号进行预处理之后,因为PSD 能表明脑电信号的频率分布,所以本研究选取PSD 作为特征。得到5个子频段PSD 的方法如下所述:对5 个子频段的信号分别进行短时离散傅里叶变换后,计算功率谱,将原始信号转化为PSD 特征向量。

在我们之前的研究中,发现在疲劳和正常这两种状态下,通过EEMD 得到的IMF 分量的PSD 也具有明显的差异,因此本研究也采用了EEMD-IMFPSD 特征。计算EEMD-IMF-PSD 的方法为: 对EEMD 分解后的每个IMF 分量分别进行短时离散傅里叶变换后,计算功率谱,将每个IMF 分量转化为PSD 特征向量。

1.1.3 样本熵

样本熵特征通过度量信号中产生新模式的概率大小来衡量时间序列复杂性,新模式产生的概率越大,序列的复杂性就越大。样本熵的值越小,序列自我相似性就越高;样本熵的值越大,样本序列就越复杂。目前样本熵在评估生理时间序列(EEG,sEMG 等)的复杂性和诊断病理状态等方面均有应用[25]。在EEG 信号中,正常和疲劳这两种状态的差异性之所以能够通过样本熵特征反映的理由如下:当受试者处于正常状态的时候,序列复杂程度高,因此样本熵的值大;当受试者处于疲劳状态的时候,序列的自我相似性高,因此样本熵的值小。由于这个特性,本研究将选择样本熵作为辅助特征,设置m =2,r=0.25std(m和r是计算样本熵的两个参数,std 是序列的标准差)。本研究SE 特征的具体计算方法如下:对EEMD 分解后的每个IMF分量分别计算样本熵,将每个IMF 分量转化为SE特征向量。

1.2 通道选择

由于采集到的脑电信号存在大量噪声和冗余信息,若将数据直接输入神经网络进行训练,那么得到的识别率必然较低,因此需要通道选择算法筛选有效信息。之前研究所使用的固定通道,难以从生理的角度来解释这些通道是否为针对疲劳驾驶检测的最优通道,仅仅在单次实验中提升识别率并不能说明算法在普遍情况下的有效性。因此本课题旨在研究一种具有普遍性的通道选择方法。首先直观阐明了通道数据好坏与否的根本原因,从1.1.2 节得知,PSD 在不同频段的幅值在疲劳和正常状态下具有显著差异。本研究通过EEMD 分解的IMF 分量再计算PSD,发现不同的受试者总是会有一些差异很明显的通道,如图1 所示。图1 中样本总数为240,每个样本代表第一个数据集中受试者3 在Fp2 通道每一个时段的EEMD-IMF-PSD 值,样本1~120 对应正常状态,样本121~240 对应疲劳状态。从图1 中可以看到,受试者3 在Fp2 通道所反映的疲劳和正常状态的差异显著。本研究将这类在两种状态差异显著的通道,称为理想通道。对于两分类任务而言,使用理想通道的数据作为输入将得到很好的分类效果,在第2 节中将验证该结论。

图1 典型EEMD-IMF-PSD 的疲劳正常状态差异图Fig.1 Typical fatigue normal difference of EEMD-IMF-PSD

经过对两个数据集,共18 位受试者的测试,发现每位受试者的EEMD-IMF-PSD 特征的理想通道数都比较多,并且通过这些通道足以实现较高的识别率。为了进一步提高算法的普适性,本研究加入了其他特征(本研究采用的是样本熵特征)作为辅助特征。需要说明的是,经过实验发现对于同一受试者,两个特征重合的理想通道几乎没有(少于1个),这个现象说明这两个特征具有互补性。以下从生理的角度阐述了选择SE 特征的原因:

通过对EEMD-IMF-PSD 特征的分析,可以总结出一条规律:若一个特征在疲劳和正常两种状态下具有显著差异性,那么只要找出这个特征的理想通道,就能够实现很好的分类效果。

因此本研究使用样本熵作为辅助特征,其物理意义是度量时间序列的复杂性描述,序列自我相似性越高,那么样本熵的值越低。对应到疲劳脑电信号,正常状态下序列的复杂度较高,样本熵较大,疲劳状态下序列的复杂度较低,样本熵较小。图2 是一个样本熵的理想通道的例子。图2 中样本总数为60,每一个样本代表了第二个数据集中受试者3 在FT7 通道在每一个时段的SE 值,其中样本1 ~30 对应正常状态,样本31~60 对应疲劳状态。

图2 典型SE 的疲劳正常状态差异图Fig.2 Typical fatigue normal difference of SE

至此,能观察到上述两种特征在疲劳和正常状态的差异性,但是还需要将差异程度量化,根据量化指标自动筛选通道。以下是两条量化准则:

准则1:疲劳和正常状态下序列的标准差的比值Cstd:可以看到在理想通道中,两种状态标准差的比值比较小,然而在非理想通道,两种状态序列的标准差的差异并不明显,得到两种状态的标准差的比值Cstd,再选定阈值进行判断,公式如下:

式中,σfati是疲劳状态的标准差,Nfati是疲劳状态的样本数,在本研究中是120(数据集1)或者60(数据集2);σwake是正常状态的标准差,Nwake是正常状态的样本数,在本研究中是120(数据集1)或者60(数据集2)。

准则2:疲劳和正常状态下特征值面积的比值Carea:对比理想通道和非理想通道,Carea的值具有显著的差异,并且因此将其作为判断理想通道的准则,公式如下:

式中,Afati是疲劳状态的特征值面积;Awake是正常状态的特征值面积。

1.3 分类器

采用两种分类器进行分类:

1)H-ELM。Huang 等[26]在2004年提出了超限学习机(extreme learning machine,ELM)方法,它在训练过程中无需调整的隐含层偏差,这个偏差是随机赋值的,并且其唯一的最优解也仅需通过简单设定隐含层神经元个数即可。但是在面临高噪声的数据时ELM 表现较差,这是由于ELM 算法简陋的单隐层网络结构所造成。因此提出了H-ELM 等方法,使用多层网络结构的ELM。H-ELM 算法构造一个自编码函数,以编码及解码的形式来学习并表示原始输入信号,不断减少重构误差来达到表征原始信号的目的,提取出更好的特征。该函数的工作原理和深度学习框架中的特征提取器类似[27]。

2)PSO-H-ELM。粒子群优化算法是Eberhart等[28]在Boid 模型的基础上于1995年提出的一种群体智能算法,源自于对鸟群捕食行为的研究。其思想是:将鸟群简化为空间中的粒子群,群体中的粒子在每次迭代搜索的过程中,通过跟踪群体的两个极值:粒子本身所找到的最优解Pbest 和群体找到的最优解Gbest 来动态调整自己位置和速度。

PSO-H-ELM 算法实际上是由PSO 算法对HELM 算法中的惩罚因子S 和l2 进行优化,从而得到最优分类模型。

1.4 实验数据及其预处理

采用两个疲劳驾驶的数据集进行算法验证,一是在实验室模拟驾驶采集的数据集,二是公开数据集,以下将对两个数据集的实验范式进行说明。

1.4.1 模拟驾驶实验设计

在实验室模拟驾驶采集的数据集。通过使用驾驶模拟设备和模拟驾驶软件组成的模拟驾驶平台来模拟真实的驾驶过程。所采用的脑电信号采集设备为德国Brain Products 公司Brain Amp DC 放大器和相应软件组成的EEG 信号采集与分析系统,该系统包括E-Prime 刺激软件、ActiCAP 电极帽、Brain Amp 放大器、Brain Vision Recorder 记录软件和Brain Vision Professional Analyzer 分析软件。

为了获得不同生理状态下的脑电图数据,在收集脑电信号前一天要求6 名受试者分别睡4 h(疲劳状态)或8 h(正常状态)。6 名受试者于第2 d 20:00 进行驾驶模拟,从20:10 开始记录脑电信号,每位受试者持续记录60 ~100 min。分2 次采集脑电信号,共40 min。第1 次采集耗时20 min,在实验开始后5 min 开始记录,标签为正常状态;第2 次采集在受试者开始疲劳后开始采集,也持续20 min,标签为疲劳状态。实验过程中,受试者被要求坐在椅子上并在驾驶模拟平台模拟驾驶过程,期间根据国际10-20 导联系统采用32 通道电极帽记录脑电信号并使用brain vision recorder 记录脑电信号,采样率为1 000 Hz。实验室的温度保持在22℃,给受试者一个舒适稳定的实验环境。

1.4.2 公共数据集

所使用的公共数据集[18]是从受控的实验室环境中使用静态驾驶模拟器记录的数据集,记录包括正常和疲劳的数据。有12 名受试者参与了这次实验。这12 名受试者都是年轻、健康的男性,年龄在19~24 岁之间。数据记录采用网站中报道的32 电极神经扫描数据采集装置,脑电图采集方案采用国际10-20 系统。基于国际10-20 系统的32 通道电极帽(包括30 个有效通道和2 个参考通道)的所有通道信号采样率均为1 000 Hz。

1.4.3 数据预处理

首先对数据进行200 Hz 的降采样,然后再通过0.1~50 Hz 的FIR 带通滤波器进行滤波,以上预处理过程都通过EEGLAB 完成。对于实验室的数据集的每名受试者,以10 s 采集的信号作为样本构建训练样本和测试样本,每名受试者分别采集20 min的正常信号和20 min 的疲劳信号,因此每名受试者各自有120 组正常脑电信号样本和120 组疲劳脑电信号样本;对于公共数据集的每个受试者,也以10 s采集的信号作为样本构建训练样本和测试样本,每名受试者分别采集5 min 的正常信号和5 min 的疲劳信号,因此每名受试者各自有30 组正常脑电信号样本和30 组疲劳脑电信号样本。

2 结果

首先将比较多个特征关于全通道和理想通道的差异程度来说明选择出的理想通道的有效性。特征分别为:5 个子频段的PSD,EMD 分解后IMF分量的PSD(EMD-IMF-PSD),EEMD 分解后IMF 分量的PSD(EEMD-IMF-PSD)和SE,由于前3 种的理想通道大致相同,而EEMD-IMF-PSD 是这3 种特征中分类效果最好的,因此接下来只需要具体分析其中的两种典型特征即可(EEMD-IMF-PSD 和SE)。最后将呈现所有特征关于全通道和理想通道识别率的比较结果,来说明此通道选择方法对于不同特征都是适用的。

2.1 EEMD-IMF-PSD 的理想通道

首先通过阈值筛选,得到了EEMD-IMF-PSD特征理想通道,图3 分别从2 个数据集中各抽取1名受试者,展示其一组典型的理想通道与非理想通道的示例,S1 ~S6 表示的是模拟驾驶的6 名受试者,S'1 ~S'12 表示的是公共数据集的12 名受试者。

图3 2 位受试者的理想通道与非理想通道的比较图。(a)受试者S4 的理想通道;(b)受试者S4 的非理想通道;(c)受试者S'2 的理想通道;(d)受试者S'2 的非理想通道Fig.3 Two participants' ideal channel and non-ideal channel comparison chart. (a)The representative ideal channel of S4;(b)The representative non-ideal channel of S4;(c)The representative ideal channel of S'2;(d)The representative non-ideal channel of S'2

接下来将对其中一位受试者的理想通道和非理想通道进行频谱分析,从生理角度证明所选通道的优势。图4 是理想通道与非理想通道在低频段的频谱图。从已有的研究可以得知,低频段的幅值在疲劳的状态下相较于在正常的状态下会有提升。可以看到,理想通道在低频段的幅值,在疲劳状态下相较于正常状态的确有较大提升,满足这条规律,并且差异程度相比于非理想通道大得多,从而证明使用2 个准则进行阈值筛选所得到的理想通道,从生理意义上远好于非理想通道。

图4 S'2 受试者的理想通道与非理想通道的频谱分析。(a)受试者S'2 在清醒状态下的理想通道;(b)受试者S'2 在疲劳状态下的理想通道;(c)受试者S'2 在清醒状态下的非理想通道;(d)受试者S'2 在疲劳状态下的非理想通道Fig.4 S'2 subject' ideal channel and non-ideal channel spectrum analysis chart. (a)The ideal channel spectrum analysis chart under awake state;(b) The ideal channel spectrum analysis chart under fatigue state;(c) The non-ideal channel spectrum analysis chart under awake state;(d) The non-ideal channel spectrum analysis chart under fatigue state

表1 显示了18 位受试者的EEMD-IMF-PSD 特征的部分理想通道。从表1 可以看出,可通过所提出的通道选择算法,对于不同受试者选出理想通道(公共数据集的受试者8 除外)。并且不同受试者的理想通道不完全相同,这与受试者佩戴脑电帽的具体情况,以及脑电信号的个体差异性有关。

表1 18 位受试者EEMD-IMF-PSD 特征的部分理想通道Tab.1 18 subjects' ideal channels of EEMD-IMF-PSD

接下来将分别使用18 位受试者全通道和被选择的理想通道的数据作为输入,其中训练集和测试集的比例为8 ∶2,并进行5 折交叉验证,使用PSOH-ELM 和H-ELM 这2 种分类器测试2 种通道组合的分类结果。结果如表2 所示。可以看到,相比于采用全通道的数据,采用理想通道的数据得到的识别率有显著提高。

表2 18 位受试者使用全通道和理想通道的识别率(%,均值±标准差)Tab.2 The accuracy(%)of 18 subjects using all channel and the ideal channel(mean±std)

以上的结果说明基于EEMD-IMF-PSD 特征的通道选择方法在跨实验、跨被试的前提下有效,普适性强。

2.2 SE 的理想通道

首先通过提出的通道选择方法得到18 位受试者基于SE 特征的理想通道,发现其通道数相比于EEMD-IMF-PSD 的理想通道数目要少得多:只有4位受试者存在SE 的理想通道。又从表2 得知PSOH-ELM 分类器的分类效果优于H-ELM 分类器,因此接下来将只使用PSO-H-ELM 分类器进行训练与测试,训练集和测试集的比例同样为8 ∶2,并进行5折交叉验证。表3 记录了所有受试者中存在SE 理想通道的受试者其对应的理想通道以及分类准确率。通过表3 可以直观的得出结论,SE 特征的理想通道不同于EEMD-IMF-PSD,是不具有普遍性的。但是又发现,对于同一受试者而言,SE 特征和EEMDIMF-PSD 特征的理想通道重合度较低,所以如果SE特征的理想通道能通过较少的个数得到很高的识别率,那么将SE 特征作为辅助特征就是有意义的。当使用PSO-H-ELM 时,SE 特征只通过1~2个通道,就能得到100 %的识别率,相比于EEMD-IMF-PSD特征,所需要的通道数更少,也因此证明了SE 特征作为辅助特征的有效性。这个结果也说明了:在一位受试者同时出现2 种特征的理想通道的情况下,SE 特征相比于EEMD-IMF-PSD 特征更加能够反映疲劳和正常状态的差异性,接下来将对SE 特征理想通道的数据进行具体分析,来直接的对比这种差异性。图5 是受试者S'1 的一部分SE 理想通道与EEMD-IMF-PSD 理想通道的比较。由图可见SE 特征在两种状态的差异性相比EEMD-IMF-PSD 大了不少,这也从数据的角度验证了SE 特征相比于EEMD-IMF-PSD 特征更加能够反映疲劳和正常状态的差异性这个观点。

图5 受试者S'1 的SE 理想通道与EEMD-IMFPSD 理想通道的比较。(a)受试者S'1 的SE 理想通道;(b)受试者S'1 的EEMD-IMF-PSD 理想通道Fig.5 The SE ideal channel compared with EEMD-IMF-PSD ideal channel of the subject S'1.(a)The representative channel data of SE;(b)The representative channel data of EEMD-IMF-PSD

表3 18 位受试者中存在SE 理想通道的受试者其对应的全部理想通道及其对应识别率Tab.3 All the corresponding ideal channels and their corresponding accuracy for subjects with SE ideal channels among 18 subjects

2.3 多个特征关于全通道和理想通道的差异结果

前述已针对两种典型的特征进行了具体的分析,说明对不同特征而言,理想通道在疲劳和正常两种状态下具有很大的差异性。为了说明提出的通道选择的方法针对不同的特征的适用性,因此将对多个特征(5 频段的PSD,EMD-IMF-PSD,EEMDIMF-PSD,SE)在全通道和理想通道的情况下进行分类,并比较在两种情况下的识别率(采用PSO-HELM 分类器)。18 位受试者在两种情况下的平均准确率如图6 所示。由图可见,对于不同的特征而言,使用提出的通道选择方法得到的理想通道对应的识别率都高于全通道对应的识别率,这证明了所提出的通道选择方法的有效性和普适性。其中使用SE 特征的达到的识别率最高,达到了100 %。

图6 4 种特征在全通道与理想通道下的平均识别率。(a)在实验室模拟驾驶的6 名受试者使用4 种特征在全通道与理想通道时;(b)公共数据集的12 名受试者使用4 种特征在全通道与理想通道时。(c)所有受试者使用4 种特征在全通道与理想通道时Fig.6 The average accuracy of four features in all channels and the ideal channels across 18 subjects. (a) 6 subjects using four features at all channels and the ideal channels in a laboratory driving simulation;(b) 12 subjects using four features at all channels and the ideal channels from public datasets;(c) All subjects using four features at all channels and the ideal channels

3 讨论

由于疲劳驾驶检测领域应用性较强,因此检测设备简化对该领域发展至关重要。目前简化检测设备的主流方案是采用固定通道的策略,如Zhang等[13]选择O1 或O2 通道进行疲劳驾驶检测。但基于固定通道的检测效果在跨设备和跨实验的前提下并不理想,因此开发出一套跨设备,跨被试,跨实验的通道选择算法至关重要。

本研究根据提出的通道选择方法筛选了EEMD-IMF-PSD 和SE 特征的理想通道,发现了对于不同受试者的同一特征而言,同一套设备的理想通道分布大致相同,然后使用PSO-H-ELM 进行分类,并使用两组数据集验证了所提方法的性能。

图3 是EEMD-IMF-PSD 特征的理想通道与非理想通道的示例,说明了被选通道在2 种状态下的显著差异性远好于非理想通道;图6 说明了在跨实验和跨被试的前提下,使用所提方法得到的通道特征相较于32 通道能得到更高的准确率。以上结果说明提出的通道选择算法能有效提高疲劳驾驶识别率。表1 显示18 位受试者的一部分理想通道并说明基于EEMD-IMF-PSD 的理想通道是跨被试、跨实验且普遍存在的。这说明提出的通道选择算法的鲁棒性。

从表1 可以发现同一设备下受试者的理想通道分布重复度极高。此现象说明通过固定少数的理想通道可以简化设备,并保证疲劳驾驶检测效果。但经过通道选择后,没有得到公共数据集受试者8的理想通道。因此将分析受试者8 不存在理想通道的原因,以探讨基于EEMD-IMF-PSD 的理想通道是否具有普遍性。图7 是受试者8 的通道数据典型示例及其频谱分析。

一般受试者的理想通道应如图3 所示:2 种状态具有显著差异。但受试者8 的每一个通道,都如图7 所示:在第28 时刻的EEMD-IMF-PSD 值远远大于其他时刻。因此对第28 时刻(正常时刻)和其余任意一个时刻的数据做了频谱分析。根据之前描述的生理认知,低频段的幅值在疲劳的状态下相较于在正常的状态下会有提升,但如图7(b)所示,受试者8 违背了这个规律。综上所述,认为受试者8 的数据异常,这给出了受试者8 不存在理想通道的根本原因。因此在排除异常数据的前提下,基于EEMD-IMF-PSD 的理想通道具有普遍性。然而受试者8 使用全通道却能够得到100 %的识别率,笔者认为这个结果是由于两种分类器的泛化能力较强所导致的。

图7 S'8 受试者典型的通道数据及其频谱分析。(a)受试者S'8 的通道数据;(b)受试者S'8 清醒状态下在该通道的频谱分析;(c)受试者S'8 疲劳状态下在该通道的频谱分析Fig.7 The representative channel data of S'8 and its spectrum analysis. (a)The representative channel data of S'8;(b)The spectrum analysis of the representative channel data under awake state;(c)The spectrum analysis of the representative channel data under fatigue state

为了进一步增加此通道选择方法的鲁棒性,采用了添加辅助特征的策略,并证明了SE 作为辅助特征的有效性。但此特征的理想通道只存在于少数受试者,是不具有普遍性的,不过此特征在2种状态的差异性显著,因此可以作为辅助特征使用。

总的来说,使用本研究提出的通道选择方法能有效提升疲劳驾驶检测效果。但是局限性也较为明显:首先本研究只采用了2 组数据集验证了算法的性能,这很难在统计学意义上说明算法跨设备和跨实验的能力;其次,还有许多基于脑电的特征本研究并没有采用,这是后续研究的一个方向;最后,本研究只是对基于所提方法的2 种特征的理想通道进行简单的组合,但实际上根据不同特征得到的理想通道,组合的方式会对疲劳驾驶检测性能带来巨大的影响。本研究通过所提出的通道选择方法,可针对不同设备得到的不同的最优固定通道,这样的策略是具有创新性的。

4 结论

对于疲劳驾驶检测,传统的基于全通道EEG 信号的方法存在数据冗余和硬件设施复杂的问题。本研究提出一种基于阈值分割的通道选择方法,用于脑电信号疲劳检测的通道选择。实验结果发现经过通道选择后,使用PSO-H-ELM 分类器,EEMDIMF-PSD 和SE 特征分类的效果最好,能够在大幅减少通道数以及具有极佳鲁棒性的同时,识别率分别达到了99.75 %和100 %,相比于全通道的分类效果具有大幅提升。而在实际应用中,只要确定了每个电极的最佳固定位置,那么理论上是一定可以得到理想通道的,所以采用此方法进行通道选择的实用性较强,对于疲劳驾驶检测的研究具有一定的参考价值。

猜你喜欢
电信号识别率受试者
涉及人的生物医学研究应遵循的伦理原则
涉及人的生物医学研究应遵循的伦理原则
基于联合聚类分析的单通道腹部心电信号的胎心率提取
涉及人的生物医学研究应遵循的伦理原则
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
基于Code Composer Studio3.3完成对心电信号的去噪
涉及人的生物医学研究应遵循的伦理原则
提升高速公路MTC二次抓拍车牌识别率方案研究
基于随机森林的航天器电信号多分类识别方法