王海玉,王映龙,闵建亮,胡剑锋
(1.江西农业大学计算机与信息工程学院,江西 南昌 330045; 2.江西科技学院信息技术研究所,江西 南昌 330098)
脑电信号EEG(Electro Encephalo Gram)是一种从中枢神经系统传出的生物电活动,人在自主思维或经受异同信号作用时,会生成携带不同特性信息的脑电信号,驾驶的过程中亦如此,驾驶人不同状态下产生不同脑电信号,通过脑电专项分析驾驶人在驾驶过程中的大脑活动规律,预测疲劳发生,提前进行疲劳预警从而减少交通事故的发生,成为疲劳检测领域可靠性极高的生物电应用。脑电信号是一种振幅、相位、频率连续变化的且受背景噪声影响的非平稳信号,最早期的脑电波研究中常用目视分析,分辨率极低且效果准确性不高;随着科技的更新,脑电信号逐步进入计算机分析阶段,功率谱、小波变换、信息熵等逐步被应用到脑电信号分析上。本文选用小波变换提取4个频段幅值以及4个合成指标作为脑电特征,并利用KPCA核化的思想将样本的空间映射到更高维度的空间,再利用这个更高维度的空间进行线性降维[1],提取总贡献率大于90%的主元组成特征集合作为最小二乘向量机的输入变量,进行分类模型测试及分析。
主观监测技术和客观监测技术是目前疲劳驾驶检测应用最为广泛的方法。主观监测技术对于驾驶疲劳的评判实质上多通过人的主观界定时间标准来判定,即对驾驶员每次连续驾驶时间的控制和衡量,但由于限定这种界定时间无法考虑到不同驾驶员个体在体质、精神状态、生活饮食状况,是否身体不适等多方面的差异,所以主观监测技术判断界限不明确且结果往往不令人满意[2]。因此本文采用客观监测方法采集脑电信号,针对不同驾驶员进行针对性分析评价。图1为实验处理的主要流程。
图1 实验处理流程图
在采集脑电数据后进行小波变换处理,投入到KPCA-LSSVM模型进行分析验证。值得一提的是实验获得学校许可并与受试者签订相关协议。
为了印证所提出方法的可行性和有效性,EEG数据来自10位身体状况良好的高校学生受试者,其中,6位男性,4位女性。所有的受试者身体康健,视力或矫正视力正常,均无神经系统疾病或药物滥用。实验前使各位受试者了解实验过程和细节相关问题,实验中受试者分别进入模拟驾驶环境,根据测试标准和计算机屏幕上的指示作出适当的反应,实时监测做相关记录并辅以拍照,记录受试者眼部变化,对受试者状态进行确定。采集EEG信号后,采用NeuroScan的Scan 4.3软件进行数据处理。除A1、A2参考电极外,将30个通道的5分钟EEG信号分成1个时期,形成300个时期,位置安放采用国际10-20标准,双耳乳突做参考电极,采样率设置为1000 Hz。
小波变换是对Gabor的加窗傅里叶变换的升级,对傅里叶窗口的局部化思想进行优化,并且对傅里叶变换窗口大小不能随频率变化的弊端进行改进,利用一个具有快速衰减性和振荡性的函数[3],将其伸缩和平移得到一个小波基函数,使信号可按其小波基函数进行时频分解,基函数在时频相平面上具备可变的时间-频率窗,能够适应不同分辨率。实验中将数据依据小波变换的积分变换定义为:
(1)
并计算其小波系数:
Cjk=[wψf](2-j,k2-j)
(2)
使用小波变换处理信号时,首先应选取适当的小波函数将信号进行分解,其次对分解出的参数进行阈值处理,选取合适的阈值进行分析,最后利用处理后的参数进行逆小波变换将信号进行重构[5]从而得到变换后新数据。实验中将采样频率为1000 Hz的脑电信号进行2倍提取后,其采样频率降低为500 Hz,依据采样定理,250 Hz则成为待分析的焦点脑电数据,这是由于该频带属于受脑电信号自身特征影响以及受工频干扰的主要频带范围。
脑电信号降噪处理分解出的脑电信号因选择不同的小波基函数而变化,去除噪声的效果也各有不同,因此选择适当高效的小波基函数成为影响信号降噪效果的关键性因素。支撑宽度、对称性、正交性、正则性是描述小波特性的几项基本指标[6]。对比采用DB10和DB5降噪结果如图2所示。
实验中对比选用不同小波基的实验效果,通过对比发现coifN与dbN具有较大优势,其中N为小波的阶数。
小波函数ψ(t)和尺度函数φ(t)中的支撑区为2N-1,ψ(t)的消失矩为N。dbN小波具有较好的正则性,即将其作为稀疏基所引入的光滑误差不明显,更具有一致性,因此光滑化信号重构过程选用dbN为小波基函数,并且对比了N的数值为5和10的这2种降噪效果。
图2 DB5与DB10处理结果对比
图2显示经过DB10处理的数据明显与原数据具有更大的相似性,而DB5的总体趋势大体和原数据一致,为尽可能保留数据中原始的信息,本文选用DB10降噪结果,为后序数据处理打好基础。
EEG分解为α波、β波、θ波和δ波这4种频段,应用Daubechies D10小波函数进行4层分解,其中,d1为原始信号,d2~d5分别为α波、β波、θ波和δ波这4种频段重构图,图3为疲劳脑电信号分解图。
图3 疲劳脑电信号分解图
实验中提取α波、β波、θ波和δ波这4种频段的幅值序列并求均值,并且参照文献[7]依次计算(α+β)/β、α/β、(δ+α)/(α+β)、(α+β)/θ这4项合成指标,对N个电极的脑电信号进行处理得到8N个脑电特征参数形成脑电参数特征集合X。
针对上文中得到的8个脑电特征参数形成的集合,由于对其进行分类计算时数据量仍然比较大,为提高分类的准确率,降低模型的训练时长以及优化学习的灵活性,对X进行降维。降维方法包括属性选择和映射方法。其中映射又分为线性映射方法(PCA、FDA等)和非线性映射方法:核方法(KPCA、KFDA等)、二维化、流形学习(ISOMap、LLE、LPP等),还包括神经网络和聚类等其他方法[8]。脑电波是非线性非平稳信号,用线性关系去刻画会损失精度且导致低效,因此本文选用非线性的KPCA选取累计贡献率达到90%的主元构成疲劳识别脑电指标。
主成分分析(Principal Component Analysis,PCA)通过将高维空间的问题转化到低维空间处理,从而使问题简易化、明确化,并且这些综合指标之间不具有互相关性,同时又可以提供原有指标包含的大部分信息[9]。作为一种由线性到非线性之间的桥梁,KPCA核方法是通过引入核函数把非线性变换后的特征空间内积运算转换为原始空间的核函数计算[10],从而缩减计算量。
实验脑电特征参数样本集合:x={x1,x2,…,xm},其中m=8N。KPCA方法将数据隐式映射到高维线性可分空间。样本在特征空间中的内积可以用一个核函数来计算[11]:
k(x,y)=Φ(x)tΦ(y)
(3)
核函数通过映射Φ把x映射到F,计算特征空间中的协方差矩阵为[12]:
(4)
(5)
公式(5)左乘Φt(Xj),则特征样本在特征矢量上的投影即为主元[14]P:
(6)
本文应用KPCA对所得8N个脑电参数进行特征降维,将主元按照贡献率降序排列,取前k(k 以受试者1脑电数据进行分析,提取α波、β波、θ波和δ波这4种频段的幅值序列并求均值,依次计算(α+β)/β、α/β、(δ+α)/(α+β)、(α+β)/θ依次记为特征信息集合,其静息及重度疲劳状态下脑电信号各贡献率分布情况如图4所示。 图4 静息与疲劳累计贡献率对比 在疲劳数据集合中,θ波和α波这2种频段的幅值均值以及(δ+α)/(α+β)、(α+β)/θ贡献率较大;在静息集合中,β波、δ波以及(α+β)/β、α/β、(δ+α)/(α+β)累计贡献率达到了90%以上,融合成新的特征集合。 支持向量机(Support Vector Machine,SVM)区别于其他机器学习算法的经验风险最小原则,是建立在结构风险最小化原则基础上的一种基于统计学习理论而来的分类方法,具有训练样本数量小,并且局部优化和泛化能力强的优势。 上文得到的样本T=(xi,yi), i=1,2,…,m,其中,xi为样本里的第i个n维输入向量,yi为对应的输出向量,则基于支持向量机的学习可以理解为寻找输入量和输出量之间的映射关系f(·),使得f(xi)=yi成立[15]。一般f(·)表示为: f(x)=wΦ(x)+b (7) 式(7)中,w称为权向量,b称为阈值,Φ:xn→Ω,即把n维输入向量xn映射到特征空间。若使预测模型精度尽可能高,须调试适当的参数,最大程度降低风险,构造如式(8)的经验风险函数: (8) 其中,L称为损失函数,其表达式为: (9) 在式(9)中ε是大于0的小数,需根据实验情况进行调整设定。原则上当学习样本有限时,使用经验值代替实际风险值是不准确的且不具有科学性,所以SVM算法里融入了泛化风险,称之为SRM准则。则根据SRM准则可选取非线性估计函数为: (10) 构造如下优化目标函数: (11) (12) 式(11)中,ξ、ξ*为2个松弛变量,C称之为容量因子。 将式(10)转化为拉格朗日对偶问题求解,可得: (13) (14) 其中,αi为拉格朗日乘子,K(·)称为核函数,要求满足: K(xi,xj)=(Φ(xi)·Φ(xj)) (15) 引入核函数可以实现实验在运算维数和运算复杂程度上的优化。在实现输入量与输出量之间的对应关系后,即可更新新的输入量从而得到相应的输出量。本实验选用径向基核函数: K(x,xi)=exp (-‖x-xi‖2/(2δ)2) (16) 实验需要确定惩罚因子C和径向基函数中δ,不同参数值的分类效果相差较大,本文通过对训练数据采用模拟退火算法并结合“留一法”进行交叉验证得到[16],并由训练样本求出Lagrange乘子a、偏置值b,再计算函数f(x),得到sgn f(x)为+1,则为重度疲劳状态,sgn f(x)为-1,则为静息状态。表1为特征集合相同情况下2种分类器分类效果对比。 表1 2种分类器分类效果对比 LS-SVM方法有较好的学习能力及泛化性能,能够在一定程度上提高建模水平,训练和泛化误差也可以较好地被控制在一定范围内;同时该模型简化了数据计算量,只需调整正规化参数和核参数,提高了计算效率且能够达到较高的计算精度[17]。 本文对比了单独应用小波变换、KPCA以及同时应用这2种方法的实验,结果如表2所示。 表2 4种方法的分类效果对比 从表2中可以看出在控制同等特征集合时LS-SVM在分类效果、训练分类器耗时上都占有一定的优势;但应用到实际驾驶疲劳预警系统上由于客观条件的限制,目前研究仍然存在一些局限性。例如没有考虑模拟驾驶与实际驾驶的环境差异,模拟驾驶时间比较短,以及“单通道视觉”实验影响实验效果等因素对疲劳监测的影响。因此,使用KPCA-LSSVM的分析方法还有待进一步完善。 针对驾驶疲劳的检测,尽可能准确预测疲劳发生,并发出语音、震动等提示,提高安全驾驶系数,减少交通事故的发生,通过强设备的改进以及算法的优化进一步推进脑电在疲劳驾驶智能检测系统中的应用。3 基于LS-SVM的脑电波数据处理
4 结束语