丁成义
(中国电子科技集团公司 第二十七研究所,河南 郑州 450047)
随着目标所处环境复杂性日益增加,以及目标主动隐身与反探测能力的提高,现有的计算机目标检测识别方法(模板匹配、最近邻和决策树等)遇到较多技术瓶颈,亟待寻求新的目标探测方法。
人类长期进化的大脑对运动或者敏感目标,会诱发出一些特殊的神经信息,这些神经信息可通过脑电信号(EEG)来反映,其中最重要的是P300事件相关电位。P300是一种内源性的与认知功能相关的特殊诱发电位,通过检测脑电信号中的P300电位,可以快速实现对目标的探测分选,进而实现分类识别。
近些年来,脑-机接口(brain-computer interace,BCI)技术的研究在国际上引起了广泛的关注并获得了快速的研究进展。通过利用EEG等来实现人机交互,是一种新型的人机接口方式。BCI技术在助残、康复、辅助控制、神经机器人、特殊环境条件下的军事应用等领域有着广泛的应用前景[1]。利用人类的脑电波结合先进的认知处理算法,充分利用人的智能和现有机器的智能结合提高对目标的探测概率。
人类在长期进化过程中形成的EEG中的事件相关P300电位是一种内源性事件相关电位(event related potentials,ERP),一般出现在刺激发生后300ms左右,具有时域波形特征,通常采用Oddball范式诱发。所谓Oddball范式,是指在标准刺激(大概率刺激)的序列中,偏差刺激或靶刺激(小概率刺激)诱发的ERP。偏差刺激或靶刺激出现的概率越小,诱发的P300振幅越大[2]。自1965年Sutton等人发现P300电位以来,P300电位一直是ERP研究的重要内容,也是脑科学研究的重要途径之一。Farewell和Donchin等最早将P300作为控制信号应用于BCI[3],他们设计了基于P300的虚拟打字机,这样可以使瘫患者通过拼写单词实现与外界交流[4]。此后基于P300的BCI研究大都建立在Farwell等的工作基础之上。例如Hoffman等[5]将呈现的矩阵改为6张生活图片,同样通过闪烁摸一张图片来诱发P300,6张图片包含开灯、开窗和看电视等内容。结果发现这一系统能满足患者的某些活动需要。Perez-marcos等[6]用P300电位控制机器人,是机器人能够实时地写出受试者所注视的字符。
P300电位的波形特点是位于刺激点后约300ms出现一个正向的峰值电位,其波形如图1所示。
事件相关电位(ERP)是大脑对某种事件进行信息加工时诱发产生的一系列电活动,其中P300是一种内源性的时间相关电位,与大脑注意力有关,是对发生概率相对较小的外界事件或刺激的反应。P300一般出现在刺激发生后300ms左右,它也因此而得名。
图1 P300电位的波形图(PZ)
P300是一种内源性的与认知功能相关的特殊诱发电位(Sutbn等人1965年发现),主要与心理因素相关。P300即为晚成分的第3个正波,也称为P3。经典的P300可在Oddball实验范式下出现。该范式是指当对同一感觉通路的一系列刺激由两种刺激组成时,一种刺激出现的概率很大,如85%,通称为标准刺激或背景刺激;另一种刺激出现的概率很小,如15%,称为敏感刺激或偏差刺激。由于两种刺激出现的顺序随机,所以,对受试者来说偏差刺激具有偶然性。当要求受试者发现偏差刺激后尽快按键或记忆其数目时,此时偏差刺激也称为靶刺激。在偏差刺激后约300ms就可观察到P300。
P300的测量指标和其他一般诱发电位一样,主要为潜伏期和波幅。 P300 的头皮分布广泛,相对集中在中线部位(Fz,Cz,Pz,Oz),如图2所示。其波幅在顶后部(Pz)最大,中央顶部(Cz)次之,主要特点是具有稳定的时间窗,对特征识别敏感等,成分较大易于测量。
图2 P300电位测量电极分布图
综上所述,P300电位的优势特点如下:
(1)P300是完全可以通过视觉刺激诱发的,所以可以用于目标探测;
(2)P300是与注意相关的信号,对于新异性目标的出现有较强的反应幅度。而且新异性越强幅度越高,有利于模式识别算法对信号的处理。能够很好的保证识别准确率和识别时间。
(3)P300由于信号幅度较大,可以避免传统ERP数据处理过程中大量的叠加平均。只需要少次叠加,甚至单次即可实现对P300信号可靠稳定的提取。
基于P300电位的特点,我们设计了P300电位的目标探测系统进行目标的快速精准探测,使用该系统可以很好地提高目标探测的准确率和降低虚警率。
基于P300电位的目标探测系统主要由八个互相通信的主要模块构成。每个功能模块通过一些可选的过程和算法完成一部分相对独立的工作,系统的硬件架构组成模块及关系如图3所示。
图3 目标探测系统的组成框图
实验系统搭建的示意图如图4。
图4 目标探测系统搭建示意图
系统通过图像采集与处理分析模块为BCI系统提供足以诱发出P300的图像序列(如图5所示),然后每次图像出现在显示器上时,都会将该图像所对应的EEG信号打一个时间开始标签。在模式识别时,对标签后250ms~350ms的一段数据利用训练好的SVM(支持向量机,Support Vector Machine)[7-10]进行识别。对分类识别出的P300信号,依据时间关系,反推追溯出引起该P300的图像,从而达到对特定目标探测的功能。
图5 刺激时序图
在EEG脑电信号采集过程中,极易受到各种伪迹噪声的干扰,因此在预处理模块中,要对脑电数据进行滤波,一方面是为了去除脑电中存在的大量噪声,另一方面可以提取重要成分进行后续处理。这里我们采用空间变换方法[11],去除各种伪迹干扰。
在特征提取模块中,小波和时频谱分析[12]、相干平均、小波包分解分析、Hilbert-Huang变换、公共空间模式(CSP)[13-15]方法被用于提取预处理后的EEG信号特征;最后,在模式分类模块中,一个SVM被训练来分类从每段EEG中提取出的特征向量。
本实验具体过程分为训练和测试。训练过程用来得到一个分类效果较好的分类器。测试过程,也就是对目标识别探测的过程。
图6 目标探测系统实验图
实验设置:基于Oddball范式,标准刺激为缓慢变化的沙漠背景图像和海洋图像(如图6所示),偏差刺激为沙漠或海洋背景中出现飞机、坦克、军舰等图像,刺激过程中每幅图像呈现的时间为600ms,且偏差图像出现的概率为16.7%,P300成分采用在线单次提取方法获取,原始信号波形图和主要特征如图7和图8所示,其中训练时采用十五导联(采集受试者大脑的顶部、枕部)数据,横坐标为样本点数目,纵坐标为EEG信号的幅度(μV)。
图7 原始信号波形图特征
图8 在线实验中各导EEG数据的P300特征图
在这里,我们以目标探测率和虚警率作为衡量系统的两个标准,这里虚警包括误警和漏警。实验选取了6名年龄25~29岁的健康男性受试者。在安静,光照略低的室内环境中进行。首先要对受试者进行训练。实验测试结果如表1所示,每个测试者的测试结果为多次测试,取平均值作为最终结果。
表1 实验测试结果
搭建基于P300电位的目标探测系统,通过Oddball刺激图像序列,诱发受试者产生P300电位。再对产生的P300电位进行预处理、特征提取和模式识别分类,实现系统连续的在线目标探测。经过对多个受试者的多次实验表明,该P300目标探测系统能够很好地实现对图像目标的识别,极大地提高了敏感图像目标识别的效率。尽管如此,实验中仍然存在一些问题:实验前需要涂脑电膏等准备工作和实验后的清洁工作,图像采集分析处理阶段如何能够更快地产生符合产生P300的刺激图像序列等。未来,随着非接触式的脑电波探测技术研究的深入,能够极大地缩短实验的准备时间和不必要的麻烦,从而能够更好地使该系统在目标探测和情报分析判读等领域得到应用和推广。
[1]WOLPAW JR,BIRBAUMER N, HEETDERKS WJ,et al.Brain-computer interface technology∶a review of the first interaction meeting[J].IEEE Transaction on rehabilitation Engineering,2000,8(2)∶164-173.
[2]赵均榜,张智君.基于皮层诱发电位的脑机接口研究进展[J].航天医学与医学工程.
[3]Donchin E,Spencer K M,Wijesinghe R.The mental prosthesis Assessing the speed of a P300-based brain-computer interface[J].IEEE Transaction on Rehabilitation Engineering,2000,8(2)∶174-179.
[4]马忠伟,高上凯.基于P300的脑-机接口:视觉刺激强度对性能的影响[J].清华大学学报:自然科学版,2008,48(3)∶417-420.
[5]Hoffman U,Vesin J M,Ebrahimi T,et al.An efficient P300-based braincomputer interface for disabled subjects[J].J Neurosci Methods,2008,167(1)∶115-125.
[6]Perez-Marcos D,Buitrago J A,Velasquez F D.Writing through a robot∶A proof of concept for a brain-machine interface[J].Med Eng Phys,2011,33(10)∶1314-1317.
[7]Duncan-Johnson C C,Donchin E.On quantifying surprise∶the variation of event-related potentials with subjective probability[J].Psychophysiology,1977,14(5)∶456-467.
[8]葛瑜,刘杨,周宗潭,胡德文.用于脑-机接口P300实验的支持向量机分类方法[J].计算机工程与设计,2008,29(11):2860-2862.
[9]杨淑莹.模式识别与智能计算:Matlab技术实现[M].北京:电子工业出版社,2008.
[10]Vapnik V N.Statistical learning theory[M].New York∶Jone Wiley&Sons,1998.
[11]计瑜,沈继忠,施锦河.基于BSS的EEG信号中眼电伪迹的自动去除方法[J].浙江大学学报:工学版.
[12]Mensh B D,Werfel J,Sung H S.BCI Competition 2003—Data set Ia∶combining gamma-band power with slow cortical potentials to improve single-trial classification of electroencephalographic signals[J].IEEE Transactions on Biomedical Engineering,2004.
[13]Ramoser H,Muller-Gerking J,Pfurtscheller G.Optimal spatial filtering of single trial EEG during imagined hand movement[J].IEEE Transaction on Rehabilitation Engineering,2000,8(4)∶441-446.
[14]Tang Y,Tang J T,Gong A D.Multi-Class EEG Classification for Brain Computer Interface based on CSP[C]//Proceedings of the 1st International Conference on Biomedical Engineering Informatics,Sanya,China,2008,2∶469-472.
[15]李明爱,刘净瑜,郝冬梅.基于改进CSP算法的运动想象脑电信号识别方法[J].中国生物医学工程学报,2009,28(2):161-165.