李冬,金韬,冯智英,左路路,朱翔,刘伟明
1.浙江大学信息与电子工程学院,浙江杭州310027;2.浙江大学第一附属医院疼痛科,浙江杭州310027
疼痛是集病理、情感为一体的不愉快的主观感受[1]。由于人体对疼痛的感知涉及到大脑的多个区域,通过对大脑活动的研究解码疼痛变得非常复杂。脑电图(Electroencephalogram,EEG)反映人体大脑皮层电活动的平均值,包含大量的生理病理信息[2]。通过对脑电信号进行特征提取,有望实现对疼痛的客观评估,为疼痛的临床治疗提供更多信息。
国内外学者针对疼痛脑电信号特征提取方法进行大量研究,采用包括时域[3]、频域[4-6]、时频域[7-10]和非线性动力学[1,11]等研究方法。时域分析方法主要是分析脑电信号波形的几何性质,如脑电信号的幅值、方差以及均值等。频域分析方法,主要是通过FFT变换获得功率谱,将脑电信号各频率段的功率、功率谱峰值频率[4]等作为研究疼痛的潜在特征。由于脑电信号是一种非平稳并且产生机理非常复杂的随机信号,单纯从时域或频域提取特征仅能够分析出大脑在不同疼痛状态下脑激活程度的差异,不足以从多维度提取有效特征对疼痛等级进行分类预测。小波变换属于时频分析方法,其能够提供一个随频率改变的“时间-频率”窗口,具有良好的时频分辨率,能够捕捉到疼痛随时间变化的局部信息,已被成功应用在疼痛研究领域[7-9]。Hadjileontiadis[7]通过让健康受试者的右手深入冰水中获得冷痛刺激,特征提取采用基于小波变换的双谱分析,在不痛和疼痛两分类情况下获得84.12%的分类准确率。Vijayakumar等[9]对受试者进行热痛刺激,特征提取采用独立成分分析和小波变换相结合的方法,以随机森林(Random Forest,RF)为分类器,在1~10级的疼痛识别中准确率高达89.45%。这些方法对外部刺激诱发的疼痛识别取得较好的分类效果,但没有考虑到对原始特征集进行特征选择。原始特征集通常维度较大,计算成本高,且具有高冗余性,进一步优化特征集可以提高分类性能。RF利用袋外数据能够评估变量重要性,可以有效地用于特征选择,已被成功应用于生物信息学[12]、黑色素瘤诊断等领域[13]。从目前来看,在疼痛识别领域尚未发现采用RF筛选最优特征子集。
本研究通过临床采集疼痛患者脑电信号,弥补外部刺激不能充分模拟自然和临床痛苦的缺陷。采用基于离散小波变换(Discrete Wavelet Transform,DWT)的疼痛脑电特征组合方法,并利用RF进行特征选择。对特征选择前后的分类准确率进行对比,实验结果表明进行特征选择后能以较高的准确率识别出不同的疼痛水平。
DWT被广泛应用于生物信号的时频分析,脑电信号具有非平稳特性,利用小波变换能够捕捉大脑感知疼痛的细节信息[14]。在众多小波家族中,Daubechies类小波在脑电信号的分解中具有很多优点[15]。因此,在本研究中采用Daubechies 4(db4)小波对脑电信号进行4层分解。EEG信号的具体分解过程如图1所示,首先原始信号x[n]通过半带高通滤波器g[n]和低通滤波器h[n]被分解为低频和高频部分,分别得到近似系数A1和细节系数D1,然后对低频部分重复上述步骤直到达到所需分解的层数。其中,分解系数的表达式如式(1)和式(2)所示:
其中,ai[k]和di[k]分别表示信号在第i层分解中第k点变换得到的近似和细节系数。
图1 脑电信号4层小波分解Fig 1 Four-level wavelet decomposition of electroencephalogram(EEG)signals
与疼痛相关特征的提取对于疼痛的客观评估至关重要。由于脑电信号在不同的疼痛状态下,各个脑电节律的能量分布、信号复杂度会发生变化[11,16]。因此,我们根据EEG信号经DWT变换后的分解系数,计算各子带的能量占比、样本熵以区分不同的脑电状态。其中,能量占比计算过程参考文献[17]中的方法。样本熵值能够衡量时间序列的复杂度,时间序列越复杂,其对应的样本熵值越大[18]。样本熵算法的计算过程参考文献[19]的方法。其中引入两个重要的参数m和r,m代表嵌入维数,r代表时间序列标准差。研究表明,当参数m取值为1或2、r取值为0.10~0.25时,样本熵值有较好的统计效果[19]。本研究中,m取2,r取0.15。
相位同步能够揭示大脑不同区域神经电活动的关系,已被广泛应用于脑电信号分析[20]。为了提取在不同疼痛状态下各通道脑电信号间的相位同步关系,我们提出一种基于小波分解的相位同步计算方法。对于8通道脑电信号,分别计算在不同分解水平和不同通道对之间的锁相值,共得到5个特征向量,每个特征向量包含28个元素。小波锁相值的计算过程如下:
(1)设信号x(t)和y(t)分别为通道x和通道y的脑电信号经DWT第l(1~4)层的分解信号,对信号x(t)和y(t)进行希尔伯特变换得到信号xh(t)和yh(t):
(2)计算信号xh(t)和yh(t)在时间t处的瞬时相位,得到瞬时相位差:
(3)信号xh(t)和yh(t)的锁相值(PLV)被定义为两信号在所有时间点的相位差的平均值:
RF是被广泛应用于数据挖掘、生物信息处理等领域中解决高维度和非线性样本的一种分类器[21]。本研究中,为了验证特征提取方法的有效性和提高分类模型的预测精度,我们采用基于RF的Wrapper特征选择算法。利用基于袋外数据分类准确率的变量重要性度量方式[22],对特征进行重要性排序,然后采用序列后向选择算法(Sequential Backward Selection,SBS),每次从特征集合中去掉一个重要性得分最小的特征,逐次进行迭代,并计算分类准确率,最终将分类准确率最高的特征集合作为特征选择结果。为了评估分类器的鲁棒性,在每次迭代中,采用留一交叉验证方法,每次只留下一个样本作测试集,其他样本被当做训练集[23]。同时,为了测试分类器的性能,我们分别计算了分类准确率、灵敏性和特异性。
本研究中,脑电数据共包含3个数据集(无痛、轻痛和重痛),无痛组数据来自于7例健康受试者,轻痛和重痛数据集是从14例患有不同程度带状疱症后遗神经痛的患者中临床采集到的脑电信号,根据患者对疼痛的自我描述,将数据归类到轻痛组或重痛组。实验设备采用8通道的脑电信号采集仪,采样频率为250 Hz,并自带50 Hz陷波器和0~48 Hz的带通滤波器,其电极安放位置根据国际10-20系统安放在C3、C4、P7、P8、O1、O2、FP1和FP2位置,参考电极固定在双耳垂。在数据采集过程中,要求受试者闭眼放松,采集时间约3 min。对于明显属于干扰噪声的信号,进行手动剔除。最终,每组脑电数据共包含5 000个采样点,用于后续特征提取。在实验开始前,所有参与者均签署知情同意书。
首先利用db4小波对每位受试者的8通道脑电信号进行4层小波分解,得到近似系数A4和细节系数D1~D4,具体分解结果如图2所示。每层分解信号的子带频率范围及其对应的近似脑电节律如表1所示。基于每层分解的小波系数,我们计算小波统计特征值(最大值、最小值、平均值和标准差)、各子带能量占比、样本熵以及两两通道对之间的锁相值。最终,对每组脑电信号,我们提取包含380个元素的特征向量。这些特征向量的具体描述如表2所示。
图2 某患者原始EEG信号及DWT分解结果Fig 2 Original EEG signals from one patient and results of discrete wavelet transform(DWT)decomposition
表1 每层小波分解的子带频率范围及其对应脑电节律Tab 1 Sub-band frequency range of each wavelet decomposition level and the corresponding brain wave rhythms
表2 提取特征描述Tab 2 Descriptions of extracted features
对提取的特征向量,我们采用基于RF的序列后向选择(RF-SBS)算法进行特征选择和分类预测。疼痛强度的分类共包含3个两分类问题(无痛和轻痛、轻痛和重痛、无痛和重痛)和1个三分类问题(无痛和轻痛和重痛)。同时,为了评估分类器性能,我们分别计算分类器的准确度(Accuracy)、灵敏性(Sensitivity)和特异性(Specificity),各参数计算公式如下:
表3显示由RF-SBS算法筛选后的特征作为RF分类器的输入进行训练和分类的预测结果。由表3可知,无痛和轻痛的分类准确率为92.85%,无痛和重痛的分类准确性为100%,轻痛和重痛的分类准确率为92.85%,不同疼痛水平三分类的分类准确率为80.95%。这表明所提出的方法可以作为疼痛水平识别的有效工具。
表3 RF-SBS特征选择后的分类结果(%)Tab 3 Classification results using features selected by RF-SBS(%)
此外,我们将由RF-SBS算法选择出的特征组合与所有特征分别作为分类器输入时的分类结果做对比,结果如表4所示。可以看出,经特征选择后的分类效果明显好于将所有特征作为分类器输入的情况。这表明提取的脑电特征在表征和疼痛有关的信息之外,仍然具有较大的冗余性,不利于分类器模型的训练和预测。对高维特征进行特征选择后,疼痛预测的准确度显著提高。
表4 不同特征下的分类结果比较(%)Tab 4 Comparison of classification results based on different features(%)
本研究提出一种新颖的方法用于识别带状疱疹后遗神经痛患者的疼痛强度。基于DWT,对临床脑电数据进行特征提取,并使用RF-SBS算法对高维特征进行特征选择。这些被选特征被用于训练和预测疼痛水平,以21例临床采样数据作为训练和测试样本,采用留一交叉验证方式,达到较高的分类效果,平均准确率为91.7%,其中对于无痛和重痛的分类情况达到100%的准确率。这表明提取的特征能够捕捉到由不同疼痛状态引起的脑电模式的变化。另外,与将所有特征作为分类器输入相比,经RF-SBS筛选后的特征训练出的模型准确度更高,说明高维脑电特征具有冗余性,筛选后的特征更能反映患者疼痛状态。这种方法能够作为一种有效的工具用来诊断疼痛水平,并为临床疼痛的治疗提供及时的信息。未来,可以考虑通过融合其他相关生物特征以进一步提高分类准确率,并能解释潜在的疼痛反应机制。