曾宣威,湛慧苗,吕浩铵,高军峰
(中南民族大学 a.生物医学工程学院;b.认知科学国家民委重点实验室,武汉 430074)
帕金森病是中老年常见的中枢神经系统退行性疾病.随着世界人口老龄化加快,帕金森病患病率逐渐升高,同时帕金森病的高致残率给患者和其家属带来长期的心身痛苦和严重的经济负担[1].由于帕金森病的早期诊治可以有效的改善患者的生活质量,因此对于帕金森病进行早期诊断和治疗将具有重大的临床和社会意义[2].如何更早的诊断帕金森病,也是目前各国学者研究的热点.
目前,帕金森病的诊断仍依赖于运动症状如静止性震颤、肌强直、运动迟缓以及姿势和步态异常等的确定,但大量研究表明精神症状、睡眠相关障碍、记忆障碍、自主神经症状、感觉异常、认知障碍等相关的非运动症状(Non-Motor Symptom,NMS)在帕金森病患者中同样很普遍[3],如果能在帕金森病患者出现明显的运动症状前就关注其非运动症状,并且采取相应的措施,那么对于帕金森病的预防效果和治疗水平将会有很大的意义.
研究表明,脑电图(Electroencephalography,EEG)作为大脑皮质神经元电生理活动的有效测量方式,为帕金森病患者认知功能减退等脑功能损伤提供了一种相对客观的指标,对帕金森病患者的非运动症状的研究提供了一个新途径.同时,EEG 还具有廉价、操作相对简单、可以定期为患者复查、及时调整治疗等优点[4].不仅如此,静息状态下的EEG可以反映大脑处于静息状态时神经网络之间的快速切换,它也可能与大脑功能组织的维持和稳定相关[5],因此静息状态EEG 的分析有助于帕金森病的监测与诊断[6].例如,YI 等人[7]使用排列熵(PE)和有序指数(OI)来表征帕金森病患者与健康对照组的大脑皮质活动的复杂性,他们观察到帕金森病患者的静息脑电图表现为PE 低于健康对照组,OI 高于健康对照组,并说明了早期帕金森病导致了脑电图复杂性的降低.2021 年,LEE 等人[8]记录了帕金森病患者和健康对照者静息状态下的EEG 数据,并且提出的CRNN深度学习模型充分提取了多通道脑电信号的时空特征,能够准确地区分帕金森病患者和健康对照者两类人.
在静息状态下的大脑可以识别出不同的连接网络,其中研究最广泛的是默认模式网络(Default Mode Network,DMN)[9].DMN 的临床意义已确定或与神经精神性脑疾病有关,包括帕金森病、阿尔兹海默症、痴呆、抑郁症和情绪障碍[10].例如,2020 年,XEFTERIS 等人[11]使用静息状态EEG 数据来研究体育训练前后大脑固有皮层网络,包括默认模式网络、突显网络和执行控制网络的功能连接变化,并指出患者伴随着DMN 连接丧失的认知恶化从疾病的早期阶段就很明显,推测即使在认知未受损的帕金森病人中,他们的认知下降也可能与DMN中的连接中断有关.同年,PRAJAPATI 等人[12]使用帕金森病患者和健康对照的静息状态功能磁共振成像数据生成脑功能连接体.通过图论的方法对整体和节点指标进行了分析,并得出结论帕金森病患者的拓扑特征存在显著差异,这在DMN区域和枕部区域表现明显.DMN 自发现以来,它的临床效用和意义一直受到研究者的关注[13].一方面,这可能与DMN 的潜在作用有关,包括记忆巩固、工作记忆、外部和内部环境的广泛连续采样、情绪显著刺激的处理以及情绪处理和认知功能之间的相互作用[14];另一方面,当开始执行任务时,DMN 会失活,但在休息期间大脑区域群的激活会增加[15].
综上所述,本研究假设帕金森病患者在DMN区域之间的有效连接会发生改变,且部分连接可能存在显著差异.研究获取帕金森病患者和健康对照组的静息状态EEG 信号,并选取两类受试者DMN 区域对应的电极信号作为数据,然后通过部分定向相干(Partial Directed Coherence,PDC)计算电极对之间的有效连接,然后对这些连接进行统计分析,挑选出来有统计差异的PDC 连接构造成特征矩阵.最后,利用XGBoost 分类器对两类被试的特征矩阵进行分类,验证DMN 中基于EEG 信号对帕金森疾病研究的有效性.
本研究在Narayanan 实验室获取有关帕金森病患者的静息态脑电实验研究数据[16],数据库中记录的帕金森病患者和对照组的EEG 数据都是来自新墨西哥大学(UNM;新墨西哥州阿尔伯克基).对照组参与者在年龄和性别上与帕金森病患者在人口统计学上相匹配,并且在任何教育或病前智力测量上没有差异.所有程序都得到了机构审查委员会UNM办公室的批准.所有参与者都提供了书面知情同意,并在新墨西哥州获得了每小时20美元的报酬.帕金森病患者完成神经心理学和问卷调查,并且接受来自神经科医生的联合帕金森病评定量表(UPDRS)的运动评分以及在每个患者疗程中都被录像,并由运动障碍专家进行评分.所有参与者的迷你精神状态测试(MMSE)分数都在26 分以上.以前的研究已经报道了其中一些受试者的数据和结果[17-18].
在UNM 数据集中共有27 名帕金森病患者和27 名健康对照组,采用64 通道脑视觉系统,使用在线参考CPZ 作为基线,并且用Ag/AgCl 电极所记录0.1~100 Hz 范围内的脑电信号,采样率为500 Hz.每个受试者都有一段脑电图记录,其中包括一段闭眼状态和一段睁眼状态.本研究只使用数据集中处于闭眼状态的脑电数据.由于获取的原始数据形式是每个通道的对应两类人的数据,所以,先利用MATLAB 软件整理为两类人共54 个样本数据,每个样本数据均为通道数×采样点的矩阵数据.为保证实验数据的均衡性,将采集时长过长和过短的两名被试数据(帕金森病患者和健康对照组各一名)进行剔除,保留26 名帕金森病患者和26 名健康对照组.最后,使用MATLAB 软件中的EEGLAB 工具箱对数据进行滤波分割、基线校正、去伪迹等操作,参数设置分别为0.5~70 Hz 带通滤波,截取40 秒的数据并且使用来自EEGLAB 的reject插件来去除伪迹.然后将数据重新参考平均参考值.整个帕金森EEG信号处理的流程如图1所示.
图1 帕金森EEG数据处理流程的方框图Fig.1 Block diagram of EEG data processing flow
根据过往研究,默认模式网络中一致确定的核心区域分别是内侧前额叶皮质(Medial Prefrontal Cortex,MPFC)、楔前叶(Precuneus)和外侧顶叶皮质(Lateral Parietal Cortex,LPC)[19].DMN 区域的布罗德曼区域(Brodmann,BA)以及对应最近的EEG 电极[20-22]如表1 所示.根据如表1 所示的BA 区,选择构成DMN 中的六个电极,即选取Pz、Fz、F3、F4、P3 和P4的数据做后续分析.
表1 DMN区域的BA区以及EEG记录的最接近的电极Tab.1 BA area of DMN area and the closest electrode recorded by EEG
PDC 是一种基于多元自回归模型(Multivariate Autoregressive Model,MVAR)和部分相干的频域有效连接技术,它通过建立自回归模型并将模型参数转换到频域,得到不同频率下不同脑电通道之间的因果关系.计算出的PDC值为标准化值,范围为0到1.Pij表示从节点i到节点j的信息与从节点i流出的所有信息的比率.值越大表示两个通道之间的关系更密切.PDC算法描述为:
假设EEG 包含M个通道,根据假设构建一个MAVR为:
它可以表示为X(n)=[x1(n),...,xM(n)]T,其中每个向量都代表一个信号通道.p阶自回归模型(AR)用于表示每个通道的信号.其中,i和d表示信号通道,aid表示通道i到d的系数,e表示偏差,xi(n)表示时间n处的信号值,p表示模型阶数,其根据AIC准则计算.
只要求出系数状态量aid及误差e就可以求解预测模型.假设各个通道间的信号噪声是独立的,而且均值为0.这样公式(1)的转置如:
式中,XT(n)=[x1(n),x2(n),…,xd(n)]T就是一组离散的数据采样点,它表示的是在时刻n时采集到的数集存放的是噪声矩阵.令:
式中Pm是MAVR 的最大预测模型参数,式(2)可以写成:
只要在公式两边同时左乘DT即可求出系数矩阵A,由于DTD是对称方阵,假如|DTD|≠0,那么DTD为可逆矩阵,这样就可以求得MAVR模型的系数:
A是一个MVAR 模型d×d预测系数矩阵,表示预测时间序列,而E也是一列长度为d的列向量,表示预测误差序列.
在建立MVAR 后,用最小二乘法拟合系数A(r).根据M维单位矩阵与系数矩阵傅里叶变换的不同,采用拉普拉斯变换将其变换到频域.
其中,r为模型阶数,p为MVAR 的最大预测阶数,f为频率.从通道j到i的PDC值定义为:
其中,aj(f)是A(r)的第j列(j=1,2,...,M),H表示共轭转置,Aij(f)是系数矩阵A(r)中i行和j列的系数.
由于大脑本质上是高度动态的,并且为了确保可靠计算MVAR 的建模参数以及确保脑电图信号的平稳性,通常在计算PDC 时会使用长度小于或等于4秒的脑电图片段[22],因此,使用HERMES工具箱将每个受试者的40 秒脑电图数据提取为4 秒长度并叠加50%窗口的19段连续片段,再计算上述预处理后两类人群的数据集的PDC 值,最后将每个受试者的19段的PDC值进行叠加平均,生成两类受试者共52个6 × 6(通道数×通道数)的PDC连接矩阵.
采用SPSS 22.0 软件,利用独立样本t 检验对帕金森病患者组和健康对照组之间的PDC 连接进行统计学分析,并以P<0.05 为两者差异有统计学意义.最后挑选出若干个有显著差异的PDC 连接组成分类的特征集.
本研究选用XGBoost 算法作为本研究的分类器.XGBoost[24]是一种改进的梯度提升算法,它采用二阶导数优化目标函数,将多个弱分类器进行融合从而演化成强分类器.XGBoost 具有计算复杂度低,运行速度快、准确度高的优点.我们基于Python 3.8的编程环境对XGBoost 算法进行配置:对上述数据集进行嵌套交叉验证[25],该过程有两个循环,即外循环和内循环.外层循环使用8折交叉验证,在每折中,将44 名受试者的样本数据(22 名帕金森病受试者和22 名对照组)用于训练集,剩余8 名受试者的样本数据(帕金森病和对照组各4 名)用于测试集.训练集数据用于内层循环寻找最佳超参数模型,测试集数据对内层循环模型测试.内层循环使用12折交叉验证,在每折计算中都将11折数据作为子训练集,剩余数据作为验证集.在该过程中,应用不同参数组合,如表2 所示,使用子训练集训练分类器,接着用验证集对训练出的分类器进行验证.当验证准确率最高时,可以获得具有最佳参数组合的分类器.再将测试集送入该分类器中,就可以得到测试准确率.将8 折计算得到的测试准确率取平均值得到最后的分类准确率.
表2 XGBoost分类器最佳参数Tab.2 Optimal parameters of XGBoost classifier
在统计分析中,对获取的两组受试者6 × 6(通道数×通道数)PDC 连接矩阵进行整合,去除对角线元素后,将其余的元素构成1 × 30的PDC连接向量,最终获得2 个26 × 30的PDC 连接矩阵.对PDC 连接矩阵中每个PDC 连接单独进行两组受试者间的独立样本t 检验,检验出PDC 连接差异.结果如图2 所示,在30 个PDC 连接中,共有6 个PDC 连接有显著的统计学差异(P<0.05).
本文选取的6 个电极对应最近DMN 区域的BA区,故将电极位置投影到大脑皮层,并利用BrainNet工具包[26]画出6个有显著差异的PDC连接的大脑网络信息流图,如图3 所示.图3 显示了帕金森病和健康组中每个连接归一化后的平均强度以及信息流流向.从图3 可以看出,在大多数连接中,帕金森病中DMN 区域相互之间的因果效应比健康组更强烈.这意味着相比于健康组,DMN 区域之间的信息流以及相应地这些区域之间的相互影响与帕金森病的关系更为密切.同时,帕金森病 患者中DMN 区域的因果效应较大,也意味着静息状态下的DMN中的区域被激活.
图3 健康对照组(a)和帕金森病患者(b)的DMN的有效连接网络使用t检验获得的显著连接构建.箭头表示影响的方向,不同的颜色表示PDC的归一化强度.Fig.3 The effective connection network of DMN in healthy control group(a)and patients with Parkinson’s disease(b)was constructed using the significant connection obtained by t-test.Arrows indicate the direction of influence,and different colors indicate the normalized intensity of PDC.
由于帕金森病和健康的受试者之间存在6个具有统计学差异的PDC 连接,因此本研究将6 个有显著差异的PDC 连接作为特征集,并送入到XGBoost分类器中训练及测试.最终,得到区分帕金森病和对照组测试的准确率为76.5%,灵敏度和特异度分别为83.3%和70.8%,如表3 所示.分类结果基本上验证了将PDC算法用于DMN分析的有效性.
表3 XGBoost分类模型的分类结果Tab.3 Classification results of XGBoost classification model
本研究将PDC 应用于DMN 相关电极的数据序列,并获得对照和帕金森病受试者的DMN的有效连接性网络.在DMN相关电极上的对照组和帕金森病组PDC 连接之间进行独立样本t 检验,并选择具有显著差异(P<0.05)的连接进行进一步分析.DMN 连接上的差异将可以归因于帕金森的症状和损害投射到DMN水平的这些变化上.针对于帕金森病的注意力障碍、记忆障碍、认知障碍等非运动症状,我们试图找出与帕金森病相关的非运动症状表现与DMN中有效连接的变化之间的关系.
帕金森病认知障碍易被忽视,它的临床表现多种多样,具有异质性,可出现多个认知领域如注意力、视空间、记忆和语言功能异常[27].图2 和图3中的结果显示,与对照组相比,帕金森病患者的BA08/09(Fz)和BA39/40(P4)之间的连接Fz←P4 降低20.3%,这表明对于帕金森病患者来说,具有控制视觉运动注意功能的顶区BA39/40没有从具有警觉性选择和持续性关注功能的额区BA08/09获得足够的视觉空间信息来很好的控制注意力.
同时,在帕金森病人中,有很多研究也报道了错误记忆和前瞻记忆等障碍[28].一般来说,在执行涉及工作记忆的任务时,观察到Fz(BA08/09)和Pz(BA07)以及大脑其他额叶和顶叶区域的神经元活动显著变化,根据表2 和图2 的结果,我们发现相比于健康组,帕金森病患者的DMN 中额区的F3←Fz、F4←Fz和F4←F3 连接分别增加了29.4%、69.5%和50.9%,以及额区到顶区的F4←Pz 连接增加了58.6%.这与其他报道中DMN中功能连接的变化相反[29].因此,我们推测由于DMN的失活需要从内部定向行为转变为外部定向行为,所以较少的DMN失活可能反映了帕金森病患者所需的记忆力资源增加,并且DMN中额区的增强可以补偿静息状态下受损的记忆功能.为了证实这一推测,需要更深入的研究来检验.
本文对帕金森疾病的早期诊断和分析已对默认模式网络通过有效连接的方式进行讨论.本文使用的Narayanan 实验室中的静息态帕金森病的脑电数据同样被研究者对帕金森病的诊断展开研究,同样得到了很好的效果,对理解帕金森病的生理机制进行分析并为帕金森病的早期诊断提供了更多的思路.例如,2018 年,SINGH 等人[17]在涉及认知控制的任务中收集头皮脑电图,发现帕金森患者在线索和反应周围的中额叶θ 活动减弱,特别是与反应冲突和错误后处理相关.并与其对照组进行分类,这些发现有助于确定PD 认知控制期间中额叶θ 畸变的范围.ANJUM等人[18]在2020年提出了一种对帕金森患者使用线性预测编码EEG 的算法,该方法可以有效地将EEG 时间序列编码成能够以适合于实时应用的计算快速方式检测帕金森病的频谱EEG 特征,并可靠地区分帕金森患者和其对照组.
本文得出结论,静息状态下帕金森病患者的非运动症状与DMN网络存在显著性的关系,表现在注意力控制与记忆上,这与BA07、BA08/09、BA39/40的受损有很大的关系,并且随后对两类受试者的分类,也取得了较好的结果.
本研究还存在一些局限性.为了提高帕金森病早期诊断效果以及对帕金森病在认知功能的生理机制进行深入研究,未来还需要结合其他生物标志物并扩大样本量,以提高研究结果的稳定性.另外,本文仅基于头皮脑电信号研究两类受试者在默认模式网络中有效连接差异,相较于大脑皮层源信号,未能更准确地体现默认模式网络激活的皮层区域间连接特性.因此,未来将对EEG 信号进行溯源分析,以研究默认模式网络皮层区域间的因果效应关系.