胡 廷,孙 婕,牛 焱,高 原,相 洁
太原理工大学 信息与计算机学院,太原 030600
阿尔兹海默症(Alzheimer’s Disease,AD)是一种弥散性脑疾病当临床症状出现时,患者已经出现不可逆的多发性大脑结构异常。AD较长的临床前期为早期干预性治疗提供了很好的机会,将AD的“诊断窗口”前移是防治AD的重要措施。
复杂度是混沌性的局部与整体之间的非线性形式,反映了事物的混乱程度。熵是分析复杂度的有力工具,因为它允许描述系统可能状态的概率分布。Gomez等使用近似熵(ApEn)和样本熵(SampEn)来分析MEG信号,并发现AD患者的信号比对照受试者更规则[6-7]。Wang等使用排列熵的复杂度分析方法发现了NC到AD发展过程中6个脑区复杂度发生显著变化,AD阶段PE值最低[8]。经上述研究可以发现,AD阶段与其他阶段相比信号,眶部额下回、顶上回、中央沟盖等区域的复杂度降低。Jack等利用携带APOE ε4载体的人与不携带APOE ε4的人作比较,发现携带ε4载体的人在NC、MCI和AD中表现出更大的β(Aβ)沉积[9],导致更严重的脑萎缩,尤其是内侧颞叶周围。然而,APOE ε4基因对AD患者的大脑复杂度的影响情况还是未知的。
排列熵(Permutation Entropy,PE)是用来度量非平稳时间序列不正则性的一种新方法[10]。PE只考虑样本的等级,而不考虑它们的度量标准。作为一种顺序测度,PE与其他常用的熵度量相比具有一定的优势,包括它的简单性,在没有进一步模型假设的情况下计算复杂度低,以及在存在观测和动态噪声的情况下的鲁棒性[11-13]。
现已有大量研究证明了APOE ε4基因对AD患者的影响较大[3-4,14],ApoE ε4 基因的多态性会对脑部创伤的反应、衰老及一些认知能力下降等造成影响,AD患者的大脑复杂度也较低[6-7]。因此,探究在 ApoE基因型影响下,AD患者在排列熵中的变化情况,以较高的准确率区分患者各个阶段,将会为阿尔茨海默病早期诊断提供新的研究思路。本文研究了基因和复杂度在阿尔茨海默病早诊中的应用,通过把基因加入到分类指标中,显著提高了分类准确率,可以更好地对AD的各个阶段进行区分。
本研究将排列熵应用于NC、早期轻度认知损害(Early Mild Cognitive Impairment,EMCI)、晚期轻度认知损害(Later Mild Cognitive Impairment,LMCI)和AD受试者,对是否携带APOE ε4载体的静息态功能性磁共振成像(rs-fMRI)fMRI信号的复杂程度进行了分析,为AD更早期地发现提供诊断依据和干预策略。最后运用SVM(Support Vector Machine)方法,使用十折交叉验证对被试进行分类研究,以此来辅助 AD的诊断,为AD的诊断提供新视角。
本研究包括以阿尔茨海默病神经成像(http://www.adni-info.org)程序手册(ADNI)提供的标准诊断为NC、EMCI、LMCI和AD的患者。从数据库根据被试类型(NC、EMCI、LMCI、AD)和时间节点为140选取被试共124例,具有基因信息的被试共有109例。具体被试情况如表1所示。
表1 被试基本信息
根据ADNI采集协议,使用3 台 Tesla(3t)扫描仪(Philips医疗系统)采集功能和结构MRI数据。每个受试者的静息状态fMRI数据由140个功能体积组成,参数如下:重复时间(Tr)=3 000 ms;回波时间(TE)=30 ms;翻转角=80°;切片厚度=3.313 mm;所有受试者都被要求闭上眼睛,但不要睡着,放松头脑,在数据采集过程中尽量少动。
数据预处理采用 spm 8(http://www.fil.ion.ucl.ac.uk/spm/)和静息状态fMRI数据处理助手(dparsf,http://www.restfmri.net/forum/dparsf)进行。考虑信号平衡和参与者对环境的适应性,每个被试前10个时间点被丢弃。其余的功能图像首先进行时间层校正,然后纠正头部运动,其位移不超过2.0 mm,在任何物体的任何方向旋转均不超过2.0°。随后,将功能图像空间归一化为蒙特利尔神经研究所(MNI)模板。再进行去线性趋势,最后进行时域带通滤波(0.01 Hz≤f≤0.2 Hz),以减小噪声的影响,在计算完PE后进行平滑处理。
为了评估管长对纸瓦楞管的影响,选用压缩速率12 mm/min的正五边形纸瓦楞管分析,其吸能特性参数值与轴向压缩载荷-位移曲线如表4与图7所示。X向与Y向正五边形纸瓦楞管在管长为110 mm时,初始峰值载荷、平均压溃载荷皆最高,管长过大反而引起承载力降低。由于纸瓦楞管的承载面积不变,管长的增加使得管的可压缩距离增加,X向纸瓦楞管与Y向纸瓦楞管的总吸能、单位面积吸能、行程利用率都增大,但由于结构总质量也增加,比吸能变化不大,管长为110 mm时纸瓦楞管的比吸能稍优。
排列熵算法(Permutation Entroy)是度量非平稳时间序列的不规则度的算法,其描述如下:
假设其一维的时间序列为:
采用相空间重构延迟坐标法对X中任一元素x(i)进行相空间重构,再对每个采样点连续取其m个样点,得到点x(i)的m维空间的重构向量:
则序列X的相空间矩阵为:
其中,m和l分别是重构维数和延迟时间。
对x(i)的重构向量Xi各元素进行升序排列,得到:
这样得到的排列方式为:
{j1,j2,…,jm}
其为全排列m!中的一种,对X序列各种排列情况出现次数进行统计,计算各种排列情况出现的相对频率作为其概率p1,p2,…,pk,k≤m!,计算序列归一化后的排列熵:
相对来说,排列熵的计算过程较为简洁,计算量主要为k次序列长度为m的全排序,在满足功能的前提下,窗口可以尽量得小,同时,窗口大小和延迟l值的大小选取非常重要。排列熵H的大小表征时间序列的随机程度,值越小说明该时间序列越规则,反之,该时间序列越具有随机性。
在计算PE时,必须考虑和设置三个参数值,包括时间序列n的长度、嵌入维数m和时间延迟l。嵌入维数m如果数值过大,则相空间重构会使时间序列均匀化,计算耗时,序列的细微变化不会得到反映。为了满足这个条件,选择了m=4 ,l=1[8,13]。
对预处理过的被试进行PE计算,被试分类后使用rs-fMRI数据分析工具包(REST 1.8)进行分析[11]。ANOVA方差分析以检查八个组之间的差异(NC携带ε4、NC不携带ε4、EMCI携带ε4、EMCI不携带ε4、LMCI携带ε4、LMCI不携带ε4、AD携带ε4、AD不携带ε4);对APOE ε4携带者进行方差分析以检查四个组之间的差异(NC、EMCI、LMCI、AD);对APOE ε4非携带者基因的进行方差分析以检查四个组之间的差异(NC、EMCI、LMCI、AD)。在高斯随机场模型(GRF)P<0.005的情况下,发现显著差异的脑区。DPARSF工具箱用于定义ROI以根据MNI坐标(XYZ)提取平均PE值,球体的半径为8 mm。
统计分析均采用SPSS 19软件(SPSS,Inc.,Chicago,IL)进行。采用双因素方差分析(ANOVA)对基因型因素(APOEε4携带者和非携带者)和诊断因素(NC、MCI和AD)进行分析,并进行Bonferroni校正。在显著差异(P<0.05)的前提下,比较差异。
根据ROI的峰值MNI坐标提取平均PE值,球体半径为8 mm。提取显著差异脑区的PE值形成特征向量,训练SVM分类器。分类器训练使用libsvm-3.12工具包,采用线性核函数(Linear Kernel),利用参数网格寻优(gridsearchcv),使用十折交叉验证对被试进行分类研究。
根据被试类别,进行4组间的两两分类,计算NC vs EMCI、EMCI vs LMCI、NC vs LMCI、AD vs LMCI、AD vs EMCI、AD vs NC在不加基因信息、携带ε4、不携带ε4三种情况下的分类准确率,比较携带基因信息是否会提高分类准确率。
所有组进行分析时,发现三个ROI(Region Of Interest)位置有显著差异(P<0.05,F>4.58 GRF校正),包括:左侧额上回(Left Superior Frontal Gyrus,SFG.L),右侧枕中回(Right Middle Occipital Gyrus,MOG.R),右侧顶叶下叶(Right Inferior Parietal Lobule,IPL.R)。表2为差异位置的具体信息。
表2 差异脑区信息
具体地,如图1所示,多因素方差分析结果显示,AD组与EMCI组和NC组比较,在三个ROI序列的携带ε4组均有明显的差异(P<0.01),在所有这些簇中,AD患者的PE值都是最低的。在SFG.L中发现携带ε4的AD组与EMCI组、AD组与LMCI组的差异;在MOG.R中发现携带ε4的AD组与EMCI组、AD组与LMCI组、AD组与NC组、AD携带ε4与不携带ε4的差异;在IPL.R中发现携带ε4的AD组与EMCI组、AD组与LMCI组、AD组与NC组、NC携带ε4与不携带ε4的差异。
图1 各ROI排列熵平均值(*:P<0.05,**:P<0.01,***:P<0.001)
将所得到的差异ROI的PE平均值作为特征使用十折交叉验证进行分类,表3为NC vs EMCI、EMCI vs LMCI、NC vs LMCI、AD vs LMCI、AD vs EMCI、AD vs NC在不加基因信息、携带ε4、不携带ε4三种情况下的分类准确率,分别为:76.36%、40.35%、67.31%、80.65%、84.62%、94.23%;95.83%、67.74%、94.12%、89.19%、94.44%、96.67%;96.67%、88.24%、94.12%、87.23%、86.05%、91.30%。图2为NC vs EMCI、EMCI vs LMCI、NC vs LMCI、AD vs LMCI、AD vs EMCI、AD vs NC在三种情况下的ROC曲线。
可以发现在不加基因信息时NC vs EMCI、EMCI vs LMCI和NC vs EMCI的分类准确率比较低为76.36%、40.35%和67.31%,其余的分类准确率达到80%以上,NC与AD的分类结果达到94.23%;在携带ε4时EMCI vs LMCI的分类准确率比较低,为67.74%,其余的分类准确率达到89%以上,NC与AD的分类结果达到96.67%;在不携带ε4时分类准确率都达到86%以上,EMCI vs LMCI的分类准确率显著提高,达到了88.24%。
研究发现,携带者与非携带者会通过特定的方法影响和控制大脑中淀粉样蛋白的沉淀与清除,进而影响阿尔茨海默病的进程。在APOE的影响下,携带ε4、不携带ε4在形态上的萎缩不同,脑区位置不一致,APOE ε4等位基因携带者呈现出认知能力下降、海马和杏仁核出现萎缩等情况;不携带ε4的萎缩区域则在额顶叶位置[2,9]。APOE在各个组间(NC,EMCI,LMCI,AD)的变化是不一样的,所以加入基因信息,就相当于去除了一个协变量,分类准确率都有明显的提升。
表3 两两比较SVM分类结果 %
图2 ROC曲线
本文使用排列熵(PE)的方法研究了携带APOE ε4载体的NC、EMCI、LMCI和AD与未携带的受试者脑信号复杂度的差异。Bonferroni校正后出现差异的三个ROI处的PE平均值在整个病程中呈下降趋势,并在AD处下降到最低。在左侧额上回、右侧枕中回、右侧顶叶下叶较为显著,三个簇中都发现了AD组与EMCI组的差异,枕中回位置与认知作用有关,在右侧枕中回发现了AD携带ε4与不携带ε4的差异,右顶叶受损会导致对外界反应刺激方面的障碍,在右侧顶叶下叶发现了NC携带ε4与不携带ε4的差异。
本文研究与大部分研究的结果保持一致。荷兰的MóLLler等发现了晚期AD患者的小脑萎缩,早发性AD患者楔前叶、额下回萎缩[15]。德国Derflinger等在分析AD的灰质萎缩时,发现从NC到AD发展过程中,顶上回的灰质损失[16]。中国的Wang等发现了AD患者在背外侧额上回、额中回、枕上回、枕中回位置的熵值较低[8]。
将差异脑区的PE平均值作为特征得到分类准确率,加上基因信息后,分类准确率都提高。已有研究有采用每个被试者的93个感兴趣区域的MRI图像灰质组织体积作为分类指标的,AD vs NC获得精度为96.2%,AD vs MCI精度达到75.9%[17]。本文的准确率相对较高。
本文从以下几个方面提高了AD早诊效果:在加上基因信息后,第一,EMCI-NC的分类准确率达到了96.67%,可以较高的正确率发现早期患者,价值更高;第二,EMCI与LMCI的分类正确率显著提高,由40.35%提高到88.24%,将早期患者与晚期患者可有效区分清楚;第三,NC、EMCI、LMCI、AD两两比较的分类正确率都有所提高。
本文为AD复杂度分析提供了一种新的视角,在排列熵的基础上,对NC、EMCI、LMCI和AD被试在是否携带APOE ε4载体的fMRI信号进行了分析,将显著性差异属性作为特征加入到疾病辅助诊断中。结果发现,加上基因信息后,提高了组间的准确率,可以有效区分NC与EMCI、EMCI与LMCL并为AD早诊发现提供诊断依据和干预策略。