基于谱聚类的MCI功能影像分类特征选择研究

2014-02-09 07:46赵冬琴
计算机工程与设计 2014年4期
关键词:体素正常人脑区

赵冬琴,相 洁,2

(1.太原理工大学计算机科学与技术学院,山西太原030024;2.北京工业大学国际WIC研究院,北京100000)

0 引 言

轻度认知障碍(magnetic resonance imaging,MCI)是介于正常人和阿尔茨海默病(Alzheimer's disease,AD)之间的一种早期临床症状,以渐进的记忆力丧失为主,如不及时诊断并治疗会逐渐累及其它认知和非认知功能,最终导致患者丧失生活自理能力转变为老年痴呆[1]。MCI临床症状模糊且不明显,多数研究[2-4]认为MCI患者在出现结构改变之前功能已经发生改变,因此功能磁共振成像(functional magnetic resonance imaging,f MRI)作为一个无创的影像学技术用于MCI的检测和识别成为了当前的研究热点。

f MRI利用血氧依赖水平(blood oxygenation level depending,BOLD)变化效应研究人们在特定任务下大脑的活动模式。由于f MRI时间序列具有高维和低信噪比的特征,因此如何从BOLD信号中有效提取MCI较正常人有显著差别的特征,是目前研究的热点之一。

目前用于f MRI数据特征选择的方法主要包括两种:一种是数据模型的方法,如广义线性模型(general liner model,GLM),但这种传统的方法需要运用先验知识预先建立模型,不能得到一些和任务相关的扩展脑区,只能找出与人们所关心的刺激形式相符合的激活区域[5]。一种是数据驱动的方法,如聚类、独立成分分析(independent compo-nent aanalysis,ICA)、主成分分析(principle component analysis,PCA)和小波变换等,这种方法可以根据数据自身的特性,将大脑活动模式分解为若干个相互独立的激活时间曲线。在ICA中,组内被试有不同的时间序列,不能确定分量个数,分离变量后无法进行排序和选择,不能对同一成分进行比较,选取成分需要经验[6]。Khorani V比较了使用各种ICA与聚类的方法分析f MRI数据[7],得出结论聚类的方法可以得到一个更好的结果。聚类方法在降低问题维度、平抑高斯噪声方面体现出很强的优势,能在无先验知识情况下,根据f MRI时间序列的相似性将数据分为类间有别,类内相似的若干类。

聚类方法已广泛用于f MRI数据的特征选择,如利用分层快速聚类进行f MRI特征选择的方法,结果显示分层快速聚类有效性和时间代价上优于K-均值方法[8];对Bold模式进行聚类分析(包含K均值聚类,模糊C均值聚类还有层次聚类)的多种方法比较,结果显示分层聚类有更好的聚类效果;通过和其它聚类方法相比较得出FCM方法分析f MRI有很高的可靠性和收敛率[9]。但是这些传统的聚类方法(如:k-means,FCM等)需要假设f MRI数据满足凸球型分布,而f MRI时间序列是复杂的、未知的、高维的和空间变换的,真实的f MRI数据不一定满足凸球型分布,因此,已有的研究结果有较高的误报率[10]。

谱聚类可以对任意形状样本空间上的数据聚类,根据样本间相似关系建立亲和矩阵,计算特征值和特征向量,找出样本间的内在联系,聚类出不同的簇。目前研究主要集中在算法层面和数据层面,在应用方面主要在普通图像,很少应用于f MRI的特征提取中。

综上,本文将改进的谱聚类应用于BOLD-f MRI模式提取中,首先聚类f MRI数据,提取有显著差异特征,然后构造分类特征,对MCI病人和正常人进行分类预测。

1 材料和方法

1.1 数据集说明

本文的实验数据采自北京市宣武医院。实验测试选取21位被试的f MRI任务态数据,其中,11位被试为MCI患者,另10位为正常组,正常组和MCI组的年龄、性别均没有显著差异。任务采用事件相关设计,实验要求被试完成一个4*4sudoku游戏,要求行、列、宫格中不存在重复数字[11]。刺激任务包括如图1所示的简单任务和复杂任务。

图1 刺激任务

被试在完成任务的同时,采集了f MRI数据,f MRI数据使用3.0T MR扫描仪(Siemens Trio+tim,Genmeny)核磁设备,采用对BOLD敏感的单次发回波平面成像(single shot echo planar imaging,SS-EPI)序列,扫描参数如下:FOV=240mm×240mm,TR=2S,Thickness=3.2ms,Flip angle=90°,Disp Factor=0%,Matrix size=64×73,共层61层横断位图像覆盖全脑。

测试的f MRI图像数据格式为61层,每层包含61×73个体素。每个元素均称为一个体素(voxel),元素的取值是该voxel的即血氧含量水平值(blood oxygen level dependent,BOLD)。

本研究的技术路线如图2所示。

1.2 数据预处理

采用DPARSF(data processing assistant for restingstate f MRI)软件(http://www.restfmri.net)对数据进行预处理。将数据的DICOM格式转换为IMG的格式,然后分别对图像进行时间片处理、头动校正、T1配准(将结构像和功能像进行配准)、分割、标准化。

在DPARSF软件中查找脑区和白质的模板,将脑区中白质的部分去除,得到灰质模板,然后将灰质模板转化为标准模板坐标。模板坐标得到69199个BOLD值不为0的体素,由于数据太大,所以每隔5层选取,得到13935个体素。

图2 研究方案

提取BOLD变化率,基本步骤为:基线设定(在一次任务中,对某一体素前两次扫描的BOLD值取均值,作为BOLD曲线变化率的基线)、BOLD变化率提取(计算trial中其它scan相对基线的BOLD变化率,计算相同scan下同一任务条件(简单任务和复杂任务)的平均BOLD变化情况)、求均值(分别对正常人和病人同一体素的BOLD变化率求平均)。

1.3 特征提取

谱聚类是基于点之间相似性的概念,每个边的权重是点(连接边的顶点)之间的相似度,代替了其它算法将距离作为相似性的特点,通过图像分割实现算法[12]。算法目的是发现图像的最小权集,通过线性代数的方法来处理,特别是通过特征分解的技术。

谱聚类基本算法:

(1)构造相似矩阵M,行对应体素,列对应BOLD变化率。

(2)变换M为稀疏矩阵C。

(3)构造亲和矩阵A,亲和矩阵被定义为Aij=是两个体素向量的相关系数。

(4)定义D为对角矩阵,构造拉普拉斯矩阵L=D-1/2AD-1/2。

(5)找到L的k个最大特征向量x1,x2,…,xk,构成矩阵X=|x1,x2,x3…xk|。

(6)对X的行进行单位化形成矩阵Y,Yij=

(7)处理Y的每行作为Rk(k维子空间)中的点,通过K-means或其它聚类算法对它们进行聚类。

(8)矩阵Y中每行i中的点都被划到聚类j中,则认为数据点Si划分到聚类j中。

谱聚类中矩阵C的构造、σ的选取和K值的确定是算法的关键[13],由于f MRI具有高维的特点,所以在聚类过程中需对算法做一些改进。

相似矩阵应真实反映数据点之间的近似关系,使相近点的相似度更高,相异点之间的相似度更低。经典谱聚类算法计算两点之间的相似度用高斯函数其中表示两点之间的欧式距离。体素的BOLD变化率反映其在不同时间片下的活动趋势,聚类是判断某一个体素时间向量的波形是否属于某种激活区域,主要考虑的是模式趋势,与距离无关。因此选用相关系数C(i,j),如果关联度高,说明体素在不同的时间片有相同的活动趋势、相似的功能或者表明处于相同的感兴趣区,两个体素将分到相同的类中。将聚类结果各簇中所有的体素进行平均,构造一个新的特征进行MCI的病情检测。

矩阵C的选择依赖于属性之间的关系,C(i,j)定义了两个体素之间的关联度,由于f MRI数据太大,而且谱聚类需要计算特征值和特征向量,会造成内存不够,无法计算全部特征值和特征向量,为了解决此问题,本文采用构造稀疏矩阵的方法,首先计算数据点之间的相关系数,然后对所有数据点的相关系数排序,保留重要的相关系数,剔除比指定阈值范围更小的数据点之间的关系(阈值分别选择1000,2000,2500,3000,4000,最后确定阈值为3000),这样就不会损失任何重要数据信息,同时解决了内存瓶颈,提高了运算效率。

经典谱聚类算法中可以预先设定不同的σ值,分别进行聚类,将聚类结果最好的σ作为参数,需要凭经验进行选择,从而增加了计算运行时间。本文采用自适应的方式进行选择,为两个数据点间相关系数的均值或中值。自适应相比谱聚类方法有明显的优势,本文在k值确定的前提下,采用了手工选取和自适应两种方法进行计算,结果表明自适应具有更好的结果。

经典谱聚类中K值的选取有两种方法,一种是手工选择,通过多次计算,选取合适的值。另一种是利用找特征距指出聚类的数量。目前对K值的选取没有广泛适用的方法。在理想情况下,通过特征距可以自动确定聚类数目[14],但在实际情况下特征距并不是很明显,所以选择k值时,一般通过经验值和数据特征进行选择。针对f MRI数据的特殊性,本文利用传统的计算方法,根据数据本身特点和实验结果并进行多次计算,最终确定K值为120。

1.4 分类

本实验利用MATLAB平台,用Lib-SVM方法对分类正确率进行了验证。

在分类矩阵的构造中行对应每个被试,列对应每个特征所有体素BOLD变化的斜率均值和最大差值。判断测试集数据的任务标签类型(正常/MCI),其准确率为判断正确任务个数与测试任务总数的百分比。测试方法采用三折交叉验证方法,即保留1/3组数据作为测试集,其余2/3数据作为训练集。得到20次的测试数据的分类准确率,并进行了平均。

2 实验结果及分析

2.1 显著差别的BOLD模式

谱聚类采用K-means的方法对特征向量空间中的特征向量进行聚类,由于K-menas中每次的K值相同,聚类结果也会有所差异,所以这里对数据计算5次,将每次都聚到一起的体素作为一个簇,然后对每个簇中的体素平均后绘制BOLD模式图。

结果中有6种显著差异的形式,如图3所示。图3中横坐标代表trial中的不同scan,坐标中-2和-1代表任务基线,0是问题呈现阶段纵坐标表示被试在任务解决过程中某个感兴趣区BOLD相对于基线的变化情况。图3中四边形标注的点线代表健康人做的简单任务,圆形标注的点线代表健康人做的复杂任务,三角标注的虚线代表病人所做的复杂任务,叉号标注的虚线代表病人所做的简单任务。其中模式ROI_1和模式ROI_2占了多数。模式ROI_1代表病人的激活强度大于正常人的激活强度,属于正激活,模式ROI_2代表正常人的激活强度大于病人的激活强度,属于正激活,模式ROI_3和ROI_4代表正常人的激活强度大于病人的激活强度,正常人属于正激活,病人属于负激活,但是ROI_3和ROI_4的正常人增长方式有明显区别。模式ROI_5和ROI_6都属于负激活,ROI_5代表病人的激活强度大于正常人的激活强度,而ROI_6代表正常人的激活强度大于病人的激活强度。

图3 BOLD变化模式

2.2 测试分类正确率

提取每个被试对应6种模式中的体素,选取每个体素10个scan对应的斜率,对每个模式中所有对应体素的斜率平均,组成一个21*6的矩阵,对数据进行分类,分类的结果如图4所示。

图4是20次运行结果的分类正确率,被试共21人,随机选取14个作为训练集,7个作为测试集,平均正确率高于随机水平,说明基于谱聚类的特征提取可以很好地进行MCI与正常人的分类,选取斜率作为特征时,分类正确率更高,所以正确率达到了80%以上。

2.3 感兴趣区对应的脑图位置

选取上述6种模式中对应的体素,转换体素坐标为talarich坐标,映射到对应的脑图中,结果如下。

图5中标注1代表ROI_1感兴趣区所在脑区位置,主要集中在左边缘叶海马旁回(BA35)、左顶下小叶(BA40)左颞上回(BA22),还包括左颞叶尾状核、左颞中回、左枕叶舌回;标注2代表ROI_2感兴趣区所在脑区位置,主要集中在左右边缘叶扣带回(BA23)和左右额中回(BA6),还包括右颞叶梭状回;标注3代表ROI_3感兴趣区所在脑区位置,主要集中在右额上回(BA8);标注4代表ROI_4感兴趣区所在脑区位置,主要集中右边缘叶前扣带回(BA24);标注5代表ROI_5感兴趣所在的脑区位置,主要集中在左枕叶楔叶和左顶叶楔前叶还包括左枕叶梭状回、右枕叶舌回和左顶下小叶;标注6代表ROI_6感兴趣区所在脑区位置,主要集中在左后叶。

2.4 异常模式结果分析

实验采用4*4Sudouk任务,选取简单任务和复杂任务进行测试。实验过程需要被试观察选择合适的数据,然后按键回答问题,如果不能及时按键回答,需要口述正确答案,在整个任务执行过程中,分别启用了大脑的视觉、计算、运动和语言功能。

图4中复杂任务的正确率达到83%,而简单任务的正确率仅达到79%,这一结果表明正常人和MCI病人在执行任务过程中,复杂任务比简单任务的激活程度有更显著的差异。

图4 分类正确率

图5 显著差异模式所在的脑区

图5中通过显著差异模式对应的脑区位置,发现MCI病人较正常人有显著差别的区域主要在左颞叶、左右额叶、左扣带回、左顶叶和左右枕叶和等位置。

颞叶是有关记忆功能的主要皮质层,是MCI最早累及的脑区[15]。额叶负责思维,计划,与个体的需求和情感相关,额中回主要参与决定的做出,在实验的执行过程中负责数据的选择,ROI_2显示病人的激活强度低于正常人,可能在做出决定时病人反应比较慢[16]。扣带回在目标定向行为的执行中可能起到注意的功能[17],实验中MCI扣带回的激活强度也明显低于正常人,说明MCI在注意方面也发生了变化。舌回与语言功能有关[18],可能由于MCI被试反应较正常人比较慢,不能及时按键回答问题,需要语言表述,所以在左枕叶舌回的激活强度就会比正常人高。顶下小叶与空间任务操作有关,是视觉、听觉、运动觉和触觉的高级整合中枢。

上述这些区域在一定程度上客观反应了MCI的认知功能损害程度,而且在以往的研究中也有涉及。通过分类正确率和对应的特征区域说明利用改进的谱聚类可以很好地用于MCI影像学分类特征的选择。

3 结束语

通过以上改进的谱聚类进行特征提取,特征的数量比原始数量大幅减少,从而获得了更好的精确度。分类准确率高的体素主要集中在颞叶、额叶和枕叶等与MCI相关的一些重要脑区,与医学研究结果一致,可以应用于MCI诊断,并在其它相关的临床诊断中,也可作为一种研究方法进行推广。

本研究在利用改进的谱聚类方法进行聚类过程中仍需要经过多次测试,才能最终确定参数值K,工作量很大,很难应用于实际的临床诊断中。下一步工作是在逐步提高分类准确率的前提下自动确定聚类个数,实现数据的正确分类,最终将此方法广泛应用到实际的临床诊断中。

[1]JIN Gugangwei,LI Kuncheng.Mild cognitive impairment BOLD-f MRI research progress[J].Chinese Journal of Medical Imaging Technology,2009,25(8):1515-1517(in Chinese).[金光暐,李坤成.轻度认知功能损害的BOLD-f MRI研究进展[J].中国医学影像技术,2009,25(8):1515-1517.]

[2]Lerch J P,Pruessner J,Zijdenbos A P,et al.Automated cortical thickness measurements from MRI can accurately separate Alzheimer's patients from normal elderly controls[J].Neurobiol of Aging,2008,29(1):23-30.

[3]Dai Z,Yan C,Wang Z,et al.Discriminative analysis of early Alzheimer's disease using multi-modal imaging and multi-level characterization with multi-classifier(M3)[J].Neuroimage,2012,59(3):2187-2195.

[4]HE Yong.Alzheimer's disease neuroimaging research[J].Progress in Biochemistry and Biophysics,2012,39(8):811-815(in Chinese).[贺永.阿尔茨海默病的神经影像学研究进展[J].生物化学与生物物理进展,2012,39(8):811-815.]

[5]Wang J,Wang L,Zang Y.Parcellation-dependent small-world brain functional networks:A resting-state f MRI study[J].Hum Brain Map,2008,30(5):1511-1523.

[6]DU Yuhui,GUI Zhiguo,LIU Yingjun.Based on independent component analysis of brain function network analysis methods[J].Biophysics,2013,29(4):266-275(in Chinese).[杜宇慧,桂志国,刘迎军.基于独立成分分析的脑功能网络分析方法综述[J].生物物理报,2013,29(4):266-275.]

[7]Gayathri K,Vignesh S.Efficient face detection and recognition using block independent component analysis and clustering[C]//Recent Trends in Information Technology,2011:561-566.

[8]HAN Ying,WANG Zhengge.Mild cognitive impairment and Alzheimer's disease by magnetic resonance imaging research[J].Medical Research Institute,2011,24(9):975-978(in Chinese).[韩樱,王正阁.轻度认知障碍和阿尔茨海默氏病的磁共振成像研究进展[J].医学研究所报,2011,24(9):975-978.]

[9]XIANG Jie.Heuristic problem solving cognitive and neural mechanisms of f MRI data analysis method[D].Taiyuan:Taiyuan University of Technology,2010(in Chinese).[相洁.启发式问题解决认知神经机制及f MRI数据分析方法研究[D].太原:太原理工大学,2010.]

[10]LIN Wei,HE Huacan,AI Lirong,et al.Characteristics of brain f MRI rapid reconstruction hierarchical clustering method[J].Computer Engineering and Applications,2009,45(32):193-208(in Chinese).[林卫,何华灿,艾丽蓉,等.脑f MRI特征重建的分层快速聚类方法[J].计算机工程与应用,2009,45(32):193-208.]

[11]CAI Liping,ZHOU Xuchuan.High-dimensional data dimensionality reduction adaptive spectral clustering method[J].Southwest University,2010,36(5):841-843(in Chinese).[蔡利平,周绪川.高维数据上的自适应谱聚类降维方法研究[J].西南名族大学学报,2010,36(5):841-843.]

[12]Bjornsdotter M,Wessberg J.Comparing clustered and distributed sampling for random subspace brain mapping[C]//Pattern Recognition in NeuroImaging,2011:29-32.

[13]Wen Yen Chen,Yangqiu Song,Hongjie Bai,et al.Parallel spectral clustering in distributed systems[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(3):568-586.

[14]CHEN Junjie,ZHAO Li,XIANG Jie.Using machine learning method decodes brain image data[J].Computer Engineering and Applications,2012,48(10):222-225(in Chinese).[陈俊杰,赵丽,相洁.用机器学习方法解码脑图像数据[J].计算机工程与应用,2012,48(10):222-225.]

[15]Ryali S,Menon V.Feature selection and classification of f MRI data using logistic regression with L1 norm regularization[J].Neuroimage,2009,47(1):39-41.

[16]JIANG Chuigang,CUI Shaoyang,NIE Binbin.Twist stimulation too river point on MCI influence functional magnetic resonance imaging study[J].Chinese Journal of Basic Medicine in Traditional Chinese Medicine,2011,17(12):1365-1367(in Chinese).[蒋垂刚,崔韶阳,聂彬彬.捻针刺激太溪穴对MCI功能性磁共振成像影响的研究[J].中国中医基础医学杂志,2011,17(12):1365-1367.]

[17]WANG Zhiqun,YAN Chaozhang,ZHAO Cheng,et al.Alzheimer's disease and mild cognitive impairment spontaneous brain activity of spatial modes:Resting state f MRI study[C]//Resonance Compilation of Papers,2011:198-200(in Chinese).[王志群,严超騿,赵澄,等.阿尔茨海默病和轻度认知功能障碍自发性脑活动的空问模式:静息态f MRI研究[C]//磁共振年会论文汇编,2011:198-200.]

[18]LI Chuanming,WANG Jian,GUI Li,et al.A bold-FMRI study of prefrontal cortex in Alzheimer disease,mild cognitive impairment and normal control subjects[J].Acta Acadamiae Medicinae Qingdao Universitatis,2009,10(3):331-334(in Chinese).[李传明,王健,桂莉,等.AD和MCI病人前额叶注意功能区f MRI检测[J].青岛大学医学院学报,2009,10(3):331-334.]

猜你喜欢
体素正常人脑区
Nü Perspectives
瘦体素决定肥瘦
Dividing cubes算法在数控仿真中的应用
长期戒断海洛因成瘾者冲动性相关脑区的结构及功能特征*
骨骼驱动的软体角色动画
基于改进体素锥追踪的大规模场景光照计算
再不动脑, 真的会傻
做人要做“正常人”
止咳药水滥用导致大脑结构异常
靠脸吃饭等