基于扩散张量成像的帕金森病的分类研究

2019-06-19 03:17吴世洋葛海涛胡俊峰
医疗卫生装备 2019年6期
关键词:降维脑区白质

张 冉,吴世洋,葛海涛,胡俊峰,巩 萍*

(1.徐州医科大学医学影像学院,江苏徐州 221004;2.徐州医科大学医学信息学院,江苏徐州 221004)

0 引言

帕金森病(Parkinson's disease,PD)是一种常见的神经系统变性疾病,多见于老年人,平均发病年龄约为60岁。静止性震颤、肌强直及运动减少是该病的主要临床特征[1]。PD在病理上最主要的改变是中脑黑质多巴胺能神经元的变性死亡,导致纹状体多巴胺的含量明显减少[2]。目前临床上一般根据英国帕金森病协会脑库标准对PD患者进行诊断。PD患者早期的症状难以察觉,易被忽略,被确诊时病情大多已经是中晚期,这导致绝大多数PD患者错失了早期治疗的时机。因此,PD的早期智能诊断是目前急需解决的问题[3-5]。

扩散张量成像(diffusion tensor imaging,DTI)近几年发展迅速,为PD的早期诊断研究提供了新方法[6]。DTI是在扩散加权成像(diffusion weighted imaging,DWI)的基础上发展起来的,能直观显示白质纤维束的改变,是目前唯一可在活体内无创地研究脑白质纤维的方法[7]。目前,针对PD患者的研究多集中在脑微观结构改变的层面上。如杨涛等[8]通过对比PD组与对照组双侧丘脑、尾状核头、黑质、壳核及苍白球的各向异性分数(fractional anisotropy,FA)、表观扩散系数(apparent diffusion coefficient,ADC),发现早期 PD组较对照组减低。Zhang等[9]通过研究脑白质感兴趣区的FA值,认为脑白质的特定区域的FA值可以作为预测PD患者冷漠严重程度的一个标志。Gattellaro等[10]通过在实验对象DTI脑图像主要纤维束和黑质核团上绘制感兴趣区,发现额叶和顶叶白质的广泛的微结构损伤在PD早期已经发生。以上研究表明,PD患者早期已有脑白质的微观结构改变。本文通过对正常对照组和PD组的DTI进行预处理,以PANDA软件自带的John-Hopkins(约翰霍普金斯)白质分区图谱(即WMlabel图谱)和纤维追踪图谱(即WMtract图谱)为模板[11],分别提取各脑区的FA值并以此作为特征值进行特征提取与降维,然后利用支持向量机(support vector machine,SVM)分类器对数据进行模型训练与测试,以实现PD的分类。

1 资料与方法

1.1 研究对象

本文选取2014—2016年经徐州医科大学附属医院神经科医生诊断的36例PD患者为实验组(PD组),其中男21例、女15例,年龄50~80岁,平均年龄(63.7±6.24)岁。所有入组患者符合英国帕金森病协会脑库原发性帕金森病临床诊断标准,左旋多巴制剂治疗有效或曾经有效。同时纳入同期采集的36例健康志愿者作为正常对照组(正常组),其中男18例、女 18 例,年龄 50~80 岁,平均年龄(63.3±6.36)岁。2组的年龄(P=0.78>0.05)和性别(P=0.38>0.05)均无组间差异。2组被试者在年龄、性别、学历上相匹配,并且均为右利手,无MRI禁忌、无明显头部外伤、无脑实质病变、无药物滥用、无酗酒等情况,其个人与家属均已签署知情同意书。本研究取得了医院伦理委员会的批准。

1.2 MRI扫描

利用美国GE公司产3.0TDiscoveryMR750w MRI扫描仪对受试者进行MRI扫描,采用单次激发平面回波成像(single-shot echo-planar-imaging,SS-EPI)序列,主要参数:扩散梯度因子b1 000 s/mm2,重复时间(repetition time,TR)5 900 ms,回波时间(echo time,TE)900ms,层厚2mm,层数72层,平面分辨力2 mm,加速因子为2。沿64个方向施加扩散梯度脉冲,扫描平面为横断面。

1.3 DTI数据预处理

在MATLAB2016a平台上,利用北京师范大学国家认知与心理研究所研制开发的PANDA软件对采集的72个样本进行图像预处理。首先将DTI的DICOM数据转换成NIFTI格式,为减少DTI在拟合过程中的运算量及提高后续配准的准确性,去掉头皮等非脑组织结构(如图1、2所示)(正常组和PD组的DTI图像并未存在明显差异),为减少干扰因素的影响,进行涡流校正和头动校正;然后将图像以1 mm×1 mm×1 mm分辨力重新采样,再将图像空间标准化,得到配准后的图像[12]。

注:图像均已去掉头皮等非脑组织结构

图1 健康成年人的DTI图像

1.4 特征值提取

对配准后的图像,按脑白质结构分别参考WM-label图谱和WMtract图谱对大脑进行分区,其中WMlabel图谱将大脑分成了50个脑区,WMtract图谱将大脑分成了20个脑区。分别计算各脑区的FA平均值,以此作为原始特征子集。然后分别采用Relief算法和主成分分析(principal component analysis,PCA)法对原始特征子集进行特征选择与降维处理。Relief算法根据各个特征和类别的相关性赋予特征不同的权重,权重小于某个阈值的特征子集将被移除。特征子集的权重越大,表示该特征的分类能力越强,反之,表示该特征分类能力越弱[13]。PCA把数据从原来的坐标系转换到新的坐标系,以方差最大的方向作为坐标轴方向。转换后可发现前面的几个主成分包含了原数据的绝大部分信息。贡献率指某个主成分的方差占全部方差的比重,贡献率越大,说明该主成分所包含的原始变量的信息越强。累积贡献率指多个主成分叠加在一起所包含的信息占原始信息的百分比。一般选取累积贡献率达到85%以上的前K个主成分。本文使用MATLAB工具箱princomp函数实现PCA。

1.5 分类器设计与评价

对特征选择与降维后的特征子集,利用SVM进行分类研究。本文使用台湾大学林智仁(Chin-Jen Lin)博士团队开发设计的通用SVM软件包[14],核函数采用最常用的径向基函数(radial basis function,RBF)。影响SVM系统性能的关键因素是RBF核函数中的惩罚因子c和参数g,选用网格搜索进行分类器参数的寻优。根据经验初设c和g的搜寻范围为2-8~28。重复进行网格搜索,得到最优参数best_c和best_g。由于研究中样本数量较少,所以选择留一法(leaveone-out)进行交叉验证。留一法每次只留下一个样本做测试集,其他样本做训练集,这使得留一法中被实际评估的模型与期望评估的全部数据集训练出来的模型很相似,所以其评估结果比较准确[15]。本实验共72例样本,每次保留一个样本用于测试,其余71例用于分类器的训练。

为了评价算法的好坏,采用分类精度、ROC曲线及AUC值来评价[16]。分类精度是用被分类的样本数除以总样本数计算得到的。一般来说,精度越高,分类性能越好。ROC曲线越靠近左上角,其AUC值越大,分类性能就越好。

2 结果

2.1 特征提取结果

2.1.1 基于Relief算法的特征提取结果

将各脑区FA值经Relief排序后,基于WMlabel分区的前30个脑区权重为正,基于WMtract分区的前10个脑区权重为正。把每个脑区的FA值看作一个特征子集,如图3、4所示。选用权重为正的特征子集进行分类训练与测试。

图3 基于WMlabel分区特征权重直方图

2.1.2 基于PCA降维的特征提取结果

先分别将2种图谱的各脑区FA值进行主成分分析,取累积贡献率大于85%的前K个主成分进行分类训练和测试。如图5、6所示,在累积贡献率大于85%时,WMlabel分区取前5个主成分,WMtract分区取前5个主成分。

2.2 分类结果

2.2.1 基于Relief算法的分类结果

图4 基于WMtrace分区特征权重直方图

图5 基于WMlabel分区PCA降维后帕累托图

图6 基于WMtract分区PCA降维后帕累托图

对权重为正的脑区进行模型训练后,发现基于WMlabel分区的累积前4个脑区和基于WMtract分区的累积前5个脑区的分类精度最高,如图7、8所示。选用这些脑区的FA值作为最优子集,其分类精度及AUC值见表1。

2.2.2 基于PCA降维的分类结果

对累积贡献率大于85%的主成分进行模型训练后,发现基于WMlabel分区的FA值在累积贡献率为99%时分类精度最高,基于WMtract分区的FA值在累积贡献率为90%时分类精度最高,如图9、10所示。选择累积贡献率最高的前K个脑区的FA值作为最优主成分,放入训练得到的模型中,其分类精度及AUC值见表2。

图7 基于WMlabel分区的前30个脑区对应的分类精度

图8 基于WMtract分区的前10个脑区对应的分类精度

表1 基于Relief算法的最高分类精度和AUC值

图9 基于WMlabel分区累积贡献率与分类精度关系图

图10 基于WMtract分区累积贡献率与分类精度关系图

表2 基于PCA的最高分类精度和AUC值

由表1~2可见,基于WMlabel分区,Relief算法的分类精度及AUC值最大,分别为81.94%和0.846 5。正常组共36例,其中有31例被正确分类,5例被错误分类到PD组;PD组共36例,其中有28例被正确分类,8例被错误分类到正常组。基于WMtract分区,PCA的分类精度及AUC值最高,分别为73.61%和0.750 8。正常组共36例,其中有27例被正确分类,9例被错误分类到PD组;PD组共36例,其中有26例被正确分类,10例被错误分类到正常组。2种最佳分类方法下的ROC曲线如图11所示。

图11 分类精度最高的ROC曲线

3 讨论

PD是临床常见的进行性神经变性疾病,主要是由黑质致密部多巴胺能神经元变性缺失所致,初期症状不明显,患者确诊时往往已处于中晚期。因此,PD的早期诊断是目前临床中面临的一大难题。目前,PD的诊断主要依靠病史、临床表现和体格检查。随着MRI技术的发展,功能磁共振成像(functional MRI,fMRI)、DTI等作为新的MRI成像技术,可以无创性获取脑结构和功能连接信息,为PD的早期诊断提供了新的影像学标记。基于DTI的功能性脑网络可以更直观地显示各脑区之间的纤维连接。DTI使无创性、非侵入性研究白质纤维束成为可能,可以测量单个体素内的FA值,从而间接反映白质纤维束的完整性,并根据FA的方向追踪白质纤维束的方向。研究表明,与正常对照组相比,PD组双侧额顶部、放射冠、胼胝体和扣带回的脑白质FA明显减低,因此FA作为一种有效的影像学特征为PD的早期诊断提供了可能。在PD的早期诊断中,大部分研究是基于统计学分析进行的。近年来,随着人工智能的发展,不少学者提出将模式识别方法应用于PD的早期诊断。SVM作为一种模式识别分类器在解决非线性、小样本问题上具有独特优势。如龙丹[17]通过提取分析fMRI的区域一致性、低频振幅和脑网络指标,利用SVM进行了PD的计算机辅助诊断,取得了不错的分类性能。熊嘉臻等[18]利用SVM对提取到的脑脊液、灰质、白质、低频振幅、区域一致性等特征进行了PD的分类研究,结果表明,基于MRI影像学分析方法可以对早期PD的出现进行准确率较高的预测。

本文选用2种图谱作为模板,分别提取DTI图像的FA值,通过预处理将MRI图像信息转化为计算机可读取的特征向量,使用Relief算法和PCA方法对数据进行特征选择与降维,然后利用SVM分类器对PD组和正常组的特征进行分类识别。实验结果表明,基于WMlabel分区的Relief算法获得了较高的分类精度,能够实现对正常组和PD组的有效分类。最早提出的Relief算法主要针对二分类问题,本实验数据具有明显的二分类特性,所以采用Relief算法优化训练集,能够提高模型精度;并且SVM在解决非线性、高维模式识别和小样本问题上具有明显优势,实验结果表明本文所用方法取得了很好的分类效果。在后续研究中,可以考虑增加对PD多个亚型的分类,扩大研究对象范围,进一步提高模型精度与泛化能力,为临床诊断提供更有效的参考依据。

猜你喜欢
降维脑区白质
腹腔注射右美托咪定后小鼠大脑响应区域初探
混动成为降维打击的实力 东风风神皓极
IL-6、NES以及新生儿颅脑超声对早期诊断早产儿脑白质损伤的应用价值
脑自发性神经振荡低频振幅表征脑功能网络静息态信息流
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
缺血性脑白质脱髓鞘病变的影响因素
止咳药水滥用导致大脑结构异常
ADMA/DDAH系统与脑白质疏松症的关系
一种改进的稀疏保持投影算法在高光谱数据降维中的应用