基于特征选择的阿尔茨海默症辅助诊断

2020-06-08 06:08刘茜王瑜付常洋肖洪兵邢素霞

中国医学物理学杂志 2020年5期

刘茜，王瑜，付常洋，肖洪兵，邢素霞

北京工商大学计算机与信息工程学院，北京100048

前言

阿尔茨海默病（Alzheimer's disease,AD）是一种多发于65周岁以上老年人的常见疾病，其特征是潜伏性认知能力下降和记忆功能障碍［1-2］。国际老年痴呆协会研究指出，2050年全球AD患病人数将增加到13 200万［3］，随着人口老龄化的加剧，AD逐渐成为困扰社会和家庭的重大问题。目前对于AD尚无治疗手段，仅可通过早期发现以及干预治疗减慢病情的发展。由于AD确诊前无明显临床表现，没能在患病初期及时发现，从而造成病情的延误，最终发展为AD。因此如何更早地发现AD病症，并给出合理的治疗方案是目前研究的重点。

目前医学上对AD的诊断主要依靠患者的临床表现，同时结合影像学检查、脑脊液检查和脑电图等［4］。磁共振成像技术（Magnetic Resonance Imaging,MRI）由于具有无损伤性、图像对比度高、可任意方位断层等优势被广泛应用于AD检查。随着计算机技术的飞速发展，机器学习辅助AD诊断方法层出不穷，周文等［5］使用核主成分分析（Kernel Principal Component Analysis,KPCA）提取AD患者和正常被试（Normal Control,NC）的MRI重点切片特征对AD进行诊断。刘卫芳等［6］使用灰度共生矩阵和游程长矩阵提取胼胝体的三维纹理特征，并对AD进行诊断。杨晨晖等［7］使用主成分分析（Principal Component Analysis,PCA）和线性鉴别分析（Linear Discriminant Analysis,LDA）融合的方法提取特征，并采用最近邻分类算法进行AD分类。上述方法虽然都获得了很好的结果，但是文献［5］和文献［6］没能充分利用MRI图像全脑信息，文献［7］中的PCA受数据分布（方差）影响大，存在降维后可能不利于分类的情况。

特征的选择和提取对分类结果有着重要的影响，通过机器学习算法可以提取更有利于分类的特征，在训练样本不足的情况下提高分类准确率，适用于类似本研究样本较少的情况。本研究提出一种基于支持向量机递归特征消除（Support Vector Machine-Recursive Feature Elimination,SVM-RFE）和LDA 的AD 辅助诊断方法，研究AD、主观记忆衰退（Subjective Memory Complaints,SMC）和NC 间两两分类辅助诊断，其中SMC 被认为是轻度认知障碍（Mild Cognitive Impairment,MCI）的前段，极易发展为MCI，甚至AD。如果能在AD 发展最早期的阶段SMC 达到较好的辅助诊断率，就能及时遏制病情的发展，为患者带来最佳的治疗效果。本研究利用SVM-RFE 从全脑90 个脑区的灰质体积中筛选出对分类有重要影响的特征，避免忽视差异较弱特征和夸大方差影响，然后通过LDA 将类间离散度扩大、类内离散度缩小，进一步提高分类准确率。

1 数据来源及预处理

1.1 数据来源及构成

本研究使用来自于ADNI数据库的共110个MRI数据。其中AD组平均年龄73.29岁，共34名被试（男18名，女16名）；SMC组平均年龄72.50岁，共26名被试（男14 名，女12 名）；NC 组平均年龄76.4 岁，共50名被试（男28名，女22名）。采用根据MPRAGE协议采集的T1加权三维MRI图像作为实验数据，大小为256×256×170，层厚为1.2 mm。

1.2 数据预处理

大脑灰质是信息处理中心，AD患者较NC的脑部结构出现灰质萎缩，且各脑区萎缩程度不同，同一脑区在AD不同阶段萎缩程度也不相同，因此本研究使用大脑90个脑区的灰质体积作为分类特征，通过SPM8和dpabi两个软件对原始图像做预处理，在SPM8中选用DARTEL［8］脑图像预处理方法，将图像配准到MNI空间（Montreal Neurological Institute，根据一系列正常人脑磁共振图像建立的坐标系统），然后通过dpabi提取90个脑区灰质体积，预处理共分为4步［9］：（1）分割。将原始图像分割为灰质c1、白质c2、脑脊液c3图像，以及经DARTEL计算得到的灰质rc1和白质rc2图像。（2）生成特异性模板。使用50名NC大脑灰质rc1和白质rc2生成特异性模板，做6次迭代，生成6个模板，选取最为精准的template 6 模板作为配准使用的特异性模板。（3）每名被试的灰质图像通过DARTEL配准到特异性模板，生成名为u_rc1的流动场。（4）使用流动场和template 6模板将每个被试配准到MNI空间，并进行体积调制，保留各个脑区的体积信息，其中平滑参数设置为［8,8,8］。在dpabi软件中对预处理得到的图像做体积计算，使用目前广泛应用的标准脑AAL模板获得大脑90个脑区的灰质体积。详见图1。

图1 图像预处理步骤示意图Fig.1 Diagram of image preprocessing

2 研究方法

2.1 SVM-RFE

SVM-RFE 由Guyon 等［10］提出，用于癌症分类中基因的选择，通过基于SVM 的分类准则对分类特征做重要性排序，逐步消去评分最低的特征，并进行反复迭代，获取最优特征子集［11］。此方法在自闭症识别［12］、前列腺组织病理学分级［13］等医学方面得到有效应用。

SVM-RFE 评价准则采用SVM 分类器训练得到超平面权向量的平方值，特征集合S中第i个特征的评分通过式（1）计算。

其中，wi为特征i对应的权向量。

初始化特征集合S，设定最优特征子集的维度为N，使用特征集合S训练SVM 分类器，由式（1）找出评分最低的特征e= argminci，在特征集合S中除去此特征S=[S-e]，重复此过程直至S的维度满足最优特征子集设定的维度N。SVM-RFE 可以保留更有益于SVM 分类器分类的特征，消除类间干扰和重要性低的特征，提高分类准确率。

2.2 LDA

LDA 是一种经典的线性学习方法，广泛应用于降维和模式分类领域［14-16］，旨在利用降维的思想，将高维数据降维至类别区分最显著的空间［17］。欲使同类样本投影点尽可能接近，异类样本的投影点尽可能远离，可以使同类样本协方差矩阵尽可能小、不同类别类中心距离尽可能大，得到如下目标函数：

其中，w为由原始空间到类别区分最显著空间的投影矩阵；μ0、μ1分别为第1 类和第2 类样本的均值向量；wTμ0和wTμ1是两类样本的中心在直线上的投影；wT∑0w和wT∑1w是两类样本投影后的协方差。目标函数J取得最大值时，通过投影矩阵w可将原始空间的数据投影到类别区分最显著的空间，此时类内离散度矩阵最小、类间离散度矩阵Sb=(μ0-μ1)(μ0-μ1)T最大，对S-1w Sb做奇异值分解，即可获得投影矩阵w，并进行降维操作。

2.3 特征选择与分类

SVM-RFE 和LDA 都是有监督的特征提取算法，使用了标签类别特征。通过SVM-RFE 获取线性SVM 上评分最高的N个特征，然后利用LDA 使RFE选择出来的特征映射到数据类别区分大的空间，使得数据更加容易被区分，分类更加准确。通过RFE的特征选择，移除一部分分类弱的相关特征，能有效减弱或避免LDA 过拟合的影响，使分类准确率较单独使用LDA更高。

SVM-FRE 与LDA 的特征选择算法具体步骤如下：

（1）对训练集大脑90 个脑区灰质体积做标准化处理，使用常见的最大最小值标准化方法，将特征归一化为同样的量纲，然后将测试集数据做相同的标准化。初始化特征集合S为训练集标准化后大脑90个脑区的灰质体积。

（2）在集合S上通过式（1）评估各个特征在SVM分类器上的重要性，消去最不重要的特征并迭代，直至集合S的维度等于N，选取在线性SVM分类器上评分最高的N维特征S，同时筛选出测试集中对应的特征。

（3）使用LDA，以式（2）为目标函数，对S-1w Sb做奇异值分解获得投影矩阵w，将特征集S降维到类别区分最显著的空间。

本研究使用上述方法提取特征训练SVM分类器作为分类模型。SVM 分类器以结构风险最小化为原则，在图像识别［18］、文档分类［19］、故障检测［20-21］等方面得到广泛应用。SVM 分类器决策边界是学习样本的最大边界超平面，此区间边界之间有足够的空间来容纳测试样本［22］，使得分类器在训练样本数量较少时仍具有良好的分类性能，适用于本实验数据集。

2.4 模型的评估

由于每次实验随机按比例划分训练集和测试集，造成划分结果不同，以致模型评估结果有所区别，单次实验的评估结果往往不够稳定可靠。为获得稳定性和保真性强的实验结果，选用10 折交叉验证法评估模型性能。将数据集划分为10个大小相似的互斥子集，每个子集尽可能保持数据分布一致，每次选取一个子集作为测试集，余下的子集作为训练集，确保每个子集做一次测试集，进行10次训练和测试，最终评估结果为10次测试结果的均值。

2 实验结果与分析

本实验采用的数据集包括34 名AD 患者、26 名SMC 患者以及50 名NC 的MRI图像，对每名被试的MRI图像先做预处理，获得90 个脑区的灰质体积作为分类特征，然后使用SVM-RFE和LDA进行特征选择，最后用SVM分类器实现AD、SMC、NC的分类。

为了横向验证SVM-RFE 和LDA 结合算法的有效性，将本文算法和单纯使用SVM-RFE或LDA的实验结果做对比，准确率来自10折交叉验证，均由对应特征提取方法提取特征，然后使用SVM分类器分类。为保证对比的公平性，每折均使用网格搜索法调参，保留最优分类结果，除核函数为线性核函数外，实验参数如表1所示。实验结果如表2所示，表2中还包括文献［7］和文献［23］两种特征选择算法获得的结果，可证明SVM-RFE和LDA结合算法的优势。

表1 实验参数Tab.1 Experimental parameters

表2 5种特征提取算法的分类结果（%）Tab.2 Classification results of 5 feature extraction algorithms(%)

由表2的实验结果可以看出，本文算法在AD/NC、AD/SMC 和SMC/NC 平均分类准确率分别为94.0%、100.0%和93.6%，证明了本文算法的有效性，主要原因在于，在LDA过程前加入SVM-RFE可以有效避免LDA 过拟合，在RFE 过程后增加LDA 能使特征分布更有益于分类器分类。通过本文算法和对比算法的10折交叉验证准确率最低值和最高值发现本文算法有更高的准确率和相对更好的鲁棒性和稳定性，证明了本文算法的优越性。

4 结语

本研究对AD、NC、SMC 的MRI图像进行分析，提出一种SVM-RFE 和LDA 结合的AD 辅助诊断算法。首先利用AAL 模板获得90 个大脑脑区的灰质体积，然后使用SVM-RFE和LDA相结合的方式进行特征选择，最后利用SVM 分类器进行分类。进行AD、SMC、NC 间的两两分类，结果显示AD/NC、AD/SMC 和NC/SMC 的平均准确率分别为94.0%、100.0%和93.6%，本文算法优于单独使用SVM-RFE或LDA，同时，也与经典方法PCA 和PCA-LDA 进行对比，证明了本文算法在AD 辅助诊断方面的可行性和有效性。未来的研究工作重点是分析多模态数据融合在AD 辅助诊断中的作用，如将结构MRI数据与功能MRI数据特征融合，观察能否获得更好的结果。