基于CNN 和fMRI 对精神分裂症的分类研究

2020-11-02 07:59朱亚飞黄庆坤杨仕虎付舒悦魏新帅谭颖

现代计算机 2020年27期

朱亚飞，黄庆坤,2，杨仕虎，付舒悦，魏新帅，谭颖

（1.西南民族大学计算机科学与技术学院，成都 610225；2.大理护理职业学院，大理 671000）

0 引言

精神分裂症是一组病因未明的重性精神病，并且没有客观的测试供予诊断。精神分裂症其病因未明、诊断信度、如何根治等问题尚未得到解决，揭示其成病原因对临床和治疗有重大意义。功能磁共振成像技术作为一种神经影像技术，凭借其高空间分辨率、无创伤等优点，已经被广泛应用在脑科学、临床医学等相关领域的研究中。但由于神经活动本身的复杂多变性，使得 fMRI（functional Magnetic Resonance Imaging）数据存在着噪声大、有效信息提取困难以及信息冗余等问题。在此背景下，引出fMRI 数据与人工智能相结合的方法，一方面有效的定位激活脑区；另一方面通过差异性脑区或脑网络机制实现分类研究。

黄庆坤[1]使用数学工具皮尔逊相关系数计算fMRI脑区之间的相关系数，经过主成分分析法降维后的特征供SVM 学习。Yang B 等人[2]使用了三种方法分析fMRI 图像得到三种fMRI 特征，三种特征被用来训练三个胶囊神经网络。最终通过集成学习的方法获得分类结果。黄庆坤等人[3]将PCA 降维后的功能连接系数作为特征输入到神经网络中，得到一个分类模型。

本文将从深度学习的角度出发，使用卷积神经网络 CNN（Convolutional Neural Networks）从 fMRI 数据中提取出有效信息，对精神分裂症患者进行分类。

1 算法实现

CNN 算法基于BP 神经网络，在CNN 训练过程种同样采用向前和向后传播。CNN 包含了一个由卷积层和池化层构成的特征抽取器，然后通过全连接层进行训练输出（见图1）。它对于图像的输入通过一个权值矩阵构成的卷积核，分别在x 和y 方向通过卷积核对若干个特征平面（feature-maps）进行卷积操作来构建多维度特征，然后再进行ReLU 激活函数和池化（pooling）来达到降维度和防止过拟合（over-fitting），将这些特征输入到全连接层，最后再到输出层。

在卷积过程中我们通过卷积核对输入的x*x 大小的图像沿着x 和y 方向分别以步长（strides）进行卷积操作，我们以ReLU 为激活函数，则卷积操作可以描述为：

图1 卷积神经网络架构

其中Wi表示第i 层卷积核的权值向量，运算符“∙”表示卷积核输入特征图进行卷积操作，卷积的输出与第i 层的偏向向量bi相加通过Relu激活函数得到输出特征图。

在卷积过程中由于卷积后像素矩阵会变小，并且在图像边缘存在信息丢失的问题，所以我们需要做像素填充 padding 操作。常见的 padding 有 VALID 和SAME 两种，对于VALID padding 后图像像素的大小可以表示为

其中xheight和xweight分别输入像素的长和宽，kheight和kweight为别为卷积核的长和宽s为每一次卷积核移动步长，其中为向上取整符号。SAME padding 后图像的像素大小可以表示为：

可见通过SAME padding 后可以得到和原来像素一样大小的矩阵。

2 数据及其预处理

本文实验中所使用的fMRI 数据为UCLA 数据集[4，5]（https：∕∕openfmri.org∕）。数据集中包括58 名精神分裂症患者和138 例健康对照组。实验中使用DPABI[6]工具包对原始数据进行预处理。预处理包括时间层矫正、头动矫正、归一化处理以及平滑滤波。

预处理后的数据是时间序列上的空间信息，即四维数据。实验中使用AAL[7]模板将大脑划分为116 个感兴趣区域，在每个感兴趣区域上提取时间序列。在所有被试中，计算各个感兴趣区域之间的皮尔逊相关系数，由此来构建功能连接矩阵。功能连接矩阵的形状为[116，116]，如图2 所示。功能连接矩阵作为被试的特征，送入CNN 训练及对精神分裂症患者进行分类。

图2 功能连接矩阵

3 CNN建模

在我们的实验中，我们使用了如图1 的网络模型。其中第一层是卷积核大小为16*16*256 的卷积层，跳步为4，激活函数为ReLU；第二层为4*4 的最大池化层，第三层再利用4*4*128 的卷积核进行卷积，跳步为1，激活函数为ReLU；第四层为2*2 的最大池化层，第五层为含有64 个神经元的全连接层，第六层为含有2 个神经元的全连接层，并由Softmax 函数进行输出。所有的卷积层采用valid 方式进行卷积。之后我们将功能连接矩阵用于网络训练，并采用十折交叉验证进行模型的训练与预测。

4 实验结果及分析

分类准确率是衡量一个分类模型性能的重要指标之一。为了评估该模型的性能，我们定义分类准确率：

其中N为数据分布，P(·)为概率密度函数。我们将其与其他使用传统机器学习分类方法的实验对比，得到如表1 所示的结果。

与传统的医疗图像分类方法SVM[8]和Bagged SVM[9]相比，CNN 模型的分类准确率大幅提高，即使是机器学习分类方法中性能较好的Random Forest[10]，相对于CNN 模型也存在明显弱势。从表格中可知，与机器学习分类方法相比，卷积神经网络分类模型在分类高维度特征时性能更好。

表1 CNN 及其他模型的分类结果

本文对精神疾病医疗图像分类研究有一定意义，在传统的机器学习方法难以取得较好成效的领域，我们应该尝试更多的方法，尤其是新兴的深度学习方法，如DNN、CNN 以及其他改进后的网络模型，这些方法往往能取得更好的结果。

5 结语

本文在医疗影像数据中，提出了基于卷积神经网络的识别算法，针对差异性脑区或脑网络，充分利用CNN 自学习特性，有效解决了传统分类模型，对高维fMRI 数据存在着不能有效提取特征的问题，使得训练网络模型本身即具有抗噪声、抗旋转等优良特性。在今后的工作中将引用3D 卷积神经网络，来针对fMRI数据高时间维度的特性，更好地挖掘大脑隐藏信息。