朱亚飞,黄庆坤,2,杨仕虎,付舒悦,魏新帅,谭颖
(1.西南民族大学计算机科学与技术学院,成都 610225;2.大理护理职业学院,大理 671000)
精神分裂症是一组病因未明的重性精神病,并且没有客观的测试供予诊断。精神分裂症其病因未明、诊断信度、如何根治等问题尚未得到解决,揭示其成病原因对临床和治疗有重大意义。功能磁共振成像技术作为一种神经影像技术,凭借其高空间分辨率、无创伤等优点,已经被广泛应用在脑科学、临床医学等相关领域的研究中。但由于神经活动本身的复杂多变性,使得 fMRI(functional Magnetic Resonance Imaging)数据存在着噪声大、有效信息提取困难以及信息冗余等问题。在此背景下,引出fMRI 数据与人工智能相结合的方法,一方面有效的定位激活脑区;另一方面通过差异性脑区或脑网络机制实现分类研究。
黄庆坤[1]使用数学工具皮尔逊相关系数计算fMRI脑区之间的相关系数,经过主成分分析法降维后的特征供SVM 学习。Yang B 等人[2]使用了三种方法分析fMRI 图像得到三种fMRI 特征,三种特征被用来训练三个胶囊神经网络。最终通过集成学习的方法获得分类结果。黄庆坤等人[3]将PCA 降维后的功能连接系数作为特征输入到神经网络中,得到一个分类模型。
本文将从深度学习的角度出发,使用卷积神经网络 CNN(Convolutional Neural Networks)从 fMRI 数据中提取出有效信息,对精神分裂症患者进行分类。
CNN 算法基于BP 神经网络,在CNN 训练过程种同样采用向前和向后传播。CNN 包含了一个由卷积层和池化层构成的特征抽取器,然后通过全连接层进行训练输出(见图1)。它对于图像的输入通过一个权值矩阵构成的卷积核,分别在x 和y 方向通过卷积核对若干个特征平面(feature-maps)进行卷积操作来构建多维度特征,然后再进行ReLU 激活函数和池化(pooling)来达到降维度和防止过拟合(over-fitting),将这些特征输入到全连接层,最后再到输出层。
在卷积过程中我们通过卷积核对输入的x*x 大小的图像沿着x 和y 方向分别以步长(strides)进行卷积操作,我们以ReLU 为激活函数,则卷积操作可以描述为:
图1 卷积神经网络架构
其中Wi表示第i 层卷积核的权值向量,运算符“∙”表示卷积核输入特征图进行卷积操作,卷积的输出与第i 层的偏向向量bi相加通过Relu激活函数得到输出特征图。
在卷积过程中由于卷积后像素矩阵会变小,并且在图像边缘存在信息丢失的问题,所以我们需要做像素填充 padding 操作。常见的 padding 有 VALID 和SAME 两种,对于VALID padding 后图像像素的大小可以表示为
其中xheight和xweight分别输入像素的长和宽,kheight和kweight为别为卷积核的长和宽s为每一次卷积核移动步长,其中为向上取整符号。SAME padding 后图像的像素大小可以表示为:
可见通过SAME padding 后可以得到和原来像素一样大小的矩阵。
本文实验中所使用的fMRI 数据为UCLA 数据集[4,5](https:∕∕openfmri.org∕)。数据集中包括58 名精神分裂症患者和138 例健康对照组。实验中使用DPABI[6]工具包对原始数据进行预处理。预处理包括时间层矫正、头动矫正、归一化处理以及平滑滤波。
预处理后的数据是时间序列上的空间信息,即四维数据。实验中使用AAL[7]模板将大脑划分为116 个感兴趣区域,在每个感兴趣区域上提取时间序列。在所有被试中,计算各个感兴趣区域之间的皮尔逊相关系数,由此来构建功能连接矩阵。功能连接矩阵的形状为[116,116],如图2 所示。功能连接矩阵作为被试的特征,送入CNN 训练及对精神分裂症患者进行分类。
图2 功能连接矩阵
在我们的实验中,我们使用了如图1 的网络模型。其中第一层是卷积核大小为16*16*256 的卷积层,跳步为4,激活函数为ReLU;第二层为4*4 的最大池化层,第三层再利用4*4*128 的卷积核进行卷积,跳步为1,激活函数为ReLU;第四层为2*2 的最大池化层,第五层为含有64 个神经元的全连接层,第六层为含有2 个神经元的全连接层,并由Softmax 函数进行输出。所有的卷积层采用valid 方式进行卷积。之后我们将功能连接矩阵用于网络训练,并采用十折交叉验证进行模型的训练与预测。
分类准确率是衡量一个分类模型性能的重要指标之一。为了评估该模型的性能,我们定义分类准确率:
其中N为数据分布,P(·)为概率密度函数。我们将其与其他使用传统机器学习分类方法的实验对比,得到如表1 所示的结果。
与传统的医疗图像分类方法SVM[8]和Bagged SVM[9]相比,CNN 模型的分类准确率大幅提高,即使是机器学习分类方法中性能较好的Random Forest[10],相对于CNN 模型也存在明显弱势。从表格中可知,与机器学习分类方法相比,卷积神经网络分类模型在分类高维度特征时性能更好。
表1 CNN 及其他模型的分类结果
本文对精神疾病医疗图像分类研究有一定意义,在传统的机器学习方法难以取得较好成效的领域,我们应该尝试更多的方法,尤其是新兴的深度学习方法,如DNN、CNN 以及其他改进后的网络模型,这些方法往往能取得更好的结果。
本文在医疗影像数据中,提出了基于卷积神经网络的识别算法,针对差异性脑区或脑网络,充分利用CNN 自学习特性,有效解决了传统分类模型,对高维fMRI 数据存在着不能有效提取特征的问题,使得训练网络模型本身即具有抗噪声、抗旋转等优良特性。在今后的工作中将引用3D 卷积神经网络,来针对fMRI数据高时间维度的特性,更好地挖掘大脑隐藏信息。