机器学习在神经精神疾病诊断及预测中的应用

2018-02-11 14:34文宏伟陆菁菁何晖光
协和医学杂志 2018年1期
关键词:正确率分类器机器

文宏伟,陆菁菁,何晖光

中国科学院 1自动化研究所类脑智能研究中心 5脑科学与智能技术卓越创新中心,北京 100190 2中国科学院大学,北京 100049 3西南大学心理学部,重庆 400715 4 中国医学科学院 北京协和医学院 北京协和医院放射科, 北京 100730

神经影像技术泛指能够直接或间接对神经系统(主要指大脑)结构、功能和药理学特性进行成像的技术。当前以磁共振成像(magnetic resonance imaging,MRI)为代表的多种神经影像技术已被广泛应用于神经精神疾病以及认知神经科学等领域,以探索用于脑疾病早期诊断、治疗和疾病发展监控的生物标志物。研究发现,神经精神疾病患者的大脑存在功能和结构改变,如阿尔茨海默病(Alzheimer disease, AD)[1- 2]、注意力缺陷多动障碍(attention deficit hyperactivity disorder, ADHD)[3]和抽动秽语综合征(Tourette syndrome,TS)[4]等。然而此类研究采用的是对图像中每个体素单独进行假设检验的传统方法,因此研究结果对临床诊断和预后的贡献十分有限。此外,神经影像学研究往往报道神经精神疾病患者和正常人组间水平的差异,而医生在诊疗中需在个体水平作出判断。因此,为了使神经影像学更好服务于临床诊断,需提供个体水平的诊断和预测。

近年来,机器学习方法已广泛应用于多模态神经影像数据分析,并能从神经影像数据中提取出新的信息和感兴趣的模式,找到基于大脑影像数据的生物学标志物,并从个体水平区别神经精神疾病患者与正常人。其中涉及机器学习的方法主要包括多任务/多模态学习、特征提取和选择、分类、核方法、深度学习等。通过这些机器学习方法,对已有疾病数据进行有效分析,发现其中规律,可准确对未知数据进行预测和诊断,进而帮助寻找与疾病有关的生物学标志物,从而有效辅助脑疾病的临床诊断。

1 基于机器学习的神经影像分析流程

机器学习基于训练数据构建统计模型,从而使计算机具有对新数据进行预测和分析能力。随着医学成像技术的发展,在许多神经精神疾病的早期诊断和治疗中已越来越多地用到多模态影像数据,如何针对神经影像数据固有的高维度、小样本、异构等特性设计出相应的有效数据分析方法是当前研究的关键问题之一。分析流程主要包含特征提取、特征选择、训练分类器、泛化能力测试等。

1.1 特征提取

当前常用的神经影像预处理软件包括SPM,FreeSurfer,FSL等,可从多模态神经影像中提取不同类型结构和功能特征指标,例如从结构 MRI 数据中,可提取其灰质体积[5- 6]、皮层厚度[5]和面积等形态学指标作为分类特征;在弥散张量成像中,可提取其分数各向异性、轴向弥散度、径向弥散度和平均弥散度等参数值为分类特征[6]。此外,还可构建脑白质结构连接矩阵或通过连接矩阵计算其网络属性作为特征[7];从静息态功能性磁共振成像(functional MRI, fMRI)数据中,可计算区域一致性[8]和低频振幅(amplitude of low-frequency fluctuation, ALFF)[9]等区域指标,还可计算区域之间的功能连接(functional connectivity, FC),或通过连接矩阵计算其网络属性作为分类特征[10]。

1.2 特征选择

由于样本采集困难,神经影像领域中的数据集通常仅包含几十到几百个样本,而从神经影像中提取的特征维度却往往很高,一般在几千到几万甚至几十万维。这些高维影像特征的维度远远大于样本个数,且实际包含了很多与分类问题无关的特征,若直接使用这些高维特征很可能会影响分类器的性能,导致模型过拟合,即对新样本的准确预测能力较差。因此将预测模型应用到神经影像数据之前需先进行特征选择。特征选择的方法主要分为3类,即过滤式(filter)、包装式(wrapper)和嵌入式(embedded)。过滤式通过某些判据衡量每个特征所包含的信息来评估特征的好坏,典型的判据如类内类间距离(Fisher score),皮尔森相关系数和双样本t检验中的p值等;包装式则针对分类问题本身,通过迭代优化特定的分类算法,找到针对该问题的最佳特征子集,典型方法如递归特征消除法(SVM-RFE)[6];嵌入式方法将特征选择融合在模型训练的过程中,典型方法如决策树。

1.3 训练分类器

训练分类器是通过已有数据训练出的分类工具,当新的观察样本输入分类器后,即可判断其所属类别。分类器依据学习方式可分为监督学习、非监督学习、半监督学习和强化学习等。目前常用的分类算法包括:支持向量机(support vector machine, SVM)、决策树、朴素贝叶斯、神经网络、K近邻等。此外,由于医学影像数据的复杂性和多样性,采用单一的分类方法往往不够有效,集成学习方法(Bagging[11]、Boosting[12]等)用于组合单一分类方法,多核学习(multiple kernel learning, MKL)[6]方法用于组合多个核函数,可显著提高分类能力。

1.4 泛化能力测试

机器学习方法可有效筛选出与疾病高度相关的重要特征,并利用已学习的特征构建一个分类模型,然后提取未知样本(待诊断受试者)相对应的影像特征,并输入分类器得到预测结果(类别),从而实现个体水平的诊断。为了评估机器学习模型预测新样本类别的能力(又称模型的泛化能力),嵌套式交叉验证通常被用于分类器泛化能力测试[5- 6]并可在样本较少时,一定程度上避免分类器的过度学习以及对分类方法的过高评价[13]。

1.5 深度学习

随着深度学习[14]和大数据的发展,特征提取、选择和分类器设计均可基于深度学习的框架和方法来完成。区别于传统的浅层学习(如SVM),深度学习可通过深层非线性网络结构学习特征,并通过组合低层特征形成更加抽象的深层表示(属性类别或特征),实现复杂函数逼近,从而可以学习到数据集的本质特征[15]。深度学习可克服传统浅层机器学习在复杂分类问题中的局限性,从而大大提高辅助诊断能力。当前常用深度学习模型与架构包括:深度限制波尔兹曼机(deep restricted boltzmann machine, DRBM)[16]、深度置信网络(deep belief networks, DBN)[17]、深度递归神经网络(deep recurrent neural networks, DRNN)[18]、深度卷积神经网络(deep convolutional neural networks, DCNN)[19]等。值得一提的是,DCNN当前已在皮肤癌分类[20]、糖尿病视网膜病变检测[21]等领域取得了出色成果。

2 基于机器学习的疾病智能诊断及预测

在临床上,神经精神性疾病的诊断、不同疾病亚型区分和预后评估十分重要。目前,以AD/轻度认知障碍、注意力缺陷多动障碍、抽动秽语综合征等为代表的神经精神性疾病对公共健康造成了巨大影响。随着大数据的深入应用,机器学习已经进入医疗领域。基于机器学习方法自动分类患者和正常人的医学影像数据可实现个体水平的智能诊断,同时也可提取医学影像数据中内在的、带有判别信息的生物标志物用于病理研究。

2.1 阿尔茨海默病/轻度认知障碍

Dai等[22]使用平均皮层厚度构建皮层厚度网络,进一步使用网络边的权重作为特征来区分AD患者和正常人(normal control, NC),分类正确率可高达90.4%。张超等[23]基于多任务学习特征选择方法与极限学习机(extreme learning macchine, ELM)分类轻度认知障碍(mild cognitive impairment, MCI)和正常老人,分类正确率最高达88.10%。李慧卓等[24]选择双侧海马体积及ALFF作为分类特征,采用Adaboost集成分类器对AD与MCI、MCI与NC、AD与NC进行分类,正确率分别达98.08%、80.36%和100%。在基于深度学习模型的研究中,吕鸿蒙等[25]提出了一种增强的AlexNet网络模型,在ADNI[25- 26]数据库上对AD与MCI、MCI与NC、AD与NC进行分类,正确率分别达90.52%、84.80%和96.14%。

2.2 注意力缺陷多动障碍

Dai等[5]采用融合多模态神经影像特征的ADHD分类框架,分别从结构MRI和fMRI中提取4种特征,并基于MKL融合4种特征训练出一个多核分类器,并在ADHD- 200数据集[27]上取得了61.54%的分类正确率。朱莉等[28]采用一种基于粗分割和深度学习的 ADHD分类算法,首先对ADHD- 200数据集的脑部MRI进行头骨剥离、高斯核平滑等预处理;其次对大脑的右侧尾状核、左侧楔前叶和左侧额上回部位的MRI进行粗分割;最后利用3层卷积神经网络模型进行分类,在右侧尾状核脑区处进行分类,最高正确率可达 77.27%。在基于深度学习模型的研究中,Kuang等[29]将ADHD- 200数据集的fMRI数据基于brodmann模板划分为48个区域,然后采用DBN模型进行分类,最后基于扣带回皮质的特征取得了最高72.73%的分类正确率。

2.3 抽动秽语综合征

Greene等[30]基于全脑静息态FC特征,应用多变量模式分析(multivariate pattern analysis, MVPA)自动分类42例TS患儿与42名年龄、性别匹配的健康儿童,分类正确率达74%。Liao等[31]应用同源体素功能连接(voxel-mirrored homotopic connectivity, VMHC)分析TS男孩皮层下的双侧大脑半球同源脑区间FC与正常男孩的差异,然后基于有显著差异的VMHC为特征,应用MVPA方法分类24例TS男孩与32名健康男孩,分类正确率高达92.86%。Wen等[32]提出采用相似网络融合(similarity network fusion, SNF)算法[32- 33]构建每个受试者多稀疏度融合的脑网络,并基于图论分析和SVM自动分类TS患儿和正常儿童,最终分别基于融合后的结构和功能网络取得了89.13%和88.79%的高分类正确率[10]。此外,Wen等[6]基于多模态神经影像提取多类型灰白质特征,并采用多核学习分类器为每种特征的核函数分配权重,融合全部特征自动分类44例TS患儿和48名正常儿童,取得了94.24%的分类正确率。该研究同时表明基于多模态影像特征的多核学习方法,相比基于单一模态数据的分类方法,能够更全面反映样本不同层面特征,从而提取更多有效特征以进一步提高分类的准确性。

此外,机器学习在精神分裂症[34]、帕金森病[35]、自闭症[36- 37]、抑郁症[38]、强迫症[39]等神经精神疾病的智能诊断和预测研究中也取得了很大进步。

3 小结和展望

机器学习在神经精神疾病智能诊断及预测研究中进步巨大,但仍有很大发展空间:(1)多数研究是基于全脑影像数据进行特征选择,分类正确率很大程度上取决于感兴趣区选择的好坏,设计算法自动寻找合理的感兴趣区域将是未来的研究重点。(2)当前研究仍以传统浅层学习算法为主,在实际应用中依然存在较大问题,如传统浅层学习算法需利用先前经验知识从原始数据中人工提取特征来训练模型,但特征选取难度较大,模型可能存在过拟合问题,泛化能力难以保证,无法利用高维特征之间的关系所提供的有效信息[40]。深度学习作为机器学习领域的新兴技术,可在很大程度上改进浅层学习中的问题,大幅提高算法从神经影像中学习特征的能力,将成为未来研究的热门方向。(3)由于大量神经精神疾病临床图像数据缺乏有效的数据标注,发展以非监督学习为主的机器学习模型完成这些数据的自动标注,将是未来的研究热点。(4)当前研究采用的数据集主要是同源数据集,往往规模较小,因此会在一定程度上影响提出方法的分类性能,但在实际临床应用中,往往存在大量的异源数据,这时传统方法未必能很好地解决此类问题,需充分利用机器学习领域的其他方法,如迁移学习等,设计特定的脑疾病分析方法,从而改善分类表现,寻找更多对脑疾病敏感的生物学标志物,更好辅助脑疾病的诊断。

神经精神疾病的临床症状复杂多样[41],其诊断是医疗系统中更偏向于劳动密集型的工作之一,这恰恰也是机器学习的擅长领域。普通医疗体系不能永远保持精确又快速的诊断,神经影像技术和以深度学习为代表的机器学习技术的不断发展,不仅能大幅削减成本,其辅助诊断结果亦能实时获取。机器学习可帮助医生提供更准确更有效率的诊断,从而进一步提高神经精神疾病的临床诊断水平。

[1] He Y, Chen Z, Evans A. Structural insights into aberrant topological patterns of large-scale cortical networks in Alzheimer’s disease[J]. J Neurosci, 2008, 4: 4756- 4766.

[2] Lo CY, Wang PN, Chou KH, et al. Diffusion tensor tractography reveals abnormal topological organization in structural cortical networks in Alzheimer’s disease[J]. J Neurosci, 2010, 30: 16876- 16885.

[3] Cao Q, Shu N, An L, et al. Probabilistic diffusion tractography and graph theory analysis reveal abnormal white matter structural connectivity networks in drug-naive boys with attention deficit/hyperactivity disorder[J]. J Neurosci, 2013, 33: 10676- 10687.

[4] Wen H, Liu Y, Wang J, et al. Combining tract- and atlas-based analysis reveals microstructural abnormalities in early Tourette syndrome children[J]. Hum Brain Mapp, 2016, 37: 1903- 1919.

[5] Dai D, Wang J, Hua J, et al. Classification of ADHD children through multimodal magnetic resonance imaging[J]. Front Syst Neurosci, 2012, 6: 63- 63.

[6] Wen H, Liu Y, Rekik I, et al. Multi-modal multiple kernel learning for accurate identification of Tourette syndrome children[J]. Pattern Recognit, 2017, 63: 601- 611.

[7] Wen H, Liu Y, Rekik I, et al. Disrupted topological organization of structural networks revealed by probabilistic diffusion tractography in Tourette syndrome children[J]. Hum Brain Mapp, 2017,38:3988- 4008.

[8] Zang Y, Jiang T, Lu Y, et al. Regional homogeneity approach to fMRI data analysis[J]. Neuroimage, 2004, 22: 394- 400.

[9] Zang YF, He Y, Zhu CZ, et al. Altered baseline brain activity in children with ADHD revealed by resting-state functional MRI[J]. Brain Dev, 2007, 29: 83- 91.

[10] Wen H, Liu Y, Rekik I, et al. Combining disrupted and discriminative topological properties of functional connectivity networks as neuroimaging biomarkers for accurate diagnosis of early tourette syndrome children[J]. Mol Neurobiol, 2017. doi: 10.1007/s12035- 017- 0519- 1. [Epub ahead of print].

[11] Breiman L. Bagging predictors[J]. Mach Learn, 1996, 24: 123- 140.

[12] Schapire RE, Freund Y, Bartlett P, et al. Boosting the margin: a new explanation for the effectiveness of voting methods[J]. Ann Stat, 1998, 26: 1651- 1686.

[13] Wilson SM, Ogar JM, Laluz V, et al. Automated MRI-based classification of primary progressive aphasia variants[J]. Neuroimage, 2009, 47: 1558- 1567.

[14] Hinton GE, Salakhutdinov RR. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313: 504.

[15] 孙志军, 薛磊, 许阳明, 等. 深度学习研究综述[J]. 计算机应用研究, 2012, 29: 2806- 2810.

[16] Zou X, Wang G, Yu G. Protein function prediction using deep restricted boltzmann machines[J]. Biomed Res Int,2017, 2017: 1729301.

[17] Hinton GE. Deep belief networks[J]. Scholarpedia, 2009, 4: 5947.

[18] Graves A, Mohamed A, Hinton GE. Speech recognition with deep recurrent neural networks [C]. IEEE International Conference on Acoustics, Speech and Signal Processing, 2013:6645- 6649.

[19] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classific-ation with deep convolutional neural networks[C]. Advances in Neural Information Processing Systems,2012: 1097- 1105.

[20] Esteva A, Kuprel B, Novoa RA, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017, 542: 115.

[21] Gulshan V, Peng L, Coram M, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs[J]. JAMA, 2016, 316: 2402.

[22] Dai D, He H, Vogelstein JT, et al. Accurate prediction of AD patients using cortical thickness networks[J]. Mach Vis Appl, 2013, 24: 1445- 1457.

[23] 张超, 胡斌, 郑炜豪. 脑皮层形态学多特征融合的轻度认知障碍的分类研究[J]. 小型微型计算机系统, 2016, 37: 2558- 2561.

[24] 李慧卓, 相洁, 秦嘉玮, 等. 基于Adaboost的轻度认知障碍和阿尔茨海默病分类[J]. 中国医学影像技术, 2016, 32: 623- 627.

[25] 吕鸿蒙, 赵地, 迟学斌. 基于增强AlexNet的深度学习的阿尔茨海默病的早期诊断[J]. 计算机科学, 2017, (S1): 50- 60.

[26] Mueller SG, Weiner MW, Thal LJ, et al. The Alzheimer’s disease neuroimaging initiative[J]. Neuroimaging Clin N Am, 2005, 15: 869.

[27] Consortium H. The ADHD- 200 Consortium: A model to advance the translational potential of neuroimaging in clinical neuroscience[J]. Front Syst Neurosci, 2012, 6: 62.

[28] 朱莉, 张丽英, 韩云涛,等. 基于卷积神经网络的注意缺陷多动障碍分类研究[J]. 生物医学工程学杂志, 2017, (1): 99- 105.

[29] Kuang D, Guo X, An X, et al. Discrimination of ADHD based on fMRI data with deep belief network[C]. International Conference on Intelligent Computing, 2014: 225- 232.

[30] Greene DJ, Church JA, Dosenbach NUF, et al. Multivariate pattern classification of pediatric tourette syndrome using functional connectivity MRI[J]. Dev Sci, 2016,19:581- 598.

[31] Liao W, Yu Y, Miao HH, et al. Inter-hemispheric intrinsic connectivity as a neuromarker for the diagnosis of boys with tourette syndrome[J]. Mol Neurobiol, 2017,54:2781- 2789.

[32] Wen H, Liu Y, Wang S, et al. Multi-threshold white matter structural networks fusion for accurate diagnosis of early tou-rette syndrome children[C]. International Society for Optics and Photonics, 2017: 101341Q- 101341Q- 13.

[33] Wang B, Mezlini AM, Demir F, et al. Similarity network fusion for aggregating data types on a genomic scale[J]. Nat Methods, 2014, 11: 333- 337.

[34] Qi J, Tejedor J. Deep multi-view representation learning for multi-modal features of the schizophrenia and Schizo-affective disorder[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, 2016:116- 118.

[35] Adeli E, Wu G, Saghafi B, et al. Kernel-based joint feature selection and Max-Margin classification for early diagnosis of Parkinson’s disease[J]. Sci Rep, 2017, 7:41069.

[36] Crippa A, Salvatore C, Perego P, et al. Use of machine learning to identify children with autism and their motor abnormalities[J]. J Autism Dev Disord, 2015, 45: 2146- 2156.

[37] Wang J, Wang Q, Peng J, et al. Multi-task diagnosis for autism spectrum disorders using multi-modality features: a multi-center study[J]. Hum Brain Mapp, 2017,38:3081- 3097.

[38] Chekroud AM, Zotti RJ, Shehzad Z, et al. Cross-trial prediction of treatment outcome in depression: a machine learning approach[J]. Lancet Psychiatry, 2016, 3: 243.

[39] Hoexter MQ, Miguel EC, Diniz JB, et al. Predicting obsessive-compulsive disorder severity combining neuroimaging and machine learning methods[J]. J Affect Disord, 2013, 150: 1213- 1216.

[40] 陈诗慧, 刘维湘, 秦璟, 等. 基于深度学习和医学图像的癌症计算机辅助诊断研究进展[J]. 生物医学工程学杂志, 2017, (2): 314- 319.

[41] Huys QJM, Maia TV, Frank MJ. Computational psychiatry as a bridge from neuroscience to clinical applications[J]. Nat Neurosci, 2016, 19: 404- 413.

猜你喜欢
正确率分类器机器
机器狗
机器狗
门诊分诊服务态度与正确率对护患关系的影响
未来机器城
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
基于层次化分类器的遥感图像飞机目标检测