复杂脑网络社区检测算法综述

2023-12-08 11:48温旭云聂梓宇曹曲美张道强
计算机与生活 2023年12期
关键词:大脑社区模块

温旭云,聂梓宇,曹曲美,张道强

南京航空航天大学 计算机科学与技术学院,南京 211106

大脑作为当前现实世界中最复杂的生命系统,其结构和功能均可以借助神经影像的技术手段和复杂网络理论进行分析,表征为不同大脑区域间错综复杂的大脑连接网络。结构网络可以帮助人们理解不同脑区的物理连接模式,而功能网络则描述了大脑神经系统快速、实时的信息整合能力。借助于网络分析理论,大量研究已经证明大脑网络具备大部分与其他复杂网络相似的拓扑属性,比如:小世界属性、无标度属性以及社区结构等[1-3]。小世界属性保证大脑以最少的消耗完成最有效的信息处理;无标度属性则证明大脑节点功能连接的异质性,即存在高度连接或集中式的功能脑区;相比于小世界属性和无标度特性,社区结构所隐藏的生物学意义更为复杂,它不仅有助于促进网络的可进化性,增加网络的抗干扰能力,同时也节省了网络布线成本,因此研究该领域对于揭示大脑连接规律具有重要的意义[4]。

近年来,针对大脑社区结构的相关研究逐年增加,特别是在功能网络研究领域。如图1(a)所示,以“brain network+community”和“brain network+module”作为关键词,在web of science 检索2013—2022 年的相关研究,发现论文数量在10 年内呈指数上升的趋势。大脑网络社区化是指神经单元在结构或功能上以社区为单元相互连接,直观地说,社区化是系统的一种架构设计特性,它允许系统实现信息的局部集成,同时保持系统的全局通信能力。对于功能网络来说,每个社区代表集体参与一个或多个认知功能的大脑区域组,即相同社区内的脑区具有相似的功能特性,不同社区的脑区则与不同的大脑功能相关联,比如,Yeo 等人[5]借助于社区检测算法,以脑区功能属性作为特征,将成年人的大脑分割为7个功能系统,包括视觉、感知运动、腹侧注意、背侧注意、控制、默认和边缘系统,不同功能系统负责特定的认知功能(图1(b))。此外,基于检测所得的社区结构,利用网络分析方法,可进一步评估大脑不同空间尺度拓扑结构的统计特性,包括局部尺度不同脑区在大脑系统中的拓扑功能,中观尺度不同功能系统的连接规律和全局尺度大脑的分离度、整合度和rich club组织等(如图1(c)所示)。社区化的拓扑属性为研究健康和疾病的大脑网络提供了强有力的工具,目前已取得丰富的成果。例如,如图1(d)所示,Cole 等人首先利用社区检测获取大脑功能系统(左侧图片),然后基于该功能系统将脑区分为核心(紫色圆圈)和非核心(黑色圆圈)连接节点,最后对比了这两种节点的平均功能活动水平(血氧动力学水平,右侧图片),结果发现在健康的年轻人中核心和非核心节点在与语义分类处理需求相关的系统(即控制系统)中表现出不同的激活,而老年人的这种差别则很小。该研究借助于社区检测方法,证明了相比于年轻人,老年人的系统分离降低了核心连接脑区(connector hub)和非核心连接脑区(non-connector hub)功能活动水平的差异[6]。另外的研究也发现疾病会导致大脑不同系统连接模式的变化,比如,阿尔兹海默症可导致功能网络和结构网络社区内和社区间连接的变化[7](图1(e))。

图1 大脑网络社区结构研究的重要性Fig.1 Importance of brain network community structure research

社区检测算法是大脑网络社区化研究的关键[8]。虽然过去20 年大量的社区检测算法被提出,但如何将这些方法应用于大脑系统识别需要格外注意,因为相比其他领域(比如社交网络),由大脑系统抽象出的网络更加复杂,检测获得准确、稳定和具有生理意义的社区结构难度更大。首先,脑网络的节点表示大脑的特定区域或神经元区域,边表示区域之间的连接强度,所构建的网络通常具有很高的网络连接密度,而且存在由影像噪声导致的虚假连接,后期社区检测中需添加网络稀疏和噪声抑制步骤;其次,与其他领域只需处理单个网络不同,脑网络研究通常涉及多个被试的数据,以获得可靠的生物标记和统计结果,如何处理被试间差异性,获得稳定、准确的社区检测结果是该领域社区检测算法面临的难点问题;最后,大脑作为自然界最为复杂的系统,具有最丰富的网络连接模式,研究者需设计多种任务揭示其网络拓扑属性,比如通过多层次社区检测揭示大脑功能系统自上而下的分层连接模式,通过动态社区检测理解脑连接对于外界刺激的动态响应方式等,使得面向脑网络的社区化研究需要不同种类的社区检测算法的支撑。基于以上原因,越来越多的研究开始关注脑网络社区化研究中社区检测算法的选择和设计问题。

2016年,Sporns和Betzel发表了首篇关于脑网络社区结构研究的综述论文[4]。该论文全面回顾了大脑社区检测在网络神经科学中的应用,总结了大脑结构和功能网络中社区化研究的主要发现,并简要考虑了它们在大脑进化、布线最小化以及功能专门化和复杂动力学的出现中的潜在功能作用,阐述了社区结构研究对揭示大脑连接模式的重要性。2018年,Garcia 等人[8]聚焦基于模块最大化的社区检测算法,详细介绍了该类方法在复杂脑网络中的应用以及面临的问题。2019 年,Vangimalla 等人[9]对比了不同网络预处理方法对社区检测结果的影响。然而,以上论文主要从神经科学的角度论述了社区结构研究的重要性,方法学的描述较为简单,主要聚焦于静态脑功能网络的分离社区结构和基于模块最大化的社区检测方法。本文则从计算机科学的角度出发,致力于提供全面、完整的面向复杂大脑功能网络社区检测方法的描述,涵盖了当前所有针对脑网络社区化研究的场景任务,以期为今后脑网络社区结构研究中的算法选择提供方法学指导。

1 背景知识

目前,大脑功能网络通常是利用功能磁共振成像(functional magnetic resonance imaging,fMRI),通过计算神经元或脑区时间序列数据之间的统计依存关系而建立[10],其高空间分辨率使其在生物标记物识别方面具有突出优势。本文聚焦fMRI 数据,全面综述面向三种场景任务的大脑网络社区检测算法,分别为“单层次社区检测”“多层次社区检测”和“动态社区检测”,具体流程如图2所示。

图2 基于社区检测的大脑功能系统识别流程图Fig.2 Flowchart for brain functional system identification based on community detection

1.1 大脑功能网络构建流程

如图2所示,大脑连接模式分为静态功能网络和动态功能网络两种,静态连接假设不同大脑区域之间信号的统计相互依赖性在整个实验记录期内是恒定的,动态连接则认为脑连接存在潜在的瞬时性变化。多种证据表明,研究静态[11]和动态[12]连接均有助于促进人们对大型功能性脑组织如何变化以支持不同的基本功能和行为的理解。

对于静态网络,基于fMRI 的脑网络构建通常包括以下三个步骤:首先根据组织解剖、大脑结构或者功能区域的分割模板,将整个大脑划分为多个脑区,每个脑区作为网络的一个节点;其次确定各个脑区的时间序列,一般通过平均该区域所包含的所有体素的血氧依赖水平信号(blood-oxygen-level-dependent,BOLD)获得;最后计算任意一对脑区之间的功能连接,比如皮尔森相关系数、偏相关系数等。

动态网络的构建则首先利用滑窗对时间轴进行分割,其中每个窗代表一个时间周期,窗长则表示时间周期的长短,通过改变该值的设定实现不同尺度下的时间切割,即不同的时间尺度;然后,针对每个时间尺度,基于每个滑窗内的所有时间点,采用与静态网络相同的步骤构建其对应的功能连接矩阵集。

1.2 大脑网络社区检测场景类别

如图2 所示,当前大脑功能社区结构化研究中社区检测面临的场景任务大体分为三种:单尺度社区检测、多层次社区检测和动态社区检测。前两种面向静态功能网络,后一种则针对动态功能网络。在第一种场景中,社区检测根据社区结构种类进一步分为分离社区和重叠社区,其中分离社区只允许单个节点属于单个社区,而重叠社区则允许一个节点同时属于多个社区,虽然单尺度社区检测有一定程度上的局限性,但是其对网络结构的探索有重大的推动意义[13]。近年来,随着对大脑网络性质的深入研究,越来越多的研究者开始关注复杂大脑系统社区结构的层次性和动态性。层次社区结构研究用来探讨不同空间尺度下大脑功能系统的交互方式,比如研究发现,人脑功能连接模式随着老化在低空间尺度上内变得更整合,而在高空间尺度上变得更分离[14]。动态社区结构可以揭示人类大脑如何根据环境的要求产生动态的适应并且短时间改变功能系统通信模式,从而进行各种复杂的认知行为。

1.3 社区检测算法类别

如图2所示,社区检测方法主要分为基于优化和基于模型的方法。基于优化的算法将社区检测问题抽象为优化问题,通过最大化/最小化某个社区划分质量评价指标,来搜索最优的网络划分结果,其中目标函数的选择和解集搜索方式都会影响算法的社区发现能力,基于优化的方法是社区检测算法中最常用的算法,但其性能易受社区划分指标定义的影响,如基于模块度的谱优化、极值优化等。基于模型的社区检测方法主要有贝叶斯框架下的社区检测方法、基于随机块的生成模型等方法,该类方法引入概率统计适应社区概念的不确定性,不仅使社区结构不再受限于社区划分指标,同时也为贝叶斯等复杂统计学知识的引入提供了框架。除了以上两类方法,不同的研究者从其他的角度或受其他领域的启发提出了新的方法,如模糊聚类和派系过滤方法等。为了提高本文可读性,表1给出了本文涉及主要符号和其对应的意义。

表1 本文主要符号说明Table 1 Explanation of main symbols of this paper

2 单尺度社区检测算法

单尺度社区结构是最早、最广泛用于探讨脑网络连接模式的图论方法。2009 年,Meunier 等人[15]首次将社区检测应用到脑网络研究中,证实了大脑功能网络社区化结构随年龄呈现显著的变化模式,之后该领域得到广泛关注,越来越多的社区检测算法被提出或被应用到各类脑科学研究中。根据社区结构特性,单尺度社区检测分为分离社区检测和重叠社区检测,分离社区检测中单个脑区只允许属于一个社区,而重叠社区检测则允许单个脑区同时属于多个社区。

2.1 分离社区检测算法

表2 总结了目前用于静态脑功能网络分离社区检测的算法,其中大部分为基于优化的方法,以模块度(modularity)、多层模块度(multi-layer modularity)、surprise、编码长度(code length)和分割率(cut cost)等作为目标函数,采用贪心、模拟退火、极值优化和谱聚类等搜索最优解。此外,算法还被进一步分类为应用型和新方法,应用型为其他领域所提出的社区检测算法用于脑网络分析,新方法则是专门针对脑网络特性设计的算法。

表2 静态脑功能网络分离社区检测算法Table 2 Separated community detection algorithms for static brain functional network

在基于优化的社区检测算法中,模块度Q是目前社区检测最广泛使用的目标函数,其定义如下:

其中,m为边的数目,Aij为连接节点i和j边的权重,ki表示节点i的度,δ(i,j)为指示函数,当节点i和j处于同一社区时取1,否则取0。模块度评估了当前社区划分与随机网络之间社区内部边数占总边数比例的差异,其值越大表明社区划分结果较好。值得注意的是,模块度优化是一个NP 难问题(nondeterministic polynomial hard problems),为了获得最好的解集,基于不同搜索策略的各类社区检测算法被提出,包括基于贪心方法的Louvain算法[16]、谱优化(spectral optimization)[17]和层次聚类(hierarchical agglomeration)[18],以及基于启发式的模拟退火(simulated annealing)[19]和极值优化(extremal optimization)[20]等方法。在三种贪心搜索算法中,Louvain 算法在脑功能网络社区化研究中的使用最为广泛,其通过“构造新网络和优化目标”的反复迭代,实现了简单、高效、准确的社区检测,适用于各种规模的网络;谱优化和层次聚类主要针对大规模的网络设计,在小规模网络的表现较差。在启发式算法中,模拟退火算法鲁棒性较强,可以获得全局最优解,但所得结果受参数影响较大;极值优化通过局部优化节点对模块度的贡献达到全局优化的效果,具有持续搜索和跳出局部最优解的能力,但不适用于大规模网络。虽然基于模块度优化的社区检测算法在各领域均获得良好的性能,但该类方法面临分辨率限制问题,无法识别较小规模的社区。

为了解决模块度的分辨率问题,各类新的评价指标和社区检测算法被相继提出,其中基于编码长度优化的Infomap 算法[21]和基于surprise 的FAGSO(fast algorithm based on greedy surprise optimization)算法[22]在脑功能网络社区研究的应用较多。Infomap算法[21]由Bergstrom 和Rosvall 提出,将网络社区检测问题转换为一个寻找最短编码的随机游走问题,其目标是寻找具有最短随机游走描述长度的网络社区划分。FAGSO 算法由Jiang 等人[22]提出,该方法以surprise作为目标函数,计算了给定社区划分下,网络社区中节点和边累积的超几何分布的概率。此外,概率图模型也可以解决社区分辨率问题,比如Bryant等人[23]基于随机块模型(stochastic block model,SBM)提出适用于静态功能网络社区检测的RGMM(Bayesian random graph mixture model)算法,识别出不同被试者之间的共同潜在结构以及异质结构,该方法引入参数的共轭先验实现对未知参数的有效估计,并采用MCMC(Markov chain Monte Carlo)计算后验,提高计算效率和准确性。

值得注意的是,脑网络社区检测通常面临多被试问题,传统方法通过构建组水平代表性连接矩阵实现社区检测,但该类方法无法获取个体特定的社区化结构。为了解决该问题,Zhang 等人[24]基于传统模块度优化方法,提出一种新的多层被试间约束模块化分析方法(multi-layer intersubject-constrained modularity analysis,MLISMA)。如图3所示,该方法首先通过超参数ω在每个被试对之间添加不同层的连接边,创建了“超连接矩阵”的多层网络,然后利用传统基于模块度优化的社区检测算法获得不同被试的社区结构。多层网络的构建不仅保证了被试间稳健和一致的社区检测,而且可以保留单个被试的独特化社区结构,用于个体变异性分析,实现了被试间社区结构的一致性和差异性的有效平衡。Gupta等人[25]则采用多类谱聚类方法,考虑被试者之间的差异性,结合一致性聚类,提出一种迭代优化方法ICSC(iterative consensus spectral clustering),使共同潜在的功能网络结构与各被试尽可能相似,从而提取出能够代表不同被试的共有功能网络结构,同时也能得到不同被试者之间的模块结构。该方法适用于高连接密度的脑功能网络模块检测,且在不同的情况下均能得到较好的结果,既适用于群体功能模块检测也适用于个体的相关检测。

总之,目前面向静态网络的分离社区检测主要采用已开发的算法进行模块识别与检测,其中基于模块度的社区检测算法使用简单方便,可取得稳定的社区检测结果,而且具有多种变体,是使用最广泛的方法。但是值得注意的是,在算法选择过程中,需根据网络规模和连接属性选择对应的搜索策略,或同时采用多种方法进行迭代搜索[26],以保证社区检测结果的准确性和稳定性。该方向新算法的开发则主要关注多被试脑网络的社区检测问题,集中于解决如何同时有效识别群体共有的社区结构和单个被试特有的功能系统,这也是未来面向脑网络社区检测算法研究的重点方向之一。

2.2 重叠社区检测算法

随着对复杂网络研究的深入,很多真实世界的网络存在单个节点与多个社区同时联系紧密的情况,比如社交网络中的个体同时隶属于学校、家庭和朋友等多个社区。最近大量的神经影像学研究表明,人脑功能网络也表现出重叠化社区组织[27-28],其中一个大脑区域可以参与多个功能模块,以保证人脑与认知功能之间灵活多变的关系,研究重叠区域的拓扑特征和功能作用对于揭示人脑连接模式具有重要的意义。表3 总结了当前脑功能网络重叠社区检测算法。

表3 静态脑功能网络重叠社区检测算法Table 3 Overlapping community detection algorithms for static brain functional network

非负矩阵分解(nonnegative matrix factorization,NMF)在提取高维数据中隐含模式和结构方面具有良好性能,是挖掘网络社区结构的一种重要方法。基于NMF的社区检测要求给定网络是稀疏的非负连接矩阵,然而传统基于相关性方法构建的脑功能连接矩阵通常包含负连接,而且网络连接密度较大。针对该问题,Li等人[29]提出一种非负自适应稀疏表示方法(non-negative adaptive sparse representation,NASR),在传统目标函数基础上添加非负和稀疏约束,保证所构建网络的非负性和稀疏化。具体公式如下:

其中,xi为脑区i的 BOLD 时间序列,Xi=(x1,x2,…,xi-1,xi+1,…,xn) 表示xi的字典,为脑区i的编码向量,每个元素代表脑区j与脑区i的依赖关系,λ为正则化参数。在获得所有节点的wi之后,脑功能连接矩阵定义为A=(W+WT)/2,W={w1,w2,…,wn}。由该方法所构建的脑功能网络非负对称,而且物理意义明确,可直接用于NMF 的输入。基于该网络构建方法,Li 等人先后提出各类基于NMF的社区检测算法,包括sNMF(symmetric non-negative matrix factorization)[29]和ssNMF(sparse symmetric non-negative matrix factorization)[30],对应优化函数分别如式(3)和式(4)所示:

H表征组水平社区结构,表征个体信息,每个元素为第i个被试社区j的连接强度。借助于H和S,cssNMF 可同时准确识别脑功能网络组水平社区结构和个体差异化信息。虽然cssNMF 解决了sNMF和ssNMF无法检测个体差异的缺陷,但由于其在被试上执行统一的稀疏约束,无法保证个体特定的稀疏模式。针对该问题,Mirzaei等人[32]提出两种基于非负张量分解(non-negative tensor factorization,NTF)的框架(即Beta-NTF 和Bayesian non-negative canonical decomposition),用于寻找跨被试可复制的重叠社区结构,该方法无需后处理步骤即可实现对主体间可变性的建模,同时贝叶斯建模能够完成最佳社区数目的自动选择。相比cssNMF,该方法可获得更鲁棒的社区检测结果。

此外,Wen 等人提出的基于多目标优化的MCMOEA(maximal clique based multiobjective evolutionary algorithm)也被用于脑功能网络重叠社区检测中[33-34]。该方法首先通过引入极大派系图,将重叠社区检测问题转换为分离社区检测,不仅降低了问题复杂度,而且实现了网络压缩;然后采用多目标优化方法,同时最大化社区内连接强度(kernelk-means,KKM)和最小化社区间连接强度(ratio cut,RC),最终从帕累托面上选择模块度最大的社区划分结果作为最终结果。Yoldemir 等人[35]基于生物进化中的复制动态理论设置优化目标,提出适用于有权网络的SORD(stable overlapping replicator dynamics)模型,该方法通过引入图增强方法获得多个不同社区划分结果,各划分之间具有重叠性,从而实现了重叠社区检测的目标。

总之,在重叠社区检测方向,基于NMF的社区检测算法实现简单,获得的社区结构具有较高的鲁棒性和稳定性,使用较为广泛,例如被用于阿尔兹海默症标记物检测[36]和年龄预测[37]等任务的重叠社区检测中。然而,目前就脑网络的重叠社区结构研究而言,仍然存在相对较少的研究,因此需要开发更多相应的社区检测算法。此外,还需要更多研究明确和探讨不同社区之间重叠脑区所包含的生理意义和神经机制。

3 层次社区检测算法

现实世界很多复杂系统的社区结构都表现出分层结构,即大规模社区可以细分为更精细的较小社区,保证网络信息传输效率、鲁棒性和适应性。在脑网络中,层次社区结构有助于支持大脑应对外界刺激的快速响应,是揭示脑机制的一种重要途径[38]。表4 总结了目前应用于脑功能网络中层次社区检测算法。

表4 脑功能网络中层次社区检测算法Table 4 Hierarchical community detection algorithms of brain functional network

在脑网络研究中,最常用的层次社区检测算法是通过改进传统的模块度最大化方法实现的,主要分为两种,具体流程如图4所示。第一种方法利用了Louvain算法[39]搜索过程中的迭代聚类产生网络的层次社区划分。以图4(a)为例,该方法首先将网络中的每个节点初始化为一个独立社区,通过不断合并社区得到最优社区划分结果(4 个社区),以此作为层次1的社区检测结果;接下来基于上一步网络划分的结果构建新的网络(即元网络),该网络中的节点为所得社区结构中的社区,边为不同社区间的相互关系,然后采用步骤1的方法检测新构建网络的社区划分结构(2 个社区),以此作为层次2 的结果。通过反复迭代,直到网络无法进一步分割,输出各个层次的结果即可获得所检测网络的层次社区结构。第二种方法则是通过改变模块度函数Q实现多层次社区检测。如图4(b)所示,Ashourvan 等人[40]提出多层次模块度函数,具体公式如下:

图4 基于模块最大化层次社区检测算法的经典方法Fig.4 Classic methods of module maximization hierarchical community detection algorithms

其中,m为边的数目,Aij为连接节点i和j边的权重,ki表示节点i的度;γx为第x层的分辨率参数,γ值越大,社区个数越多;τjxy为不同层之间的连接强度;δ(gix,giy)为指示函数,当第x层中的节点i与第y层的节点j属于同一个社区时为1,否则为0。该目标函数通过参数γ控制网络层次性,参数τ保证层次间节点的对应关系。虽然实验证明该方法能够有效检测网络的层次社区结构,但是面临复杂的超参数设置问题,如何根据先验信息选择合适的γ和τ需要进一步的研究。

此外,Vangimalla 等人[41]将探索性因子分析法(exploratory factor analysis,EFA)应用于脑功能网络社区划分,通过对功能网络关系矩阵进行不同因子参数下的因子分析,实现层次社区检测。Sanchez-Rodriguez 等人[42]则将经验因子分解(empirical mode decomposition,EMD)与随机游走相结合提出一种多时间尺度的社区检测方法。该方法首先基于游走在每个时间点碰到的其他游走的数量占总数量的比例构造时间序列,标准化后利用EMD 得到若干反映不同时间尺度的本征模函数(intrinsic mode function,IMF)及单调残差;然后根据IMF 构建的特征进行聚类,并使用一致性聚类进行结果整合,达到层次社区检测的效果。该方法角度新颖,考虑了时间尺度上的信息流,可在中等规模的网络中找到可信的社区结构,但所识别的层次个数不超过两个。

近年来研究者提出一种基于边的功能连接网络构建方法,即eFC(edge functional connectivity)网络,该网络以原始网络的边作为节点,评估了不同边之间功能的相互关系[43]。将基于eFC 的社区检测结果映射回其相应的大脑区域时,就可以获得重叠的社区检测结果。通过利用eFC 的该特征,Fan 等人[44]采用嵌套谱分区方法(nested spectral partition,NSP),该方法基于特征模式将脑网络分区为不同层次的多个模块,使其能够在层次水平上跟踪重叠模块组织的详细变化。

总之,层次社区检测是一个具有挑战性的任务,因为现实网络的社区层级可能是连续的,而且是不明确的,极大增加了层次社区定义与识别的难度。目前,面向脑网络层次社区检测方法主要以应用型为主,其中基于多层模块度的方法应用较多,因为它实现方便简单,而且可以保证节点在不同层次社区结构之间的对应性,便于后续讨论该层次结构背后的生理意义。在未来研究工作中,需针对脑网络连接特性,开发相应的层次社区检测算法。

4 动态社区检测算法

大量证据表明人脑功能连接是一个动态变化的过程,研究这种时间动力学可极大提升对人类大脑的理解,其中追踪人脑网络社区结构随时间的变化不仅有助于揭示大脑功能系统对外界响应的模式,而且可作为刻画脑区功能特征的指标[45]。表5 总结了目前面向脑功能网络的动态社区检测方法。

表5 动态脑功能网络社区检测算法Table 5 Community detection algorithms on dynamic brain functional network

在动态社区检测算法中,多层模块度最大化算法是最早被引入到动态脑网络社区检测研究中,并得到广泛应用[46-48],其原理与上一章中多尺度模块最大化基本相同,但赋予每一层不同的含义。具体来说,该方法首先通过层间连接将大脑所有时间点的功能网络聚合为一个大型多层网络,然后通过优化多层目标函数,同时识别所有时间点的社区结构,其中利用超参数γ控制检测到的动态社区结构的时间平滑度。基于该算法框架,Ting等人[49]结合随机块模型(SBM),进一步提出一种适用于多被试的动态社区检测算法,该方法构建了一个多层SBM 来表征多个被试动态脑功能网络中的社区结构,同时引入多尺度模块度优化,获取不同被试间的共同划分结构,该方法不仅可以实现动态网络的一致社区划分,而且可捕捉个体间差异。

此外,Al-Sharoa 等人基于张量分解的框架[50],提出适用于单被试(3D-windowed tensor approach,3DWTA)和多被试动态社区检测算法(4D-windowed tensor approach,4D-WTA)。该方法借助谱聚类思想将Tucker 张量分解的框架进行扩展,通过在某个时间点考虑历史信息构建新的张量,提出3D-WTA 和4D-WTA的优化目标,分别如式(7)和式(8)所示:

然而,上述动态社区检测算法均为全局尺度的社区发现,其性能随着网络规模的增大以及时间点的增加而降低。针对此问题,Wen等人[51]提出基于随机游走的局部动态社区检测算法MLRW(multi-layer random walk),该方法通过选择感兴趣的查询节点,并同时发出多个随机游走对所有时间的社区结构进行同步检测,游走过程中的概率矩阵根据相邻时间点的访问节点序列进行实时调整,从而保证社区划分随时间变化的一致性和连续性。该方法为纯数据驱动算法,无需引入任何先验信息,而且计算复杂度较低,为研究脑功能网络的局部结构提供了思路。

总之,脑网络动态社区结构的绘制有助于揭示人脑对于外界刺激任务的响应方式,是理解人类大脑神经机制的重要途径。然而,目前相关的研究工作还处于起步阶段,其主要原因一方面来源于网络动态社区检测的难度较大,不仅要保证单个时间点社区检测质量,同时还要保证社区结构的时间平滑性,如何根据先验信息选择合适的时间平滑度度量指标需要进一步的研究和探讨;另一方面来源于动态社区结构生理意义的解析难度大,特别是静息状态下,很难将不同的社区分布模式与人类行为建立关系。因此,在未来研究工作中,不仅要聚焦于动态脑网络社区检测算法的开发,而且需关注脑网络动态社区分析范式的建立。

5 未来展望

近年来,针对脑网络社区结构的研究吸引了很多研究者的关注并取得了丰富的成果,虽然各种社区检测算法不断被提出,但仍有一些问题需要进一步探索。

第一,开发不同场景任务下的多被试脑网络社区检测算法,包括分离社区、重叠社区、层次社区和动态社区。多被试是脑网络社区化研究领域的特有问题,通过对多个被试进行社区检测,可以揭示个体之间的脑网络差异,帮助人们更好地理解脑社区结构在个体水平上的多样性和个体特定的特征,并获得可靠的生物标记和统计结果。多被试脑网络社区面临的难点主要是数据的异质性和个体差异性,导致数据的多样性和复杂性增加。同时,数据收集过程中的噪声、运动伪影等因素也会影响结果的准确性。因此,如何在考虑多个被试的数据异质性和差异的基础上,有效地提取出共性的网络社区结构,是该领域的关键挑战之一,需要未来更多的研究和讨论。

第二,针对脑网络社区检测算法鲁棒性和可重复性的研究工作较少。在临床环境中,需要确保脑网络分析结果的一致性和稳定性,以便做出准确的诊断和治疗决策。因此,鲁棒性和可重复性的研究对于将脑网络分析应用于临床实践至关重要。特别地,社区检测属于NP 难问题,每次运行均无法获得唯一的结果,这种情况在连接密度高、存在虚假连接的大规模脑网络中尤其严重,而且社区检测结果还会受到脑网络构建过程不同流程选择的影响,比如大脑分区模板、功能连接评估方法和网络稀疏化等。目前该领域已有一些初步探讨性的研究工作,比如Wen等人[52]和Dimitriadis等人[53]利用成年健康人的检测-重测(test-retest)数据集分别针对功能网络和结构网络,评估了不同社区检测算法、不同网络构建方法以及不同网络规模下的脑网络社区分析结果的鲁棒性,结果发现脑网络社区化研究的可重复性处于中等水平,而且社区检测算法的选择对结果的影响很大。然而,当前对于这一领域的研究仍然相对有限,不仅缺乏关于疾病患者脑网络社区差异可重复性的研究,而且在重叠社区检测、多层次社区检测以及动态社区检测等方面的研究也尚未展开。

第三,针对多模态脑网络社区检测的研究是未来的重要研究方向之一。多模态研究可以结合不同类型神经影像数据,从多个角度探索脑的结构和功能,揭示大脑结构和功能连接之间的关联性,帮助人们理解脑区域的解剖连接是如何与其功能联系在一起的,是近年来的研究热点。目前大部分结构-功能关联研究主要专注于网络边缘权重之间的统计关系,但对结构和功能网络社区之间的依赖关系了解甚少。Puxeddu等人[54]首次基于多层次模块最大化的社区检测算法,提出新的框架,通过同时将从不同受试者估计的结构和功能网络映射到社区,实现了对大脑模块化组织进行多受试者和多模态的同步分析。利用该方法,研究者发现了脑结构和功能网络存在模态独特和模态共享的连接模式。深入研究多模态脑网络的社区结构,将极大扩展人们对大脑的理解,同时也有望改善疾病的诊断和治疗方法,因此需要未来的进一步研究探索。

6 总结

本文聚焦于复杂脑网络,从分离社区检测、重叠社区检测、层次社区检测和动态社区检测四方面进行全面系统的调研,同时侧重于针对脑网络连接稠密、多被试、复杂动态性、含噪声等特性而提出的方法,试图为脑网络社区检测研究提供一份全面完整的研究综述,为今后脑网络社区结构研究选择提供方法学指导。

猜你喜欢
大脑社区模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
社区大作战
3D打印社区
在社区推行“互助式”治理
如何积极应对社区老年抑郁症
集成水空中冷器的进气模块