赵怡然,黎银潮,陈树达,佘颖芳,陈傲寒,周列民,2
局灶性皮质发育不良(focal cortical dysplasias,FCD)是皮质发育畸形的一种类型,与药物耐受性癫痫高度相关,是儿童新皮质癫痫的最常见原因。Crome和Taylor等人最早描述此类疾病[1,2]。目前认为对于FCD引起的顽固性癫痫的最佳治疗手段是进行外科手术,但是许多癫痫患者并不能在影像学检查中发现小的病灶。
目前来说对于细微病灶的发现及FCD亚型的分类与诊断仍然有较大不足,因此,识别FCD相关的诊断治疗及预后指标,如生物标志物具有重要作用。在这项研究中,我们通过生物信息学分析的方法,发现局灶性脑皮质发育不良的潜在致病基因及疾病发生发展相关的信号通路途径,从分子水平揭示FCD潜在的分子机制。
1.1 基因芯片来源 基因芯片数据集GSE62019及相关临床资料来自于GEO数据库,其采用的是商业化的离子通道芯片平台GPL10558[3]。含有5例局灶性皮质发育不良患者的脑组织标本,对照组包括3例正常的脑组织标本。
1.2 数据的预处理与差异表达基因的筛选 基于GPL10558平台构建的信息,将探针识别号转化为正式的基因名称。然后,利用limma软件包分析基因表达矩阵,经affy、affyPLM软件包进一步处理,得到差异表达基因(DEGs),利用Benjamini-Hochberg错误发现率方法,调整P值来降低假阳性率[4~7]。采用调整P值≤0.05,|logFC|≥2 作为截断值的标准,logFC≥2和logFC≤-2分别对应上调和下调的差异表达基因。
1.3 差异表达基因本体论(Gene ontology,Go)和信号通路富集分析 GO分析是对基因产物及其功能特征进行注释,能够有效地用于鉴定高通量遗传数据特征的生物学属性,包括分子功能(molecular function,MF)、生物学过程(biological processes,BP)和细胞组分(cellular components,CC)[8]。KEGG数据库是一个处理基因组、细胞、疾病和信号转导通路等的高通量生物数据库的集合,通常用于注释参与其中的基因列表和信号通路网络[9]。利用功DAVID数据库对DEGs进行GO分析和KEGG/生物途径富集分析,使用ggplot2包将共表达的DEGs的功能分析,错误发现率(false discovery rate,FDR)<0.05具有显著的统计学意义[10]。
1.4 蛋白质-蛋白质相互作用(Protein-Protein interaction,PPI)网络分析 STRING数据库(The Search Tool for the Retrieval of Interacting Genes,version 11.0)用于搜索蛋白质之间的直接(物理)和间接(功能)关联,评估蛋白质之间的相互作用[11]。将界值标准设定为置信度得分≥0.4且最大相互作用数=0。随后,用Cytoscape的插件Cytohubba分析PPI网络,使用MCC算法,从PPI网络中挑选出与周围基因具有高度连通性前5个基因,作为核心基因[12]。
1.5 差异表达基因功能模块分析 使用Cytoscape中的MCODE插件,其根据拓扑关系对给定网络进行聚类,本研究分析基于DEGs的PPI网络以筛选出基因功能模块,degree cutoff=2,node score cutoff=0.2,k-core=2,and max depth=100。另外筛选出的功能模块映射到STRING,进行GO和KEGG分析以注释。
1.6 药物-基因的相互作用 探究基因与现有药物之间的相互作用以及探索新药适应证在FCD中的潜在应用。 利用开源的药物基因相互作用数据库(DGIdb:https://www.dgidb.org)[13]。以核心基因作为潜在的靶标在数据库中搜索现有药物或化合物。
1.7 统计学分析 统计分析采用t检验进行DEGs的筛选与鉴定;采用Fisher精确检验分析GO和KEGG注释富集。所有统计分析均在R版本3.6.3软件中执行。
2.1 差异表达基因 通过GSE62019进行差异基因筛选出777个DEGs,分别包括364下调基因和413个上调基因。
2.2 差异表达基因的功能分析 为了进一步了解777个DEGs的生物学功能,分别将413个上调基因和364下调基因进行GO和KEGG/生物途径富集分析。GO分析结果显示,413个上调DEGs的细胞组分在细胞外间隙和胞外区中富集;生物过程主要是组成细胞外基质和胶原纤维组织,参与免疫应答;分子功能富集在细胞因子活性、生长因子活性以及钙离子结合。KEGG/生物途径分析显示,上调的DEGs主要参与PI3K-Akt信号转导通路,补体途径和抗原加工提呈过程(见图1)。364下调基因DEGs的细胞组分在细胞外间隙和胞外区中富集,与上调基因相同;生物过程主要是细胞趋化性,T细胞稳态增殖的调节以及参与免疫应答;分子功能富集在转运活性,单加氧酶活性和补体受体活性。KEGG/生物途径分析显示,上调的DEGs主要参与细胞因子受体互作,产生IgA的肠道免疫网络和类固醇激素合成途径(见图2)。
图1 上调DEGs的GO分析及KEGG分析
2.3 核心基因的功能模块及表达水平分析
2.3.1 PPI 网络的构建及5个核心基因的筛选 为了鉴定潜在调控基因,构建PPI网络,再用Cytoscape插件Cytohubb计算PPI网络,然后按MCC方法选择靠前的5个基因,包括,将这5个基因命名为核心基因(见图3)。
2.3.2 功能模块分析 通过Cytoscape软件中的MCODE插件及DVAID在线网站分析DEGs的功能模块,其基于基因计数对其进行降序排序P值<0.05(见表1)。显示核心功能模块的27个DEGs主要富集在细胞间隙中,其涉及的生物学过程集中在细胞趋化活性和炎症反应,生物分子功能分析显示集中在趋化因子活性,G蛋白偶联受体活性和CXCR趋化因子受体结合,KEGG信号通路分析核心模块的DEGs主要参与趋化因子信号通路和神经信号传递信号通路。与平行对照的脑组织相比,这些基因的表达改变,显示了探究差异表达基因的相关生物学功能及信号通路对FCD的发病机制具有重要价值。
2.4 药物基因的相互作用 筛选出的5个核心基因进行药物-基因相互作用分析。我们发现多种药物靶向核心基因,具体(见表2)。
表1 DEGs的功能模块相关分析
表2 基因-药物分析结果
局灶性皮质发育不良是由于大脑皮质神经元细胞的增殖异常或者异性障碍引起,其结果常常会导致难治性癫痫的发生。对于FCD的治疗,外科手术被证实是较为有效的方法,有研究表明在FCD引起的难治性癫痫患者中,外科手术治疗后的癫痫缓解率可达到50%~80%[14]。然而对于FCD的诊断,目前的影像学相关检查并不能完全发现所有的FCD病灶,而且多数的FCD患者在头部MRI及其他功能性影像学检查并不能发现异常。因此识别局灶性皮质发育不良相关的生物标志物对于其疾病的诊断、治疗选择及预后具有重要作用,进而探讨FCD的发病机制并进行药物靶点的筛选。越来越多的研究报道FCD与基因突变相关,如PI3K-AKT3-TSC信号通路、mTOR信号通路及PTKs信号通路相关的基因[15]。在这项研究中,我们选择患者手术切除的大脑组织标本,通过生物信息学分析的方法,发现局灶性脑皮质发育不良的潜在致病基因,如C3、SAA1、ANXA1、CXCL2和CCL25,及其相关的现有靶向药物和参与FCD发病相关的信号通路。
我们发现的潜在的致病基因中,膜联蛋白A1(Annexin A1,ANXA1)能够促进肌动蛋白细胞骨架的重排,细胞极化和细胞迁移[16]。通过激活甲酰基肽受体促进粒细胞和单核细胞的趋化性以及通过增强由T细胞活化触发的信号级联反应,调节活化T细胞的分化和增殖来促进适应性免疫应答[16]。补体成分3(complement component 3,C3)在补体系统的激活中起核心作用,C3转化酶对其的加工是经典途径和替代途径中的中心反应。在慢性炎症中,C3充当嗜中性粒细胞的趋化因子,诱导平滑肌收缩,增加血管通透性,并导致组胺从肥大细胞和嗜碱性白细胞释放[17]。血清淀粉样蛋白A-1蛋白(Serum amyloid A-1 protein,SAA1)属于SAA家族,是主要的急性期蛋白。在正常血清中浓度较低,但在老年人和淀粉样变患者血清中浓度较高它是淀粉样蛋白A的循环前体,主要沉积在AA型淀粉样原纤维中[18]。C-X-C模体趋化因子 2(C-X-C motif chemokine ligand 2,CXCL2)是由活化的单核细胞和中性粒细胞产生的血液调节趋化因子,在炎症部位表达,在体外能够抑制造血祖细胞增殖[19]。C-C模体趋化因子配体25(C-C motif chemokine ligand 25,CCL25)可能参与T细胞的发育,对胸腺细胞、巨噬细胞、THP-1细胞和树突状细胞有趋化活性,但对外周血淋巴细胞和中性粒细胞无趋化活性,与非典型趋化因子受体ACKR4结合并介导β-arrestin(ARRB1/2)向ACKR4募集[20]。
基于上述的基因功能分析,我们发现这些基因与炎症过程和免疫应答密切相关。有许多的研究证实许多促炎细胞因子参与了癫痫的病理生理,特别是在局灶性皮质发育不良的患者中[21]。既往有研究在局灶性发育不良的患者中发现IL-17、TNF-α等炎性因子的表达上调,同时伴有小胶质细胞和星形胶质细胞的激活[22]。ANXA1广泛表达于许多组织中,包括白细胞、淋巴细胞、上皮细胞和内皮细胞。ANXA1存在于细胞内和细胞膜上,但也可以通过自分泌和旁分泌的方式分泌到循环中。有许多的文献报道补体受体在中枢神经系统中的表达,指出这些蛋白在中枢神经系统稳态和发育中潜在的作用。在中枢神经系统的几乎所有细胞类型(即神经元、小胶质细胞和星形胶质细胞)上都鉴定出了补体受体[23]。有研究表明补体相关蛋白在出生后大脑的神经元和胶质细胞中广泛表达,其级联反应在突触的发育重塑及突触回路的形成过程中起到了重要作用[24]。在中枢神经系统中,补体蛋白由神经元和神经胶质细胞局部合成,其中小胶质细胞和星形胶质细胞是中枢神经系统补体的主要产生者。此外,一种活化的C3片段的受体CR2(CD21),也在神经祖细胞中表达,并调节成年海马神经发生[25]。由神经胶质及其受体分泌的趋化因子参与大脑发育过程中的神经元迁移和细胞增殖,突触活性调节和神经内分泌功能的调节[26]。趋化因子可以直接影响神经元的兴奋性,有研究报道趋化因子CCL2、CCL3、CCL5和CX3CL1在癫痫中具有重要作用[27]。另外有研究报道CCL2改变小脑神经元的电生理特性和参与Ca2+信号传导通路,降低脊髓神经元的抑制性反应,并通过激活p38 MAP激酶途径在体外增强海马旁侧支通路的兴奋性突触后电流[28]。有文献报道在FCD患者中细胞因子/趋化因子及其受体的异常表达,并证实了多种炎症介质(IL1β、IL1Ra、IL6、IL10、CCL3、CCL4、TNFα和VEGF)在FCD患者中的异常表达[29]。因此我们认为这5个预测关键基因与FCD的发病机制具有密切联系。一方面,这些研究使我们有理由相信它们可以作为FCD的潜在靶点进行进一步的研究;另一方面,我们推测FCD是一种系统性疾病,是在大脑的一种局部表现。另外这些研究提示我们预测的靶向药物(大多为免疫炎症抑制剂)可能在治疗FCD中具有潜在的作用。到目前为止,尚未发现所有这些基因和药物在FCD的研究和应用中。虽然我们通过生物信息学分析识别5个基因和多个基因现有的靶向药物,但需要进行分子实验验证。更重要的是本文为我们提供探索FCD分子机制的线索。
我们通过应用一系列生物信息学方法对基因表达谱进行分析,筛选出5个潜在的基因标志物和多种现有靶向药物,这将为我们了解新的研究靶点和新的药物适应证提供依据。