多个GEO芯片联合分析阿尔茨海默病内嗅皮层的关键基因

2021-03-19 08:35邵康梅蔡宏斌魏海萍陈圆圆葛朝明
生命科学研究 2021年1期
关键词:皮层海马关键

邵康梅,张 凡,蔡宏斌,魏海萍,陈圆圆,葛朝明*

(1.兰州大学第二医院神经内科,中国甘肃兰州730030;2.甘肃省消化系肿瘤重点实验室,中国甘肃兰州730030)

阿尔茨海默病(Alzheimer’s disease,AD)是一种进行性神经退行性疾病,其发病机制可归因于大脑皮质和边缘区β淀粉样蛋白(amyloid β-protien,Aβ)斑块的胞外聚集和过度磷酸化的tau蛋白构成的细胞内神经原纤维缠结,其特点是记忆丧失和进行性神经认知功能障碍[1]。AD是老年期最常见的痴呆类型,占老年期痴呆的60%~80%[2]。目前,AD的治疗无特效药物,寻找AD早期的治疗靶点对疾病的治疗至关重要。研究证实内嗅皮层是AD进展中最早发生病变的部位[3~4]。

内嗅皮层位于颞叶内侧,参与最初的情景编码,在记忆形成过程中起着不可或缺的作用,而且是海马体和大脑皮层之间的关键通道[5]。AD中tau蛋白相关神经原纤维缠结病理遵循一定的顺序,首先影响内嗅皮层,然后发展到边缘系统和联合皮层[5]。因此,在AD早期针对内嗅皮层寻找其潜在治疗靶点,对AD的治疗具有重要的临床意义。

本研究收集了GEO(Gene Expression Omnibus)数据库中AD的内嗅皮层表达谱数据集GSE-48350[6]、GSE26972[7]和 GSE118553[8]。通过批次矫正对多组数据联合分析,筛选出差异表达基因(differentially expressed genes,DEGs),并对其进行GO(Gene Ontology)分析、KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析以及蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络分析,结果提示血管细胞黏附分子1(vascular cell adhesion molecule 1,VCAM1)基因、CD44、原癌基因FOS和富含半胱氨酸的酸性分泌蛋白(secreted protein acidic and rich in cysteine,SPARC)基因在AD发生发展中发挥关键作用。VCAM1属于黏附分子免疫球蛋白超家族,在衰老中与记忆和认知密切相关[9~10]。CD44是一种跨膜糖蛋白,参与透明质酸代谢、激活淋巴细胞和释放细胞因子过程,并且参与海马记忆编码、存储或检索过程[11~12]。c-Fos蛋白由FOS基因转录后翻译产生,其参与了记忆的形成[13]。SPARC是调节细胞与其周围细胞外基质相互作用的细胞分子,其异常表达与脑组织炎症的发生相关[14]。本研究阐明了AD在内嗅皮层部位的发病机制并筛选出了AD治疗的潜在靶点,为AD的防治提供了新的思路与线索。

1 材料与方法

1.1 资料来源

本文使用的数据来自于美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)公共数据平台的GEO数据库(http://www.ncbi.nlm.nih.gov/geo)。检索关键词为“entorhinal cortex”,检索条件为“Homo sapiens”和“expression profiling by array”,共检索到13个数据集,排除缺乏正常对照组、晚发性AD、非AD研究的数据集,最终纳入 GSE48350、GSE26972、GSE118553 数据集进行下一步分析。

1.2 数据预处理和差异基因分析

在GEO数据库中下载GSE48350、GSE26972、GSE118553矩阵数据[6~8]。运用R软件处理芯片数据,limma包用于数据的标准化以及内嗅皮层和正常对照组的基因差异分析[15];利用K近邻法(K-nearest neighbor,KNN)填充缺失值,采用 impute包进行芯片数据缺失值的处理[16]。运用R软件中的sva包和limma包进行批次矫正[17],消除数据集间存在的异质性。以|log2FC|>1(FC:fold change)和P<0.05为筛选条件筛选DEGs。

1.3 GO富集与KEGG通路富集分析

为了在功能层面上分析DEGs,利用Cytoscape软件中的ClueGO插件对其进行GO/KEGG富集分析及数据可视化[18],得到DEGs富集的生物过程及通路,筛选标准为P<0.05。

1.4 PPI网络构建及关键基因分析

本研究通过STRING数据库(http://www.string-db.org/),以互作评分 combination score>0.4为条件构建PPI网络[19],使用Cytoscape软件对DEGs所编码蛋白质的相互作用进行可视化展示[20]。其中,cytoHubba插件用于分析生物网络中的关键基因[21],它包括最大集团中心度(maximal clique centrality,MCC)、最大邻域组件密度(density of maximum neighborhood component,DMNC)、度(degree)、边缘渗透组件(edge percolated component,EPC)、中介中心性(betweenness)、离心率(eccentricity)等拓扑分析方法[19]。为了提高预测结果的可靠性,运用不同的算法探索本研究的关键基因。

1.5 关键基因在脑组织不同部位的表达分析

结合GSE48350和GSE118553数据集验证关键基因在内嗅皮层、海马、中央后回、额上回、额叶皮层、颞叶皮层和小脑组织的表达水平是否有差异,并分析GSE118553数据集中无症状AD(asymptomatic Alzheimer’s disease,AsymAD)和 AD 患者内嗅皮层数据。其中,AsymAD患者为认知功能正常但有明显AD神经病变的个体[8]。比较Asym-AD和AD患者的基因表达差异可能有助于阐明AD早期进展的特定生物学机制。

1.6 数据处理

所有数据录入SPSS 23.0软件进行分析,对关键基因在脑组织不同部位的表达分析采用Mann-Whitney U检验,以P<0.05为差异具有统计学意义。

2 结果

2.1 AD内嗅皮层DEGs的筛选

从GEO数据库中下载的3个AD相关的内嗅皮层芯片数据集的具体信息见表1。对3个数据集分别进行DEGs筛选,结果显示:GSE48350中有43个DEGs,包括37个上调基因和6个下调基因;GSE26972中有266个DEGs,包括127个上调基因和139个下调基因;GSE118553中有93个DEGs,包括78个上调基因和15个下调基因。对3个数据集的DEGs绘制韦恩图,结果提示三者间未见共同DEGs,说明这3个数据集之间存在异质性,可能是由于发表时间不同、芯片检测水平不一致,故需对 GSE48350、GSE26972、GSE-118553数据集的数据进行批次矫正。对合并的数据进行标准化处理后,结果显示有17个DEGs,且均为上调基因(图1)。

表1 AD内嗅皮层各数据集的基本情况Table 1 Basic information of data sets of the entorhinal cortex with AD

图1 AD内嗅皮层DEGs的分布热图红色代表表达水平高,绿色代表表达水平低。Fig.1 Heat map of DEGs in the entorhinal cortex with ADRed means higher expression,and green means lower expression.

2.2 DEGs的富集分析

对17个DEGs进行GO富集和KEGG通路富集在线分析。GO富集分析提示,DEGs主要富集在白细胞-细胞间黏附的正调控、细胞外基质组织、皮质类固醇反应等11个生物过程(表2,图2)。KEGG通路富集分析结果显示,DEGs在卟啉和叶绿素代谢信号通路上显著富集。

表2 DEGs的GO富集分析Table 2 GO analysis of DEGs

图2 DEGs的GO富集分析圆形代表富集到的条目,连线代表两个GO富集条目之间存在相同的DEGs,图形越大表明富集到的基因数目越多。Fig.2 GO analysis of DEGsNodes represent GO terms.Lines indicate that overlapping DEGs exist between two GO terms.Larger nodes indicate more enriched DEGs.

2.3 DEGs所编码蛋白质的PPI网络分析

对分析获得的DEGs进行PPI网络分析,结果如图3所示,包含13个节点和31条相互作用关系。进一步基于cytoHubba插件中的多种计算方法,得到互作网络中的关键基因为VCAM1、CD44、FOS 和 SPARC(表 3)。

表3 基于cytoHubba中各算法筛选的关键基因Table 3 Hub genes screened based on cytoHubba algorithm

图3 DEGs的PPI网络图中颜色由红到黄到蓝表明相应基因得分由高到低。Fig.3 PPI network of DEGsColors ranging from red to yellow to blue indicate gene scores from high to low.

2.4 关键基因在内嗅皮层及海马中显著高表达

运用GSE48350数据集验证VCAM1、CD44、FOS和SPARC基因在内嗅皮层、海马、中央后回和额上回的表达是否有差异。研究发现,VCAM1在内嗅皮层的表达水平显著高于中央后回和额上回(P<0.01,图 4A);CD44和 SPARC 在海马的表达水平显著高于内嗅皮层(P<0.05),但在内嗅皮层的表达水平显著高于中央后回和额上回(P<0.01,图4B和图4D);FOS在海马中的表达水平显著高于中央后回和额上回(P<0.01),而海马中的表达水平高于内嗅皮层,但差异无统计学意义(P>0.05,图4C)。结合GSE118553数据集再次探究关键基因在内嗅皮层、额叶皮层、颞叶皮层和小脑组织中的表达情况。我们发现VCAM1、CD44、FOS和SPARC基因在内嗅皮层的表达水平显著高于其他部位(P<0.01,图 5)。

图4 关键基因在内嗅皮层、海马、中央后回和额上回组织中的表达水平Fig.4 The expression levels of hub genes in the entorhinal cortex,hippocampus,postcentral gyrus and superior frontal gyrus*:P<0.05;**:P<0.01.

图5 关键基因在颞叶皮层、小脑、额叶皮层和内嗅皮层组织中的表达水平Fig.5 The expression levels of hub genes in the temporal cortex,cerebellum,frontal cortex and entorhinal cortex**:P<0.01.

2.5 关键基因在AD中的表达显著高于AsymAD

AsymAD是AD的前驱阶段,我们结合GSE-118553数据集对AsymAD和AD患者内嗅皮层中关键基因的表达做进一步分析。结果显示,与Asym-AD患者相比,VCAM1、CD44、FOS和 SPARC 基因在AD患者内嗅皮层中显著高表达(P<0.01,图6)。

图6 关键基因在AD和AsymAD患者内嗅皮层中的表达水平Fig.6 The expression levels of hub genes in the entorhinal cortex between AD and asymptomatic patients**:P<0.01.

3 讨论

近年来大量研究者为探究AD发生发展的潜在机制和筛选治疗靶点,构建了一系列生物大数据集。GSE48350数据集包含来自正常人(20~99岁)和AD患者海马、内嗅皮层、额叶上回、中央后回4个脑区的微阵列数据[6]。通过对该数据的分析,Berchtold等[22]发现在衰老和AD进展中突触相关基因的表达逐渐下调。此外,通过构建正常老年人、AsymAD和AD患者的内嗅皮层、额叶皮层、颞叶皮层和小脑组织微阵列表达谱芯片(GSE118553),Patel等[8]发现AsymAD和AD患者的能量代谢与谷氨酸-谷氨酰胺循环失调有关。Berson等[7]通过对来源于AD患者内嗅皮层的芯片数据(GSE26972)展开分析发现,核内不均一核糖核蛋白(heterogeneous nuclear ribonucleoprotein,hnRNP)A/B 剪接因子在AD患者内嗅皮层中选择性缺失,而且敲除hnRNP A/B可导致初级神经元选择性剪接损伤和树突损失。

为探究内嗅皮层在AD发生发展过程中的机制,本研究对GEO数据库中3个AD患者内嗅皮层数据集(GSE48350、GSE26972、GSE118553)进行了整合和差异基因筛选,并针对筛选出的差异基因进行了GO/KEGG富集分析和PPI分析,结果提示 VCAM1、CD44、FOS和 SPARC参与多条信号通路并在AD中发挥关键作用。VCAM1是黏附分子免疫球蛋白超家族的成员,于1989年首次被鉴定为位于内皮细胞表面的一种90 kD糖蛋白,其功能主要是介导单核细胞和淋巴细胞对内皮细胞的黏附[9,23]。多项研究证实,VCAM1在AD患者血液、脑脊液标本中异常高表达[24~27]。最新研究发现,在年老小鼠海马区的脑内皮细胞中VCAM1高表达,通过抑制VCAM1基因或使用抗VCAM1抗体可逆转年老小鼠脑内小胶质细胞活性和认知功能障碍等衰老方面的变化[10]。另有研究报道,VCAM1水平与短期记忆和绘画得分呈显著负相关,即血浆中VCAM1表达越高,AD患者记忆力及视空间功能越差[28]。焦谷氨酸-Aβ是AD中Aβ斑块的主要成分,在谷氨酰基环化酶催化下,截短的Aβ肽发生吡咯酰化反应,产生焦谷氨酸-Aβ,增强其聚集倾向[29]。相关研究报道,VCAM1与AD患者谷氨酰基环化酶活性密切相关,是抑制谷氨酰基环化酶的潜在药效学指标[30]。目前,探究VCAM1在AD内嗅皮层部位的相关研究很少报道,仅Pang等[26]研究提示VCAM1在内嗅皮层及海马中高表达,这与我们的结果(图4A)一致。此外,我们首次发现VCAM1在AD患者内嗅皮层中的表达水平显著高于AsymAD患者(图6A),提示在AD早期VCAM1在内嗅皮层部位出现表达异常。

CD44是一种跨膜糖蛋白,正常组织中CD44在调节透明质酸代谢、激活淋巴细胞和释放细胞因子方面起着至关重要的作用[11]。Uberti等[31]证实AD患者淋巴细胞CD44基因的表达水平较正常人升高。小胶质细胞是中枢神经系统的天然免疫细胞,在AD小鼠早期,小胶质细胞CD44的表达升高[32]。另一项研究发现,CD44S和CD44剪接变异体(CD44V6和CD44V10)在AD患者的神经母细胞瘤细胞和原代神经元中被Aβ肽诱导表达,其中CD44V10特异性干扰小RNA(small interfering RNA,siRNA)和抗CD44V10抗体都能保护神经细胞使其免受Aβ诱导的毒性[33]。目前,关于CD44在AD患者内嗅皮层部位的相关研究未见报道。本研究发现CD44在AD内嗅皮层部位高表达,且在AD患者内嗅皮层中的表达水平高于AsymAD患者。其与VCAM1共同参与白细胞-细胞间黏附的正调控通路和细胞外基质组织通路。研究报道,CD44作为糖胺多糖透明质酸的受体,参与海马记忆编码、存储或检索过程[12]。我们发现,CD44在内嗅皮层及海马显著富集,且在海马的表达水平显著高于内嗅皮层(图4B)。因此,我们推断CD44在内嗅皮层和海马记忆形成及储存中发挥关键作用。

FOS基因编码产生c-Fos蛋白。研究证实,c-Fos蛋白是神经可塑性的关键蛋白质,参与了记忆的形成[13,34]。有研究表明,海马神经元的突触可塑性变化在老年痴呆的病理过程中占据重要的地位,可能是AD学习和记忆障碍的神经生物学基础[35]。此外,FOS还可通过调节肠道微生物-GLP-1(glucagon-like peptide-1)/GLP-1R(glucagon-like peptide-1 receptor)通路,发挥良好的抗AD作用[36]。通过对AD患者外周血单个核细胞的基因表达谱进行测定,Leandro等[37]不仅发现炎症和免疫相关信号通路显著上调,而且发现FOS可作为AD患者外周血的潜在生物标志物。为进一步分析AD中不同细胞亚型的特异性调节机制和各细胞亚群的功能差异,Grubman等[38]构建了AD内嗅皮层的单细胞图谱,其研究证实FOS在AD患者的星形胶质细胞亚群中显著高表达,而且星形胶质细胞也是AD早期的生物标志物并参与AD疾病进展[39]。本研究发现FOS在海马及内嗅皮层组织中显著富集(图4C),且FOS在AD患者内嗅皮层中的表达水平显著高于AsymAD患者(图6C)。

SPARC是调节细胞与其周围细胞外基质相互作用的细胞分子,同时参与细胞外基质的组装、沉积和生长因子信号[40]。针对AD患者脑脊液的蛋白质组学分析发现,SPARC表达升高,且可能具有预测早期AD发生的作用[41]。Strunz等[14]通过分析AD患者颞皮质发现,SPARC显著高表达,并与Aβ蛋白相结合,参与脑组织炎症的发生。本研究发现,SPARC在AD患者内嗅皮层和海马组织中显著高表达,且其在海马的表达水平显著高于内嗅皮层(图4D)。同样,SPARC在AD患者内嗅皮层中的表达水平显著高于AsymAD患者(图6D)。

综上所述,本研究运用多芯片联合分析,发现VCAM1、FOS、CD44和SPARC在AD患者内嗅皮层部位发挥重要作用。此外,本研究结合相关数据再次验证了关键基因在脑组织不同部位及AD患者与AsymAD患者之间的表达水平具有差异性。研究结果为阐明AD疾病发生发展的潜在机制提供了新的思路,也为筛选AD的治疗药物提供了新的靶点。但该结论仍需要进一步的临床大样本验证及机制探究。

猜你喜欢
皮层海马关键
硝酸甘油,用对是关键
新形势下深化改革开放的关键一招
海马
高考考好是关键
复发缓解型多发性硬化患者扣带皮层结构和灌注变化
急性皮层脑梗死的MRI表现及其对川芎嗪注射液用药指征的指导作用研究
海马
基于复杂网络的磁刺激内关穴脑皮层功能连接分析
生意无大小,关键是怎么做?
生意无大小,关键是怎么做?