基于表达谱芯片数据的阿尔茨海默病易感基因的生物信息学数据挖掘

2016-12-21 07:06刘静张蕾赵志刚陈瑞玲刘腾余克富朱斌
东南大学学报(医学版) 2016年5期
关键词:差异基因信息学阿尔茨海默

刘静,张蕾,赵志刚,陈瑞玲,刘腾,余克富,朱斌

(1.首都医科大学 附属北京天坛医院,北京 100050;2.首都医科大学 附属北京世纪坛医院,北京 100038)



·论 著·

基于表达谱芯片数据的阿尔茨海默病易感基因的生物信息学数据挖掘

刘静1,张蕾2,赵志刚1,陈瑞玲1,刘腾1,余克富1,朱斌1

(1.首都医科大学 附属北京天坛医院,北京 100050;2.首都医科大学 附属北京世纪坛医院,北京 100038)

目的:采用生物信息学对阿尔茨海默病(AD)表达谱芯片结果进行数据挖掘,寻找影响AD发病的差异表达基因,为AD的前期有效预防提供一定的基础。方法:从GEO数据库中下载符合条件的表达谱芯片研究结果,通过Expression Console对数据进行标准化处理后,导入Transcriptome Analysis Console进行数据分析比较。将得到的数据导入在线分析工具DAVID、ToppGene、STRING中对差异表达基因进行筛选,同时进行GO分析及Pathway分析。结果:本次研究共纳入3项以人脑海马组织为样本的独立实验。24个差异表达基因中上调的基因共有18个,下调基因6个。NEFM和SV2B基因与神经突触信号传导关系密切,与AD的发病有一定的联系。结论:AD的发病可能与NEFM和SV2B基因密切相关,尚需具体实验进行更深一步研究。

阿尔茨海默病;生物信息;表达谱芯片;基因

阿尔茨海默病(Alzheimer’s disease,AD)是严重影响老年人生活质量的危险疾病之一[1-2]。AD的发病机制很复杂,呈现多样性和不确定性,临床诊断的AD患者多已处于中晚期,现有治疗均难以取得满意疗效[3]。自1906年11月德国病理学和精神病学医师Alois Alzheimer首次报道1例老年性痴呆病例起,已有100多年的时间,在此期间各国学者在多个领域从不同角度开展对AD的研究,试图揭示其发生发展的病理机制,但因病因不明和早期诊断困难,再加上缺乏有效的治疗药物,给诊断、预防和治疗带来了难以克服的困难[4]。本研究拟通过对美国国家生物信息中心(NCBI)数据库中的表达谱芯片原始数据进行数据挖掘,从而筛选到AD发病的易感基因,为AD的早期预防和诊断提供可参考的标志物。

1 资料与方法

1.1 原始研究资料

数据来自所有采用美国Affymetrix公司表达谱芯片且其比较了患病和未患病患者的原始芯片研究结果(CEL文件)。具体方法如下:通过NCBI的GEO数据库(http://www.ncbi.nlm.nih.gov/pubmed/),以“Alzheimer”“Hippocampus”“Homo sapiens”为检索词,查找所有符合条件的研究结果。

1.2 数据处理及差异基因分析

将3项研究的结果分别导入Expression Console(Affymetrix)软件,采用RMA法和MAS 5对数据进行归一化处理,同时对芯片探针信号强度及芯片质量进行分析。完成上述分析后,将所得到3项CHP文件导入到Transcriptome Analysis Console(TAC)中,基因表达数据缺失数不超过50%,对通过过滤标准的基因进行非配对样本t检验。根据设定的筛选标准:fold change<-1.5或者fold change>1.5,且P值小于0.05,筛选得到每个数据集的差异基因。利用在线分析网站(http://bioinfogp.cnb.csic.es/tools/venny/index.html)制作Venn图得到3张芯片的共有差异基因。

1.3 差异基因的GO分析和通路分析

将所筛选到的共有差异基因分别上传至the Database for Annotation,Visualization and Integrated Discovery(DAVID)生物信息数据库中,对这些差异基因分别进行生物学过程、分子功能、生物学通路分析。利用ToppGene(http://topp.gene.cchmc.org/)在线工具对差异表达基因进行共表达分析。

1.4 差异基因编码蛋白的相互作用分析

将得到的差异基因上传至蛋白质相互作用关系数据库(Functional Protein Association Networks,STRING),通过STRINQ分析工具,分析其所编码的蛋白之间的相互作用图,找出处在关键节点的蛋白质。

2 结 果

2.1 纳入分析的基因芯片数据一般情况

通过横向比较筛选,我们共得到3项研究符合本此研究条件的研究(表1)。3项研究均采用AD患者和非AD患者进行比较,其中第1个研究共纳入17例样本(AD患者7例,非AD患者10例);第2个研究共纳入20例样本(AD患者10例,非AD患者10例);第3个研究共纳入24例样本(AD患者15例,非AD患者9例)。

表1 前期研究所纳入的3项研究

Tab 1 The studies which included in the research

研究研究者取样组织检测平台芯片类型芯片型号第1个研究YusakuNakabeppuHippocampusHomosapiensGPL6244AffymetrixHumanGene1.0STArrayGSE36980第2个研究WinnieLiangHippocampusHomosapiensGPL570AffymetrixHumanGenomeU133Plus2.0ArrayGSE4757第3个研究EricMBlalockHippocampusHomosapiensGPL96AffymetrixHumanGenomeU133AArrayGSE1297

2.2 差异基因筛选

通过分析,我们获得3项独立研究中均出现明显表达的差异基因共24个(图1、表2)。其中上调的基因共有18个,下调基因6个。

图1 所纳入的3项独立研究筛选得到的差异基因

Fig 1 The Venn diagram of the differently expressed genes

2.3 差异基因的GO富集分析和通路分析

差异基因所涉及到的基因功能主要与神经细胞、神经突触及细胞骨架相关的功能相关。在本研究中的24个基因中与神经突触功能相关的基因约有9个基因,分别为ATP2B1、SLC12A5、NEFM、SLC17A7、GABBR2、WASF1、SV2B、NEEFM及GABBR2。通过ToppGene在线工具进一步的分析,我们最终确定了NEFM和SV2B为神经信号转到通路上的关键基因。见图2、表3。

2.4 NEFM和SV2B蛋白相互作用图

通过STRING 10在线工具对最终筛选的差异基因进行蛋白质相互作用网络分析,从图3可以看出NEFM和SV2B蛋白与其他蛋白均存在≥5的相互作用关系,为此蛋白质相互作用网络的中心节点,删除这些节点蛋白后,网络结构的稳定性降低。

表2 24个差异基因及其所在研究中的差异倍数变化

Tab 2 The fold changes of the 24 differently expressed genes

差异基因差异倍数(研究1)差异倍数(研究2)差异倍数(研究3)HOPX1.741.721.55MAN1A11.761.851.74ENC11.811.811.95SLC17A71.561.761.61GABBR21.571.81.67CAP21.521.811.59OXCT11.591.811.61SV2B2.011.521.81WIF12.661.543.98ANGPT1-1.51-1.67-1.66AEBP1-1.87-1.87-2.63RGS42.431.512.16LMO41.562.221.82WASF11.711.631.74SCN3B1.781.651.79SLC12A51.581.561.6MYO161.541.672.27NEFM1.681.522.11APLNR-1.95-2.33-3.01GPR221.623.612.43AHNAK-1.53-4.83-1.51FLNC-1.81-1.54-1.75ATP2B11.521.641.56CP-1.73-1.95-1.83

图2 GO分析网络图

Fig 2 The network diagram of GO analysis

3 讨 论

阿尔茨海默病的发病机制目前仍不明确,其发病是多基因、多途径、多步骤、多阶段相互作用和相互影响的复杂过程。然而由于阿尔茨海默病患者的脑组织不易取得,这也严重阻碍了对该病的治疗进展。为了更好地研究AD患者的发病机制,最直接的办法就是以患病的组织为标本进行研究,然而这些标本的取得往往存在非常大的难度,因而也限制了对AD发病机制的深入研究。本次研究我们利用国外珍贵海马组织芯片数据,一方面解决了课题研究过程中标本获得困难的不足,另一方面通过对多项研究数据的横向比较也可以更加行之有效地筛选出特异性的差异基因。

表3 24个差异基因GO分析

Tab 3 The GO analysis of the 24 genes

随着基因芯片技术的不断成熟,为高通量筛选疾病易感基因带来了新的曙光。通过生物信息学进行信息挖掘,我们能够多层次了解基因表达状况,对基因功能富集分析、通路富集分析及网络调控分析的探讨有重要作用,因此该技术已经广泛应用于疾病差异基因的筛选、疾病治疗药物的筛选以及疾病应用基因诊断和治疗等方面[5]。通过生物信息学对阿尔茨海默病进行信息挖掘,能够深层次了解相关基因表达状况,对于疾病差异基因的筛选、治疗药物筛选以及早期标志物的发现,具有重大的现实意义。

图3 NEFM和SV2B蛋白相互作用图

Fig 3 The interaction of NEFM and SV2B

本研究共筛选到了与阿尔茨海默病发病相关的基因24个,涉及与神经生长、突触连接、离子转运、G蛋白偶联等,其中每一项研究中fold change≥2或fold change≤-2的差异基因主要有SV2B、WIF1、AEBP1、RGS4、LMO4、MYO16、NEFM、APLNR、GPR22及AHNAK。同时,通过对GO分析得到的基因功能中与神经细胞相关的基因(dendrite membrane,synapse,neuron projection membrane,neuron part,synaptic vesicle membrane,neurofibrillary tangle,neuron projection)进行筛选,得到ATP2B1、SLC12A5、NEFM、SLC17A7、GABBR2、WASF1、SV2B、NEEFM、GABBR2等9个基因。将2次基因筛选得到的结果进行较分析,发现NEFM和SV2B在所纳入的3项研究中其FDR值均≥2,且其基因功能均与神经细胞的生长发育密切相关。其中NEFM的基因功能与神经元信息传递、神经原纤维缠结关系紧密,而SV2B(突触囊泡蛋白2B)与神经细胞信号转到关系密切。由此我们推测在AD患者中NEFM和SV2B基因的突变可能与阿尔茨海默病的发展密切相关,但是其具体的作用机制目前还不清楚,文献中也未见详细报道,可以作为潜在的治疗靶点,但尚需实验进行证实。

[1] LLORET A,FUCHSBERGER T,GIRALDO E,et al.Molecular mechanisms linking amyloid beta toxicity and Tau hyperphosphorylation in Alzheimer’s Disease[J].Free Radic Biol Med,2015,83:186-191.

[2] MAYEUX R.Early Alzheimer’s disease[J].N Engl J Med,2010,362(23):2194-201.

[3] 高天丽,陈克平.阿尔茨海默病的常见诊断方法[J].现代医学,2016,44(3):415-419.

[4] KUMAR A,SINGH A,EKAVAL I.A review on Alzheimer’s disease pathophysiology and its management:an update[J].Pharmacol Rep,2015,67(2):195-203.

[5] 李铁求,杨宇,李琦,等.前列腺癌转移相关基因的生物信息学分析[J].实用医学杂志,2013,29(21):3481-3485.

Bioinformatics data mining of Alzheimer’s disease susceptible genes based on the data of expression profile chip

LIU Jing1,ZHANG Lei2,ZHAO Zhi-gang1,CHEN Rui-ling1,LIU Teng1,YU Ke-fu1,ZHU Bin1

(1.BeijingTiantanHospital,CapitalMedicalUniversity,Beijing100050,China;2.BeijingShijitanHospital,CapitalMedicalUniversity,Beijing100038,China)

Objective: To analyze the expression information of three independent researches to explore differential genes in the progress of alzheimer disease(AD)and providing a basis for the AD prevention.Methods: Raw data were downloaded from NCBI databases and imported to “Expression Console” to standardize the data and then the results were output to “Transcriptome Analysis Console” for data analysis.After that all different genes were imported to online analysis tools DAVID,ToppGene,STRING for further analyze.Results: The studies included in our research all used human brain hippocampus sample.Through further analysis,24 differentially expressed genes were analyzed,among which 18 genes were increased and 6 were down-regulated.Through further analysis,two genesNEFM and SV2B were found to be closely related to synapses signal transduction.Conclusion: The pathogenesis of AD may be closely related with NEFM and SV2B genes.Nevertheless,specific experiment will be needed to verify the geness.

Alzheimer’s disease; biological information; expression profile chip; gene

2016-05-18

2016-07-06

国家自然科学基金青年基金资助项目(81402814)

刘静(1975-),女,北京人,主管药师。E-mail:liujing1366@sina.cn

朱斌 E-mail:zbtcm@163.com

刘静,张蕾,赵志刚,等.基于表达谱芯片数据的阿尔茨海默病易感基因的生物信息学数据挖掘[J].东南大学学报:医学版,2016,35(5):653-657.

R749.16; Q7

A

1671-6264(2016)05-0653-05

10.3969/j.issn.1671-6264.2016.05.002

猜你喜欢
差异基因信息学阿尔茨海默
阿尔茨海默病的预防(下)
阿尔茨海默病的预防(上)
鸡NRF1基因启动子区生物信息学分析
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
初论博物馆信息学的形成
睡眠不当会增加阿尔茨海默风险
紫檀芪处理对酿酒酵母基因组表达变化的影响
CH25H与阿尔茨海默病
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
SSH技术在丝状真菌功能基因筛选中的应用