生物信息学分析影响胶质母细胞瘤生物学行为的关键基因

2020-06-01 00:17秦至臻赵水强封耀辉邱险峻杨书芹王建祯
武警医学 2020年4期
关键词:差异基因脑组织通路

何 心,秦至臻,李 鑫,赵水强,程 诚,王 震,封耀辉,邱险峻,杨书芹,王建祯

胶质瘤是中枢神经系统常见的恶性肿瘤,占颅内恶性肿瘤的30%~50%。其中胶质母细胞瘤(glioblastoma,GBM)的致残率和死亡率最高。GBM呈高度的侵袭性生长,手术难以完全切除,术后易复发。对GBM发生、发展机制的研究仍是医学界的一个重要课题。高通量基因芯片和测序技术的发展,为研究GBM的基因表达谱、发现GBM组织中基因表达与正常脑组织的差异、寻找关键基因提供了一种方法。许多学者已经应用生物信息学的方法研究了一些与GBM发生、发展相关基因的特征,并对探索GBM患者的治疗方法和改善预后具有一定的指导作用[1-3]。本研究利用生物信息学的方法,通过对GBM基因表达谱芯片数据的整理,筛选出与GBM相关的关键(HUB)基因,以期获得更多有关GBM发生、发展的生物学信息及相关分子机制,为GBM的基础研究提供新的思路。

1 材料与方法

1.1 材料 利用美国国立生物技术信息中心(NCBI)平台下的基因表达综合数据库(gene expression omnibus,GEO),检索含有人源GBM样本的基因表达谱数据芯片,选取含有GBM组织学标本和正常脑组织对照研究的芯片数据集:GSE7696、GSE19728、GSE4290、GSE50161作为研究对象。芯片类型为Affymetrix Human Genome U133 Plus 2.0 Array,纳入研究芯片共包含 GBM组织194例,正常脑组织44例。

1.2 差异表达基因筛选 下载GSE7696、GSE19728、GSE4290、GSE50161研究芯片数据RAW数据集文件,每组研究数据应用R语言bioconductor包完成数据的预处理,所有研究芯片归一化方法统一采用Robust Multi-Array Average(RMA)方法,最后获得每组研究对象的基因表达矩阵。随后应用limma包计算每组数据集中GBM和正常脑组织的基因表达差异,差异基因的筛选标准为Pvalue<0.01,|log FC|>2。应用affy包将基因探针名称转化为标准基因名称。得到4组数据集中各自的差异基因后,取4组差异基因的交集作为最终差异表达基因进行后续研究。

1.3 基因功能富集和注释 筛选出最终差异表达基因后,将这些基因通过 DAVID数据库进行基因注释,注释内容包括分子功能、细胞学组分、生物学过程,注释结果选择标准为P<0.05。并利用KEGG(Kyoto Encyclopedia of Genes and Genomes)信号通路数据库进行信号通路的富集,寻找差异表达基因所富集的关键信号通路,筛选标准为P<0.05。

1.4 差异表达基因的相互作用分析 通过 STRING 10.5 数据库,构建GBM差异表达基因蛋白质相互作用 (protein protein interaction, PPI) 网络,并应用 Cytoscape 3.6.1 软件进行可视化分析。使用 Cyto Hubba 插件应用Betweenness、 Closeness、DEGREE、EcCentricity、MCC、MNC、Radiality和Stress共8种算法计算HUB基因。取每种算法中前50个基因,将各算法得到的基因取交集筛选出最终HUB基因。

1.5 差异表达基因的预后价值分析 利用TCGA在线分析数据库UALCAN,分析TCGA数据库中163例GBM患者在差异表达基因表达水平影响下的总生存期(overall survival,OS)的差异情况。在TCGA数据库中将本研究中得到的基因按照基因表达水平的25%分位值分为高表达组和低表达组,应用Kaplan-Meier 生存分析方法,逐个基因分析其对GBM患者OS的影响,计算危险比(HR)及其 95%置信区间,绘制生存曲线,P<0.05视为存在生存期差异。

2 结 果

2.1 差异基因表达分析 应用R软件对各组芯片数据进行基因表达差异分析后,GSE19728数据集得到差异表达基因1458个、GSE4290数据集得到差异表达基因1628个、GSE50161数据集得到差异表达基因2417个,GSE7696数据集得到差异表达基因1489个,各组基因数据集的临床信息见表1。各组数据集差异表达基因取交集,最终得到差异表达基因628个,其中上调基因87个,下调基因541个(图1)。

图1 各组数据集中GBM芯片差异表达基因韦恩图

包含样本数量(例)胶质母细胞瘤脑组织对照性别(男/女)胶质母细胞瘤脑组织对照年龄(岁)胶质母细胞瘤脑组织对照GSE769679452/473/156.26±8.8332.2±4.31GSE19728543/22/260.28±10.544.7±6.83GSE4290762333/4315/861.43±5.8155.73±6.83GSE50161341314/209/464.88±7.2231.25±8.37合计19444102/9229/1560.71±7.3240.97±6.57

2.2 GO 富集分析及KEGG富集分析 通过对628个差异表达基因 GO 富集分析发现,差异基因分子功能(molecular function,MF)显著富集在syntaxin-1绑定、离子通道绑定、钙离子结合等方面。细胞学组分(cellular components,CC)主要为突触后膜、突触、细胞连接等部位。生物学过程(biological process,BP)主要富集在神经递质分泌、胞外分泌的监管、化学突触传递等方面。进一步对差异表达基因进行 KEGG 通路富集分析发现,差异表达基因主要富集于GABA信号通路、吗啡相关信号通路、逆神经信号通路(图2)。

图2 差异基因表达GO 富集分析及KEGG富集分析

2.3 蛋白质相互作用网络的构建和HUB基因分析 去除游离于网络的蛋白影响后,得到了由510个点,3157 条边构成的PPI网络。应用 Cyto Hubba 插件分析最终得到了SYNPR、DNM1、RBFOX1、OPCML、GRM5、SYT1、KCNJ9、GABRD、CA10、SLC17A7、PVALB、NEUROD6、GABRB2、CHRM1、SNAP91、SYT4、KCNA1、SNCB和SYN2共19个HUB基因。KEGG注释显示HUB基因富集的主要信号通路集中在逆行神经的信号通路、突触囊泡循环通路及GABA相关通路等(表3)。

表3 HUB基因参与的信号通路富集分析

2.4 HUB基因的预后价值分析 应用TCGA在线分析工具分析163例GBM患者的预后数据和基因表达数据。在得到的19个HUB基因中筛选出能够显著影响患者OS的基因。结果显示在19个HUB基因中,仅GABRD 的低表达能够显著延长GBM患者 OS(P<0.05,图4)。

图4 两组患者生存曲线

3 讨 论

恶性肿瘤与正常组织中基因的异常表达与调控,对肿瘤的发生和发展有重要的意义。将多组恶性肿瘤中的差异表达基因进行比较,寻找共同存在的差异表达基因,是基因数据挖掘中寻找差异表达基因的经典方法。许多差异基因可以作为肿瘤特有的标志,以便于临床上对恶性肿瘤的识别与诊断[4, 5]。GBM患者生存期短,治疗方法和药物有限,病情发生和发展一直是颅内肿瘤的研究热点[6],2016年世界卫生组织已经将胶质瘤分子病理正式列入胶质瘤的病理诊断[7]。对GBM组织和正常脑组织差异表达基因的研究有助于在临床上对GBM病理进行精确定性、对患者预后进行判断和对化疗药物敏感性进行初步的评估[8-10]。许多学者应用差异基因比较的方法,寻找到了影响GBM患者预后的相关基因[1, 3, 4]。但由于他们在各自的研究中纳入的研究数据集不同,各数据集中芯片平台存在差异及对芯片数据的归一化处理方法不同,所得到的结果是存在差异的。在本研究中,笔者选取了GEO数据库中的4组含有GBM组织和正常脑组织的全基因表达谱芯片作为研究对象。为了减少不同芯片平台、核苷酸探针设计差异对基因表达检测的影响,本研究中纳入的数据集均选用来自GPL570平台的昂飞人类全基因组表达谱芯片(Affymetrix U133 Plus2.0)数据集作为研究对象。所有芯片研究数据在完成质控后,应用统一的RMA算法进行归一化,最终将各组差异基因取交集得到了628个差异表达基因,其中87个上调基因,541个为下调基因。通过 GO 和 KEGG 富集分析,发现差异基因与离子通道绑定、钙离子结合、神经递质分泌、胞外分泌的监管、化学突触传递等方面密切相关。许多研究证实,在GBM发生、发展过程中有细胞自分泌与旁分泌过程参与,肿瘤细胞与细胞外基质共同构成肿瘤生长的微环境,在调节GBM细胞增殖、迁移等过程到至关重要的作用,这与本研究得到的结果类似[11-14]。在本组研究中,通过对PPI网络的分析,发现了19个网络中的HUB基因,其中DNM1、RBFOX1、GABRD基因等,均参与肿瘤与细胞外基质的作用,且与多种肿瘤的发生、发展密切系相关[15-18]。本研究提示,这些基因可能也在GBM的生物学过程中发挥至关重要的作用。

应用TCGA数据库进行生存分析发现,在筛选出的19个HUB基因中GABRD基因的表达水平会显著影响GBM患者总生存期。GABRD又名r-氨基丁酸A型受体亚基,其能够与哺乳动物大脑中主要的抑制性神经递质r-氨基丁酸(GABA)结合调控的氯离子通道。研究报道GABA的代谢状况能够影响胶质瘤的增殖和预后[19],而且GABA神经递质代谢过程的改变能够显著影响GBM细胞的侵袭性表型[20]。本研究中KEGG 通路富集分析发现,差异表达基因主要富集于GABA信号通路、吗啡相关信号通路、逆神经信号通路等。这也提示GABA信号在GBM的发展中起到了关键的作用。本研究中虽然除GABRD基因外的HUB基因在统计上并不能影响GBM患者的总生存期,但是它们可能会以其他的形式在GBM的发生、发展中起到作用。这还有待进一步的研究。

综上所述,本研究应用生物信息学的方法对GBM的多组芯片数据进行挖掘。利用差异基因的表达分析,最终寻找出HUB基因。这些基因信息有助于我们对GBM的发生、发展和转移的分子过程有进一步认识,并且可以为研究GBM提供潜在的生物标志物及靶点。有助于全面了GBM发生、发展的潜在分子机制,并为后续的实验研究提供指导。

猜你喜欢
差异基因脑组织通路
电针对慢性社交挫败抑郁模型小鼠行为学及脑组织p11、5-HTR4表达的影响
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
山楂叶总黄酮对大鼠缺血脑组织p38蛋白表达的影响
山楂叶总黄酮对2型糖尿病大鼠脑组织的保护作用
SphK/S1P信号通路与肾脏炎症研究进展
2,4-二氯苯氧乙酸对子代大鼠发育及脑组织的氧化损伤作用