小细胞肺癌相关基因的生物信息学分析

2020-01-26 05:49张婕戴巍冯宇叶佳琪
电脑知识与技术 2020年34期
关键词:小细胞肺癌生物信息学

张婕 戴巍 冯宇 叶佳琪

摘要:运用生物信息学方法分析小细胞肺癌的相关基因,选取GEO数据库基因芯片数据集GSE66635进行深入挖掘,通过GEO2R筛选差异表达基因,并利用R软件对其进行聚类分析、DAVID数据库进行GO功能和KEGG通路富集分析、STRING数据库和Cytoscape软件构建蛋白质相互作用网络,最终得到6个关键基因:TP53,CCL2,FGF2,FOS,FGFR4,PGF,其所参与的生物学过程等可能与小细胞肺癌的发生、发展相关。

关键词:生物信息学;相关基因;小细胞肺癌

中图分类号:R319           文献标识码:A

文章编号:1009-3044(2020)34-0014-03

小细胞肺癌(small cell lung cancer,SCLC) 是一类恶性程度高的肺癌,虽然只占肺癌的13%-15%,但是其死亡率极高[1]。有关研究表明,SCLC是多个分子水平改变累积的结果,单靶点的抑制对SCLC的治疗作用有限[1]。由于SCLC的复杂性及其发病机制的不明确性导致研究人员无法确定靶向治疗的靶点,因此我们需要更深入地研究与SCLC发生发展相关的基因。

随着精准医疗的发展,生物信息学分析技术的成熟为癌症的诊治提供更为广泛的空间。由于生物信息学数据库及其分析软件的种类多样性和开放共享性,使得利用生物信息分析方法识别疾病相关的治疗靶基因成为可能。其中,NCBI的GEO数据库中有着大量的基因芯片数据集,其具有更新快、大规模等优点,而且易于共享,避免在数据采集等方面浪费大量时间,因此在生命科学领域的研究中运用逐渐广泛[2]。本研究通过生物信息学方法挖掘SCLC基因芯片数据集GSE66625,利用计算机分析预测SCLC的潜在相关基因,从分子层面探讨SCLC可能的作用机制。

1  材料与方法

1.1  材料

以SCLC和差异表达基因为关键词,在NCBI的GEO数据库中查找基因芯片数据集,最终选择并下载检索序列号为GSE66625的基因芯片数据集,此数据集基于GPL16951平台,是人SCLC细胞NCI-H446经一种化疗药物治疗前后的基因表达变化数据,其中对照组为经DMSO处理的3瓶SCLC细胞,实验组为相同浓度药物处理后的3瓶细胞,采用Phalanx OneArrayTM检测它们之间的基因表达差异,体现了SCLC细胞经化疗药物治疗前后的基因表达差异。

1.2  方法

1.2.1  差异表达基因筛选

使用GEO2R在线分析药物治疗组与癌症对照组的基因数据并保存所有基因的分析结果,在Excel中以|logFC|>2.00且P.Value<0.05为条件筛选出差异表达基因(Differential Expression Genes,DEGs),并使用SangerBox软件和R软件的Pheatmap包分别绘制出全部基因的火山图以及DEGs的聚类热图。

1.2.2  功能与富集分析

DAVID是一个为大量基因提供一系列功能性注释的生物信息数据库。将DEGs上传到DAVID 6.7版在线数据库,并选择物种homo sapiens,选定p<0.05,基因数目≥5的条件进行GO功能富集分析,以p<0.05为限定条件进行KEGG通路富集分析,并筛选出富集到每项条目的共同基因。

1.2.3  蛋白质-蛋白质相互作用网络构建

STRING数据库能够对蛋白质相互作用网络进行分析和预测,并提供详细的相互作用信息。将显著富集到生物过程、细胞组件、分子功能以及KEGG代谢通路中的共同DEGs上传至STRING 11.0版数据库,以数据库、文本挖掘、实验结果等为依据进行蛋白之间交互网络的初步预测,筛选出综合得分≥0.4的相互作用关系,将相互作用表格及注释信息导入Cytoscape软件中进行可视化交互网络的构建。

2  结果与分析

2.1  DEGs的筛选结果与分析

经过药物治疗组与癌症对照组的比较,得到864个DEGs,其中有566个基因上调,298个基因下调,将其绘制成火山图,其中红色表示上调,绿色表示下调,黑色部分为普通基因,如图1(a)。利用R软件的Pheatmap包将DEGs的基因表达矩阵绘制成聚类热图,如图1(b)。

2.2  DEGs的GO功能与KEGG通路富集分析

通过GO功能的3种生物学关系分析,SCLC的DEGs主要参与细胞迁移的正调控、凋亡过程和正调控血管生成等生物学过程,如图2(a)所示,其产物主要参与神经元投射、细胞外空间、突触小泡等细胞组分,如图2(b)所示,并且DEGs主要发挥着调节蛋白质同二聚化活性、磷脂结合、肝素结合等分子功能,如图2(C)。通过KEGG代谢通路分析,得到16条显著富集的信号通路,主要包括PI3K-Akt信号通路、轴突导向、p53信号通路等代谢通路,如图2(d)所示,与SCLC的发生、发展密切相關。其中共有52个基因同时富集到3种生物学关系和KEGG代谢通路中,如图3所示。

2.3  DEGs的蛋白-蛋白交互网络构建

为发现DEGs之间的相互作用和SCLC的相关分子机制,将同时富集到KEGG通路以及GO功能3个条目的52个基因所编码的蛋白进行蛋白-蛋白交互网络的构建,隐藏没有参与相互作用的4个蛋白,整个网络中共有48个蛋白和187个交互关系。将相互作用信息导入Cytoscape软件中进行互作网络的可视化,每一个节点代表一个蛋白,每一条边代表一个交互关系。其中,节点的大小随度渐变,且红色表示基因上调,绿色表示基因下调,边的粗细随相互作用的强度渐变。结果显示(图4),交互网络中TP53,CCL2,FGF2,FOS,FGFR4和PGF与其他蛋白的关系最为密切,为整个交互网络的中心节点。将这6个基因所参与的生物过程(表1)、细胞组分(表2)、分子功能(表3)和KEGG代谢通路(表4)分别整理成表。

3 討论

本研究运用生物信息学方法从GEO数据库中下载SCLC的相关基因芯片数据集GSE66625,并利用GEO2R对其进行初步分析,得到了864个DEGs,其中566个基因上调,298个基因下调。通过GO功能富集和KEGG通路分析,我们选取富集分析结果中交集的52个基因的编码蛋白进行蛋白质相互作用网络的构建,最终得到TP53,CCL2,FGF2,FOS,FGFR4,PGF为网络的中心蛋白。

TP53(Tumor Protein 53)是与人类肿瘤相关性最高的基因之一,编码生成肿瘤蛋白p53。有研究发现,在人体正常细胞的活动中,TP53通过参与细胞调控、促进DNA修复等过程,发挥着维持基因组稳定、调节细胞分化等作用[3]。在本研究中,TP53在经化疗药物处理过后的细胞内显著下调,说明其在癌组织中表达量上调,同时在互作网络中处于中心位置。此外,TP53显著富集到细胞的凋亡过程以及p53、PI3K-Akt等信号通路中。PI3K与其下游分子蛋白激酶所组成的PI3K-Akt信号通路在人类肿瘤的发生发展过程中有着关键地位。TP53可能通过此过程以及代谢通路来抑制肿瘤细胞的表达并促进细胞凋亡,在SCLC的作用机制中起着关键作用。

CCL2蛋白是趋化因子CC亚家族的成员之一,可以趋化单核细胞、巨噬细胞、记忆T细胞等到达感染的部位,在肿瘤、免疫系统疾病等多种疾病的发生发展中起着关键作用[4]。它能够增强肿瘤细胞的侵袭能力,促进肿瘤的转移,从而导致疾病恶化。在本研究中,CCL2的表达量在经药物处理后的细胞中显著下调,且显著富集到细胞外空间的细胞组分并参与肝素结合功能,这表明CCL2的下调可能通过调控胞外空间组分和肝素结合功能等途径抑制SCLC的致癌作用。FOS蛋白是细胞增殖、分化等的调节因子。本研究中FOS在经药物处理的细胞中表达上调,在癌细胞中下调,且显著富集到神经元投射的细胞组件中,可能通过此过程在致癌机制的调控中发挥功能。

PGF(Placenta growth factor)一种胎盘生长因子,在本研究中,PGF表达量在经药物处理后的细胞内显著下调,在癌组织中显著上调,显著富集到血管生成、器官再生过程中,并参与着肝素结合等分子功能以及PI3K-Akt信号通路,可能发挥着促进肿瘤细胞生长的功能。

FGF2(Fibroblast Growth Factor 2)是成纤维细胞生长因子家族成员中较典型的一类多肽,具有促进血管生成、创伤修复、组织再生等功能。有研究发现其可通过PKC信号传导途径来促进小细胞肺癌细胞中凋亡抑制蛋白的表达,从而抑制细胞凋亡[5]。FGFR4(Fibroblast Growth Factor Receptor 4)是一种跨膜受体酪氨酸激酶,是成纤维细胞生长因子受体中的一员[6]。FGF2主要通过与细胞表面上的FGFRs高亲和力结合发挥生物学效应。冯彦等人研究发现FGF2和FGFR4与SCLC的侵袭和转移密切相关[7]。在本研究中,FGF2表达量在经药物处理后的细胞内显著下调,在癌组织中显著上调,而FGFR4的表达量在经药物处理后的细胞内显著上调,在癌组织中表达量下调。这两种基因共同发挥肝素结合的分子功能而且同PGF、TP53富集到PI3K-Akt信号通路中,表明其基因表达结果可能通过影响肝素结合和PI3K-Akt信号通路调控SCLC的发展,阻止FGF2与其受体的结合从而抑制癌细胞的增殖。此外,FGF2参与着细胞迁移、血管生成以及经典Wnt信号转导通路调节等生物学过程,与CCL2、PGF共同参与着胞外空间的细胞组分,且与TP53共同富集到癌症中蛋白多糖代谢通路,这表明这些基因可能通过调控细胞迁移、细胞外空间的组分或者是蛋白多糖的代谢参与SCLC的发生、发展,从而在SCLC的作用机制中起重要作用,这可能是SCLC的潜在致病机制。

综上所述,本研究通过对SCLC基因芯片数据集进行生物信息学分析,发现TP53,CCL2,FGF2,FOS,FGFR4,PGF可能是SCLC的潜在相关基因,然而我们仍需更多地研究来证实其在SCLC中的作用。

参考文献:

[1] 王伙刚,洪波,林文楚.小细胞肺癌靶向治疗研究进展[J].中国药理学通报,2017,33(10):1333-1337.

[2] 滕牧洲,马文丽.走近医学研究领域中的基因芯片技术[J].分子诊断与治疗杂志,2014,6(6):361-365.

[3] 徐文达,高平,杨文君.p53信号通路与肿瘤关系的研究进展[J].宁夏医科大学学报,2012,34(9):971-976.

[4] 姜懿纳,陈乃宏.CCL2/MCP-1在其相关疾病的机制研究[J].中国药理学通报,2016,32(12):1634-1638.

[5] 屈晓辉,周建华.碱性成纤维细胞成长因子2对小细胞肺癌细胞凋亡的影响及机制研究[J].江西医药,2016,51(10):1023-1027.

[6] 伍代朝,陈林,陈永恒, 等.靶向FGFR4的抗肿瘤药物研究进展[J].肿瘤防治研究,2017,44(1):61-65.

[7] 冯彦,李建慧,赵雪, 等.FGF-2和ToPo Ⅱ在小细胞肺癌中的表达及相关性[J].临床肿瘤学杂志,2012,17(2):121-125.

【通联编辑:光文玲】

猜你喜欢
小细胞肺癌生物信息学
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
胃泌素释放肽前体在小细胞肺癌诊断的应用价值分析
胸腔镜联合加速康复外科流程在小细胞肺癌开胸手术中应用的临床研究