利用生物信息学分析鼻咽癌关键基因和信号通路

2021-03-31 01:43赵琳何章彪张欣曹翠萍
中国老年学杂志 2021年7期
关键词:通路基因差异

赵琳 何章彪 张欣 曹翠萍

(1商丘医学高等专科学校,河南 商丘 476000;2南阳医学高等专科学校)

鼻咽癌(NPC)是鼻咽上皮的恶性肿瘤,在东南亚和中国比较普遍〔1,2〕。在流行区,早期NPC患者的5年生存率达95%,晚期NPC患者的生存率仅为60%,70%的初诊NPC患者的病情会进一步发展〔3〕。因此,寻找潜在的识别早期NPC患者的生物标记物对改善患者预后具有重要意义。EB病毒(EBV)DNA检测目前用于NPC早期患者的筛查,但其对肿瘤筛查的阳性预测值较低(11%)〔4〕。有证据表明,基因和细胞信号通路,可能参与NPC的发生和发展,包括TGF-β信号通路和Notch信号通路〔5〕。NPC进展的分子机制尚不清楚,目前对NPC的早期诊断和治疗有限〔6〕。因此,需要进一步研究NPC发生和发展的分子机制。

基因芯片是分析基因表达的高通量平台,可以鉴定参与各种信号通路、分子功能和生物学过程的数百个差异表达基因(DEGs)〔7〕。本研究从基因表达综合数据库〔GEO;www.ncbi.nlm.nih.gov/geo;GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕上下载了GSE64634数据,以鉴定NPC组织中的DEGs〔8〕。随后,进行了基因本体论(GO;www.genontology.org)和京都基因与基因组百科全书(KEGG)信号通路富集分析,以确定关键基因的生物学功能和通路〔9〕。这项研究的结果为NPC的潜在生物标志物提供了新的见解,并可能有助于对NPC发生和发展的分子机制的理解。

1 材料和方法

1.1研究工具和对象 基因表达谱GSE64634从GEO数据库下载。GSE64634是在Affymetrix GPL570平台〔GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕的基础上提出的,由12例NPC标本和4例正常对照(GSM1575894,GSM1575895,GSM1575896,GSM15-75897)组成。应用在线分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)对NPC及对应的癌旁组织进行DEGs分析。GEO2R是一个基于R语言程序的数据集分析工具,能够对相同实验条件下的两组样品进行对比,筛选DEGs。基因表达的差异用差异倍数(FC)表示。本研究设定的筛选标准分别为P<0.05,|logFC|≥1(筛选表达差异大于等于2倍的DEGs;或P<0.05,|logFC| ≥2 (筛选表达差异≥4倍的DEGs)。所筛选的差异显著性基因见表1。

1.2基因功能和通路富集分析 Metascape (http://metascape.org/)是一种在线分析工具,用于提取与候选基因列表相关的生物信息。它不仅可以提供典型的基因功能富集分析,而且可以实现可视化分析,可查看差异显著性基因的生物功能、信号通路富集等。对筛选出的DEGs进行了GO分析和KEGG通路分析,并利用Metascape工具对筛选的DEGs进行了GO和KEGG通路分析。以P值<0.01为界值,以富集程度评分〔-log10(P)〕进行显著性排列。

1.3构建蛋白质相互作用(PPI) 网络String(http://string-db.org)是一个基于Web的资源,用于检索基因相互作用的搜索工具,用于预测输入基因列表的蛋白质综合信息。本研究使用字符串来获取DEGs的PPI信息,并选择组合得分大于0.4的相互作用进行研究。在此基础上,根据蛋白质之间相互作用的信息,利用Cytoscape软件(Version3.4.0,http://www.cytoscape.org/)构建了PPI网络,并对网络进行了可视化。使用Cytoscape Plug-in Network Analyzer进行了进一步的分析,并计算了PPI网络的拓扑性质、节点度。

1.4以MCODE方法分析鼻咽癌的Hub基因 MCODE分析是检测PPI网络中紧密连接区域的一种方法。本研究使用MCODE分析从构建的PPI网络中选取最重要的模块进行进一步分析。参数设置:node score cutoff=0.2,K-Core=2,degree cutoff=2。

2 结 果

2.1NPC差异显著基因的筛选 从GEO公共数据库中选取GSE64634的基因芯片数据,上传到GEO2R网络工具中,筛选正常鼻咽组织和NPC组织之间的DEGs。图1显示了DEGs的火山图。每个颜色点代表一个上调或下调的基因,其中绿色表示下调的基因,红色表示上调的基因,黑色表示根据P值<0.05和|logFC|>1的标准,没有差异表达的基因。从GSE64634中鉴定出1 014个DEGs,包括191个上调基因和823个下调基因。图2分别描绘了来自GSE64634的上调和下调的前10个重要基因的DEGs表达热图,基因表达水平用颜色表示,红色表示高表达,蓝色表示低表达。聚类分析表明,在正常鼻咽和NPC组织中,DEGs的表达存在差异。具体差异显著性基因以表格的形式呈现(表1)。这193个重叠基因被确认为候选DEGs,并用于进一步的分析。

表1 NPC基因芯片GSE64634中筛选出193个差异表达基因

图1 GSE64634微阵列中的DEGs火山图

图2 GSE64634微阵列中前10个差异表达的DEGs mRNA水平的热图

2.2DEGs的功能和途径富集分析 在Metascape数据库的基础上,对筛选的NPC的候选DEGs的GO功能和KEGG通路进行了富集分析。以P值为<0.01、最小重叠基因=3和最小富集因子>1.5作为设置标准。如图3所示,DEGs富集分析主要集中在纤毛运动、体液免疫应答、抗菌体液反应、药物代谢-细胞色素P450、花生四烯酸代谢过程、鞭毛的精子能动性、化学致癌性、金属离子运输、适应性免疫反应的负调控等方面,这些基因之间的功能彼此紧密地联系在一起,并聚集成完整的网络(图4)。图4显示了KEGG途径的富集分析。每个条带代表一个丰富项或通路,根据-log 10P值着色,网络的丰富条件和途径,节点代表丰富的术语或途径,节点大小表示所涉及的DEGs的数量。共享同一个集群的节点通常彼此靠近,显示的边界越粗,相似度就越高。

2.3PPI网络构建 将筛选的获得的差异基因输入STRING网站,构建PPI网络(图5),并进一步应用Cytoscape软件中的分子复合物检测(MCODE)分析对PPI网络中连接最为紧密的基因进行分组,形成多个模块。结果显示共有3个模块评分较高(图2)。其中评分最高的模块1中共包含了SNRPG,SNRPE,DDX42,SF3A3,DDX46,BUD31,SF3B6,U2AF2,SF3B5,SF3B3,PHF5A,SNRPD3,SF3A2,SNRPA1,SNRPB2,SF3B1,SF3B4,SNRPD2,PRPF6,SF3A1,PRPF31,SNRPA,SNRPB,SNRPD1,SF3B2等25个基因,共形成了300种相互作用关系,具有较高连接度,为中心(Hub)基因。

1~13:纤毛运动、体液免疫反应、抗菌体液反应、药物代谢细胞色素P450、花生四烯酸代谢过程、鞭毛精子存活率、化学致癌、辅助因子转运、金属离子转运、营养水平的细胞反应、成肌细胞融合、适应免疫反应的负调控、SLC介导的跨膜转运;图4同图3 DEGs富集分析

图4 KEGG途径的富集分析

图5 DEGs对应的蛋白质相互作用紧密连接度最高的3个模块

3 讨 论

NPC是头颈部最常见的鳞状细胞肿瘤之一〔5,10〕。Ⅰ期患者的5年生存率为95%。然而,Ⅳ期患者的5年存活率略高于60%〔11〕。因此,了解NPC进展的病因和分子机制对于诊断和治疗至关重要〔12〕。微阵列技术已被广泛应用于预测癌症的潜在治疗靶点,包括结直肠癌〔13〕。在此之前,Wang等〔14〕分析了GSE12452数据集,发现细胞周期蛋白(cyclin)B1、黏蛋白1、细胞表面相关和乙醛脱氢酶1家族成员A1可能与EBV相关的NPC有关。GSE12452序列分析表明,CXC基序趋化因子配体(CXCL)9、ZIC家族成员2、前列腺素内过氧化物合成酶2、纤维连接蛋白1、CXCL10和 ovo 样转录抑制因子1可能在NPC中发挥作用。在本研究中,通过生物信息学分析筛选了20个上调和173个下调的DEGs。KEGG通路富集分析和GO功能注释结果显示,上调表达的DEGs主要富集于依赖DNA的DNA复制、细胞分裂、调节参与炎症反应的细胞因子的产生、抗原处理和肽抗原通过MHC Ⅱ类递呈和胚胎骨骼系统发育,而表达下调的DEGs主要参与纤毛运动、微管运动、鞭毛精子活力、纤毛或鞭毛依赖的细胞运动和动脉内皮细胞分化,胶质细胞增殖、趋化因子介导的信号通路、软骨细胞增殖、肌动蛋白丝聚合、神经递质分解代谢过程。已有研究表明,NPC细胞的侵袭、转移、增殖和凋亡可能受特异性基因表达上调或下调的影响。这个结果与癌细胞的侵袭和转移与异常的细胞黏附和细胞分裂密切相关的事实是一致的〔15〕。此外,癌细胞的增殖和凋亡与依赖DNA的DNA复制的异常密切相关。因此,分析所涉及的信号通路为理解肿瘤增殖提供新的见解。

本研究中构建了一个PPI网络来识别25个最重要的Hub基因。这25个基因形成300种相互作用关系将其紧密联系在一起,构成一个相对独立的网络,并可能通过拮抗或协同作用起到相似的生物学功能。进一步GO分析发现,DDX42参与调控细胞凋亡的过程,通过与TP53BP2相互作用参与细胞存活,可以抵消TP53BP2的凋亡刺激活性。没有白细胞介素(IL)-3的诱导会引起细胞凋亡,过表达DDX42可以保护Ba/F3细胞免受这种影响,过表达DDX42通过影响IL-3诱导细胞骨架重排来调节细胞极化〔16〕。U2AF2可以负性调控蛋白泛素化。U2AF2在原发性非小细胞肺癌组织中也显著上调,并且与肿瘤转移,晚期肿瘤分期,肿瘤患者不良预后和复发显著相关〔17〕。而且癌症相关突变与U2AF2剪接因子的功能密切关联〔18〕。U2AF2介导的CD44亚型会导致体外黑素瘤迁移,体内黑色素瘤转移至肺和肝〔19〕。SNRPD3、SNRPB参与蛋白质甲基化作用〔20〕。SNRPB在非小细胞肺癌中的表达异常,并且与非小细胞肺癌不良预后相关。在小鼠前列腺癌移植模型中,SNRPB被鉴定为转移抑制基因〔21〕。敲除SNRPB改变了与胶质母细胞瘤发展相关的关键基因/途径〔受体酪氨酸激酶(RTK),磷脂酰肌醇3-激酶(PI3K),丝裂原活化蛋白激酶(MAPK),转化(RAS),丝氨酪/苏氨酸激酶(AKT),成视网膜细胞瘤(RB),p53〕〔22〕。SNRPA1参与IL-12介导的信号通路。SNPRA1是一种剪接体组分,负责将前mRNA加工成mRNA,对男性生育至关重要。SNRPA1与TCF7L2(Wnt信号通路的转录因子)与rs386772267的等位基因结合,增加胰腺癌患病风险。SNRPA1对肾癌和卵巢癌的预后不良〔23〕。SNRPA1影响结直肠癌细胞周期,增殖和迁移。SF3B1积极调控基因表达,参与表观遗传作用,SF3B1在鼻窦黑色素瘤中出现7%的突变,是鼻窦黑色素瘤潜在的致癌因子〔24〕。

综上所述,通过GSE64634基因芯片筛查出的DDX42、U2AF2、SNRPB、SNRPA1,SF3B1等5个基因在多种肿瘤中表达异常,并已明确在某些特定肿瘤的发生发展中扮演着重要的角色。这5个基因位于NPC DEGs构成的表达谱网络中的关键节点位置,可作为NPC发生过程中的关键Hub基因,为进一步研究NPC发生发展的分子机制及分子标志物的筛选提供指导。

猜你喜欢
通路基因差异
相似与差异
Frog whisperer
修改基因吉凶未卜
找句子差异
生物为什么会有差异?
创新基因让招行赢在未来
基因
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
M1型、M2型巨噬细胞及肿瘤相关巨噬细胞中miR-146a表达的差异