促新型冠状病毒感染的相关差异表达基因及其功能分析

2022-04-19 12:29吴宝杰锡书毅
医学综述 2022年7期
关键词:核糖体通路分子

吴宝杰,锡书毅

(上海泽润生物科技有限公司,上海 201203)

严重急性呼吸系统综合征冠状病毒2(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)感染是导致新型冠状病毒肺炎(corona virus disease 2019,COVID-19)大流行的原因[1],其以血管紧张素转换酶2为受体[2],侵入宿主呼吸系统和消化系统,侵袭宿主细胞[3-4],具有较强的感染性和致病性[5]。相关研究表明,COVID-19患者需克服细胞因子风暴引起的急性呼吸窘迫综合征和多脏器衰竭[6-7],在易感染人群中,癌症患者罹患COVID-19的概率更高,感染后病死率更高[8],因此,预防与治疗癌症患者感染SARS-CoV-2的策略备受关注。2020年1月至今,SARS-CoV-2在全球范围内传播,各国时刻面临着病毒变异、病毒感染与传播能力增强的风险[9-12],需探索高效的SARS-CoV-2筛查技术,迅速推进SARS-CoV-2疫苗量产供应[13-14]。为了控制COVID-19大流行,需要对SARS-CoV-2的感染机制和致病机制进行深入研究,包括病毒结构、病毒感染的免疫逃逸、细胞因子风暴的影响、相关分子的相互作用、相关信号转导和代谢途径、相关生物靶点的预测与验证以及病毒感染筛查等方面。迄今为止,罕有促SARS-CoV-2感染的相关差异表达基因(differentially expressed genes,DEGs)及其功能的相关研究报道,SARS-CoV-2感染涉及众多DEGs的表达、分子间相互作用和复杂的信号通路,研究并获得促SARS-CoV-2感染关键基因对预防病毒感染具有重要意义。本研究主要探索分析促新型冠状病毒感染的相关差异表达基因及其功能,为控制并阻断SARS-CoV-2的感染与传播提新思路。

1 资料与方法

1.1获取数据集 在美国国立生物中心(National Center for Biotechnology Information,NCBI)的NCBI-GEO数据库(https://www.ncbi.nlm.nih.gov/)中检索并下载与SARS-CoV-2感染相关的基因表达谱芯片数据。检索式:("Severe acute respiratory syndrome coronavirus 2"[Organism] OR SARS-CoV-2[All Fields]) AND "Expression profiling by array"[Filter],选用GSE156544数据集进行分析[15-16]。GSE156544数据集由Hans-Joachim Mollenkopf提供(the Max-Planck-Institute for Infection Biology,Microarray/Genomics Core Facility)。

1.2DEGs的筛选 采用GEO2R工具对GSE156544数据集进行分析,根据是否为SARS-CoV-2感染致病分为未感染组和感染致病组,进行数据分类和差异表达分析(Padj<0.05),筛选获得促SARS-CoV-2感染的DEGs。

1.3富集分析及蛋白-蛋白相互作用(protein-protein interaction,PPI)网络构建 根据已获得的DEGs信息,采用注释、可视化和集成发现的数据库[17](the database for annotation,visualization and integrated discovery,DAVID)(https://david.ncifcrf.gov/)进行基因本体论(gene ontology,GO)和京都基因与基因组百科全书[18](Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。再通过STRING数据库[19](https://string-db.org/)分析分子互作网络,验证富集功能(包括生物过程、细胞成分、分子功能、信号通路等),构建促SARS-CoV-2感染的PPI网络。

1.4关键子网络筛选及hub基因的功能注释 基于PPI网络分析筛选关键子网络。使用Cytoscape3.8.2软件进一步对hub基因进行分析和信息挖掘[20-21]。同时,结合NCBI-Gene和STRING数据库注释相关基因的功能。使用GEPIA2数据库[22](http://gepia2.cancer-pku.cn/)分析hub基因在多种类型肿瘤中的表达情况。

2 结 果

2.1DEGs的筛选 基于GSE156544数据集,通过GEO2R分析,设置样本分组,进行DEGs的筛选,共获得59个DEGs(P<0.05),包含37个上调DEGs和22个下调DEGs。见图1。

2.2富集分析 根据DEGs分析结果进行DAVID富集分析,GO/KEGG富集分析结果显示,59个DEGs显著富集于1个KEGG通路(hsa04512,P<0.01),1个生物学过程(GO:0007263,P<0.05),1个分子功能(GO:0008307,P<0.05)。见表1。

注:SARS-CoV-2为严重急性呼吸系统综合征冠状病毒2,DEGs为差异表达基因

表1 GO/KEGG富集分析

2.3分子相互作用分析及PPI网络构建 采用STRING数据库分析DEGs的蛋白交互作用网络关系(隐藏单独没有连接的节点,交互分析设置highest confidence 0.900,1st shell no more than 20 interactors),分子互作模型见图2,该交互作用网络中的功能富集结果包括25个生物过程(表2)、21个细胞成分(表3)与8个分子功能(表4),涉及2个KEGG通路(hsa03008:真核生物核糖体的生物合成通路、hsa04512:ECM受体相互作用通路),4个Reactome通路(hsa-6790901:细胞核和细胞质中的核糖体RNA(ribosomal RNA,rRNA)修饰通路、hsa-8868773:rRNA在细胞核和细胞质中的加工通路、hsa-6791226:核仁和细胞质中rRNA加工的主要途径、hsa-8953854:RNA的代谢通路)和15个相关蛋白结构域。

2.4关键子网络、hub基因的筛选及分析 基于PPI网络,使用Cytoscape(MCODE插件)进行其关键子网筛选及hub基因分析,结果发现1个关键子网,其中的基因产物在SARS-CoV-2感染过程中存在相互作用,共获得21个hub基因,见图3。同时,使用STRING和NCBI-Gene数据库对相关基因进行功能注释,见表5。21个hub基因在不同癌症肿瘤组织细胞中的表达情况见图4,NOP56、NHP2L1、FBL在不同癌症肿瘤组织细胞中的表达分值高(>7分)。

注:SARS-CoV-2为严重急性呼吸系统综合征冠状病毒2,DEGs为差异表达基因,PPI为蛋白-蛋白相互作用

表2 分子相互作用网络的GO富集结果(生物过程)

表3 分子相互作用网络的GO富集结果(细胞成分)

续表3

表4 分子相互作用网络的GO富集结果(分子功能)

注:SARS-CoV-2为严重急性呼吸系统综合征冠状病毒2

表5 促SARS-CoV-2感染hub基因的功能注释

续表5

注:SARS-CoV-2为严重急性呼吸系统综合征冠状病毒2

3 讨 论

COVID-19大流行对全球社会经济平衡和医疗体系产生了巨大影响,同时也促进了对SARS-CoV-2及其感染机制的深入研究,相关新型药物干预方法和疫苗开发及量产策略将陆续被应用于全球疫情的控制[23]。随着生物信息学研究及相关检测技术的推进,许多学者对SARS-CoV-2感染过程中相关基因的表达进行了研究报道。

Ramesh等[24]研究结果表明,ELANE和LTF差异表达会导致过度的炎症反应,即细胞因子风暴,最终导致患者死亡。Muhammad等[25]报道HSPA1L是抗病毒预防和治疗的潜在靶点。Ibrahim和Ellakwa[26]研究表明,在SARS-CoV-2感染过程中类泛素化修饰、凝血、氧化应激途径反应的基因异常调节可能是疾病进展的关键。George等[27]报道维生素D内分泌系统失调与SARS-CoV-2感染的病理生物学有关。Fang等[28]发现CXC趋化因子配体8、CXC趋化因子配体10和表皮生长因子是SARS-COV-2感染过程中的关键基因。Chen等[29]报道SARS-CoV-2感染可引起人体细胞内大量分子及相关信号通路的异常改变。Vastrad等[30]探讨了SARS-CoV-2感染的分子机制,筛选获得关键基因(TP53、HRAS、MAPK11、RELA、IKZF3、IFNAR2、SKI、TNFRSF13C、JAK1、TRAF6、KLRF2、CD1A),并发现SARS-CoV-2感染后DEGs主要富集在核苷酸结合寡聚化结构域样受体信号通路、核糖体、对外界生物刺激的反应和病毒转录等方面,CBL、ISG15、NEDD4、PML、REL、CTNNB1、ERBB2、JUN、RPS8和STUB1基因是良好的诊断生物标志物[31]。Mishra等[32]对已知参与宿主-病毒相互作用的基因(TP53、KAT2B、DHX9、RELA、RBX1、PSMB2)进行了深入研究,加深了对病毒复制与传播分子机制的理解。

在本研究中,来自NCBI-GEO数据库的GSE156544数据集证明了SARS-CoV-2能够在γ干扰素处理的肠上皮细胞中有效地完成整个生命周期,并揭示了SARS-CoV-2的感染机制:γ干扰素驱动的炎症反应可能增加对SARS-CoV-2的易感性并促进其复制[33]。本研究通过对GSE156544进行数据挖掘,筛选获得了与促SARS-CoV-2感染相关的DEGs,以迅速聚焦促SARS-CoV-2感染相关的生物学过程、细胞组分及分子功能,成功构建PPI网络,并对促SARS-CoV-2感染关键基因和重要的KEGG通路进行分析,有助于揭示促病毒感染的分子机制,为后续研究提供参考。本研究KEGG通路分析结果表明,在ECM受体相互作用通路中,细胞和ECM之间的特异性相互作用是由跨膜分子介导的,这些相互作用导致细胞活动的直接或间接控制,如黏附、迁移、分化、增殖和凋亡。而核糖体是负责制造蛋白质的细胞工厂,真核生物核糖体的生物合成通路涉及rRNA和众多核糖体蛋白质的产生和正确组装,在缺乏核糖体生物合成必需的蛋白质时,核糖体的生物合成便会停滞。本研究显示,在促SARS-CoV-2感染过程中,ECM受体相互作用通路是极显著的KEGG通路(COL6A2、LAMB4、CD36),其与真核生物核糖体的生物合成通路(FBL、TP18、MPHOSPH10、IMP4、NOP58、NOL6、IRH1A、HEATR1、DKC1、BMS1、NOP56、NHP2L1、WDR36、BL3)构成了促SARS-CoV-2感染PPI网络中的关键通路。本研究Cytoscape-MCODE分析结果发现1个关键子网,表明其中21个hub基因在促SARS-CoV-2感染过程中存在重要的相互作用,对rRNA及核糖体合成的深入探索可能为阻断SARS-CoV-2的感染提供相应的分子靶点与预防策略。

文献报道,罹患癌症的易感人群预后较差,且感染SARS-CoV-2后癌症患者的致死率高[8]。Liang等[34]对我国癌症患者的SARS-CoV-2感染状况进行了研究,结果表明癌症患者面临罹患COVID-19的风险较高。Miyashita等[35]对美国纽约市癌症患者的COVID-19预后情况进行研究发现,感染SARS-CoV-2后,癌症患者死亡风险增加。英国冠状病毒癌症监测项目团队分析英国癌症中心的实时数据发现,癌症患者SARS-COV-2感染的易感性可能增加,且后遗症更严重[36]。本研究结合GEPIA2数据库对促SARS-CoV-2感染的21个hub基因在癌症患者(易感染群体)中的临床价值进行评估,结果发现NOP56、NHP2L1、FBL在不同癌症肿瘤组织细胞中的表达分值高,可能为感染SARS-CoV-2的不同癌症患者的临床预后提供潜在靶点。

综上所述,本研究基于已报道的GSE156544数据集,综合运用生物信息学研究方法,筛选获得59个与SARS-CoV-2感染显著相关的DEGs,对其进行功能富集和信号通路分析,成功构建分子互作网络模型,获得1个关键互作子网络和21个hub基因,并对其进行了功能注释。本研究的局限在于:①研究结果及分析受表达谱芯片数据质量的影响,目前SARS-CoV-2的感染研究芯片数据集数目少;②单芯片数据集分析结果需要后续更多相关表达谱数据的对比分析和相关实验研究的评价验证。目前,全球COVID-19大流行尚未结束,需要继续深入探索SARS-CoV-2感染机制与致病机制,促SARS-CoV-2感染的相关DEGs及功能研究将为控制SARS-CoV-2的感染与传播提供信息支持。

猜你喜欢
核糖体通路分子
核糖体成熟因子RimP、Era和RimJ的研究进展
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
《分子催化》征稿启事
核糖体相关质量控制与核糖体自噬研究进展*
降低核糖体蛋白质翻译功能对延缓衰老具有重要作用
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
“精日”分子到底是什么?
米和米中的危险分子