基于生物信息学筛选分析脓毒症预后相关核心基因

2024-02-27 11:01龙刚宇黄朝林张定宇
医学研究杂志 2024年1期
关键词:基序脓毒症关键

汪 茜 龚 睿 龙刚宇 黄朝林 张定宇

脓毒症是宿主对感染反应失调,导致危及生命的器官功能障碍综合征,与高发生率和高死亡风险相关[1]。据统计,全球每年有近5000万病例,其中超过25%~30%的患者死亡[2]。尽管目前关于脓毒症的抗生素治疗、液体复苏及器官支持技术不断改进,但其治疗前景仍不理想[3]。因此,挖掘影响预后的相关基因并探讨其指导临床诊疗的意义仍是脓毒症研究的热点。

生物信息学方法已广泛用于挖掘人类疾病进展的关键基因簇,对揭示疾病潜在的分子机制和临床诊治靶点具有重要意义[4]。脓毒症的发病机制复杂,涉及炎性反应、免疫失衡、凝血功能障碍等多个方面,既往的单基因研究并不能全面的揭示脓毒症复杂的病理生理学过程。因此,笔者从基因表达数据库(Gene Expression Omnibus,GEO)中获得脓毒症生存与死亡患者外周血基因表达数据,通过WGCNA分析,预测与脓毒症预后相关的关键基因,并进行基因本体(gene ontology, GO)及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析、转录因子富集分析、免疫浸润分析、生存分析等,旨在探索脓毒症预后相关的潜在核心基因及分子生物学机制,为寻找潜在的预测标志物与治疗靶点提供理论依据。

材料与方法

1.数据来源:通过在GEO数据库中检索关键词“sepsis”,筛选符合本研究要求的脓毒症患者基因表达数据集GSE54514、GSE65682、GSE5772,其注释平台分别为GPL6947、GPL13667、GPL4274。数据集GSE54514共有163例患者血液标本,其中纳入分析127例,包含96例(75.6%)脓毒症存活患者,31例(24.4%)死亡患者;数据集GSE65682中有脓毒症患者血液样本802例,符合纳入标准479例,其中生存组365例(76.2%),死亡组114例(23.8%)。数据集GSE5772共有94个转录组数据,健康对照组23例(24.5%),脓毒症组71例(75.5%),用于验证疾病中存在显著差异的核心基因。

2.WGCNA 和筛选关键基因:利用WGCNA-R包构建数据集GSE54514和GSE65682的基因共表达网络,先筛选出方差前5000的基因用于后续分析。基于近似无标度拓扑的标准,应用函数“sftMYMpowerEstimate”选择合适的软阈值,详细流程为:(1)计算基因之间的Pearson相关系数。(2)通过α=|cor|β构建加权基因邻接矩阵,其中α表示两个基因之间的邻近系数,cor表示两个基因之间的Pearson相关系数,β为可设定的软阈值。然后将加权邻接矩阵转化为拓扑重叠矩阵(topological overlap matrix,TOM)来估计网络连接度,运用层次聚类的方法构建TOM的聚类树结构,获得不同的基因模块。结合标本的临床数据通过计算基因显著性(gene significance, GS)与模块成员(module membership, MM)识别与脓毒症预后相关的模块和基因。本研究选取数据集GSE54514与GSE65682中与预后相关性最高的两个模块的交集基因作为关键基因。

图1 数据集GSE54514、GSE65682的WGCNA网络构建

3.基因功能富集分析:使用Metascape数据库对关键基因进行GO功能注释和 KEGG通路富集分析。最小基因重叠数(min overlap)≥3 及P<0.01即视为差异有统计学意义的通路。

4.转录因子富集分析:使用R软件中RcisTarget包构建分析,通过基因基序排名和转录因子的基序注释,来识别富集的转录因子(transcription factor, TF)结合基序(binding motifs)和候选的TF,归一化富集分数(normalized enrichment score, NES)≥3.0的基序被保留并被注释到相应的 TF进行分析。

5.免疫浸润分析:使用CIBERSORT算法对不同组患者的RNA测序数据进行分析,评估22种免疫浸润细胞的相对比例。

6.统计学方法:采用R软件对数据进行统计分析,使用Kaplan-Meier法构建生存曲线,采用Spearman相关性分析评价基因对免疫浸润的影响。以P<0.05为差异有统计学意义。

结 果

1.构建WGCNA与筛选关键基因:通过R语言WGCNA包分析数据集GSE54514、GSE65682,基于无尺度网络的标准,本研究分别选取β=5和β=12作为数据集GSE54514与GSE65682的软阈值。然后通过动态树切割算法在GSE54514和GSE65682中分别检测到9个和12个基因模块,其中GSE54514中的绿色模块(cor= 0.61,P<0.01)和GSE65682中的棕色模块(cor= 0.18,P<0.01)与脓毒症的预后相关性最高(图1中A、C)。将两个模块与脓毒症的生存表型相关联后,使用模块成员(module members,MM)相对于脓毒症生存特征的基因显著性(gene significance,GS)做散点图,可见GSE54514中的绿色模块(cor= 0.42,P<0.01)与GSE65682中的棕色模块(cor= 0.37,P<0.01)内GS和MM之间存在相关性(图1中B、D),表明两个模块中的基因与脓毒症预后相关。通过维恩图绘制GSE54514的绿色模块基因和GSE65682的棕色模块基因的交集,筛选出20个关键基因(图2)。

图2 维恩图

2.基因功能富集分析:对筛选得到的关键基因进行富集分析,设置条件为min overlap≥3及P<0.01,结果显示,基因主要富集于细胞形态调节、单核细胞迁移等通路(图3)。

图3 关键基因的功能富集分析

3.转录因子富集分析:共表达基因受转录因子等机制的共同调节。因此对关键基因的转录因子进行富集分析,包括利用累计恢复曲线进行基序富集分析、motif-TF注释以及重要基因的选择。分析结果表明,转录因子ZNF148是基因集中的主要调控因子之一(NES=4.49),motif注释为cisbp_M6552,其中LST1、CHD8等6个基因在此基序中富集。笔者对基因集中前10位的富集基序和相应的转录因子进行了展示(表1),使用RcisTarget包绘制了富集基序和相应基因的互作网络(图4)。

表1 前10位富集基序和相应的转录因子

图4 关键基因与富集基序的互作网络

4.筛选核心基因:为了进一步筛选核心基因,选取数据集GSE5772对20个关键基因进行表达差异分析。结果显示,与健康对照组比较,基因FGD3、MBP、MSN、RNF130、SETD1B在脓毒症患者中的表达显著下调(图5),这5个基因为与脓毒症预后相关的潜在核心基因。

图5 数据集GSE5772中关键基因的表达差异分析

根据NES值的大小,前10个基序在表1进行展示;/.该基序无相应的转录因子

5.免疫浸润分析:首先对数据集GSE54514和GSE65682的数据进行合并,然后通过CIBERSORT算法评估脓毒症生存组和死亡组中22种免疫浸润细胞的差异。结果显示,与生存组比较,死亡组中浆细胞、静止记忆CD4+T细胞、M2巨噬细胞显著升高;幼稚CD4+T细胞、调节T细胞(Tregs)、静止树突状细胞显著降低(图6A,P<0.05)。通过分析核心基因与免疫浸润细胞的相关性,发现5个核心基因与免疫细胞含量均有较强的相关性(图6B)。

图6 免疫浸润分析

6.生存分析:为评估筛选出的5个核心基因与脓毒症患者生存率的关系,使用Kaplan-Meier法对数据集GSE65682中基因差异表达的患者进行生存分析。结果显示,脓毒症患者中基因FGD3、MSN、RNF130高表达组的生存率高于低表达组(P<0.05),而MBP、SETD1B的表达水平与脓毒症患者的生存率无关(图7)。

图7 5个核心基因的生存曲线

讨 论

脓毒症是一种危及生命的严重感染性疾病,是危重病患者中最常见的直接死因[5]。因此,若能早期识别脓毒症可能的预后结局并采取更为精准的干预治疗,将可能显著降低脓毒症的病死率。

本研究采用两个不同的脓毒症数据集进行WGCNA分析,从而获得与脓毒症预后相关性最高的“绿色”和“棕色”模块。较单一的基因差异表达分析,WGCNA在很大程度上能更灵敏地识别具有生物意义的基因。随后对两个模块的基因取交集进行维恩分析,筛选到20个关键基因。经GO和KEGG富集分析发现,这20个关键基因主要富集在细胞形态调节、单核细胞迁移等通路。

本研究通过转录因子富集分析表明,转录因子ZNF148可能是关键基因的主要调节因子之一。有研究证实,富集在此基序上的6个基因中LST1、EFHD2和ARID3A可以调节淋巴细胞的增殖、凋亡和分化。其中主要调节因子ZNF148已被证明是细胞凋亡的重要调控因子,并且ZNF148可通过靶向特定基因在T细胞发育过程中具有重要作用[6,7]。Essien等[8]研究发现,ZNF148fl/fl小鼠较野生型小鼠感染风险更高且表现出更低的生存率。目前认为免疫细胞的凋亡是脓毒症免疫抑制的主要原因,并与继发感染风险和不良结果相关[9]。但脓毒症疾病变化过程中的淋巴细胞是否与ZNF148呈相关性还有待于进一步探索。

脓毒症是由于机体对感染反应失调导致的一种异质性综合征,个体之间具有不同的免疫状态和生物过程,其中以炎症过度激活和免疫抑制为特征的免疫失衡被认为是脓毒症发展的关键环节[10]。研究表明,脓毒症免疫功能紊乱与免疫细胞在不同阶段的反应特征密切相关[11]。本研究通过数据集GSE5772对关键基因进行表达差异分析并识别到与脓毒症预后显著相关的5个潜在核心基因。免疫浸润分析表明,这5个核心基因均与免疫细胞含量有较强的相关性,其中生存分析显示,FGD3、MSN和RNF130可作为脓毒症患者预后的重要预测指标,而且这些基因高表达的患者预后较好。

FGD3编码的蛋白主要参与调节肌动蛋白细胞骨架和抑制细胞迁移等作用。根据基因图谱中的数据,发现FGD3在T细胞、单核细胞等免疫反应细胞中高表达[12]。目前关于FGD3与脓毒症的相关报道较少,但已发现FGD3可预测乳腺癌、胰腺癌等多种癌症的良好预后[13]。Moesin是MSN编码的一种细胞骨架蛋白,在调节淋巴细胞激活和迁移及非特异性免疫等方面起到重要作用[14]。有研究表明,抑制moesin的表达可抑制脂多糖诱导的免疫细胞浸润和炎性细胞因子释放[15]。这与本研究中发现MSN在脓毒症中明显下调并与患者生存率显著相关的结果一致。RNF130编码的蛋白是一种E3泛素连接酶,属于PA-TM-RING 家族,主要参与调节细胞凋亡和自身免疫[16]。Qin等[17]研究发现,RNF130在宫颈癌中低表达并可作为疾病预后的潜在生物学标志物,可能与铁死亡和免疫细胞浸润相关。然而目前针对其与脓毒症的国内外研究较为少见。

本研究基于生物信息学分析,筛选出5个与脓毒症预后相关的潜在核心基因,这5个核心基因与免疫细胞密切相关。其中FGD3、MSN和RNF130具有作为脓毒症预后指标的潜力,可进一步为临床诊疗和药物开发等医学转化方面提供新举措。

猜你喜欢
基序脓毒症关键
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
硝酸甘油,用对是关键
带TRS基序突变的新型冠状病毒威胁更大
高考考好是关键
芥蓝Aux/IAA家族基因生物信息学与表达分析
血清IL-6、APC、CRP在脓毒症患者中的表达及临床意义
脓毒症的病因病机及中医治疗进展
脓毒症早期诊断标志物的回顾及研究进展
生意无大小,关键是怎么做?
生意无大小,关键是怎么做?