基于生物信息学及机器学习算法筛选脓毒血症铁死亡相关基因的研究分析

2023-07-22 05:18徐波邵碧波
国际医药卫生导报 2023年13期
关键词:毒血症性反应核心

徐波 邵碧波

1黄石市中心医院(湖北理工学院附属医院)急诊医学科,黄石 435000;2肾脏疾病发生与干预湖北省重点实验室,黄石 435000

脓毒血症是临床较为常见的一种危急重疾病,由明确或未知感染导致病原菌进入患者血液循环系统,继而引发严重的全身性炎性反应[1]。一项统计近40年来全球脓毒血症相关数据显示,高收入国家中该病每年患病人数由1 940千万升至3 150 千万,其院内病死率高达17%~26%[2]。庞大的发病人群以及不低的病死率无疑是基础和临床工作者所面临的巨大且棘手的“挑战”。脓毒血症患者早期症状不典型导致早期诊断困难,且其发病的分子机制尚未得到明确阐明。因此,积极寻求该疾病相关的敏感生物标志物,不仅有益于临床医生采取合适的临床决策,而且能够提供新的治疗靶点,最终有效改善患者预后。铁死亡是一种依赖铁的特殊细胞死亡方式,其主要机制是随着铁离子浓度的升高,进而抑制谷胱甘肽-过氧化物酶活性、而活性氧自由基和脂质过氧化物增多[3]。目前,已有大量可信的证据表明,铁死亡参与了许多肿瘤的发生和发展[4],也有研究发现,其参与了包括脓毒血症在内等多种非肿瘤疾病的进程中[3,5]。但目前缺乏对铁死亡相关基因在脓毒血症中作用和相关机制的系统研究。本研究拟通过公共数据库,通过生物信息学联合机器学习算法筛选脓毒血症中的核心铁死亡相关基因,明确其中诊断价值较高的铁死亡相关生物标志物,继而为脓毒血症的诊断和治疗提供一定理论依据。

资料与方法

1.脓毒血症测序样本的获取

在公共数据库GEO(Gene Expression Omnibus)中以“sepsis”为关键词检索,获取GEO数据中的GSE185263芯片中所有数据,其中包括348 例脓毒血症患者和44 例正常人群的全血样本RNA测序数据以及一般临床资料。

2.基因数据库处理方法

首先使用R 语言(4.1.3版本)包将“Ensemble gene id”转化为基因名字,然后将基因表达的count 值转化为FPKM值。进一步用Sva 包对基因表达矩阵进行校正后,从midsigib 网站中获取382 个铁死亡相关基因,获取382 个基因在348例脓毒血症患者和44例正常人群的全血样本的表达含量矩阵后,用limma包筛选脓毒血症和正常人群中差异表达基因(differentially expressed genes,DEGs),筛选条件为log2FC 绝对值>2 和校正后的P<0.05,分别用ggpolt2 包和pheatmap包绘制DEGs的火山图和热图。

3.DEGs功能注释和富集分析

用R 语言软件的Bioconductor 包对DEGs 分别进行基因本论(gene ontology,GO)富集分析、京都基因与基因组百科全书(Kyotoencyclopedia of genes and genomes,KEGG)通路分析。另外疾病本体(disease ontology,DO)富集分析与脓毒血症关系密切的其他疾病。

4.机器学习算法筛选核心铁死亡相关基因

具体机器学习算法采用最小的绝对值∕收敛∕选择算子(LASSO)、支持向量机-递归的特征消除(SVM-RFE)。LASSO 和SVM-RFE 分别由glmnet 包和e1071 包完成,最后取两者的交集作为核心铁死亡相关基因。

5.铁死亡核心基因的验证以及诊断价值分析

另将GSE 芯片作为外部验证的数据集,分析机器学习筛选的核心铁死亡相关基因在脓毒血症和正常对照组之间的表达,另外也根据受试者工作特征曲线(receiver operating characteristic curve,ROC)来评估相关基因的诊断价值。

6.预测列线图模型的构建

利用5 方法中获取的铁死亡核心基因的表达含量,在其基础上采用逻辑回归来构建列线图的预测模型,预测脓毒血症的发生,另外采用ROC评估其诊断价值。

7.免疫浸润分析

基于22 种人类免疫的细胞亚型的基因表达矩阵,采用CIBERSORT 算法进行卷积分析,从而计算每个样本中免疫细胞的比例,以P<0.05 为脓毒血症和正常对照组之间免疫细胞浸润有差异。利用R 语言“graphics”包的barplot 函数绘制两组样本中每种免疫细胞构成比的柱状图;利用R 语言中的“corrplot”包对脓毒血症患者外周血清中的免疫细胞进行相关性分析;利用R语言中的“vioplot”包对脓毒血症患者和正常人群外周血清中免疫细胞占比进行比较分析并绘制小提琴图。

结果

1.脓毒血症和正常人群中的铁死亡相关DEGs提取

根据方法里所提的筛选标准,获得43 个表达下调的DEGs、44 个表达上调的DEGs,绘制的火山图和热图分别见图1A和图1B。

图1 脓毒血症铁死亡相关的差异表达基因(DEGs)的火山图(A)和热图(B)

2.DEGs相关功能分析结果

GO 富集显示铁死亡相关的DEGs生物学过程主要富集在氧化应激、凋亡信号的调控路径、细胞衰老、神经元死亡的调节等方面;在细胞组分富集在自噬体、核包膜和二级溶酶体等方面;在分子功能富集在促分裂原活化蛋白激酶(MAP 激酶)的激酶活性、铁离子结合等方面(图2A)。KEGG 通路主要富集在FoxO 信号传导途径、缺氧诱导因子(HIF)-1 信号传导途径、PI3K-Akt 信号传导途径和铁死亡等方面(图2B)。DO 分析结果显示脓毒血症与神经系统肿瘤、神经母细胞瘤、骨癌等疾病关系密切(图2C)。

3.机器学习筛选脓毒血症患者铁死亡相关的核心基因

用LASSO 回归和SVM-RFE 对87个DEGs进行筛选,分别获得了20 个、25 个基因,取两者交集获得了5 个基因PRDX1、IDH1、DUSP1、YWHAE和SOCS1,见图3。

4.铁死亡相关的核心基因的表达外部验证

在GSE154918 芯片中,PRDX1、IDH1、DUSP1、YWHAE和SOCS1 在脓毒血症患者中表达均上升(均P<0.05),见图4。

图4 脓毒血症铁死亡相关核心基因的表达验证:DUSP1(A)、IDH1(B)、PRDX1(C)、SOCS1(D)和YWHAE(E)

5.基于铁死亡相关的核心基因构建的列线图的诊断价值

GSE185263 和GSE154918 中,PRDX1、IDH1、DUSP1、YWHAE 和SOCS1 基因的诊断价值均较高[曲线下面积(AUC)均>0.7],具体见图5,另外基于上述基因表达矩阵通过逻辑回归构建的列线图如图5 所示,且两个芯片的AUC分别为0.958(0.935~0.978)和0.981(0.951~0.999),均具有极高的诊断价值。

图5 脓毒血症铁死亡相关的核心基因(PRDX1、IDH1、DUSP1、YWHAE 和SOCS1)预测脓毒血症列线图(A)、受试者工作特征曲线(ROC)(B)和外部验证列线图(C)、ROC(D)

6.免疫细胞浸润分析

根据GSE185263 芯片的基因表达矩阵,22 种不同免疫细胞在各个样本中浸润程度分布差异,见图6A。相关性分析结果显示,静止的自然杀伤(NK)细胞和CD8+ T 细胞之间的关系最为明显,两者浸润程度呈正相关(r=0.60),其余免疫细胞相关性见图6B。同正常人群比较,脓毒血症患者中浸润程度有差异的免疫细胞(P<0.05)包括13 种,其中幼稚B 细胞、CD8+ T 细胞、CD4+记忆静止T 细胞、滤泡辅助性T 细胞、静止NK 细胞、静止树突状细胞、活动期树突状细胞活动受到抑制,浆细胞、幼稚T 细胞、活动期记忆CD4+ T 细胞,δ T细胞、巨噬细胞M0、中心粒细胞活动活跃,见图6C。

图6 免疫细胞浸润分析:每个样本中22种免疫细胞的比例柱状图(A)、22种浸润性免疫细胞的相关热图(B)、正常对照组和脓毒血症组的22种免疫细胞免疫浸润程度差异(C)

讨论

脓毒血症的发病率有逐年升高的趋势,且病死率不低,这给个人和社会均带来了沉重的负担。有研究指出,提高脓毒血症的早期确诊率,继而尽早做出正确的临床决策,有助于患者预后的改善[6]。而常规的临床检查指标对于脓毒血症患者早期诊断灵敏度和特异度均不高,临床上亟需寻求更加敏感且特异度高的生物标志物或更为精确的诊断模型。近年来,基于机器学习算法的各种预测模型,已经广泛应用于各种疾病中。如范可欣等[7]基于孕妇的临床信息和相关检查结果,利用机器学习构建了预测胎母输血综合征发生的临床模型,该模型在内部验证和外部中均表现了较高的预测价值(AUC 值均>0.8)。宿家铭等[8]基于公共数据库,针对2 型糖尿病肾病肾小管间质损伤,利用机器学习筛选出具有高预测价值的核心基因。本研究结果显示,通过LASSO 和SVM-RFE 算法,筛选出5 个铁死亡相关核心基因(PRDX1、IDH1、DUSP1、YWHAE 和SOCS1),对于脓毒血症均具有较高的诊断价值,在内部和外部验证中所有AUC 值均>0.7。而基于其表达含量所构建的临床预测列线图,在内部验证AUC 值高达0.958,而外部验证数据集中的AUC为0.981,这表明机器学习在面对医疗临床相关的复杂数据,具有强大且可靠的分析和预测能力。

铁死亡是近年来基础和临床的研究热点,已有研究通过体内和体外研究发现,其对肿瘤具有抑制作用。如有研究发现,鲁斯可皂苷元可以通过诱导铁死亡的发生,继而促进胰腺癌细胞发生死亡[9]。在动物实验中,也有研究发现化瘀祛痰方能够抑制p53∕xCT∕GPX4 信号通路的激活,促进肝细胞发生铁死亡,从而降低了小鼠肝癌的发生率[10]。在非肿瘤疾病中,也有大量可信的证据表明铁死亡参与其发生发展。如李秋畅等[11]发现,抑制铁死亡的发生能够保护脑出血大鼠的神经功能。刘畅等[12]研究结果显示,铁死亡的抑制能够改善心肌梗死的大鼠模型的心肌功能。铁死亡与脓毒血症同样关系密切[13]。如在一项动物模型研究发现,铁死亡在脓毒血症导致急性肺损伤小鼠模型中表现活跃[14]。Li等[15]体外研究发现,Sesn2能够通过保护树突状细胞而抑制脓毒血症诱发的铁死亡发生。但铁死亡在脓毒血症中的研究相当有限。本研究通过对于348 例脓毒血症患者和44 例正常人群的相关数据挖掘,最终获得PRDX1、IDH1、DUSP1、YWHAE 和SOCS1 5个铁死亡相关核心基因,此外,外部验证中,也证实上述基因在脓毒血症患者外周血中表达含量较正常对照组均上升。在脂多糖诱导的脓毒血症小鼠模型中,发现PRDX1 同小鼠炎性反应严重程度呈正相关关系[16],但其是否通过铁死亡而调控炎性反应需进一步研究和证实。Wang 等[17]研究也发现IDH1 在脓毒血症患者外周血中表达升高。DUSP1也被发现参与脓毒血症中炎性反应的调控[18]。目前,尚无关于YWHAE 和脓毒血症的研究,YWHAE 在乳腺癌中表现为癌基因[19]。在小鼠动物模型中,发现小鼠外周血中SOCS1 的含量同脓毒血症的严重程度呈正比[20]。但上述基因是否通过铁死亡而参与脓毒血症的发生发展,仍需进一步开展这种高级别证据予以证实。

近年来,免疫微环境在各种疾病中的重要作用逐渐被人们所重视。如研究发现,由于免疫微环境的异质性,导致肿瘤患者对于免疫治疗响应结果不同[21]。免疫微环境在脓毒血症中的作用机制也受到医学界所重视[22]。脓毒血症是一种同机体免疫功能关系密切的疾病,炎性反应导致患者体内的免疫细胞功能异常,而紊乱的免疫细胞可能导致其分泌细胞因子失衡,而加重机体内的炎性反应。本研究结果显示,在正常对照组和脓毒血症组中,13种免疫细胞浸润程度表现差异。大部分同炎性反应关系密切的巨噬细胞、浆细胞和中性粒细胞表现为在脓毒血症患者中活动活跃,而对炎性反应具有保护作用的CD8+ T 细胞和树突细胞活动受到抑制,国外有研究通过单细胞测序也揭示了免疫微环境在脓毒血症患者中的异质性[23]。这为临床上治疗脓毒血症患者提供理论基础和新的治疗靶点。

总之,基于GEO数据库和机器学习算法,我们筛选出关于脓毒血症患者诊断的铁死亡相关核心基因。并通过生物信息学的方法,为上述基因的功能作用提供理论依据。另外不仅为早期诊断脓毒血症提供新且敏感的生物标志物,而且还为其治疗提供新的靶点。但需开展前瞻性、多中心的研究,并进行体内体外实验,继而提高本研究的循证医学级别。

猜你喜欢
毒血症性反应核心
我是如何拍摄天和核心舱的
近观天和核心舱
你好!我是“天和”核心舱
肠道菌群失调通过促进炎性反应影响颈动脉粥样硬化的形成
羊肠毒血症的防与治
促酰化蛋白对3T3-L1脂肪细胞炎性反应的影响
一起山羊肠毒血症的诊断与防治
羊肠毒血症的中西医治疗
核心价值观 要害在核心
益生菌对结直肠癌术后患者免疫力和炎性反应的影响