心肌梗死中淋巴管新生关键差异基因的生物信息学分析及防治中药的筛选*

2024-03-14 11:09齐育麟白立鼎邱先哲司雨萌李琳王炎炎陈璐李玉红
天津中医药大学学报 2024年2期
关键词:差异基因淋巴管心梗

齐育麟,白立鼎,邱先哲,司雨萌,李琳,王炎炎,陈璐,李玉红,

(1.天津中医药大学中医药研究院,天津 301617;2.天津中医药大学组分中药国家重点实验室,天津 301617)

心肌梗死(MI,以下简称心梗),是一种严重的冠心病类型,其主要特点是心肌因缺血而无法获得足够的氧气而导致的心肌坏死[1]。心肌梗死会造成多种并发症,包括心力衰竭、休克、心脏破裂等[2]。据《中国心血管健康与疾病报告2021》显示,心梗死亡率仍处于高位,每年有16.7%的心梗患者由于心力衰竭而再次入院,现已成为危害人类健康的重大卫生问题[3]。

淋巴管新生是心脏健康的重要组成部分,在修复心肌梗死造成的心肌水肿、炎症、纤维化中发挥着重要作用[4]。有研究表明,MI 后增强淋巴管内皮细胞中血管内皮生长因子受体3(VEGFR3)的表达能够促进淋巴管新生,并通过引流梗死区域的组织间液来减轻心脏水肿,进而改善心功能[5]。此外,尽管中药在治疗MI 方面显示出潜在的优势,但是关于中药通过促进淋巴管新生有益于MI 后心脏功能恢复的研究报道仍然较少。因此,本研究拟通过生物信息学分析,鉴定MI 患者中与淋巴管新生相关的关键基因,分析这些基因参与的生物途径,并利用机器学习方法筛选出核心基因。通过对核心基因和相关中药的关联分析,旨在为基于淋巴管新生治疗MI 的中药研究及临床应用提供科学依据。

1 材料与方法

1.1 数据筛选与预处理 在GEO 数据库(http://www.ncbi.nim.nih.gov/geo/)中以“myocardial infarction”为关键词检索相关数据集,根据数据集提供的相关信息,获得所需芯片GSE66360 作为训练集。GSE66360 共有99 个样品,其中包括了49 个MI 患者与50 个健康人样品。选取GSE48060 作为验证集,GSE48060 共有52 个样品,其中包括了31 个MI患者与21 个健康人样品。注释数据后通过“limma”包对GSE66360 与GSE48060 中的表达谱基因进行差异化分析,同时根据|log2FC|>1&FDR<0.05 对于基因进行差异化筛选,得到差异表达谱文件diffGeneExp。使用在线生物信息学分析工具HIPLOT 网站(http://hiplot.com.cn)对diffGeneExp进行基因聚类可视化分析。

1.2 淋巴管新生相关基因的筛选 在GeneCards 数据库(http://www.genecards.org)中以“lymphangiogenesis”为关键词检索相关基因构建淋巴管新生基因库,利用“tidyverse”包将diffGeneExp 与淋巴管新生数据库取交集,得到心梗-淋巴管新生DEGs 集。

1.3 Metascape 分析 利用Metascape 基因功能分析数据库(http://www.metascape.org)将心梗-淋巴管新生DEGs 进行初步的功能与通路分析。

1.4 功能富集分析 对于心梗-淋巴管新生DEGs进行GO 与KEGG 富集分析,使用“org.Hs.eg.db”包对于DEGs 进行GO 与KEGG 注释,使用在线生物信息学分析工具HIPLOT 网站对注释信息进行富集分析。

1.5 GSEA 富集分析 利用“limma”“org.Hs.eg.db”“clusterProfiler”与“enrichPlot”包对GSE66360 数据集进行GSEA 富集分析,以FDR<0.05 筛选在正常人与MI 患者中表达最显著的前5 条通路。

1.6 Lasso 回归筛选特征基因 利用“glmnet”包进行Lasso 回归分析,选择交叉误差最小的点筛选心梗-淋巴管新生DEGs 中的特征基因。

1.7 SVM-RFE 机器学习筛选特征基因 利用“e1701”,“kernlab”与“caret”包对心梗-淋巴管新生DEGs 进行机器学习,使用“svmRadial”方法选择交叉验证误差最小的点筛选特征基因。

1.8 交集特征基因的提取 分别提取Lasso 回归分析与SVM-RFE 机器学习中的特征基因,利用在线生物信息学分析平台微生信(http://www.bioinformatics.com)取二者交集构建特征基因集并进行可视化。

1.9 绘制受试者工作特征(ROC)曲线 利用“pROC”包绘制每个特征基因的ROC 曲线,判断特征基因在MI 中的预测诊断能力,以ROC 曲线下面积(AUC)>0.8 进行筛选,得到预测诊断效果较好的基因。

1.10 二次验证与相关性分析 利用“limma”包与“ggpubr”包对MI 相关的验证集GSE48060 中基因表达谱进行差异化分析并与预测诊断效果较好的基因进行二次验证,构建核心基因集。此外,利用“corrplot”与“circlize”包对核心基因集进行相关性分析。

1.11 免疫细胞浸润分析 基于CIBERSORT 算法,按照P<0.05 的标准计算22 种免疫细胞在GSE66360数据集样本中的占比情况,对MI 患者及健康人血液样本中的免疫细胞进行差异分析,并用“reshape2”,“ggpubr”与“ggplot2”包对结果进行可视化。

1.12 验证核心基因与免疫细胞的相关性分析 利用“limma”,“reshape2”,“tidyverse”与“ggplot2”包将核心基因与免疫细胞进行相关性分析。

1.13 心梗-淋巴管新生DEGs 的中药筛选 将核心基因作为预测靶标,在医学本体信息检索数据库(https://coremine.com)中筛选对各预测靶标具有生物学效应的前5 位中药,并进行四气五味、归经分析。

2 结果

2.1 心梗-淋巴管新生DEGs 的筛选 研究设计如图1 所示,从GEO 数据库中下载GSE66360 作为训练集,GSE48060 作为验证集开展实验。用“limma”包筛选训练集中心梗患者血液样品中的差异基因,共得到390 个差异基因,其中80 个上调基因与310个下调基因(图2A)。从GeneCards 数据库下载与淋巴管新生相关的数据集,并与训练集中的差异基因取交集,共得到26 个在心梗患者血液中与淋巴管新生存在联系的差异基因,构建心梗-淋巴管新生DEGs 集(图2B)。并对心梗-淋巴管新生DEGs 集进行基因相关性分析,结果显示除XIST 外,其他基因均表现出不同程度的协同作用(图2C)。

图1 研究设计示意图

图2 差异基因筛选

2.2 Metascape 分析 如图3 所示,将26 个心梗-淋巴管新生DEGs 输入Metasacpe,对基因的生物学功能进行初步分析,发现差异基因主要参与了白介素信号通路、脂多糖反应、细胞运动、肺纤维化与一氧化氮合成等生物学过程。

图3 Metascape 分析

2.3 功能富集分析 为进一步探究心梗-淋巴管新生DEGs 的生物学功能,对26 个差异基因进行GO与KEGG 富集分析。GO 结果显示,在生物过程中这些基因主要参与一氧化氮生物合成、脂多糖反应等方面。在细胞组分中与三级颗粒腔、血小板a 颗粒腔、内质网腔显著相关。在分子功能中与细胞因子活性、配体结合活性、黏多糖结合等生物学功能相关(图4A)。KEGG 富集分析结果,DEGs 参与了疟疾(Malaria)、白细胞介素-17(IL-17)、核因子κB(NF-κB)、肿瘤坏死因子(TNF)、脂质与动脉粥状硬化(Lipid and atherosclerosis)等信号通路(图4B)。

2.4 GSEA 分析 如图5A、5B 所示,为探究MI 患者与健康人的差异生物学功能,对GSE66360 进行GSEA 分析,结果显示正常人的基因集涉及分子功能与生物学过程主要包括了趋化因子信号通路、补体与凝血信号通路、细胞因子-受体相互作用通路,而MI 患者基因集涉及分子功能与生物学过程主要包括了N 聚糖生物合成信号通路、核苷酸切割修复信号通路、免疫缺陷等信号通路。

图5 GSEA 分析

2.5 机器学习模型与关键基因筛选 为了评价心梗-淋巴管新生DEGs 的诊断潜力,分别用Lasso 回归与SVM-REF 机器学习的方法对心梗-淋巴管新生DEGs 进行筛选,以均方误差最小时为最佳诊断模型,可见Lasso 回归分析筛选得到15 个基因构成的诊断模型(图6A)。SVM-RFE 算法共筛选出了28 个特征基因(图6B),将Lasso 与SVM-RFE 算法得到的特征基因取交集,共鉴定出15 种特征基因(ADM、AREG、CEBPD、EDN1、EPAS1、IL1B、IL1RN、PELI1、PFKFB3、PLAU、SULF2、THBS1、TNF、TNFAIP6、XIST)用于后续分析(图6C)。

图6 机器学习模型与关键基因筛选

2.6 二次验证与相关性分析 如图7A 所示,对上述的15 个特征基因绘制ROC 曲线,以ROC 曲线下面积>0.8 进行筛选共得到了11 个预测诊断基因(ADM、AREG、EDN1、EPAS1、IL1B、IL1RN、PELI1、PFKFB3、PLAU、SULF2、THBS1)。此外,对验证集GSE48060 表达谱进行基因差异化分析,与11 个预测诊断基因进行对比,最终得到了4 个在两个数据集中均具有预测诊断价值的核心基因(ADM、IL1B、IL1RN、PFKFB3)(图7B)。并对这4 个核心基因进行基因间相关性分析,结果显示4 个基因均呈正相关(图7C)。

图7 二次验证与相关性分析

2.7 免疫浸润分析 如图8 所示,对GSE66360 数据集进行免疫浸润分析,结果显示与健康人相比,MI 患者血液样品中含更高的滤泡辅助性T 细胞、调节性T 细胞、静息NK 细胞、活化的NK 细胞、单核细胞、M2 型巨噬细胞、活化的树突状细胞、活化的肥大细胞、嗜酸性粒细胞与中性粒细胞,与此同时,MI 患者的CD8T 细胞、CD4 记忆T 细胞、γδT 细胞与M0 巨噬细胞的数量显著下降。

图8 心梗的免疫浸润分析

2.8 核心基因与免疫细胞的相关性分析 如图9所示,通过对免疫细胞与核心基因进行相关性分析,结果显示PFKFB3 与调节性T 细胞呈负相关;IL1RN、IL1B 与活化肥大细胞、中性粒细胞、活化NK 细胞等免疫细胞呈正相关,而与CD4 记忆T 细胞、静息肥大细胞呈负相关。此外,ADM 基因高表达时,活化肥大细胞、中性粒细胞与嗜酸性粒细胞的数量也会同时增多。

图9 淋巴管新生与免疫细胞的相关性分析

2.9 核心基因的中药筛选 经过筛选共得到了18味中药(图10A)。四气五味、归经分析结果显示,药物四气多为寒、温,五味多属苦、甘、辛,归经主要集中于肺、肾、脾经(图10 B、10C、10D)。

图10 中药筛选与分类分析

3 讨论

MI 是由动脉斑块引起进入心脏的携氧血液减少而导致的缺氧性心肌损伤,常伴随着炎症、水肿与心肌纤维化,其临床表现为胸痛、呼吸急促、出汗、心脏跳动异常等[6]。尽管近年来在MI 治疗方面取得了进展,如连续药物治疗、经皮冠状动脉介入手术治疗等,但MI 发病率和死亡率仍处于高位。因此寻找新的治疗方式,特别是治疗靶点,对预防疾病的进一步发展具有重要意义[7]。

淋巴管系统几乎渗透到所有组织与器官,在维持间质体液稳态与免疫监控中发挥着重要作用[8]。近年来,越来越多的证据表明淋巴管新生在修复心肌梗死造成的心脏损伤中发挥着重要的作用。心肌梗死后渗出的炎性细胞会产生血管内皮生长因子VEGF-C 与VEGF-D,使附近淋巴管中的VEGFR表达增多,促进梗死边缘区与梗死区的淋巴管新生,引流梗死区的组织间液,排出缺氧后的组织代谢产物,缓解心脏水肿,改善心脏功能[9]。在本研究中,GO富集分析显示交集基因主要与一氧化氮合成、脂多糖反应等生物学功能相关。KEGG 富集分析结果显示基于淋巴管新生治疗MI 可能与疟疾、IL-17、NFKB、TNF 等信号通路有关。IL-17 信号通路可刺激VEGF-C 的产生促进淋巴管新生[10],而是否能够通过干预该通路治疗MI 还有待进一步的研究。

基于机器学习算法,本研究中共筛选4 个具有诊断意义的核心基因。PFKFB3 是一种将果糖-6-二磷酸转化为果糖-2,6-二磷酸的代谢酶,是限速酶磷酸果糖激酶-1 最有效的变构激活剂[11],其生物学活性主要是通过激活磷酸果糖激酶-1 参与糖酵解反应。有研究表明靶向抑制PFKFB3 被证实与淋巴管新生相关,其作用机制可能是通过抑制巨噬细胞中PFKFB3 的表达,刺激该免疫细胞中VEGF-C的产生,进而促进了淋巴管新生[12-13]。然而本研究仅发现PFKFB3 与适应性T 细胞呈负相关,并未发现PFKFB3 与巨噬细胞之间的相关性,是否适应性T细胞中的分泌的某种信号因子影响了巨噬细胞中PFKFB3 的表达还有待进一步研究。IL1RN 具有编码IL-1Ra 的功能,有证据表明上调IL-1a 可以减少IL-1 引起的炎症反应[14]。本研究发现IL1RN 在MI患者为上调基因,目前尚未有关于IL1RN 基因与淋巴管新生和MI 的文献报道。IL1B 又称分解代谢素,是白细胞介素-1 细胞因子家族的成员。IL1B 参与多种自身免疫性炎症反应和多种细胞活动,包括细胞增殖、分化和凋亡[15]。越来越多的证据表明IL1B与MI 的治疗相关。在MI 大鼠模型中,microRNA-132 通过下调IL-1B 抑制心肌梗死后的大鼠心肌细胞凋亡改善心脏功能[16]。ADM 是一种在心脏、血管内皮细胞、血管平滑肌细胞中均有所表达的血管扩张肽[17],有研究发现ADM 与淋巴管新生相关,在ADM 过表达小鼠心梗模型中发现ADM 可以通过Cx43 驱动淋巴管新生与心脏功能恢复[18]。

中医将MI 归属于“心痛”“胸痹”范畴[19],其发病因素复杂,主要有寒邪内侵、饮食不节、情志失调、年老体弱等,其病机属本虚标实,虚为阴阳气血亏虚,实为阴寒、痰浊、瘀血。本研究对心梗-淋巴管新生核心基因进行中药预测与筛选,发现预测的药物四气或温或寒,针对阴阳气血亏虚,多用温药以补阳虚,寒药以补阴虚;五味多属苦、甘、辛,针对MI的阴寒、瘀血的病因病机,用辛味中药温通、散寒、活血;针对致病因素痰浊,辛苦类中药多温燥化寒痰,甘苦咸凉类中药化热痰。归经主要集中于肺、肾、脾经,与众多学者从肺、肾、脾论治胸痹的观点一致[20]。

综上,本研究以生物信息学、Lasso 回归、SVMRFE 机器学习等方法对于MI 患者血液中与淋巴管新生相关的差异基因进行筛选,共得到了4 个具有潜在治疗意义的基因靶点(PFKFB3、IL1B、IL1RN、ADM),同时基于这4 个靶点预测了相关防治中药,为后续基于淋巴管新生研究治疗MI 的中药奠定了坚实的基础[21-22]。

猜你喜欢
差异基因淋巴管心梗
心梗猛于虎
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
诱发“心梗”的10个危险行为
肺淋巴管肌瘤病肺内及肺外CT表现
胸内淋巴管瘤诊治进展
心肌梗死常规检查漏诊率高,近2/3患者被遗漏
紫檀芪处理对酿酒酵母基因组表达变化的影响
β2微球蛋白的升高在急性心梗中预测死亡风险的临床意义
聚桂醇治疗左腋下巨大淋巴管瘤1例
SSH技术在丝状真菌功能基因筛选中的应用