余保瑞,任静静,常爱民,石瑛,3
(1.阜外华中心血管病医院 高血压科,河南 郑州 450000;2.郑州大学第三附属医院 检验科,河南 郑州 450000;3.郑州大学 检验系,河南 郑州 450000)
冠状动脉斑块造成血管狭窄进而破裂导致心肌严重缺血、缺氧是引起心血管死亡事件的重要原因。ST段抬高型心肌梗死(ST-segment elevation myocardial infarction,STEMI)是一类严重的心血管疾病,是急性冠脉综合征(acute coronary syndrome,ACS)重要的表现形式和类型[1-2]。现阶段,针对STEMI的治疗是基于危险分层和冠状动脉病变严重程度的综合治疗。常规的冠状动脉造影及CT血管造影检查(computer tomography angiography,CTA)只能明确冠状动脉管腔是否狭窄及狭窄程度,不能有效评价斑块性质及血流动力学功能变化,更不能预测斑块破裂时间以及预判治疗后再发急性心肌梗死(acute myocardial infarction,AMI)的风险。目前,从斑块形成后致冠状动脉管腔狭窄到发生斑块破裂引发STEMI的窗口期无预测指标和确切的治疗靶点。因此,寻找有效特异的预测靶分子和预后指标对于预防和治疗STEMI具有重要的意义。本研究对基因表达数据库(Gene Expression Omnibus,GEO)中已发表的关于STEMI的相关数据进一步整合分析,以期寻找STEMI发生发展中的关键基因、涉及的信号通路,为预测STEMI的发生提供数据支持,为后续的治疗提供靶点。
1.1 获取数据资料从GEO(http://www.ncbi.nlm.nih.gov/geo)中获取与ACS中STEMI相关的两组数据集,分别为GSE66360和GSE19339。两组基因芯片数据均为基于GPL570平台的Affymetrix Human Genome U133 Plus 2.0 Array所获得的人全基因转录本生物信息。GSE66360包含99例样本(STEMI组49例和健康对照组50例),研究对象为CD146+免疫磁珠分离出的循环内皮细胞(circulating endothelial cells,CECs),同时该研究还以全血细胞进行了候选基因的验证;GSE19339包含8例样本(STEMI组和健康对照组各4例),研究对象为利用Ficoll分离液分离出的静脉全血中的白细胞。
1.2 STEMI相关差异表达基因(differentially expressed genes,DEGs)的筛选利用R语言对芯片原始数据进行分析,在基因表达数据集中提取STEMI组和健康对照组数据,利用Limma包[3]分析芯片数据的DEGs。显著差异基因的筛选条件设定为P<0.05,标准化差异倍数|log2FC|>1;运用ggplot2包绘制芯片原始的火山图。利用Venn在线工具(bioinformatics.psb.ugent.be/webtools/Venn/)生成韦恩图筛选出在GSE66360和GSE19339中同时上调或下调的DEGs并用于进一步筛选分析,以降低假阳性率,确保结果准确性。
1.3 DEGs的富集分析和通路分析利用R语言clusterProfiler包对筛选出的共同DEGs分别进行基因本体(Gene Ontology,GO)富集分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)信号通路分析,并将结果进行可视化处理。
1.4 DEGs的蛋白互作网络(protein-protein interaction network,PPI)构建和关键模块获取利用STRING数据库(https://string-db.org/)检索分子间相互作用并预测蛋白质互作关系。对STEMI芯片中107个DEGs进行PPI网络构建,导入Cytoscape软件(版本号3.9.1)进行可视化分析,利用MCODE插件对DEGs进行聚类功能模块构建,关键模块筛选标准为MCODE score>5,degree cut-off=2,node score cut-off=0.2,Max depth=100,k-score=2。
1.5 关键基因的获取及富集分析利用Cytoscape软件中cytoHubba插件,应用最大互相关方法(maximum cross correlation,MCC)算法在107个DEGs中筛选前10位关键基因,并利用R语言clusterProfiler包对关键基因进行GO富集分析和KEGG通路富集分析。
2.1 DEGs分析利用Limma包对两组数据集进行分析,见图1。数据集GSE66360(循环内皮细胞)中有439个DEGs,其中STEMI组有330个基因表达上调,109个基因表达下调(图1A);数据集 GSE19339(白细胞)中有1 699个DEGs,其中STEMI组971个基因表达上调,728个基因表达下调(图1B)。将2个数据集筛选出的DEGs进一步分析并制作交集韦恩图,得到差异共表达基因107个,其中STEMI组81个基因表达上调(图1C),26个基因表达下调(图1D)。
A为SE19339数据集火山图;B为GSE66360数据集火山图;C为共同上调DEGs的韦恩图;D为共同下调DEGs的韦恩图。
2.2 DEGs的GO富集分析和KEGG信号通路分析结果以P.adjust从小到大进行排列,展示GO与KEGG富集分析中前10位的富集结果。结果显示STEMI患者中的DEGs主要参与脂多糖的应答、对来源于细菌分子的应答、切口愈合的调节、创伤应答的负调节、细胞趋化等生物学过程;信号通路主要涉及TNF信号通路、糖尿病并发症相关的AGE-RAGE信号通路、细胞因子-细胞因子受体相互作用途径和NF-κB信号途径等。见图2。
A为共同DEGs生物学功能的柱状图;B为共同DEGs的KEGG信号通路柱状图。
2.3 DEGs的PPI网络构建结果通过STRING数据库在线分析STEMI共同DEGs的PPI关系,并导入Cytoscape软件获得可视化的PPI网络(见图3)。可视化分析所得的PPI网络共包括73个节点和408条边,其中红色节点为上调DEGs基因,蓝色节点为下调DEGs基因,节点大小按照连通度的值进行调节,节点的连通度越高,节点在PPI网络图中的权重越大。从此图中可见权重列为前5的分别是IL-1β、FN1、ICAM-1、JUN和vWF基因,其权重均≥28。
图3 STEMI相关DEGs的PPI网络相互作用图
2.4 PPI网络关键模块的筛选结果利用MCODE插件对PPI进行关键模块筛选分析,共筛选出3个重要的子模块,筛选条件为K-Core=2,Node Score Cutoff=0.2,Degree Cutoff=2,Maximum Depth=100(见表1、图4)。STEMI的子模块1分数为4.15,由12个节点(由上调DEGs组成)、54个相互作用关系构成,其中以JUN为中心节点,参与免疫细胞和免疫相关细胞的趋化作用,参与血栓的纤溶过程(见图4A);子模块2分数为2.40,由4个节点(由下调DEGs组成)、12个相互作用关系构成,4个节点蛋白为均来自GTP结合超家族,属于免疫相关的核苷酸超家族的核苷酸结合蛋白(见图4B),其表达水平降低与加快细胞凋亡有关;子模块3分数为2.25,由7个节点、18个相互作用关系构成,以骨膜蛋白为中心,参与切口愈合和心肌重塑(见4C)。
表1 STEMI相关DEGs的关键基因
A、B、C分别为模块1、模块2和模块3的PPI网络互作图。
2.5 关键基因的获取和富集分析结果利用cytoHubba插件MCC算法筛选出前10个节点的DEGs作为STEMI的关键基因(见图5A)。在STEMI发生发展中可能起关键作用的基因及其排序和权重见表2。通过对关键基因进行GO富集分析和KEGG信号通路分析,结果显示关键基因主要参与免疫细胞的迁移、趋化和免疫应答等生物过程(见图5B);信号通路主要富集于炎症相关的NF-κB信号通路、TNF信号通路和IL-17信号通路等(见图5C)。
表2 利用cytoHubba插件选择的关键基因
A为STEMI关键基因的PPI网络互作图;B为关键基因的生物学途径柱状图;C为关键基因的KEGG信号通路柱状图。
本研究通过对在GEO已发表的关于STEMI的相关数据进一步整合分析,共筛选出107个DEGs,列位前10的DEGs(IL-1β、ICAM1、FN1、vWF、PLAU、CXCL2、THBD、CCL20、CXCL3和CCRL2)主要涉及免疫炎症反应、出凝血和心脏重塑等过程。
炎症是动脉粥样硬化的理论基础,动脉粥样硬化是STEMI重要的驱动因素,因此,以往临床上常以白介素6(interleukin-6,IL-6)作为研究热点。Fan等[4]对263例首发STEMI患者进行研究,发现3 a随访期间死于心血管原因的34例患者血清IL-6水平均升高,由此得出IL-6有可能是心血管疾病死亡的独立预测因子。
但是,本研究通过整合在GEO发表的关于STEMI的数据后发现IL-6基因的表达变化差异无统计学意义,而另一个前炎症因子IL-1β列为DEGs之首。在高血压大鼠模型和单细胞RNA测序分析心力衰竭患者免疫细胞中均发现IL-1β基因表达与健康对照组差异显著[5-6]。可能是由于在心肌损伤等心血管疾病中,受损心肌细胞可通过释放细胞外ATP,触发NOD样受体蛋白3炎症小体的组装和激活,随后IL-1β被激活[7-9]。低密度脂蛋白是公认的心血管疾病的风险相关因子,其可与凝集素样氧化型低密度脂蛋白受体-1结合而启动炎症小体的级联反应,也可以促使IL-1β升高[10]。因此,Abbate等[11]用抗IL-1β单克隆抗体治疗STEMI,通过降低IL-1β水平而降低心血管事件及再发心肌梗死的风险。所以,STEMI等急性血栓性事件的部分原因可能来自IL-1β的升高,对于STEMI高危人群进行连续血清IL-1β水平检测,有助于对STEMI的再发进行评估。
在本研究中,通过cytoHubba插件筛选的另1个权重较高的基因是ICAM-1,也是紧随在IL-1β后的第2个DEGs。尽管ICAM-1在心血管事件中的预测价值还存在争议,但是在炎症状态下,IL-1β可以诱导心肌细胞膜ICAM-1(mICAM,CD54)和可溶性ICAM-1的表达,并使其与整合素结合后募集白细胞,同时,ICAM-1使炎症细胞与内皮细胞间的黏附作用进一步增强,促进炎症部位的粘连性[12-13]。这也进一步说明炎症反应参与了STEMI发生、发展的全过程。
值得注意的是在进行PPI网络关键模块的筛选时,子模块1~3中未包含IL-1β和ICAM-1,而是由趋化因子受体基因、纤溶相关基因、GIMAP家族基因、心肌重塑蛋白相关基因组成,参与免疫细胞的趋化、血栓的纤溶过程、心肌细胞的重塑等过程。但是,在所有的DEGs的PPI网络中,IL-1β和ICAM-1的权重大,互作关系复杂,这与入组病例的疾病状态和疾病发生阶段密切相关。尽管如此,在对PPI模块筛选结果的整体分析中,与炎症发生和发展过程密切相关的趋化因子受体参与的生物学过程仍占据主导地位,因此,免疫因素在STEMI发生、发展中的作用不容忽视。
总之,STEMI作为动脉粥样硬化不良结局的典型代表,如何早期发现并进行预防仍然是一个棘手的问题。通过对STEMI基因组的整合分析,进一步说明IL-1β和ICAM-1等炎症因子与患者斑块负担和心脏事件的发生和结局密切相关。血液检查是替代心脏活检的最佳方法,定期检查高危人群的IL-1β和ICAM-1等炎症因子水平,为预防STEMI发生提供了检测指标,同时也为STEMI的治疗提供了靶点和强有力的数据支持。