李 雪,冯彦超,牟华明,乐 暾
冠心病是指冠状动脉粥样硬化引起冠状动脉狭窄或闭塞,导致心肌缺血缺氧或心脏坏死,通过各种作用机制导致一系列不良后果,甚至出现心脏性猝死。目前,冠心病已严重威胁到中老年人群的健康[1]。近年来,基因表达谱数据快速增长,利用生物信息学方法对基因表达谱数据进行深入挖掘成为新的研究热点,既往对冠心病的基因研究多聚集在微小RNAs(microRNAs)上,已有研究证实,冠心病的病理生理过程与microRNAs密切相关[2],但对冠心病病人表达的其他基因认识不足且其他基因是否为冠心病的新型治疗靶点研究较少。本研究使用GEO数据库寻找冠心病病人相关基因芯片、绘制Venn图寻找共同表达的差异基因,运用京都基因与基因组百科全书(KEGG)、STRING等数据库寻找共同差异表达基因之间的联系,进一步寻找冠心病的特征性基因,以期为冠心病早期诊断及特异性靶向治疗提供依据。
进入GEO数据库(www.ncbi.nlm.nih.gov/geo),在输入框中输入“coronary disease” AND “coronary heart disease”,检索现有的冠心病基因芯片数据集,获取两个数据集GSE71226、GSE98583。GSE71226以外周血为研究组织,共纳入6名研究对象,其中3例为冠心病病人,3名为正常人;GSE98583以全血为研究组织,共纳入18名研究对象,6例为单支血管病变的冠心病病人,6例为三支血管病变的冠心病病人,6名为无血管病变的正常人。
2.1 差异表达基因的分析 利用GEO数据库的GEO2R在线分析工具寻找差异表达基因。将GSE71226中的3例冠心病病人样本作为试验组,3名正常人样本作为对照组;GSE98583中的12例存在血管病变的病人样本作为试验组,6名无血管病变的正常人样本作为对照组,分析两个基因集差异表达基因。将从GEO数据库检索到的且差异倍数≥1、P<0.05的基因作为差异表达基因。详见表1、表2。
表1 GSE98583中的部分差异表达基因
表2 GSE71226中的部分差异表达基因
2.2 共同表达差异基因的分析 将两个芯片中(GSE71226、GSE98583)选择的差异表达基因进行Venn图分析,寻找共同表达差异基因,存储后以供分析。详见图1。
图1 共同表达差异基因Venn图
2.3 基因本体(GO)富集分析 利用DAVID网站将共同表达差异基因进行GO富集分析,GO分析发现共同表达差异基因功能主要集中在以下几个方面:1990440 RNA聚合酶Ⅱ启动子转录对内质网应激的正调控(positive regulation of transcription from RNA polymerase Ⅱ promoter in response to endoplasmic reticulum stress);0021549小脑发育(cerebellum development);0005783内质网(endoplasmic reticulum);0070062胞外小体(extracellular exosome);0005615胞外间隙(extracellular space);0005654核质(nucleoplasm);0005515蛋白质结合(protein binding);0019838生长因子结合(growth factor binding);0004872受体活性(receptor activity)。详见表3。
表3 共同差异基因GO富集分析
2.4 KEGG通路分析 利用DAVID网站将共同表达差异基因进行KEGG通路分析,发现了1条关键途径,即酪氨酸激酶-信号转导子和转录激活子(Janus kinase-signal transducer and activator of transcription,JAK-STAT)信号转导途径(P<0.05)。详见表4、图2。
表4 共同差异基因KEGG通路分析
图2 JAK-STAT信号通路(五星位置为本研究中蛋白)
2.5 蛋白-蛋白相互作用(PPI)网络分析 通过STRING网站对共同表达差异基因行PPI网络分析,发现IL6ST与SOCS1联系较紧密。详见图3。
图3 共同差异基因PPI网络
冠心病是一种常见的慢性疾病,若不及时诊治,病人生命安全及生活质量将受到严重的影响[3-4]。有研究显示,冠心病已成为因病死亡的首要原因[5],评估部分心血管危险因素在疾病预防和预后方面起重要作用,但完全预测复发事件略显不足[6-7]。一些分子标志和血清炎症标志物虽然在这方面获得了越来越多的关注,仅适当增加了预测能力[8]。因此,寻找敏感的疾病标志物以揭示疾病的初始失调和潜在机制是目前研究需解决的问题。
本研究通过生物信息学方法,筛选GEO数据库中现有的芯片数据,获得两个有关冠心病的基因集,与正常人进行对照,对两个基因集取交集,获得50个共同表达差异基因,进一步对共同表达差异基因进行相关分析,对冠心病病人体内差异基因进一步分析。通过对共同表达差异基因进行GO富集分析,发现有统计学意义的是小脑发育、内质网、胞外小体这一系列功能;通过进行KEGG通路分析,发现有统计学意义的是JAK-STAT信号通路,该通路中部分成员在心肌中表达[9]。相较于其他信号通路,该通路涉及多个病理生理过程[10],且对心肌血管的生成及缺血心肌的保护也有一定作用[11]。通过分析发现,IL6ST、PIAS2、SOCS1这3个冠心病基因参与该通路,相关研究证实,SOCS1通过升高体内促炎细胞因子水平进而参与冠心病发病[12]。关于IL6ST及PIAS2与冠心病之间的关系未见相关研究。
目前医疗诊治手段不能完全治愈冠心病,虽然部分病人行经皮冠状动脉介入术治疗,但术后需长期口服药物治疗。介入治疗虽然可有效开通部分血管,但无法逆转其生物学进程。部分病人术后出现冠状动脉再狭窄现象,导致病人再次选择介入术开通血管或其他有效治疗方法,从而增加医疗开支[13]。有研究表明,动脉粥样硬化的发生与JAK-STAT通路介导的炎症反应有关[14]。本研究未对该信号通路涉及冠心病的基因进行研究,通过基因芯片方法,寻找出IL6ST、PIAS2及SOCS1这3个基因,该结果为早期诊断冠心病提供可能,并成为潜在治疗靶点,通过对上述3个基因的提前检测,可减少病人后续的医疗费用并提高后期的生活质量。