崔胜宇,徐 林,浦 湧,夏 豪
(1. 武汉大学人民医院心内科,武汉大学心血管病研究所,心血管病湖北省重点实验室,湖北 武汉 430060;2. 武汉市汉南区人民医院,武汉大学人民医院汉南医院,湖北武汉 430060)
心肌梗死(MI)是最严重的心血管疾病之一,发病率和死亡率很高[1],主要是由于多种原因包括冠状动脉内血栓形成导致的冠脉长时间闭塞,引起心肌细胞缺血缺氧后坏死。血小板在冠脉内血栓形成过程中发挥重要作用,血小板的聚集和功能活化是导致MI 的重要原因之一,因此临床针对心血管疾病的治疗最常见的手段之一就是抗血小板治疗。相关研究表明,检测分析血小板RNA 的表达可以为血小板的正常止血和血栓形成功能,以及血小板如何参与心梗发作,反应和预后提供新的见解[2]。本文通过检索挖掘GEO 数据库,利用生物信息学的相关方法,筛选心梗患者与正常人血小板miRNA及mRNA 差异表达基因,构建miRNA-mRNA 调控网络,并对结果进行生物学功能及信号通路富集分析,揭示血小板的表达与功能改变。
在GEO 数 据 库(https://www.ncbi.nlm.nih.gov/geo/)分别检索心梗病人的miRNA 及mRNA表达谱芯片数据。 miRNA 芯片数据来源于GSE24548,mRNA 芯片数据来源于GSE24519。
使用GEO 数据库下的GEO2R 进行表达谱数据分析,GEO2R 是基于R 语言的在线分析工具,使用到Biobase、GEOquery 及limma 包进行数据分析,以|logFC|>1、P<0.05 为筛选条件进行差异miRNA 及mRNA 的筛选。使用R 语言中的ggplot2 包进行差异miRNA 的火山图绘制。
使用FunRich 3.1.3 软件中的寻找miRNA 靶基因功能进行miRNA 的靶基因预测,而后运用Perl语言脚本,对预测的靶基因与差异mRNA 取交集并与miRNA 交叉匹配,即高表达的miRNA 与低表达的mRNA 匹配,低表达的miRNA 与高表达的mRNA 匹配,最终得到miRNA-mRNA 对应调控关系文件。
利用miRNA-mRNA 对应调控关系文件在JAVA 环境下使用Cytoscape 3.8.0 进行调控网络可视化,构建miRNA-mRNA 调控网络。
利用和R 语言的clusterProfiler、org.Hs.eg.db、enrichplot、ggplot2 包对交集中的基因进行KEGG 富集可视化分析及GO 可视化分析,设定参数“Pvalue cutoff =0.05,Q value cutoff =0.05”。利用Perl 语言脚本和R 语言的digest、GOplot 包对KEGG 富集结果进行圈图绘制。
miRNA 芯片数据(GSE24548)共筛选到差异miRNA 27 种,mRNA 芯片数据(GSE24519)共筛选到差异mRNA 2 897 个,图1 示差异表达的火山图。
图1 miRNA 及mRNA 差异表达火山图Fig 1 Volcano map of differentially expressed miRNA and mRNA
27 种差异miRNA 共预测到靶基因3 563 个,与差异mRNA 取交集后得到376 个共同基因,这些共同基因与miRNA 交叉匹配后,共得到503 个miRNA-mRNA 调控关系,在大部分调控关系中,miRNA 呈现表达下调(绿色),与之对应的mRNA呈现上调(红色)。使用Cytoscape 3.8.0 进行网络可视化作图,见图2。
图2 miRNA-mRNA 调控网络Fig 2 miRNA-mRNA regulation network
对调控网络图(图2)中的靶基因进行KEGG 富集分析(图3),结合富集基因数及调整后P值,排名前五的信号通路包括:PI3K-AKT 信号通路、肌动蛋白细胞骨架的调节、MAPK 信号通路、人乳头瘤病毒感染、Ras 信号通路,而低表达的基因中富集结果主要涉及GAB2、ITGB8、PAK1、LPAR2 基因,主要富集PI3K-AKT 信号通路、肌动蛋白细胞骨架的调节两个通路(图4)。
图3 靶基因KEGG 富集分析Fig 3 KEGG enrichment analysis of target genes
图4 KEGG 富集分析圈图Fig 4 Circle graph of KEGG enrichment analysis
对调控网络图(图2)中的靶基因进行GO 分析(图5),展示了生物过程(BP)、细胞组成(CC)、分子功能(MF)的前10 个最显著的GO Term。 BP中靶基因主要涉及轴突发生、轴突树突状蛋白转运、基于微管的转运、细胞骨架依赖性细胞内转运、呼吸管发育、沿微管运输、发育参与形态发生、高尔基小泡运输、在子宫内胚胎发育中、突触组织。CC中靶基因主要涉及神经脊柱、树突棘、突触后膜、突触后专业化、突触后密度、不对称突触、神经元到神经元突触、突触膜、突触前、网格蛋白包被的囊泡膜。MF 主要涉及蛋白质大分子衔接子活性、分子衔接子活性、DNA 结合转录阻遏物活性等。
图5 靶基因GO 分析Fig 5 GO analysis of target genes
心肌梗死的发生与粥样斑块破裂继发的血栓形成关系密切,血小板在血栓形成中又起主导作用,因此,探寻心梗病人血小板中基因的差异表达就显得很有意义。本研究比较了急性心梗病人血小板中差异表达的miRNA,由于miRNA 主要发挥负性调节靶基因的作用[3],因此我们通过预测软件进行了其靶基因的预测,并与芯片数据筛选出的差异mRNA 取交集,再通过Cytoscape 基因互作分析软件做出了miRNA-mRNA 调控关系网络,最后通过R 语言的方法绘制出了靶基因富集的的KEGG与GO 分析,揭示了血小板基因在心梗中的差异表达及可能作用,为可能的靶向干预治疗提供了一个方向。
经火山图可以看出,miRNA 芯片数据大部分呈现低表达,mRNA 芯片数据大部分呈现高表达,说明两芯片数据较为一致。调控网络中的miRNA 与心 血 管 疾 病 密 切 相 关:Zhou 等[4]的 研 究 发 现miR-29b-3p 可通过调节TGFβ1/Smad3 通路在缺氧的心肌细胞中发挥保护作用;miR-19a-3p 被报道在缺血性脑卒中中参与了炎症反应,血液凝固和血小板活化[5];miR-32-5p 可调控人心脏成纤维细胞的凋亡,增殖和表型变化[6];miR-142-3p 可从活化的血小板经血小板衍生微粒传递到内皮细胞中促进高血压中内皮细胞的增殖[7];循环中miR-133b 的水平也被证实与接受冠脉介入治疗的心梗患者的临床预后 密 切 相 关[8];此 外,Weng 等[9]的 研 究 发 现 抑 制miR-34a-5p 可能通过刺激CTRP9 的表达促进脂肪干细胞对心梗损伤的保护功能。
对网络图中的靶基因进行KEGG 富集分析显示,靶基因主要参与PI3K-AKT 信号通路。PI3K-AKT 通路已被报道广泛参与各种原因所致的血小板的活化过程并直接参与整联蛋白功能的调节[10-12],在心梗发生过程中发挥重要作用。MAPK信号通路也被报道广泛参与血小板的聚集、钙动员、颗粒分泌和纤维蛋白原与整联蛋白αIIbβ3 的结合[13,14]。同样的,Ras 信号通路与血小板的活化也密切相关[15]。血小板的活化在心梗发生过程中占据重要作用,其活化后通过黏附、聚集、释放等机制参与血栓形成。因此,针对这些富集的通路,我们应该可以调控血小板活化进程,对血栓的形成进行靶向干预。
对网络图中的靶基因进行的GO 分子功能分析显示,靶基因主要涉及蛋白质大分子衔接子活性、分子衔接子活性、DNA 结合转录阻遏物活性等功能,这些功能都提示了血小板的活化过程,揭示了血小板的激活在心梗发生过程中的重要作用。
综上所述,本研究通过生物信息学的方法筛选出了心梗病人血小板中差异表达的miRNA,构建了miRNA-mRNA 调控网络,并进一步对网络中的靶基因进行通路和功能分析,揭示了血小板中miRNA及相关基因在心梗发生中的重要作用,为今后的干预治疗及靶点选择提供了新的见解。