乔利杰,王建茹,李 彬,朱明军
急性心肌梗死(acute myocardial infarction,AMI)是由于动脉斑块破裂、溃疡、糜烂或夹层,引起一支或多支冠状动脉血栓形成,从而出现急性、持续性缺血缺氧所引起的心肌坏死[1],是世界范围内的主要死亡原因,被称为危害人类健康的“头号杀手”之一[2]。心力衰竭(heart failure,HF)是急性心肌梗死的严重并发症。流行病学调查显示,心肌梗死后30 d和心肌梗死后5年心力衰竭的发生率分别高达23.1%、31.9%,院内死亡率为12.2%,出院1年死亡率为26.6%[3-4]。可见急性心肌梗死后心力衰竭(heart failure post-acute myocardial infarction,HFpAMI)的高发病率和高死亡率严重威胁着病人的生命与健康[5]。
现代医学治疗HFpAMI以改善病人临床症状、减缓心室重构、降低再住院率及死亡率为主,随着对发病机制的深入研究,药物治疗与非药物治疗都有了长足的进步。但长期用药容易产生耐药性,且存在发生恶性心律失常、水电解质紊乱等风险,再加上高昂的治疗费用,不仅影响病人生活质量,也给病人带来了心理及经济上的双重负担[6-7]。进一步探讨HFpAMI的发病机制,挖掘潜在作用靶点,探索新的治疗方法至关重要。近年来,随着中医学对HFpAMI的认识,大量研究表明,中药可改善HFpAMI病人心功能,减缓心室重构进程,改善预后,但用药规律方面尚缺乏系统的了解[8-9]。目前,生物信息学技术已被用于筛选多种心血管疾病潜在生物学标志及调控靶点[10-11],但对HFpAMI的研究较少。因此,利用生物信息学技术分析HFpAMI的差异表达基因,进一步探讨可能的发病机制,预测潜在干预中药,归纳用药规律具有重要的意义。
本研究通过基因表达综合数据库(gene expression omnibus,GEO)获取GSE59867数据集,利用生物信息学分析方法筛选HFpAMI与非心力衰竭的差异表达基因(differentially expressed genes,DEGs),并对 DEGs进行功能和通路的富集分析,从而探究HFpAMI的病理机制。利用基于本体的医学信息检索平台(Coremine Medical)数据库预测干预HFpAMI的中药,并归纳总结用药规律。同时,通过加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)获取与临床性状相关性最高的基因模块,再与DEGs取交集后获得次Hub基因,通过String数据库及Cytoscape软件构建蛋白-蛋白互作(protein protein interaction,PPI)网络并筛选出Hub基因,通过corrplot包和pROC包分析Hub基因之间的相关性,评价Hub基因诊断HFpAMI的效能,并运用GSEA 4.1.0软件对单个Hub基因进行基因富集分析(gene set enrichment analysis,GSEA)。本研究致力于探讨HFpAMI的发病机制,并为其中药干预提供一定的理论依据。
从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中下载GSE59867数据集和GPL6244-17930平台文件。采用Affymetrix Human Gene 1.0 ST Array检测病人外周血单核细胞基因的表达情况。数据集包括111例ST段抬高型心肌梗死(STEMI)病人4个时点(入院、出院、心肌梗死后1个月和心肌梗死后6个月)以及46例无心肌梗死病史的稳定型冠状动脉疾病病人的外周血样本。同时,依据血浆N末端脑利钠肽前体(NT-proBNP)水平和左室射血分数(LVEF)将STEMI后病人分为心力衰竭组和非心力衰竭组。本研究选取了其中入院时点的8个非心力衰竭样本和9个心力衰竭样本进行后续研究。依据GPL6244-17930平台文件对选取样本的表达数据进行注释,将探针矩阵转化为基因矩阵。若基因对应多个探针则取其均值,剔除表达量为0的基因。再利用Normalize Between Arrays函数对数据进行矫正。
利用Limma包,以|log(fold change,FC)|>0.585和P<0.05为阈值筛选DEGs,并采用clusterProfiler包对获取的DEGs进行基因本体(gene ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。同时,利用ggplot2包绘制气泡图对结果进行可视化。
在Coremine Medical数据库(https://coremine.com/medical/)中获取DEGs所映射的中药,以P<0.05为筛选条件,并通过中医药整合药理学研究平台V2.0(http://www.tcmip.cn/)、中国医药信息查询平台(https://www.dayi.org.cn/)、《中国药典》2020年版、《中药大辞典》第2版中检索其性味归经功效等信息,统计分析中药性味归经出现的频次和频率、中药对应的靶点数目,归纳总结中药的药物类别。若中药的性味归经不止一个,则要全部如实记录。频率=出现频次/总频次×100%。
利用R语言中的WGCNA软件包对预处理后的8个非心力衰竭样本和9个心力衰竭样本的数据进行分析。首先,依据最佳软阈值β来构建共表达网络,依次转化为邻接矩阵、拓扑重叠矩阵,并绘制层次聚类树;其次,通过动态剪切树的方法识别基因模块(最小模块大小设为30);然后,对模块进行聚类分析,将相似模块合并成新的共表达模块(height设置为0.25);最后,将共表达模块与临床性状(样本分组信息)进行关联分析,选择与其高度相关的模块进行后续分析[12]。筛选条件设为模块特征相关系数的绝对值≥0.5,P<0.05。
将筛选出的DEGs分别与选取的与临床性状相关高的模块基因取交集,获取次Hub基因,结果用Ggplot 2包绘制的韦恩图进行可视化。
将次Hub基因上传至STRING 数 据 库(https://string-db.org/),进行PPI分析,并将结果导入Cytoscape 3.7.2软件构建PPI网络。然后,利用MCODE插件以默认参数(Degree cut-off=2,node score cut-off=0.2,Max depth=100,k-score=2)为标准对其进行模块分析,筛选最重要的子模块。
利用CytoHubba插件对PPI网络进行分析,以度值(Degree)算法来筛选Hub基因。依据Hub基因在心力衰竭组和非心力衰竭组的表达量,分别利用corrplot包和pROC包分析Hub基因之间的相关性,评价Hub基因诊断HFpAMI的效能。
分别以每个Hub基因在GSE59867数据集中所有样本表达量的中位数为依据,将数据集中的基因分为Hub基因高表达组和低表达组;然后,利用GSEA 4.1.0软件,选择c2.cp.kegg.v7.4.symbols.gmt作为参考基因集,选择默认参数进行基因富集分析。筛选标准化富集得分(normalized enrichment score,NES)的绝对数>1、名义P<0.05和错误发现率(false discovery rate,FDR)<0.25的基因集作为阳性基因集。
差异分析结果显示,以|logFC|>0.585和P<0.05为筛选条件,筛选出140个DEGs,其中上调55个、下调85个。绘制数据集中基因差异表达的火山图和前20个DEGs的热图,每个点代表1个基因,黑色点为表达无差异的基因,红色点为上调的DEGs,绿色点为下调的DEGs。详见图1、图2。利用clusterProfiler包、org.Hs.eg.db包等将筛选出的DEGs进行功能富集分析和可视化,详见图3、图4。GO功能富集分析结果显示,依据P<0.05确定了267个GO条目;生物学过程(biological process,BP)条目为221条,主要涉及细胞间黏附的调节、白细胞和T细胞活化的调控、炎症反应的调控等;细胞组分(cellular component,CC)条目为20条,主要涉及细胞质膜的外部、血小板α颗粒、三级颗粒等;分子功能(molecular function,MF)条目为26条,主要涉及细胞外结合基质蛋白、表皮生长因子受体结合、细胞因子受体活性、分子适配器活性等。KEGG通路富集分析结果显示,依据P<0.05共映射出了13条信号通路,其中与心力衰竭密切相关的有细胞外基质(ECM)-受体相互作用、磷脂酰肌醇3激酶/蛋白激酶3(PI3K/AKT)信号通路、黏着斑、T细胞和B细胞受体信号通路等。
表1 单个Hub基因GSEA结果
图1 DEGs的火山图
图2 前20个DEGs的热图
图3 DEGs的GO富集分析气泡图
图4 DEGs的KEGG通路富集分析气泡图
为了确定能够使邻接函数较好满足无尺度条件且R2>0.8的软阈值(β值),本研究对1~20 的参数值开展了网络拓扑分析,结果显示最佳β值为9(见图5)。利用动态剪切树法初步识别模块,合并相似模块后,共得到16个含有不同基因数目的基因模块(见图6)。在各基因模块与临床性状的相关性方面,darkturquoise模块与临床性状的相关性最高(|R|=0.66,P=0.004),其次为steelblue 模块(|R|=0.58,P=0.01)和salmon模块(|R|=0.51,P=0.04),其余模块与临床性状的相关性为弱相关或不相关(见图7)。因此,本研究选择这3个模块中的基因开展后续研究。
图5 网络拓扑分析结果
图6 基因聚类树与基因模块
图7 临床性状与基因模块的相关性热图[相关性系数(P值)]
DEGs与darkturquoise模块的交集基因为19个;与steelblue 模块的交集基因为15个,与salmon模块的交集基因为38个;所有交集基因汇总后共得到72个次Hub基因。详见图8。
图8 次Hub基因的韦恩图
经STRING数据库对次Hub基因进行PPI分析后,利用Cytoscape软件构建了PPI网络。该网络包括160条边和48个节点。MCODE插件分析结果显示,共获得4个子模块,其中模块1(score为6.667)最为重要,seed基因为CD24。详见图9。
图9 次Hub基因PPI网络构建、模块分析及Hub基因筛选网格图
利用cytoHubba插件中的Degree算法在PPI网络中共筛选出10个Hub基因,即分化抗原28(cluster of differentiation 28,CD28)、原癌基因c-Fos(proto-oncogene c-Fos,FOS)、白细胞介素-2受体α亚型(interleukin-2 receptor subunit alpha,IL2RA)、B淋巴细胞抗原CD20(B-lymphocyte antigen CD20,MS4A1)、Rho相关GTP结合蛋白(Rho-related GTP-binding protein RhoH,RHOH)、分化抗原24(cluster of differentiation 24,CD24)、假定P2Y嘌呤受体10(putative P2Y purinoceptor 10,P2RY10)、二肽基肽酶4(dipeptidyl peptidase 4,DPP4)、血小板反应蛋白-1(thrombospondin-1,THBS1)、2型补体受体(complement receptor type 2,CR2)。所有Hub基因之间都存在一定的相关,其中RHOH和FOS之间的负相关性最强;CD28和DPP4之间的正相关性最强(见图10)。本研究绘制了单个Hub基因的受试者工作特征曲线(ROC)以评价Hub基因诊断HFpAMI的能力,ROC 曲线下面积(AUC)结果表明,所有Hub基因均表现出了良好的诊断性能。详见图11。
图10 Hub基因之间的相关性热图(相关系数)
图11 单个Hub基因的ROC曲线图
为了更好地理解Hub基因在HFpAMI病理过程中的作用,对每个Hub基因进行了GSEA。结果显示,以|NES|>1、P<0.05 和FDR<0.25为筛选条件共发现19条信号通路,涉及免疫损伤和炎症介导的多个生物学过程及信号通路,其中以补体及凝血级联最为关键,CD28高表达组富集到8个基因集,低表达组未富集到阳性基因集;DPP4高表达组富集到1个基因集,低表达组未富集到阳性基因集;FOS高表达组富集到2个基因集,低表达组未富集到阳性基因集;IL2RA高表达组富集到2个基因集,低表达组未富集到阳性基因集;P2RY10低表达组富集到1个基因集,高表达组未富集到阳性基因集;THBS1高表达组富集到5个基因集,低表达组未富集到阳性基因集;而MS4A1、RHOH、CD24、CR2在其高低表达组均未富集到阳性基因集。详见表1。
将140个DEGs输入到Coremine Medical数据库中,并以P<0.05为条件,筛选后共获得275味中药,有30味中药未收集到归经,1味药未收集到性味,2味药未收集到性味、归经信息,14味药未收集到性味、归经、功效;性微温者3味,微寒者11味,均按性温、性寒记录;药味微酸者2味,微甘者4味,微辛者1味,微苦者8味、微涩者1味、微咸者1味均按味酸、味甘、味辛、味苦、味涩、味咸记录。经统计后发现,具有调控DEGs的中药在药味方面以苦味的出现频次和频率最高,其次为甘味和辛味;在药性方面,以性温的出现频次和频率最高,其次为性寒和性平。详见表2。在归经方面,以肝经的出现频次和频率最高,其次为脾经、肺经和胃经。详见图12;药物类型方面,以补虚药出现频次和频率最高,其次是清热药、活血化瘀药。详见图13。对中药对应的靶点数进行统计,发现对应靶点数最多的中药为鱼脑石、水牛角、三七叶、三七花、三七等。详见图14。
表2 预测中药的性味分布
图12 干预DEGs中药的归经分布图
图13 干预DEGs中药的功效分布的柱状图
图14 干预DEGs靶点数≥3个的中药条形图
近年来,虽然对HFpAMI的发病机制进行了深入的探索,其治疗手段也有了长足的进展,但HFpAMI病人全因死亡率、心血管事件发生率和再住院率仍未有明显改善[13-14]。因此,进一步探究HFpAMI的发病机制,寻找新的靶点以改善病人预后为当务之急。本研究通过生物信息学分析方法对GSE59867数据集中HFpAMI与非心力衰竭的DEGs进行筛选,共获取了140个DEGs。GO富集分析结果显示:DEGs的生物学过程与分子功能主要与细胞间黏附的调节、白细胞和T细胞活化的调控、炎症反应的调控、细胞外结合基质蛋白、表皮生长因子受体结合、细胞因子受体活性、分子适配器活性等方面有关。KEGG通路富集结果显示,HFpAMI主要涉及细胞外基质-受体相互作用、PI3K-AKT信号通路、黏着斑、T细胞和B细胞受体信号通路等相关通路。ECM是由大分子构成的错综复杂的网络,可与细胞质膜上的ECM受体结合,通过信号转导系统对细胞的形状、代谢、功能、迁移、增殖和分化产生重要的影响。研究显示,ECM在HFpAMI后的心脏重构过程中起着关键作用[15]。在多种因素的刺激下,激活的成纤维细胞会引起ECM重构,从而改变心脏的功能与结构[16]。PI3K-AKT信号通路生物学效应广泛,可参与细胞分裂、增殖、凋亡、代谢等活动[17]。研究显示,miR-146a可能通过抑制PI3K/AKT信号通路发挥其促进心肌细胞凋亡的作用[18]。除此之外,PI3K-AKT信号通路对心肌细胞能量代谢、炎症反应、钙离子在肌浆网与胞质之间的运输等方面均有影响[19]。T细胞和B细胞受体信号通路是重要的免疫炎症相关通路。免疫炎症反应通过促炎性细胞因子参与心力衰竭的发生、发展。HFpAMI的严重程度与免疫细胞数量变化、炎性相关单核细胞水平密切相关[20]。以上富集分析结果表明,HFpAMI的病理机制与免疫损伤和炎症介导相关,与既往研究[5]相一致。
WGCNA可以对复杂机制和数据集进行多基因分析,探索样本间表达谱的相似性,获取协同表达的基因模块,并建立模块基因与临床性状之间的关联,构建基因共表达网络。目前,WGCNA分析方法已经被广泛应用于识别多种疾病的潜在生物学标志和治疗靶点方面[21-22]。本研究通过WGCNA共识别出16个基因模块,挑选出与临床正负相关性最强的3个基因模块与DEGs取交集后,得到了72个次Hub基因,构建次Hub基因的PPI网络后,共鉴定出10个Hub基因(即MS4A1、RHOH、CD24、CR2、CD28、FOS、IL2RA、P2RY10、DPP4、THBS1)。本研究利用ROC曲线评价了单个Hub基因诊断HFpAMI的能力,分析结果表明所有Hub基因的AUC值均>0.7,表现出了良好的诊断性能,从侧面验证了研究结果的科学性与可靠性。CD24是一种糖基磷脂酰肌醇锚定分子,既可以作为共刺激分子参与自身性免疫过程,又可以作为炎症负反馈分子,发挥抑制炎症反应的作用[23-25]。CD28可促进T细胞的增殖和分化;FOS可在心肌细胞缺血缺氧、血流动力学障碍的诱导下快速表达,致使心肌蛋白比例改变从而导致心肌细胞损伤,促使心肌细胞重塑的各种细胞外信号通过多条信号转导途径引起细胞应答[26]。IL2RA可通过影响IL-2R蛋白的表达,控制T细胞免疫反应[27]。MS4A1基因可以编码B细胞表面抗原CD20,而CD20可以通过核转录因子-κB(NF-κB)信号通路影响 B 细胞的生物活性[28]。有研究证实,抑制 B 细胞的功能可以明显减轻HFpAMI的发生与进展[29]。RHOH是miR-3646的下游靶点,研究显示阻断RHOH的表达可以上调白细胞介素-6(IL-6)的表达,此外,miR-3646可以通过靶向RHOH促进血管平滑肌细胞(VSMC)的增殖和迁移,因此,调节miR-3646和RHOH的表达可能是减少炎症、减少VSMC增殖和迁移、改善血管损伤后内皮再生的很有前途的手段[30]。DPP4是一种广泛表达的跨膜糖蛋白,它可以通过细胞内信号传导、代谢、氧化应激、免疫过程、炎症等方面影响动脉粥样硬化进程[31]。THBS1可与纤维蛋白原、纤维连接蛋白、层粘连蛋白、V型胶原、整合素、CD47及CD36等结合,参与细胞与细胞、细胞与基质之间的相互作用,在血小板聚集、血管生成等方面亦有一定的影响[32-33]。CR2主要分布于B淋巴细胞膜上,它与不同的配体结合,广泛参与免疫应答、组织修复及炎症反应等过程[34]。以上基因均以不同的方式参与了HFpAMI的病理过程,P2RY10在HFpAMI发展过程中的作用仍需进一步探讨。此外,Hub基因间相关性分析结果可见RHOH和FOS之间的负相关性最强;CD28和DPP4之间的正相关性最强,目前,对于Hub基因间相互作用的研究仍然较少,本研究可为后续的研究提供一些参考。
本研究对单个Hub基因进行GSEA分析,共发现了19条KEGG通路,与以上DEGs富集分析所得通路相交,最终获得一条共同通路:补体和凝血级联,提示该通路与HFpAMI密切相关。人体补体及凝血级联系统由肝脏产生凝血物质与血管内皮系统共同维持,包括凝血、抗凝、纤溶、补体激活4个过程,维持人体血液的正常流动[35-36]。补体系统是先天性免疫的主要系统,研究显示多种补体成分可通过影响炎症反应、血管重塑、血栓形成等过程,参与动脉粥样硬化性心血管疾病(ASCVD)的发生和发展[37]。凝血系统中的凝血相关因子能通过特定受体介导血管系统炎症级联反应的信号传递发挥其促炎效应[38]。以上结果同样提示HFpAMI的病理机制与免疫损伤和炎症介导相关。
中医学古籍中并无明确HFpAMI的记载,其临床症状与颈动脉、喘疾咳、足胫肿、心下坚、气短乏力、尿少等心力衰竭的描述相符合,《慢性心力衰竭中西医结合诊疗专家共识》[39]认为慢性心力衰竭为本虚标实之证,本虚以气虚为主,兼阳虚、阴虚;标实以血瘀为主,兼水饮、痰浊。AMI在中医学上可归属于胸痹、真心痛的范畴,为虚实夹杂之证,其基本病机为心脉闭阻不通,心失所养,虚证以心气虚为主,实证以血瘀为主,临床多为气虚血瘀证候[40]。由此可见,HFpAMI以气虚血瘀为基本病机,益气活血是其主要治则[41]。
本研究结果显示,通过干预HFpAMI的DEGs的中药药性多为性温、性寒,药味以苦、甘多见,多归为肝、脾、肺经,对应靶点数最多的中药为鱼脑石、水牛角、三七、三七叶、三七花等,药物类型中以补虚药、清热药、活血化瘀药使用频次最高。性寒者清热、解毒、凉血、消肿,性热者止痛、散寒、补虚、助阳;味苦者泻火、燥湿、通泄、下降,微甘者滋补、和中、缓急。肝主疏泄、藏血,具有调畅气机、情志,协调脾胃的升降,贮藏血液和调节血流量的功能。脾为后天之本,气血生化之源,具有运化水谷精微与统摄血液的功能。肺主气,司呼吸,朝百脉主治节。三脏共同调节全身气血的生成、运行与气机的升降。鱼脑石利水渗湿、通淋;水牛角清热凉血、解毒;三七散瘀止血、消肿止痛。高瑞敏等[42]研究显示三七总皂苷可通过下调心肌组织中磷酸化c-jun氨基末端激酶(p-JNK)及磷酸化胞外信号调节激酶(p-ERK)和p-p38蛋白表达水平,抑制血清炎性因子分泌,从而抑制心肌细胞凋亡。三七叶总皂苷与三七花总皂苷的共有成分人参皂苷Rb3可通过激活抗氧化信号通路、改善心肌缺血、抑制细胞凋亡等途径保护心肌细胞[43-44]。李志伟[45]研究发现温阳药物附子、肉桂和益气药物人参、黄芪均可改善HFpAMI大鼠心功能。荣仔萍[46]研究发现清热养阴类汤药(清营汤)可明显改善热盛阴虚心力衰竭大鼠心脏力学指标左心室等容收缩(LVSP)、心室压力上升的最大速率(+dp/dtmax)、等容舒张期(LVEDP)、心室压力下降的最大速率(-dp/dtmax)。王金秀等[47]报道用益气活血类汤药(通脉汤)可以改善HFpAMI病人的中医证候积分、肾素、血管紧张素Ⅱ、醛固酮水平。
综上所述,本研究挖掘的中药性味、归经、规律与HFpAMI的病机相吻合,药物类型也与主要治则一致,且有大量研究证实补虚、清热、活血类药物可有效缓解HFpAMI病人临床症状。本研究尚存在一些不足之处:1)纳入分析的HFpAMI的数据集来源于GEO 数据库,该数据库收集的相关数据集样本数量有限,可能由于样本量过少导致分析结果存在一定的误差。2)一些DEGs在Coremine Medical数据库中未找到对应的中药,某些药物未找到性味归经、功效等相关信息,可能导致中药预测结果存在偏倚。3)本研究着重于理论探讨,后期需要更多临床及动物实验对所预测的靶点、通路以及中药应用加以验证。总之,本研究通过生物信息学技术发现HFpAMI的病理过程可能与MS4A1、RHOH、CD24、CR2、CD28、FOS、IL2RA、P2RY10、DPP4、THBS1等Hub基因有关,涉及免疫损伤和炎症介导的多个生物学过程及信号通路,其中以补体及凝血级联最为关键。预测干预HFpAMI的中药药性多为温、寒,药味多为苦、甘,多归属于肝、脾、肺经,以补虚药、清热药、活血化瘀药为主。本研究为后续进一步探讨HFpAMI的病理机制及其药物的研究提供了潜在靶点,也为中医药治疗HFpAMI的遣方用药提供了参考。