刘玥佩 钟颖 张萍 杨冉潋 李雷益
[摘要] 目的 采用生物信息学方法对特发性非肝硬化门静脉高压症(idiopathic non-cirrhotic portal hypertension,INCPH)的基因芯片数据进行分析,获取疾病发生发展的关键基因和信号通路,预测治疗INCPH的潜在中药。方法 从基因表达综合数据库(gene expression omnibus,GEO)数据库下载关于INCPH的基因芯片数据集GSE77627,利用R语言对数据进行标准化并筛选INCPH的差异基因(differential genes,DEGs),并利用Metascape数据库对所有DEGs进行基因本体(gene ontology,GO)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)富集分析,并通过STRING数据库构建蛋白-蛋白互作网络;同时,利用CytoHubba插件筛选Degree值排名前15的DEGs作为关键基因。随后将关键基因与医学本体信息检索平台互相映射,以P<0.05为标准筛选治疗INCPH的潜在中药,并从TCMSP数据库中筛选潜在中药有效成分,导入Cytoscape软件构建中药相关网络图,并预测关键作用靶点。结果 共获得1880个DEGs,其中表达上调的基因有1061个,表达下调的基因有819个。利用STRING数据库以及Cytoscape环境下的cytoHubba插件分析DEGs,筛选Dgree值排名15位的基因作为关键基因,分别是RPS27A、CDC42、EIF4E、MAPK1、PIK3R1、RPS6、RPS9、RPS8、RPL15、RPL27A、RPL24、RPL27、RPL26、RPL12和MAPK14。GO、KEGG分析显示DEGs主要参与配子生成、糖尿病并发症中的AGE-RAGE信号通路等信号通路。结论 篩选得到干预INCPH的潜在中药为人参、丹参、黄芪等,可能成为INCPH治疗的潜在分子药物来源。
[关键词] 特发性非肝硬化性门静脉高压症;生物信息学;中药预测
[中图分类号] R319 [文献标识码] A [DOI] 10.3969/j.issn.1673-9701.2024.02.012
Screening of hub genes and pathways of idiopathic non-cirrhotic portal hypertension and prediction of traditional Chinese medicine
LIU Yuepei, ZONG Ying, ZHANG Ping, YANG Ranlian, LI Yilei
School of Clinical Medicine, Chengdu University of Chinese Medicine, Chengdu 611137, Sichuan, China
[Abstract] Objective To with analyzing the gene expression profile of idiopathic non-cirrhotic portal hypertension (INCPH) by bioinformatics methods, we may obtain its key genes and signaling pathways to explore the molecular mechanism of INCPH and predict the potential traditional Chinese medicine. Methods The gene microarray dataset GSE77627 on INCPH was downloaded from gene expression omnibus (GEO) database, the data were normalized and screened for differential genes (DEGs) of INCPH using R language, and all DEGs were analyzed for gene ontology (GO) and Kyoto encyclopedia of genes and genomes (KEGG) enrichment using Metascape database, and protein-protein interaction network was constructed by STRING database; meanwhile DEGs with the top 15 Degree values were screened as key genes using CytoHubba plugin. Subsequently, the key genes were mapped to each other with the medical ontology information retrieval platform (coremine medical) to screen potential Chinese herbal medicines for the treatment of INCPH with P<0.05, and the potent components that potential Chinese medicines have were screened from the TCMSP database, imported into Cytoscape software to construct a Chinese medicine correlation network map and predict the key targets. Results A total of 1880 DEGs were screened, including 1061 up-regulated and 819 down-regulated genes. DEGs were analyzed using the protein interaction database STRING and cytoHubba in Cytoscape software to obtain key genes, which were RPS27A, CDC42, EIF4E, MAPK1, PIK3R1, RPS6, RPS9, RPS8, RPL15, RPL27A, RPL24, RPL27, RPL26, RPL12 and MAPK14. The GO and KEGG analysis mainly involved gamete production and AGE-RAGE signaling pathway in INCPH. Conclusion The potential traditional Chinese medicines screened for INCPH are Ginseng Radix et Rhizoma, Salviae Miltiorrhizae Radix et Rhizoma, Scutellariae Radix, etc, which may be a potential source of molecular drugs for the treatment of INCPH.
[Key words] Idiopathic non-cirrhotic portal hypertension; Bioinformatics (INCPH); Prediction of traditional Chinese medicine
特发性非肝硬化性门静脉高压症(idiopathic non-cirrhotic portal hypertension,INCPH)是一种病因尚未清晰阐明的,由非肝硬化因素所致的肝内中小门静脉阻塞所引起的血管性肝病[1]。Baveno VI共识会议指出,特发性门静脉高压(idiopathic portal hypertension,IPH)、非肝硬化门静脉纤维化(non- cirrhotic portal fibrosis)和INCPH提示的临床疾病相同[2]。其组织学特征[3]涉及多种非特异性改变,包括正窦扩张、静脉硬化、门脉纤维化和结节性再生性增生。
INCPH在全球范围内分布,并且在亚洲较为普遍。在过去的几十年中,INCPH在日本和印度等已得到广泛认可,约占PH病例的30%~40%[4]。与之不同的是,在北美和欧洲,INCPH被认为是一种罕见疾病,其仅占PH病例的3%~5%左右[5]。然而,由于对该疾病的识别经常不足,其发病率可能被低估。
迄今为止,INCPH的病理生理机制在很大程度上仍不为人知,现存相关文献仍然较少,多种病理学实体高度依赖于组织学特征。因此,明确INCPH进展中准确可靠的基因和重要生物途径,对于提高对INCPH的认识以期更好地服务于临床具有重要意义。
本研究基于基因表达综合数据库(gene expression omnibus,GEO)數据库对INCPH的基因芯片数据进行处理,筛选与INCPH相关的差异基因,并对其进行基因本体(gene ontology,GO)富集功能与京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)信号通路分析,构建蛋白互作网络,确定关键基因,预测潜在治疗中药,以期为INCPH的临床诊断和治疗以及后续的相关研究提供参考。
1 资料与方法
1.1 数据提取
查找GEO(https://www.ncbi.nlm.nih.gov/geo),下载编号为GSE77627的基因表达数据集。GSE77627数据集包含18例INCPH患者和14例正常人肝组织的基因表达数据,该数据集平台为GPL14951。
1.2 数据标准化处理
采用R4.2.1环境下的GEOquery[6]软件包获取GPL14951的平台信息,并将探针名转换为基因名,当一个基因对应多个探针时取其平均值。针对数据预处理结果,利用R语言绘制箱线图和主成分分析图。
1.3 差异表达基因(differentially expressed genes,DEGs)的筛选
以P<0.05且log2(fold change)的绝对值>2[7]为筛选条件,使用limma包研究INCPH患者和正常人肝组织样本之间的DEGs。同时,利用pheatmap和ggplot2软件包分别绘制热图和火山图。
1.4 关键基因的功能注释
将上述DEGs导入Metascape[8]数(https://metascape. org)据库对上调、下调的差异基因进行GO生物功能分析与京都基因与KEGG通路富集分析。
1.5 蛋白-蛋白互作(protein-protein interaction,PPI)网络分析与关键基因筛选
以“medium confidence>0.9”为筛选条件,利用STRING数据库(https://string-db.org)进行PPI分析。利用Cytoscape软件(Version 3.7.1)进行可视化分析,并绘制PPI图。同时利用CytoHubba插件筛选出Degree值排名前15的DEGs作为关键基因。
1.6 潜在干预中药预测
将上述15个关键基因与Coremine Medical数据库(https://www.coremine.com)相互映射[9],以P<0.05为标准筛选得出具有潜在干预作用的中药。结合临床常用药筛选出现次数排名前3的中药进行预测,从TCMSP数据库(https://tcmsp-e.com)中以OB≥30%,DL≥0.18为条件筛选这3味中药的有效成分、作用靶点,并使用Uniprot数据库(https:// www.uniprot.org)对靶点名称进行标准化。通过Cytoscape构建“中药-成分-靶点”网络图,并分别使用CytoHubba插件中的MCC、degree、EPC算法筛选出排列前25的靶点,并最终得到其交集靶点进行可视化处理。
2 结果
2.1 芯片数据标准化和预处理结果
经过数据规范化后得到的箱式图可见各样本对齐较好,符合预期要求。PCA图可以明显观察到INCPH患者与正常人肝组织的两组样本分离显著,样本归一化程度较好,见图1。
2.2 DEGs筛选结果
依据log2FC的绝对值>2的筛选条件对GSE77627数据集的基因数据进行筛选,共得到1880个DEGs。其中,呈现上调状态的基因为1061个,呈现上调状态的为819个,DEGs火山图见图1C。
2.3 上述DEGs的GO生物功能分析和KEGG富集分析
使用Metascape数据库,选择P<0.05,可以得到上述DEGs的GO生物功能分析与KEGG富集分析主要参与的信号通路。GO分析结果显示,呈现上调表达的基因主要参与配子生成、细胞连接组织等生物功能;呈现下调表达的基因主要参与单羧酸代谢过程的生物功能。KEGG通路富集分析结果显示,呈现上调表达的基因主要富集在造血细胞谱系、糖尿病并发症中的AGE-RAGE信号通路等信号通路;呈现下调表达的基因则主要富集在癌症中的蛋白聚糖、不饱和脂肪酸的生物合成等信号通路。
2.4 DEGs的PPI网络构建与关键基因筛选
利用STRING数据库导入Cytoscape绘制PPI网络分析图见图2;利用CytoHubba提供的Degree值算法,筛选网络图中互作程度较高的前15个差异基因作为关键基因,见图3。关键上调基因分别为RPS27A、CDC42、EIF4E;下调基因分别为MAPK1、PIK3R1、RPS6、RPS9、RPS8、RPL15、RPL27A、RPL24、RPL27、RPL26、RPL12、MAPK14(P均<0.01),见表1。
2.5 潜在治疗中药的预测
上述15个关键基因与Coremine Medical数据库相互映射,结合临床常用药物筛选出现次数排名前3中药,即人参、(膜荚)黄芪、丹参。通过TCMSP 数据库、Uniprot数据库进行数据处理后,将筛选过后的清洁数据导入Cytoscape软件,并绘制“中药-成分-靶点”网络图,见图4。使用CytoHubba插件分别按照MCC、degree、EPC算法筛选出排列前25的靶点,取交集共得到16个靶点。靶点间的不同颜色代表了值的大小,颜色越深则值越大,相关性越强。结果显示,上述3味中药的活性成分主要参与调控PTGS2、PTGS1、ADRB2、SCN5A等基因,可能成为治疗INCPH的潜在中药,见图5。
3 讨论
INCPH的发病机制十分复杂,目前尚不清楚。内脏血流增加和门静脉病(由继发于自身免疫性损伤、内皮损伤或高凝状态的血栓形成或闭塞引起)可作为致病因素[10]。目前,对于INCPH的研究在不断深入,但仍然缺乏对于该疾病生理病理的实体认识,且临床可用的治疗方法十分有限。本研究通过GEO数据库提取芯片GSE77627的数据信息,通过R语言环境筛选DEGs,共识别INCPH患者与正常人肝组织的1880个差异表达基因,其中包括上调基因1061个,下调基因819个。
GO、KEGG富集分析结果证明,DEGs主要参与配子生成、糖尿病并发症中的AGE-RAGE信号通路等生物学过程。研究已经证实,遗传性危险因素与INCPH存在明显的相关性[11]。配子生成素结合蛋白2(gametopoietin-binding protein 2,GGNBP2)是配子生成素的结合蛋白,在哺乳动物配子发生等生殖相关过程发挥重要作用。研究表明,GGNBP2可以通过影响SOX9阳性Sertoli细胞的形态和功能在精子发生中起关键作用[12]。此外,门静脉血管系统异常往往与纤维化的增加有关[13]。70%的患者会出现闭塞性门静脉病变,这被认为是INCPH的标志,特点是门静脉分支壁纤维化和不规则增厚[14]。AGE-RAGE信号通路可级联激活与纤维化相关的生长因子,促进组织纤维化的发展,并影响RAGE的表达增加[15]。
研究表明,INCPH的发病机制与诸多免疫性疾病相关,包括系统性红斑狼疮[16]、常见变异型免疫缺陷症[17]等,这些数据均表明免疫紊乱与INCPH的发病机制有关。CDC42是Rho GTPases(Rho GTP酶)家族的成员,CDC42分子在细胞周期调节和广泛的组织特异性功能中起着关键作用[18]。研究表明,CDC42失调可能会阻碍B细胞发育和亲和力成熟的多个阶段,导致异常的生发中心反应和免疫缺陷,以及自身免疫和淋巴细胞增生[19]。由此推测,CDC42的失调可以诱导免疫失调,引发INCPH。
INCPH患者的治疗主要集中在根据肝硬化指南预防和管理门静脉高压并发症方面[20],目前暂无特效的治疗方法。中医药传承千年,具有其独特的优势。本研究基于上述15个关键基因,使用Coremine Medical数据库,结合临床常用药物筛选出现频次排名前3中药,即人参、黄芪、丹参。陆雄等[21]发现,丹酚酸B能够降低ET-1诱导的门脉高压。王皎皎等[22]通过实验证实,人参皂苷Rg3能够通过激活PI3K-Akt/PKB信号通路,抑制VEGF和ICAM-1蛋白的表达,降低门脉高压。秦合伟等[23]则发现,黄芪甲苷能够通过靶向调控VLDLR等抑制血管炎性反应,减轻血管内皮细胞损伤。以上众多研究和报告证明了本研究预测的结果中药在INCPH的干预中可能发挥确切的有效作用。
迄今为止,INCPH的病理生理机制仍未完全阐明,目前对其的研究更多集中在临床病例研究,较少从分子角度探究INCPH的生理病理机制;且研究探析了中药治疗的可能性,有一定的创新性和研究价值。研究对INPCH的所有DEGs进行GO、KEGG富集分析,结果证明其主要参与配子生成、糖尿病并发症中的AGE-RAGE信号通路等生物学过程。通过15个关键基因与Coremine Medical数据库的相互映射预测出的频次排名前3位的有效中药,即人参、黄芪、丹参主要通过调节PTGS2、PTGS1、ADRB2、SCN5A等靶点防治INCPH,这也不失为一个有意义的研究方向。综上来看,本研究为后续INCPH的生理病理机制以及治疗药物的研究提供了可参考的方向和思路,但后续仍然需要进行多项实验来验证研究的真实性和准确性,以便更好地探究INCPH的生理病理機制,加强对于该疾病的实体认识,更好地指导临床诊断和治疗。
利益冲突:所有作者均声明不存在利益冲突。
[参考文献]
[1] 张博静. TIPS治疗特发性非肝硬化vs. 肝硬化门脉高压静脉曲张出血的病例—对照研究[D]. 西安: 第四军医大学, 2016.
[2] DE FRANCHIS R, BAVENO V. Expanding consensus in portal hypertension: Report of the Baveno VI Consensus Workshop: Stratifying risk and individualizing care for portal hypertension[J]. J Hepatol, 2015,63(3): 743–752.
[3] SIRAMOLPIWAT S, SEIJO S, MIQUEL R, et al. Idiopathic portal hypertension: natural history and long-term outcome[J]. Hepatology, 2014, 59(6): 2276–2285.
[4] GUIDO M, SARCOGNATO S, SACCHI D, et al. Pathology of idiopathic non-cirrhotic portal hypertension[J]. Virchows Arch, 2018, 473(1): 23–31.
[5] LEE H, REHMAN A U, FIEL M I. Idiopathic noncirrhotic portal hypertension: an appraisal[J]. J Pathol Transl Med, 2016, 50(1): 17–25.
[6] 吳丹, 王雪, 杨静, 等. 生物信息学方法下脑老化关键基因与通路的筛选及中药预测研究[J]. 中国中药杂志, 2021, 46(21): 5701–5709.
[7] 李霞, 于逸, 左海维, 等. circRNAs对结直肠癌的抑制作用及其生物信息学分析[J]. 吉林大学学报(医学版), 2020, 46(6): 1283–1287.
[8] ZHOU Y, ZHOU B, PACHE L, et al. Metascape provides a biologist-oriented resource for the analysis of systems- level datasets[J]. Nat Commun. 2019, 10(1): 1523.
[9] 肖祥, 吴宣諭. 胰腺癌“炎-癌”转化关键基因筛选及干预中药的预测分析[J]. 中草药, 2022, 53(15): 4795–4806.
[10] SCHOUTEN J N, VERHEIJ J, SEIJO S. Idiopathic non-cirrhotic portal hypertension: A review[J]. Orphanet J Rare Dis, 2015, 10: 67.