冠心病相关基因的生物信息学分析

2018-12-28 10:41吴家炎袁振光陈依敏
健康大视野 2018年17期
关键词:转录因子生物信息学冠心病

吴家炎 袁振光 陈依敏

【摘 要】 目的:采用生物信息学的方法来分析冠心病相关的基因,通路,转录因子和miRNA。方法:从公共基因芯片数据库GEO下载冠心病基因表达谱数据,筛选出差异表达基因(DEGs),并对差异基因进行GO、KEGG以及PPI网络分析。最后利用Webgestalt预测CHD相关的miRNA以及转录因子,并构建miRNA-TF-gene调控网络。结果:共筛选出1449个DEGs。GO功能分析发现DEGs主要参与炎症反应、细胞 - 细胞信号传导、神经肽信号通路等生物学过程。KEGG通路富集分析发现DEGs参与神经活性配体 - 受体相互作用、蛋白质的消化和吸收、维生素的消化吸收等通路。并且筛选出20个与冠心病发病相关的基因,特别是发现了少有文献报道的POMC、MYOD1等基因。最后我们还预测了与CHD相关的7个转录因子和3个miRNA。结论:通过生物信息学对基因芯片数据的分析,我们得到了冠心病相关的基因、通路、miRNA以及转录因子,为冠心病的精准治疗提供了新思路。

【关键词】 冠心病;生物信息学;差异表达基因 ;miRNA;转录因子

【中图分类号】 R249 【文献标志码】A 【文章编号】1005-0019(2018)17-001-01

冠状动脉粥样硬化性心脏病(coronary heart disease,CHD) 是由于冠状动脉粥样硬化使管腔狭窄或阻塞导致心肌缺血、缺氧而引起的心脏病,简称为冠心病,是 21 世纪威胁人类健康的主要疾病之一 [1]。冠心病的发生和发展是在遗传因素和环境因素基础上,多重危险因素共同作用导致的[2]。高血压、糖尿病等疾病,以及过度肥胖、不良生活习惯如吸烟等是诱发该病的主要因素。冠心病是全球死亡率最高的疾病之一[3],目前对冠心病发病的遗传因素还不清楚,对其基因方面的研究相对不足。

近年来,生物信息学发展迅速,为疾病在基因方面的研究提供了非常广阔的平台。生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也是21世纪自然科学的核心领域之一。本文从GEO 数据库下载冠心病相关基因表达谱数据,为在基因层次上研究冠心病的发生发展及其精准治疗提供了新思路。

1 材料与方法

1.1 材料来源 利用美国国立生物技术信息中心NCBI平 台 下 的GEO 数据库进行芯片筛选,目标芯片需满足如下筛选标准:①人类标本,排除细胞株和动物;②入选芯片需具有冠心病信息;③需为基因表达芯片,各探针具有归一化的表达值; 经筛选及芯片质量分析,我们选取了6个样本:冠心病CHD3例和健康对照组3例。

1.2 方法

1.2.1 差异基因筛选 下载CEL格式原始数据,利用R软件包affy进行读取,采用RMA方法进行数据标准化预处理(包括Background correction, Normalization, Expression calculation),利用平台注释文件对探针进行注释,去除没有匹配到基因的探针;对于不同探针映射到同一基因,我们取不同探针的均值作为这个基因最终的表达值。基于R包limma筛选差异表达基因,采用矫正T检验计算基因表达显著性P值,BH方法矫正P值。每个差异表达基因,要求P<0.05。

1.2.2 差异表达基因功能分析 使用常用的富集分析工具DAVID分析差异表达基因参与的GO(gene ontology) 功能和KEGG(Kyoto encyclopedia of genes and genomes) 通路。参数富集基因个数count>=2,超几何检验显著性阈值P <0.05。

1.2.3 差异表达基因的PPI网络分析 使用STRING数据库预测分析所有差异表达基因的差异蛋白的PPI网络,PPI网络可揭示蛋白之间的互作关系。构建网络软件为Cytoscape。并统计节点degree值,观察节点之间的连接情况。

1.2.4 miRNA-TF-gene调控网络 利用webgestalt网站分别对差异基因进行转录因子TF富集预测和miRNA富集预测。取富集结果显著的TF和miRNA。并整理TF-gene和miRNA-gene关系对,构建miRNA-TF-gene调控网络。

2 结果

2.1 差异表达基因筛选结果 最终我们共筛选出1449个差异基因,与对照组相比,冠心病样品组得到726个上调基因,723个下调基因。

2.2 GO功能和KEGG通路富集分析 通过G0功能分类体系对差异基因进行注释后发现,显著富集的生物过程GO富集分析发现DEGs主要参与炎症反应、细胞-细胞信号转导、

神经肽信号通路、G蛋白偶联受体-环核苷酸通路、G蛋白偶联受体-蛋白信号通路的正调控等生物学过程。以KEGG数据库中的pathway为基本单位,向背景基因组映射,明确差异基因所参与的主要代谢途径和细胞转导通路,结果表明差异基因显著富集于神經活性配体-受体相互作用、蛋白质的消化和吸收、黑素瘤、维生素的消化吸收、甘氨酸、丝氨酸和苏氨酸代谢、脂肪的消化吸收等具有统计学意义的通路。

2.3 PPI网络分析 结合PPI数据库,分别对上调差异基因和下调差异基因构建网络图,得到的PPI网络。上调ppi网络包括392个节点,下调ppi网络包括419个节点。上调基因按照节点度大小排名的top 20 ,见表1。此处插入表12.4 miRNA-TF-gene调控网络:通过Webgestalt,我们找到富集结果排名前七的转录因子TF:PAX8、EVI1、AR、NRSF、GATA、IK1、MYOD,以及排名前三的miRNA:MIR-26A/B,MIR-29A/B/C,MIR-122A。整理相应的TF和miRNA的靶基因,构建miRNA-TF-gene调控网络,见图1。

3 讨论

目前对冠心病的发病机制,还不是特别的清楚。根据文献报道,炎症反应对冠状动脉形成粥样硬化具有重要的作用。Luczak[4]FanWH[5]杨海燕[6]等研究表明,慢性炎症反应导致细胞产生黏附分子,是动脉粥样硬化的始动环节;同时炎症指标可用来预测心血管疾病的發生。但是目前在基因水平上对该病的了解还是非常的有限,因此本研究对正常人和冠心病患者的表达谱进行差异基因筛选,共筛选出1449个差异基因。利用string 在线软件对1449个差异基因编码蛋白进行蛋白质互相作用关系网络分析,按节点度大小筛选出排名前20的上调基因:POMC、FPR2、MYOD1、GATA1、C3、GRM4、DRD4、SSTR5、PYY、FGF13、RGS6、CXCR1、、CCR10、SSTR4、CNR2、GALR3、APLN、NPBWR1、CDX2、PTGDR2。

对以上基因进行文献挖掘,我们发现已有大量的文献报道APLN、CXCR1、C3、FPR2与冠心病的发生、发展的机制以及预后关系密切 ;NR2、PYY、NPBWR1、PTGDR2与冠心病发生的危险因素有关,比如:糖尿病、高血压、肥胖;POMC、MYOD1等至今少有跟冠心病相关的报道。Guang Yang等研究表明,载脂蛋白C3单核苷酸多态性增加了冠心病的发生风险[7] ;Ye zhang等认为CXCR1通过抑制内皮细胞转移,使冠心病发生的风险增加[8];CAPLN是APJ受体的内源性肽配体,已经成为心血管系统的新型调节剂,APLN的缺乏使血管和内皮祖细胞生成减少,从而体内心肌血管生成受损,同时也会增加对缺血性损伤的易感性,这也增加了冠心病发作的风险[9]。值得一提的是,我们发现POMC、MYOD1等基因与冠心病之间的关系报道较少。MyoD1基因,别名MYF3,是一种蛋白质编码基因。Davis等人在1987年通过与小鼠MyoD1探针的弱交叉杂交分离出3种不同的人肌源性因子MYF3,MYF4和MYF5的cDNA,证明MYF3是小鼠MyoD1的人类同系物。Weintraub等人在1991年研究发现MyoD1仅在骨骼肌及其前体中表达,在非肌肉细胞中,基因被特定基因所抑制。但这与冠心病的发生发展还需进一步的研究。

值得一提是,我们还利用Webgestalt和Cytoscape构建了miRNA-TF-gene调控网络。Webgestalt的富集结果中,我们得到与CHD关系最为密切的7个转录因子:PAX8、EVI1、AR、NRSF、GATA、IK1、MYOD,以及3个miRNA:MIR-26A/B,MIR-29A/B/C,MIR-122A。

总之,通过生物信息学方法对冠心病芯片进行数据挖掘,我们得到了冠心病患者和正常健康人之间的差异表达基因。对这些差异表达基因的进一步筛选得到包括MYOD1和POMC在内的20个关键基因;同时我们发现炎症反应、维生素的消化吸收等过程和神经活性配体 - 受体相互作用等通路;最后我们进一步研究发现了一些与CHD相关的转录因子和miRNA:PAX8、EVI1、AR、MIR-26A/B、MIR-29A/B/C,MIR-122A。这些基因,转录因子和miRNA可能在CHD的发病机制中发挥重要的作用,但是具体的作用机制还需要进一步的实验来探讨,这对于CHD以后的精准治疗具有一定的临床意义

参考文献

[1] 杨天,王莉娜,智宏,等. 冠心病合并糖尿病与单纯冠心病危险因素及临床特点比较研究[J]. 南京医科大学学报(自然科学版),2014(09):1218-1223.

[2] 高阅春,何继强,姜腾勇,等. 冠心病患者冠状动脉病变严重程度与冠心病危险因素的相关分析[J]. 中国循环杂志,2012(03):178-181.

[3] 谢睿彬,张小新,苏华,等. 不同类型冠心病介入治疗的研究进展[J]. 中国医学创新,2013(15):158-159.

[4] Luczak S E, Smits S H, Decker C, et al. The Chlamydia pneumoniae Adhesin Pmp21 Forms Oligomers with Adhesive Properties[J]. J Biol Chem,2016,291(43):22806-22818.

[5] Fan W H, Liu D L, Xiao L M, et al. Coronary heart disease and chronic periodontitis: is polymorphism of interleukin-6 gene the common risk factor in a Chinese population?[J]. Oral Dis,2011,17(3):270-276.

[6] 杨海燕,毛静飞,吴常裕,等. 肺炎衣原体感染及炎症反应与冠心病的关系[J]. 中华医院感染学杂志,2017(23):5352-5356.

[7] Yang G, Lei M M, Yu C L, et al. Apolipoprotein A5 and apolipoprotein C3 single nucleotide polymorphisms are correlated with an increased risk of coronary heart disease: a case-control and meta-analysis study[J]. Lipids Health Dis,2015,14:113.

[8] Zeng Y, Shen Y, Huang X L, et al. Roles of mechanical force and CXCR1/CXCR2 in shear-stress-induced endothelial cell migration[J]. Eur Biophys J,2012,41(1):13-25.

[9] Wang W, Mckinnie S M, Patel V B, et al. Loss of Apelin exacerbates myocardial infarction adverse remodeling and ischemia-reperfusion injury: therapeutic potential of synthetic Apelin analogues[J]. J Am Heart Assoc,2013,2(4):e249.

猜你喜欢
转录因子生物信息学冠心病
ADAMTs-1、 CF6、 CARP在冠心病合并慢性心力衰竭中的意义
茶、汁、饮治疗冠心病
警惕冠心病
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
NF—κB信号通路抗肝纤维化的研究进展
冠心病室性早搏的中医治疗探析