石 磊 李万鹏 安军钰 刘怡 吴鹏 吴文宇 曹云山 黄晏
[摘要] 目的 基于生物信息学技术挖掘糖尿病心肌病(DC)相关差异表达基因及其功能。 方法 应用生物信息学方法分析基因表达谱数据集GSE4547。 結果 挖掘原始芯片数据,筛选到79个差异表达基因。基于基因本体论功能注释和相关通路分析,以及通过构建差异共表达基因蛋白质互作网络及模块分析后,最终获得Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4 10个关键基因为链脲佐菌素诱导DC的关键基因。 结论 最终获得的10个关键基因可能成为未来治疗糖尿病心肌病的潜在治疗靶点,为今后探究与DC相关基因和信号通路的功能变化提供新的视角和导向。
[关键词] 糖尿病心肌病;GEO数据库;差异表达基因;基因芯片;生物信息学技术
[中图分类号] R587.2 [文献标识码] A [文章编号] 1673-7210(2019)08(c)-0019-05
[Abstract] Objective To explore differentially expressed genes and their function related to diabetic cardiomyopathy (DC) based on bioinformatics technology. Methods The gene expression profile data set GSE4547 was analyzed using bioinformatics methods. Results The original chip data was mined and 79 differentially expressed genes were screened. Based on gene ontology functional annotation and related pathway analysis, as well as the construction of differentially coexpressed genes protein-protein interaction and module analysis, 10 key genes of Hk2, Col1a2, Col1a1, Col3a1, Slc2a1, Cpt1a, Slc2a4, Cd36, Ucp3 and Pdk4 were finally obtained as the key genes of Streptozozin induced DC. Conclusion The 10 key genes eventually obtained may become potential therapeutic targets for the treatment of DC in the future, and provide a new perspective and guidance for the exploration of functional changes of DC related genes and signaling pathways in the future.
[Key words] Diabetic cardiomyopathy; GEO database; Differentially expressed genes; Gene chip; Bioinformatics technology
糖尿病心肌病(diabetic cardiomyopathy,DC)是一种特殊的心脏疾病,其发生与心脏组织对胰岛素代谢作用的抵抗、代偿性高胰岛素血症和高血糖等有关,与冠状动脉疾病和高血压等其他心脏危险因素无关[1]。尽管研究已证实,多种因素可能共同促进DC的进展,但是推动这些病理过程的确切分子机制尚不完全清楚[2]。研究表明[3],DC可能是一种由多种基因和多个信号通路参与的疾病。本研究拟利用生物信息学技术从GEO数据库中挖掘与DC相关的差异表达基因,从而探究与DC相关的基因和信号通路的功能变化,为DC的发病机制及可能存在的治疗靶点提供新的视角和导向。
1 材料与方法
1.1 基因芯片数据的获取
从GEO数据库下载GSE4547基因表达谱数据集,该芯片分析基于GPL85平台。GSE4547数据集包括3、28、42 d标本,本研究选取42 d糖尿病心肌病小鼠模型4只和对照组小鼠4只。标本类型为小鼠心肌组织。
1.2 相关差异表达基因数据的处理
下载DC组织基因芯片GSE4547的探针文件和CELL数据压缩包后,通过R软件对原始数据进行标准化处理后,采用Limma包进行差异表达值计算,以变化倍数>2(|log FC|>1)且P < 0.05选取差异表达基因[4]。通过R软件的gplots包绘制热图(heatmap)。
1.3 差异表达基因数据的功能和富集分析
应用DAVID软件进行基因本体论(gene ontology,GO)功能注释和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genome,KEGG)进行通路分析,以P < 0.05为选取标准。
1.4 构建差异共表达基因蛋白质互作网络及模块
利用String软件对差异表达基因间的差异共表达基因蛋白质互作网络(protein-protein interaction,PPI)进行评价。将从String中获得的联合评分>0.4的中等置信度的相互作用的节点数据导入Cytoscape软件进行模块分析。
1.5 确定关键基因
应用Cytoscape软件中的cytoHubba插件通过MCC、MNC和DMNC算法分别获得了前15位基因,繪制韦恩图后获得关键基因。
2 结果
2.1 糖尿病心肌组织的差异表达基因
通过R语言中的Affy包、Limaa包对原始芯片数据进行标准化后进行差异表达分析,最终获得79个差异表达基因(包括40个上调基因、39个下调基因)。见图1。
2.2 差异表达基因功能和通路途径分析
使用DAVID在线分析软件进行GO分析和KEGG通路分析后,这些差异表达基因在生物学过程中(biological process)主要参与了药物反应等,见图2A;在细胞组件(cellular component)中主要集中在线粒体,见图2B;在分子功能层面(molecular function)主要参与了C3HC4型RING指结构域结合等功能,见图2C;差异表达基因中9个最显著差异的KEGG通路,它们主要集中在金黄色葡萄球菌感染等信号通路,见图2D。
2.3 差异共表达基因蛋白质互作网络及模块分析
将得到的差异基因导入到String在线分析软件中,得到差异共表达基因PPI,该网络由56个节点、98条边组成,见图3A,将数据导入Cytoscape软件中MCODE插件进行模块分析,截断标准是degree cut-off≥2,a k-core≥3。进而确定3个可视化模块,见图3B~D,其中图3B由5个节点和10条边组成,图3C由4个节点和6条边组成,图3D由4个节点和5条边组成。
2.4 关键基因的确定
关键基因是根据cytoHubba中3种排序方法将基因重叠确定的,见图4。最终获得Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4 10个关键基因为链脲佐菌素(STZ)诱导DC的关键基因。见表1、图5。
3 讨论
基于基因表达数据库挖掘疾病的差异表达基因,现已成为当今生物医学领域研究的热点之一[5]。DC是糖尿病患者后期一种严重威胁生命的并发症,其进展为心力衰竭的主要病理生理学特征是胰岛素抵抗、心脏胰岛素信号传递受损、高血糖等。然而,糖尿病与心血管疾病关系的复杂性是减少DC发生和进展的重要挑战之一[6]。本研究应用生物信息学技术,挖掘GEO数据库中涉及DC的基因芯片数据,探究DC相关基因和信号通路的功能变化。在本研究中,应用生物信息学技术分析后最终获得了10个关键差异表达基因:Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4。
HK2是一种己糖激酶的同工酶,其通过催化葡萄糖磷酸化发挥对葡萄糖-6-磷酸的抑制作用[7]。有研究指出,HK2活性降低会引起细胞内葡萄糖磷酸化障碍,从而导致糖耐量受损[8]。COL1A1、COL1A2、COL3A1是属于胶原蛋白家族的成员。COL1A1、COL1A2和COL3A1是Ⅰ型胶原的主要组成部分[9]。糖尿病心肌纤维化病理表现为胶原大量沉积,导致心室壁的僵硬度增高和顺应性降低,主要原因为Ⅰ型胶原蛋白的过量表达[10]。Gaikwad等[11]发现,糖尿病组小鼠心肌中Col3a1表达下降,可能与组蛋白H3在胰岛素抵抗条件下参与心脏和肾脏的共价修饰有关,具体机制仍有待进一步阐明。
SLC2A1、SLC2A4分别编码葡萄糖转运蛋白1(GLUT1)、葡萄糖转运蛋白4(GLUT4)。葡萄糖通过葡萄糖转运体进入心肌细胞,其中GLUT1和GLUT4在数量上最为重要[12]。Kainulainen等[13]在糖尿病小鼠模型中发现,随着GLUT1和GLUT4表达下降,出现胰岛素抵抗,干扰心肌细胞胰岛素信号通路,导致心肌细胞代谢紊乱,进而发展为心肌纤维化和舒张功能不全。CPT1A是线粒体中脂肪酸氧化的一种关键酶,Jeffrey等[14]在实验中发现,直接抑制Cpt1a的摄取是将心肌能量代谢从游离脂肪酸转化为葡萄糖利用的有效途径。链霉素诱导的糖尿病大鼠经Cpt1抑制剂处理后,心肌葡萄糖氧化速率增加,心脏功能恢复[15]。CD36是一种脂肪酸转位酶。在糖尿病表型小鼠模型中,敲除Cd36后心肌组织脂质积累减少、葡萄糖氧化增加进而使心脏功能恢复[16]。
UCP3是线粒体负离子载体蛋白家族中的一员,主要参与线粒体能量代谢和氧化应激。Umbarkar等[17]在诱导大鼠糖尿病模型中观察到糖尿病组心肌组织中UCP3蛋白表达量显著增加。Boudina等[18]在实验中发现与野生型小鼠相比,从2型糖尿病小鼠分离、灌注的心脏能量代谢效率降低,ATP生成减少。PDK4是细胞中参与葡萄糖代谢氧化的关键调节酶之一。Thapa等[19]的研究数据表明,adropin在心肌细胞中通过降低Pdk4的表达来降低对丙酮酸脱氢酶(PDH)活性的抑制,从而促进心肌葡萄糖的利用。
综上,本研究应用生物信息学技术挖掘GEO数据库,最终获得Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4 10个关键基因。初步揭示了这些关键基因可能成为未来治疗糖尿病心肌病的潜在治疗靶点,为今后探究与DC相关基因和信号通路的功能变化提供新的视角和导向。
[参考文献]
[1] Jia G,Whaley-Connell A,Sowers JR. Diabetic cardiomyopathy:a hyperglycaemia- and insulin-resistance-induced heart disease [J]. Diabetologia,2018,61(1):21-28.
[2] Varga ZV,Giricz Z,Liaudet L,et al. Interplay of oxidative,nitrosative/nitrative stress,inflammation,cell death and autophagy in diabetic cardiomyopathy [J]. Biochim Biophys Acta,2015,1852(2):232-242.
[3] Varma U,Koutsifeli P,Benson VL,et al. Molecular mechanisms of cardiac pathology in diabetes - Experimental insights [J]. Biochim Biophys Acta Mol Basis Dis,2018, 1864(5 Pt B):1949-1959.
[4] Ritchie ME,Phipson B,Wu D,et al. limma powers differential expression analyses for RNA-sequencing and microarray studies [J]. Nucleic Acids Res,2015,43(7):e47.
[5] Min S,Lee B,Yoon S. Deep learning in bioinformatics [J]. Brief Bioinform,2017,18(5):851-869.
[6] Jia G,DeMarco VG,Sowers JR. Insulin resistance and hyperinsulinaemia in diabetic cardiomyopathy [J]. Nat Rev Endocrinol,2016,12(3):144-153.
[7] Nederlof R,Eerbeek O,Hollmann MW,et al. Targeting hexokinase Ⅱ to mitochondria to modulate energy metab-olism and reduce ischaemia-reperfusion injury in heart [J]. Br J Pharmacol,2014,171(8):2067-2079.
[8] Mueckler M,Thorens B. The SLC2(GLUT)family of membrane transporters [J]. Mol Aspects Med,2013,34(2/3):121-138.
[9] Eghbali M,Weber KT. Collagen and the myocardium: fibrillar structure, biosynthesis and degradation in relation to hypertrophy and its regression [J]. Mol Cell Biochem,1990,96(1):1-14.
[10] Tang M,Zhang W,Lin H,et al. High glucose promotes the production of collagen types Ⅰ and Ⅲ by cardiac fibroblasts through a pathway dependent on extracellular-signal-regulated kinase 1/2 [J]. Mol Cell Biochem,2007, 301(1/2):109-114.
[11] Gaikwad AB,Gupta J,Tikoo K. Epigenetic changes and alteration of Fbn1 and Col3A1 gene expression under hyperglycaemic and hyperinsulinaemic conditions [J]. Biochem J,2010,432(2):333-341.
[12] Barrett EJ,Schwartz RG,Francis CK,et al. Regulation by insulin of myocardial glucose and fatty acid metabolism in the conscious dog [J]. J Clin Invest,1984,74(3):1073-1079.
[13] Kainulainen H,Breiner M,Schürmann A,et al. In vivo glucose uptake and glucose transporter proteins GLUT1 and GLUT4 in heart and various types of skeletal muscle from streptozotocin-diabetic rats [J]. Biochim Biophys Acta,1994,1225(3):275-282.
[14] Jeffrey FM,Alvarez L,Diczku V,et al. Direct evidence that perhexiline modifies myocardial substrate utilization from fatty acids to lactate [J]. J Cardiovasc Pharmacol,1995,25(3):469-472.
[15] Wall SR,Lopaschuk GD. Glucose oxidation rates in fatty acid-perfused isolated working hearts from diabetic rats [J]. Biochim Biophys Acta,1989,1006(1):97-103.
[16] Yang J,Sambandam N,Han X,et al. CD36 deficiency rescues lipotoxic cardiomyopathy [J]. Circ Res,2007,100(8):1208-1217.
[17] Umbarkar P,Singh S,Arkat S,et al. Monoamine oxidase-A is an important source of oxidative stress and promotes cardiac dysfunction,apoptosis,and fibrosis in diabetic cardiomyopathy [J]. Free Radic Biol Med,2015,87:263-273.
[18] Boudina S,Sena S,Theobald H,et al. Mitochondrial energetics in the heart in obesity-related diabetes:direct evidence for increased uncoupled respiration and activation of uncoupling proteins [J]. Diabetes,2007,56(10):2457-2466.
[19] Thapa D,Stoner MW,Zhang M,et al. Adropin regulates pyruvate dehydrogenase in cardiac cells via a novel GPCR-MAPK-PDK4 signaling pathway [J]. Redox Biol,2018,18:25-32.
(收稿日期:2019-03-18 本文編辑:张瑜杰)