王子璐,刘立民,孙晓
(中国医科大学 1.体育部,沈阳 110122;2.附属盛京医院药学部,沈阳 110004)
体育锻炼的缺乏是诱发慢性病的重要原因之一[1-2]。体育活动已被证明可以改善和调节代谢稳态代谢效率[3]。年轻人和老年人久坐的生活方式和低体力活动是健康的不良因素。虽然有关运动对机体的有益作用已经达成共识,但很少有研究关注于评估有氧运动与机体基因表达之间的关系及其促进健康、预防疾病的分子机制。本研究拟通过生物信息学方法分别分析年轻人和老年人2个年龄段中运动组和非运动组股外侧肌活检样本基因表达谱,旨在探讨有氧运动对人骨骼肌全基因组表达的影响及其可能的作用机制。
本研究从美国国立生物技术信息中心公共基因芯片数据平台 (gene expression omnibus,GEO) 数据库(https://www.ncbi.nlm.nih.gov/geo/)[4]下 载GSE9103,该数据库为mRNA基因芯片数据集,芯片平台是GPL570 [HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。用该芯片对股外侧肌活检样本进行骨骼肌转录谱分析,共40例样本,其中包含10例年轻久坐者、10例老年久坐者、10例年轻训练者和10例老年训练者。
应用R语言对芯片进行分析,读取下载矩阵文件,使用limma包分别对年轻久坐组和年轻训练组,以及老年久坐组和老年训练组进行分析,直接获取DEGs,并对结果进行去重[5]。筛选标准[4]为:log2基因表达差异倍数 (fold change,FC) 绝对值≥1,P<0.05。用“ggplot2”R语言包绘制火山图,同时根据差异表达数据,用“VennDiagram”R语言包绘制韦恩图。
本研究应用在线数据库DAVID (https://david.ncifcrf.gov/),分析提供所需的GO功能富集数据,分别按照生物途径 (biological process,BP)、细胞定位(cellular component,CC)、分子功能 (molecularfunction,MF) 对基因进行注释和分类。除此之外,采用KEGG分析,用以发现可能涉及的生物学通路[6]。使用EASE Score或Fisher Exact统计方法,GO和KEGG各项筛选条件为P< 0.05[7]。应用“ggplot2”R语言包根据分析结果绘制气泡图。
STRING (https://string-db.org/) 是一款在线分析工具 (当前版本11.0),用来呈现与评估PPI网络[8]。将本研究筛选出的所有DEGs导入STRING,通过STRING分析工具可以进一步探寻这些DEGs之间潜在的联系[9]。筛选条件设置为:置信度≥0.15,互作最大值=0。之后把STRING的计算结果导入Cytoscape (版本3.7.1)[10],挖掘PPI网络中连接最为紧密的集簇[5],应用的是分子复合物检测 (molecular complex detection,MCODE) 插件,筛选设置参数设置为默认参数。此外应用cytoHubba插件筛选出PPI网络中处于关键位置的前10个基因。
基因表达芯片GSE9103应用R语言分析后,在年轻组和老年组分别筛选出25个DEGs,在年轻组中,相较于久坐组,训练组8个mRNA表达上调,17个mRNA表达下调 (FC≥2,P< 0.05)。在老年组中,相较于久坐组,训练组10个mRNA表达上调,15个mRNA表达下调 (FC≥2,P< 0.05)。利用火山图 (图1) 分析和观察FC值2倍以上变化的mRNA的分布及统计学差异,FC值2倍以下或者P> 0.05的基因标注为灰色,表达下调的基因标注为蓝色,表达上调的基因标注为红色。将年轻组和老年组筛选出的DEGs绘制韦恩图,如图2所示,共有9个基因为2组群体共有的DEGs,包括ACTN3、AFAP1L1、CALML6、CKB、G0S2、IGFN1、LDHB、PDLIM5和SLC38A1。
采用DAVID数据库对总的DEGs进行GO和KEGG信号通路富集分析后,结果如图3所示,GO富集分析发现,DEGs主要定位在线粒体、细胞外和细胞质内,分子功能主要涉及细胞对饥饿的反应、乳酸代谢过程以及细胞生长调节等;KEGG分析显示,DEGs主要与胰高血糖素信号通路、细胞紧密连接和AMPK信号通路有关。
通过STRING得到的PPI网络由40个节点蛋白以及86条相互作用关系构成 (enrichmentP< 0.000 01),将PPI网络导入Cytoscape本地版,根据degree和log2FC大小2个因素美化PPI网络 (图4A)。通过MCODE插件分析发现1组集簇,此集簇包含9个节点 (node) 与16条连线 (edge) (图4B)。通过cytoHubba插件按照MCC为标准,最终筛选出处于关键位置的10个基因(图5),分别为THRSP、MYH8、MYH1、PDK4、IGFN1、CALML6、PRKAG3、G0S2、ACTN3和FOXO1 10个关键基因。
图1 运动组和非运动组mRNA差异表达火山图分析Fig.1 Differentially expressed genes between trained and sedentary subjects
图2 年轻组和老年组筛选出的差异表达基因韦恩图分析Fig.2 The Venn graph of DEGs in young and old human subjects
研究[3]显示,身体长期或短期不活动都会对肌肉性能产生负面作用,并与胰岛素敏感性降低、有氧能力下降和基础代谢率降低有关。肌肉力量随着年龄的增长而下降,增加体育活动是目前已知的唯一能减轻这种下降趋势的方法[11]。有氧运动除了对机体健康有益外,还可以改善某些慢性疾病的症状,如体育活动对预防和 (或) 维持血糖控制及心血管危险因素有积极作用;在进行有氧运动之后,脑卒中和帕金森病患者除了在心肺健康方面有所改善外[12],在行走、功能和运动能力方面也有改善[13-14]。目前,有关有氧运动与机体基因表达之间的关系及其促进健康、预防疾病的分子机制的研究较少,本研究应用生物信息学方法分别对年轻人和老年人2个年龄段中运动组和非运动组股外侧肌活检样本基因表达谱进行了分析,筛选出的DEGs生物学功能主要涉及细胞对饥饿的反应、乳酸代谢过程、细胞生长调节,KEGG分析显示主要与胰高血糖素信号通路、细胞紧密连接和AMPK信号通路有关。
PPI网络筛选出THRSP、MYH8、MYH1、PDK4、IGFN1、CALML6、PRKAG3、G0S2、ACTN3和FOXO1这10个关键基因。其中,THRSP被称为甲状腺激素应答点14蛋白,是脂质合成的重要调节基因,可被甲状腺激素和高糖饮食等刺激脂质合成的因子迅速上调,参与组织中的脂质合成调控[15];MYH8和MYH1编码肌球蛋白重链,参与肌肉的合成[16];PDK4增加胰岛素抵抗,升高血糖,减少非酯化脂肪酸水平,是线粒体能量代谢的调控因子[17];IGFN1参与成肌细胞融合和分化[18];CALML6的有关研究相对较少;G0S2为脂质代谢调控分子,PRKAG3是AMPK的调节亚基,在骨骼肌中有特异性表达,有研究[19-20]显示PRKAG3和G0S2均在AMPK影响葡萄糖或脂类相关代谢中发挥重要作用;ACTN3基因已经被证实为运动基因,编码一种α辅肌动蛋白,不仅与速度有关,而且也与耐力和力量有关,关于该基因的多态性的研究较多,其中某些基因型是成为优秀运动员的一种特殊标志[21];FoxO1作为Forkhead蛋白家族的成员,是调节细胞增殖、自噬、凋亡等作用的功能蛋白[22]。
图3 对差异表达的mRNA进行生物学过程、细胞组分分子功能的富集信息以及参与的细胞通路分析Fig.3 Functional and signaling pathway analysis of DEGs,including biological process,cellular component,molecular function and KEGG pathway
图4 PPI网络分析结果和集簇模块构建Fig.4 Protein-protein interaction network construction and module analysis
图5 cytoHubba插件筛选出PPI网络中处于关键位置的前10个基因Fig.5 The top 10 hub genes in the PPI network selected by cytoHubba
以上的这些基因都不同程度地参与了运动对机体的调节作用,而本研究获得的结论尚需要更多的研究来进行验证,通过数据挖掘,探究有氧运动对机体作用的靶基因,可以为下一步的机制研究提供参考。