COPD相关差异表达基因筛选、生物学功能分析及其编码蛋白互作网络分析

2019-02-12 15:12刘兆宇胡腊曾子成林海李明易高姚文霞
山东医药 2019年30期
关键词:差异基因胞外基质通路

刘兆宇,胡腊,曾子成,林海,李明,易高,姚文霞

(广州医科大学附属第五医院,广州510700)

慢性阻塞性肺病(COPD)是一种以气流受限,且不完全可逆的一种常见病和多发病[1~3]。CODP的临床特征往往表现为咳嗽、咳痰,并且伴随有气流受限、肺功能下降等病理特征。目前,COPD影响人口约3.3亿,造成的经济成本约2.1万亿美元[4]。随着大气污染日益加重,烟草人群增多和人口老龄化等因素,预计到2020年COPD讲发展为全球第三大死亡原因[5]。长久以来,COPD的发病机制并不十分清楚,涉及的机制比较复杂。一般认为,COPD是一种慢性炎症性疾病,以持续性气道炎症、肺功能恶化等为主要特征[6,7]。以往的大多数研究主要针对单个或数个基因与COPD相关性及生物学功能研究,尽管能阐明部分基因在COPD发展进程中的作用,然而并不能全面的探究COPD的形成。近年来随着生物技术的发展,高通量测序和基因芯片已经在COPD、哮喘等疾病中有了广泛的应用,并为相关疾病的诊断、治疗靶点提供了可靠的思路[8~10]。本研究通过生物信息学等方法筛选基因芯片GSE37768中COPD肺组织中差异表达基因,并分析COPD相关基因的功能以及构建相关基因编码蛋白的相互作用网络,为进行下一步研究COPD发生发展的分子机制提供基础。

1 资料与方法

1.1 芯片数据来源介绍 从美国国立生物技术信息中心(NCBI,https://www.ncbi.nlm.nih.gov/)的GEO(Gene Expression Omnibus)数据库中下载COPD表达芯片GSE57148。该COPD表达芯片数据由汉城国立大学的JaeHyun Lim等上传,包括98个COPD肺组织样本(GSM1376077~GSM1376174)和91个正常肺组织标本(GSM1375986~GSM1376076),均为mRNA表达谱数据。

1.2 COPD中差异表达基因分析 下载COPD表达谱芯片GSE57148的表达数据和相应探针后,通过R软件(R version 3.5.0)对表达数据进行标准化,然后采用R软件扩展包“DESeq”进行差异表达基因分析。

1.3 COPD差异表达基因基因本体功能富集分析及调控通路分析 基因本体(GO)分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)分析是目前广泛应用于芯片数据分析的方法,能够对大规模的基因组数据进行功能分析和通路富集。我们采用R软件扩展包“clusterProfiler”分析COPD中信号通路的富集情况,以P<0.05作为显著性标准,对差异基因进行功能注释,并分析其中涉及的相关通路。

1.4 COPD差异表达基因所调控蛋白互作网络与关键基因分析 STRING(https://string-db.org/)是常用来构建蛋白相互作用网络的工具。在最新版的数据中收集包含了5 090个物种中的24 584 628种蛋白之间的相互作用。我们将COPD中差异表达的基因导入到STRING11.0数据库中分析,并设置最低相互作用分值为0.4,获得差异基因之间的相互作用关系。在STRING数据库中获得差异基因之间的相互作用关系后,将数据下载,然后通过Cytoscape(Version 3.7.1)进行可视化,并通过相应的插件“cytoHubba”分析获得Hub基因。

2 结果

2.1 COPD肺组织中差异表达基因的筛选结果 通过对芯片数据进行分析,以表达量变化2倍,P<0.05为标准,在COPD肺组织中我们发现117个基因为差异表达基因,其中发生上调的基因有63个,发生下调的基因有54个。以表达量变化1.5倍,P<0.05为标准,在COPD肺组织中有642个基因差异表达,其中380个基因发生上调,262个基因发生下调。差异表达基因中上调最明显的为HIST1H4A、CCKAR、TCF23、COL11A1、CDKL5,分别上调了7.5倍、5.1倍、4.6倍、3.9倍和3.5倍;下调最明显的基因为PRAMEF21、FAM21B、RTBDN、GPR89C和CSAG1,分别下调了21.9倍、16.8倍、13.5倍、9.8倍和8.1倍。

2.2 COPD差异表达基因的GO功能和调控通路分析结果 在分析COPD肺组织中的差异性表达基因后,采用GO分析和KEGG分析研究COPD中差异性表达基因参与的信号通路激活情况。首先,分析差异基因主要参与的生物学过程发现这些基因主要参与细胞外结构组织(GO:0043062:extracellular structure organization)、细胞外基质组织(GO:0030198:extracellular matrix organization)、妊娠中的母性过程(GO:0060135:maternal process involved in female pregnancy)、外部刺激的正向调控(GO:0032103:positive regulation of response to external stimulus)和胶原纤维组织(GO:0030199:collagen fibril organization);主要分子功能为受体配体活性(GO:0048018:receptor ligand activity)、激素活性(GO:0005179:hormone activity)、细胞因子活性(GO:0005125:cytokine activity)、细胞色素c氧化活性(GO:0004129:cytochrome-c oxidase activity)和氧化还原活性(GO:0016676:oxidoreductase activity);而主要细胞组份为线粒体呼吸链复合物IV(GO:0005751:mitochondrial respiratory chain complex IV)、呼吸链复合物IV(GO:0045277:respiratory chain complex IV)、细胞外基质(GO:0031012:extracellular matrix)、血小板α颗粒官腔(GO:0031093:platelet alpha granule lumen)和纤维状胶原三聚体(GO:0005583:fibrillar collagen trimer)。

在以P<0.05的标准下,KEGG信号通路富集分析表明COPD肺组织中差异性表达基因主要激活的信号通路有阿米巴虫病(Amoebiasis)、精氨酸生物合成(Arginine biosynthesis)、补体与凝血级联(Complement and coagulation cascades)、ECM受体相互作用(ECM-receptor interaction)和细胞因子-细胞因子相互作用(Cytokine-cytokine receptor interaction);主要抑制的信号通路有α-亚麻酸代谢(alpha-Linolenic acid metabolism)、醚酯代谢(Ether lipid metabolism)、核糖体(Ribosome)、亚油酸代谢(Linoleic acid metabolism)和Ras信号通路(Ras signaling pathway)。

2.3 COPD差异表达关键基因的筛选结果 为了通过分析COPD肺组织中差异表达基因来获得相应的调控互作网络,找出与COPD发生发展相关的关键基因,我们通过在线网站STRING分析差异表达基因的蛋白互作网络和Hub基因。通过STRING数据库,我们获得了一份包含差异基因的433条互作关系的蛋白相互作用网络。然后,将互作数据在Cytoscape软件中进行可视化和Hub基因确认并展示出来,结果显示Hub基因分别为VWF、FGG、IGF1、F5、RPS15、RPS12、SEC61B、THBS1和F13A1,它们之间存在较强的相互作用关系,可能是COPD发生发展的关键基因,为进一步探索COPD的发病机制、提供诊断和治疗靶点提供基础。

3 讨论

COPD的形成是一个非常复杂的生物学过程,一般认为是一种慢性炎症性疾病,在发病过程中包括巨噬细胞、上皮细胞、中心粒细胞等多种细胞参与[11,12]。细胞生物学、分子生物学等方法是目前研究COPD的主要手段和方法,然而高通量测序、基因芯片结合生物信息的方法的应用为我们从分子水平揭示COPD的发生、发展机制提供了可能[13,14]。在本研究中,我们采用生物信息学方法分析了COPD肺组织和正常肺组织中的差异表达基因,发现变化2倍的基因有117个,变化1.5倍的基因有642个,并采用GO分析、KEGG分析了富集的信号通路,并通过蛋白-蛋白相互作用网络分析了COPD相关的关键基因。

在117个变化2倍的差异基因中,表达上调的有63个,表达下调的有54个,其中变化5倍的基因有15个。通过GO分析发现,这些基因主要参与细胞外结构形成、细胞外基质形成、胶原纤维化和氧化还原活性等。细胞外基质改变,纤维化和氧化还原活性提高是COPD的基本病理特征[15~17]。多项研究表明,COPD肺组织存在纤维化情况,与纤维化相关的基因出现高表达。Bihlet等发现,COPD患者中性粒细胞弹性蛋白酶降解弹性蛋白,慢性炎症诱导Ⅵ型胶原大量累积[18],Ⅰ型胶原蛋白、Ⅲ型胶原蛋白、Ⅳ型胶原、纤连蛋白、层粘连蛋白β2表达量增加[19]。

随后,我们通过构建蛋白—蛋白互作网络分析一共发现了433条互作关系,获得的Hub基因分别为VWF、FGG、IGF1、F5、RPS15、RPS12、SEC61B、THBS1、F13A1,其中FGG属于纤维蛋白原家族成员,是系统性炎症的标志物。研究表明,fibrogen表达量的提高与肺功能降低、COPD发生的风险增加[20,21]。Hub基因是蛋白相互作用网络中的核心基因,在生物学过程中可能发挥了十分关键的作用,因此针对这些基因的进一步研究将可能为COPD的相关研究提供进一步的思路。由于缺少临床样本,本研究才存在一定不足,下一步我们将收集相关临床样本,研究相关关键基因在COPD疾病进程中的作用和相关机制。

综上所述,本研究采用生物信息学分析的方法对COPD高通量数据GSE57148进行了分析,获得了COPD肺组织中的差异表达基因。通过这这些差异基因的GO分析和KEGG信号通路富集分析,揭示了COPD肺组织中主要涉及的信号通路,并通过蛋白互作网络初步构建了VWF、FGG、IGF1、F5、RPS15、RPS12、SEC61B、THBS1、F13A1等为COPD相关的关键基因,为进一步在细胞和分子水平研究COPD发生发展的分子机制提供指导,为后续COPD的临床诊治提供依据。

猜你喜欢
差异基因胞外基质通路
脱细胞外基质制备与应用的研究现状
关于经络是一种细胞外基质通道的假说
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用
通路快建林翰:对重模式应有再认识
水螅细胞外基质及其在发生和再生中的作用
SSH技术在丝状真菌功能基因筛选中的应用