基于生物信息学方法探究溃疡性结肠炎的关键基因和通路

2022-09-26 08:35张科
医学信息 2022年16期
关键词:细胞骨架网络图靶点

宋 崟,张科

(天津医科大学总医院药剂科,天津 300052)

溃疡性结肠炎(ulcerative colitis,UC)是一种以结直肠黏膜连续性、弥漫性炎症表现为特点的慢性非特异性疾病,其发病机制尚不明确,临床很难根治。UC 主要症状为腹痛、腹泻、黏液脓血便等,症状轻重不等,但多为反复发作的慢性病程,严重影响患者的心理、经济状况和生活质量[1-3]。目前UC 以药物治疗为主,常用药物有氨基水杨酸类、糖皮质激素、免疫抑制剂等,但这些药物存在一定的不良反应,患者依从性低,治疗效果也不理想[4,5]。因此,寻求新的药物治疗靶点,开发新的高效、低毒的UC 治疗药物成为研究热点。近年来,随着高通量测序平台及研究方法在疾病基因表达分析的应用,各种疾病的相关机制逐渐从基因和分子层面被阐明[6]。本研究采用基于Affymetrix 芯片平台的GSE42911 数据集,探究溃疡性结肠炎(UC)的发病机制,为其早期诊断和治疗药物的开发提供新思路。

1 资料与方法

1.1 基因芯片数据获取 以“Ulcerative Colitis”为关键词,在Gene Expression Omnibus(GEO)数据库中检索与UC 相关的表达谱数据。选择GSE42911 芯片数据进行挖掘,该研究是基于GPL15207 平台(affymetrix human gene expression array)的芯片,由Kellermayer R 提交。由10 个样本构成,分别为GSM1053271、GSM1053272、GSM1053273、GSM1053274、GSM1053277、GSM1053268、GSM1053269、GSM1053270、GSM1053275、GSM1053276。其中,前5 个样本来自5 例溃疡性结肠炎患者,后5 个样本来自5 名正常人。

1.2 筛选差异基因 GEO2R 是GEO 数据库中以R语言为基础的交互式在线分析工具,借助R 语言及Limma 包对GEO 样品数据行基因差异表达分析[7]。本研究利用该工具筛选UC 患者和正常人大肠组织的差异基因(DEGs)。以基因倍数改变(fold change,FC)大于1.5,即|logFC|>1.5 作为DEGs的筛选标准,以P<0.05 为差异有统计学意义,除去重复和无效基因,得到本芯片的DEGs[8]。采用R 语言绘制DEGs的热图和火山图。

1.3 核心DEGs 筛选与生物学过程及信号通路分析将DEGs 导入STRING 数据库,设置筛选标准:combined score>0.4,将分析数据以TSV 格式导出,再导入Cytoscape 3.2.1 软件中,然后使用软件的NetworkAnalyzer 进行分析。在网络中,度值(Degree)表示某一节点与其他节点连接边的数量[9];中介中心度(betweenness centrality,BC)表示一个节点担任其它两个结点之间最短路的桥梁的次数。BC 值越大,表示节点在网络拓扑结构中的枢纽程度越重要[10]。目前,网络分析的主要方法是选择节点Degree 值及BC 值高的作为网络的关键节点[9]。本研究也采用该分析方法,筛选BC>0.01,Degree>30的作为UC的核心DEGs。对大规模基因进行功能注释,包括基因功能富集分析(GO 基因本体论)和基因通路富集分析(KEGG)。GO 分析包括分子功能(molecular function,MF)、细胞组分(cellular components,CC)和生物学过程(biological process,BP)[11,12]。接着将核心DEGs 导入DAVID 数据库,并限定物种为人,进行基因功能注释分析和功能富集分析,然后导出数据,对生物过程(P<0.01)和信号通路(P<0.05)进行筛选,用R 语言对GO 和KEGG 富集分析结果进行可视化。

1.4 蛋白质相互作用网络构建及分析 将得到的核心DEGs 导入STRING 数据库绘制蛋白-蛋白互作网络图(protein-protein interaction,PPI),将分析数据以TSV 格式导出,导入Cytoscape 3.2.1 软件,绘制PPI 网络图,并对网络进行拓扑结构分析;再利用“Generate style from statistics”工具对网络节点的大小和颜色进行设置。网络图中节点的大小、颜色及其深浅变化代表Degree 值的大小,边的粗细反映了Combine Score的大小,从中筛选出Degree 值和接近中心度排名靠前的靶点。

2 结果

2.1 差异基因筛选结果 共筛选出487 个差异基因,其中上调465 个,下调22 个。采用R 语言绘制火山图,见图1A;绘制前30 位上调基因和下调基因的热图,见图1B。

图1 差异基因筛选结果

2.2 核心DEGs 筛选与生物学过程及信号通路分析共得到36 个UC的核心DEGs,包括:UBB、CYCS、GNB2L1、APP、CDC42、SOD1、ACTG1、ISG15、RHOA、ACTR2、B2M、CANX、ATP5B、TXN、ATP5A1、CCT8、PFDN5、RAB11A、RAB7A、HNRNPA2B1、NEDD8、HSPD1、PARK7、TFRC、SDHB、RPL7、PSMA6、PCBP1、ATP5O、ANXA2、RPS27、GDI2、RAC1、CFL1、FAU、PTGES3。功能注释结果显示:36 个UC 核心DEGs共在53 个(P<0.01)GO term 上富集,其中BP18 个,CC24 个,MF11 个。BP 主要富集在Gtpase 介导的信号转导、细胞或亚细胞成分的运动、线粒体ATP 合成耦合质子转运、ATP 合成耦合质子运输、线粒体膜电位的调节等;CC 主要富集在胞外外体、胞质溶胶、细胞外间质、局部粘连等;MF 主要富集在蛋白质结合、多聚RNA 结合、质子转运ATP 合成酶活性、谷胱甘肽酶活性、跨膜转运活性等,BP、CC、MF的COUNT 得分排名前5的结果见表1、图2。KEGG 通路分析显示:36 个UC 核心DEGs 共富集在25 条通路上,主要包括:吞噬体、黏着小带、细菌侵袭上皮细胞、沙门氏菌感染、肌动蛋白细胞骨架调节、白细胞内皮移动等,见表2、图3。

图3 核心DEGs的KEGG 富集分析

表2 核心DEGs的KEGG 通路分析

图2 核心DEGs的GO 富集分析图

表1 核心DEGs的GO 富集分析结果

2.3 PPI 网络分析结果 将核心DEGs 上传至STRING 数据库,PPI 网络图包含35 个节点和171条边,平均节点Degree 值为9.77,富集P<1.0E-16。将网络分析数据以TSV 格式从STRING 数据库中导出,然后导入Cytoscape 3.2.1 软件中,绘制PPI 网络图,Degree 排名前10的靶点包括RACK1、ACTG1、UBB、CCT8、HSPD1、SOD1、CDC42、PSMA6、CFL1、RPL7,见图4。

图4 核心DEGs的PPI 网络图

3 讨论

随着高通量芯片技术发展,利用生物信息学方法可以更加快速、经济、高效地筛选出参与疾病发病机制的重要基因,为疾病的诊断、治疗及药物设计提供依据。本研究基于生物信息学分析筛选出UC的487 个DEGs,上调基因465 个,下调基因22 个,然后筛选得到36 个UC 核心DEGs。进一步探究了核心DEGs的生物学过程、分子功能和细胞组成,发现涉及的生物过程包括:GTP 酶介导的信号转导、细胞或亚细胞成分的运动、线粒体ATP 合成耦合质子转运、ATP 合成耦合质子运输、线粒体膜电位的调节、胞外外体、胞质溶胶、细胞外间质、局部粘连、蛋白质结合、多聚RNA 结合、质子转运ATP 合成酶活性、谷胱甘肽酶活性、跨膜转运活性等,这些与UC的发生和发展都有一定的联系。KEGG 通路分析显示主要通路包括:吞噬体、黏着小带、细菌侵袭上皮细胞、沙门氏菌感染、肌动蛋白细胞骨架调节、白细胞内皮移动等。

PPI 网络分析结果显示,RACK1、ACTG1、UBB、CCT8、HSPD1、SOD1、CDC42、PSMA6、CFL1、RPL7等靶点是网络中的核心节点,推测它们是UC 发病的关键基因。目前研究显示,RACK1 通过控制蛋白激酶C(protein kinase C,PKC)介导的信号通路将蛋白锚定在特定亚细胞位置并调节活性,导致下游激酶的激活或失活,从而控制细胞极性,从动力学角度调节细胞骨架的动力。此外,RACK1 基因的过表达,调节某些癌症的上皮间质转化,从而促进多种不同肿瘤细胞的侵袭和扩散[13]。研究显示[14],UC 患者结肠黏膜中CDC42 水平较正常人显著升高。CDC42是RhoGTP 酶蛋白家族中的一员,与GTP 结合后活化的CDC42 可以调控细胞黏附、细胞骨架重排、细胞运动和迁移、细胞膜蛋白物质运输等多种生物学活动[15]。在T 细胞中,CDC42 过表达对细胞骨架的肌动蛋白和微管蛋白分极和迁移、分化均有影响[16]。CDC42 还会使癌细胞依附于血管壁上,从而使它们通过血液扩散到身体的其他部位。因此,理论上抑制CDC42 蛋白可以使癌细胞无法依附于血管内壁的内皮细胞上,从而减少其扩散的机会,这在未来极有可能成为新的预防癌细胞扩散和转移的新靶点。

综上所述,RACK1、ACTG1、UBB、CCT8 等基因可能通过调控吞噬体、黏着小带、细菌侵袭上皮细胞、沙门氏菌感染、肌动蛋白细胞骨架调节、白细胞内皮移动等信号通路参与溃疡性结肠炎的发生发展。

猜你喜欢
细胞骨架网络图靶点
土槿皮乙酸对血管内皮细胞迁移和细胞骨架的影响
维生素D受体或是糖尿病治疗的新靶点
网络图计算机算法显示与控制算法理论研究
肿瘤免疫治疗发现新潜在靶点
“洋葱细胞骨架的制作技术研究”一 文附图
网络图在汽修业中应用
细胞骨架在ns脉冲诱导肿瘤细胞凋亡中的作用
心力衰竭的分子重构机制及其潜在的治疗靶点
氯胺酮依赖脑内作用靶点的可视化研究
论虚工作是单双代号网络图的实质性区别