糖尿病肾病相关基因筛选及生物信息学分析

2019-08-19 11:11丁炜光张瑶李静波丁敏
山东医药 2019年20期
关键词:编码通路数据库

丁炜光,张瑶,李静波,丁敏

(1天津市南开区三潭医院,天津300193;2天津医科大学代谢病医院)

糖尿病是临床上最常见的代谢系统疾病[1],其发病率逐年升高,占用了大量医疗资源和经费[2]。糖尿病肾病(DN)是糖尿病晚期重要的微循环并发症,也是临床上终末期肾病的主要原因之一[3]。晚期DN患者出现大量蛋白尿、肾功能衰竭,是糖尿病患者死亡的重要原因。DN的确切发病分子机制并未明确,目前认为DN是涉及多基因、多步骤的异常代谢过程。近年来随着表达谱芯片及二代测序技术的不断发展,海量DN相关数据被上传至多个基因表达数据库,为从分子层面研究DN提供了基础[4,5]。对相关基因表达谱芯片中的数据深入分析,探索DN相关基因的信号通路,有助于筛选DN高危人群。本研究采用生物信息技术,分析基因公共表达数据库(GEO)中关于DN的芯片数据,筛选差异表达基因及其可能的功能和信号通路,以期为DN的早期诊断及靶向药物研发提供生物信息学基础。

1 材料与方法

1.1 数据库及分析软件 基因表达谱公共数据库GEO(https://www.ncbi.nlm.nih.gov/geo/)用于筛选DN差异表达基因。本研究中涉及的基因芯片平台为GPL8300,芯片数据集为GSE1009详见网址https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GSE1009[6]。生物学信息注释数据库DAVID(https://david.ncifcrf.gov/)用于对差异表达基因进行生物功能信息注释。蛋白-蛋白相互作用数据库STRING(http://string-db.org/cgi/input.pl)用于构建差异表达基因编码蛋白的相互作用网络。

1.2 差异表达基因筛选 在GEO中筛选并下载DN相关基因芯片数据,数据搜索条件为“diabetic nephropathy”,物种选择“human”。利用GEO数据库提供的在线分析方法筛选出DN患者肾组织与正常人群肾组织中差异表达最为明显的基因。筛选条件为差异表达上调或下调2倍以上(logFC>2或<-2)、P<0.01。

1.3 差异表达基因功能及信号通路分析 对筛选出的差异表达基因的靶基因进行基因本体论(GO)和京都基因与基因组百科全书(KEEG)分析,预测其可能功能及信号通路。

1.4 差异表达基因编码蛋白的相互作用分析 用STRING数据库分析差异表达基因编码蛋白间的相互作用关系。分析差异表达基因编码蛋白与其他常见DN致病基因编码蛋白之间的相互作用关系。筛选条件为蛋白与蛋白相互作用关系置信指数>0.4。

2 结果

2.1 差异表达基因筛选结果 筛选出9个差异表达最为显著的基因,分别为PLCE1、CLIC5、PTPRO、热休克蛋白A12A(HSPA12A)、AIF1、GMDS、SEMA5A、CEP152、FOXC1。除CEP152表达下调外,余8个基因在DN组表达上调。见表1。

表1 GEO数据库筛选DN差异表达的基因

2.2 差异表达基因功能与相关通路 层次聚类分析显示,DN组与对照组呈现出明显的聚类表达,其中有191个基因呈现明显的差异表达。GO分析显示,上述差异表达基因的蛋白产物主要位于细胞膜、细胞器等细胞组成成分,主要的分子功能涉及蛋白结合、对细胞刺激反应和细胞信号转导,主要调控细胞代谢等生物学过程。KEGG通路分析显示,差异表达基因主要参与细胞代谢途径、甲状腺激素信号通路、Rap1信号通路、磷脂酰肌醇信号系统及肌醇磷酸代谢等。见表2、3。

表2 DN差异表达基因的GO分析结果

表3 KEEG基信号通路分析

2.3 差异表达基因编码蛋白的相互作用网络分析结果 在STRING数据库中分析9个差异表达基因编码蛋白间的相互作用关系,蛋白网络分析提示HSPA12A、GMDS、CEP152基因编码蛋白与其他蛋白作用关联最紧密(节点度≥5)。

3 讨论

DN是临床上较常见的一类糖尿病微血管并发症,其病理改变主要为肾小球肥大,肾小管、肾小球基底膜厚度增加,细胞外基质积聚[7~9];病情进展逐渐出现蛋白尿、血肌酐和尿素氮增高,最终发展为尿毒症、肾功能衰竭[10]。近年来我国2型糖尿病发病率逐渐增高,DN的患病人数也相应增加[11]。

DN的发病机制复杂,目前仍未完全清楚,现有研究认为DN的发生主要与遗传背景、肾脏血流动力学异常、血糖升高造成的代谢功能紊乱有关[10~14]。DN相关流行病学研究认为,糖尿病患者一级亲属罹患糖尿病的概率明显高于非糖尿病人群,且有糖尿病家族史的人群罹患DN的风险也明显高于无家族史的糖尿病患者。同时,移居非洲的高加索人种DN的发病率高于当地居民,而与移居前所在地的人种发病率相当。上述研究均提示DN的发病存在遗传因素。

近年来,随着基因芯片及二代次序技术的不断进展,积累了大量关于DN的数据,为在分子水平上研究DN的发病、危险因素及靶向治疗提供了基础[9,16,17]。本研究中,笔者借助GEO数据库筛选了9个在DN患者肾组织与正常人群肾组织中差异表达的基因,进行了功能富集、信号通路和共表达网络分析。共筛选出9个差异表达最为显著的基因,分别为PLCE1、CLIC5、PTPRO、HSPA12A、AIF1、GMDS、SEMA5A、CEP152、FOXC1。除CEP152表达下调外,余8个基因在DN组表达上调。这些差异表达的基因蛋白产物主要位于细胞膜、细胞器等细胞组成成分,主要的分子功能涉及蛋白结合、对细胞刺激反应和细胞信号转导,主要调控细胞代谢等生物学过程。蛋白网络分析提示HSPA12A、GMDS、CEP152基因编码蛋白与其他蛋白作用关联最紧密,提示它们在DN的发病机制中可能发挥重要作用。

HSPA12A、HSPA12B都属于HSP70超家族。不同于与该家族其他成员,HSPA12B有自己特异的结构和功能。HSPA12B主要表达于血管内皮细胞中,随着内皮细胞功能障碍及凋亡,外周血中HSPA12B可能升高[18]。DN组中HSPA12B表达水平是对照组的4.19倍,表达水平明显上调。同时,在DN相关差异表达基因编码蛋白的相互作用网络中,HSPA12B基因编码蛋白为关键单蛋白,在整个网络中与其他蛋白相互作用较为紧密,因此HSPA12B在DN的发生发展中可能发挥重要作用。而关于HSPA12A的研究较少,其确切生物学功能并不清楚。本研究发现HSPA12A为DN的关键基因,在DN发生发展中可能发挥重要作用,丰富了HSPA12A的生物学功能,下一步也将就此进行深入探索。

甘露糖-4,6-脱水酶(GDP)由GMDS基因编码。近年来研究显示,GDP参与体内的糖代谢过程,其表达水平增高大多与血糖水平升高或异常波动有关[19]。长期较高的血糖水平是DN的发病基础。本研究中GMDS表达水平在DN组中明显增高,推测抑制GMDS表达有望成为DN治疗的新方向。

目前关于CEP152基因及其编码蛋白的研究报道较少,且主要为其基因序列报道,具体功能并不清楚[20]。本研究结果显示CEP152在DN患者中表达水平明显下调,提示其拷贝数降低或编码蛋白表达水平下降可能是DN的危险因素。

总之,本研究借助生物信息学方法,筛选出了9个在DN肾组织与正常肾组织中差异表达最显著的基因,这些基因的主要分子功能涉及蛋白结合、对细胞刺激反应和细胞信号转导,主要调控细胞代谢等生物学过程。其中,HSPA12、GMDS、CEP152基因编码蛋白为蛋白-蛋白相互作用网络的中心节点,提示三者可能是DN相关的关键基因,其异常表达可能参与了DN的发病。上述研究结果为DN的早期诊断及靶向药物研发提供了生物信息学基础。

猜你喜欢
编码通路数据库
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare
数据库
数据库
数据库
数据库
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖