基于加权基因共表达网络分析筛选阿尔茨海默病的血液关键基因

2022-09-28 07:52魏冕张亚恒韩亚齐俊丽
实用心脑肺血管病杂志 2022年10期
关键词:共表达关键通路

魏冕,张亚恒,韩亚,齐俊丽

阿尔茨海默病(Alzheimer's disease,AD)是一种进展隐匿且病程不可逆的神经退行性疾病,至2019年全球AD患者人数已达5 000万[1-2],且其死亡率呈逐年升高趋势[3]。AD可能是由多种因素导致的复杂病理过程,且其早期诊断和治疗研究进展缓慢。从基因层面分析,AD被认为是由大量基因在整个基因组[4]或转录组水平[5]上调控异常所致。因此,未来有望通过对异常表达的基因进行标记和干预来达到早期诊断和治疗AD的目的。加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)已被证实可以有效检测基因模块与疾病特征之间的复杂关系[6]。WGCNA的独特优势是可以根据基因之间的权重相关系数将基因聚类到模型或网络中,然后分析模块与样本特征(包括临床特征、手术方法、治疗方法等)之间的相关性。本研究通过对AD血液相关芯片数据进行分析并通过WGCNA筛选与AD相关的血液关键基因,旨在从基因层面为AD的诊断和治疗提供新思路。

1 资料与方法

1.1 数据收集 2021年5—7月,利用美国国家生物技术信息中心基因表达综合数据库(https://www.ncbi.nlm.nih.gov/geo/)收集AD相关数据。所下载的数据集均以AD患者为实验组,以年龄匹配的健康老年人为对照组,使用的是血液样本。

1.2 基因注释和差异表达基因(differentially expressed genes,DEG)的鉴定 将所有数据集的基因名称进行重新注释,删除不能识别及重复识别的序列。在R 3.0.1软件中,使用R-limma软件包对两组血液样本中的mRNA进行差异表达分析。利用Benjamini-Hochberg方法进行多次测试校正。当mRNA的P<0.05、错误发现率(false discovery rate,FDR)<0.05和|log2 FC|≥1时被认为是DEG。

1.3 共表达网络构建和模块识别 使用WGCNA R包构建共表达网络。首先,聚类评估样本是否存在明显异常值;其次,使用自动网络构建功能构建共表达网络。计算软阈值β,根据β值获得临近矩阵和拓扑矩阵并计算基因之间的相异度。利用相异度对基因进行聚类,形成不同特征的模块基因。根据性状与模块特征向量基因的相关性及P值来挖掘与性状相关的模块,选择相关系数最高和P值最小的模块。提取相应模块的基因信息进一步分析。

1.4 功能富集分析 利用注释、可视化和集成发现的数据库(the database for annotation,visualization and integrated discovery,DAVID)对相关性最强的网络模块中的基因进行GO富集分析和KEGG通路富集分析,其中GO富集分析从生物学过程(biological process,BP)、细胞组成(cellular component,CC)和分子功能(molecular function,MF)3个方面进行。

1.5 关键基因鉴定 计算临床相关性较强的几个基因模块的基因显著性(gene significance,GS)(基因与性状的相关性)和模块身份(module membership,MM)(基因与模块的相关性),将各模块网络中GS>0.9和MM>0.9的基因定义为核心基因。将核心基因上传至STRING数据库进行在线分析并建立蛋白-蛋白相互作用(protein protein interaction,PPI)网络。在生物网络中通过量化关键节点与非关键节点在拓扑性质方面的差异,并以量化值的大小作为判别关键节点与否的标准。使用Cytoscape的cytoHubba插件可计算网络中各节点的最大团中心性(maximal clique centrality,MCC)、最大相邻成分(maximum neighborhood component,MNC)、节点连接度(degree)、边缘渗滤分量(edge percolated component,EPC)等拓扑特征。为了筛选出在PPI网络中起关键作用的基因,并尽可能使结果稳健,利用该插件集成了多种网络拓扑算法来识别网络中的关键节点优点,将多种算法筛选出的前10个关键节点进行相交,最终获得在多个算法中均处于关键节点的关键基因。

2 结果

2.1 DEG的鉴定 本研究数据集为GSE97760队列的19个血液样本,其中实验组10个血液样本、对照组9个血液样本。使用FDR<0.05和|log2FC|≥1作为临界点共鉴定出7 080个DEG,其中3 278个下调DEG和3 802个上调DEG,见图1。

图1 火山图Figure 1 Volcano plot

2.2 共表达网络构建和模块识别 当β值为19时,基因间的连通性开始符合幂律分布(无尺度分布),因此可使用该阈值计算基因之间的相异度并构建WGCNA共表达网络。将最小模块大小设置为5,最终拆分出4个基因共表达模块。结果显示,黑色模块 与AD呈正相关(r=0.89),绿色模块与AD呈负相关(r=-0.90),见图2。

图2 临床特征相关性模块图Figure 2 Correlation module diagram of clinical features

2.3 关键模块的功能富集分析 GO富集分析结果显示,黑色模块和绿色模块基因的BP主要富集于转录、参与泛素依赖性蛋白质分解代谢过程的蛋白质泛素化,CC主要富集于核、核质,MF主要富集于蛋白质结合、DNA结合、泛素蛋白转移酶活性。KEGG通路富集分析结果显示,黑色模块和绿色模块基因主要调节途径包括PI3K-Akt、MAPK信号通路。

2.4 关键基因鉴定 黑色模块包含1 723个基因,绿色模块包含2 321个基因。以GS>0.9和MM>0.9为临界标准,在黑色模块中鉴定出112个基因为核心基因,见图3A;在绿色模块中鉴定出42个基因为核心基因,见图3B。将绿色模块中的核心基因导入STRING数据库后发现基因间交互关系稀少,基因间关系离散,故无法进一步锁定关键基因。在黑色模块中共得到4个关键基因(CUL5、RBM25、SRSF10、SRSF2),其中CUL5的MCC、MNC、degree、EPC均最大,见表1。

表1 黑色模块中关键基因的拓扑特征Table 1 Topological characteristics of key genes in black module

图3 相关性最强的基因模块的核心基因散点图Figure 3 Scatter plot of the most correlated gene modules hub geens

3 讨论

虽然正电子发射计算机断层显像及腰椎穿刺脑脊液检查对AD具有较好的诊断效能[7],但昂贵的价格和有创操作等问题限制了其在AD早期诊断中的应用。本研究旨在鉴定AD患者血液中异常表达的关键基因,以从基因层面寻找新的生物标志物。

本研究通过构建共表达网络从相关性最强的2个模块中筛选出多个关键基因,其中在黑色模块中通过多种算法筛选出的CUL5的中心特性最强,故认为其在模块中的位置最为关键。既往研究发现,CUL5可以通过不同途径参与AD的发生和发展,如CUL5过表达可减少腺苷酸环化酶和环磷酸腺苷的产生,通过丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)磷酸化的机制,参与与细胞增殖有关的各种蛋白质的降解过程,从而抑制细胞增殖[8-9];不仅如此,CUL5过表达还会导致DEPTOR水平明显降低[10]。而高DEPTOR表达对于维持PI3K/Akt信号通路激活是必要的,此外其又是哺乳动物雷帕霉素靶蛋白复合体1(mammalian target of rapamycin complex 1,mTORC1)的抑制剂,可以抑制mTORC1的功能并诱导自噬[11]。这些途径已被证实在AD的发生和发展中发挥着关键作用[12]。此外,黑色模块中的SRSF2基因是一个重要的调节剪接tau蛋白的前mRNA,其剪接失调经常导致神经变性疾病[13-14]。而绿色模块中的MIB1、USP9X已被证实可激活Wnt/β-catenin信号传导通路[15-16],该信号通路的激活有助于AD的治疗[17]。

近期一项基于基因表达综合数据库的网络药理学研究发现,药物可以通过调控CUL5等核心基因来干预PI3K-Akt、MAPK、泛素介导的蛋白水解等信号通路,进而发挥治疗AD的作用[18];此外,另一项网络药理学研究也发现,通过干预PI3K-Akt、MAPK信号通路可达到治疗AD的效果[19]。这些途径早已被多数研究证实在AD的发生和发展中具有核心作用[20-21]。笔者认为处于模块最关键位置的CUL5可通过PI3K-Akt、MAPK信号通路在AD的发生和发展中发挥重要作用。

综上所述,CUL5是AD的血液关键基因,其可调控PI3K-Akt、MAPK信号通路,并有望成为AD潜在的诊断和治疗靶点。上述研究结果有助于揭示AD在基因层面的发生、发展机制。但本研究尚存在一定局限性:(1)本研究仅纳入单个芯片数据,且数据中包含的病例较少,导致结果可能不稳定;(2)严格的重注释方法可能导致部分错配的探针序列不能被注释,而丢失一些功能性mRNA;(3)部分关键基因与AD的关系尚不明确,需进一步验证。

作者贡献:魏冕、张亚恒进行文章的构思与设计,研究的实施与可行性分析;魏冕、韩亚、齐俊丽进行数据收集、整理、分析;魏冕、韩亚进行结果分析与解释;魏冕负责撰写、修订论文;张亚恒负责文章的质量控制及审校,并对文章整体负责、监督管理。

本文无利益冲突。

猜你喜欢
共表达关键通路
硝酸甘油,用对是关键
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
高考考好是关键
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
高世代回交玉米矮秆种质的转录组分析
两种半纤维素酶在毕赤酵母中的共表达
SphK/S1P信号通路与肾脏炎症研究进展
通路快建林翰:对重模式应有再认识