李莎莎,王琦2,钟斌,陈依烛,陈佳音,凌雁武
(1. 右江民族医学院,广西 百色 533000;2. 右江民族医学院附属医学院,广西 百色 533000)
阿尔茨海默病(Alzheimer’s Disease,AD)即老年性痴呆,是一种慢性神经退行性疾病,主要临床表现为记忆力减退、认知功能障碍、行为异常等,具有起病隐匿、发展缓慢的特点。AD可分为认知正常、轻度认知障碍(MCI)、痴呆3个阶段。AD是老年痴呆最常见的原因,随着我国人口老龄化进程的加快,AD发病率呈逐年上升的趋势,现已超过700万人[1]。AD可导致老年人丧失工作、社交和生活自理能力,严重危害老年人身心健康,给家庭和社会带来沉重的负担。
AD的发病机制较复杂,以β-淀粉样蛋白(Aβ)瀑布理论、Tau蛋白学说,氧化应激、炎症机制、线粒体功能障碍和基因突变等假说较为常见[2]。许多学者和专家致力于AD发病机制和病医学的研究,认为遗传和环境因素是导致AD的主要因素,而环境因素中,微量元素与AD的关系受到了越来越多的重视。研究表明,环境中暴露的铝可能参与AD的发生发展[3]。AD发病后难以治愈,目前主要的治疗手段是缓解发病症状,但研究表明AD的病理生理改变出现早于临床症状[4]。如治疗开始于早期阶段(MCI或者认知正常阶段),临床症状的发作可延迟[5]。因此,迫切地需要提高早期诊断水平,在疾病早期给予有效干预和治疗。
随着基因芯片和高通量测序技术的快速发展,从基因组、转录组、蛋白质组等不同层次研究疾病的发生、发展及预后已经成为全世界共同关注的热点之一。本研究运用生物信息学方法,从NCBI公共数据平台中的基因芯片原始数据进行挖掘,筛选出与AD相关的差异表达基因,并对其进行GO功能注释和KEGG通路富集分析,蛋白质-蛋白质相互作用(PPI)网络分析,希望能从中为AD发病机制、早期预防、治疗靶点的筛选提供有用的信息。
1.1数据下载 在NCBI-GEO DataSets公共数据库(https://www.ncbi.nlm.nih.gov/geo)平台中以关键词“Alzheimer’s disease”搜索并筛选微阵列数据集,得到基因芯片数据集GSE5281,芯片平台[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array,该数据集样本来源于74例正常对照组,87例AD患者的脑组织。
1.2方法
1.2.1差异表达基因(differentially expressed genes,DEGs)筛选 对上述数据运用R/Bioconductor统计语言对芯片数据进行处理,将表达谱中的原始数据读入R操作平台,对数据进行标准化处理,运用limma包分析并筛选差异表达基因,筛选条件为P<0.05,|logFC|>1;并绘制火山图。
1.2.2差异基因的功能富集分析 利用DAVID 6.8生物信息学资源数据库对差异基因进行GO功能注释分析和KEGG通路富集分析(P<0.05为“显著富集”)。将P值从小到大排序,分别列出排序前10位的GO功能族和KEGG信号通路。
1.2.3差异基因编码的蛋白质-蛋白质相互作用(PPI)和Cytoscape分析 利用STRING数据库(http://string-db.org)对差异基因进行PPI网络分析,设置可信度“confidence”为0.7,借助Cytoscape 3.8.2软件对差异基因的相互作用进行可视化展示,最后使用CytoHubba插件MCC法构建模块,筛选出10个候选关键基因,再对10个候选关键基因进行GO功能注释和KEGG通路富集分析。其中,节点表示蛋白,边表示蛋白之间的相互联系,节点度值大小与对应节点在网络中的重要程度对比,将节点度值排序,前3位的基因视为核心基因。
2.1差异表达基因的筛选结果 在GSE5281数据集中,共筛选得1037个DEGs,其中上调基因312,下调有725,见图1。
图1 DEGs的火山图
2.2差异表达基因的GO功能注释分析 GO分析结果显示,DEGs主要富集于线粒体电子传递NADH到泛醌、mRNA稳定性调节、ATP水解耦质子转运、离子跨膜转运等生物过程;DEGs主要富集于髓鞘、线粒体、线粒体内膜结合、线粒体呼吸链复合物Ⅰ等细胞成分;DEGs主要富集于NADH脱氢酶(泛醌)活性、质子转运ATP酶活性、未折叠蛋白结合、钙离子结合等分子功能,见图2。
2.3KEGG通路富集分析结果 KEGG通路富集分析结果显示,DEGs在氧化磷酸化(hsa00190)、突触囊泡循环(hsa04721)、帕金森病(hsa05012)、亨廷顿病(hsa05016)、阿尔茨海默病(hsa05010)等信号通路上显著富集,见图3。
图2 DEGs的GO功能注释
图3 DEGs的KEGG通路富集分析
2.4构建DEGs蛋白质-蛋白质相互作用网络(PPI)筛选hub基因分析 通过STRING数据库对DEGs进行分析,设置可信度“confidence”为0.7,绘制PPI网络,含节点979个,边596条。然后利用Cytoscape软件中CytoHubba插件中MCC法筛选出网络中最高的10个候选关键基因,见图4。
颜色越红代表节点度值越大,黄色代表节点度值越小。
对10个候选关键基因进行GO功能注释和KEGG功能富集分析,GO分析结果显示,主要富集于线粒体电子传递NADH到泛醌、线粒体呼吸链复合体组装、线粒体电子传递泛醌到细胞色素c等7个生物过程;主要富集于线粒体内膜、呼吸链复合体Ⅰ,呼吸链复合体Ⅰ/Ⅲ等7个细胞成分;主要富集于NADH脱氢酶(泛醌)活性、NADH脱氢酶活性、泛醌-细胞色素-C还原酶活性等9个分子功能,见图5。结果显示候选关键基因主要富集在氧化磷酸化(hsa00190)、代谢途径(hsa01100)、帕金森病(hsa05012)、阿尔茨海默病(hsa05010)等7条信号通路,见图5。节点度排序前3位的基因是NDUFAB1,UQCRC2,UQCRC1,是网络中的核心基因。
图5 候选关键基因的GO功能注释和KEGG通路分析
AD是目前全球医疗保健领域最具挑战的疾病之一[6]。AD的发病机制尚未明确,且是多基因、多途径、多阶段相互作用的复杂过程,缺乏有效的治疗手段,但AD的病理生理改变早于临床症状出现[4]。因此,早发现、早治疗成为了临床急需解决的难题。
本研究对基因芯片数据GSE2581(74例正常对照组,87例AD患者的脑组织)进行数据挖掘,共筛选出1037个DEGs,其中312个基因表达上调,725个基因表达下调。将DEGs导入STRING数据库获取PPI网络数据,利用Cytoscape进行可视化,使用插件CytoHubba筛选出前10个候选关键基因。对候选关键基因做GO功能注释和KEGG通路富集分析,结果显示,富集在线粒体电子传递NADH到泛醌、线粒体呼吸链复合体组装等7个生物过程,富集在线粒体内膜、呼吸链复合体Ⅰ/Ⅲ等7个细胞成分;富集在NADH脱氢酶(泛醌)活性、NADH脱氢酶活性等9个分子功能,富集在氧化磷酸化(hsa00190)、代谢途径(hsa01100)、帕金森病(hsa05012)、阿尔茨海默病(hsa05010)等7条信号通路。
NDUFAB1是细胞活力必不可少的线粒体酰基载体蛋白(ACP)[7],是复合物Ⅰ的辅助亚基。Hou TT等[8]研究发现,NDUFAB1通过协调呼吸复合物和超级复合物(SC)的组装,作为线粒体能量代谢效率和能力以及活性氧(ROS)代谢的关键内源性调节剂。Wang IL等[9]使用一种新的方法iMDM来分析AD的基因表达谱,预测NDUFAB1、NDUFB5、MDH1、DDX1、MRPS35基因在AD的发生发展中起关键作用。
UQCRC1和UQCRC2是线粒体呼吸链复合物Ⅲ中的两大蛋白,对还原酶的组装以及复合物Ⅲ的完整性至关重要。线粒体呼吸链复合物Ⅲ是线粒体正常功能和ATP合成所必需的,对神经元的形态发生和功能至关重要[10]。复合物Ⅲ活性的丧失导致线粒体ROS的产生升高,并可能导致许多神经退行性疾病,例如UQCRC1的罕见遗传变异导致常染色体显性遗传性帕金森病[11]。UQCRC1在脑、心、肾、肝、骨骼肌在内的组织中广泛表达,值得注意的是,在黑质和纹状体中含量丰富[12]。Fu W等[13]在对小鼠研究中发现UQC-RC2和UQCRC1在神经元和星形胶质细胞中表达,但在小胶质细胞中却没有检测到UQCRC1,更有趣的是,一些表达UQCRC1的细胞似乎不表达UQCRC2,但所有表达UQCRC2的细胞也有表达UQCRC1,因此,UQCRC1对于复合物Ⅲ的正常功能很重要,来维持正常的脑缺血耐受性、学习和记忆。同时,在AD患者中UQCRC1的表达量显著增加(2.7~8.6倍),且表达水平与UQCRC1的甲基化状态之间存在强正相关(P<0.001)[14]。一些研究表明,异常的UQCRC2表达与多种癌症的发生发展和侵袭转移有关,如结肠癌[15]、乳腺癌[16]。然而,尚未发现UQCRC2与AD的相关性研究的文献报道。
NDUFAB1是线粒体呼吸链复合物Ⅰ的辅助亚基,UQCRC1和UQCRC2是线粒体呼吸链复合物Ⅲ中的两大蛋白。线粒体具有多种功能,包括能量代谢、钙稳态、活性氧化的产生和凋亡信号[17-19]。线粒体能量产生中最重要的参与者是呼吸电子传递链(ETC),它由细胞器内膜中的4个多异聚体复合物(复合物Ⅰ~Ⅳ)组成。ETC也会释放ROS,过量的ROS释放会导致蛋白质、脂质甚至是遗传物质的氧化损伤[20]。线粒体功能障碍的特征是缺乏关键呼吸酶的活性并伴随着ROS的产生和积累。有研究表明,线粒体功能障碍和氧化应激是AD发病的早期指标,甚至可在血液[21]中检测出来。
随着广西大型铝业的建设及不断扩产,矿区内矿尘、矿渣、矿水污染加重,矿区内环境发生巨大变化,人群铝元素暴露压力持续增加。早期研究表明矿区老年人的认知能力与非矿区老年人的认知能力有显著性差异[22-23]。另外,职业性铝接触对工人的认知功能特别是记忆能力有损伤[24]。职业性电解铝接触人群的短时记忆能力、语言能力和计算能力相对于对照组人群明显降低,其MCI的检出率与对照组相比明显升高[25]。我们的前期研究中发现在铝矿区MCI老年人与对照组共有130个差异表达的microRNA,其中12个表达上调,118个表达下调。使用Target Scan数据库进行miRNA预测靶基因时发现,其中hsa-miR-381-3p、hsa-miR-129-5p、hsa-miR-136-3p、hsa-miR-370-3p、hsa-miR-5581-3p均预测到了NDUFAB1、hsa-miR-214-3p预测到UQCRC1,hsa-miR-129-5p、hsa-miR-9-3p预测到UQCRC2,其中hsa-miR-129-5p调控的靶基因有NDUFAB1、UQCRC2。这些证据说明铝致认知障碍发生发展与AD有相似的发病机制,与AD相关的关键基因密切关联,铝致认知障碍发病机制亟需做大量基础研究工作,探究铝暴露在相关信号通路之间的作用及表观遗传调控在其中发挥的重要作用。
综上所述,本研究通过对公共数据集进行生物信息学分析,最后筛选出于AD发生发展相关的关键基因NDUFAB1、UQCRC1、UQCRC2。不足之处在于,缺少后续的分子生物学实验来验证所得到的结果。利用生物信息学分析环境因素及遗传因素等多维度交互在痴呆发病过程中作用,以期明确AD及高铝环境暴露认知障碍相关标记物,明确铝暴露损伤的与学习记忆密切相关的信号通路,探寻铝致认知障碍可能的发病机制是下一步研究重点。为减轻矿区高铝暴露认知障碍患者家庭负担,积极探索防治痴呆新策略。