利用转录组学数据探究阿尔茨海默病与食管癌的关联

2021-03-22 09:29殷晓莎田肃岩
中国老年学杂志 2021年6期
关键词:胶质甲基化关联

殷晓莎 田肃岩

(吉林大学第一医院临床研究部,吉林 长春 130021)

阿尔茨海默病(AD)是一种常见的神经退行性疾病,多见于70岁以上人群,占痴呆症患者的60%~80%〔1〕。食管癌(EC)的死亡率在癌症相关死亡中排名第六,发病率在所有癌症中排名第七〔2〕,是一种常见的恶性消化道癌症。老年食管癌患者数量不断增加,且食管癌在老年人群中预后更差〔3〕。

一些研究为AD和癌症之间的关联提供了流行病学、细胞水平及分子水平的证据。Ma等〔4〕的meta分析将队列研究中人群的年龄、性别等干扰因素进行调整后发现,相较于未罹患AD的人群,罹患AD的人群癌症风险降低42%;相较于未罹患癌症的人群,罹患癌症的人群发生AD风险降低37%。Yarchoan等〔5〕研究也表明,与未罹患癌症人群相比,罹患癌症人群AD的发生率显著降低,并检测了罹患癌症与未罹患癌症的人脑内神经原纤维缠结(NTF)和β-淀粉样蛋白(Aβ)水平,结果显示Aβ水平相似,但罹患癌症的人脑内NTF明显低于未罹患癌症的人群。AD和癌症都随着年龄增长,发病率快速增高〔6,7〕,AD和癌症之间存在复杂的生物学关系。AD和癌症可看作是衰老的不同表现,AD中神经元进行性死亡标志着神经元变性,细胞不受控制的增殖是癌变的特征〔8〕。AD和癌症中存在相同基因发生不同方向的失调,如已知的肿瘤抑制基因P53在AD中上调,在癌症中下调〔9〕,死亡蛋白激酶(DAPK)1在AD中上调,在癌症中失活〔10〕。

通过查阅文献发现AD和EC之间存在共享分子。氧化应激标志物4-羟基壬烯醛(4-HNE)可促进AD中Aβ沉积、tau蛋白磷酸化〔11,12〕,它在EC上皮中的含量相较于正常食管上皮显著增多,且随癌症进展而增加〔13〕;miR-21可抑制AD中Aβ表达〔14〕,它在EC晚期显著升高,能诱导癌症细胞生长和侵袭〔15〕。这些证据表明AD和EC之间可能存在关联,但仍需进一步探索。随着基因芯片和二代测序技术的发展,对高通量转录组学数据进行大数据分析,能快速发现不同疾病共享的基因和通路,进而探究不同疾病之间潜在的生物学关联。本研究利用基因表达谱数据,通过识别AD和EC共享的基因和通路来探索二者间关联。

1 材料方法

1.1数据来源和处理 AD数据集对应基因表达综合数据库(GEO)(https://www.ncbi.nlm.nih.gov/gds/)中的GSE48350数据集,该数据集的检测芯片为Affymetrix Human Genome U133 Plus 2.0 Array。该数据集包含58个健康人的173个脑组织和29例AD患者的80例AD脑组织,这些脑组织分别来自大脑的4个区域(海马、内嗅皮质、上额叶皮层和中央后回)。EC数据集来自癌症基因组图谱(TCGA)中食道癌(ESCA)队列的RNA-seq数据,包括161例肿瘤组织和11例癌旁正常组织。

AD数据集(GSE48350)已经鲁棒多阵列平均(RMA)法背景校正和log2转化。使用Affymetrix Human Genome U133 Plus 2.0 Array芯片对应的注释包hgu133plus2.db进行探针集和基因名的转化,如果有多个探针集对应一个基因,则保留平均表达量最高的探针,EC数据集来自TCGA中的EC队列。AD和EC数据集测序方法、平台不一样,所包含的基因不一样,为保证AD和EC数据集中含有相同的基因,事先将两个数据集内的基因取交集得到重叠的16 379个基因。

采用邦弗罗尼-霍克伯格(BH)法〔16〕对P值进行多重检验校正,调整后P值为错误发现率(FDR)。统计分析均在R语言(https://www.r-project.org/)3.6.1版本中进行。

1.2统计方法

1.2.1筛选AD和EC的差异表达基因(DEGs) 在R语言环境下调用limma包,对大脑4个区(海马、内嗅皮质、上额叶皮质、中央后回)AD组与健康组基因表达值分别进行稳健t检验,设置差异表达基因的阈值为|log2FC|≥1,FDR<0.01,如果有基因在两个及以上脑区差异表达则取最小的FDR;对EC的癌症组和癌旁组的基因表达值进行稳健t检验,设置DEGs阈值为|log2FC|≥1,FDR<0.01获得EC的DEGs。在线工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)绘制韦恩图,使用ggplot2包绘制火山图。

在R语言环境下调用tinyarray包选取基因表达值的最佳截断点,并利用最佳截断点对共享基因的表达值分组(高、低表达组),对两组生存曲线进行log rank检验。KM生存曲线图使用survminer包和ggplot2包绘制。

1.2.2对AD和EC DEGs的富集分析 基因本体论(GO)功能注释是进行大规模功能富集研究的常用方法,GO数据库对基因的描述包括3个方面,分别为生物学过程(BP),分子功能(MF)和细胞组分(CC)。 京都基因与基因组百科全书(KEGG)是一个广泛使用的数据库,它存储和基因组、生物途径、疾病、化学物质和药物有关的大量数据。富集分析是一种可以把GO和KEGG数据库中的功能和通路等进行整合计算的算法。将筛选出的AD和EC的DEGs分别在clusterProfiler〔17〕包中进行GO〔18〕功能注释和KEGG〔19〕通路富集,富集分析阈值为counts≥2,FDR<0.05。

2 结 果

2.1AD与EC的差异表达基因 AD和EC DEGs的重叠(AD 125个,EC 2 395个),得到19个共享基因包括白细胞分化抗原(CD)44、生长抑素(SS)T、CD86、泛素结合酶E2T(UBE2T)、着丝粒蛋白(CENP)W等。在AD中19个基因中有6个基因上调,13个基因下调;在EC中19个基因有11个基因上调,8个基因下调,见表1。AD和EC DEGs见图1标记出的19个共享基因。

表1 AD和EC 19个共享基因表达

2.2AD和EC DEGs富集分析 AD的DEGs富集分析得到165个GO注释和6个KEGG通路;对EC的DEGs进行富集分析得到1 371个GO注释和38个KEGG通路。最终,AD和EC没有重叠的KEGG通路,但有8个重叠的GO注释,分别为内吞作用的调节、肽基酪氨酸磷酸化的正调控、细胞器定位的建立、神经元死亡、神经元死亡的调节、肿瘤坏死因子超家族细胞因子产生的调控、受体复合体、谷氨酸能突触,见表2。

2.3AD与EC相关联基因CD44、CD86在AD与EC中均呈高表达,通过绘制CD44与CD86高、低表达组的KM生存曲线,对预后进行评估发现CD44表达值高的组预后差,而CD86高低表达组生存曲线无显著差别,表明CD86不具有预后价值。见图2。

图1 AD和EC DEGs火山图

表2 AD和EC共享的GO富集分析

图2 CD44和CD86高、低表达组的KM生存曲线

3 讨 论

目前还没有研究利用转录组学数据探究AD和EC间的关联,本研究通过对基因表达谱数据分析,识别AD和EC之间共享的异常表达基因和通路,找出将两种复杂疾病联系在一起的共享机制,探索两种疾病的关联情况。本研究得到的共享基因中,有些炎症相关基因已明确涉及AD和EC的发病,如CD44、CD86和CHGA,提示炎症反应可能是将两种疾病关联起来的共同机制之一。CD44有20个外显子,仅含有组成型外显子的CD44转录产物为标准CD44(CD44S),EC上皮中CD44S表达增高与E-钙黏着蛋白在上皮-间质转化中缺失有关〔20,21〕,这种蛋白的缺失降低了组织内细胞的黏附力,使EC细胞转移和侵袭能力增强;星形胶质细胞可清除AD脑组织中的Aβ,CD44是星形胶质细胞形成过程中的重要黏附分子,在AD脑内,CD44阳性的星形胶质细胞弥漫性急剧增加〔22〕,可能Aβ的刺激动员了星形胶质细胞发生炎症反应,CD44因此表达升高。上述研究均表明CD44在AD和EC中呈现高表达,与本研究结果一致,通过对CD44在EC中的预后分析,发现CD44表达值高的组预后差,与Okamoto等〔23〕研究结果一致。

CD86是促炎性M1表型的标志物,Aβ可促进小胶质细胞激活产生促炎性M1表型,促进炎症和组织损伤,AD中存在大量M1表型的小胶质细胞,CD86也处于高表达状态〔24〕,这支持本研究中CD86在AD中上调。CD86是树突细胞表面分子,它的低表达使得树突细胞呈递抗原的功能下降,癌细胞更容易逃脱免疫监视。杨文锋〔25〕通过RT-PCR检测了EC组织中CD86的mRNA水平,发现其相对于正常对照组表达降低,推测这可能是炎症因子(转化生长因子和白细胞介素10)导致CD86表达降低。本研究中CD86显示在EC中上调,与杨文锋等〔25〕的结果不一致,可能是由于测量人群的异质性或基因多态性〔26〕导致,需要进一步设计实验验证。

嗜铬粒蛋白(CHG)A是一种可溶性糖蛋白,与激素和神经肽一起存储在内分泌细胞的分泌颗粒中,是神经内分泌肿瘤的分化标志物,参与肿瘤血管生成和肿瘤生长调节〔27,28〕。突触障碍可能在AD的病理生理中起关键作用,Lechner等〔29〕通过免疫组化实验发现,约40%的CHGA免疫阳性斑块和细胞外沉积物弥漫着活化的小胶质细胞,提示CHGA可能是AD中神经元、神经胶质和炎性机制之间的介体。

本研究还发现在共享基因中SST与激素分泌有关,提示激素分泌也可能是AD和EC中共享的潜在机制。SST广泛存在于下丘脑、大脑皮层、胃肠道中,已知它通过与高亲和力的G蛋白耦联生长抑素受体结合而抑制许多次要激素的释放,在共享的GO注释中可发现,AD和EC的DEGs同时被富集在激素转运、激素分泌、调节介素分泌这几个激素相关的生物学功能上,提示激素可能在AD和EC中有关键作用。SST是Aβ1-42选择性最强的结合物,干扰Aβ原纤维化并促进Aβ装配体的形成〔30〕。Jin等〔31〕通过实时甲基化特异性聚合酶链反应对EC患者中SST的超甲基化进行检测,发现在食管腺癌中,天然未甲基化中的SST mRNA水平显著高于天然甲基化中的SST mRNA水平,且在鳞癌和腺癌中,SST的甲基化频率和标准化甲基化均显著高于正常对照组,表明SST的高甲基化和EC发生有关。

综上,AD和EC这两种疾病共享相同的差异表达基因,但它们在两种疾病中的差异表达方向有的相同,有的相反,这些共享的基因和通路涉及的炎症反应(如CD44、CD86)、激素释放(如SST、GO:0030100)等生物学过程可能是将AD和EC联系在一起的机制。AD和EC之间可能存在关联,关于两种疾病关联研究的证据还不充分,需要大型实验进行验证。本研究从转录组学水平,利用生物信息学的方法对AD和EC的关联进行探索,提供了两种疾病关联研究的新视角。

猜你喜欢
胶质甲基化关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
人类星形胶质细胞和NG2胶质细胞的特性
小胶质细胞——阿尔茨海默病中重新回炉的热点
“一带一路”递进,关联民生更紧
奇趣搭配
智趣
视网膜小胶质细胞的研究进展
侧脑室内罕见胶质肉瘤一例
SOX30基因在结直肠癌中的表达与甲基化分析
鼻咽癌组织中SYK基因启动子区的甲基化分析