表达谱芯片和DNA甲基化芯片联合分析筛选克罗恩病发生、发展的分子靶标

2022-09-30 07:51林道泼
医学研究杂志 2022年9期
关键词:甲基化位点通路

徐 缘 蒋 益 林道泼

克罗恩病(Crohn′s disease, CD)是累及全消化道的慢性肉芽肿性透壁性炎症。全基因组关联研究已确定160多个炎症性肠病(inflammatory bowel disease, IBD)易感基因位点。然而,临床上仅7.5%的溃疡性结肠炎(ulcerative colitis, UC)患者和13.6%的CD患者观察到遗传变异,提示非遗传因素在疾病发病中发挥重要作用。表观遗传学是指基因的DNA序列未发生改变的情况下,基因功能发生了可遗传的变化,并最终导致表型变化。越来越多的证据提示,表观遗传修饰是连接IBD易感基因与非遗传因素(如肠道菌群、环境因素等)的重要桥梁,在IBD发病及疾病进展中起重要作用。因此,探讨CD患者表观遗传修饰状态或许能为探讨CD潜在发病机制提供新的思路。

DNA甲基化是最普遍的表观遗传学修饰方式,该过程是基因转录过程中的关键调控机制之一,通常情况下,DNA甲基化程度与基因表达活性之间呈负相关。研究发现,多个基因的甲基化修饰异常与IBD的发病密切相关。采用全基因组DNA甲基化分析方法,对小儿初治IBD患者和幼年发病CD患者肠组织进行研究发现,IBD患者肠组织中多个基因位点出现DNA甲基化程度改变。另有研究发现,与健康对照者比较,CD患者肠道纤维化组织中发现17个低甲基化修饰的基因,其中miR-1225、miR-661等可能在肠道纤维化过程中发挥关键作用。本研究拟联合分析表达谱芯片和DNA甲基化芯片数据,筛选与CD相关的异常甲基化修饰的差异表达基因及这些基因相关的信号通路,从而寻找CD疾病诊断和治疗的潜在靶点。

对象与方法

1.数据来源:从 NCBI的公共基因表达数据库(gene expression omnibus, GEO)中下载CD的表达谱芯片和DNA甲基化芯片。表达谱芯片下载编号为GSE102134、GSE75214和GSE186582、GSE102134共包含65例CD患者和12例健康对照者的人类肠组织标本,测序平台为GPL6244(Affymetrix Human Gene 1.0ST Array);GSE75214共包含59例CD患者和22例健康对照者的肠组织标本,测序平台为GPL6244(Affymetrix Human Gene 1.0ST Array);GSE186582共包含102例活动期CD患者和25例健康对照者的肠组织标本,测序平台为GPL570。而DNA甲基化芯片(下载编号:GSE105798)利用GPL13534(Illumina Human Methylation 450 Bead Chip)平台检测了8例CD患者肠组织和3例健康对照者肠组织样本中基因组DNA的甲基化水平。

2.数据标准化及差异表达基因筛选:GEO2R是GEO数据库中基于R语言的在线分析工具。本研究通过GEO2R分析数据集中的差异表达基因,差异表达基因检测条件为假发现率(false discovery rate, FDR)<0.05且|log差异倍数(FC)|>0.5。

3.甲基化芯片数据分析:应用R语言中的CHAMP包对DNA甲基化芯片数据进行CpG位点水平上的差异甲基化分析,以|delta beta vale|>0.3和FDR<0.05为阈值,寻找CD肠组织样本相比于正常肠组织的差异甲基化位点(DNA-methylation profiles, DMP);随后利用注释文件将差异甲基化位点映射到基因组上。

4.异常甲基化修饰差异表达基因的功能富集分析:使用VENNY在线软件将差异表达的基因、异常甲基化修饰基因列表进行对应的交集分析。利用R语言的ClusterProfiler包对差异表达基因进行富集,行基因本体(gene ontology, GO)分析和京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析,选取<0.05 作为显著富集相关的阈值。

5.蛋白-蛋白相互作用网络(protein-protein interaction, PPI)和子模块基因构建分析:应用STRING数据库行PPI分析,并利用Cytoscape软件进行可视化,行MCODE分析,筛选提取子网络,筛选条件设置为degree cut off=2,node score cut off =0.2,k-core=2,以及max depth=100。进入CytoHubba插件,根据其中的5种算法(MNC、MCC、Degree、EPC和Closeness),将每种算法获得的前20个基因与MCODE筛选出的子网络基因取交集后筛选出的共同基因即为核心基因。

6.核心基因验证:使用GEO2R工具,首先查找差异基因ID,随后通过ID号查找到差异基因在肠组织中的表达量,最后分析数据集中的差异表达基因,所有数据均输入GraphPad Prism 5.0软件进行绘图,验证核心基因在芯片集中的表达量。

结 果

1.CD差异表达基因的筛选:如图1A所示,对GSE102134数据进行差异分析后,共得到1315个差异表达基因,其中780个基因表达上调,535个基因表达下调。

2.DNA甲基化芯片分析:对于甲基化芯片的数据集GSE105798,以FDR<0.05,|delta beta vale|>0.3为阈值筛选差异甲基化位点,如图1B所示,一共筛选出11066个差异甲基化位点,其中8542个高甲基化位点,2524个低甲基化位点。随后利用注释文件将差异甲基化位点映射到基因组上,共获得3364个甲基化修饰水平升高的基因和937个甲基化修饰水平降低的基因。

3.异常甲基化修饰的差异表达基因进行GO功能和KEGG通路富集分析:将CD的差异表达基因和异常甲基化修饰的基因导入VENNY软件取交集获得异常甲基化修饰的差异表达基因。如图2所示,共得到55个低甲基化修饰下表达上调的基因,和125个高甲基化修饰下表达上调的基因。利用R语言的ClusterProfiler包对180个异常甲基化修饰的差异表达基因进行GO功能注释和KEGG通路富集分析。表1和表2展示了前5个具有显著意义的GO功能注释结果,以及上述基因相关的KEGG通路富集结果。分析表明异常甲基化修饰的差异表达基因主要分子功能(molecular function, MF)与跨膜转运蛋白活性、次级活化跨膜转运蛋白活性和转运体活性等相关;细胞组分(cellular component, CC)定位于细胞顶端、顶端质膜和细胞前沿等;而其生物学过程(biological process, BP)主要为有机阴离子转运、有机羟基化合物代谢和细胞外基质的组成等。KEGG信号通路主要为磷脂酰肌醇-3-激酶/丝苏氨酸蛋白激酶(phosphatei-dylinositol 3 kinase/serine-threonine kinase, PIK/Akt)信号通路、黏附斑和细胞外基质(extracellular matrix, ECM)-受体相互作用等。

4.异常甲基化修饰的差异表达基因蛋白相互作用网络分析:如图3所示,在STRING数据库中分析上述180个基因编码蛋白间的相互作用关系,接着采用Cytoscape软件中的MCODE法分析,发现1个子网络处于核心位置,总共包含10个关键基因。再采用CytoHubba插件,根据其中的5种算法(MNC、MCC、Degree、EPC和Closeness),将每种算法获得的前20个基因与MCODE筛选出的子网络基因取交集后筛选出5个核心基因,分别为分别为淀粉样前体蛋白(amyloid precursor protein, APP)、Ⅳ型胶原蛋白2(collagen Ⅳ alpha 2, COL4A2)、Ⅳ型胶原蛋白1(collagen Ⅳ alpha 2, COL4A1)、血小板源性生长因子β受体(platelet-derived growth factor receptor beta, PDGFRB)、肽YY(peptide YY,PYY)。5个核心基因的甲基化程度详见图4。

5.GEO数据库验证:如图5和图6所示,CD患者肠组织中PYY基因表达水平低于健康对照者(GSE75214:logFC=-0.76, FDR<0.001;GSE186582:logFC=-1.09, FDR<0.0001)。与健康对照者比较,CD患者肠组织中COL4A2、COL4A1、PDGFRB表达水平均显著升高[(GSE75214:logFC=0.82, FDR<0.001; logFC=1.17, FDR<0.001; logFC=0.96, FDR<0.001)(GSE186582:logFC=0.59, FDR<0.01; logFC=1.27, FDR<0.0001; logFC=0.75, FDR<0.001)]。而肠组织中APP基因表达在CD患者和对照组中差异无统计学意义。

讨 论

在临床中由于IBD的诊断缺乏金标准,易造成误诊和漏诊。近年来,越来越多的证据提示表观遗传学修饰如DNA甲基化、miRNA在IBD诊断中发挥关键作用。研究证实DNA甲基化在IBD诊断中具有较高的敏感度、特异性及准确性。Howell等研究发现,幼年IBD患者肠上皮细胞具有特异性的DNA甲基化模式,该模式诊断IBD的敏感度为75%,而特异性高达100%。此外,进一步对UC和CD患者回肠组织进行研究发现,DNA甲基化标志物有77%的准确性对两种疾病进行区分。上述研究提示,寻找IBD特异度的DNA甲基化模式有巨大的临床意义。

本研究通过生物信息学方法,筛选CD中异常甲基化修饰的差异表达基因,并进行KEGG信号通路聚类分析。结果发现,差异表达基因被显著富集到PIK/Akt信号通路、黏附斑和ECM-受体相互作用等信号通路,这与其他CD机制相关性研究一致。PIK/Akt信号通路与细胞生长和细胞程序性死亡等密切相关。研究证实PIK/Akt信号通路可能通过调控白细胞介素和免疫细胞,从而在炎症性肠病中发挥关键作用。Long等研究发现,与健康对照者比较,CD患者外周血CD4T细胞和肠组织淋巴细胞中PIK、Akt及mTOR的mRNA及蛋白表达水平均上调。使用PIK抑制剂和多不饱和脂肪酸均可下调PIK/Akt信号通路,从而诱导CD缓解。黏附斑激酶(focal adhesion kinase, FAK)可以调节细胞的生长、锚定、迁移、恶变和凋亡等过程,与多种肿瘤的发生、发展相关。LEEB等研究发现,与健康对照者比较,CD患者肠组织固有层成纤维细胞中FAK磷酸化水平降低,提示CD中成纤维细胞迁移能力减弱,肠道组织修复能力下降。肠道纤维化是CD特征性表现之一,逐渐进展可形成肠道狭窄。CD发病过程中,肠道慢性透壁性炎症及过度损伤修复,ECM蛋白异常沉积、胶原蛋白分解、ECM形成和ECM受体相互作用,最终导致肠道狭窄。因此进一步研究ECM受体相互作用可能有助于理解CD纤维化的分子机制。

本研究最终筛选出4个与CD发病密切相关的异常甲基化修饰的差异表达基因,分别为COL4A2、COL4A1、PDGFRB、PYY。PYY是一种胃肠道肽类激素,研究发现血浆PYY水平升高与多种胃肠道疾病如炎症性肠病密切相关。在葡聚糖硫酸钠诱导的大鼠结肠炎模型中,采用免疫组化方法对大鼠结肠组织进行分析发现,结肠炎组结肠组织中分泌PYY的内分泌细胞密度显著增高,且PYY水平与T淋巴细胞比例密切相关,提示胃肠道激素可能与肠道免疫系统存在相互作用,通过靶向PYY等可能有助于缓解炎症性肠病。血小板源性生长因子受体(PDGFR)是生长因子受体家族重要成员之一,对中性粒细胞、成纤维细胞具有趋化作用,并参与细胞凋亡过程。Tuller等对CD和溃疡性结肠炎患者外周血单个核细胞进行转录组分析发现,血小板源性生长因子(PDGF)信号通路参与炎症性肠病的发生、发展。此外CD肠道纤维化是ECM、成纤维细胞、细胞因子等多种因素之间复杂作用的结果,目前研究证实,PDGFR参与ECM及成纤维细胞的调控,因此PDGFR可能在CD肠道纤维化中发挥重要作用。但目前尚缺乏COL4A1、COL4A2与CD关系的研究。

综上所述,本研究利用生物信息学分析对表达谱数据集和甲基化数据集进行联合分析,构建PPI网络,推测信号通路可能影响CD的发生、发展,并筛选出可能与CD发病相关的4个核心基因,为探寻CD潜在的分子机制及致病基因研究提供必要理论依据。但仍需开展体内外分子生物学实验验证相关基因的功能和信号通路的作用。

猜你喜欢
甲基化位点通路
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
基于改进TF-IDF算法的基因通路富集方法
DNA脱碱基位点的检测方法及其生物学研究进展
多环境下玉米保绿相关性状遗传位点的挖掘
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
一种肿瘤甲基化谱纯化的统计方法朱宜静
5-氮杂胞苷调节植物基因表达研究进展与应用展望
干旱锻炼对B73自交后代当代干旱胁迫记忆基因表达及其启动子区DNA甲基化的影响
老年前列腺癌与DNA甲基化研究进展