邓坤,易蔚,赖海艳,龙娟,任梦瑶,李伟伟
1广西中医药大学研究生院,广西南宁530001;2广西中医药大学第一附属医院儿科
哮喘(BA)是儿童最常见的慢性呼吸道疾病[1],主要特征是气道慢性炎症、气道重塑及气道高反应性。文献[2]报道,14岁以下儿童哮喘患病率约3.3%,并且发病率呈明显上升趋势。哮喘病因、发病的分子机制尚未明确,加之哮喘的反复发作严重影响生活质量,对患儿家庭及社会造成巨大的精神及经济负担。miRNA小分子与哮喘气道重塑、支气管炎症及气道高反应性的发生密切相关,miRNA-182-5p的上调能抑制气道平滑肌细胞的增殖和迁移[3],miRNA-620下调能抑制气道平滑肌的增殖和凋亡[4],miR-223的过表达能够减轻气道炎症、NLRP3水平及IL-β的释放[5],miR-140-3P的上调表达可增加CD38蛋白质的表达,导致气道平滑肌收缩的增加[6]。越来越多的研究表明,miRNA在哮喘儿童的发生发展过程中起重要作用。本课题组利用生物信息学技术获取高通量基因表达数据库(GEO)哮喘儿童差异表达miRNA、mRNA,并进一步挖掘重要转录因子、关键生物学途径以及构建miRNA-mRNA调控网络,最终筛选与儿童哮喘发病相关的关键微小核糖核酸(miRNA)、信使核糖核酸(mRNA),为儿童哮喘发病机制和潜在治疗药物提供一定理论依据。
1.1 差异表达miRNA筛选、转录因子预测、靶基因预测 ①筛选:从GEO数据库检索Child asth‑ma、miRNA等关键词,限制研究类型为长链非编码RNA,物种为Homo sapiens,下载哮喘儿童芯片数据集GSE25230,其中包含14例支气管上皮组织样本,选取其中7例哮喘患儿的支气管上皮组织作为此次研究的哮喘样本组,7例正常支气管上皮组织作为对照组,同时利用GEO2R对数据集GSE64913进行差异表达分析,限制条件为P<0.05及logFC>0.5。②转录因子预测:FunRich是一个可以对通路、生物过程、分子功能及蛋白互作进行分析的独立软件工具,因此我们将差异表达miRNA导入FunRich,并利用FunRich对数据进行分别对上下调差异miRNA进行转录因子的预测,进而获得上下调差异miRNA中前10个较为重要的预测转录因子。③靶基因预测:miRNet(https://www.mirnet.ca/)是一个以miRNA为中心的可视化网络平台,是一个集合了多个数据库来预测miRNA—靶基因互作的在线工具,因此我们选取logFC排名前20的差异表达miRNA,并通过miRNet在线数据库预测其下游靶基因,为筛选目标基因作准备。
1.2 差异表达mRNA筛选、京都基因与基因组百科全书(KEGG)通路、基因本体(GO)功能富集分析 ①筛选:从GEO数据库检索child asthma、mRNA等关键词,物种为Homo sapiens,下载哮喘儿童芯片数据集GSE63142,其中包含128例支气管上皮组织样本,27例健康的支气管上皮组织样本,将128例哮喘患者支气管上皮组织作为此次研究的哮喘样本组,27例正常支气管上皮组织作为对照组。同时利用GEO2R对数据集GSE63142进行差异表达分析,限制条件为P<0.05及logFC>0.5。②KEGG通路、GO功能富集分析:利用R软件中“Bioconductor”包对哮喘差异表达基因进行GO功能、KEGG通路富集分析,筛选条件为P<0.05(表明差异具有显著意义),GO、KEGG能更好的揭示差异表达基因参与的生物学功能及信号通路等途径,有助于明确哮喘的潜在发病机制。
1.3 关键miRNA、mRNA筛选 从GEO数据库中获取哮喘儿童上调差异表达mRNA与下调差异表达mRNA,利用VEEN图把上调的差异表达mRNA和下调的差异表达miRNA预测的靶基因取交集;下调的差异表达mRNA和上调的差异表达miRNA预测的靶基因取交集。根据miRNA预测的下游靶基因与差异表达mRNA的交集结果,反向筛选出目标基因上游的miRNA,构建哮喘儿童发病的潜在miRNA-mRNA网络,并进一步筛选出关键miRNA、mRNA。
2.1 差异表达miRNA筛选、转录因子预测、靶基因预测结果 ①筛选结果:利用GEO2R对数据集GSE25230进行差异分析,共获得69个差异表
达miRNA,其中34个表达上调(logFC值排名前10位的分别是hsa-miR-335-5p、hsa-miR-181a-5p、hsa-miR-129-5p、hsa-miR-576-3p、hsa-miR-487b-3p、hsa-miR-181c-5p、hsa-miR-374a-5p、hsa-miR-132-3p、hsa-miR-30b-5p、hsa-miR-454-3p),35个表达下调(logFC值排名前10位的分别是hsa-miR-210-3p、hsa-miR-498-3p、hsa-miR-92b-3p、hsa-miR-1268a、hsa-miR-602、hsa-miR-423-5p、hsa-miR-193b-3p、hsa-miR-877-5p、hsa-miR-1225-5p、hsa-miR-885-3p)。②转录因子预测结果:分别对上下调miRNA进行转录因子预测,34个上调差异表达miRNA中基因百分比排名前10的转录因子分别是EGR1、RREB1、SP1、CACD、FOXD3、SP4、TFAP4、ESR2、HENMT1、NHLH1,35个下调差异表达miRNA中基因百分比排名前10的转录因子分别是EGR1、RREB1、FOXD3、HNF4A、EBF1、YY1、MYF5、NR1H3、ZEB1、ETS1。其中EGR1、SP1较为重要。③靶基因预测结果:通过miRNet数据库对logFC绝对值属于前20的差异表达miRNA进行下游靶基因预测,其中包括15个上调的miRNA,分别是hsa-let-7f-5p、hsa-mir-30a-
5p、hsa-mir-129-5p、hsa-mir-30c-5p、hsa-mir-181a-5p、hsa-mir-181c-5p、hsa-mir-30b-5p、hsa-mir-132-3p、hsa-mir-374a-5p、hsa-mir-335-5p、hsa-mir-411-5p、hsa-mir-454-3p、hsa-mir-576-3p、hsa-mir-487b-5p、hsa-mir-886-3p;5个下调差异表达miRNA,分别是hsa-mir-193b-3p、hsa-mir-423-5p、hsa-mir-885-3p、hsa-mir-877-5p、hsa-mir-1225-5p。经去重后,在数据库中分别有5378和1436个独立靶基因,分别建立哮喘儿童上调差异表达miRNA-靶基因网络和下调差异表达miRNA-靶基因网络并列出各个差异miRNA靶基因计数。
2.2 差异表达mRNA筛选、KEGG、GO富集分析结果 ①利用GEO2R对数据集GSE63142进行差异分析,得到68个上调差异表达mRNA(根据logFC值排名 前10位的分别是CLCA1、PRR4、CEACAM5、CPA3、TPSAB1、NOS2、CST1、TCN1、POSTN、TFF1)及48个下调差异表达mRNA(根据logFC值排名前10位的分别是LOC100132287、C7orf26、LYPD2、LTF、GPR156、TMEM45A、C20orf46、C3、CSH1、SCGB3A1)。②KEGG富集结果显示,差异表达mRNA在白介素17信号通路、神经活性配体—受体相互作用、趋化因子信号通路、肾素—血管紧张素系统富集显著,GO富集结果显示,差异表达mRNA GO功能主要富集在细胞外基质、丝裂原激活蛋白激酶、细胞外间隙以及胞外区等生物学过程中。
2.3 关键miRNA、mRNA筛选结果 从GEO数据库获取哮喘差异表达基因,确定上调与下调的差异表达基因,利用VEEN图把上调的差异表达基因与下调的差异表达miRNA预测的靶基因作交集,把下调的差异表达基因与上调的差异表达miRNA预测的靶基因取交集。获得差异表达上调的miRNA靶向目标基因有NFAIP2、DUSP5、TMEM45A、NCOA7等12个,下调的差异表达miRNA靶向目标基因有TFF1、KIT、S100A14。通过筛选后的目标基因确定其对应的miRNA,并进一步构建哮喘儿童发病的潜在miRNA-mRNA网络(详见图1),最后利用“CytoHubba”插件筛选出Degree值排名前3的关键miRNA(hsa-miR-30c-5p、hsa-miR-181a-5p、hsa-miR-335-5p)和 关 键mRNA(CXCL2、KIT、MUC5B)。
图1 儿童哮喘潜在miRNA-mRNA调控网络关系
哮喘为儿童最常见的慢性呼吸道疾病,其发病率、病死率呈逐年上升趋势,对世界带来严重的健康和经济负担,严重影响患者的生活质量[7-8]。哮喘病因尚不明确,认为与免疫、神经、精神、内分泌因素、遗传学背景及信号通路密切相关[9],因此对临床治疗造成严重困难,寻找其潜在发病分子机制具有重要意义。哮喘的发生发展过程中,miRNA通过调控mRNA从而影响基因表达起到了重要的作用,当这种调控机制发生紊乱时,更容易造成哮喘的发生,但其具体机制尚不明确。因此我们利用生物信息学技术,构建了哮喘儿童miRNA-mRNA潜在调控网络,并筛选出关键miRNA、mRNA;同时预测出差异表达miRNA的潜在转录因子;筛选出差异表达mRNA并对其进行KEGG和GO富集分析。
通过对miRNA芯片GSE25230数据集进行分析,最终我们得到34个上调差异表达miRNA以及35个下调差异表达miRNA;并进一步预测了差异表达miRNA的转录因子、下游靶基因。利用GEO2R对数据集GSE63142进行差异分析,得到68个上调差异表达mRNA及48个下调差异表达mRNA。根据miRNA预测的下游靶基因与差异表达mRNA的交集结果,反向筛选出目标基因上游的miRNA,进一步构建哮喘儿童发病的潜在miRNA-mRNA网络,最终根据Degree值筛选出前3位关键mRNA(CX‑CL2、KIT、MUC5B)及3个关键miRNA(hsa-miR-30c-5p、hsa-miR-181a-5p、hsa-miR-335-5p);趋化性细胞因子2(CXCL2)属于趋化因子家族成员之一,研究表明,CXCL2可以通过NF-kB信号通路途径将中性粒细胞募集到炎症部位,进而加重气道炎症反应[10];研究[11]证实,通过抑制CXCL2的表达,可以有效抑制哮喘气道炎症反应。三叶因子1(TFF1)属于TFF基因家族成员之一,TFF1的过度表达能够导致支气管上皮细胞的炎症反应以及呼吸道分泌物的产生,从而导致气道慢性炎症的发生[12]。粘液的堵塞是致命性哮喘死亡的主要原因,粘蛋白5B(MUC5B)属于粘蛋白家族成员之一,研究表明,MUC5B的过度表达会导致气道粘液的聚集,进而引发气道的阻塞[13]。在哮喘儿童中,这些差异表达mRNA均受到差异表达miRNA的调控,其中以hsa-miR-30c-5p、hsa-miR-181a-5p、hsa-miR-335-5p较为重要,但是对于哮喘与上述差异表达miRNA的相关研究几乎未见报道,这为我们以后的研究提供了新的分子靶标;转录因子可以调控miRNA的表达,同时miRNA对转录因子也起到调控作用,二者共同作用于mRNA,调控其转录与翻译。因此,我们通过FunRich软件预测哮喘儿童差异表达miRNA的转录因子。经分析发现EGR1、SP1在调控哮喘儿童过程中比较重要;早期生长反应蛋白1(EGR1)是具有锌结构的转录因子,其介导的细胞凋亡是转化生长因子β1(TGF-β1)诱导气道纤维化及重塑的先决条件[14];在EGR1缺乏时,导致TGF-β1诱导的哮喘小鼠气道反应性升高、气道平滑肌细胞的增生及肺部的纤维化。特异性蛋白1(SP1)是一种锌指蛋白,与真核细胞转录机制密切相关,SP1通过调控含有GC或GACCC启动因子的表达在细胞生长、分化及凋亡过程发挥重要作用[15];研究证明,TGF-β1/AKT1/SP1/WNT-5A信号转导途径在哮喘气道重塑中发挥了重要作用[16]。以上结果表明,差异表达mRNA(CX‑CL2、KIT、MUC5B)、差异表达miRNA(hsa-miR-30c-5p、hsa-miR-181a-5p、hsa-miR-335-5p)和转录因子(EGR1、SP1)在哮喘儿童的发病机制中可能起重要作用,有望成为治疗哮喘儿童的新方向。
传统的逐个分析基因的方法不足以满足生物学研究在探究真实生物学方面的增长和需求;然而伴随基因组测序、微阵列芯片等新技术而产生的海量数据,使得数据的分析和整合变得非常重要[17]。生物信息学是一门基于统计学、计算机科学和数学来进行分析转录组、蛋白组及代谢组等的理论工具,是生物研究的最新领域之一,被广泛地用来处理和分析生物数据;GEO数据库为现今最全面的基因表达数据库,其中包含大量正常与患病个体的组织和细胞系基因表达谱芯片数据。因此我们通过生物信息学方法,挖掘GEO数据库中有关哮喘儿童的芯片数据集GSE63142,筛选出68个上调差异表达mRNA及48个下调差异表达mRNA,并对差异表达mRNA进行了GO和KEGG富集分析,KEGG富集结果显示差异表达mRNA在白介素17(IL-17)信号通路、趋化因子信号通路等途径密切相关,GO富集结果显示差异表达mRNA在细胞外基质途径、丝裂原激活蛋白激酶途径富集显著。IL-17是T辅助细胞17(Th17)细胞产生的标志性细胞因子,在抵抗微物入侵的宿主防御反应以及自身免疫性疾病和过敏综合症的发病机理中起着关键作用;IL-17激活包括NF-kB、MAPK和C/EBPs在内的多个下游信号转导途径,从而诱导抗菌肽、促炎性趋化因子、细胞因子和基质金属蛋白酶的基因表达[18]。研究[19]表明,阻断白介素17信号通路能够有效减轻哮喘气道炎症。趋化因子信号通路是由趋化因子及其相应的受体结合形成的信号转导途径,趋化因子主要由CXC、CC及CX3C家族构成,其相应的受体则称之为CXCR、CCR等,细胞趋化因子是气道高反应性、免疫细胞浸润及炎症反应的重要调剂[20];CCL2属于CC趋化细胞因子,研究表明,抑制趋化因子CCL2能够有效减轻哮喘气道炎症反应及气道高反应性[21]。丝裂原激活蛋白激酶是一组在真核生物中高度保守的丝氨酸/苏氨酸蛋白激酶,主要包括细胞外信号调节蛋白激酶、c-Jun氨基末端激酶、p38丝裂原激活蛋白激酶三大类,其功能主要是将上游信号传递至下游效应因子,以调节细胞增殖、分化、及凋亡[22];研究[23]表明,p38丝裂原激活蛋白激酶的激活,能够上调多种促炎细胞因子和趋化因子的表达及某些纤维化因子的产生,p38丝裂原激活蛋白激酶能够通过诱导支气管气道的炎症和重塑,进而促进气流受限的发展。细胞外基质是水合大分子蛋白质和糖的复杂网络,与结合的可溶性因子协同作用,构成组织的无细胞基质微环境,细胞外基质不仅为细胞提供结构信息,而且在发育中起指导作用,对于维持组织稳态起着至关重要的作用[24];胶原蛋白是最丰富的气道细胞外基质成分,是决定气道机械性能的主要因素,气道胶原蛋白异常沉积与气道疾病的发病机理和进展密切相关[25];研究表明,细胞外胶原蛋白的异常沉积会导致哮喘气道重塑的发生发展及患者症状的加剧[26]。以上研究表明,白介素17信号通路、趋化因子信号通路、细胞外基质以及丝裂原激活蛋白激酶途径均可能是哮喘儿童潜在作用机制。
总之,筛选出3个与哮喘儿童密切相关的关键mRNA(CXCL2、KIT、MUC5B)和3个关键miRNA(hsa-miR-30c-5p、hsa-miR-181a-5p、hsa-miR-335-5p),并得出较为重要的2个转录因子(EGR1、SP1)和4条相关生物学途径(IL-17信号通路、趋化因子信号通路、细胞外基质、丝裂原激活蛋白激酶)。本研究对哮喘儿童的诊断、发病的分子机制及后续新药的开发有重要指导意义,但是也存在一些局限性,比如选取数据集的样本量还不够,研究仅基于数据库的预测,后续仍需要在体内和体外进行实验验证来进一步验证我们的分析结果。