曹 君,金婕妤,张 胜,乔龙威,梁玉婷(.苏州大学附属第一医院临床检测中心,江苏苏州 5006;.南京医科大学附属苏州市立医院生殖与遗传中心,江苏苏州 5000)
肥大细胞(mast cell,MC)是造血干细胞起源的组织区域免疫细胞,由于胞浆中储存广泛的介质及表面表达多种受体,除参与I 型超敏反应外,其在许多炎症性疾病、组织重塑和抗肿瘤免疫反应中也发挥重要作用[1-2]。目前,针对MC 在其相关疾病的病理生理学的研究主要是通过细胞模型及动物模型来获得。常用的MC 系包括人未成熟MC系(HMC-1)、人MC 系(LAD2)、小鼠MC 系(MC/9,P815)和大鼠嗜碱性粒细胞系(RBL-2H3)等。但这些细胞株有些缺乏成熟肥大细胞的表面特征性分子(FcεRI)或活化能力,有些增殖缓慢,不能完全满足体外实验要求[3-4]。相比之下,原代培养的小鼠骨髓来源的MC(bone marrow-derived mast cells,BMMCs)具备成熟MC 的特性,更适合体外研究MC 的功能。目前,体外培养的MC 都是在添加生长因子的培养基上获得的。白细胞介素-3(interleukin-3,IL-3)是最初研究中发现的支持MC 生长发育的生长因子之一,具有刺激骨髓干细胞向MC 增殖与分化的功能。但随后的研究发现,单独IL-3 培养的BMMC 可表达FcεRI,结合IgE,但形成颗粒很少[5]。干细胞因子(stem cell factor,SCF)又称为CD117/c-Kit 受体的配体,在MC 增殖、趋化、黏附、存活以及活化过程中发挥重要作用[2]。Lantz 和Huff的研究证实[6],SCF和IL-3 联合培养3 天后,小鼠BMMCs 的表面表达FcεRI 并开始形成分泌颗粒。由此可见,单独IL-3 与SCF 和IL-3 联合培养的小鼠BMMCs 是存在差异的。大量的研究表明,MC 活化后释放其预先储存在分泌颗粒中的各种介质,这些介质涉及MC 在不同情况下表现出的不同功能。而这些介质的具体特征又由MC 发育和成熟的微环境所决定[7]。因此,研究IL-3 与IL-3+SCF 分别诱导的小鼠BMMCs 的差异性,将有助于其功能学的研究。近年来,基因测序技术与生物信息学分析结合的研究方法已经广泛应用于各种疾病的研究中,筛选出与疾病鉴定或预后相关的基因,为疾病的治疗提供新的治疗靶点[8-10]。但是,很少有研究应用生物信息学分析来鉴定和分析IL-3 与IL-3+SCF 分别诱导小鼠BMMCs 的差异表达基因。本研究旨在通过基因表达数据库(gene expression omnibus,GEO)分析单独IL-3 诱导的BMMCs 与IL-3+SCF 共同诱导的BMMCs 的差异表达基因,并对其进行富集分析,筛选枢纽基因,为进一步阐明MC 在相关疾病中的发病机制和潜在治疗靶点提供方向。
1.1 数据来源 从Gene Expression Omnibus(GEO,https://www.ncbi.nlm.nih.gov/geo/)数据库下载SCF诱导小鼠骨髓细胞向MC 分化的基因表达数据集GSE35332,该芯片采用GPL1261 平台,包括IL-3诱导BMMCs 和IL-3+SCF 共同诱导BMMCs 的基因表达矩阵,两组各6 个生物学重复。
1.2 GEO 数据标准化及差异表达基因的筛选 采用R 软件(4.0.2 版本)limma 包对数据进行标准化及差异基因筛选,以|logfold change(FC)| > 512,adjustedP< 0.001 为筛选条件,符合此标准的被认为是差异表达的基因(differentially expressed gene,DEGs)。利用R 软件包绘制火山图和聚类分析图。
1.3 差异基因信号通路及生物学功能分析 运用DAVID(Version 6.8,http://david.ncifcrf.gov)在线工具进行基因本体(gene ontology,GO)的功能分析及京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG) 通路富集分析。通过GO 功能分析将DEGs 功能注释分为生物过程(biological process,BP)、细胞组分(cellular component,CC)及分子功能(molecular function,MF);KEGG 通路富集分析对DEGs 信号通路进行总结,以明确DEGs 在小鼠骨髓细胞向MC 诱导分化过程中的作用,为MC 功能研究提供理论依据。相关柱状图采用GraphPad Prism 6.0 进行作图。
1.4 DEGs 对应的蛋白质互作网络及枢纽基因的获取 利用String(http://string-db.org)在线工具以互作评分为0.98 对DEGs 构建蛋白质互相作用(protein-protein interaction,PPI)网络图。采用Cytoscape 3.8.0 软件对PPI 结果进行可视化展示。利用Cytoscape 软件中的MCODE 插件进行功能模块分析,以Degree cutoff = 2,Node score cutoff = 0.2,K-score = 2,Max.depth = 100 为标准筛选出PPI 中的显著模块,运用DAVID 在线工具对模块中重要的基因进行功能富集。
2.1 GEO 数据标准化及DEGs 的筛选 我们采用limma 包对GSE35332 数据集进行标准化,标准化后每个样本的表达水平相似。在IL-3 和IL-3+SCF诱导小鼠骨髓细胞分化为MC 的两组数据中以|logfold change(FC)| > 512,adjustedP< 0.001 为筛选标准共鉴定到1 339 个(723 个上调和616 个下调)DEGs,见图1。
图1 DEG 表达谱火山图
2.2 DEGs 的GO 和Pathway 富集分析 通过DAVID 在线工具对IL-3 和IL-3+SCF 诱导小鼠骨髓细胞分化为MC 的两组数据的DEGs 进行功能富集。见表1。表1 中呈现了前5 个GO 条目,GO-BP 条目中,上调的DEGs 主要富集在脂质代谢过程、质子运输、小G 蛋白介导的信号转导、蛋白质转运和骨化调节介导的信号传导通路。下调的DEGs 主要参与核糖体的生物合成、端粒酶RNA 定位于Cajal小体的正调控、T 细胞分化、氧化应激反应和NIK/NF-κB 信号通路的调节。在GO-CC 条目中,上调的DEGs 主要位于在细胞外的外泌体、质膜及胞浆等,而下调的DEGs 主要富集在胞浆、胞核及内质网等。而GO-MF 则主要富集在蛋白质结合力、核酸结合力及钙粘蛋白结合参与细胞-细胞黏附等。
表1 DEGs 的GO 分析(Top 5)
KEGG 通路富集分析显示,上调的DEGs 富集在代谢途径、轴突引导及细胞周期等,而下调的DEGs 主要富集在溶酶体、细胞周期、Epstein-Barr病毒感染和内质网中,见图2。
图2 DEGs 的KEGG 富集分析
2.3 关键基因筛选 鉴于筛选出的DEGs 较多,我们按PPI 评分> 0.98 构建PPI 网络,见图3A。通过Cytoscape 软件对PPI 网络图进行可视化显示,共得到163 个节点和334 条边,其中红色节点表示上调基因,绿色节点表示下调基因。进一步对DEGs 的PPI 网络进行模块,见图3B 分析,总分排名前6 位的关键基因分别是Psmd8,Psmd6,Psmd14,Psmc4,Psma6 和Psma3。对枢纽基因进行GO-BP 和KEGG 通路富集分析,主要集中在蛋白质水解、MHC I 类分子介导的抗原提呈和加工、泛素依赖性蛋白质分解代谢过程及EB 病毒感染等相关通路。
图3 DEGs 蛋白互作及模块分析
肥大细胞(MC)作为机体免疫防御的第一道屏障,主要分布于皮肤的皮下和黏膜的上皮层沿血管和神经纤维排列,在各种生理和病理过程中发挥重要作用[11]。1879年,MC 首次被EHRLICH P 描述[12],但它们的起源在近一个世纪以来一直存在争议。近年来,研究者们在不断地对MC 起源的认知进行补充和修正。2018年,曹雪涛[13]院士团队和GENTEK[14]团队在Immunity 期刊连发两文,揭示了小鼠皮肤MC 来源于卵黄囊而黏膜MC 来源于骨髓造血干细胞。由此得知,不同部位定居的MC的起源和发育途径也会不同。从造血干细胞到MC的具体分化轨迹是MC 研究领域长期关注的科学问题。目前,对MC 分化轨迹的描述较为全面的依然是其骨髓起源。IL-3 是促进小鼠MC 分化作用最强的因子,在MC 分化早期发挥重要作用。SCF 是维持MC 生存并促进其增殖的重要细胞因子。研究表明,SCF 也能协助IL-3 介导的MC 分化,在MC 成熟晚期较IL-3 发挥更重要的作用[15]。体外实验表明,IL-3 和SCF 联用可促进MC 膜上IgE 高亲和受体FcεRI 的表达和胞内嗜碱颗粒的形成[16]。虽然大部分的研究认为SCF 可以诱导MC 的增殖和分化[17-18],但也有人认为MC 的增殖分化不完全依赖于SCF。在SCF 基因敲除小鼠模型中,给予IL-3就能够逆转因SCF 基因缺失而导致的MC 缺失[12]。这些研究结果提示,单独IL-3 或/和SCF 诱导小鼠骨髓干细胞分化成MC 的功能可能存在差异性。LTO 等[19]研究者发现,IL-3+SCF 诱导的BMMCs因其长期暴露于含有SCF 的微环境中,FcεRI 介导的MC 脱颗粒显著降低,而单独IL-3 诱导的BMMCs 则无此现象。他们通过基因表达芯片发现,Hck 基因在SCF 诱导的BMMCs 中表达下调,表明SCF 已影响了BMMCs 的表型。LTO 等[19]人在研究中仅证实了Hck 基因在SCF 诱导的BMMCs中表达下调,与BMMCs 脱颗粒降低相关,但此现象也有可能是其他基因修饰导致的,因此深入探讨IL-3 和IL-3+SCF 两种模式培养的BMMCs 的差异表达基因,为MC 功能研究提供有力证据。
本研究基于GEO 数据库对SCF 诱导小鼠骨髓细胞向MC 分化的基因表达数据集GSE35332 进行分析,以|logfold change(FC)| > 512,adjustedP< 0.001 为筛选标准,共筛选出1 339 个DEGs(图1A),其中723 个为上调基因,616 个为下调基因,前20 个DEGs 以表达热图显示,见图1B。我们通过R 软件对数据集进行DEGs 分析时发现,当该数据集以|logfold change(FC)| > 2 或4 为筛选标准时,获得的DEGs 过多,且差异倍数相差较大,过多的DEGs 在后续分析相关通路时会产生巨大冗余数据。经多次比较,最终以|logfold change(FC)|> 512,adjustedP< 0.001 为筛选标准。MC 在分化发育过程中,极易受局部微环境的影响,ITO 等[19]人将小鼠造血干细胞在IL-3 和IL-3+SCF 两种微环境作用,势必会诱导出不同基因表达的BMMCs,而MC 的分化发育过程易受多种细胞因子尤其是SCF 的影响[16],这也可解释本研究筛选出的大量差异倍数较大的DEGs。
随后,我们通过DAVID 数据库分析发现这些DEGs 与蛋白质转运、代谢途径、细胞周期及NIK/NF-κB 信号通路的调节等密切相关(表1)。研究表明,NF-κB 家族的转录因子与多种重要生物过程密切相关,他们可激活数百个基因参与细胞凋亡、增殖、先天性和适应性免疫以及炎症反应[20]。有研究表明,IκB 激酶复合物可以通过IgE 的高亲和力受体FcεRI 的交联方式活化MC,进而导致MC脱颗粒[21]。而这些DEGs 参与NF-κB 信号通路提示,在涉及MC 信号通路相关研究时,可采用不同的诱导方式来选择MC 的细胞模型。此外,我们采用Cytoscape 软件共筛选出6 个枢纽基因,分别为Psmd8,Psmd6,Psmd14,Psmc4,Psma6 和Psma3(图3)。本研究筛选出的枢纽基因主要是蛋白酶体亚基(proteasome subunits,PSs)组分。在真核细胞中,蛋白酶体是高度保守的蛋白酶复合物,多以泛素链为标记进行降解[22]。泛素-蛋白酶体系统(ubiquitin-proteasome system,UPS)是主要的细胞内和非溶酶体蛋白质降解系统[23]。由于其以高度特异性的方式消除损坏的及错误折叠的调节蛋白,所以UPS 涉及真核生命的几乎所有方面。UPS 的重要性在免疫细胞中尤为明显,免疫细胞在识别病原体后会经历快速的功能重塑。蛋白质稳态、信号转导、细胞增殖和抗原加工等过程均受UPS 的严格调控[24]。MC 的核心功能是识别危险并适当地启动对已感知危险的免疫反应,这两个方面都直接或间接的受MC 发育期间细胞代谢途径的影响。在MC 发育过程中会发生多种代谢变化,目前的研究大多集中于糖酵解和氧化磷酸化的分解代谢[25]。而本研究筛选出的枢纽基因参与泛素依赖性蛋白质分解代谢过程,提示MC 参与的相关疾病可能与UPS 密切相关,这一发现将为因MC 增殖和发育异常引起的疾病研究提供新思路。
最后,我们通过通路富集分析发现主要集中在蛋白质水解、MHC I 类分子介导的抗原提呈和加工、泛素依赖性蛋白质分解代谢过程及EB 病毒感染等相关通路。众所周知,MC 在慢性过敏/炎症疾病,尤其是支气管收缩性哮喘的病理过程中起重要作用。而该过程主要依赖于MC 中类胰蛋白酶的蛋白水解或降解作用,产生调节支气管张力和气道反应性的重要介质[26]。也有体外研究表明,MC 能诱导抗原特异性CD8+T 细胞活化和增殖。该过程需要MC 直接接触细胞和MHC I 类依赖性抗原交叉呈递,并诱导CD8+T 细胞分泌IL-2,干扰素-γ和巨噬细胞炎性蛋白-1α[27]。病毒感染时,MC 能促进CD8+T细胞被招募到感染部位并产生干扰素,有效清除病毒[28]。但目前MC 在EB 病毒感染中发挥的作用尚不清晰,还需进一步研究。这些研究结果也证实了本研究中生物信息学分析的科学性。
综上所述,本研究基于GEO 数据库通过生物信息学方法,发现IL-3 和IL-3+SCF 两种培养模式下诱导的小鼠BMMCs 基因表达谱存在明显差异,同时发现6 个枢纽基因参与泛素依赖性蛋白分解过程,这一发现将有助于MC 体外培养和功能的深入研究。但本研究同样存在一些局限性。首先,本研究是通过公共数据库中的数据构建的分析模型,缺少体内实验的验证;其次,筛选出的枢纽基因的作用及机制尚需要进一步研究。