郭阳,于波
特应性皮炎(atopic dermatitis,AD)是一种慢性、复发性、需长期治疗的炎症性皮肤病,以剧烈瘙痒为主要特征,通常患者会合并过敏性鼻炎、哮喘等其他特应性疾病,患者心理及经济双重负担加重[1-2]。AD的发病机制复杂,目前认为与免疫应答异常、皮肤屏障受损、遗传易感性等相关[1-4],近年来随着对皮肤微生态研究不断深入,研究发现皮肤微生态在AD发病中起到一定作用[5],其中金黄色葡萄球菌(Staphylococcusaureus,SA)作为重要病原在AD的发病过程中发挥重要作用[6]。
生物膜是细菌附着于生物或非生物表面时,与其自身分泌的细胞外基质成分共同形成的细胞群体,它有利于细菌持续定植、逃脱宿主免疫攻击、抵抗药物治疗,并向其他部位播散[7]。既往基于人群的研究显示,AD患者皮肤表面所定植的SA形成了生物膜[8-9],且患者皮肤表面SA形成生物膜能力与AD严重程度及皮肤屏障功能显著相关[8]。此外,SA生物膜扩散及其慢性定植可能是AD病情复发的重要诱因[10]。目前SA生物膜导致AD发病的机制研究较少,仅有少数研究聚焦SA生物膜形成的相关蛋白组分,如SpA蛋白可刺激人角质形成细胞产生TNF-α,并可通过结合TNF受体Ⅰ,激活AP-1和NF-κB信号通路,产生多种促炎因子[11]。但SA生物膜与AD发病关系的机制尚未完全阐明,因此有必要对SA生物膜导致AD发病的关键基因、通路进行探索,并找寻潜在治疗靶点及药物。本研究通过对人类永生化表皮(HaCaT)细胞实验的基因表达谱数据进行分析,筛选SA生物膜对HaCaT细胞基因表达影响的差异表达基因,探索关键基因及通路,进一步对AD患者的基因表达谱数据进行二次探索性分析,并筛选潜在治疗药物。
1.1数据获取 在国家生物技术信息中心的Gene Expression Omnibus(GEO)平台(http://www.ncbi.nlm.nih.gov/geo/)获取基因芯片表达谱数据。本研究拟在HaCaT细胞实验中,比较SA生物膜实验组与对照组的差异表达基因,找寻潜在关键靶点基因,在该平台检索到符合条件的数据集为 GSE32920数据集。实验组中HaCaT细胞被SA生物膜处理,对照组为空白对照组,每组3个复孔。将基于此数据集所找到的关键靶点基因,在人体皮肤组织样本中进行二次探索性分析,所需人体数据集的入选标准为同时包含AD患者、健康对照的皮肤组织样本、且不同数据集之间样本信息一致度好,最终所采用的两个数据集为GSE16161和GSE32924。
1.2差异表达基因的筛选 使用R语言的limma包,采用贝叶斯法进行差异基因的筛选,选择标准如下:以差异倍数(fold change,FC)表示实验组与对照组基因表达的差异倍数,若|log2FC| >1.0 且校正后P<0.05,即差异表达显著上调2倍或显著下调2倍认为是差异表达基因。
1.3GO功能富集分析及KEGG通路富集分析 根据上述所筛选出的差异表达基因,进行GO功能富集分析和KEGG通路富集分析,其中GO分析包括生物过程(biological process,BP)、分子功能(molecular function,MF)、细胞定位(cellular component,CC)三个层面,所采用工具为DAVID平台,以错误发现率(false discovery rate,FDR)校正后P<0.05为阈值筛选后进行可视化展示。
1.4蛋白互作网络构建及hub基因筛选 使用在线分析工具STRING对差异表达基因进行分析,预测差异基因对应蛋白之间的互作关系,获得蛋白互作网络图(protein-protein interaction,PPI),并将分析结果导入Cytoscape软件,使用CytoHubba插件计算Degree值选择Top20的hub基因,另使用MCODE插件对差异基因进行聚类分析。
1.5关键靶点基因筛选及二次探索性分析 在两个二次探索性分析数据集中,按照相同标准进行差异表达基因的筛选,将此三个数据集所选出的差异表达基因取交集,以韦恩图展示。在此基础上,再与上述hub基因取交集,所得即为关键靶点基因,并以箱线图展示其在二次探索性分析数据集中的表达情况。此外,在两个二次探索性分析数据集中,按照相同方法进行GO功能富集分析和KEGG通路富集分析,并进行比较讨论。本研究流程图如图1所示。
图1 研究流程图
1.6治疗药物预测 使用Connectivity Map(CMap)平台进行治疗药物的预测,该平台可基于差异表达基因,与参考数据库进行比对,计算出Score值,该值的取值范围为-100~100,其绝对值越大,表示与参考数据库相似程度越高。本研究以Score值<-95为标准,筛选可用于治疗SA生物膜皮肤感染的潜在药物。
2.1差异表达基因的筛选结果 实验组细胞与对照组细胞相比,依照差异表达基因的筛选标准,共找到754个显著差异表达基因,对其分布绘制火山图(图2a),其中包括上调差异基因404个,下调差异基因350个,其中top60差异表达基因热图见图2b。
Volcano plots of differentially expressed genes; Heatmaps of differentially expressed genes (top 30)
2.2GO功能富集分析结果 上调的差异表达基因功能富集分析结果显示,主要富集于炎症反应、ERK1和ERK2级联的正向调控RNA聚合酶Ⅱ转录因子复合体、转录因子AP-1复合体等(图3a),下调的差异表达基因功能富集分析结果显示,主要富集于蛋白结合等(图3b)。
Bar chart of GO enrichment analysis for up-regulated genes; Bar chart of GO enrichment analysis for down-regulated genes
2.3KEGG通路富集分析结果 上调差异表达基因参与的主要信号通路富集于IL-17信号通路、TNF信号通路、MAPK信号通路、类风湿关节炎等炎症通路(图4a),下调差异表达基因参与的主要信号通路富集于HIV-1感染、人巨细胞病毒感染等(图4b)。
Bubble diagram of KEGG enrichment analysis for up-regulated genes; Bubble diagram of KEGG enrichment analysis for down-regulated genes
2.4蛋白互作网络构建及hub基因筛选情况 使用STRING对差异表达基因进行蛋白互作网络构建,PPI网络图所示,可见差异表达基因之间存在广泛的蛋白互作关系(图5a)。进一步使用Cytoscape软件CytoHubba插件找寻hub基因,计算PPI网络中的各个节点Degree值,依照Degree值排序,获取top20的hub基因,top20 hub基因及其相互作用网络见图5b。此外,使用Cytoscape软件MCODE插件对PPI网络进行差异基因的聚类分析,聚类结果见图5c,可见差异基因聚集为两类。
Protein interaction network diagram for differentially expressed genes; Protein interaction network diagram for hub genes (top 20); Cluster diagram for differentially expressed genes
2.5关键靶点基因筛选及二次探索性分析 按照相同流程对两个基于人体皮肤组织检测的二次探索性分析数据(GSE16161和GSE32924)进行分析,找寻差异表达基因。两个数据集中样本均为皮肤组织活检样本,均为白种人,纳入分析的均为慢性AD急性加重、且4周内未进行治疗的患者以及健康志愿者。数据集GSE16161和GSE32924纳入分析的分别包括9名AD患者+9名健康对照、13名AD患者+9名健康对照。分析发现,GSE16161数据集中共找到2 993个显著差异表达基因,含1 418个上调基因、1 575个下调基因,差异基因火山图、top60差异表达基因热图分别见图6a~6b。GSE32924数据集中共找到1 042个显著差异表达基因,含516个上调基因、526个下调基因,差异基因火山图、top60差异表达基因热图分别见图6c~6d。对三个数据集的差异表达基因取交集,上调及下调差异表达基因的韦恩图分别见图7a~7b。在此基础上,再与上述top 20的hub基因取交集,所得即为关键靶点基因,据此最终确定了3个关键靶点基因,为:MMP-1、CXCL1以及EGR1,均为显著上调的差异表达基因。上述3个关键靶点基因在二次探索性分析数据集中的表达情况见图8,可见在AD患者人体皮肤组织中均显著上调。
Volcano plots of differentially expressed genes in dataset GSE16161; Heatmaps of differentially expressed genes (top 30) in dataset GSE16161; Volcano plots of differentially expressed genes in dataset GSE32924; Heatmaps of differentially expressed genes (top 30) in dataset GSE32924
Note: AD_1 indicated dataset GSE16161, AD_2: dataset GSE32924, SA_biofilm indicated dataset GSE32920, AD indicated atopic dermatitis, SA indicated Staphylococas aureus.
Note:**P<0.01, ***P<0.001, ****P<0.0001, AD indicated atopic dermatitis, NC indicated normal control group.
2.6富集分析二次探索性分析情况 对两个基于人体皮肤组织检测的二次探索性分析数据集(GSE16161和GSE32924)进行GO功能富集分析和KEGG通路富集分析。GO功能富集分析显示,差异表达基因主要富集于有丝分裂姐妹染色单体分离、DNA复制等(图9)。KEGG通路富集分析(图10)显示,细胞实验中差异表达基因所富集的炎症信号通路中,IL-17信号通路和TNF信号通路在两个二次探索性分析数据集中同样显著上调。
GO enrichment analysis in dataset GSE16161; GO enrichment analysis in dataset GSE32924
KEGG enrichment analysis in dataset GSE16161; KEGG enrichment analysis in dataset GSE32924
2.7治疗药物预测结果 将细胞实验中|log2FC|前100位显著上调、显著下调的共计200个差异表达基因上传至CMap平台,进行预测计算,根据筛选标准Score值<-95,共获得14种小分子化合物(表1),此14种小分子化合物可能成为SA生物膜皮肤感染致AD的潜在预防或辅助性治疗药物。
表1 药物预测结果
SA作为导致AD患者皮肤微生态紊乱的关键因子,可通过多种机制参与AD病理生理过程[6]:SA的α毒素和蛋白酶能够溶解角质层并在角质形成细胞穿孔,破坏皮肤屏障;SA产生的肠毒素A(staphylococcal enterotoxin A,SEA)、肠毒素B(staphylococcal enterotoxin B,SEB)和毒性休克综合征毒素-1(toxic shock syndrome toxin-1,TSST-1)等可以作为超抗原直接激活淋巴细胞和巨噬细胞释放炎症因子;SA脂蛋白可促进角质形成细胞合成胸腺基质淋巴生成素(thymic stromal lymphopoietin,TSLP)进而诱发Th2炎症反应;SA可形成生物膜附着于皮肤表面,促进其持续定植、逃脱人体免疫攻击[12]。目前关于SA生物膜与AD发病的探讨,多为人群层面的SA成膜能力与AD疾病及其严重程度、屏障功能等指标的关联性分析[8-9],揭示了AD患者皮肤定植SA形成生物膜以及二者存在一定关联的现象,而相关分子机制尚未完全阐明。本研究基于GEO数据库的GSE32920数据集,采用生物信息学方法分析及筛选SA生物膜对HaCaT细胞基因表达影响的差异表达基因共754个,其中显著上调404个、显著下调350个。进一步进行GO功能富集分析、KEGG通路富集分析发现,差异表达基因主要参与炎症反应等过程,所参与的信号通路主要富集于IL-17信号通路、TNF信号通路等炎症通路。此外,通过进一步的蛋白互作网络构建、hub基因筛选以及在两个人体数据集的二次探索性分析,最终确定了3个潜在关键靶点基因,为:MMP1、CXCL1以及EGR1,上述炎症通路在二次探索性分析中同样显著上调。
本研究发现SA生物膜对HaCaT细胞的基因表达影响涉及共计754个差异表达基因,这些差异基因主要在炎症反应方面发挥重要作用,其中主要富集的通路有:IL-17信号通路、TNF信号通路等。在两个AD患者的数据集中开展的二次探索性分析,结果显示上述炎症通路在二次探索性分析数据集中同样显著上调。IL-17是一种促炎细胞因子,由Th17细胞所产生,既往研究发现AD患者外周血中Th17细胞、IL-17水平显著升高[13],特应性皮炎评分(scoring atopic dermatitis,SCORAD)分值与IL-17水平呈显著正相关[14]。TNF是一种促炎细胞因子,体外实验发现TNF-α可诱导产生AD样表现[15]。上述炎症通路多在AD的慢性皮损病变中发挥重要作用[1],结合本研究的分析结果,SA生物膜可能通过上调炎症相关通路参与AD的慢性病变过程。
本研究通过多步骤分析、筛选,最终找到了SA生物膜参与AD发病过程的3个潜在关键靶点基因:MMP1、CXCL1以及EGR1。MMP1是基质金属蛋白酶家族(MMPs)一员,MMPs可通过调节组织物理屏障、调节炎症因子及在炎症组织调节趋化因子水平等方式参与炎症过程[16]。既往AD相关研究发现,MMP1在AD患者皮肤组织中高表达[17],在AD患者血清中水平亦显著升高[18]。CXCL1属于CXC趋化因子家族,由中性粒细胞、巨噬细胞等分泌,可对中性粒细胞起到趋化作用,在人体炎症反应中具有重要作用。体外研究发现,Th17细胞可上调CXCL1水平[19],其中IL-17A和IL-17F可诱导嗜酸性粒细胞释放CXCL1参与炎症反应[20]。AD相关临床研究发现,在度普利尤单抗治疗后CXCL1水平显著降低[21]。EGR1是早期生长反应蛋白(EGR)家族的一员,是一种炎症相关转录因子,在皮肤炎症反应中同样发挥重要作用,体外实验提示EGR1参与IL-33通过MAPK途径对TSLP表达的调节,从而参与AD的炎症反应过程[22]。此外,破坏EGR1的DNA结合可改善2,4-二硝基氯苯所诱导的皮肤炎症[23]。
基于CMap平台的计算发现14种小分子化合物可能成为SA生物膜皮肤感染致AD的潜在预防或辅助性治疗药物。其中,吴茱萸碱(evodiamine)是一种吲哚喹啉生物碱[24],具有抗菌、抗炎活性。针对SA感染,evodiamine可通过下调NF-κB、MAPKs通路减弱巨细胞病毒再激活后SA诱发的重症肺炎[25];大鼠实验发现evodiamine可通过下调HMGB1/NF-κB/TLR-4通路,减少肺组织中的气道炎症和重构[26]。PKC(蛋白激酶C)是一组磷脂依赖性丝氨酸/苏氨酸蛋白激酶,皮肤角质形成细胞的蛋白激酶C激活可上调TSLP的基因表达[27],因此蛋白激酶C抑制剂在皮肤抗炎治疗中可能发挥一定作用。对于PKC抑制剂用于皮肤病及炎症性感染性疾病领域,现有研究多关注chelerythrine(白屈菜红碱,一种PKC抑制剂),研究发现chelerythrine可抑制小鼠耳部炎症、抑制PGE2产生、降低COX2活性[28],在急性肺损伤小鼠中可抑制TNF-α、IL-6、IL-1β的产生和氧化应激[29]。PARP(聚ADP核糖聚合酶)是一种位于真核细胞中参与DNA修复的核酶,可增强咪喹莫特诱导的银屑病小鼠模型的炎症严重程度[30]。既往研究显示,PARP抑制剂对于创伤性脑损伤具有炎症抑制作用,可减轻创伤性脑损伤小鼠的脑挫伤及水肿程度,抑制NF-κB激活所致钙蛋白酶过度激活和炎症因子的产生[31]。
本研究存在局限性。本研究基于生物信息学方法,在细胞层面所找到的关键靶点基因仅在两个基于人体皮肤组织检测的外部数据集进行二次探索性分析,尚未在AD患者SA感染炎症皮损中进行验证,因此本研究结果有待在后续机制探讨研究中得以证实。
综上所述,本研究通过生物信息学分析方法筛选SA生物膜对HaCaT细胞基因表达影响的差异表达基因、探索关键基因及通路,并在患者的基因表达谱数据进行二次探索性分析,找到3个关键靶点基因:MMP1、CXCL1以及EGR1,为SA生物膜致AD发病的潜在关键基因,并预测出14种小分子化合物可能成为潜在药物,这为后续探索SA生物膜致AD的发病机制及以此为切入点进行药物研发提供了线索。