宋伟华,谢欣辛,秦 琼,范国荣
(1. 上海交通大学附属第一人民医院临床药学科,上海 200080;2. 上海市皮肤病医院药剂科,上海 200443;3. 苏州大学附属第一医院药学部,江苏 苏州 215006)
支气管哮喘(简称哮喘)是一种以气道高反应性为特征的由多种炎症细胞参与的慢性气道炎症性疾病。哮喘具有明显的异质性,根据患者肺部及气道组织中不同类型的炎症细胞,哮喘可分为嗜酸粒细胞型(eosinophilic asthma,EA)、中性粒细胞型(neutrophilic asthma,NA)和混合粒细胞型(mixed granulocytic asthma,MA)[1]。有研究显示[2],NA对激素的治疗反应性差,临床症状比其它类型的哮喘更难控制,但其具体机制尚未完全明确。因此,深入探讨NA的发病机制,寻找新的治疗靶点及干预药物具有重要的临床意义。
随着基因芯片技术与高通量技术的发展,运用生物信息学方法对基因芯片数据进行挖掘可以快速有效地筛选出差异基因,近年来,广泛应用于疾病的致病机制的阐明、药物治疗靶点的筛选[3-5]。本研究从GEO数据库中筛选出NA的相关差异基因,进而对这些基因进行GO功能富集和KEGG信号通路富集分析,并从PPI网络中筛选出关键基因,采用分子对接技术筛选潜在的先导化合物,为进一步阐明NA的发病机制和寻找新的治疗药物提供科学依据。
1.1 差异基因的筛选基因表达数据来自GEO数据库中的GSE137268芯片,利用GEO2R在线分析工具对基因表达谱进行分析,筛选出满足|log(2 Fold Change)|≥1.0且P<0.05的差异表达基因,同时至少一个样品该基因FPKM≥1(去除表达量低的基因)。其中log 2FC正值为上调基因,log 2FC负值为下调基因。
1.2 PPI网络构建与关键基因筛选将获得的差异基因上传至STRING数据库,物种设定为人类,构建PPI网络,下载TSV文件,利用 Cytoscape 软件进行PPI网络可视化,对构建的PPI网络进行分析,将节点中心度值(Degree)排在前10位的基因靶点作为关键靶点。
1.3 差异基因的GO功能与KEGG信号通路富集分析利用DAVID数据库对差异基因进行GO(Gene ontology,GO)基因功能注释分析,包括生物学过程(Biological process,BP)、分子功能(Molecular function,MF)和细胞组分(Cellular component, CC); 并对差异基因进行KEGG(Kyoto encyclopedia of genes and genomes,KEGG) 通路富集分析。选取前10个条目进行分析,以P<0.05作为显著性基因富集筛选标准。
1.4 分子对接技术筛选先导化合物采用ChemSketch软件画出对接化合物的化学结构,将其3D结构能量最小化后保存为MOL格式。将目标基因上传至PDB数据库,将基因的3D结构保存为PDB格式,用iGEMDOCK分子对接软件进行对接,根据对接能量的高低来判断靶蛋白与化合物的结合程度,能量越低,代表二者的结合程度越高。
2.1 NA与健康人群中差异表达基因的筛选从GEO数据库中的GSE137268芯片获得了11个NA和15个健康人的诱导痰基因表达数据,通过GEO2R对两组数据进行分析,筛选出满足|log2FC|≥1.0且P<0.05的差异表达基因,共筛选出147个差异基因,其中上调基因7个,下调基因140个,见Tab 1。
Tab 1 The differential expression genes of NA patients compared with healthy people
2.2 PPI网络分析及关键基因筛选通过STRING数据库构建了差异基因的PPI网络,通过Cytoscape软件将综合得分大于0.4的相互作用的PPI网络可视化。如Fig 1所示,该网络由99节点和326边构成,节点代表基因靶点,边代表相互作用。使用Cytoscape 软件中的“NetworkAnalyzer”插件对该网络进行分析,根据Degree值排序,排名前10的关键基因分别为CXCL8、FPR2、CXCL1、TNFRSF1B、CXCR1、FPR1、CXCR4、CLEC4D、GPR84与CXCR2。
Fig 1 PPI network of differential expression genes
2.3 GO注释与KEEG通路富集分析通过DAVID数据库对147个差异基因进行GO与KEGG通路富集分析,结果见Fig 2与Tab 2。GO富集显示这些基因主要参与炎症反应、趋化作用、免疫反应等生物过程;在细胞组分中主要影响细胞膜、细胞外泌体、膜锚蛋白等;在分子功能中主要影响受体活性、碳水化合物结合与IL-8受体活性等。KEGG通路富集分析显示,差异表达基因与细胞因子-细胞因子受体相互作用、环磷酸腺苷信号通路、NOD样受体、补体与凝血等信号通路有关。
Tab 2 KEGG enrichment analysis of differential expression genes
Fig 2 GO enrichment analysis of differential expression genes
2.4 分子对接结果将SERPINA1、PLAU、C8B、CD55与CXCL8基因与具有抗补体活性的化合物芍药苷元酮、白藜芦醇、雷公藤甲素进行分子对接。分子对接结果如Tab 3所示,结果表明芍药苷元酮与C8B、PLAU、CXCL8结合能力较强,各化合物与补体与凝血通路中的PLAU、C8B靶蛋白结合能力较强,其中芍药苷元酮与雷公藤甲素与C8B的结合能力最强,其分子对接示意图如Fig 3、4所示。
Fig 3 Molecular docking diagram of paeoniflorigenone with C8B
Fig 4 Molecular docking diagram of triptolide with C8B
Tab 3 Results of molecular docking
NA以肺组织中性粒细胞增多为特点,表现出更严重的临床症状,对糖皮质激素治疗反应较差,其具体机制尚未完全明确。为了进一步阐明NA的发病机制,本研究通过生物信息学分析方法对GEO数据库GSE137268芯片中NA患者与健康人群中的诱导痰的表达基因分析,获得了147个差异基因,其中7个为上调基因,140个为下调基因。对这些差异基因进行了PPI网络分析、GO功能注释与KEGG通路富集分析。
PPI网络分析得到了10个核心基因,根据它们的Degree值确定CXCL8基因最为关键。CXCL8作为重要的中性粒细胞趋化因子,趋化与活化中性粒细胞汇集于肺组织,引起肺部炎症和气道高反应。近年的研究表明[6],患者肺泡灌洗液中CXCL8的浓度与中性粒细胞的数量呈正相关,与FVC/FEV1成明显的负关系。本研究通过生物信息学分析方法进一步证明了CXCL8在NA的致病机制中起关键作用。
KEGG富集分析显示,差异基因受多种信号通路的调节,如细胞因子-细胞因子受体相互作用信号通路、环磷酸腺苷信号通路,NF-κB信号通路,这些通路在以往的研究中被证实参与了哮喘的炎症过程[7-9]。此外,我们的研究发现补体与凝血信号通路参与了NA的病理过程。补体系统是机体重要的免疫系统,在免疫防御中发挥了关键作用。补体系统通过经典、旁路和凝集素途径激活后,其活化产物C3a与C5a是重要的趋化因子,募集与活化嗜酸性粒细胞、中性粒细胞等炎症细胞汇集于肺组织[10],释放多种炎症介质如CXCL8、IL-6、IL-1与TNF-α,从而此起气道高反应[11-12]。此外,补体激活产物C5a能直接抑制中性粒细胞凋亡,加重气道炎症反应[13]。这提示补体系统的激活在NA的发病机制中起了重要作用。采用抗补体药物抑制补体系统的激活或许可以达到治疗NA的目的。
为了进一步验证抗补体药物治疗NA的可行性,我们选取了文献报道具有较强补体抑制活性的芍药苷元酮、白藜芦醇与雷公藤甲素3个化合物与补体与凝血通路中的4个基因SERPINA1、PLAU、C8B与CD55以及受多条信号通路调节的CXCL8基因进行分子对接[14-16]。分子对接显示各化合物与上述靶蛋白均具有较好的结合活性,尤以芍药苷元酮与雷公藤甲素与C8B的结合能力最强。C8B是组成攻膜复合物(membrane attack complex,MAC)的重要成分之一。补体系统异常活化产生的MAC可激活巨噬细胞、中性粒细胞、单核细胞释放IL-8、IL-1等细胞因子,参与炎症反应[17]。
雷公藤甲素是传统中药雷公藤的主要活性成分之一,具有抗炎和免疫调节等药理活性。黎雄斌等研究发现雷公藤甲素可以明显缓解中性粒细胞哮喘小鼠气道炎症,但其机制不明确[18]。本研究通过生物信息学分析方法和分子对接技术揭示了雷公藤甲素治疗NA的机制可能与其抑制补体系统的过度激活有关。课题组前期在中药牡丹皮的抗补体活性成分的筛选过程中发现芍药苷元酮具有很好的抗补体活性[14]。本研究发现芍药苷元酮与多个NA相关的靶蛋白具有很好的结合活性,其体内药理作用有待后续研究中进一步验证。
综上所述,本研究基于GEO数据库,运用生物信息学方法分析了NA的差异表达基因,筛选出的关键基因及信号通路与NA的致病机制密切相关,进一步通过分子对接技术发现芍药苷元酮与雷公藤甲素与补体与凝血通路的基因蛋白具有良好的结合活性,可以作为NA的潜在治疗药物。本研究为NA的治疗提供了新的思路与方法。