杨 想, 吴 莺
(江苏大学附属医院 消化内科, 江苏 镇江, 212000)
溃疡性结肠炎(UC)是一种发病原因尚不明确的慢性肠道非特异性炎症,属于炎症性肠病(IBD)之一[1], 主流治疗方式为药物治疗。英夫利西单抗(IFX)是一种抗肿瘤坏死因子(TNF)-α单克隆抗体(简称抗TNF-α单抗),可通过阻断组织和血液循环中的TNF-α与TNF-α受体结合,从而使T细胞和巨噬细胞的凋亡被诱导激活以降低炎症水平,已被广泛应用于UC的临床治疗中[2]。但并非所有患者都对这种治疗有反应,治疗后第8~12周即3个疗程IFX治疗后仍未达到黏膜愈合为原发性失应答[3], 目前约有30%患者存在原发性无应答[4]; 此外,第1年约有13%的初始应答者在维持治疗期间疾病复发,即继发性失应答,而且随着时间的推移,失去应答的患者不断增多(40%~60%)[4]。对药物的失应答不仅会延误患者的治疗,还会增加患者的治疗成本和副反应发生风险。治疗成本分析研究[5]提示,抗TNF-α药物失应答是IBD患者治疗成本增加的主要驱动因素。因此,使用预测性生物标记物来协助选择治疗药物可能是必要的[6]。本研究挖掘GEO数据库中IFX治疗UC相关基因芯片进行生物信息学分析,寻找差异表达基因(DEGs)进行富集分析,并筛选出与UC患者对IFX原发性失应答相关的关键基因,现将结果报告如下。
于GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)下载GSE12251、GSE14580、GSE23597数据集的基因芯片。基因芯片中,治疗后第8周对IFX原发性失应答的UC患者肠黏膜组织样本为实验组,治疗后第8周对IFX应答的UC患者的肠黏膜组织样本为对照组。GSE12251包括治疗后第8周对IFX应答的UC患者12例,原发性失应答患者11例; GSE14580包括治疗后第8周对IFX应答的UC患者8例,原发性失应答患者16例; GSE23597包括治疗后第8周对IFX应答的UC患者27例,原发性失应答患者7例。
应用GEO2R在线工具软件对GSE12251、GSE14580、GSE23597数据集样本进行分组并分析DEGs, 以P<0.05、|log2FC|≥1(FC指差异倍数,即fold change)为条件筛选得到上调、下调基因,并进行数据集基因可视化展示。
注释、可视化和综合发现数据库(David, Version 6.8, http://david.ncifcrf.gov)是一个集成了生物数据和分析工具的在线生物信息数据库,为使用者提供的生物信息包括全面的基因和蛋白质功能注释信息。为了分析相关DEGs的功能,本研究利用David在线数据库进行生物学分析,设定P<0.05及错误发现率(FDR)<0.05为差异具有统计学意义。
将筛选得到的DEGs导入String在线数据库(https://string-db.org/), 设定最小互作评分为0.4分,构建蛋白质互相作用(PPI)网络图。采用Cytoscape3.8.0软件对结果进一步进行可视化展示。利用Cytoscape插件MCODE获得有显著相互作用的功能模块,设置参数为MCODE scores>7、Degree cutoff=2、Node score cutoff=0.2、K-score=2、Max. depth=100。利用cytoHubba插件的MCC算法筛选出得分最高的前20个基因作为关键基因。
药物-基因相互作用数据库(DGIdb, http://dgidb.org/)是一个整合了来自组织和展示论文、数据库和网络资源的药物-基因相互作用和基因可药性信息的数据库。DGIdb将30个不同来源的内容标准化,包含药物查询、药物-基因相互作用等更详细的信息。将Hub基因列表上传至DGIdb数据库基因清单窗口框,寻找基因-药物作用关系,得到PubMed id列表、相互作用类型和得分等结果数据,根据所得到的结果数据筛选潜在治疗药物[7]。
应用GEO2R软件对GSE12251、GSE14580、GSE23597数据集进行筛选,根据筛选条件,在火山图中将筛选得到的差异有统计学意义的表达基因用不同颜色展示,并鉴定出DEGs(GSE12251中为454个, GSE14580中为1 173个, GSE23597中为726个),见图1A、图1B、图1C[蓝点、红点分别代表下调、上调且符合筛选条件(P<0.05和|log2FC|>1)的DEGs, 黑点代表不符合筛选条件的DEGs]。3个数据集之间的重叠部分包含143个基因(上调基因10个,下调基因133个),见图1D。
A: GSE12251的DEGs火山图谱(应答与失应答); B: GSE14580的DEGs火山图谱(应答与失应答); C: GSE23597的DEGs火山图谱(应答与失应答); D: 各数据集共表达的VENN图(紫色、红色、绿色的圆分别代表GSE12251、GSE14580、GSE23597数据集,重叠部分代表共表达的DEGs)。图1 各数据集DEGs表达火山图及其共表达的VENN图
为了分析DEGs的生物学分类,应用David软件进行功能和途径富集分析,并利用Metascape在线分析网站对DEGs进行GO分析和KEGG分析。GO分析结果显示: ① 生物过程(BP), DEGs主要富集于炎症反应、信号转导和免疫反应等; ② 细胞组成(CC), DEGs 主要富集于质膜、细胞外区域和细胞外空间等; ③ 分子功能(MF), DEGs富集于细胞因子活性和受体活性。KEGG分析结果提示, DEGs富集于细胞因子-细胞因子受体相互作用、破骨细胞分化、Toll样受体(TLR)信号通路、Jak-STAT信号通路、TNF信号通路、IBD等。见表1、表2。
表1 GO分析结果
表2 KEGG分析结果
构建DEGs的PPI网络(见图2A), 并使用Cytoscape软件获得重要的模块(见图2B、图2C)。应用cytoHubba插件的MCC算法筛选出20个关键基因:CXCL8、CXCL10、IL6、IL1β、TLR2、TLR8、CCL4、CXCR2、TLR1、PTPRC、CSF3、SELL、SELE、PTGS2、FCGR2A、C5AR1、IL1α、TREM1、FPR2、IL6R。关键基因的相互作用模块见图3。
A: 对IFX原发性失应答UC患者的DEGs的PPI网络; B: 积分排名第1的相互作用功能模块; C: 积分排名第2的相互作用功能模块。图2 对IFX原发性失应答的UC患者的DEGs及相互作用功能模块
图3 关键基因的相互作用模块
将PPI网络中筛选出的20个关键基因导入DGIdb数据库寻找相关潜在药物,得分排名前3的药物分别为萨利鲁单抗(sarilumab)、阿伐可泮(avacopan)、托拉利单抗(tomaralimab), 其或许在未来可作为对IFX治疗原发性失应答UC患者的备选药物。
本研究整合了GSE14580、GSE12251、GSE23597这3个微阵列数据集,利用GEO2R在线分析工具筛选出143个共同的DEGs, 并进行GO和KEGG富集分析来寻找DEGs之间的相互作用。GO功能注释表明,对IFX原发性失应答的DEGs是主要存在于质膜的细胞学组分,介导细胞因子活性和受体活性的生物学功能,参与炎症反应、免疫反应、信号转导、细胞对脂多糖的反应等生物学过程,说明基因表达失调在UC患者对IFX是否应答中有着重要作用。
KEGG分析发现,对IFX原发性失应答的UC患者的DEGs与TLR通路、TNF信号通路以及Jak-STAT信号通路等密切相关,相关研究[8]表明这3个通路的基因多态性与抗TNF治疗的应答相关。TLR通路是启动IBD炎症反应的重要通路,也是炎症通路中的一个重要调节器[9-10], 对IFX原发性失应答的UC患者所有TLR对固有细胞因子反应持续降低,且与应答者相比,其在TLR刺激下细胞因子产生的倍数变化更小; 此外,与TLR激活后的应答者相比,原发性失应答者的IL-10水平较低,这可以解释为何这些患者使用IFX治疗无法控制炎症[11]。研究[12]表明,参与TLR通路从而激活核因子κB(NFκB)的基因、调节TNF-α信号传导的基因是预测患者对抗TNF治疗反应的重要因素,这也提示了调节TNF信号和TNF合成的基因是抗TNF治疗效果的重要预测因素。JAK-STAT通路的基因变异与IBD风险增加相关, JAK-STAT通路蛋白负责介导许多IBD相关细胞因子的受体信号,这些细胞因子参与调节肠道通透性,从而进一步引起肠道上皮的损伤[13], 而严重的肠道损伤会导致患者体内的抗TNF-α药物通过溃烂的肠黏膜丢失[14], 这可能解释了JAK-STAT通路为何与IFX治疗原发性失应答密切相关。此外, JAK-STAT抑制剂如托法替尼目前已被用于常规治疗失败和(或)对其他生物制剂失去反应性的UC患者[15]。
本研究应用Cytoscape软件筛选出20个关键基因,其中CXCL8即白细胞介素-8(IL-8), 具有预测UC对IFX的反应性的潜力。IFX原发性失应答的UC患者血清IL-8水平下降相较于IFX应答的UC患者更不明显[16], 且原发性失应答患者的基线IL-8水平较高[17]。另一项针对IFX失应答的CD患者的研究[18]显示,失应答患者单核细胞的CXCL8 mRNA是上调的。白细胞介素-6(IL-6)是一种多效性细胞因子,参与多种生物学过程,包括肿瘤发生、造血、炎症和免疫系统调节[19-20]。研究[21]报道,患有严重IBD的患者或小鼠模型更可能有更高的血清IL-6水平。白细胞介素-1β(IL-1β)作为强效促炎细胞因子,可诱导前列腺素合成、中性粒细胞流入和激活、T细胞激活和细胞因子产生、B细胞激活和抗体产生以及成纤维细胞增殖和胶原蛋白产生[22]。IL-6及IL-1β基因高表达被证明与UC患者对IFX治疗原发性失应答有关,这可能是此类患者潜在的治疗目标[12]; 此外,治疗过程中血清IL-6水平降低可作为UC患者对IFX治疗应答的预测指标[16]。TLR2为TLR家族成员,其通过识别病原相关的分子模式及某些内源性配体,引发信号转导并导致炎症介质的释放,在天然免疫防御中起重要作用并最终激活获得性免疫系统。与对IFX应答的UC患者相比,对IFX失应答的UC患者血液中TLR2表达升高[23]。TLR2中的2个单核苷酸多态性(SNP)位点(rs4696480和rs11938228)与IFX治疗UC患者的反应性相关[12]。目前虽无明确的研究结果证明PTPRC与IFX治疗UC反应的关系,但其表达被认为与类风湿关节炎(RA)的抗TNF-α治疗反应相关[24]。髓系细胞触发受体-1(TREM-1)会加重结肠炎症,而抑制体内TREM-1可通过调节自噬和内质网应激减轻结肠炎[25]。国外已有多项研究[26-28]证明,对IFX原发性或继发性失应答的UC患者,早期TREM1表达会升高。IBD患者的CD14+单核细胞的TREM1高表达时,抗TNF反应必需的Fcγ受体和自噬通路的活性降低[29], 从而影响抗TNF反应。CXCL10、TLR8、CCL4、CXCR2、TLR1、PTPRC、CSF3、SELL、SELE、PTGS2、FCGR2A、C5AR1、IL1α、FPR2、IL6R基因在UC患者IFX原发性失应答中的作用尚不清楚,有待进一步研究。
萨利鲁单抗是一种靶向结合白细胞介素-6受体(IL-6R)的人源化单克隆抗体,抑制该受体介导的炎性信号,在既往接受1种或多种疾病修饰抗风湿药物治疗效果欠佳的中度至重度活动性RA成人患者的治疗中取得了较好的疗效[30]。早期IL-6高水平在UC患者对IFX继发性失应答中起到了提示作用[16], 萨利鲁单抗可阻断IL-6与其受体的结合,中断细胞因子介导的炎症信号,从而抑制炎症进展,而托拉利单抗是一种人源化TLR2 IgG4单克隆抗体,对IL-6也存在持续抑制作用[31], 这2种药物均可通过抑制IL-6的生物作用抑制炎症反应,未来或可成为UC的治疗药物。阿伐可泮是选择性补体C5a受体抑制剂,C5a能够调节IL-6、IL-8等促炎介质的表达[32]。阿伐可泮在抗中性粒细胞胞浆抗体(ANCA)相关血管炎的治疗中取得了进展[33-34], 且补体C5a受体抑制剂可以预防IBD老鼠模型肠道炎症的产生[35]。阿伐可泮可以抑制IL-6、IL-1β、TNF-α的产生,并促进抗炎因子IL-10、TGF-β的生成[36], 而IL-6、IL-1β、TNF-α、IL-10及TGF-β均在IBD的发生发展中发挥重要作用,故阿伐可泮未来或可成为UC的潜在治疗药物。
本研究从GEO数据库获取对IFX治疗失应答UC患者的相关数据集,筛选出143个DEGs, 对DEGs进行GO和KEGG功能分析并进行PPI网络构建,筛选出排名前20位的关键基因。应用DGIdb数据库对关键基因进行分析发现,萨利鲁单抗、阿伐可泮、托拉利单抗是对IFX失应答的UC患者可能的有效治疗药物,为UC的进一步临床研究提供了新的视角。