蔡鑫 唐芳 马武开 兰维娅 蒋总 樊梅 金泽旭
【摘 要】目的:应用生物信息学方法研究干燥综合征的差异基因,为干燥综合征的治疗提供新靶点。方法:在GEO数据库中下载并筛选干燥综合征相关的差异表达基因,利用STRING在线数据库构建蛋白与蛋白相互作用关系网络,运用Cytoscape软件筛选出关键基因,通过DAVID数据平台对差异基因进行基因本体论(GO)和京都基因与基因组百科全书(KEGG)富集分析。结果:通过分析基因芯片GSE127952后获得406个差异基因,筛选出STAT1、MX1、IFIT1、IFIT3、ISG15等10个关键基因;GO分析显示差异基因主要富集在正向调节细胞因子产生、淋巴细胞分化、T细胞活化等生物学过程;KEGG分析主要涉及细胞因子与细胞因子受体的相互作用、趋化因子信号通路、Toll样受体信号通路、T细胞受体信号通路等。结论:上述所得的关键基因和信号通路可能与干燥综合征的疾病过程相关,为深入研究靶向治疗干燥综合征提供了理论参考。
【关键词】 干燥综合征;差异基因;生物信息学;分子机制
【ABSTRACT】Objective:To study the differential genes of Sj?gren's syndrome by bioinformatics,and to provide a new target for the treatment of Sj?gren's syndrome.Methods:The deferentially expressed genes related to Sj?gren's syndrome were downloaded and screened from the GEO database.The protein-protein interaction network was constructed by STRING online database.The key genes were screened out using the software of Cytoscape.The enrichment analyses of GO and KEGG for differential genes were carried out using DAVID data platform.Results:Four hundred and six deferentially expressed genes were obtained by analyzing gene chip GSE127952,and 10 key genes including STAT1,MX1,IFIT1,IFIT3 and ISG15 were screened out.Go analysis showed that the differential genes were mainly concentrated in biological processes such as positively regulating cytokine production,lymphocyte differentiation and T cell activation.KEGG analysis mainly involved the interaction between cytokines and cytokine receptors,chemotactic factor signaling pathway,Toll-like receptor signaling pathway,T cell receptor signaling pathway,etc.Conclusion:Above key genes and signal pathways may be related to the disease process of Sj?gren's syndrome,which provides a theoretical reference for further research on the targeted treatment of it.
【Keywords】 Sj?gren's syndrome;differential gene;bioinformatics;molecular mechanism
干燥綜合征(Sj?gren's syndrome,SS)是一种慢性自身免疫性疾病,病变累及的靶器官主要包括泪腺、唾液腺等外分泌腺体。SS可根据是否合并其他风湿病分为原发性干燥综合征(primary Sj?gren's syndrome,pSS)与继发性干燥综合征(secondary Sj?gren's syndrome,sSS),SS患者临床表现多样,除了具有典型的症状如口干、眼干等,也可出现多系统损害,如疲乏、肌肉关节疼痛、皮疹反复发作[1]。目前,本病的发病机制尚不明确,亦无特效药物治疗,临床中主要通过对症处理和替代疗法缓解症状、改善病情[2]。生物信息学属于生命科学范畴的一门新兴学科,近年来为理解疾病发生的分子机制和开展基础研究带来了可供选择的思路及可能的理论依据[3]。本研究应用生物信息学方法,对GEO数据库中pSS患者与健康志愿者小唾液腺组织的基因芯片进行分析,筛选获得与疾病相关的差异表达基因,对差异基因进行富集分析,构建蛋白-蛋白相互作用(PPI)关系网络,识别pSS发生、发展的关键基因,为进一步研究其发病机制提供生物信息学理论参考。
1 材料与方法
1.1 材 料 借助NCBI中Gene Expression Omnibus(GEO)数据库收集pSS相关的基因表达谱芯片,获得的芯片编号为GSE127952。该芯片基因数据包括8例pSS患者和6例健康志愿者的小唾液腺组织。
1.2 筛选pSS差异表达基因 在GEO数据库中下载基因芯片编号为GSE127952的原始数据文件和编号为GPL20995-16144的芯片注释文件。借助R软件筛选出差异表达基因并绘制火山图,筛选条件为P < 0.05、|log2FC|≥1.5(其中|log2FC|≥1.5为上调基因,|log2FC| < 1.5为下调基因)。
1.3 PPI分析 将筛选出的差异基因导入STRING在线数据库,构建PPI关系网络(得分 > 0.4分),然后下载TSV格式的PPI数据包,运用Cytoscape软件对中心度值(Degree)≥10的基因进行可视化分析,利用插件CytoHubba分析获得前10个关键差异基因[4]。
1.4 差异表达基因的富集分析 借助DAVID分析平台对差异基因做基因本体论(GO)和京都基因与基因组百科全书(KEGG)通路富集分析,利用R软件对富集结果进行可视化处理。
2 结 果
2.1 差异基因的筛选 利用R软件分析pSS患者和健康人小唾液腺组织基因谱芯片,得到差异表达基因406个,包括上调基因226个和下调基因180个。绘制差异表达基因火山图,见图1。
2.2 构建PPI网络和筛选关键差异基因 利用STRING数据库对406个差异基因构建PPI网络,将Degreee≥10的基因导入Cytoscape软件进行可视化分析,該PPI网络包含99个节点、1101条边,网络中节点大小由Degree值决定,节点间相互连线(边)粗细代表连边紧密度,中心度以冷色至暖色表示,见图2。使用Cytoscape的插件CytoHubba筛选获得关键的差异基因,包括STAT1、MX1、IFIT1、IFIT3、ISG15、GBP1、IFIT2、RSAD2、IFI44L、DDX60,见图3。
2.3 差异基因的GO和KEGG富集分析 为研究差异表达基因在pSS中的作用机制,将上述获得的差异基因导入DAVID数据库进行GO和KEGG富集分析[5]。GO主要涉及对病毒反应、正向调节细胞因子产生、淋巴细胞分化等生物学过程,参与质膜外侧、收缩纤维、肌节等细胞组分(CC),参与趋化因子受体结合、细胞因子受体结合、肌动蛋白结合等分子功能(MF),见图4。KEGG主要富集在细胞因子与细胞因子受体的相互作用、趋化因子信号通路、Toll样受体(TLRs)信号通路等信号通路,见图5。
3 讨 论
SS是一种自身免疫性系统性疾病,而非口干、眼干的单一性疾病。目前,治疗SS的随机对照临床试验研究结果不尽相同,用药尚缺少高级别循证医学证据支撑,临床中更多为经验性用药[6]。因此,从多靶点和多通路的研究角度出发,深入对SS发病机制的探索以发现潜在的治疗新靶点,具有重要意义。本研究应用生物信息学方法,通过对pSS患者和健康人小唾液腺组织的基因芯片进行挖掘,共得到406个差异表达基因,对这些差异基因进行PPI分析并筛选出关键基因,最后进行GO和KEGG富集分析,以期为深入研究SS发病机制提供理论参考。
通过对差异基因PPI网络的分析,获得的关键基因包括STAT1、MX1、IFIT1、IFIT3、ISG15、GBP1、IFIT2、RSAD2、IFI44L、DDX60。STAT1在α/β-干扰素(IFN-α/β)、IFN-γ等细胞因子激活下被磷酸化,进入细胞核促进靶基因转导,参与细胞分化、生长、凋亡,以及调节免疫系统等生物学功能[7]。STAT1活化后可引起活性氧累积,损伤细胞功能和结构,导致肺纤维化、动脉粥样硬化及高血压等[8]。pSS相关的间质性肺病患者血清中活性氧明显增多[9],可能在肺纤维化形成过程中具有重要生物学作用。研究发现,STAT1在pSS患者外周血单核细胞中的表达较正常人明显升高[10]。MX1是基于IFN抗病毒反应的主要介质,受Ⅰ型IFN的调节,MX1基因表达与疾病活动有关,可能作为其潜在的生物标志物,病情活跃的pSS患者具有更高水平的MX1[11]。IFIT1、IFIT2、IFIT3同属于IFN诱导蛋白家族,能够抑制病毒复制,参与调节细胞凋亡和天然免疫通路[12-13]。
ISG15是由IFN刺激基因编码的蛋白,参与抗病毒免疫反应、RNA剪接、修复染色体等多种生理过程,通过调节IFN水平或直接作用于病毒蛋白而发挥抗病毒作用[14]。GBP1主要涉及抗肿瘤和抵抗病原微生物[15],RSAD2可作为类风湿关节炎的预测因子,是一种有着广泛活性的抗病毒基因[16]。本研究筛选出的关键差异基因主要涉及抗病毒感染和调节免疫方面,SS的发病与病毒感染引起自身免疫反应相关[17],这些基因可能有助于进一步理解病毒感染在SS中的作用机制,为本病的治疗提供新思路。
借助DAVID分析平台对上述差异基因进行GO和KEGG富集分析,结果显示,GO主要涉及抗病毒、正向调节细胞因子产生、淋巴细胞分化等生物学过程,参与质膜外侧、收缩纤维、肌节等细胞组分,参与趋化因子受体结合、细胞因子受体结合、肌动蛋白结合等分子功能。以上涉及的生物学过程与病毒感染和免疫系统反应关系密切。当前的研究认为,病毒感染和免疫功能紊乱参与了SS的疾病过程[18-19]。上述生物过程及分子功能与免疫系统功能密切相关,而免疫系统功能的异常导致了RA的发生、发展。KEGG主要富集在细胞因子与细胞因子受体的相互作用、趋化因子信号通路及TLRs信号通路等信号通路。pSS患者的免疫性炎症反应受细胞因子调控,这些细胞因子的异常表达可能影响疾病发生、发展,包括T细胞因子、IFN、白细胞介素(IL)、趋化因子等。IFN-γ能诱导SS患者唾液腺组织中细胞因子IL-6、肿瘤坏死因子-α(TNF-α)异常表达,TNF-α分泌又能刺激唾液腺局部炎症细胞浸润,加重腺体破坏[20-21]。趋化因子与受体相互作用可诱导炎症反应和淋巴样细胞的聚集,使SS的外分泌腺体被淋巴细胞浸润并形成异位生发中心,趋化因子CXCL13、CXCL9等在SS患者唾液腺组织中的表达明显增多[22],CXCL10或许能成为早期诊断SS的生物标志物[23],趋化因子与疾病进展密切相关,进一步探索其生物学特点有助于阐明SS发病机制,使用抗趋化因子的治疗方法可能减少异位生发中心形成和降低淋巴细胞的浸润程度。TLRs可表达在巨噬细胞等免疫细胞和成纤维细胞等非免疫细胞中,能够对抗病原微生物诱发的免疫应答[24]。TLR4、TLR7、TLR9等在pSS患者中的表达明显高于健康人[25]。TLRs可识别细胞在损伤以及修复过程中所释放出的内源性因子,说明其是诱导pSS发生的重要因素。TLRs能够刺激IL-1、IL-6、TNF-α等炎症因子释放,引起过度的炎性反应,进一步加重SS病情。
综上所述,本研究应用生物信息学方法深入挖掘pSS基因表达谱芯片,筛选获得关键差异基因,可能作为其潜在的靶点蛋白;通过对差异基因进行GO和KEGG富集分析得出的结果有助于提高对pSS分子机制的理解,为今后进一步的基础研究提供可能的理论参考和新思路。由于本研究样本量有限,所得结果可能存在偏倚;今后研究应增加样本量,进一步探讨与SS疾病过程相关的差异基因。
参考文献
[1] FISHER BA,JONSSON R,DANIELS T,et al.Standardisation of labial salivary gland histopathology in clinical trials in primary Sj?gren's syndrome[J].Ann Rheum Dis,2017,76(7):1161-1168.
[2] D?RNER T,POSCH MG,LI Y,et al.Treatment of primary Sj?gren's syndrome with ianalumab (VAY736) targeting B cells by BAFF receptor blockade coupled with enhanced,antibody-dependent cellular cytotoxicity[J].Ann Rheum Dis,2019,78(5):641-647.
[3] BIAN Q,CAHAN P.Computational tools for stem cell biology[J].Trends Biotechnol,2016,34(12):993-1009.
[4] DA FONSECA-PEREIRA P,NERI-SILVA R,CAVALCANTI JHF,et al.Data-Mining Bioinformatics:Connecting Adenylate Transport and Metabolic Responses to Stress[J].Trends Plant Sci,2018,23(11):961-974.
[5] CHEN YJ,CHANG WA,WU LY,et al.Systematic analysis of differential expression profile in rheumatoid arthritis chondrocytes using next-generation sequencing and bioinformatics approaches[J].Int J Med Sci,2018,15(11):1129-1142.
[6] CARSONS SE,VIVINO FB,PARKE A,et al.Treatment guidelines for rheumatologic manifestations of Sj?gren's syndrome:use of biologic agents,management of fatigue,and inflammatory musculoskeletal pain[J].Arthritis Care Res,2017,69(4):517-527.
[7] BATHIGE SDNK,UMASUTHAN N,GODAHEWA GI,et al.Molecular insights of two STAT1 variants from rock bream (Oplegnathus fasciatus)and their transcriptional regulation in response to pathogenic stress,interleukin-10,and tissue injury[J].Fish Shellfish Immunol,2017,69(2):128-141.
[8] SHEN L,ZHOU T,WANG J,et al.Daphnetin reduces endotoxin lethality in mice and decreases LPS-induced inflammation in Raw264.7 cells via suppressing JAK/STATs activation and ROS production[J].Inflamma Rese,2017,66(7):579-589.
[9] 白淑榮,沈乐,陈乾,等.原发性干燥综合征相关间质性肺疾病患者血清活性氧、转录因子κB及转化生长因子β1水平变化及其临床意义研究[J].实用心脑肺血管病杂志,2017,25( 11):42-45.
[10] PERTOVAARA M,SILVENNOINEN O,ISOM?KI P.STAT-5 is activated constitutively in T cells,B cells and monocytes from patients with primary Sj?gren's syndrome[J].Clin Exp Immunol,2015,181(1):29-38.
[11] AIR? P,GHIDINI C,ZANOTTI C,et al.Upregulation of myxovirus-resistance protein A:a possible marker of type Ⅰ interferon induction in systemic sclerosis[J].J Rheumatol,2008,35(11):2192-2200.
[12] ZHANG J,SZE DMY,YUNG BYM,et al.Distinct expression of interferon-induced protein with tetratricopeptide repeats (IFIT) 1/2/3 and other antiviral genes between subsets of dendritic cells induced by dengue virus 2 infection[J].Immunology,2016,148(4):363-376.