基于生物信息学分析人狼疮肾炎血中相关差异基因

2021-06-30 16:43崔道林陈春丽
大理大学学报 2021年6期
关键词:差异基因浆细胞抗原

崔道林,陈春丽

(曲靖医学高等专科学校基础医学部,云南曲靖 655000)

系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种因免疫系统对自身抗原免疫耐受减弱或消失而导致的自身免疫性疾病。临床多发生以免疫细胞和细胞因子浸润、肾小球和肾小管间质损失为特征的狼疮肾炎(lupus nephritis,LN)。据统计,多达60%的SLE并发症为LN〔1〕,约有10%的LN会发展为终末期肾衰竭〔2〕,最终患者需要通过透析或器官移植来维持生命。因此,LN是导致残疾和死亡的重要原因。

LN在缺乏最佳治疗的情况下,Ⅳ型2年死亡率高于90%,Ⅲ型4年死亡率接近50%,而Ⅱ型的预后要好得多,4年死亡率约为10%〔3〕。因此,早期的诊断和治疗会大幅度提高LN患者的生存率。传统的LN检查指标,如血肌酐、蛋白尿、血尿、抗-dsDNA、抗-Sm等,仍然是LN的重要生物标志物。肾活检是评估LN的金标准,但它是一项侵入性手术,即使经验丰富的专家,对肾脏进行经皮穿刺活检也会有一定风险。目前,理想的能识别出患病风险并应用于临床的LN生物标志物尚未见报道,因此探寻LN生物标志物具有十分重要的意义。

LN当前的治疗方法主要是非特异性减少炎症的高剂量类固醇激素与减少自身抗体产生的细胞毒性药物的组合,非特异性免疫抑制方案仍然是LN治疗的核心。然而,该治疗方法具有明显的副作用,缓解率不足。

血液中含有与LN相关的巨噬细胞、B淋巴细胞、T淋巴细胞、浆细胞和中性粒细胞等免疫细胞。由于LN患者的血液容易采集,核酸检查成本低且结果精准,使其成为LN生物标志物的理想来源。本研究基于GEO芯片数据,采用生物信息学方法筛选LN血液中的差异基因。通过GO功能富集分析和KEGG信号通路分析,获取差异基因的主要功能和参与的关键免疫途径。通过STRING数据库(https:∕∕string-db.org∕)构建蛋白质互作(PPI)网络,筛选关键基因,旨在探寻LN在血液中的生物标志物和生物制剂的特异性靶点。

1 材料和方法

1.1 数据来源 通过GEO(https:∕∕www.ncbi.nlm.nih.gov∕gds∕)数据库下载基因芯片GSE72747,输入类型“Series”,种属为“Homo sapiens”,研究类型为“Expression profiling by array”,数据注释平台为GPL570。免疫治疗前,LN患者血样10例(GS M 1 8 6 9 3 9 6,G S M 1 8 6 9 3 9 9,GS M 1 8 6 9 4 0 2,GS M 1 8 6 9 4 0 5,G S M 1 8 6 9 4 0 8,GS M 1 8 6 9 4 1 1,GS M 1 8 6 9 4 1 4,GSM1 8 69 4 1 7,GSM1 8 69 4 2 0,GSM1 8 69 4 2 3),免疫治疗3个月后LN患者血样10例(GSM1869397,GSM1 8 6 9 4 0 0,GSM 1 8 6 9 4 0 3,GS M 1 8 6 9 4 0 6,GS M 1 8 6 9 4 0 9,GSM1 8 6 9 4 1 2,GS M 1 8 6 9 4 1 5,GS M 1 8 6 9 4 1 8,GSM1 8 6 9 4 2 1,GSM1869424),免疫治疗6个月后LN患者血样10例(GSM1869398,GSM1869401,GSM1 8 6 9 4 0 4,G S M 1 8 6 9 4 0 7,G S M 1 8 6 9 4 1 0,GS M1 8 6 9 4 1 3,GSM1 8 6 9 4 1 6,GSM1 8 6 9 4 1 9,GSM1 8 6 9 4 2 2,GSM1 8 6 9 4 2 5)。

1.2 差异表达基因的提取和分析 从GEO数据库下载GSE72747芯片的Series Matrix File(s)和数据注释平台GPL570的文件,运用“probeconvertsymbol.pl”脚本将探针信息转变成基因名称,利用R软件引用“sva”和“limma”包对数据进行批次矫正,接着引用“limma”包获取差异表达基因、上调基因和下调基因并分别保存在3个Excel文件中。差异表达基因的筛选标准为|logFC|>1且adjustP<0.05。

1.3 差异表达基因的富集分析 运用R软件引用“clusterProfiler”和“pathview”包对差异基因进行GO功能富集分析和KEGG信号通路分析。从已经筛选到的上调基因和下调基因中,找出差异基因在LN中的功能和最有可能参与的信号通路。

1.4 差异表达的PPI构建 STRING数据库是一个在线搜索已知蛋白质以及预测PPI的数据库,包括蛋白质之间直接物理相互作用以及间接功能的相关性。关键参数设置:“Multiple proteins”“Homo sapiens”“medium confidence(0.400)”“hide disconnected nodes in the network”。利用STRING数据库获得的文件“string_interactions.tsv”,运用R 3.6.1软件分析前30个关键基因出现的频率,并将其进行可视化。

2 结果

2.1 差异表达基因的提取及可视化 GSE72747芯片数据处理后,共筛选到59个差异表达基因,20个为上调基因(占33.9%),39个为下调基因(占66.1%)。见表1。

表1 狼疮肾炎未治疗组与狼疮肾炎治疗组差异基因

2.2 GO功能富集分析和KEGG信号通路分析 通过R 3.6.1软件对筛选到的59个差异表达基因进行GO功能富集分析和KEGG信号通路分析。GO功能富集分析结果显示:差异基因主要富集在抗原结合、Fcγ受体(FcγR)结合、跨膜受体蛋白、蛋白结合等方面。见表2。KEGG信号通路分析结果显示:腺苷酸活化的蛋白激酶(AMP-activated protein kinase,AMPK)信号通路和mTOR信号通路与LN的免疫治疗相关。见表3。

表2 差异表达基因GO功能富集分析

表3 差异表达基因KEGG信号通路分析

2.3 PPI构建 通过STRING数据库获得差异基因的PPI网络,一共有30个节点,54个互作关系。见图1。出现频率最高的5个差异基因:(enhancer of zeste 2 polycomb repressive complex 2 subunit,EZ H2)8次,(immunoglobulin lambda like polypeptide 5,IGLL 5)7次,(membrane spanning 4-domains A1,M S 4A1)7次,(paired box 5,PAX5)7次,(CD38 molecule,C D38)6次。见图2。

图2 关键基因出现的频率

3 讨论

本研究首先筛选出LN免疫治疗前后血液中59个差异表达基因。GO功能富集分析结果显示差异基因的主要功能为FcγR结合和抗原结合,提示这些基因参与了LN的发病机制〔4-8〕。肾脏中免疫复合物的沉积被认为是导致LN炎症的原因,沉积的免疫复合物激活FcγR,从而促进树突状细胞和巨噬细胞的激活〔4〕。FcγR还可以激活体内Toll样受体(TLR),包括TLR7和TLR9,从而增加炎症反应〔5〕。多项研究表明FcγR基因与SLE易感性相关,并与LN相关〔6〕。当抗原暴露在免疫系统时,抗原提呈细胞(APC)对抗原进行加工,形成抗原肽-MHC分子复合物。常见的先天免疫系统的专业APC为树突状细胞和巨噬细胞,已成为LN发病机制中的关键细胞群〔7〕。T淋巴细胞的活化依赖于抗原肽-MHC分子复合物,效应CD8+T淋巴细胞对靶细胞产生细胞毒性,效应CD4+T淋巴细胞可辅助B淋巴细胞活化为浆细胞。浆细胞产生的抗原可以与抗原发生特异性结合形成免疫复合物,激活补体系统,产生过敏毒素(C3a、C4a、C5a)、调理素(C3b、C4b、iC3b)、攻膜复合体(MAC)等物质,其中C5a还是中性粒细胞的趋化因子,浸润的炎性细胞通过肾小球和间质血管进入肾脏,并导致组织损伤〔8〕。

KEGG信号通路分析显示,差异基因主要在AMPK信号通路富集。研究表明,通过阻断AMPK信号通路,不但能显著降低白细胞介素1(IL-1)和高迁移率族蛋白1(HMGB1)的表达量〔9〕,而且可以抑制NLRP3炎性小体的活化和抑制caspase-1诱导的凋亡〔10〕。AMPK信号通路促进单核细胞分化为巨噬细胞〔11〕。

根 据PPI网 络 筛 选 出EZH2,IGLL5,MS4A1,PAX5,CD38等基因。EZH2属于多梳家族蛋白(PcG)家族,参与DNA的甲基化,通过基因沉默来控制表观遗传〔12〕,到目前为止,没有文献表明EZH2与LN直接相关,EZH2可能通过甲基化调控与LN的相关基因。多发性骨髓瘤(MM)是一种恶性浆细胞肿瘤,研究表明IGLL5可能是MM的生物标志物〔13〕。MS4A1也称为CD20,是正常B淋巴细胞和各种类型B细胞淋巴瘤细胞的重要标志物。研究发现MS4A1是转化生长因子-β(TGF-β)的靶点,TGF-β通过降低MS4A1∕CD20的表达来诱导B细胞淋巴瘤Ramos细胞凋亡〔14〕。PAX5是一种在造血系统中表达的转录因子,在B淋巴细胞的发育、成熟和分化过程中发挥重要作用〔15〕,因此,抑制PAX5的表达可以影响B淋巴细胞的发育、成熟和分化。CD38是一种Ⅱ型糖蛋白,参与细胞黏附和信号转导,浆细胞是表达CD38最多的细胞,其次是NK细胞(自然杀伤细胞)以及B淋巴细胞和T淋巴细胞〔16〕,这种表达模式使CD38可能成为LN治疗的理想靶标,旨在消除产生抗体的浆细胞。总之,除EZH2参与表达调节外,IGLL5,MS4A1,PAX5,CD38与浆细胞有着密切关系,在大多数自身免疫性疾病中,浆细胞通常被认为是致病性的,因为它们能够分泌自身抗体〔17〕。

综上所述,通过生物信息学方法筛选出LN免疫治疗前后血液中的5个关键基因:EZH2,IGLL5,MS4A1,PAX5,CD38。这些基因既可作为潜在生物标志物用于LN的早期诊断,也可作为潜在特异性靶点指导LN的药物研发。

猜你喜欢
差异基因浆细胞抗原
中医治疗浆细胞性乳腺炎的研究进展
骨髓涂片联合活组织检查浆细胞数量对浆细胞骨髓瘤的诊断价值
苏州市D抗原阳性无偿献血者C和e抗原阴性率及其筛血策略*
甲状腺髓外浆细胞瘤超声表现1例
血清铁蛋白、IL-6和前列腺特异性抗原联合检测在前列腺癌诊断中的应用
多发性骨髓瘤合并颅内浆细胞瘤的临床及影像学特点分析
负载抗原DC联合CIK对肝癌免疫微环境的影响
关于血型问题的释疑
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析