结核分枝杆菌感染免疫调控关键基因筛选

2023-11-09 01:28孙家官瞿蓉蓉孟伟民崔俊伟王志霞
新乡医学院学报 2023年11期
关键词:结核病肺结核分化

孙家官,瞿蓉蓉,孟伟民,崔俊伟,王志霞,宋 杰

(1.新乡医学院公共卫生学院,河南 新乡 453003;2.青海省第四人民医院重症医学科,青海 西宁 810000;3.新乡医学院第一附属医院结核内科,河南 卫辉 453100)

结核病是由结核分枝杆菌(Mycobacteriumtuberculosis,Mtb)感染引起的慢性传染性疾病,主要表现为肺结核,在致死性传染病中居第2位[1]。早期诊断和及时治疗是结核病防控的主要策略[2]。结核病诊断的主要依据是临床症状和体征、影像学检查、痰细菌学检查、免疫学检查等,其中痰培养和痰涂片镜检是世界卫生组织推荐的诊断方法,但耗时长(2~8周)、阳性率低(14%~47%)[3]。因此,需要对Mtb感染过程的关键基因和重要生物学通路进行研究,筛选结核病诊断与治疗的新靶标,以期提高疾病的诊治效率。本研究通过对肺结核患者进展期和好转期外周血进行转录组测序及生物信息分析,筛选差异表达基因,探讨其功能和生物学通路,并构建蛋白互作(protein-protein interaction,PPI)网络,以鉴定结核病免疫调节的关键基因,为结核病的诊断和治疗提供候选靶标。

1 资料与方法

1.1 一般资料

选择2019年7月至9月青海省第四人民医院收治的肺结核患者为研究对象。病例纳入标准:符合《中华人民共和国卫生行业标准肺结核诊断标准(WS288-2008)》[4],根据临床症状和体征、痰菌培养、抗酸染色以及影像学检查确诊肺结核。排除标准:人类免疫缺陷病毒感染、妊娠、肿瘤、严重肝肾衰竭、自身免疫性疾病及服用免疫抑制药物者。共5例肺结核患者纳入本研究,患者在初诊时表现出典型的肺结核症状,如慢性咳嗽(5/5)、发热(2/5)、胸痛(2/5)和夜间盗汗(1/5)。本研究已获得医院机构审查委员会批准,患者知情同意并签署知情同意书。

1.2 血液样本收集及转录组测序

分别于初诊(进展期)和抗结核治疗6个月后(好转期)[5]用PAXgene全血RNA管采集患者外周血,送至广州基迪奥生物公司进行RNA提取及测序。测序数据按照如下标准进行过滤:(1)去除原始数据中带有测序接头的序列;(2)去除含N碱基比例大于10%的序列;(3)去除全部都是A碱基的序列;(4)去除低质量序列(碱基识别错误率≤1%的碱基数占整条序列50%以上)。以每百万片段中来自某一基因每千碱基长度的片段数目(fragments per kilo base of transcript per million fragments mapped,FPKM)计算基因转录表达水平,以差异倍数(fold change,FC)>2[即|Log2(FC)|>1]和错误发现率(false discovery rate,FDR)<0.05作为差异表达基因筛选标准。

1.3 差异表达基因富集分析

应用基因本体论(Gene Ontology,GO)数据库(https://www.geneontology.org/)对差异表达基因进行GO富集分析;应用京都基因和基因组(Kyoto Encyclopedia of Genes and Genomes,KEGG)数据库(https://www.genome.jp/kegg/)进行通路富集分析,以确定差异表达基因参与的重要生物代谢或信号转导途径。

1.4 PPI网络构建和关键基因筛选

将差异表达基因上传至STRING数据库,以最低交互得分>0.4为显著性阈值获得差异表达基因之间的蛋白互作关系,并用Cytoscape 3.9.1软件绘制PPI网络。使用CytoHubba插件,采用最大团中心性(maximal clique centrality,MCC)算法,筛选排名前10的基因并作为关键基因。使用分子复合物检测(molecular complex detection,MCODE)插件对PPI网络进行蛋白复合物分析,参数设置如下:degree cutoff=2,node score cutoff=0.2,K-Core=2,Depth from Seed=100。

1.5 Mtb感染免疫调控关键基因的诊断效能评价

从GEO数据库中下载数据集GSE83456,选择106个血液样本进行诊断效能的评估,包括45例肺结核患者样本和61例健康对照样本。利用R语言的pROC包绘制受试者操作特征(receiver operating characteristic,ROC)曲线,计算免疫调控关键基因诊断结核病的灵敏度、特异度、曲线下面积(area under curve,AUC)及95%置信区间(confidence interval,CI)。

1.6 免疫浸润分析

通过估计已知RNA转录本的相对子集识别细胞类型(cell-type identification by estimating relative subsets of RNA transcripts,CIBERSORT)进行免疫浸润分析以了解各类免疫细胞的丰度。CIBERSORT算法是基于已知的T细胞、中性粒细胞、静息态和激活态的自然杀伤(natural killer,NK)细胞等22种免疫细胞参考集LM22,通过mRNA表达谱来定量评估样本中免疫细胞亚型的相对比例的分析方法[6-7]。将差异表达基因谱上传至CIBERSORT数据库获得各样本22种免疫细胞的丰度值,通过主成分分析研究免疫细胞的浸润差异。

2 结果

2.1 差异表达基因筛选

根据|Log2(FC)|>1和FDR<0.05的筛选标准进行差异分析,共筛选出187个差异表达基因,其中149个上调,38个下调,结果见图1。

图1 差异表达基因的火山图Fig.1 Volcano plot of differentially expressed genes

2.2 差异表达基因的功能和富集通路分析

GO功能富集分析从生物过程、细胞组分和分子功能3个方面对基因进行注释。生物过程主要富集于白细胞与细胞黏附及调节、细胞因子产生、T细胞激活的调节(图2A);细胞组分主要富集于吞噬囊泡、溶细胞颗粒、T细胞受体复合物、特殊颗粒(次级颗粒)、三级颗粒(白明胶酶颗粒)(图2B);分子功能主要富集于主要组织相容性复合体(major histocompatibility complex,MHC)Ⅰb受体活性、二氧化碳转运复合体活性、MHCⅠ类蛋白复合物结合受体、MHCⅠ类受体活性、铵跨膜转运体活性(图2)。KEGG富集分析显示,差异表达的基因主要涉及NK细胞介导的细胞毒性、辅助性T细胞(helper T cell,Th)1/Th2细胞分化、疟疾、Th17细胞分化、凋亡等信号通路,结果见图3。

A:生物学过程;B:细胞组分;C:分子功能。

图3 差异表达基因KEGG通路富集分析Fig.3 KEGG functional enrichment analysis of differentially expressed genes

2.3 PPI网络分析和关键基因筛选

根据蛋白相互作用分析的数据构建PPI网络, PPI网络包含75个节点(nodes),398条边(edges),平均聚集度(degree)为5.3,PPI富集P<1.0 × 10-16,结果见图4A。MCC得分居前10位的基因分别是穿孔素-1(perforin-1,PRF-1)、白细胞分化抗原2(clusters of differentiation 2,CD2)、白细胞分化抗原247(clusters of differentiation 247,CD247)、杀伤细胞凝集素样受体D1(killer cell lectin like receptor D1,KLRD1)、杀伤细胞凝集素样受体B1(killer cell lectin like receptor B1,KLRB1)、自然杀伤细胞颗粒蛋白7(natural killer cell granule protein 7,NKG7)、颗粒溶素(granulysin,GNLY)、T-box转录因子21(T-box transcription factor 21,TBX21)、白细胞介素2受体亚基β(interleukin 2 receptor subunit beta,IL2RB)、颗粒酶H(granzyme H,GZMH),结果见表1。

利用Cytoscape软件的MCODE插件鉴定出的蛋白复合体包含上调的11个基因,84条边,平均聚集度为7.6。11个上调的基因为杀伤细胞凝集素样受体F1(killer cell lectin like receptor F1,KLRF1)、GNLY、KLRB1、白细胞分化抗原7(clusters of differentiation 7,CD7)、CD247、IL2RB、NKG7、杀伤细胞凝集素样受体K1(killer cell lectin like receptor K1,KLRK1)、KLRD1、TBX21、GZMH。KEGG分析发现,该11个基因主要涉及NK细胞介导的细胞毒作用、Th1/Th2细胞分化、Th17细胞分化(图4B)。

2.4 关键基因诊断效能评估

KLRB1诊断肺结核的AUC为0.855 4(95%CI:0.783 2~0.927 6),敏感度为82.22%,特异度为75.41%;CD2诊断肺结核的AUC为0.835 7(95%CI:0.757 8~0.913 6),敏感度为62.22%,特异度为91.80%;CD247诊断肺结核的AUC为0.865 9(95%CI:0.795 9~0.935 9),敏感度为73.33%,特异度为86.89%。结果见图5。

图5 KLRB1、CD2和CD247的ROC曲线分析结果Fig.5 ROC curve analysis results of KLRB1,CD2 and CD247

2.5 免疫浸润分析

免疫细胞浸润的主成分分析结果显示,结核进展过程中免疫细胞浸润模式存在明显的群体异质性,治疗前的进展期主要由嗜酸性粒细胞、中性粒细胞、巨噬细胞等固有免疫细胞发挥抗结核作用,治疗后的好转期主要是由CD8+和CD4+T细胞、Th细胞等适应性免疫细胞以及激活的NK细胞发挥抗结核作用(图6)。22种免疫细胞浸润丰度分析显示,单核细胞和中性粒细胞在免疫微环境中的丰度最高(图7)。好转期记忆B细胞、嗜酸性粒细胞、M1型巨噬细胞的丰度显著降低,而幼稚B细胞、静息态CD4+记忆T细胞、静息态NK细胞、激活态NK细胞的丰度显著升高(P<0.05)。

图6 免疫细胞浸润模式的主成分分析Fig.6 Principal component analysis of immune cell infiltration patterns

图7 免疫细胞浸润丰度差异分析箱式图Fig.7 Box plot of the abundance difference analysis in immune cell infiltration

3 讨论

结核病是由Mtb感染引起的慢性呼吸道传染性疾病,胞内寄生的特性使其与其他细菌感染不同,可能具有独特的感染与免疫调控机制。本研究的转录组测序结果显示Mtb感染清除后,149个基因表达上调,38个基因表达下调。GO分析结果显示,差异表达基因参与白细胞与细胞黏附的调节、T细胞激活的调节、细胞因子产生等免疫过程,参与吞噬囊泡、溶细胞颗粒、T细胞受体复合物、中性粒细胞颗粒(特殊颗粒和三级颗粒)等细胞组分形成,编码的蛋白主要与MHCⅠ类分子活性以及二氧化碳和铵转运体等分子功能相关。KEEG信号通路主要富集在NK细胞介导的细胞毒作用、Th1/Th2及Th17细胞分化和凋亡信号通路。同时,富集分析结果也提示,中性粒细胞、NK细胞等固有免疫细胞通过形成吞噬囊泡、释放溶细胞颗粒产生细胞毒作用以及Th细胞分化参与抗Mtb感染过程。

本研究通过PPI网络分析,筛选得到结核病免疫调控的10个关键基因,可分为2类:细胞毒性相关基因PRF1、GZMH、GNLY、KLRD1、KLRB1、NKG7、TBX21和T细胞活化信号转导基因CD2、CD247、IL2RB。PRF1、GZMH和GNLY是由细胞毒性T淋巴细胞(cytotoxic T lymphocyte,CTL)和NK细胞分泌的溶细胞颗粒,是CTL和NK细胞清除胞内寄生病原体的效应分子,它们的抗结核保护效应已被确认[8-9]。KLRD1、KLRB1是杀伤细胞凝集素样受体家族成员,是NK细胞表面识别MHCⅠ类分子的调节性受体。NKG7是Th1细胞相关蛋白,抑制Th2转录过程,调节细胞毒性颗粒胞吐作用和炎症反应[10]。TBX21是Th1相关转录基因,编码的转录因子T-bet不仅促进Th1特征性细胞因子干扰素γ(interferon gamma,IFN-γ)的表达,而且也能抑制Th2特征性细胞因子白细胞介素(interleukin,IL)-4的产生,即T-bet在促进Th1细胞分化的同时也阻断或抑制Th2细胞分化。因此,有研究将T-bet作为基于Ag85B DNA疫苗的佐剂[11-12]。有研究报道,在Mtb感染早期,NK细胞和T细胞特异性基因KLRD1、NKG7、TBX21表达的下调与结核病进展有关[13]。而本研究发现,在清除Mtb后,KLRD1、NKG7和TBX21表达上调;这说明,KLRD1、NKG7和TBX21的表达状态影响着结核病的进展。CD247、CD2、IL2RB是T细胞活化信号转导基因,CD247编码的CD3-ζ链参与T细胞活化第一信号的传导,CD2参与介导T细胞旁路激活途径和T细胞与靶细胞之间的黏附,IL2RB编码的IL-2受体β链通过STAT、MAPK、PI3K等途径诱导T细胞增殖、分化[14-16]。本研究通过MCODE模块分析鉴定出结核病的关键蛋白复合体由11个蛋白构成,其中CD247、IL2RB、KLRB1、NKG7、GNLY、GZMH、TBX21同时也是Cytohubba筛选出来的关键基因。KEGG分析发现,该蛋白复合体参与NK细胞介导的细胞毒作用和Th1/Th2及Th17细胞的分化。免疫浸润分析发现,在Mtb感染的进展期,NK细胞、M1型巨噬细胞和中性粒细胞参与的固有免疫发挥着抗结核作用;在好转期,NK细胞参与的固有免疫和CD4+T细胞介导的适应性免疫共同发挥着抗结核作用。

PPI网络分析和免疫浸润分析的结果表明,PRF1、GZMH、GNLY、KLRD1、KLRB1、NKG7、TBX21等细胞毒性相关基因,以及CD2、CD247、IL2RB等T细胞活化信号转导基因的表达随着结核病的进程发生改变,固有免疫和适应性免疫共同参与抗结核感染免疫。研究报道,Mtb感染早期,NK细胞分泌溶细胞颗粒,M1型巨噬细胞形成吞噬囊泡,中性粒细胞分泌含有溶菌酶和吞噬素的特殊颗粒,从而杀伤被感染的细胞;在Mtb感染12~20 d后,Th1细胞的适应性免疫反应成为主要抗结核免疫机制,Th1诱导CTL分化,通过穿孔素/颗粒酶途径杀伤靶细胞[17-18]。Th17细胞也参与保护性免疫反应,Th17细胞分泌IL-17募集中性粒细胞和调节趋化因子诱导炎症反应[19-20]。值得注意的是,NKG7和TBX21在促进初始CD4+T细胞向Th1细胞分化的同时,也会抑制初始CD4+T细胞向Th2细胞分化。这种Th1/Th2细胞分化失衡的现象在结核病发生发展过程中具有重要意义。有研究报道,Th1细胞分泌IL-12、IFN-γ、肿瘤坏死因子-α等,促进细胞免疫,消除感染源;而Th2细胞分泌IL-4、IL-5、IL-10和TGF-β,抑制Th1介导的保护性免疫应答,Th2细胞分化通常被认为是Mtb的一种免疫逃避形式[21-22]。

4 结论

本研究通过对肺结核患者疾病进展过程中的外周血进行转录组测序及生物信息分析,发现细胞毒性相关基因PRF1、KLRD1、KLRB1、NKG7、GNLY、TBX21、GZMH和T细胞活化信号转导基因CD2、CD247、IL2RB是结核病进展过程中免疫调控的关键基因,通过表达免疫调控分子产生一系列的固有免疫和适应性免疫反应,参与机体抵御Mtb的侵袭过程,这有望成为结核诊断和治疗的候选靶标。但本研究主要对小样本量肺结核患者的转录组测序数据进行生物信息学分析,也未将结核病和其他疾病进行对比研究,因此,筛选出的关键基因仅能作为结核病诊断和治疗监测的候选生物标志物,这为后续研究提供靶标,但应用于临床实践尚需大样本量的分子生物学实验以验证其可靠性。

猜你喜欢
结核病肺结核分化
警惕卷土重来的结核病
艾滋病合并结核病的诊断和治疗
两次中美货币政策分化的比较及启示
分化型甲状腺癌切除术后多发骨转移一例
鲁政委:房地产同城市场初现分化
爱情是一场肺结核,热恋则是一场感冒
蒙西医结合治疗肺结核进展
疣状皮肤结核合并继发型肺结核1例
算好结核病防治经济账
IL-17在结核病免疫应答中的作用