胡绍正, 黄雪英, 杜红宇 , 林智权
(1.江门市中心医院儿科,广东 江门 529030; 2.五邑大学智能制造学部,广东 江门 529000)
克罗恩病是一种隐匿发病的慢性非特异性肉芽肿性炎症,主要累及消化道,可影响从口腔到肛门的任何部位,好发于回肠末端、右半结肠,多为节段性、跳跃性、非对称性分布,呈全层炎症表现。其发病原因和机制尚不清楚,目前常见诱因和发病机制包括遗传因素、环境[1]、食物因素、肠道细胞损伤[2]、肠道菌群失调、免疫功能失调等[3],一般认为克罗恩病是多因素相互作用的结果[4]。儿童克罗恩病好发于青少年期,发病年龄高峰为10~20岁,近年来,儿童发病率逐年升高[1,5],且发病年龄呈逐渐下降趋势[5],甚至出现新生儿病例[6]。克罗恩病是一种可以治疗缓解但无法治愈的疾病,疾病具有终身性,病情复杂,尚无可根治的药物。
1.1 数据下载 从GEO(gene expression omnibus)数据库的GSE126124数据集下载儿童克罗恩病的数据,该数据集收录了年龄8~18岁儿童炎症性肠病的病历,样本包含了组织样本和血液样本。共下载了37例儿童克罗恩病患者的病历作为实验组,19例正常儿童作为正常组。
1.2 差异基因分析 从数据库中筛选37例克罗恩病儿童和19例正常儿童肠道组织标本的RNA测序数据,采用R语言的wilcoxTest函数,以获取克罗恩病儿童和正常儿童肠道组织的转录组差异表达基因,参数设置P<0.05,log|FC|>1。
1.3 功能及KEGG通路富集分析 基因本体论(gene ontology,GO)功能富集分析是解释差异基因功能特性的常用方法。GO功能富集分析主要包含以下三个部分:生物过程(biology process,BP)、细胞成分(cellular component,CC)和分子功能(molecular function,MF)。京都基因和基因组数据库(kyoto encyclopedia of genes and genomes,KEGG)用于解释生物的功能和特征。采用R语言的“ggplot”软件包,对P值位于前20位的特征进行可视化。
1.4 蛋白-蛋白网络分析 STRING是一个用来预测差异基因所编码的蛋白质之间相互关联的在线网站[7]。具体步骤如下:①把差异基因输入到STRING网站。②采用Cytoscape软件构建蛋白-蛋白互助网络。③采用Cytoscape软件中的MCODE插件识别关键基因。
1.5 免疫评分分析 由于克罗恩病的发病可能和机体的免疫调节缺陷存在相关性,通过计算样本的免疫评分,以了解克罗恩病的免疫状态。首先,预先准备了内含13种免疫基因的文件;其次,通过R语言的“GSVA包”计算所有实验组和正常组的免疫评分;再次,通过t检验比较2组的免疫评分差异,P<0.05为差异有统计学意义。
2.1 差异基因分析 通过比较实验组和正常组的肠镜组织的转录组基因表达情况,以P<0.05,log|FC|>1作为截值,共筛选出120个差异表达基因,包含了87个上调基因和33个下调基因。差异表达基因通过火山图和热图的形式进行可视化。见图1A,图1B。
注:A.火山图,红点:上调的差异基因;蓝点:下调的差异基因。B.热图,排名前32位差异最显著的基因在实验组和正常组的表达谱。
2.2 功能及KEGG通路富集分析 通过GO功能富集分析发现,位于BP富集前三位的分别是:体液免疫反应(humoral immune response)、白细胞趋化性(leukocyte chemotaxis)、抗真菌体液反应(antimichobial humoral response);CC富集前三位的是:细胞适体部分(apical part of cell)、分泌颗粒膜(secertory granule membrane)、质膜外侧(external side of plasma membrane);MF富集前三位的是:G蛋白偶联受体结合(G protein-coupled receptor binding)、细胞因子受体结合(cytokine receptor binding)、趋化因子受体结合(chemokine receptor binding)。见图2A。
注:A.GO富集分析;B.KEGG通路富集分析。
KEGG通路主要富集于:细胞因子-细胞因子受体相互作用(cytokine-cytokine receptor interaction)、白介素-17信号通路(IL-17 signaling pathway)、NOD样受体信号通路(NOD-like receptor signaling pathway)。见图2B。
2.3 蛋白-蛋白网络分析 通过把120个差异基因输入到STRING网站后,成功构建了包含439个蛋白关联的网络分析。见图3A。进一步通过Cytoscape软件的Cytohubba功能,计算出蛋白网络分析中的最大效应值,获得了27个热点基因,分别是S100A9、FPR1、VNN2、CXCL2、S100A8、AQP9、FCGR3B、FCGR3A、LCN2、CXCL11、MMP1、IL1RN、S100A12、MMP3、CXCR2、CSF3R、CD274、IDO1、GBP2、CXCL10、CXCL5、CXCL1、CCL18、IRF1、IFIT2、STAT1以及GBP5。见图3B。
注:A.关联蛋白全景图像;B.核心蛋白图。
2.4 免疫评分分析 通过计算并比较2组儿童的免疫状态发现,实验组患者的免疫评分在全部13个免疫功能基因中均存在差异(P<0.05),提示克罗恩病的发病机制和免疫状态存在密切相关性。见图4。
注:红色箱式图:实验组;蓝色箱式图:正常组。
克罗恩病临床常表现为腹痛、腹泻、黏液血便、腹部肿块、消化不良等,部分病例可出现发热、贫血、营养不良、生长发育障碍等全身表现和泌尿生殖系统、肌肉骨骼、肺、心脏、眼部、皮肤等肠道外表现[8]。肠狭窄、肠梗阻、瘘管和肛周脓肿是克罗恩病常见的临床并发症。克罗恩病病情比较复杂,早期起病隐匿,容易误诊,病程长,并发症多,致残率高[9]。不同个体的严重程度、 治疗决策、预后差别大。克罗恩病缺少诊断“金标准”,临床需综合分析症状体征、影像、内镜表现及病理检查结果诊断该病,采取排除诊断法,主要排除肠结核、肠道恶性肿瘤和其他慢性肠道感染性疾病[10]。
过去的十余年,在克罗恩病病因的研究及诊治方面已经取得了很大突破,随着我国对该病认识不断深入,其临床研究和基础研究已取得长足进展,这为克罗恩病的诊治提供了良好的基础。本研究基于生物信息学方法,首先通过转录组层面比较克罗恩病儿童和正常儿童的差异基因,其次对差异基因进行功能富集分析及蛋白质的关联分析,再次进行免疫分析,全面展示了克罗恩病可能存在的通路、机制和靶点,为克罗恩病的进一步研究拓宽了思路。
本研究通过KEGG信号通路富集分析发现,最主要的通路是细胞因子-细胞因子受体互助作用通路。细胞因子主要分为白细胞介素、集落刺激因子、干扰素、肿瘤坏死因子、趋化因子和生长因子。该信号通路和炎症及肿瘤关系密切。ISAKOV等[11]通过机器学习,发现细胞因子-细胞因子受体互助作用通路参与了炎症性肠病的发生与发展。LEW等[12]研究发现,炎症性肠病患者采用抗肿瘤坏死因子治疗时,不良反应的严重程度和细胞因子-细胞因子受体互助作用通路存在密切相关性。本研究也证实了儿童克罗恩病的发生、发展与该通路存在密切相关性,为后续分子机制的研究提供了基础。
克罗恩病被认为是一种免疫相关性疾病,由多种原因作用于免疫易感者引起的慢性炎症性肠病,临床上也会考虑使用免疫抑制剂,例如氨甲蝶呤[13]。本研究对克罗恩病的免疫状态进行了较为全面地分析,通过比较13种免疫相关基因在实验组和正常组的表达状态,结果发现,所有关键的免疫相关基因在克罗恩病患儿中均显著升高。COLLINS等[14]尝试采用PD-1抑制剂治疗成人炎症性肠病,获得了初步效果。但LO等[15]研究发现,肿瘤患者采用PD-1抑制剂治疗,可能诱发一系列的肠道免疫性疾病,包括回盲部炎症及结肠炎。儿童克罗恩病是一个复杂的机体免疫紊乱过程,免疫治疗的角色和作用有待进一步探讨。
当然,本研究也具有一定的局限性。首先,纳入的儿童克罗恩病例数较少;其次,只有相应的生物信息学探讨,缺乏进一步的实验验证。由于儿童克罗恩病为罕见病,难以收集大宗样本;虽然本研究只是聚焦生物信息学领域的探讨,但搜索既往文献,尚没有此类型的研究,因而本文具有一定的创新性。
总之,通过生物信息学初步揭开了儿童克罗恩病的潜在热点基因、信号通路及免疫状态,为后续进一步研究提供了基础。