溃疡性结肠炎相关性结肠癌与偶发性结直肠癌的差异基因分析

2022-07-09 05:44郭跃王少波曾昊庞志刚
中国现代医药杂志 2022年5期
关键词:差异基因中枢溃疡性

郭跃 王少波 曾昊 庞志刚

溃疡性结肠炎(UC)是一种慢性复发性肠道炎症性疾病,其病因及发病机制尚不完全清楚。UC最严重的并发症是溃疡性结肠炎相关性结肠癌。结直肠癌是全球第三大常见癌症,2020年全球共诊断结直肠癌1 931 590例,935 173例死于结直肠癌,死亡率位居第二[1]。据统计溃疡性结肠炎相关性结肠癌发病率虽然只占结直肠癌的1%~2%,但却占UC患者死亡原因的10%~15%[2]。研究显示,UC所致的结肠癌恶性程度更高,预后更差[3]。研究表明,溃疡性结肠炎相关性结肠癌与偶发性结直肠癌的临床特点和发病机制不同[4]。

本研究以生物信息学方法分析基因数据集,探寻两种肿瘤在分子水平的差异,并对得到的差异性表达基因进行功能聚类、京都基因和基因组百科全书(KEGG)途径富集分析及基因本体(GO)功能注释分析。构建蛋白质相互作用网络,选择与癌症发病相关的中枢基因,使用网络数据库对所筛选的中枢基因进行生存分析,探讨两种肿瘤的差异基因及对预后的影响,以期为溃疡性结肠炎相关性结肠癌的个体化临床治疗提供相应指导。

1 材料与方法

1.1 数据预处理 基因表达数据集来自在线Gene Expression Omnibus(GEO)数据库(https://www.NCBI.NLM.NIH.gov/GEO/)。从数据库中共提取100个关于炎症性肠病的系列。检索词:炎症性肠病、结肠癌。通过添加条件选择人类基因,检索结果69条。经过仔细对比,选择数据集GSE39582[5]和GSE37283[6],其中GSE37283为溃疡性结肠炎相关性结肠癌与正常组织的数据集,GSE39582为偶发性结直肠癌与正常组织的数据集。

1.2 差异基因分析 在R 4.0.3软件中使用GEOqury包[7]获得GSE39582和GSE37283数据集的表达矩阵,在NCBI下载GPL570平台的注释文件进行基因注释。根据数据集的临床信息分组分为癌症组和正常组。对两个数据集分别进行limma包[8]数据标准化处理,设置P<0.05和│log2FC│>1,选出两个数据集中与正常组织相比表达上调或下调的基因。韦恩图选出两个数据集不相同的上调和下调基因进行后续分析。

1.3 富集分析 对筛选出的差异基因,采用clusterProfiler包[9]进行GO富集分析[10]及KEGG途径分析[11]。GO富集分析主要描述与差异表达基因相关的生物学过程、细胞成分和分子功能,KEGG途径分析揭示与差异表达基因相关的生物学途径,以P<0.05为界值。

1.4 蛋白质相互作用网络的构建及模块选择 使用STRING在线数据库(http://string-db.org)[12]确定蛋白质相互作用网络。单独的点被去除,置信度得分≥0.4的交互作用被认为显著并被保留。蛋白质相互作用网络信息进一步导入Cytoscape 3.82软件[13]用于后续分析。使用软件中的分子复合物检测(MCODE)应用程序进行模块分析,以检测聚类模块,检测到聚类最明显的模块后应用cytoHubb程序进行中枢基因筛选,选出排名靠前的中枢基因,颜色较深的模块具有更强的汇聚性。

1.5 GEPIA数据库中枢基因的验证及生存分析 通过GEPIA数据库(http://gepia.cancer.pku.cn/)进行肿瘤和正常组织差异基因表达分析、生存分析及基因相关性分析[14]。临界条件设置为|Log2FC|=1,P<0.01,肿瘤为红色模块,正常组织为灰色模块。

2 结果

2.1 差异基因 GSE39582数据集中包含566例偶发性结直肠癌和19例正常组织样本,GSE37283数据集中包含11例溃疡性结肠炎相关性结肠癌和5例正常组织样本。根据筛选标准在数据集中筛选溃疡性结肠炎相关性结肠癌和偶发性结直肠癌差异表达基因,在GSE39582数据集中得到上调基因115个,下调基因328个;在GSE37283数据集中得到上调基因222个,下调基因444个,通过分析获得两个数据集中不相同的下调基因141个,上调基因396个。

2.2 差异基因的功能和途径富集分析 为探索差异基因功能和途径的丰富性,进行GO和KEGG分析。KEGG分析表明,代谢通路主要富集于补体途径、细胞因子受体相互作用、利什曼原虫相关通路、NK-κB信号通路等,见图1。GO分析显示,改变的细胞功能为代谢过程、细胞外泌体蛋白质异源二聚体活性、蛋白结合、信号转导、质膜相关的分子功能等,见图2。

图1 KEGG富集分析

图2 GO富集分析

2.3 蛋白质相互作用网络构建与中枢基因识别 通过STRING在线数据库,为重叠的差异表达基因构建蛋白质相互作用网络,使用Cytoscape中的MCODE程序,分析基因之间的内在联系网络蛋白质。最重要的集群得分为26分,筛选出10个关联性最高的基因,得分为26分,这10个中枢基因均为上调基因,见图3。

图3 聚类最明显模块及中枢基因

2.4 GEPIA数据库中验证中枢基因在肿瘤与正常组织表达水平差异及生存分析 在GEPIA数据库中,再次验证了溃疡性结肠炎相关性结肠癌和偶发性结直肠癌组织之间中枢基因表达差异,见图4。生存分析显示,CCL4、CCL2、ITGAM基因对预后影响明显,IL1B基因与预后相关,见图5。

图4 中枢基因在GEPIA数据库中与正常组织的表达差异

图5 GEPIA数据库中枢基因生存分析

3 讨论

溃疡性结肠炎相关性结肠癌与偶发性结直肠癌的临床特点和发病机制不同。本研究基于基因数据集筛选出溃疡性结肠炎相关性结肠癌和偶发性结直肠癌的差异表达基因,包括下调基因141个,上调基因396个。KEGG途径分析显示差异基因主要富集在补体途径、细胞因子受体相互作用、利什曼原虫相关通路、NK-κB信号通路,这些通路在细胞的代谢中具有重要作用。GO富集分析显示下调基因富集于代谢过程、细胞外泌体蛋白质异源二聚体活性的细胞功能,上调基因富集于与蛋白质结合、信号转导和质膜相关的分子功能。

通过STRING在线数据库,构建了差异基因蛋白质相互作用网络,将蛋白共作用网络导入Cytospace软件中的MCODE,分析两个基因之间的内在网络蛋白关系。最佳模块得分为26分,采用cytoHubba软件筛选出聚类程度排名前10的中枢基因PTPRC、TLR4、ITGAM、CD40、CD86、IL1B、CCL4、CXCL9、TLR2、CCL2,这些中枢基因均为上调基因。在GEPIA数据库中验证中枢基因,与正常组织表达差异明显的基因为PTPRC、CXCL9、CD86、ITGAM、IL1B,其中在GEPIA数据库的结肠癌中表达上调的基因有CXCL9、IL1B,下调基因有PTPRC、ITGAM、CD86。生存分析显示,CCL4、CCL2、ITGAM基因对预后影响明显,IL1B基因的表达与预后相关,其中ITGAM、CCL2在溃疡性结肠炎相关性结肠癌中表达下降,CCL4、IL1B表达上升。

ITGAM参与单核细胞、巨噬细胞和粒细胞的各种粘附相互作用,研究报道,ITGAM与肿瘤转移有明显关系[15,16],该基因在结肠癌中下调可能与结肠癌的转移有关。CCL2是一种趋化因子,其结合同源受体CCR2,具有多种促肿瘤发生作用,介导肿瘤生长和血管生成,促进肿瘤进展[17]。CCL4在结肠癌中的高表达可诱导肿瘤相关巨噬细胞,尤其是促肿瘤巨噬细胞的浸润,CCL4的高表达与结肠癌患者的不良预后相关[18]。IL1B是一种抗感染促炎细胞因子,研究表明其突变增加了炎症性肠病相关结肠癌在人群中的比例[19]。这些基因的改变将会对肿瘤的发生发展产生影响,筛选差异性基因有助于对肿瘤的发病机制有更深入的了解,也会为肿瘤的治疗提供新思路。

综上所述,本研究通过生物信息学对GEO数据集进行差异基因分析,通过蛋白质相互作用网络确定了10个偶发性结直肠癌和溃疡性结肠炎相关性结肠癌的差异基因,并通过在线数据库验证与正常组织的表达差异,选出对预后影响较大的基因,为溃疡性结肠炎相关性结肠癌的临床治疗提供新的靶点及治疗方向,为肿瘤的个体化治疗提供指导。然而本研究通过公共数据库的数据分析完成,相关结果需要进一步的实验研究加以验证。

猜你喜欢
差异基因中枢溃疡性
试议文化中枢的博物馆与“进”“出”两种行为
都市区创智中枢 北郑州水韵嘉城
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
针灸可治疗溃疡性结肠炎
紫檀芪处理对酿酒酵母基因组表达变化的影响
“辟谷”能治便秘吗?
SSH技术在丝状真菌功能基因筛选中的应用
蒙药治疗溃疡性结肠炎46例临床观察
抢占中枢