应用生物信息学方法筛选与早期胃癌预后相关的核心基因

2021-04-15 06:51邓建忠刘秀玲陆文斌张华李文晶吴颉刘迁
山东医药 2021年10期
关键词:信息学生物学标志物

邓建忠,刘秀玲,陆文斌,张华,李文晶,吴颉,刘迁

江苏大学附属武进医院 徐州医科大学武进临床学院,江苏常州213017

胃癌是临床常见的消化系统恶性肿瘤,在我国其发病率仅次于肺癌,居第2位,死亡率居肿瘤相关死亡的第3位[1]。我国早期胃癌发现占比较低,仅占20%左右,大多数患者首诊时已属进展期,5 年总体生存率不足50%[2-3]。目前,胃癌发病的确切分子机制尚不清楚,临床亦缺乏早期诊断和预后判断的生物标志物。近年来,随着高通量技术迅速发展,有力地推动了疾病基因组学发展和进步。有研究认为,利用生物信息学方法探索分子改变与疾病预后的关系,能够挖掘对疾病预后判断有效的分子标志物[4]。2020 年8 月,本研究应用生物信息学方法通过GEO数据库获取早期胃癌发生、发展过程中显著差异表达基因(DEGs),然后通过GO 功能注释、KEGG 富集分析和蛋白质相互作用网络(PPI)筛选核心基因,通过Kaplan-Meier 生存分析进一步筛选与预后相关的核心基因,旨在为早期胃癌的预后判断提供新的视角。现报告如下。

1 材料与方法

1.1 微阵列数据库检索 以“early gastric cancer,Homo”为关键词,从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中获得人类早期胃癌基因芯片数据集。数据集需要同时提供早期胃癌组织和正常胃组织的基因芯片,共筛选出GSE3438、GSE55696 两个微阵列数据集。GSE3438数据集基于GPL2912平台(人类基因组功能分析中心KUGI 14K),GSE55696 数据集基于GPL6480 平 台(Agilent-014850全人类基因组芯片4×44K G4112F)。所有数据在线免费获取。

1.2 DEGs 数据处理 利用GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)在线分析工具筛选早期胃癌组织与正常胃组织的DEGs,以调整后的P 和|logFC|为筛选指标。调整后的P<0.05 且|logFC|≥1.0,则认为早期胃癌组织与正常胃组织存在DEGs,然后采用维恩图(http://bioinformatics. psb. ugent.be/webtools/venn/)确定GSE3438、GSE55696 数据集的交集基因。

1.3 GO 功能注释和KEGG 富集分析 利用生物学信息注释数据库DAVID(http://david.ncifcrf.gov/)对早期胃癌DEGs 进行GO 功能注释和KEGG 富集分析[4]。其中,GO 功能注释包括生物学过程、细胞学组分和生物学功能。

1.4 PPI构建和核心基因筛选 应用STRING在线数据库(http://string-db. org),以medium confidence>0.4为条件构建DEGs 的PPI,并通过Cytoscape(http://www. cytoscape. org/)的CytoHubba 插件按基因节点的连接度筛选前6位核心基因。

1.5 核心基因表达与早期胃癌预后关系分析 应用在线分析工具Kaplan-Meier(http://kmplot. com/analysis/)中mRNA 胃癌数据库评估核心基因对早期胃癌预后判断的价值。以核心基因mRNA表达的最佳截断值为临界值,将早期胃癌患者分为高表达者与低表达者,比较不同表达者的总生存期(OS)。

1.6 统计学方法 计数资料比较采用χ2检验。生存分析采用Kaplan-Meier法。P<0.05为差异有统计学意义。

2 结果

2.1 DEGs 筛选结果 经GEO2R 在线分析工具筛选GSE3438、GSE55696 两个微阵列数据集,GSE3438 数据集含早期胃癌组织标本10 例份、正常胃组织标本10 例份,GSE55696 数据集含早期胃癌组织标本19 例份、正常胃组织标本19 例份。按P<0.05 且|logFC|≥1.0 标准,从GSE3438 数据集中筛选出DEGs 687 个,其中表达上调基因312 个、表达下调基因375 个;从GSE55696 数据集中筛选出DEGs 2 686 个,其中表达上调基因1 911个、表达下调基因775个。通过维恩图分析获得GSE3438、GSE55696数据集的DEGs交集(见图1),结果在DEGs交集中共有30个基因,其中表达上调基因11个、表达下调基因19个。

图1 GSE3438、GSE55696数据集中DEGs的维恩图

2.2 DEGs 的GO 功能注释和KEGG 富集分析结果 GO 功能注释显示,早期胃癌的DEGs 主要存在于细胞外外来体的细胞学组分,介导烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP)为受体的氧化还原酶活性的生物学功能,参与细胞增殖调控的生物学过程。KEGG 富集分析显示,DEGs主要参与糖酵解和糖异生以及细胞色素P450信号通路的调控。见表1。

表1 DEGs的GO富集分析和KEGG信号通路分析结果

2.3 PPI 构建和核心基因筛选结果 通过STRING构建DEGs 的PPI,并通过Cytoscape 的CytoHubba 插件按基因节点的连接度筛选前6 位核心基因,分别为CDKN2A(连接度为9)、ANXA2(连接度为8)、CTSB(连接度为7)、ATF3(连接度为6)、CD59(连接度为6)、CCND2(连接度为6)。见图2。

2.4 早期胃癌不同核心基因表达患者OS比较 不同ANXA2、CTSB 表达与早期胃癌患者预后有关(P均<0.01),其余4 个核心基因(CDKN2A、ATF3、CD59、CCND2)表达与早期胃癌患者预后无关(P均>0.05)。见表2 及图3、4。

3 讨论

早期胃癌可能无症状,或表现为消化不良、上腹部不适感等症状,但这些症状无特异性,亦可见于慢性胃炎、胃溃疡等疾病,常常不被重视,待出现贫血、体质量减轻或伴有便血等并发症状就诊时,病情已进展到中晚期,患者生活质量明显降低、生存时间明显缩短。因此,寻找一种便捷诊断早期胃癌的分子标志物具有重要意义。目前,以筛选差异表达分子和基于网络的核心基因及生存分析为主要内容的生物信息学分析已被广泛用于寻找与胃癌诊断、治疗和预后相关的潜在生物标志物[5]。RONG 等[6]采用生物信息学方法筛选出与胃癌早期诊断相关的生物标志物,并可能有助于进一步评估胃癌患者预后。但鲜有报道通过生物信息学方法筛选与早期胃癌预后相关的核心基因。

图2 DEGs的PPI示意图

表2 早期胃癌不同核心基因表达患者OS比较

图3 早期胃癌不同ANXA2表达患者生存曲线

图4 早期胃癌不同CTSB表达患者生存曲线

本研究整合了GSE3438、GSE55696 两个微阵列数据集,利用GEO2R 在线分析工具筛选出30 个共同DEGs,其中表达上调基因11个、表达下调基因19个。GO 功能注释表明,早期胃癌的DEGs 主要存在于细胞外外来体的细胞学组分,介导以NAD 或NADP 为受体的氧化还原酶活性的生物学功能,参与细胞增殖调控的生物学过程。KEGG 富集分析显示,DEGs 主要参与糖酵解和糖异生以及细胞色素P450 信号通路的调控。结果提示,这些DEGs 可能在早期胃癌的发生、发展中具有重要作用。

通过PPI的核心基因分析筛选出6个核心基因,分 别 为CDKN2A、ANXA2、CTSB、ATF3、CD59、CCND2。CDKN2A 能够参与细胞周期调控、细胞分化和凋亡等生物学过程,该基因突变在胰腺导管癌中常见[7]。YANG 等[8]研究发现,CDKN2A 高表达不能预示脊索瘤患者预后不良。本研究结果发现,CDKN2A 表达与早期胃癌患者预后无关。ATF3是ATF/CREB 家族的转录因子,已被证实在乳腺上皮细胞癌变过程中发挥重要作用,ATF3过表达可抑制细胞周期G2/M 期阻滞,抑制细胞凋亡,提高克隆成活率[9]。结直肠癌患者血清ATF3 水平升高,ATF3 可能是结直肠癌诊断的潜在生物标志物[10]。CD59是一种膜结合的补体调节蛋白,该基因缺陷会加重DNA 损伤,阻碍细胞增殖,导致细胞周期G2/M期阻滞和细胞衰老。有研究发现,CD59高表达与接受放疗的食管鳞癌患者OS 和无病生存期较短有关[11]。在肺癌和乳腺癌组织中存在CCND2 启动子高甲基化状态,而CCND2启动子高甲基化是患者预后不良的一个独立危险因素。研究表明,CCND2 过表达能够抑制肿瘤细胞增殖和迁移,并促进其细胞凋亡[12]。本研究结果发现,虽然CDKN2A、ATF3、CD59 在早期胃癌组织与正常胃组织中存在差异表达,但其表达差异与早期胃癌预后无关,与以往研究结果并不一致[10-12]。

ANXA2是膜联蛋白家族的一个重要成员,是一种钙依赖性磷脂结合蛋白,可参与细胞骨架重排和纤溶酶原激活等生物学过程[13]。与癌旁正常组织比较,胃癌组织ANXA2表达上调,沉默ANXA2可导致胃癌细胞增殖、侵袭和迁移能力减弱[14]。在肝癌组织中ANXA2高表达,其高表达能够通过调节肌动蛋白重构,促进肝癌细胞的侵袭和迁移;ANXA2 高表达与肝癌肝内转移、门静脉血栓形成等显著相关,生存分析发现ANXA2 高表达者预后较差[15-16]。本研究结果显示,ANXA2 在早期胃癌组织中高表达,并且ANXA2 高表达者OS 明显高于ANXA2 低表达者,与ZHANG等[15]研究结果并不一致。CTSB是半胱氨酸蛋白酶家族成员之一,在蛋白质降解和加工过程中发挥重要作用[17]。CTSB 在多种恶性肿瘤组织中高表达,可作为一种促癌基因,参与肿瘤的发生、发展[18]。由于CTSB 蛋白在自噬相关事件中发挥关键性作用,其表达调控引起人们广泛关注。本研究结果发现,CTSB 在早期胃癌组织中低表达,并且CTSB低表达者OS 明显高于CTSB 高表达者。因此,ANXA2、CTSB 可作为预测早期胃癌患者预后的生物标志物。

总之,在早期胃癌组织中存在多种DEGs,如CDKN2A、ANXA2、CTSB、ATF3、CD59、CCND2等,其中ANXA2、CTSB 表达变化可能与早期胃癌患者预后有关。这为早期胃癌的预后判断提供了新的视角,但这些DEGs 在胃癌发生、发展中的具体分子机制仍不清楚,尚需进一步研究。

猜你喜欢
信息学生物学标志物
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
多项肿瘤标志物联合检测在健康体检中的应用价值
丁酸梭菌的筛选、鉴定及生物学功能分析
谷稗的生物学特性和栽培技术
鸡NRF1基因启动子区生物信息学分析
基于TCGA数据库分析、筛选并验证前列腺癌诊断或预后标志物
生物信息学辅助研究乳腺癌转移相关lncRNA进展
PBL教学模式在结构生物信息学教学中的应用
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用