基于TCGA数据库筛选与胃癌进展和预后相关的潜在关键基因

2022-05-10 03:53:46刘婷张红2万亿3李晓宇任明翰王斌4田字彬
精准医学杂志 2022年2期
关键词:生存率基质胃癌

刘婷 张红2 万亿3 李晓宇 任明翰 王斌4 田字彬

(1 青岛大学附属医院消化内科,山东 青岛 266021; 2 青岛大学基础医学院、公共卫生学院;3 青岛大学基础医学院免疫学实验室; 4 青岛大学基础医学院特种医学实验室)

全球范围内胃癌发病率居恶性肿瘤的第5位,居癌症死亡原因的第3位,近年来胃癌的发病率呈逐年增加趋势,进展期胃癌虽可进行手术、化疗和放疗等相关治疗[1-3],但在改善进展期胃癌患者的长期生存率方面还存在一定的局限性,因此迫切需要进一步的探索胃癌的发生机制和寻找主要的致病基因,为胃癌的精准治疗提供数据参考。

近年来肿瘤分子标记物的早期检测备受关注,肿瘤微环境(TME)与实体肿瘤的发生、发展密切相关,胃癌与TME的相关性也是目前胃癌研究的热点之一[4-5]。TME是一个复杂的综合系统,主要由肿瘤细胞及其周围的免疫细胞、炎症细胞、肿瘤相关的成纤维细胞以及附近的间质组织、微血管、各种细胞因子和趋化因子构成,TME的改变对肿瘤患者的疗效和预后均会产生影响[6]。TME评分包括基质评分以及免疫评分,是采用ESTIMATE算法对TME中的基质细胞、免疫细胞以及肿瘤纯度进行估计计算而得来。目前临床普遍以TME评分作为筛选前列腺癌、结肠癌和乳腺癌的生物标记物的指标之一[7-10]。本研究首先通过运用CIBERSORT和ESTIMATE算法对TCGA数据库中胃癌样本计算基质评分以及免疫评分,然后分析基质评分、免疫评分与患者生存率以及胃癌临床病理特征的相关性,筛选出与胃癌患者生存率和预后密切相关的差异表达基因(DEGs),旨在为胃癌的临床治疗能够提供数据参考。

1 材料与方法

1.1 胃癌组织样本基质评分和免疫评分与患者生存率的相关性分析

从TCGA数据库(https://portal.gdc.cancer.gov/)中下载胃癌组织及癌旁正常组织样本的转录组RNA-seq数据,通过R语言软件转换后,再使用R语言中的“estimate”软件包计算每个胃癌样本的基质成份和免疫成份比例,进一步获得基质评分和免疫评分;按照ESTIMATE算法中的要求,将基质评分和免疫评分以中位数为界限,分为高基质评分、低基质评分、高免疫评分、低免疫评分,绘制Kaplan-Meier生存曲线并进行Log-rank检验,分析胃癌患者样本基质评分、免疫评分与患者生存率的相关性。

1.2 基质评分、免疫评分与胃癌患者临床病理特征的相关性分析

下载TCGA数据库中胃癌患者临床病理学数据,包括grade分级(G1、G2、G3)、Stage分期(StageⅠ、StageⅡ、StageⅢ)、TNM分期(T分期、N分期、M分期),再通过R语言软件分析胃癌患者的临床病理特征与样本基质评分、免疫评分的相关性。

1.3 DEGs的初步筛选并进行KEGG和GO富集分析

对从数据库中下载的胃癌组织与癌旁正常组织数据通过R语言软件转换以后,进一步通过R语言“limma”软件包分析获得胃癌组织与癌旁正常组织的DEGs。使用R语言“enrichplot”“ClusterProfi-ler”“ggplot2”和“org.Hs.eg.db”软件包对初步筛选出的DEGs进行KEGG和GO富集分析,以P(调整后的P值)<0.05为差异有统计学意义。

1.4 构建蛋白质相互作用(PPI)网络并筛选关键DEGs

通过STRING数据库(https://string-db.org)对胃癌组织与癌旁正常组织的DEGs构建PPI网络,以置信水平>0.9设为过滤值,使用Cytoscape(version 3.6.1,https://cytoscape.org)对PPI网络进行评分及重构,提取网络中的前150个DEGs。采用R语言“survival”软件包对胃癌组织样本进行单变量COX回归分析,筛选出与胃癌患者生存具有显著相关性的DEGs,以P<0.05为有统计学意义,并按照P值从小到大的顺序进行排序。将单因素COX回归分析获得的DEGs与PPI网络中的前150个DEGs取交集,获得显著DEGs。采用R语言软件分别对获得的每一个显著DEGs在胃癌组织和癌旁正常组织中进行样本配对分析、患者生存率分析以及临床病理特征相关性分析以后,筛选出关键DEGs。

1.5 关键DEGs的基因集富集分析(GSEA)

通过R语言软件对关键DEGs进行GSEA,以同时满足P<0.05、NOMP<0.05、|NES|>1为有统计学意义。

1.6 TME中肿瘤浸润性免疫细胞(TICs)类型及比例、TICs差异分析以及TICs与关键基因的相关性分析

通过CIBERSORT方法计算所有胃癌组织样本TME中TICs的类型和比例。以关键DEGs表达水平的中位值为阈值,将关键DEGs分为高表达组和低表达组,对同一种TICs在关键DEGs高表达组和低表达组的占比与癌旁正常组织间进行差异分析,以P<0.05为有统计学意义,并对TICs与关键DEGs表达水平进行相关性分析,以P<0.05为有统计学意义。

2 结 果

2.1 基质评分和免疫评分与胃癌患者生存率的相关性分析

从TCGA数据库共下载胃癌组织及癌旁正常组织样本407例,其中375例胃癌组织样本,32例癌旁正常组织样本。通过R语言软件分析并计算胃癌组织样本的基质评分和免疫评分,并绘制Kaplan-Meier生存曲线显示,高基质评分与患者生存率呈负相关(P=0.030)(图1A),免疫评分与患者生存率无显著相关性(图1B)。

2.2 基质评分、免疫评分与胃癌患者临床病理特征相关性分析

对基质评分、免疫评分与胃癌患者临床病理特征进行相关性分析,结果显示,基质评分和免疫评分均与胃癌grade分级、Stage分期、TNM分期的T分期呈显著相关(P<0.05),见图2。基质评分和免疫评分与TNM分期的N分期及M分期不具有显著相关性(P>0.05)。

2.3 DEGs的筛选及其KEGG和GO富集分析

通过R语言软件分析后,共获得胃癌组织与癌旁正常组织的DEGs 1 305个,其中1 070个DEGs表达上调,235个DEGs表达下调。进而对1 305个DEGs进行KEGG富集分析结果显示,这些DEGs主要参与了免疫应答过程,其中排列在前4位的主要通路分别为细胞因子-细胞因子受体相互作用通路、细胞黏附分子、B细胞受体信号通路和原发性免疫缺陷;GO富集分析结果显示,DEGs主要参与免疫应答过程,如免疫反应激活表面受体信号通路、免疫反应激活信号转导以及淋巴细胞免疫、体液免疫反应。

2.4 显著DEGs的筛选及其与患者预后等相关性分析结果

对1 305个DEGs通过STRING数据库构建PPI网络,并使用Cytoscape提取出PPI网络中的前150个DEGs。对胃癌组织样本进行单因素COX 回归分析,共筛选出18个与胃癌患者生存具有显著相关性的DEGs,与PPI网络提取出的150个DEGs取交集后,获得5个显著DEGs,分别为MCEMP1、HTR2A、PTGFR、F13A1和HGF。采用R语言软件分别对上述5个显著DEGs进行样本配对分析,结果显示,仅F13A1、MCEMP1在胃癌组织与癌旁正常组织中的表达有显著差异(P<0.05);患者的生存分析结果显示,F13A1、MCEMP1低表达患者的中位生存时间均显著高于高表达患者(P<0.05);另一方面与临床病理特征相关性分析显示,F13A1、MCEMP1的表达与grade分级、Stage分期、TNM分期的T分期及N分期均显著相关(P<0.05),通过上述分析得出F13A1、MCEMP1为关键DEGs。

A:基质评分与患者生存率的相关性,B:免疫评分与患者生存率的相关性图1 基质评分、免疫评分与患者生存率的相关性Fig.1 Correlation between Stromal Score and Immune Score and survival rate of patients

A:基质评分与胃癌grade分级的相关性;B:基质评分与胃癌Stage分期的相关性;C:基质评分与胃癌T分期的相关性;D:免疫评分与胃癌grade分级的相关性;E:免疫评分与胃癌Stage分期的相关性;F:免疫评分与胃癌T分期的相关性图2 基质评分、免疫评分与胃癌患者临床病理特征的相关性Fig.2 Correlation between Stromal Score and Immune Score and clinicopathological features of patiants with gastric cancer

2.5 关键DEGs的GSEA

关键DEGs的GSEA结果显示,F13A1的高表达与结直肠癌、前列腺癌肿瘤相关通路以及JAK/STAT和MAPK信号通路显著相关,MCEMP1的低表达与抗原加工和呈递、半乳糖代谢、糖胺聚糖降解、自然杀伤(NK)细胞介导的细胞毒性、Nod样受体信号通路、蛋白酶体和Toll样受体信号通路具有相关性(P<0.05)。

2.6 关键DEGs与TICs比例的差异及相关性

CIBERSORT算法结果显示,每一例胃癌组织样本中含有22种TICs。F13A1、MCEMP1与22种TICs的相关性分析结果显示,在F13A1高表达和低表达的胃癌组织样本中,F13A1的表达与8种TICs存在显著相关性(P<0.05),其中M0巨噬细胞、T调节(Treg)细胞与F13A1的表达呈显著负相关,活化的树突状细胞、静息的树突状细胞、嗜酸性粒细胞、M2巨噬细胞、静息的肥大细胞、单核细胞与F13A1的表达均呈显著正相关(|R|>0.1)。另外MCEMP1的表达与14种TICs存在显著相关性(P<0.05),其中幼稚B细胞、静息肥大细胞、活化的NK细胞、静息忘记性CD4阳性T细胞、Treg细胞与MCEMP1的表达呈显著负相关,活化的树突状细胞、嗜酸性粒细胞、M0巨噬细胞、M2巨噬细胞、活化的肥大细胞、中性粒细胞、静息NK细胞、活化的CD4阳性细胞和γδT细胞与MCEMP1的表达呈显著正相关(|R|>0.1)。

3 讨 论

胃癌早期症状隐匿,大多数患者就诊时已经处于进展期[11],传统的治疗方式对于进展期胃癌的疗效有限,进展期胃癌5年生存率不足10%。近年来分子靶向治疗在胃癌领域有一定进展,但仅有部分人群获益。TME在肿瘤的发生发展方面起着关键性的作用,因此从TME角度去探索肿瘤潜在的治疗靶标对深入研究肿瘤的发病机制有着极其重要的意义和价值[12-13]。另外许多研究结果表明,TME与胃癌的发生、进展和转移显著相关[14-15],TME中的TICs与胃癌患者的临床预后密切相关[16]。

本研究通过下载TCGA数据库中胃癌及癌旁正常组织样本数据,计算胃癌患者样本中基质成份及免疫成份比例,获得基质和免疫评分,并对基质评分、免疫评分与患者生存及胃癌临床病理特征进行了相关性分析,结果显示基质评分越高,患者生存率越低、肿瘤组织分化程度越低、分期越晚,提示TME中的基质评分可能适用于预测胃癌患者的预后。为进一步分析DEGs的作用机制和途径,本研究对胃癌组织与癌旁正常组织中的DEGs进行了KEGG及GO富集分析,提示所有DEGs主要参与了免疫应答过程。随后通过对DEGs构建PPI网络以及对胃癌组织样本进行单变量COX回归分析,进一步筛选得到5个显著DEGs。通过对显著DEGs在胃癌组织和癌旁正常组织中进行样本配对分析,获得2个关键DEGs。对关键DEGs在胃癌组织和癌旁正常组织中进行患者生存率分析以及临床病理特征相关性分析,提示肿瘤组织分化程度越低、分期越晚、淋巴结受累越多,F13A1、MCEMP1表达水平越高,提示F13A1、MCEMP1参与了胃癌的发生发展,并且F13A1、MCEMP1的表达可能对胃癌的发展和患者的预后有着重要影响。为进一步分析关键DEGs参与的信号通路,以及进一步明确关键DEGs与TME之间的关系,本研究又对关键DEGs进行了GSEA并分析了关键DEGs与22种TICs的相关性,结果显示F13A1、MCEMP1与多种TICs相互关联,在胃癌TME中的表达对免疫细胞激活相关的信号通路和细胞毒性作用有较大影响。提示F13A1、MCEMP1是一种潜在的预后生物标志物,也许可作为胃癌的治疗靶点。

研究发现F13A1、MCEMP1是胃癌的高危基因,可分别独立用于预测胃癌患者的生存和预后。F13A1也称为凝血因子A,是一种谷氨酰胺转氨酶,可以交联纤维蛋白形成稳定的血凝块,也可在炎症和血管生成过程中发挥作用。F13A1在血栓性疾病形成过程中充当重要角色,F13A1基因和蛋白在血浆中的表达水平及活性均与肿瘤的发生发展密切相关。另有研究表明F13A1与多种癌症的增殖以及转移有关,并且与M2巨噬细胞的极化显著相关[17-19]。结合本研究结果,可以推测F13A1在胃癌的发展中起着促进作用。

MCEMP1主要由单核细胞和肥大细胞表达,编码一种单向跨膜蛋白,可参与调节肥大细胞分化或免疫应答过程。肿瘤内肥大细胞的增加可促进免疫抑制和胃癌的进展[20-21]。研究发现,MCEMP1在调节机体免疫反应中起着重要作用,与先天免疫系统密切相关,其缺失可增加T淋巴细胞的活性、NK细胞的活性和免疫球蛋白的表达水平,抑制炎症因子的释放,诱导T淋巴细胞凋亡[22]。研究发现MCEMP1的高表达与膀胱癌的发生和患者不良预后显著相关[20]。另外HU等[23]构建的胃癌患者预后的预测风险模型中也显示,MCEMP1可以作为预测胃癌进展和预后的生物标记物。结合本研究结果,可以推测MCEMP1与胃癌的预后密切相关。

本研究结果显示,F13A1、MCEMP1基因表达与M2巨噬细胞呈显著相关。M2巨噬细胞又称狭义的肿瘤相关巨噬细胞(TAMs),主要由单核细胞分化而来,肿瘤细胞分泌的集落刺激因子等趋化因子能招募外周血中的单核细胞到TME中,从而使单核细胞分化为巨噬细胞。据报道TAMs对甲状腺乳头状癌与乳腺癌的细胞增殖、血管生成、免疫抑制起着促进作用[24-25]。有研究证明胃癌TME中浸润的TAMs以M2亚型巨噬细胞为主,发挥着促进肿瘤生长、侵袭和转移的作用[26]。本研究结果提示,随着F13A1、MCEMP1表达水平的上调,存在于胃癌TME中的主导反应从抗肿瘤免疫反应转变为促进肿瘤细胞代谢反应。此外本研究GSEA结果也提示,F13A1表达与JAK/STAT和MAPK等肿瘤相关的信号通路具有显著相关性,这也提示F13A1、MCEMP1可能与胃癌的发展和患者的预后具有密切相关性。

综上所述,本研究通过生物信息学方法筛选了与胃癌的进展和患者的预后相关的关键基因。研究发现在胃癌的TME中,F13A1、MCEMP1高表达对胃癌的发展起着促进作用,与胃癌患者的临床预后密切相关,对胃癌患者的预后预测和治疗指导有重要意义。

利益冲突声明:所有作者声明不存在利益冲突。

ConflictsofInterest: All authors disclose no relevant conflicts of interest.

作者贡献:刘婷、王斌、田字彬参与了研究设计;刘婷、李晓宇、张红、万亿、任明翰、田字彬参与了论文的写作和修改。所有作者均阅读并同意发表该论文。

Contributions: The study was designed byLIUTing,WANGBin, andTIANZibin. The manuscript was drafted and revised byLIUTing,LIXiaoyu,ZHANGHong,WanYi,RENMinghan, andTIANZibin. All the authors have read the last version of the paper and consented submission.

猜你喜欢
生存率基质胃癌
机插秧育苗专用肥——机插水稻育苗基质
金银花扦插育苗基质复配及验证
“五年生存率”不等于只能活五年
不同栽培基质对一品红扦插苗的影响
北京园林(2020年4期)2020-01-18 05:16:46
人工智能助力卵巢癌生存率预测
“五年生存率”≠只能活五年
直干蓝桉容器育苗基质的选择
HER2 表达强度对三阴性乳腺癌无病生存率的影响
癌症进展(2016年12期)2016-03-20 13:16:14
P53及Ki67在胃癌中的表达及其临床意义
胃癌组织中LKB1和VEGF-C的表达及其意义