庄阳辉,康争春,王海棠,陈贵珠,陈琪琛,蔡 慧
1.泉州市中医院普通外科,泉州 362000 2.海军军医大学附属长海医院普通外科,上海 200433
胃癌是我国乃至全球常见的消化道恶性肿瘤之一,严重威胁人类生命健康[1]。我国是世界上胃癌的高发地区之一,每年至少有50多万人死于胃癌。因此,早期诊断、早期治疗对于降低胃癌的病死率非常重要。随着我国公共卫生事业的发展,早期胃癌发现率越来越高。早期胃癌是否伴有淋巴结转移的治疗方式、治疗策略、预后均不同。对于早期胃癌淋巴结转移相关分子的研究显得十分重要[2]。本研究利用TCGA公共数据库中的胃癌RNA-seq表达谱数据筛选了早期胃癌伴与不伴淋巴结转移的差异表达基因,并分析了其与患者预后的关系,为胃癌的早期诊治提供了新的靶点。
1.1 早期胃癌组织样本RNA-seq数据的下载及预处理 首先,从癌症基因组图谱官方网站(TCGA[3],https://cancergenome.nih.gov/)下载胃腺癌RNA-seq数据,下载时间为2019年6月2日。利用Perl 5.26.2软件,将原始数据转化为gene id表达矩阵,并将Gene ID改写成Gene Symbol,对表达谱信息进行编码蛋白的mRNA抽提。然后下载TCGA数据库胃腺癌患者的临床生存及病理信息,获取T1N0M0期和T1N1~3M0期胃癌患者的信息。
1.2 筛选T1N1~3M0期与T1N0M0期胃癌的差异表达基因 在R 3.5.3环境下,加载edgeR[4]包。以未发生淋巴结转移的早期胃癌表达谱为对照组,以发生淋巴结转移的早期胃癌表达谱为实验组,筛选两组的差异表达基因。以log2FoldChange(差异表达倍数取2的对数)绝对值大于1、假发现率(FDR)小于0.05为筛选条件,对差异表达基因聚类热图结果进行可视化分析。
1.3 差异表达基因的GO功能和KEGG通路富集分析 首先将Gene Symbol转换成Gene ID,在R 3.5.3环境下,加载clusterProfiler包、org.Hs.eg.db包、enrichplot包、ggplot2包,对上调、下调差异表达基因分别进行GO功能和KEGG通路富集分析和可视化,检验水准(α)为0.05。
1.4 差异表达基因与胃癌患者预后的相关性分析 在Kaplan-Meier Plotter网站(http://kmplot.com/analysis/)对差异表达基因与胃癌患者的生存情况进行相关性分析,判断差异表达基因是否影响患者预后(由于早期胃癌人群较少,故对全部分期胃癌患者进行生存分析,共371例)。分别对上调差异表达基因前10个和下调差异表达基因的前5个进行胃癌患者生存相关性分析。高风险和低风险的最佳截断值由网站的智能化功能自动选择。
2.1 早期胃癌组织样本情况 肿瘤组织样本共646例,其中T1N0M0期14例,T1N1~3M0期5例。检测基因19 767个,为HTSeq-Counts数据。
2.2 T1N1~3M0期对比T1N0M0期胃癌相比的差异表达基因 共发现差异表达基因202个,其中上调197个、下调差异5个。聚类分析(图1)显示,T1N1~3M0期胃癌有独特的上调基因表达谱。前10个上调差异表达基因的基本信息见表1,5个下调差异表达基因的基本信息见表2。
图1 差异表达基因聚类热图
红黑绿不同颜色及颜色深浅代表不同的mRNA表达量. 热图最上方的蓝条代表T1N0M0期胃癌,红条代表T1N1-3M0期胃癌
表1 T1N1-3M0期对比T1N0M0期胃癌的前10个上调差异表达基因情况
Log2FoldChange:差异表达倍数取2的对数;log2CPM:每百万片段筛选获得的该基因片段数取2的对数;FDR:假发现率
表2 T1N1-3M0期对比T1N0M0期胃癌下调的5个差异表达基因情况
Log2FoldChange:差异表达倍数取2的对数;log2CPM:每百万片段筛选获得的该基因片段数取2的对数;FDR:假发现率
2.3 差异表达基因显著富集的GO功能和KEGG通路情况 由于下调差异表达基因数量仅5个,故不对其进行富集分析,仅对上调差异表达基因进行GO功能和KEGG通路富集分析。结果(图2)显示:上调差异表达基因与肿瘤对白细胞介素-6(IL-6)的反应、细胞对IL-6的反应、IL-1生成正向调节、IL-1β分泌、细胞对IL-1的反应、肿瘤对肿瘤坏死因子(TNF)的反应、骨形态发生蛋白(BMP)信号通路、DNA去甲基化等GO功能显著相关;上调差异表达基因与Wnt信号通路、Ras信号通路、干细胞多能性的调节、细胞外基质(ECM)-受体相互作用、轴突指导、NF-κB信号通路、胃癌信号通路、钙信号通路、腺苷酸激活蛋白激酶(AMPK)信号通路、磷脂酰肌醇3-激酶(PI3K-Akt)信号通路等信号通路显著相关。
图2 T1N1-3M0期胃癌较T1N0M0期胃癌显著上调差异表达基因富集的GO功能(A)区域和KEGG通路(B)
2.4 差异表达基因与胃癌患者预后的相关性分析 在前10 个上调差异表达基因中,有6个与患者总生存期缩短相关,分别为DPEP3、THPO、HSPA6、SCGB3A2、CLDN6、CACNA1B(图3),提示这6个基因可能与胃癌的恶性表型相关。5个下调差异表达基因中,有4个与患者总生存期缩短相关,分别为HDGFL1、CTRB1、CCL26、OLFM4(图4)。
图3 T1N1-3M0期胃癌较T1N0M0期胃癌上调差异表达基因与患者生存期的相关性分析
胃癌的发生、发展、转归中的分子调控机制和关键分子事件一直是我国肿瘤科研工作的重点。早期淋巴结转移是胃癌早期侵袭的标志性事件之一,是否发生淋巴结转移与早期胃癌的预后密切相关[5]。本研究以早期胃癌的淋巴结转移状态为切入点,利用TCGA公共数据库表达谱数据,探索可能影响胃癌早期淋巴结转移的差异表达基因及其富集的功能区域、信号通路,并探索其是否影响胃癌的恶性表型,进而影响胃癌预后。
目前,国内外关于早期胃癌淋巴结转移相关因素的研究较多。闵丛丛等[6]发现,浸润深度、分化程度、是否合并溃疡是影响早期胃癌淋巴结转移的关键病理因素;王力等[7]通过回顾性分析242例早期胃癌病例,证明肿瘤浸润深度、脉管瘤栓是早期胃癌淋巴结转移的显著相关因素;周羽翙等[8]则通过回顾性分析更大样本量(417例)早期胃癌患者的临床资料发现,肿瘤大小、浸润深度、组织学类型、性别4个因素独立影响早期胃癌的淋巴结转移。有学者[9]绘制了曲线下面积(AUC)达0.860的列线图,用于评估各个临床病理因素对早期胃癌淋巴结转移的权重。然而,目前关于在基因表达层面评估早期胃癌淋巴结转移影响因素的报道较少。
图4 T1N1-3M0期胃癌较T1N0M0期胃癌下调差异表达基因与生存期的相关性分析
本研究通过生物信息学方法,筛选出早期胃癌淋巴结转移组相对于早期胃癌淋巴结未转移组显著上调和下调的基因,首先发现显著上调差异表达的基因占了差异表达基因的绝大部分,下调差异表达基因仅有5个。对两类组织的差异表达基因进行聚类分析,发现其聚类明显,早期胃癌具有独特的表达谱特征。该现象说明发生早期淋巴结转移的胃癌可能通过多个癌基因和癌症相关信号通路的激活而促进早期侵袭事件的发生,而抑癌基因的失活对胃癌早期淋巴结转移的促进作用并不明显。上调差异表达的197的基因富集在以IL-1[10]、IL-6[11]、TNF[12]介导的促增殖相关GO功能区域,且干细胞多能性的调节、ECM-受体相互作用、轴突指导、NF-κB信号通路[13]及胃癌信号通路也多证实与癌症密切相关,提示胃癌早期淋巴结转移机制的研究可以从这些方面入手。
本研究还发现,早期淋巴结转移胃癌差异表达基因多与胃癌预后相关,提示其可能影响胃癌的恶性表型。其中,上调差异表达显著性前10的基因中,有6个高表达与早期胃癌不良预后相关;下调差异表达全部5个基因中,有4个低表达与早期胃癌不良预后显著相关。该结论与GO功能和KEGG通路富集互相论证,为预后标志物及相关分子机制研究提供了参考。
早期淋巴结转移胃癌中高表达前10个基因和低表达基因中,已有部分被报道。目前已发现MUC12[14]、CLDN6[15]在胃癌预后评估方面具有重要价值;Cui等[16]通过全基因组测序发现,MUC12在其研究的5组配对胃癌组织中最常见;Oh等[17]发现,miRNA-486通过靶向嗅素蛋白4(OLFM4)调控胃癌细胞的增殖活性; PIWIL2蛋白家族[18]则可以作为人类胃癌的预测标志物。部分基因虽未在胃癌中被报道,但在其他恶性肿瘤中被发现有重要的生物学意义,如:DPEP3高表达与三阴乳腺癌不良预后密切相关[19];THPO等5个基因表达谱模式在肺腺癌和肺鳞癌中存在显著差异[20];CPA1的突变可增加胰腺癌的遗传易感性,促进胰腺癌的发生、发展[21];HSPA6的表达上调与HBV相关的早期肝细胞肝癌不良预后相关[22]。这些基因给我们在胃癌的研究中提供了一个很好的思路和方向。也有肿瘤相关基因在恶性肿瘤中的研究缺乏,如TRIM43、HDGFL1、CTRB1等,均是潜在的重要研究对象。
综上所述,本研究利用TCGA数据库发掘早期胃癌淋巴结转移相关的差异表达基因,并从GO功能、KEGG通路富集层面及其与预后相关性方面分析了差异表达基因的生物学意义,为更深入的胃癌调控机制研究提供了参考。这些差异表达基因并有可能作为胃癌的诊治靶标应用于临床实践。