陈思澈,党胜春
(江苏大学附属医院 普通外科,江苏 镇江 212001)
胰腺癌(pancreatic cancer)是现今社会病死率较高的消化道恶性肿瘤之一,预后极差,5年生存率不到6%[1-5]。胰腺癌的早期诊断及确诊率不高,目前手术治疗是最佳的治疗方式,但转移和复发率较高,所以找到一个可以判断预后的标记物是很有必要的。相关研究表明,胰腺癌发展的整个过程伴随着多个基因的改变,而细胞周期蛋白依赖性激酶抑制蛋白2A(cyclin-dependent kinase inhibitor 2A,CDKN2A)就是其中之一。CDKN2A是消化道恶性肿瘤患者体内一个突变基因。研究[6]表明CDKN2A在胰腺癌是一个最常见的不良变异基因。在一些胰腺癌患者中,病情的改变已经被证明与CDKN2A突变频率增加相关,最明显的是有胰腺癌发生家族史的患者[7]。所以在高危人群中,一般的变异都足以影响患者的生存率[8]。由于胰腺癌相对较低的发生率和存活率低,其发生的根本原因尚不明确,但有大量研究证明CDKN2A基因对很多肿瘤的发生、发展有着一定程度的影响对肿瘤的发生、发展有着一定的影响[9]。CDKN2A低表达与肿瘤大小、浸润深度、淋巴结转移和TNM分期等临床病理特征有关,可能是一种新的生物标志物,用于预测癌症患者的预后和临床病理特征[10]。CDKN2A主要是产生一种肿瘤抑制蛋白,这是一个细胞周期蛋白依赖性激酶抑制剂[11]。所以,通过认识、了解这个基因的改变特点,有可能为胰腺癌的早期诊断及治疗提供新的思路和方法。
基因拷贝数变异(copy number variation,CNV),是导致人类疾病发生、发展的重要因素之一,主要是因为基因组发生重排,一般指长度为1 kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。CDKN2A基因在胰腺癌的CNV程度较高。本研究通过TCGA及GTEx等数据库研究胰腺癌中CDKN2A基因CNV对其表达和预后的影响,为进一步研究CDKN2A相关信号通路在胰腺癌中的作用机制提供新的思路。
癌症基因组图谱(TCGA)数据库里有关胰腺癌数据库的临床资料,cBioPortal是TCGA的一个可视化在线数据库,可以通过在cBioPortal(http://www.cbioportal.org)中“Pancreatic cancer(TCGA,Provisional)186 samples下载临床数据。CNV、mRNA表达RNA Seq V2可在子数据库分析,同时使用GEO等数据库。
分析统计186例胰腺癌样本中包含CDKN2A基因CNV的样本以及未包含CDKN2A基因CNV的样本的各项临床参数,从TCGA等数据库收集胰腺癌数据及其临床资料,研究CDKN2A基因拷贝数缺失患者的临床病理特征,利用TCGA数据库CNV与RNA Seq V2数据分析CDKN2A的CNV与其mRNA的表达水平的相关性。分析CDKN2A基因CNV对GGA2、MTAP、HOXC6、SLC2A1表达的影响。通过比对TCGA数据库及GTEx数据库研究CDKN2A基因在正常人群与胰腺癌患者间的表达差异、CDKN2A基因CNV与胰腺癌患者预后的相关性;使用DAVID在线分析网站,通过对CDKN2A及其共表达基因进行基因集富集分析,得到CDKN2A基因富集通路。
生存分析使用Kaplan-Meier和Log-rank检验,P<0.05为相关结果有差异,且有统计学意义。其它基因表达与CNV的相关性以及共表达蛋白的相关性使用Spearman和Pearson检验,r>0.3认为有统计学相关。功能分析采用Fisher检验,P<0.05为功能富集有统计学差异。
胰腺癌中C D K N 2 A基因C N V情况见图1。CDKN2A基因CNV与mRNA表达呈正相关(Pearson:r=0.102,Spearman:r=0.257)(图2)。随着CDKN2A基因CNV程度增高,其表达也随之升高。
图1 胰腺癌中CDKN2A基因CNV情况Figure 1 CDKN2A gene CNV in pancreatic cancers
图2 CDKN2A基因CNV与其mRNA表达的相关性Figure 2 Correlation of CDKN2A gene CNV to its mRNA expression
将1 8 6例研究样本根据有无C D K N 2 A基因CNV分为变异组与非变异组,结合TCGA数据库RNA Seq V2数据分析CDKN2A基因CNV对GGA2、MTAP、HOXC6、SLC2A1表达的影响,使用Studentt-test检验。与非变异组相比,CDKN2A基因CNV组中HOXC6、SLC2A1 mRNA表达水平明显升高,GGA2、MTAP mRNA表达水平明显降低(均P<0.05)(图3)。通过相关性研究可以发现,CDKN2A基因与MTAP为正相关(Pearson:r=0.42,Spearman:r=0.55,P<0.05),与其他三者相关程度较低(图4)。
图3 变异组与非变异组各基因mRNA表达情况Figure 3 The mRNA expressions of each studied gene in altered group and unaltered group
图4 CDKN2A与各个基因相关性散点图Figure 4 Scatter plots showing correlations of CDKN2A with related genes
通过比对TCGA数据库179例胰腺癌样本及GTEx数据库171例正常胰腺样本发现,CDKN2A基因在胰腺癌肿瘤组织中表达明显高于正常胰腺组织(P<0.05)(图5)。
携带CDKN2A基因CNV的胰腺癌患者的总生存率(OS)明显低于不携带该基因CNV的胰腺癌患者(P=0.0175),CDKN2A基因CNV患者的无瘤生存率也明显低于不携带该基因CNV的患者(P=0.0368)(图6)。
图5 CDKN2A基因在胰腺癌和正常胰腺组织中的表达Figure 5 CDKN2A gene expressions in pancreatic cancer and normal pancreatic tissues
图6 CDKN2A基因CNV与胰腺癌患者预后的相关性Figure 6 Correlation between CDKN2A gene CNV and prognosis in patients with pancreatic cancer
通过对CDKN2A基因相关共表达基因分析发现,CDKN2A基因CNV与一些基因表达水平存在明显的关联(Pearson≥0.3或Spearman≥0.3)(表1)。通过对包括CDKN2A相关表达KEGG功能富集分析发现(表2),这些共表达基因的功能主要集中于一些细胞周期检查点的信号通路。提示CDKN2A相关共表达基因通过细胞周期通路调节肿瘤的发生发展。
表1 CDKN2A基因相关共表达基因分析Table 1 Analysis of the coexpression genes related to CDKN2A gene
表2 CDKN2A的功能基因集富集分析Table 2 Enrichment analysis of CDKN2A functional genes
胰腺癌作为恶性程度较高的消化道肿瘤之一,一旦发现,大多达到进展期,放化疗等综合治疗对患者生存时间的改善甚微,其治疗的首选方案为手术,但长期的临床实践表明,对于胰腺癌单纯手术的治疗效果是有限的[12]。因此,早期发现并诊断胰腺癌成为目前迫在眉睫的问题。通过对胰腺癌基因的调查,发现了以前的基因研究尚不完善[13]。在过去的几十年里,有一些分子标志物被研究出来,作为胰腺癌早期诊断的基因标志物[14]。CA19-9是一种黏蛋白类物质,因为其诊断胰腺癌的敏感性和特异性分别达到80.0%和86.0%,所以被广泛应用于胰腺癌的诊断[15]。但CA19-9还存在一些不足,其在胰腺良性疾病和非胰腺肿瘤患者的检测中也有升高,如在胰腺炎、胆囊炎、胃癌、结直肠癌中等等[16]。而且,尽管CA19-9已经使用几十年,但仍缺乏定量诊断标准[17]。CEA则是一种酸性糖蛋白,可用于胰腺癌的辅助诊断,但是因其在多种癌症,如乳腺癌、消化道肿瘤、肺癌等癌症表达都有所升高,所以特异性并不高[18-21]。CDKN2A基因在许多肿瘤的发生、发展中有着不同的改变,使它对于肿瘤的密切关系与日俱增。胰腺癌患者存在CDKN2A基因突变频率增加的情况[22]。并且胰腺癌中CDKN2A大多数的变异是基因缺失[23],CDKN2A基因主要是通过肿瘤细胞周期抑制剂调控肿瘤进展[24-25]。所以,通过认识、了解这些基因的改变特点,有可能为胰腺癌的早期诊断及治疗提供新的思路和方法。
本研究结果特异性地证实了在胰腺癌中,CDKN2A基因CNV是一种预后较差的因素。利用TCGA数据库CNV、RNA Seq V2数据分析CDKN2A的CNV与其mRNA的表达水平的相关性。CDKN2A基因拷贝数的变异与mRNA表达呈明显正相关(Pearson:r=0.102,Spearman:r=0.257)。表明随着CDKN2A基因CNV程度增高,其mRNA表达也随之升高。结合 TCGA 数据库RNA Seq V2数据分析 CDKN2A基因CNV对GGA2、MTAP、HOXC6、SLC2A1表达的影响。CDKN2A基因CNV组中HOXC6、SLC2A1 mRNA表达水平明显升高。GGA2、MTAP mRNA表达水平明显降低(P<0.05)。而通过相关性研究可以发现,CDKN2A基因与MTAP为明显正相关(Pearson:r=0.42,Spearman:r=0.55,均P<0.05),与其他三者相关程度较低,可以得出CDKN2A很有可能使MTAP表达下降。
CDKN2A基因在肿瘤和正常组织中表达的差异,通过比对TCGA数据库179例肿瘤样本及GTEx数据库171例正常样本发现,CDKN2A基因在胰腺癌肿瘤组织中表达显著高于正常组织。结合TCGA数据库183例样本中基因表达与临床资料分析发现,CDKN2A基因在各临床分期中表达无显著差异。CDKN2A基因CNV水平与OS显著相关(P=0.0175),携带CDKN2A基因CNV的胰腺癌患者预后明显差于不携带该基因CNV的胰腺癌患者。另外CDKN2A基因CNV患者的无瘤生存期显著短于不携带该基因CNV的患者(P=0.0368)。表明CDKN2A变异提示预后不良,患者总生存期和无瘤生存期显著缩短。通过对CDKN2A及其共表达基因KEGG 功能富集分析,发现这些共表达基因的功能主要集中于一些细胞周期的信号通路,提示CDKN2A相关共表达基因通过细胞周期通路调节肿瘤的发生发展。
综上所述,本研究依托TCGA数据库,对胰腺癌患者进行大样本量的数据分析和临床资料对比分析,探讨CDKN2A CNV对患者预后的影响。通过了解基因CNV的程度,可确定CDKN2A基因可作为胰腺癌预后评估的重要分子标志物。