肾透明细胞癌基因拷贝数变异与mRNA差异表达的整合分析

2020-03-31 03:15丁晓飞
医学研究杂志 2020年2期
关键词:拷贝数肾癌变异

朱 进 丁晓飞 周 军 陈 光

肾透明细胞癌是最为常见的肾癌组织学类型,其占比高达80%~86%,且预后明显差于其他肾癌的亚型(如乳头状癌和嫌色细胞癌)[1]。由于肾透明细胞癌的发生率逐年增长,已成为严重危害我国居民健康的疾病之一,故需要对此类肿瘤进行深入研究来提高肾透明细胞癌的治疗效果[2]。本研究通过对肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)数据库的肾透明细胞癌组织样本基因mRNA和拷贝数进行整合分析,挖掘肾透明细胞癌中拷贝数变异的功能,从分子水平推测其对基因表达的影响,为肾透明细胞癌的诊断和治疗提供分子标记和靶点。

资料与方法

1.数据下载及筛选:从TCGA数据库(https://tcga-data.nci.nih.gov/tcga/)下载了肾脏透明细胞癌(kidney renal clear cell carcinoma,KIRC)相关基因的拷贝数和表达数据(皆为level3数据)。对样本进行筛选,仅分析同时具有表达和拷贝数据的癌症样本和具有表达数据的正常样本,数据统计详见表1。

表1 肾脏透明细胞癌样本概况

2.拷贝数变异分析:从TCGA下载Affymetrix SNP 6.0的marker文件,用GISTIC 2.0分析拷贝数变异区域,版本号为GISTIC_2_0_22,拷贝数扩增或缺失的阈值设为0.1,显著性阈值P值设为0.25,其他参数均为默认。

3.差异表达基因数据分析:(1)整理差异表达基因数据:将各个样本中基因表达的原始计数整合成一个矩阵(行为基因,列为样本),然后剔除表达量低的基因。(2)比较癌症和正常样本之间的差异表达基因:用R语言包edgeR对表达矩阵进行归一化处理和差异表达分析,该包采取的是对数表达比率的加权截断均值(trimmed mean of M values,TMM)归一化方法[3,4]。P值用Benjamini-Hochberg (BH)方法校正,差异显著性的筛选阈值为log2 fold-change(logFC)≥2,FDR<0.01。

4.差异表达基因和染色体拷贝数变异整合分析:查看基因拷贝数的扩增和删失与基因表达上调和下调之间的关系,并计算基因拷贝数与基因表达之间的相关系数,P值用BH方法校正。

5.差异表达基因的功能富集分析:利用R包clusterProfiler(Version 3.2.11, http://www.bioconductor.org/packages/release /bioc/html/clusterProfiler.html)对差异表达mRNA数据进行KEGG pathway及GO功能分析,并对差异表达的mRNA做气泡图展示GO和KEGG的P值前15位的分析结果,显著富集的阈值为P<0.01[5,6]。

6.统计学方法:癌症和正常样本之间基因的差异表达利用R软件Limma包的t检验分析,进一步用Benjamini-Hochberg (BH)方法校正P值,差异显著性的筛选阈值为log2 fold-change(logFC)≥2,FDR<0.01。基因拷贝数的扩增和删失,与基因表达上调和下调之间的相关性采用R语言计算Pearson相关系数,同样利用BH方法校正P值,以P<0.05为差异有统计学意义。

结 果

1.肾脏透明细胞癌中显著的拷贝数变异区域:对所有样本的片段数据用GISTIC方法进行分析,525例肾脏透明细胞癌全基因组拷贝数变异状况见图1A,显著扩增和缺失区域分别单独见图1B和图1C。

图1 GISTIC分析结果

2.肾脏透明细胞癌中基因表达差异分析:R语言包分析癌症样本与正常组织间的基因表达差异,一共得到1738个差异表达的基因(differntially expressed genes, DEGs),其中1171个表达上调,567个表达下调。对于这些差异表达基因,笔者做了聚类图(图2),可以看到这些基因能够将癌症和正常样本清晰的分开,分析结果可靠。

3.差异表达基因和染色体拷贝数变异整合分析结果:对上述差异表达基因和染色体拷贝数变异进行整合分析,如图3的韦恩图所示,有30个基因的拷贝数变异和表达变化具有相同的趋势,其中13个癌症中拷贝数增加的基因,其表达也上调;17个癌症中拷贝数降低的基因,其表达也下调。30个拷贝数变化和表达变化一致的基因的结果详见表2。

图2 肾脏透明细胞癌及正常肾脏组织间差异表达基因聚类图蓝色表示正常样本,红色表示癌症样本

图3 差异表达基因和染色体拷贝数变异整合分析的韦恩图

4.差异表达基因的功能富集分析:(1)KEGG通路富集分析差异表达基因:KEGG通路共富集到18条通路(图4),其中显著富集的通路有细胞因子与细胞因子受体的相互作用通路、吞噬体作用通路、自然杀伤细胞介导的细胞毒性作用通路及细胞黏附分子(CAM)作用通路等。(2)GO功能富集分析差异表达基因:GO功能富集分析发现差异表达基因共富集到382条GO生物过程,显著富集的GO生物过程包括细胞活化调节、T细胞聚集、淋巴细胞聚集、白细胞聚集、白细胞活化调节、白细胞与细胞黏附(图5)。

讨 论

肾癌是起源于肾实质泌尿小管上皮系统的恶性肿瘤,全称肾细胞癌,占成人肾脏恶性肿瘤的90%~95%,而肾细胞癌中又以透明细胞癌为主,其占比约为80%~86%。据《卫生统计年鉴》和国家癌症中心发布的《2017年中国肿瘤的现状和趋势》报告显示,我国肾脏肿瘤发生率为3.8/10万,每年新发患者约为6.7万,发生率跃居所有恶性肿瘤的第16位。肾癌在泌尿系统肿瘤相关死亡中已经超过膀胱癌位居第1位,在所有癌症相关致死中居第14位。中国肾癌发生率在过去20年间,以平均每年6.5%的速度增长,速率远高于肾癌高发的发达国家[7, 8]。

肾细胞癌对于化疗和放疗不敏感,手术仍是治疗肾癌的唯一可靠方法,外科手术目前仍是肾癌的首选治疗方法,但由于早期肾癌常无临床症状,约20%~30%肾癌被确诊时既为晚期,另外约有20%~30%的患者在手术后1~2年内出现远处转移[9,10]。目前晚期肾癌的治疗多采用以药物为主的综合治疗,但效果参差不齐,有远处转移的晚期肾癌患者5年总体生存率仅为10%[9,11]。靶向药物治疗是转移性肾癌的一线及二线治疗手段,2005年美国FDA先后批准了索拉非尼、舒尼替尼、替西罗莫司、依维莫司等多种靶向方案用于转移性肾癌的治疗[12,13]。但是由于肾癌发病机制十分复杂,现有靶向药物均普遍存在客观有效率低及改善生存尚有限的问题[14]。因此,揭示肾癌治疗新靶标及发现肾癌早期诊断生物学标志物,仍是肾癌基础与临床研究的重点。

笔者从TCGA肾癌数据库下载525例肾癌及72例正常肾脏样本的拷贝数及mRNA表达数据,并进行整合分析,希望找到差异基因。通过GISTIC对肾癌拷贝数的分析,识别肾癌拷贝数变异区域,其中包含一些公认的致癌基因所在区域,例如MYC、PI3K、NEK9及SOX11等。随后进一步对这些位于变异区域内的基因进行正常和肿瘤两类样本间的比对分析,一共发现30个差异表达基因(P<0.01),其中有13个上调基因(包括PLK2、ADAM6、GRM8、CCL4、HLA-B、HLA-DQA2、BTNL9、KIR2DL4、MLIP、 CDH4、 NLGN1、SLC2A14、GOLGA8B)和17个下调基因(包含CHL1、SIM1、CA8、CALB1、SFRP1、DLGAP2、PHYHIP、ARC、ESRP1、C8orf4、DUSP26、GRHL2、FAM167A、PKHD1L1、MAL2、SLC26A7、FER1L6)。

表2 30个差异表达基因和染色体拷贝数变异相关性分析

Amp&Up.扩增和表达上调;Del&Down.删除和表达下调

图4 差异基因通路富集分析气泡图

图5 差异基因GO富集分析气泡图

虽然在拷贝数变异和mRNA差异表达分析中发现一些公认的致癌或抑癌基因包含在本研究的分析结果中,但是上述30个拷贝数和mRNA表达同向变化的基因在肾癌中相关研究较少。其中ESRP1基因已被证实参与于乳腺癌上皮细胞的间质转化(EMT)过程并影响乳腺癌患者的生存时间,而结直肠癌患者过表达PLK2基因会导致化疗耐药以及较差的预后[15,16]。

杀伤细胞免疫球蛋白样受体2DL4(killer-cell immunoglobulin-like receptor 2DL4,简称KIR2DL4,也称CD158d)在临床肾癌样本中存在明显的基因拷贝数扩增和RNA水平表达上调。同时,其配体——非经典人类白细胞抗原G(human leukocyte antigen - G, HLA-G)在肾癌组织中的表达也明显高于癌旁组织。KIR2DL4为杀伤性细胞免疫球蛋白样受体(killer cell immunoglobulin-like receptor, KIR)基因家族中的一个功能性结构基因,位于人染色体10q13.42,基因全长约10.4kb,其编码蛋白KIR2DL4分子是自然杀伤性(natural killer,NK)细胞受体(NKR)的一种,主要分布在NK细胞膜,由胞外区、跨膜区和胞质区组成[17]。KIR2DL4与经典KIR2D家族抑制性受体不同,其胞内区只含有一个免疫受体酪氨酸抑制基序(immunoreceptor tyrosine-based inhibitory motifs,ITIM),而跨膜区还含有一个带正电荷的精氨酸残基(协同激活性信号的传递)。同时具有胞内“抑制性”ITIM结构域和跨膜区“激活性”精氨酸残基,显示其在特定情况下可发挥抑制性或活化性受体的作用,但也提示该受体调控机制的复杂性[17, 18]。人白细胞抗原G(human leukocyte antigen G, HLA-G)是KIR2DL4的唯一配体,HLA-G在多种肿瘤细胞中呈异常高表达,且其表达水平与患者的不良预后相关,提示HLA-G/KIR2DL4功能轴可能参与肿瘤的免疫逃逸[19,20]。

本研究还对差异表达基因进行了KEGG通路富集分析以及GO功能富集分析,发现以趋化因子/受体(CXCL/CXCR)功能轴为代表的细胞因子/受体相互作用通路及非经典人类白细胞抗原G/杀伤细胞免疫球蛋白样受体2DL4(HLA-G/KIR2DL4)为代表的自然杀伤细胞活性信号通路等在肾透明细胞癌中异常调控。同时发现除VEGF/VEGFR、VHL/HIF、mTOR或PD1/PDL1等信号通路外,趋化因子通路介导的癌细胞迁移、侵袭及NK细胞介导的肿瘤免疫逃逸在肾癌的发生、发展中也发挥重要作用,可能为肾癌靶向治疗新策略。

综上所述,通过对肾脏透明细胞癌基因拷贝数数据和表达数据的整合分析,获取肾癌的致癌或抑癌信息,可为肾癌发生、发展机制研究、早期诊断和治疗提供新的思路。

猜你喜欢
拷贝数肾癌变异
线粒体DNA拷贝数在儿童脑性瘫痪患者中的表达及临床意义
线粒体DNA拷贝数变异机制及疾病预测价值分析
变异危机
变异
胎儿染色体组拷贝数变异与产前超声异常的相关性分析
HBV相关性肝细胞癌组织及癌旁组织PDCD1基因拷贝数差异分析
索拉非尼治疗晚期肾癌期间引发高血压的分析
变异的蚊子
自噬与肾癌
常规超声与超声造影对小肾癌诊断的对比研究