基于cBioPortal数据库的TP53突变型和野生型结直肠腺癌的临床病理和基因突变谱差异性研究

2021-06-25 09:01孙耀华王瀚李雪莹杨慧玲白辰光
海军医学杂志 2021年3期
关键词:差异基因外显子基因突变

孙耀华,王瀚,李雪莹,杨慧玲,白辰光

根据中国国家癌症中心于2018年发布的统计数据,结直肠癌(colorectal cancer)在我国的发病率和死亡率分别位居恶性肿瘤的第3位和第5位[1],且表现出城市发病率高于农村、出现低龄化趋势等特点[2],严重威胁人民身体健康。结直肠癌的发生发展是一个多基因参与的多步骤复杂过程,其中抑制癌基因TP53突变是结直肠癌最常见分子事件之一,与肿瘤发生、发展、预后及治疗等各个环节均有明显的相关性[3]。尽管TP53基因突变在结直肠癌致瘤作用已得到广泛证实,但接近半数肿瘤的TP53基因为野生型,TP53基因突变型和野生型结直肠癌之间的差异意义尚未完全明确。为此,本研究采用cBioPortal数据库中的癌症基因组图谱(the cancer genome atlas)公共数据集,在明确2种亚型临床病理特征差异的基础上,进一步分析基因突变谱的差异,为结直肠癌精准分型和靶向治疗提供参考。

1 资料与方法

1.1 数据资料下载 本研究从cBioPortal数据库(http://www.cbioportal.org/)下载TCGA结直肠癌数据资料(GDAC firehose)。该数据资料包括640例结直肠癌样本,其中220例有完整的基因突变信息和对应的临床病理信息。

1.2 TP53基因突变信息和临床病理特征提取 应用Gene选项分析设置“Mutation”为筛选条件,输入查询基因:“TP53”,下载TP53基因突变信息,包括突变类型、外显子分布、蛋白改变等。根据TP53基因突变状态将220例具有完整基因突变信息的肿瘤分为TP53突变型和野生型2种亚型。下载2种亚型肿瘤的临床病理信息,包括年龄、性别、部位、TNM分期、淋巴管侵犯、血管侵犯、肿瘤突变计数(tumor mutation count)和基因组变异片段(fraction genome altered, FGA)等。肿瘤突变计数,即每例肿瘤的突变个数,以192为界值分为高突变负荷和低突变负荷[4]。FGA以5%为界值分为染色体稳定性和染色体不稳定性[5]。

1.3 基因突变谱差异数据提取 应用Gene选项分析设置“Mutation”为筛选条件,输入查询基因,筛选条件为突变频率(该基因在本组所有病例中的突变发生率)≥5%的基因:TP53、APC、KRAS、NRAS、BRAF、LRP1B、FAT4、FBXW7、PIK3CA、SMAD4、ATM、AMER1、RELN、ARID1A、CREBBP、MYH11、ERBB4、GRIN2A、PCLO、LRRK2、LIFR、CHD4、DNMT1、MTOR、MKI67、ROBO1、TRRAP、TET1、EPHA3、POLE、TCF7L2、EP400、ARID2、ACVR1B、ZFHX3、CDH11、ERBB3、LRP6、SMAD2、NOTCH3、PTPRT、RNF213、ALK、EPHA5、FAT1、KMT2A、PIK3CG、PRKD1、PRKDC、ROS1、TPR、KMT2D、SPEN、SETD2、EP300、AFF3、NOTCH2、IRS4、STAG1、MGA、ZNF521、KMT2C、ATR、CTNNA1、CTNNB1、ESR1、FLT1、MYH9、PDGFRA、PTPRC、PTPRD、RANBP2、MAP2K4、VAV1、KAT6A、KMT2B、MED12、GPHN、LARP4B、SETBP1、RNF43、PREX2。病例选择“samples with mutation and CNA data (220)”。下载TP53突变型和野生型2种亚型结肠癌的基因突变数据。

1.4 差异基因蛋白的相互作用及生物功能及信号通路分析 采用String(https://string-db.org/)在线工具分析差异基因蛋白的相互作用,物种属性设置为“homo sapiens”,灰色连线代表蛋白相互作用的强度,连线越粗代表相互作用越强。预测信息来自实验、数据库、共表达、相邻基因和共存。聚类分析采用Kmeans clustering分析,将差异基因蛋白分为3个亚簇。采用Funrich软件进行基因本体(gene ontology,GO)功能注释以及京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,标注基因数排列在前10位的项目。

1.5 统计学处理 采用Graphd软件进行统计分析,计数资料以百分比表示,组间比较采用χ2检验及Fisher精确检验。P<0.05表示差异有统计学意义。

2 结果

2.1 220例结直肠癌患者的临床病理和基因突变特征 220例结直肠癌患者年龄为(69.09±11.71)岁,其中男性114例(51.8%),女性106例(48.2%)。77例(35.0%)肿瘤位于右半结肠、76例(34.5%)肿瘤位于左半结肠、65例(29.5%)肿瘤位于直肠,另有2例结肠肿瘤未明确标注具体位置。基因突变分析表明排在前10位的突变基因分别是APC(160/220, 72.7%)、TP53(120/220, 54.5%)、KRAS(96/220, 46.6%)、LRP1B(42/220, 19.1%)、FAT4(39/220, 17.7%)、FBXW7(39/220, 17.7%)、SMAD4(33/220, 15.0%)、PIK3CA(32/220, 14.5%)、ATM(27/220, 12.3%)、AMER1(26/220, 11.8%)。

2.2 结直肠癌TP53基因突变类型及外显子分布特征 120例结直肠癌存在TP53基因突变,突变率为54.5%。TP53基因突变类型为缺失突变82例(68%),无义突变20例(17%)、移码缺失突变10例(8%)、移码插入突变6例(5%)、剪切突变1例(0.8%)、框内缺失1例(0.8%)。除1例未标注外,119例TP53突变型结肠癌的TP53基因突变分布分别位于外显子3(1/120, 0.8%)、外显子4(10/120, 8%)、外显子5(35/120, 29%)、外显子6(15/120, 12.5%)、外显子7(21/120, 17.5%)、外显子8(28/120, 23.3%)、外显子9(5/120, 4%)、外显子10(4/120, 3%)。

2.3 TP53突变型和野生型结直肠癌患者的临床病理特征分析 根据TP53突变状态,将220例结直肠癌分为TP53突变型(120例)和野生型(100例)2种亚型。2种亚型患者的临床理特征相关性分析结果显示,TP53基因突变多发于左半结肠和直肠(P<0.05)。TP53突变型结直肠癌中,FGA≥5%的例数显著增多(P<0.01),而高突变负荷的肿瘤比例显著减少(P<0.01)。2组肿瘤在年龄、性别、TNM分期、淋巴管和血管侵犯方面均无统计学差异(P>0.05)。见表1。

2.4 TP53突变型和野生型结直肠癌的基因突变谱分析 进一步比较TP53突变型和野生型结直肠癌的基因突变谱差异,选用突变例数≥10例的基因,共81个,其中突变率≥10%的基因突变瀑布图和热图见图1。如表2所示,包括APC、KRAS、NRAS、SMAD4在内的56个基因在2种亚型结直肠癌中的突变率无明显差异。但是,基因LRP1B、FAT4、FBXW7、PIK3CA、ATM、RELN、CREBBP、ROBO1、BRAF、AMER1、MYH11、POLE、ZFHX3、SETD2、TET1、EP400、NOTCH3、RNF43、PTPRC、LARP4B、PDGFRA、MAP2K4、KMT2A、EP300、VAV1在TP53野生型结直肠癌中的突变率明显增高,与TP53突变型结直肠癌相比,差异有统计学意义(P<0.05)。

2.5 差异基因蛋白的相互作用及生物功能及信号通路分析 采用String在线工具分析差异基因表达蛋白之间的交互作用,并做kmeans聚类分析。差异基因蛋白相互作用网络中共有25个节点,50条边,kmeans聚类分析将差异基因蛋白分为3个亚簇。其中21个蛋白之间存在直接或间接作用,EP300、KMT2A、CREBBP、NOTCH之间存在紧密连接;另外BRAF、PIK3CA、PDGFRA、VAV1之间存在紧密连接,见图2。采用Funrich软件进行GO功能注释和KEGG通路富集分析差异基因。在TP53野生型结直肠癌中,分子功能富集到17项,主要与DNA结合、转录调控、细胞粘附及蛋白激酶和受体活性等相关。细胞位置富集到25项,差异基因主要位于细胞核,其次是细胞浆。参与的生物过程富集到7项,主要与信号转导、细胞交流、调控细胞增生和生长相关。KEGG通路富集到334条通路,排在前位生物过程的主要与PDGFR、EGFR、VEGFR、PI3K信号通路等相关。

图2 结直肠癌突变率差异基因表达蛋白之间的交互作用及聚类分析

3 讨论

结直肠癌的发生发展是一个多基因参与的多阶段复杂过程,包括抑癌基因的失活、癌基因的激活以及各种信号转导通路的异常等。在本组数据中,220例结直肠癌就存在上百个基因发生突变。野生型TP53是重要的抑癌基因,其能通过多种机制抑制细胞分裂和增殖、促进细胞衰老和凋亡等,从而发挥着肿瘤抑制作用[6]。经过多年的研究,TP53基因在恶性肿瘤中的作用受到越来越多的重视,现已证实在所有恶性肿瘤中,50%以上会出现该基因的突变[7]。在本组数据中,TP53的突变率为54.5%,突变位点主要位于外显子5和8,与文献报导一致[8]。

通过比对TP53突变型和野生型结直肠癌患者的临床病理特征,本研究数据提示TP53突变型结直肠癌好发于左半结肠及直肠,而TP53野生型结直肠癌则好发于右半结肠。有研究表明左半结肠和右半结肠的胚胎起源不同,解剖生理各异,这提示尽管临床病理表现一致,来自左半结肠和右半结肠的结直肠癌发病的分子机制有所不同[9-10]。目前研究显示,左半结肠癌与抑癌基因(例如APC、TP53、SMAD4等)的失活,KRAS基因突变以及CpG岛甲基化表型相关;而右半结肠癌则与癌基因的激活、BRAF基因突变、MLH1基因的甲基化失活、肿瘤微卫星不稳定相关。本研究也提示,发生于左半结肠和直肠的肠癌病例抑癌基因TP53 突变率明显高于发生于右半结肠的病例。

本研究发现TP53突变型结直肠癌中FGA≥5%的肿瘤例数显著增高,这表明TP53突变型结直肠癌更容易产生染色体不稳定性。染色体不稳定性是癌症的标志之一,它是由于有丝分裂过程中染色体分离持续出现错误而所致。当前,越来越多的数据表明TP53突变与染色体不稳定性密切相关[11],携带TP53基因突变的肿瘤细胞多为非整倍体(aneuploid)。其中重要的机制就是,野生型p53蛋白可诱导出现异常有丝分裂细胞凋亡坏死,进而限制染色体不稳定性的产生;而TP53基因突变所导致的p53蛋白功能丧失,则增加染色体不稳定性[12-13]。

此外,分析数据表明TP53野生型结直肠癌中高突变负荷肿瘤数目显著高于TP53突变型结直肠癌,与Cai等[14]在胃癌中的研究结果相一致。近年来,越来越多的研究表明突变负荷会影响肿瘤免疫原性。高突变负荷肿瘤中含有大量记忆CD4+T细胞、活化的CD4+和CD8+T细胞等免疫细胞,因而其对免疫检查点抑制剂治疗(如PD-1/PD-L1、CTLA-4等)更为有效[15]。2017年,Colli等[4]学者的研究进一步提示,以肿瘤突变个数192为界值,可以更好地筛选免疫检查点抑制剂受益患者。以上结果在另一方面也提示,TP53野生型结直肠癌患者中免疫检查点抑制剂受益患者要多于TP53突变型结直肠癌患者。

笔者进一步比对TP53突变型和野生型结直肠癌患者的基因突变谱差异,共筛选出25个基因更好发于TP53野生型结直肠癌。基于String分析构建差异基因蛋白间的相互作用网络发现有21个差异基因蛋白之间存在直接或间接作用。GO注释和KEGG分析表明筛选出的25个差异基因主要发挥着DNA结合、转录调控等分子功能,并主要富集在PDGFR、EGFR、VEGFR、PI3K等信号通路,提示TP53野生型结直肠癌通过新的基因突变、激活以上通路促进肿瘤生长和进展。

综上所述,虽然除发生部位外,TP53突变型和野生型结直肠癌存在相似的临床病理形态学特征,但是2种亚型肿瘤的基因突变谱不同。TP53突变型结直肠癌更容易发生染色体不稳定性;而TP53野生型结直肠癌突变负荷增高,其可通过产生新的基因突变,激活非p53信号通路促进肿瘤生长。

猜你喜欢
差异基因外显子基因突变
肌营养不良蛋白基因检测的评价
基因突变的“新物种”
“基因突变和基因重组”复习导航
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
人类组成型和可变外显子的密码子偏性及聚类分析
SSH技术在丝状真菌功能基因筛选中的应用