陈慧娟,王 景,王爱琴
( 1.北京工业大学生命科学与生物工程学院,北京 100124;2.北京博奥医学检验所有限公司,北京 101111)
在全世界范围内,肿瘤依旧是发病率和致死率较高的疾病之一。据我国国家癌症中心统计,2015年我国肿瘤新发病例392.9万,发病率为285.83/10万;死亡病例233.8万例,死亡率为170.05/10万[1]。在我国,肿瘤的发病率和死亡率均高于世界平均水平[2],自2010年起肿瘤死亡率高居各类疾病首位[3],已成为危害公众健康的巨大杀手。近年来,随着药物基因组学的快速发展、各种肿瘤驱动基因的发现、各类靶向药物和免疫治疗药物的“井喷式”出现,肿瘤的治疗取得了较大进展,由原来的“一病同治”逐步实现精准化和个体化治疗。基于大规模并行测序技术的高通量测序(next generation sequencing,NGS)具备采用低样本量同时检测多个基因多种基因状态的能力。随着检测速度的加快、测序成本的降低,目前NGS在临床肿瘤患者基因状态的检测中已逐步取代低通量的Sanger测序和中通量的焦磷酸测序。NGS可同时检测多个样本DNA和RNA水平的多种形式的基因突变,包括小片段的插入缺失、点突变、拷贝数突变、基因重排等,可用于指导肿瘤患者治疗药物选择和预后预测,并有助于肿瘤发病机制的研究。本研究采用Ion AmpliSeq Cancer Hotspot Panel V2( life technologies)检测了367例多种类型实体肿瘤中与肿瘤发生、发展及治疗相关的50个基因的近2 800个基因位点的状态,为临床的个体化诊疗提供了依据,并为我国肿瘤患者的发病机理研究累积数据。
367例多种类型实体肿瘤样本均为福尔马林固定石蜡包埋(formalin-fixed,paraffinembedded,FFPE)组织样本与外周血配对样本。所有肿瘤组织样本肿瘤细胞含量≥20%或经人工富集后肿瘤细胞含量≥20%。
1.2.1 DNA提取和定量 所有肿瘤组织均进行苏木精-伊红染色(hematoxylin-eosin,HE)染色,由有资质的病理医生进行肿瘤细胞含量评估。5~10 μm FFPE切片经脱蜡后,若肿瘤细胞含量≥20%,直接采用手术刀片刮取并收集肿瘤细胞于1.5 mL离心管中;若需人工富集样本,比对HE划圈区刮取白片圈内组织收集肿瘤细胞于1.5 mL离心管中;无法进行人工富集或人工富集后肿瘤细胞含量依旧<20%的样本未进行下一步检测。采用TIANamp FFPE DNA Kit [天根生化科技(北京)有限公司,货号DP331]试剂盒提取FFPE组织基因组DNA。采用TIANamp Genomic DNA Kit [天根生化科技(北京)有限公司,货号DP304]试剂盒提取外周血基因组DNA。所有基因组DNA均采用Qubit dsDNA HS试剂盒(美国ThermoFisher Scientific公司)测定DNA浓度,采用Nanodrop 2000分光光度计(美国ThermoFisher Scientific公司)测定纯度,-20 ℃储存备用。
1.2.2 文库构建及测序 采用Ion AmpliSeq Cancer Hotspot Panel V2(美国ThermoFisher Scientific公司)和Ion AmpliSeq library Kit 2.0(美国ThermoFisher Scientific公司)构建文库,所有操作步骤严格按说明书进行。每一样本FFPE组织DNA和外周血DNA均按15 ng总量投入同一批次平行建库。文库采用Agilent 2100生物分析仪(美国Agilent公司)进行文库片段大小判定,合格文库片段范围为111~187 bp(平均为154 bp);采用荧光定量聚合酶链反应(polymerase chain reaction,PCR)测定文库浓度,要求文库浓度>100 pmol/L;文库片段大小或浓度不满足要求的样本,需重新进行文库构建。合格文库根据文库定量结果稀释进行多样本文库混合,经乳液PCR[Ion One Touch 2系统(美国ThermoFisher Scientific公司)和测序模板富集[Ion One Touch ES系统(美国Thermo fisher Scientific公司)],采用BES 4000基因测序仪(北京博奥生物集团)进行测序分析,平均测序深度>2 000×。
1.2.3 生物信息学分析 测序所得的原始数据,采用Torrent Suite V5.2软件(美国ThermoFisher Scientific公司),以人类基因组hg19为参考序列进行序列比对和碱基识别。采用Torrent Variant Caller V5.2软件(美国ThermoFisher Scientific公司)筛选基因突变位点,并通过综合基因组学查看器(intergrative genomics viewer,IGV;美国Broad研究所)进行确认。确定基因突变位点后,通过比对同一样本FFPE组织和外周血突变位点,去除胚系突变和克隆性造血突变位点。
采用SPSS 23.0软件进行统计分析。计数资料以率表示,组间比较采用Pearsonχ2、Fisher's精准检验或连续校正法。以P<0.05为差异有统计学意义。
367例样本中,非小细胞肺癌(non-small cell lung cancer,NSCLC)294例(肺腺癌270例、鳞癌19例、其他5例)、胃肠间质瘤(gastrointestinal stromal tumor,GIST) 32例、结直肠癌28例、胃癌6例、卵巢癌4例、肝癌3例。男性患者190例,女性患者177例,年龄为58(30~86)岁;≥58岁191例,<58岁176例。见表1、表2。
表1 实体肿瘤样本的特征及基因突变情况 例
表2 NSCLC样本特征及基因突变情况 例
在367例肿瘤样本中,235例(64.03%)至少存在1种基因的突变。在存在基因突变的235例样本中,有167例(71.07%)为1种基因突变,有57例(24.26%)为2种基因突变,有10例(4.26%)为3种基因突变,有1例(0.43%)为4种基因突变。在367例肿瘤样本中共检出28种基因的突变,突变例数≥10例的基因有9种,以EGFR基因突变率最高(32.15%,118/367),其次依次为TP53(15.53%,57/367)、K-ras(8.17%,30/367)、c-kit(5.72%,21/367)、腺瘤性结肠息肉病蛋白(adenomatous polyposis coli,APC)(3.00%,11/367)、同源性磷酸酶-张力蛋白(phosphatase and tensin homolog,PTEN)(3.00%,11/367)、B-raf原癌基因丝氨酸/苏氨酸激酶(BRAF-B-Raf proto-oncogene,serine/threonine kinase,B-raf)(2.72%,10/367)、ERBB2(2.72%,10/367)、磷脂酰肌醇-4,5-二磷酸催化激酶3 α亚基(phosphatidylinositol-4,5-bisphosphate 3-kinase catalytic subunit alpha,PIKC3CA)(2.72%,10/367),见图1。TP53突变在被检的多数瘤种中均存在,K-ras突变主要发生在结直肠癌中,而c-kit基因突变主要发生在GIST中。
图1 实体肿瘤基因突变例数
在不同肿瘤中,发生突变的基因和突变率存在较大差异,见图2。在294例NSCLC样本中共检测到23种基因的突变,有62.24%(183/294)的样本至少检出了1个基因的突变。在294例NSCLC样本中基因突变例数≥5例的基因有8种,其中EGFR的突变率最高(40.14%),其次依次为TP53(13.61%)、K-ras(6.12%)、ERBB2(3.40%)、B-raf(3.06%)、PTEN(2.72%)、APC(2.38%)、PIK3CA(1.70%),见图2(a)。EGFR的突变主要集中在外显子19和21,分别占51.69%(61/118)和38.14%(45/118),外显子18、20及其他外显子所占比例较少;EGFR突变类型较多,最为常见的为外显子19的缺失(35.5%,42/118)和L858R(50.00%,59/118)。在检测样本中共发现8种外显子19的缺失,其中以p.E746_A750del最为常见;5例样本存在EGFR2个基因位点的共突变,其突变类型分别为L861Q&G719S、L861Q&G719A、L858R&E709V、L858R&R108K、N771_P772insN&S720F,未检测到T790M与其他基因的共突变。TP53基因以点突变为主,主要集中在外显子5~8上,但未发现某一密码子偏好性;K-ras基因的突变则全部发生于密码子12(94.44%,17/18)或13(5.56%,1/18)上,突变类型分别为p.G12C(33.33%,6/18)、p.G12D(27.78%,5/18)、p.G12V(22.22%,4/18)、p.G12A(11.11%,2/18)和p.G13C(5.56%,1/18);ERBB2的主要突变类型为p.A775_G776insYVMA(60.00%,6/10),其余基因的突变因检测到突变例数较少,无明显规律性。
在GIST中,基因突变率为68.75%(22/32),以c-kit基因的突变为主,突变率为53.13%(17/32)。c-kit基因突变主要集中于外显子11上(64.71%,11/17),以外显子11的点突变和插入缺失为主,其次为PDGFRA的突变(9.38%,3/32),见图2(b)。28例结直肠癌中,23例(82.14%)检出了至少1种基因的突变:K-ras的突变率最高为42.86%(12/28),主要集中于密码子12上,见图2(c);TP53的突变次之为34.38%(11/32),同NSCLC,在结直肠癌中TP53基因以点突变为主,但无某一位点偏好性;PIK3CA的突变主要以p.H1047R和p.E545X为主,而3例APC基因的突变均为exon14的移码突变。在胃癌中检测到2例TP53的点突变。4例卵巢癌样本均检测到基因突变:2例为TP53基因的点突变,1例为c-kit基因exon10上的点突变,1例为PTEN与TP53共突变。3例肝癌样本中检测到1例PTEN突变。
图2 实体肿瘤基因突变图谱
在检测到基因突变的235例样本中,28.97%(68/235)的样本存在2种或2种以上基因的共突变,TP53与其他基因的共突变率最高为57.35%(39/68)。在57例2个基因共突变样本中,有34例(59.65%)为TP53基因与其他基因的共突变,其中79.41%(27/34)为与EGFR-RAS-RAF信号通路的共突变,8.82%(3/34)为与PTEN的共突变;有9例(15.79%)为EGFR基因与APC、KDR、K-ras等基因的共突变;有3例(5.26%)为PTEN分别与ERBB2、SMAD4、CTNNB1的共突变;有3例(5.26%)为K-ras分别与B-raf、PIK3CA、APC的共突变;有2例为c-kit分别与PDGFRA、ABL1的共突变;其余6例为随意2个基因的组合,无规律性。检测到10例3个基因的共突变,其中5例为TP53与其他2个基因共突变,4例为APC与其他基因的共突变,1例为c-kit、PTEN、SMAD4的共突变。还有1例为APC、MLH1、PIK3CA和FBXW7 4个基因的共突变。
分析基因突变与患者性别、年龄之间的关系。结果显示,是否发生基因突变与患者的性别及年龄无关,但≥58岁的患者的TP53突变率明显高于<58岁的患者(P<0.001)。见表1。
因EGFR、ERBB2基因突变仅发生于NSCLC中,故仅统计了这2个基因与NSCLC患者性别、年龄及病理分型之间的关系。结果显示,发现EGFR在女性(P<0.01)、肺腺癌(P<0.001)患者中突变率较高;ERBB2在<58岁患者中突变率较高(P=0.001)。见表2。
从内在因素分析,肿瘤的发生、发展是一系列基因突变共同作用的结果,了解肿瘤的分子图谱能指导肿瘤的精准治疗并预测预后。针对肿瘤分子图谱的大规模研究如肿瘤基因组图谱(the Cancer Genome Atlas,TCGA)、国际癌症基因组联合体(the International Cancer Genome Consortium,ICGC)已明确了多种实体肿瘤的主要驱动基因[4],但这些研究大多为采用NGS平台的全外显子测序(whole exome sequencing,WES)。虽WES在技术上可行,但因其产生的海量数据分析问题及较高的费用问题,依旧是其应用于临床的障碍。针对单个肿瘤患者的检测,基于各种基因组合的高通量靶向测序因其费用低、灵活等优点,目前在临床上应用较为广泛。
在实际应用中,如何精准检出肿瘤特有的体细胞突变对肿瘤患者的治疗及预后至关重要。针对无正常对照配对的肿瘤样本,虽然目前通过一些算法和过滤标准可以区分体细胞突变和胚系突变,但如何从体细胞突变中区分胚系嵌合突变,尤其是针对一些基因如TP53和Mg2+/Mn2+依赖性蛋白磷酸酶1D(protein phosphatase,Mg2+/Mn2+dependent 1D,PPM1D)的突变尚存在较大的困难[5]。另外,造血干细胞会随年龄增长累积克隆性突变。有研究发现,克隆性造血突变具有基因偏向性,绝大多数DNA甲基转移酶3α(DNA methyltransferase 3 alpha,DNMT3A)突变和少数TP53突变为克隆性造血突变,但除采用正常对照样本目前尚无好的方法区分克隆性造血突变和体细胞突变[6]。外周血因其易得、创伤小等成为较好的对照材料,故在本研究中采用肿瘤患者的外周血样本作为配对样本进行检测,用于去除患者本身胚系突变和克隆性造血突变。
在50%~60%的人类肿瘤中均存在TP53基因的突变,在大多数肿瘤中TP53是主要的肿瘤驱动基因。二代测序结果显示,TP53的突变率在绝大多数肿瘤中位于所有基因的前3位。在所有肿瘤中,TP53体细胞突变的总突变率为29%,主要集中于外显子5~8上,以点突变为主,突变位点主要集中于密码子175、220、245、248、273和282上[7]。本研究结果显示,TP53的突变率为15.53%,分布于多种肿瘤中,主要集中于外显子5~8上,以点突变为主但无密码子偏向性;TP53突变多发于年龄较大的患者(≥58岁),提示TP53基因突变与多种肿瘤的发生、发展密切相关。
在NSCLC中,EGFR基因突变是最常见的基因突变,本研究中检测到EGFR基因在NSCLC中的突变率为40.14%,并且在肺腺癌、女性患者中突变率较高,与针对我国NSCLC患者的Meta分析[8]结果一致。本研究检测到EGFR的突变多发生于外显子19和21上,突变类型以exon19缺失和L858R为主,与其他研究报道[9]一致。本研究发现,在NSCLC中ERBB2基因突变在<58岁的患者中较为常见。而MAZIÈRES等[10]的研究结果显示,ERBB2在女性和未吸烟患者中突变率较高,这可能与种族特异性相关。
在实体瘤中,K-ras的突变主要集中于密码子12、13上,其他位点的突变较为少见。本研究在结直肠癌患者中检测到3例密码子p.A146T的突变,而NSCLC中K-ras基因的突变全部集中在密码子12和13上,提示K-ras基因的突变类型可能与肿瘤类型及肿瘤生物学行为相关。作为研究频次较高的原癌基因,K-ras的基因状态不仅能指导酪氨酸激酶抑制剂(tyrosine kinase inhibitor,TKI)类、单抗类等靶向药物的治疗,还可作为免疫节点抑制剂类基因标志物,携带K-ras突变的NSCLC患者可从免疫检查点抑制剂(immune checkpoint inhibitor,ICI)类药物获益[11]。
多基因或多位点的共突变提示肿瘤的生物性质可能会因多基因或多位点的共突变而发生改变,进而影响肿瘤的行为和临床结果。VANDERLAAN等[12]发现,在EGFR阳性的NSCLC中较常见到TP53基因的共突变并且基因的共突变会影响临床结果。LABBÉ等[13]的研究结果显示,存在EGFR、TP53共突变的NSCLC患者对TKI类药物获益较少,无进展生存期也较短。本研究结果也显示,在所有存在共突变的样本中,TP53基因与其他基因的共突变率最高。另外,本研究还发现部分排他性突变的共突变,如EGFR与K-ras、K-ras与B-raf、K-ras与PIK3CA等。目前,肿瘤治疗的主要策略是确定瘤种相关的肿瘤驱动基因,根据其基因突变或蛋白产物状态进行靶向治疗。但基因共突变,尤其是排他性共突变的存在,提示在肿瘤治疗中,尤其是在靶向药物治疗中应考虑多基因、多位点共突变对药物疗效的影响。
与传统检测方法如Sanger测序、突变阻滞扩增系统-聚合酶联反应(amplification refractory mutation system-polymerase chain reaction,ARMS-PCR)等相比,NGS检测的基因突变范围和突变类型更为全面,能为临床提供更全面的信息,使肿瘤治疗更加精准化。本研究采用NGS检测了多种实体肿瘤中基因突变情况,绘制了不同肿瘤的基因突变图谱,检测出了高频率的基因共突变,但未分析与临床结果之间的关系,今后将对此作进一步研究。