张柏林 宋丰举
乳腺癌是全球女性发病和死亡占第1位的恶性肿瘤[1]。一般认为,乳腺癌的发病是基因与环境共同作用的结果。体细胞突变是乳腺癌发生的必然途径。体细胞突变分为遗传性突变和获得性突变。前者不是癌症发生所必需的,而后者则由环境暴露刺激形成,在体内逐渐累积,最终引发癌症[2]。因此,研究肿瘤体细胞突变谱对于明确癌症的成因和进展过程有重要意义。二代测序技术的出现加速了癌症基因组学研究的进程,乳腺癌的基因组学研究也随之取得了突破性进展[3]。二代测序技术在肿瘤基因组学研究中的应用可以归纳为4个方面:1)发现新的突变基因和通路;2)识别特异性突变签名;3)探索肿瘤的克隆进化;4)促进个体化医学发展[4]。本文就二代测序技术在乳腺癌基因组学中的研究成果进行综述。
在基因组变异与乳腺癌风险的关联程度中,乳腺癌相关变异可分为常见低风险变异(5%~20%风险)、低频中等风险变异(2~3倍风险)和罕见高风险变异(可达10倍风险)[5]。以往的关联研究多集中在高频率(>5%)的SNP位点,在大量开展全基因组关联研究(GWAS)之后,“常见疾病-常见变异”的理论受到了极大的挑战。因GWAS发现的癌症相关SNP位点只能解释5%~10%的癌症病因,而大部分病因很可能归于大量的罕见变异的作用[5-6]。因此,“常见疾病-罕见变异”的假说产生。在罕见变异中寻找病因是更大的挑战,检测低频变异需要更大的样本量,更专业的技术平台和更庞大的数据分析工作。在大量的低频体细胞突变中,只有小部分是对癌症发生有直接作用的“驾驶员”突变,而大部分只是“乘客”突变[7]。只有在大量突变中去伪存真,找到真正的驾驶员突变才能确定病因,以这些可操作突变为依据指导临床开发出有效的个体化治疗手段。
近期开展的乳腺癌二代测序技术报道了乳腺癌相关体细胞突变谱。Shah等[8]分别在80和65例三阴乳腺癌(雌激素受体、孕激素受体和Her-2受体均不表达)患者中进行RNA和DNA测序。Ellis等[9]对77例雌激素受体阳性乳腺癌患者进行DNA测序(46例全基因组测序和31例外显子组测序)。另有研究分别对100和108例各种类型乳腺癌进行DNA测序,前者全部是全基因组测序,后者包括17例全基因组与外显子组测序、5例全基因组测序以及86例外显子组测序[10-11]。该研究常见的体细胞突变基因(>10%)较少,只有TP53、PTEN和PIK3CA等,而大量存在的是低频散发突变,包括TBX3、RUNX1、CBFB、AFF2、PIK3R1、PTPN22、PTPRD、NF1、SF3B1和CCND3等。这些突变单个作用有限,一般可归纳为特定的通路。某些突变具有互斥性特点,即两种突变一般不会同时发生,如TP53和PIK3CA,前者倾向于发生在ER阴性患者,而后者多发生在ER阳性患者。一些突变可能与抗癌治疗的反应和耐药有关,Ellis等[9]认为GATA3突变可能与芳香酶抑制剂治疗抑制增殖作用有关。但在一些类型的乳腺癌中无明显的驾驶员突变,说明可能有不同的机制驱动这些肿瘤的发生,如DNA甲基化等。
通路反映了体细胞突变的共同作用。在乳腺癌中目前共总结了19个相关通路,主要包括PI3K/AKT信号通路、JUN/MAPK通路、凋亡通路、细胞周期通路、TP53信号通路、Wnt信号通路、黏着斑通路、JAK/STAT信号通路、ERBB信号通路和VEGF信号通路等[12]。其中,PI3K/AKT信号通路和JUN/MAPK通路被认为是最重要的2个通路。突变在某些通路的富集说明尽管肿瘤具有遗传学差异,但由于共同通路的突变而在表型上具有相似性,对治疗非常重要。总之,突变基因和通路的发现增加了对乳腺癌及其驱动事件的认知。此外,应该开展功能分析作为癌症基因组结构分析的补充,以证实这些发现的生物学意义。
乳腺癌的发生和发展是多基因、多阶段的过程,也是体细胞突变的积累过程,而不同的突变过程都会在基因组内留下痕迹,即突变签名(mutational signature)[13]。识别癌症的体细胞突变签名有助于加深对癌症生物学的认识。癌症基因组中的体细胞突变可能来源于多个方面,如DNA修复机制的轻度失真、内源性或外源性突变原的暴露、酶促DNA修饰或DNA修复缺陷等。不同的肿瘤具有各自特征性的突变签名,有些突变签名反映了环境因素的作用,如吸烟或导致皮肤癌的紫外线照射等[14]。有些突变签名则反映了DNA维护异常,如某些大肠癌中发现的DNA错配修复异常等[15]。通过二代测序分析可以全面揭示遗传与环境变化在癌症基因组内留下的签名。
乳腺癌基因组的碱基突变率低于其他常见成人恶性肿瘤,每1 000个碱基约有1个突变。黑色素瘤和肺鳞状细胞癌的突变频率最高,为乳腺癌的10倍。高频率的突变可能反映了环境因素,如紫外线照射和吸烟等在这2种癌中的作用。在目前确定的全部21种肿瘤突变签名中,各种肿瘤基因组携带的突变签名从2种到6种不等,乳腺癌中目前确定的突变签名主要有5种[13]。这些突变签名有的与年龄有关,如最常见的签名1B,发生在60%的肿瘤样本中;有的签名(如签名3)与BRCA1/2突变有关,是典型的乳腺癌特异性签名,只出现在乳腺癌、卵巢癌等少数几种肿瘤中;另外有2个签名(签名2和签名13)与APOBEC有关,其中签名2发生频率为15%,主要特征是TpCpG三核苷酸序列上的C>T和C>G突变,与APOBEC胞苷脱氨酶家族成员的过度活性有关,在碱基切除修复和DNA复制机制的共同作用下,使胞嘧啶转换成尿嘧啶。乳腺癌相关签名8仅发生在约2%的肿瘤样本中,其发生机制尚不清楚[13]。在乳腺癌特征性的突变签名中,并无与环境暴露明确相关的签名,这与宏观流行病学发现基本一致。
此外,二代测序技术还发现了2种新的突变签名,即雷雨(kataegis)[16]和染色体破碎(chromothripsis)[17]。雷雨是指与结构变异共存的体细胞单核苷酸变异集群。染色体破碎是指由单个的染色体破碎重组事件导致的复杂的体细胞结构变异,特征是拷贝数波动和染色体局部大量重排。研究者在乳腺癌14号染色体区域发现密集(多于50个突变)雷雨签名[13],反映了该区域基因组重排的特征。
乳腺癌二代测序研究中最意外的发现是每个肿瘤样本的测序结果均不重复,突变谱差异极大,这种个性化的结果被称为肿瘤的异质性[18]。肿瘤异质性包括瘤间异质性和瘤内异质性。前者反映出每个肿瘤都有一个属于自己的突变通路;而瘤内异质性反映的是多克隆的存在,并非瘤内所有细胞都发生了相同的突变。异质性的存在反映了肿瘤研究的复杂性及个体化肿瘤治疗的必要性。瘤内异质性的形成有几种假说模型:1)细胞起源模型,即突变起源于不同细胞,因而具有异质性。2)遗传模型,即同一细胞起源,不同初始事件促成肿瘤发生,因而形成异质性。3)混合模型,即不同细胞起源和不同初始事件引起肿瘤发生[19]。
Nik-Zainal等[16]应用二代测序技术绘制了21例乳腺癌患者的亚克隆结构。这项研究发现了重要的信息。首先,在所有研究病例中,既发现了克隆突变,也发现了亚克隆突变,即突变在全部或一部分肿瘤细胞中出现。有趣的是,克隆突变在癌症发生的早期出现,包含多种癌症基因的突变,如PIK3CA、p53、Her-2、MYC及CCDN1扩增以及遗传性乳腺癌BRCA1和BRCA2野生型等位基因的缺失。奇怪的是,尽管很多癌症基因的突变都是克隆突变,仍然有大量的亚克隆突变存在。事实上,对于多数病例,观察到的亚克隆突变数量多于克隆突变数量。其次,在所有肿瘤中均有一个优势克隆占肿瘤细胞的50%~95%。该作者推测优势克隆的扩张引发了肿瘤的诊断。最后,该研究发现了区分早发和迟发突变的不同突变签名。早发突变C>T比例高。同时发现了一个与遗传性乳腺癌相关的突变签名。然而,Shah等[8]检测了三阴乳腺癌患者的克隆异质性,并证实在克隆频率方面肿瘤变异存在的差异。一些肿瘤中有较少的亚克隆,而另外其他肿瘤中却有10个以上的亚克隆,与上述的观察结果不同。尽管p53,PIK3CA和PTEN等癌症基因突变在多数样本中均构成最大克隆,但这些突变均不是发生在所有肿瘤细胞的完全克隆。总之,这些研究显示了乳腺癌持续的遗传进化和克隆扩增的动态。瘤内异质性在抗癌治疗和耐药以及转移进展方面的研究正在进行中,在不远的将来将会获得具有生物学和临床双重意义的信息。
乳腺癌个体化治疗有赖于更科学实用的分型,进而针对分型开展有效的临床工作。乳腺癌的分型经历了不同的阶段,最初是依据形态学的病理分型,70%为浸润性导管癌,因同种类型的治疗效果和预后差异较大[20],这种分型对临床指导意义不大。此后发展为表达分型,即以ER、PR和Her-2受体的表达水平为依据分为管状A/B型(Luminal A/B)、基底样癌(basal-like)、正常样癌(normal-like)和Her-2过表达等类型[21],这种分型有效地指导了临床治疗实践。在基因组学时代,技术的发展将会带来更为精细化的乳腺癌分子分型,即基于基因组学信息的乳腺癌分子分型,这将有力的推动乳腺癌的研究,极大加深对乳腺癌的认识,更有效的指导乳腺癌的临床实践。
二代测序技术在乳腺癌个体化医学中的应用已初现端倪。2011年美国癌症研究会(AACR)年会首次报道了二代测序技术在乳腺癌临床试验中的应用。研究者对来自2项临床试验的50例ER阳性乳腺癌患者进行全基因组测序,其中26例患者对芳香酶抑制剂敏感、24例耐药。并发现芳香酶抑制剂耐药患者的突变数量显著高于敏感患者。突变负荷可能是判断治疗效果的重要指标[22]。此外另有研究还发现,对MAK3P1突变的ER阳性乳腺癌患者芳香酶抑制剂可能是一种有效的治疗方法,而TP53突变患者则通常对芳香酶抑制剂耐药,应该选择其他治疗方式[9]。在另外一项研究中,对三阴乳腺癌转移患者开展二代测序,发现全部14例患者中均存在激活MAPK通路和PI3K/AKT通路的突变。基于这项发现,研究者建立了一项新的Ⅰ期临床试验,对患者开展MEK联合AKT抑制剂治疗[23]。尽管这些研究只是二代测序在临床试验中应用的开端,但成功的经验将对后续大规模临床研究具有指导意义。二代测序临床应用的真正意义在于能够通过测序获得患者基因组和转录组信息,选择适合于患者的治疗手段。随着二代测序速度逐渐加快,成本逐渐降低,大规模临床应用正在逐渐成为现实[22]。
近期开展的二代测序研究较为全面系统地检测了乳腺癌基因组,推进了对乳腺癌发生发展的认识。研究发现了新的突变基因和通路,总结了突变签名和克隆进化,并对乳腺癌个体化医学进行了初步的探索。二代测序开启了乳腺癌基因组学研究的新篇章,未来的研究可以着力增大研究样本,开展多中心联合研究,开展比较基因组学研究,如不同肿瘤类型间的比较,原发癌与转移癌的比较等。进行组学分析与功能实验相结合,如在模式生物中研究特定环境暴露引发突变谱等,开发更强有力的数据分析系统,以应对海量测序数据,挖掘更有价值的信息。
1 Parkin DM,Bray F,Ferlay J,et al.Global cancer statistics,2002[J].CA Cancer J Clin,2005,55(2):74-108.
2 Watson IR,Takahashi K,Futreal PA,et al.Emerging patterns of somatic mutations in cancer[J].Nat Rev Genet,2013,14(10):703-718.
3 Cancer Genome Atlas Network.Comprehensive molecular portraits of human breast tumours[J].Nature,2012,490(7418):61-70.
4 Mwenifumbo JC,Marra MA.Cancer genome-sequencing study design[J].Nat Rev Genet,2013,14(5):321-332.
5 Hilbers FS,Vreeswijk MP,van Asperen CJ,et al.The impact of next generation sequencing on the analysis of breast cancer susceptibility:a role for extremely rare genetic variation[J]?Clin Genet,2013,84(5):407-414.
6 Sharma M,Krüger R,Gasser T.From genome-wide association studies to next-generation sequencing:lessons from the past and planning for the future[J].JAMA Neurol,2013[Epub ahead of print].
7 Koboldt DC,Steinberg KM,Larson DE,et al.The next-generation sequencing revolution and its impact on genomics[J].Cell,2013,155(1):27-38.
8 Shah SP,Roth A,Goya R,et al.The clonal and mutational evolution spectrum of primary triple-negative breast cancers[J].Nature,2012,486(7403):395-399.
9 Ellis MJ,Ding L,Shen D,et al.Whole-genome analysis informs breast cancer response to aromatase inhibition[J].Nature,2012,486(7403):353-360.
10 Stephens PJ,Tarpey PS,Davies H,et al.The landscape of cancer genes and mutational processes in breast cancer[J].Nature,2012,486(7403):400-404.
11 Banerji S,Cibulskis K,Rangel-Escareno C,et al.Sequence analysis of mutations and translocations across breast cancer subtypes[J].Nature,2012,486(7403):405-409.
12 Guille A,Chaffanet M,Birnbaum D.Signaling pathway switch in breast cancer[J].Cancer Cell Int,2013,13(1):66.
13 Alexandrov LB,Nik-Zainal S,Wedge DC,et al.Signatures of mutational processes in human cancer[J].Nature,2013,500(7463):415-421.
14 Pfeifer GP.Environmental exposures and mutational patterns of cancer genomes[J].Genome Med,2010,2(8):54.
15 Peña-Diaz J,Bregenhorn S,Ghodgaonkar M,et al.Noncanonical mismatch repair as a source of genomic instability in human cells[J].Mol Cell,2012,47(5):669-680.
16 Nik-Zainal S,Alexandrov LB,Wedge DC,et al.Mutational processes molding the genomes of 21 breast cancers[J].Cell,2012,149(5):979-993.
17 Stephens PJ,Greenman CD,Fu B,et al.Massive genomic rearrangement acquired in a single catastrophic event during cancer development[J].Cell,2011,144(1):27-40.
18 Russnes HG,Navin N,Hicks J,et al.Insight into the heterogeneity of breast cancer through next-generation sequencing[J].J Clin Invest,2011,121(10):3810-3818.
19 Visvader JE.Cells of origin in cancer[J].Nature,2011,469(7330):314-322.
20 Weigelt B,Reis-Filho JS.Histological and molecular types of breast cancer:is there a unifying taxonomy[J]?Nat Rev Clin Oncol,2009,6(12):718-730.
21 Perou CM,Sørlie T,Eisen MB,et al.Molecular portraits of human breast tumours[J].Nature,2000,406(6797):747-752.
22 Radovich M.Next-generation sequencing in breast cancer:translational science and clinical integration[J].Pharmacogenomics,2012,13(6):637-639.
23 Craig DW,O'Shaughnessy JA,Kiefer JA,et al.Genome and transcriptome sequencing in prospective metastatic triple-negative breast cancer uncovers therapeutic vulnerabilities[J].Mol Cancer Ther,2013,12(1):104-116.