全外显子组测序技术及其在肿瘤研究中的应用

2011-01-24 02:13陈怡然吴小华
中国肿瘤外科杂志 2011年3期
关键词:癌基因外显子基因组

陈怡然, 吴小华

随着2002年人类基因组计划的完成,以及其他种类生物全基因组图谱的陆续描绘,发现不同种群间的基因差别仅为1%,主要表现为外显子的差异。外显子作为蛋白质的编码区,是DNA中的重要功能序列,其仅占人类基因组约1%[1],但涵盖了与个体表型相关的大部分功能性变异,与人类约85%的导致疾病的基因突变相关[2]。全外显子组(exome)为人类基因组全部外显子区域的总称,全外显子组测序(whole-exome sequencing)又称为定向外显子组捕获(targeted exome capture),可选择性的对人类基因组的编码区进行测序,从而发现罕见及常见疾病相关的异常基因[3]。目前,全外显子组测序相比于全基因组测序,其低成本、高效率的优势日益显著。在单基因疾病的应用中,其不仅加快单基因缺陷疾病的基因确定,在系统地预测疾病相关基因方面亦有应用。对于复杂疾病如肿瘤、糖尿病等的致病基因和易感基因的测定等[4]也有相当的应用前景。本文主要对全外显子组测序技术以及目前该技术在肿瘤研究中的应用等问题进行阐述。

1 全外显子组测序技术

全外显子组测序技术作为一种新型的基因组分析技术,包括全外显子组序列捕获及测序。

1.1 全外显子组序列捕获

以两种较成熟的方法为例。

1.1.1NimbleGen外显子序列捕获芯片法基因组DNA被随机打断成片段,随后在DNA片段两端分别连上接头,与定制的序列捕获芯片杂交,去除未与芯片结合的背景DNA,将经过富集的外显子区域的DNA洗脱并扩增。

1.1.2In-Solution 捕获法所要求的基因起始量低,能有效地捕获包含未知突变的DNA。具体步骤[5]:(1)基因组DNA被打断,并组装成测序平台特异的文库形式。在捕获之前,对文库的大小进行选择,并利用电泳等方法来进行验证。(2)精选大小的文库,随后与诱饵共同孵育24 h。(3)加入链酶亲和素标记的磁珠,并通过强磁铁从混合物中钓出RNA诱饵-DNA杂合体。(4)洗脱磁珠,将RNA诱饵降解,将得到的目的DNA进行常规的扩增和测序。

以上方法主要通过捕获芯片或溶液型目标富集系统完成。捕获芯片作为定向测序的快速有效的方法,更适用于小型化研究,而溶液型则适用于样品数量上千的大规模高通量测序研究。

1.2 全外显子组测序

目前应用的主要测序平台有:Roche454,Illumina Genome Analyzer Ⅱ,Applied Biosystems SOLiD。

图1 In-Solution法捕获外显子组流程[5]

1.2.1Roche454即大规模并行焦磷酸合成测序法,采用GS FLX系统:每个磁珠通过接头,与一条大小为300~800bp的DNA片段结合构成样品文库。包含磁珠和扩增试剂的水溶液注入矿物油中,形成油包水的乳浊液结构,乳浊液PCR在每个小水滴中独立进行,产生几百万相同的拷贝,焦磷酸测序反应测得每个磁珠上的片段产生一条读长,由此进行数据分析[6]。

1.2.2Applied Biosystems SOLiD即基于磁珠的大规模并行克隆连接DNA测序法,采用SOLD系统:利用微珠通过接头捕获DNA片段,之后进行乳液PCR。其以连接反应取代传统的聚合酶延伸反应,以8bp的探针作为连接反应的底物,探针设计为将3′端1~2位的碱基与5′端标记的荧光信号的颜色相对应。一次SOLiD测序共为五轮循环测序,每轮由多个连接反应组成。五轮测序完成后,可得到各位置的颜色信息,从而推断出相应的碱基序列[7]。

1.2.3Illum ina Genome Analyzer Ⅱ即合成测序法,采用GA Ⅱ系统。单链的DNA片段两端通过接通固定到芯片表面,形成桥结构,之后以寡核苷酸为引物进行PCR扩增,得到单克隆DNA族群。测序中,利用“可逆终止子”,使得每个测序循环只掺入单个碱基,获得各位置单个碱基的信息后,将反应试剂洗脱,加入新的反应体系,开始下一测序循环[8]。

新一代的测序平台,与传统测序技术相比,利用接头构建基因文库,在反应基质上进行大规模的并行PCR,实现了边合成边测序的可能性。

不可否认的是,全外显子测序技术作为一种新型技术,目前其对于全基因组蛋白质编码区的覆盖并不如设计的理想,Jacobs等[9]评估后发现,NimbleGen的捕获探针捕获蛋白质编码序列碱基率为77%,Agilent为83%,并且不同方法的测序亦均有一定程度的缺失。故目前对于该新型技术的应用,尤其是对于实验阴性结果的解释,仍需谨慎为之。

2 全外显子组测序技术在肿瘤学方面的应用现状

2.1 找寻潜在癌基因及抑癌基因,为肿瘤的分子诊断提供参考

全外显子组测序技术由于对外显子的高覆盖而获得大量的基因样本。故即使在样本中肿瘤细胞含量较少和(或)样本纯度差异较大的情况下,其仍可较好的对外显子区域的基因突变进行测定,从而进一步确定肿瘤相关癌基因及抑癌基因,为肿瘤的早期诊断提供依据[10]。

Wei等[11]对14位配对的正常人及转移黑素瘤患者进行比较研究,发现TRRAP频发突变具有致癌功能;患者GRIN2A突变频率达33%;突变均发生在谷氨酸信号通路的编码区域,通过该信号通路的修饰达到抑制肿瘤生长成为潜在的治疗手段。类似地,Varela等[12]在对7例肾透明细胞癌患者的研究中,发现SWI/SNF染色质重组复合体基因PBRM1作为该肿瘤的第二大癌基因,在患者组截断突变率达41%。Jones等[13]通过对42例卵巢透明细胞癌患者的肿瘤和正常细胞的对比分析,筛选得到4个基因,PIK3CA编码磷脂酰肌醇-3激酶亚单位,KRAS与已知癌基因产物相关。PPP2R1A编码丝氨酸-苏氨酸磷酸酶2的调控亚单位,功能类似癌基因。ARID1A作为肿瘤抑制基因编码产物参与染色体重构,并且其在42例患者中突变率达到57%。Parsons等[14]在儿童髓母细胞瘤的研究中,发现16%的髓母细胞瘤的患者中存在着组蛋白-赖氨酸-N甲基转移酶基因MLL2或MLL3的钝化突变。该研究同时揭示了儿童及成人髓母细胞瘤的遗传景观上的关键差异。

相比于散发而言,家族性肿瘤的遗传倾向常更明显,故全面的、无偏倚的蛋白质编码区的基因测序成为确定相关责任基因的一种可行方法。Jones等[15]对家族性胰腺癌进行测定,发现该家系的3个独立的截断突变,确立了PALB2为家族性胰腺癌的易感基因。Goldin等[16]在对肿瘤易感家族的研究中,对3个黑色素瘤及2个霍杰金淋巴瘤的家族以及各家族1名远亲对比进行全外显子组的测序,发现每个家族可以获得0~100不等的候选非同义突变。通过追踪,对各家族其他成员进行基因分析,使得筛选该肿瘤的家族易感基因成为可能。

2.2 协助肿瘤分型

某些特定肿瘤的基因分型,对之后的治疗方案、靶向药物的选择和治疗结局等都有一定的指示作用,故利用适当的基因测序技术,对其进行个体化分型,成为未来肿瘤治疗的一大趋势。Timmermann等[17]发现,由于全外显子组测序可以平行探测微卫星不稳定性(microsatellite instability,MSI) 结直肠癌的频发突变,潜在错配修复(mismatch repair, MMR)机制的缺失甚至对结直肠癌亚型的高频突变如BRAF、KRAS和TP53进行测定,使其可能成为未来结直肠癌基因分型的工具。

2.3 肿瘤转移遗传学

转移作为恶性肿瘤的一大特征,是肿瘤患者死亡的最常见原因,但目前对于肿瘤转移遗传学的所知甚少。Harbour等[18]经过对转移性的葡萄膜黑素瘤进行外显子组捕获及高通量平行测序,发现BAP1(BRCA1-关联蛋白1)的缺失与该病高转移性相关。另外,胰腺癌预后不佳常常与其不能早期诊断及早期远处转移相关。Yachida等[19]报道,对7例转移胰腺癌患者进行基因测序,除评估原发灶与转移灶之间同源细胞关系之外,亦对胰腺癌的遗传学演变进行 了研究,发现细胞原始突变的发生至原位肿瘤亲代细胞的产生至少需要10年时间,之后获得转移能力至少经历5年,转移后患者平均在2年内死亡。其结论提示,可以通过研究肿瘤进展的遗传学特征,明确肿瘤转移前的时间窗,以期早期发现,预防肿瘤转移导致的死亡结局[20]。

2.4 选择肿瘤治疗的相关靶点

Pasqualucci等[21]关于B细胞非霍奇金淋巴瘤中最常见类型——弥漫大B细胞淋巴瘤以及滤泡性淋巴瘤的研究中发现,基因组结构的改变使得与组蛋白及非组蛋白乙酰转移酶高度相关的基因CREBBP和EP300钝化,其表达不足造成BCL6和p53的乙酰化不足,最终导致相关肿瘤蛋白的激活以及p53肿瘤抑制基因活性的下调,提示可利用药物针对乙酰化/去乙酰化进行靶向治疗。Timmermann等[17]研究显示,结直肠癌中BRAF、KRAS、FGFR2、MTOR等肿瘤药物靶区的基因突变,直接影响肿瘤药物的治疗效果。Parsons等[14]在儿童髓母细胞瘤的研究中,发现一种特别类型的组蛋白甲基化在该肿瘤形成中的作用,提供靶向抑瘤的研究方向。Jiao等[22]在胰腺内分泌肿瘤的研究中,除了发现关于DAXX、ATRX、MEN1等突变导致的染色体重组,亦显示14%的该肿瘤患者存在钠巴霉素的靶向通路(mammalian target of rapamycin, mTOR)相关基因的突变,从而使得筛选该类患者进行mTOR抑制治疗存在可能。

因此,通过全外显子组测序技术获得肿瘤基因突变相关的最佳药物靶点,改变相应代谢途径,或可能成为未来肿瘤个体化治疗的金标准。

2.5 提示肿瘤预后

Yan等[23]研究显示, 在急性单核细胞性白血病(AML-M5)患者中,DNMT3A 基因突变导致了DNA甲基转移酶的活性降低,并表现出对组蛋白H3的异常亲和力。DNA甲基化作为重要的基因组修饰,调控着许多重要细胞过程,其与肿瘤发生的相关性也已被证实。研究者经分析后发现DNMT3A作为与总生存率相关的独立预后变量,携带该基因常显示预后不佳。而Jiao等[22]关于胰腺内分泌肿瘤临床研究中显示,DAXX、ATRX、MEN1基因突变则提示较好预后。

2.6 应用于干细胞研究

肿瘤干细胞(Cancer Sterm Cells, CSCs)学说认为肿瘤中存在着一类细胞,其抗调亡能力、成瘤能力、迁徙和侵袭能力等与占大多数分化程度较高的肿瘤细胞存在差异[24],是肿瘤无限增殖、复发和转移的根源[25]。该理论为肿瘤的发生、发展、复发和转移等机制的研究提供了全新的视角。目前,全外显子组测序技术应用于干细胞,甚至是肿瘤干细胞的研究尚处于初步阶段。Howden等[26]在对于1例视网膜环状萎缩患者诱导性多潜能干细胞(IPS cell)的遗传校正及分析研究中,对IPS细胞株进行最初的重编程、基因靶向、选择性片段移除后,联合应用全外显子组测序技术与aCGH方法,评估其基因组完整性。找到该患者原始IPS细胞的蛋白质编码区域中共有1个基因缺失、2个基因扩增以及9个基因突变。为研究该疾病IPS细胞分化潜能的机制提供了新思路。Totoki等[27]在关于肝细胞癌的基因组研究显示,发现的47个非同义突变中的TSC1复合体的无义突变仅在小部分的肿瘤细胞中出现,并与负性调节钠巴霉素的哺乳动物靶向通路有关,成为与该肿瘤细胞的“干性”表达、生长、代谢相关的重要致癌途径。

综上所述,目前全外显子组测序技术在肿瘤学的应用仍处于较早期的阶段。相比于传统全基因组测序技术,其低花费、高产量已成为明显的优势,在肿瘤分子生物学的研究和临床应用方面显示了多方面的影响。相信随着测序成本的进一步降低,通过该技术对肿瘤进行基因水平的诊断、分型,治疗靶点的确立以及预后的分析等,将成为未来肿瘤分子生物学及个体化治疗的有效手段。

参考文献:

[1]Ng SB, Turner EH, Robertson PD, et al. Targeted capture and massively parallel sequencing of 12 human exomes[J]. Nature, 2009,461(7261): 272-276.

[2]Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J]. Proc Natl Acad Sci U S A, 2010, 106(45): 19096-19101.

[3]Ng SB, Buckingham KJ, Lee C, et al. Exome sequencing identifies the cause of a mendelian disorder[J]. Nat Genet, 2010, 42(1): 30-35.

[4]Lehne B, Lewis CM, Schlitt T.Exome localization of complex desease association signals[J]. BMC Genomics, 2011, 12:92.

[5]Ernani FP, LeProust EM. Agilent’s sureselect target enrichment systems: Bringing cost and process efficiency to next-generation sequencing[EB/OL]. http://www.chem.agilent.com/Library/brochures/5990-3532en_lo%20CMS.pdf

[6]Margulies M, Egholm M, Altman WE, et al.Genome sequencing in open microfabricated high density picolitre reactors[J]. Nature, 2005, 437(7057): 376-380.

[7]Smith DR, Quinlan AR, Peckham HE, et al. Rapid whole-genome mutational profiling using next-generation sequencing technologies[J]. Genome Res, 2008,18(10): 1638-1642.

[8]Bentley DR, Balasubramanian S, Swerdlow HP,et al. Accurate whole human genome sequencing using reversible terminator chemistry[J]. Nature, 2008, 456(7218): 53-59.

[9]Jacobs KB, Yeager M, Cullen MG, et al. Realities and limitations of coverage in current whole-exome sequencing capture approaches[J]. Genetic epidemiology, 2010, 34(8): 919-920.

[10]Meyerson M, Gabriel S, Getz G.Advances in understanding cancer genomes through second-generation sequencing[J]. Nat Rev Genet, 2010, 11(10): 685-696.

[11]Wei X, Walia V, Lin JC,et al. Exome sequencing identifies GRIN2A as frequently mutated in melanoma[J]. Nat Genet, 2011,43(5):442-446.

[12]Varela I, Tarpey P, Raine K,et al. Exome sequencing identifies frequent mutation of the SWI/SNF complex gene PBRM1 in renal carcinoma[J]. Nature, 2011, 469(7331): 539-542.

[13]Jones S, Wang TL, Shih IeM,et al. Frequent mutations of chromatin remodeling gene ARID1A in ovarian clear cell carcinoma[J]. Science, 2010,330(6001):228-231.

[14]Parsons DW, Li M, Zhang X,et al. The genetic landscape of the childhood cancer medulloblastoma[J]. Science, 2011, 331(6016):435-439.

[15]Jones S, Hruban RH, Kamiyama M,et al. Exomic sequencing identifies PALB2 as a pancreatic cancer susceptibility gene[J]. Science, 2009, 324(5924): 217.

[16]Goldin LR, Yang XR, McMaster ML, et al. The use of whole exome sequencing to identify rare susceptibility variants in cancer prone families[J]. Genetic epidemiology,2010, 34(8):924.

[17]Timmermann B, Kerick M, Roehr C, et al. Somatic mutation profiles of MSI and MSS colorectal cancer identified by whole exome next generation sequencing and bioinformatics analysis[J]. PLoS One, 2010, 5(12): e15661.

[18]Harbour JW, Onken MD, Roberson ED,et al. Frequent mutation of BAP1 in metastasizing uveal melanomas[J]. Science, 2010,330(6009): 1410-1413.

[19]Yachida S, Jones S, Bozic I,et al. Distant metastasis occurs late during the genetic evolution of pancreatic cancer[J]. Nature, 2010,467(7319):1114-1117.

[20]Campbell PJ, Yachida S, Mudie LJ, et al. The patterns and dynamics of genomic instability in metastatic pancreatic cancer[J]. Nature, 2010, 467(7319): 1109-1113.

[21]Pasqualucci L, Dominguez-Sola D, Chiarenza A, et al. Inactivating mutations of acetyltransferase genes in B-cell lymphoma[J]. Nature, 2011,471(7337): 189-195.

[22]Jiao Y, Shi C, Edil BH, et al. DAXX/ATRX, MEN1, and mTOR pathway genes are frequently altered in pancreatic neuroendocrine tumors[J]. Science, 2011, 331(6021):1199-1203.

[23]Yan XJ, Xu J, Gu ZH,et al. Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemia[J].Nature Genetics, 2011,43(4): 309-315.

[24]O’Brien CA, Kreso A, Jamieson CH. Cancer stem cells and self-renewal[J]. Clin Cancer Res. 2010, 16(12): 3113-3120.

[25]Marx J. Cancer research. Mutant stem cells may seed cancer[J]. Science, 2003, 301(5638): 1308-1310.

[26]Howden SE, Gore A, Li Z, et al. Genetic correction and analysis of induced pluripotent stem cells from a patient with gyrate atrophy[J]. Proc Natl Acad Sci U S A,2011, 108(16): 6537-6542.

[27]Totoki Y, Tatsuno K, Yamamoto S et al. High-resolution characterization of a hepatocellular carcinoma genome[J]. Nat Genet, 2011, 43(5): 464-469.

猜你喜欢
癌基因外显子基因组
外显子跳跃模式中组蛋白修饰的组合模式分析
牛参考基因组中发现被忽视基因
外显子组测序助力产前诊断胎儿骨骼发育不良
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
紫花白及基因组DNA提取方法的比较
腺病毒载体介导的抑癌基因LRIG1对PC-3细胞生物学特性的影响
探讨抑癌基因FHIT在皮肤血管瘤中的表达意义
抑癌基因WWOX在口腔肿瘤的研究进展