潘映秋,张 伟,陈枢青 综述
(1.温州医学院附属浙江省台州医院中心实验室,浙江 临海 317000;2.浙江大学药学院药理毒理与生化药学研究所,浙江 杭州 310058)
随着基因组学研究的逐渐深入,人们深刻地认识到人类疾病除外伤外,几乎都与基因相关,研究领域也由有限的遗传疾病扩大到各种常见疾病。其中,肿瘤是一种非常复杂的疾病,其复杂性不仅表现在受多个基因和环境因素的共同影响,还表现于其存在体细胞基因突变和表观遗传调控改变的逐渐积累的过程,而其改变的机制目前尚不明确。全基因组测序分析有助于解开肿瘤发生发展的谜团,为个体化诊治肿瘤找到新的思路。
肿瘤细胞基因组中的体细胞突变包含几种不同类型的DNA 序列的改变:单个碱基的置换;DNA 小片段或者大片段的插入或缺失;基因重排,创建融合基因,破坏DNA,DNA 片段结合至基因组的其他位置;基因组中某些基因的拷贝数异常,可较正常二倍体基因组的2个拷贝数增加或者减少甚至缺失。另外,肿瘤细胞整合外源性DNA 序列。最常见的是整合某些病毒基因,目前已知的可能会导致癌症发生的有人类乳头状瘤病毒、EB 病毒、乙肝病毒等[1]。Woo 等通过分析400 余种肿瘤基因组的体细胞突变,发现单碱基突变是最常见的体细胞突变类型,突变主要发生在细胞分裂S 期,而且肿瘤细胞发生有义突变的比例较生殖细胞高[2]。Sung 等研究了HBV 整合的复发性肝癌的全基因组,发现HBV 在肿瘤组织中的整合率要远远高于癌旁组织,在可能诱发染色体不稳定的HBV 断点位置拷贝数变异(copy -number variations,CNVs)显著增加,而且HBV 整合数与患者的生存相关[3]。
遗传因素和环境因素共同作用引起的致癌基因的激活以及抑癌基因的失活是肿瘤发生发展最常见的肇事突变组合。Stephens 等分析了100个乳腺癌标本的体细胞蛋白编码外显子基因组的拷贝数改变和突变情况,发现某些基因在乳腺癌标本中的突变率很高,可能涉及乳腺癌发生发展的有近十个关键基因,包括AKT2、ARID1B 和CASP8 等,提示同一种肿瘤的发生发展可能涉及多种致癌基因的共同作用[4]。Kan 等研究了441 种肿瘤样本的1 507个编码基因(DNA 碱基数量约为1 800 Mb),发现了2 576个体细胞突变,而且在不同类型或不同亚型的肿瘤中基因的突变率和突变的基因组合均存在差异[5]。
肿瘤的发生和发展在很大程度上依赖于关键基因突变所导致的蛋白表达谱的改变,这些异常表达的蛋白可作为新型的肿瘤治疗的靶点。近年来,针对异常表达蛋白研发的单克隆抗体药物陆续被开发并应用于临床,如吉非替尼、特罗凯、伊马替尼等,有效地延长了肿瘤患者的中位生存期[6]。但在肿瘤治疗的过程中,药物靶蛋白的异源性表达则造成药物对肿瘤细胞的选择性下降,导致耐药及治疗的毒副反应。Denmeade 等在最近的研究报告中提出了一种新的策略,希望通过选择性抑制肿瘤细胞中的一种关键内源性蛋白肌浆/内质网钙ATP 酶(SERCA)的功能来杀伤肿瘤细胞,并据此研制了前药G202。该药为实体瘤血管内皮细胞特异性表达的羧前列腺特异性膜抗原(PSMA)耦合SERCA 抑制剂,能特异性地靶向杀伤肿瘤细胞,目前该药物的I 期临床试验已经在中晚期癌症患者中开展[7]。此外,在一些肿瘤中,如急性髓细胞白血病(AML),通过分析特定异常肿瘤基因的特征,对肿瘤进行分类并制定相应的治疗方案,不同的亚型具有特异性的基因表达谱、细胞形态、临床症状和预后,并由此选择最优的具有针对性的治疗方案[8]。可见研究体细胞中的基因突变,并通过分析其可能产生的影响寻找到关键突变点,可以促使人类真正地认识肿瘤的发生发展过程,有助于肿瘤的早期诊断与治疗。
除了体细胞突变,肿瘤基因组还存在部分导致染色体结构和基因表达发生改变的表观遗传学上的变化,包括DNA 序列的甲基化、组蛋白的乙酰化及去乙酰化修饰、核小体重塑和RNA 介导的靶向作用的改变等都参与调控与肿瘤发生密切相关的多种生物学过程[9]。Morin 等研究发现,近90%的滤泡性淋巴瘤的组蛋白甲基转移酶MLL2 发生了突变[10],而Haaften 则发现了12 种不同肿瘤的组织存在组蛋白去甲基化酶UTX 的突变[11]。Berman 等的研究比对了同一个体的肿瘤组织和正常组织的表观遗传学图谱,发现在肿瘤组织中广泛存在重要的DNA 甲基化状态的改变,该变化可能与基因组后期复制区域的核纤层相关[12]。
新一代测序(next -generation sequencing,NGS)平台与染色质分析技术,如染色质免疫沉淀(ChIP-Seq)等的结合,提供了全面的核小体定位、染色质构象、转录因子结合位点和组蛋白及DNA 修饰位点等的信息,使我们对表观遗传基因组的特征有了更为深刻的认识[13]。近年来随着质谱(mass spectrometry,MS)仪的灵敏度和准确度的提升,为表观遗传基因组的研究提供了有力的手段。通过新的同位素标记法,MS 将有可能提供定量分析的结果。下一步的研究目标将是建立高分辨率的体内动态记录方法,记录特定核小体在基因表达过程中的动态变化[9]。
根据NGS 平台目前提供的基因组范围的CpG 岛的甲基化图谱,有5%~10%的启动子CpG 岛在正常情况下是非甲基化的,而在肿瘤组织中则发生了异常的甲基化。肿瘤组织中启动子CpG 岛的高度甲基化不仅与蛋白编码基因的表达有关,而且与大量的非编码RNAs 的表达相关,其中有一部分的甲基化参与了肿瘤的恶性转移[14]。组蛋白的乙酰化主要受2 种酶家族的调控,组蛋白赖氨酸乙酰化转移酶(KATs)和组蛋白去乙酰化酶(HDACs),这些酶参与了肿瘤的发生发展过程。如实体瘤及恶性血液肿瘤中的p300/CBP 基因的编码突变涉及了大量的KATs。而且白血病常见的PML-RARa、AML1-ETO 等融合基因则通过招募HDACs 导致异常的基因沉默,从而促进了恶性血液肿瘤的进程[15]。最近研究发现,近1/3 的婴幼儿胶质母细胞瘤复制相关组蛋白H3.3(H3F3A)和H3.1(HIST1H3B)的编码基因发生了突变[16];研究还发现,H3.3 突变后可能通过延长端粒和影响异染色质的稳定性参与肿瘤进程[17]。另外,类似的突变也在胶质母细胞瘤和胰腺神经内分泌肿瘤中发现[18],提示染色质重塑复合物的突变是恶性肿瘤的共有特征之一。
目前高通量测序平台能对整个基因组进行序列测定,但是只有2%的序列得以翻译,而大量未翻译的“非编码”RNA(ncRNA)也在肿瘤的发生发展过程中起到重要的作用[19]。目前研究较为深入的一个ncRNA:HOTAIR,在乳腺癌和结直肠癌中异常过表达,通过抑制恶性肿瘤细胞的HOTAIR 表达,可以改变肿瘤细胞的侵袭 力[20,21]。进一步探索与肿瘤相关的ncRNA 分子机制及其与蛋白之间的相互作用,是染色质研究的重要内容,将为肿瘤治疗提供新的作用靶点[22]。
通过对肿瘤表观遗传学的研究,发现某些靶点,可以特异性地重新活化因表观遗传改变而沉默的抑癌基因,抑制因表观遗传改变而活化的致癌基因。目前,DNA 甲基化和HDAC 抑制剂在临床上应用最为广泛,如5 -氮胞苷和地西他滨用于骨髓增生综合征的治疗[23],可以有效地激活因启动子高甲基化而沉默抑癌基因。Landreville 等发现,抑癌基因BAP1 的失活突变与葡萄膜黑色素瘤(UM)的转移密切相关,通过高通量筛选出候选化合物进行体内外研究,发现HDAC 抑制剂丙戊酸(VPA)可以抑制UM 细胞在体内的生长,提示HDAC 抑制剂可能对UM 具有潜在的治疗作用[24]。
尽管目前尚未完全了解肿瘤基因组表观遗传学改变的方式和方法,但是表观遗传学全基因组测序平台的建立,已经成为探秘肿瘤基因组表观遗传学的有力手段。
对肿瘤基因组进行分析,最关键的是要找出导致肿瘤发生的“肇事突变”,因此需要解决的就是如何辨别“肇事突变”和“无关突变”。以往的基因组研究主要通过比较患者与健康人群间的基因组,统计两者的某一基因或基因上某一位点的突变率是否存在显著性差异。但是突变发生时,DNA 被攻击的位点几乎是随机的,可能发生在与疾病直接相关的致命位点,也可能发生在无关的序列区域。研究已发现,超过20 000个蛋白编码基因和大量位于内含子和DNA 基因间隔区中的未知功能元件,其中大部分突变都是无关突变,只有少部分突变与肿瘤相关,因此如何选择出最关键的重要突变已经成为了目前最大的挑战[25]。
近年来,大量研究通过比对肿瘤患者的肿瘤组织和自身的正常组织的全基因组序列,发现了大量的肿瘤相关的“肇事基因”。Ley 等提取了一名急性髓细胞性白血病(AML)患者的癌细胞及其健康的皮肤细胞,对两者之间基因序列进行比对,并进一步与其他患者的SNPs及dbSNPs 进行比较,发现了体细胞突变所导致的同一个体不同位点基因序列的差异,验证了病变组织细胞的基因序列在不同个体中的异质性,最终找到了可能影响癌症发生的8个突变点[26]。Link 等也通过类似的方法比对了一名AML 患者的癌细胞和健康皮肤细胞的全基因组,在该患者的正常皮肤细胞中发现一个新的杂合的3 千个碱基的缺失,该缺失导致了抑癌基因TP 537 -9 号外显子的缺失,而在肿瘤细胞中,这部分的缺失则变为了纯合子。此外,他们还在体细胞中发现了28个蛋白编码基因的单核苷酸突变体,8个基因结构变异体和12个基因拷贝数量的改变[27]。Selamat 等通过高通量测序平台检测了59 对肺腺癌肿瘤组织和匹配的正常组织的全基因组甲基化状态,发现766个基因存在甲基化状态的改变,其中大量甲基化状态的改变导致了相关基因表达水平的差异,并发现一个可能与肺腺癌发生发展相关的基因LGALS4,为进一步研究肺腺癌表观遗传调控相关的分子机制提供了宝贵的资料,也证明表观遗传调控参与了肺腺癌的发生发展过程[28]。Vasmatzis 等通过对16 对匹配的外周T淋巴细胞瘤(PTCL)患者自身组织及6个相关细胞系的全基因组序列的分析,发现了13个异常基因,其中5个与p53 相关[29]。通过对全基因组进行精确的自身比对的测序分析,能够发现在常规检测中经常遗漏的结构性变异株,为研究肿瘤的发生发展提供了有力的帮助。
然而,以未发生癌变的自身组织作为标准对照是否可靠呢?在个体生命延续的过程中,各种各样的突变不可避免,其中有些突变并未导致疾病的发生,这样的突变存在于体细胞中,并在细胞分裂时得以延续。所以即使是看似健康的皮肤细胞也不能认为其遗传基因未发生任何突变,以此作为对照无疑忽略了这些突变存在的可能性。但目前很难取得更加可靠的DNA 对照信息,为此,如何建立可靠的个体DNA 资料库成为了迫在眉睫的问题。如果能够为每一个新生儿建立个体DNA 档案资料,一次性完成全基因组的序列测定,保存该测序结果以便将个体不同时期的DNA 进行比对分析,可能是最为可信、高效的一种研究方法。
在过去的30年里,Sanger 测序法是最常用的,是DNA 测序的金标准,但是低通量和高昂的测序成本限制了大规模、系统性的体细胞全基因组测序工作的开展。2005年,以大规模并行焦磷酸测序平台为开端的新一代测序技术(next-generation sequencing,NGS)开创了高通量基因组学检测的新时代。大量新型的高通量大规模并行测序仪器,如罗氏454、SOLiD、Illumina 等测序平台陆续被开发[30],测序流程逐步简化,成本则逐步降低。Beckman 公司新近研发的仪器已经将分析所需的DNA 样本量缩小至纳克级。另外,Helico Bioscience 公司的DNA 单分子测序技术也实现了对样本的微型化分析[31]。即便如此,由于技术水平的制约,要获得一个人完整的全基因组序列成本仍然较高,临床普及尚待时日。全外显子组测序是目前应用最为广泛的降低全基因组测序成本的策略之一,仅分析全基因组中最有可能成为肇事突变的2%的编码蛋白基因组和含有大量疾病相关突变的部分目标基因组。当然肇事突变也有很可能会发生在非编码区,因而全基因组测序的比对更为全面。
尽管高通量测序技术已被广泛应用于各种生物学研究,但是多细胞组织中存在细胞异质性,尤其是高异质性的肿瘤细胞,除非进行额外的细胞分选实验,否则肿瘤组织中很难避免正常组织的干扰,难以鉴定出肿瘤发展中具有重要影响的关键突变。最近,Baslan 等结合流式分选技术和高通量测序技术建立了一种单细胞测序法,实现了对单细胞的拷贝数变异的比对[32]。Hon 等建立了一种基于多重置换扩增(MDA)的单细胞测序新方法,通过对1 例典型的JAK2 阴性的原发性血小板增多症患者的90个单细胞进行了全外显子测序,分析并揭示了此肿瘤发生中遵循单克隆演化模型[33]。Xu 等则用同样的方法研究了1 例肾透明细胞癌,发现此例肾癌并非由常见的2个突变基因VHL和PBRM1 导致的,这说明在患者群体中所鉴定的频发突变可能与肿瘤个体无关,同时也强调了在癌症分析和诊断过程中进行个性化治疗的重要性[34]。单细胞测序法解决了之前使用组织样本测序时无法解决的肿瘤高异质性难题,为从单核苷酸水平深入研究癌症的发生、发展机制及其诊断、治疗提供了新的研究思路,开辟了新的研究方向。
尽管人们都希望尽快攻克癌症等常见的复杂性状疾病,但是这些复杂性状疾病往往是在漫长岁月中发生发展起来的,对它们的研究需要对受试人群进行长期跟踪调查。可以预见,在不久的将来全基因组测序的价格将下降到大众可以接受的水平,建立及应用个体DNA 资料库将不再只是梦想。我们可以将DNA 测序的结果存储在服务器或者光盘中,作为常规的医疗档案,通过比对分析将其用于疾病的诊断、治疗,从而发挥DNA 分子本身的信息性、长期稳定性和阅读备查性。个体DNA 资料库作为基因组自身比对的物质基础与信息来源,将记录一个人生老病死的所有秘密。
基因组的自身比对将看清体细胞突变的过程,认识到表观基因组对肿瘤发生发展的调控作用,大大促进人类对肿瘤发生发展过程的认识与控制。实践将证明,基因组自身比对的应用与推广必将成为肿瘤基因组研究的又一次飞跃。
[1]STRATTON M R,CAMPBELL P J,FUTREAL P A.The cancer genome [J].Nature,2009,458(7239):719-724.
[2]WOO Y H,LI W H.DNA replication timing and selection shape the landscape of nucleotide variation in cancer genomes [J].Nat Commun,2012,3:1004.
[3]SUNG W K,ZHENG H,LI S,et al.Genome-wide survey of recurrent HBV integration in hepatocellular carcinoma[J].Nat Genet,2012,44(7):765-769.
[4]STEPHENS P J,TARPEY P S,DAVIES H,et al.The landscape of cancer genes and mutational processes in breast cancer[J].Nature,2012,486(7403):400-404.
[5]KAN Z,JAISWAL B S,STINSON J,et al.Diverse somatic mutation patterns and pathway alterations in human cancers [J].Nature,2010,466(7308):869-873.
[6]MARTINI M,VECCHIONE L,SIENA S,et al.Targeted therapies:how personal should we go?[J].Nat Rev Clin Oncol,2012,9(2):87-97.
[7]DENMEADE S R,MHAKA A M,ROSEN D M,et al.Engineering a prostate-specific membrane antigen-activated tumor endothelial cell prodrug for cancer therapy [J].Sci Transl Med,2012,4(140):140r-186r.
[8]BUCCISANO F,MAURILLO L,DEL P M,et al.Prognostic and therapeutic implications of minimal residual disease detection in acute myeloid leukemia[J].Blood,2012,119(2):332-341.
[9]DAWSON M A,KOUZARIDES T.Cancer epigenetics:from mechanism to therapy[J].Cell,2012,150(1):12-27.
[10]MORIN R D,MENDEZ-LAGO M,MUNGALL A J,et al.Frequent mutation of histone-modifying genes in non-Hodgkin lymphoma [J].Nature,2011,476(7360):298-303.
[11]VAN HAAFTEN G,DALGLIESH G L,DAVIES H,et al.Somatic mutations of the histone H3K27 demethylase gene UTX in human cancer[J].Nat Genet,2009,41(5):521-523.
[12]BERMAN B P,WEISENBERGER D J,AMAN J F,et al.Regions of focal DNA hypermethylation and long-range hypomethylation in colorectal cancer coincide with nuclear lamina-associated domains[J].Nat Genet,2012,44(1):40-46.
[13]PARK P J.ChIP-seq:advantages and challenges of a maturing technology[J].Nat Rev Genet,2009,10(10):669-680.
[14]BAYLIN S B,JONES P A.A decade of exploring the cancer epigenome -biological and translational implications [J].Nat Rev Cancer,2011,11(10):726-734.
[15]PASQUALUCCI L,DOMINGUEZ-SOLA D,CHIARENZA A,et al.Inactivating mutations of acetyltransferase genes in B-cell lymphoma [J].Nature,2011,471(7337):189-195.
[16]SCHWARTZENTRUBER J,KORSHUNOV A,LIU X Y,et al.Driver mutations in histone H3.3 and chromatin remodelling genes in paediatric glioblastoma[J].Nature,2012,482(7384):226-231.
[17]WU G,BRONISCER A,MCEACHRON T A,et al.Somatic histone H3 alterations in pediatric diffuse intrinsic pontine gliomas and non-brainstem glioblastomas[J].Nat Genet,2012,44(3):251-253.
[18]JIAO Y,SHI C,EDIL B H,et al.DAXX/ATRX,MEN1,and mTOR pathway genes are frequently altered in pancreatic neuroendocrine tumors[J].Science,2011,331(6021):1199-1203.
[19]AMARAL P P,DINGER M E,MERCER T R,et al.The eukaryotic genome as an RNA machine[J].Science,2008,319(5871):1787-1789.
[20]KOGO R,SHIMAMURA T,MIMORI K,et al.Long noncoding RNA HOTAIR regulates polycombdependent chromatin modification and is associated with poor prognosis in colorectal cancers [J].Cancer Res,2011,71(20):6320-6326.
[21]WU H,ZHANG Y.Mechanisms and functions of Tet protein-mediated 5-methylcytosine oxidation[J].Genes Dev,2011,25(23):2436-2452.
[22]AMARAL P P,CLARK M B,GASCOIGNE D K,et al.lncRNAdb:a reference database for long noncoding RNAs[J].Nucleic Acids Res,2011,39(Database issue):D146-D151.
[23]LOHRUM M,STUNNENBERG H G,LOGIE C.The new frontier in cancer research:deciphering cancer epigenetics[J].Int J Biochem Cell Biol,2007,39(7-8):1450-1461.
[24]LANDREVILLE S,AGAPOVA O A,MATATALL K A,et al.Histone deacetylase inhibitors induce growth arrest and differentiation in uveal melanoma[J].Clin Cancer Res,2012,18(2):408-416.
[25]FRIEDBERG E C.A comprehensive catalogue of somatic mutations in cancer genomes [J].DNA Repair (Amst),2010,9(4):468-469.
[26]LEY T J,MARDIS E R,DING L,et al.DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome [J].Nature,2008,456(7218):66-72.
[27]LINK D C,SCHUETTPELZ L G,SHEN D,et al.Identification of a novel TP53 cancer susceptibility mutation through whole-genome sequencing of a patient with therapy-related AML [J].JAMA,2011,305(15):1568-1576.
[28]SELAMAT S A,CHUNG B S,GIRARD L,et al.Genome-scale analysis of DNA methylation in lung adenocarcinoma and integration with mRNA expression[J].Genome Res,2012,22(7):1197-1211.
[29]VASMATZIS G,JOHNSON S H,KNUDSON R A,et al.Genome-wide analysis reveals recurrent structural abnormalities of TP63 and other p53-related genes in peripheral T-cell lymphomas[J].Blood,2012,120(11):2280-2289.
[30]LOMAN N J,MISRA R V,DALLMAN T J,et al.Performance comparison of benchtop highthroughput sequencing platforms [J].Nat Biotechnol,2012,30(5):434-439.
[31]HARRIS T D,BUZBY P R,BABCOCK H,et al.Single-molecule DNA sequencing of a viral genome[J].Science,2008,320(5872):106-109.
[32]BASLAN T,KENDALL J,RODGERS L,et al.Genome-wide copy number analysis of single cells[J].Nat Protoc,2012,7(6):1024-1041.
[33]HOU Y,SONG L,ZHU P,et al.Single-cell exome sequencing and monoclonal evolution of a JAK2-negative myeloproliferative neoplasm [J].Cell,2012,148(5):873-885.
[34]XU X,HOU Y,YIN X,et al.Single-cell exome sequencing reveals single-nucleotide mutation characteristics of a kidney tumor[J].Cell,2012,148(5):886-895.