吴家睿
肿瘤患者广泛存在着个体之间的差异以及个体的肿瘤组织内部差异,需要通过生物标志物来区分和确定对药物具不同响应的个体。因此,生物标志物在抗肿瘤药物研发中起着重要的作用。
抗肿瘤药物研发是当前创新药物研发最活跃的领域,也是生物标志物最能够体现“英雄用武”之领域。肿瘤患者不仅广泛存在着个体异质性(inter-tumor heterogeneity),而且在每个个体的肿瘤组织中也普遍存在内部差异(intra-tumor heterogeneity),因此需要通过生物标志物来区分和确定对药物具不同响应的个体。据统计,如果在肿瘤临床试验中纳人正确的生物标志物,可将药物最终获批的可能性提高10%到25%。
美国食品与药品管理局(Foodand Drug Administration,FDA)在2018年度批准了多个基于伴随诊断的肿瘤分子靶向药物,例如用于治疗携带ALK(间变性淋巴瘤激酶)基因重组的非小细胞肺癌的药物劳拉替尼(lorlatinib)。随后FDA又进一步推出一项伴随诊断分类标签指南草案,主要针对个体化抗肿瘤药物伴随诊断的分类标签,即在特定情况下,如果试验证据足以证明某一伴随诊断产品适用于一组或一类治疗药物,则该诊断产品的预期用途或适应证将涵盖这一类药物,而不限于单个药物。这表明FDA已经把生物标志物视为抗肿瘤药物研发和应用的主要基础。
最主要的肿瘤生物标志物:基因变异
肿瘤的形成和发展源于大量的基因变异,每种类型的肿瘤往往都具有成百上千的基因变异。因此,发现肿瘤细胞基因组的DNA序列变异被公认是抗击肿瘤的关键。美国国立卫生研究院(National Institutes of Health,NIH)在2006年启动了一个名为“癌症基因组图集”(The Cancer Genome Atlas,TCGA)的项目,通过该项目的实施,已在肺癌、乳腺癌等50种癌症的上万个样本中发现近1000万种遗传变异。目前学术界达成这样一个共识:防治肿瘤的首要任务是了解肿瘤细胞的基因变异。
美国国家癌症研究所(National Cancer Institute,NCI)在2017年进行了一次全国癌症精确医学问卷调查(National Survey of Precision Medicinein Cancer Treatment),调查结果显示:在参加调查的美国肿瘤医生中,高达75.6%的人都在用“二代测序”(next-generation sequencing,NGS)技术指导肿瘤治疗,其中34.0%的医生经常使用NGS检测来指导晚期难治性肿瘤患者的治疗决定,29.1%的医生通过NGS检测决定肿瘤患者是否满足临床试验的标准,17.5%的医生用NGS检测来决定是否进行超适应证用药。
基因测序目前已成为一个巨大的产业。根据美国联合市场研究机构在2017年年底发布的分析报告,2016年全球DNA测序市场产值约为52亿美元,预计2023年将达到183亿美元。显然,肿瘤患者的基因检测需求在这个测序市场中占有重要的份额。例如,美国已经有数百万女性接受了抑癌基因BRCA1的基因变异检测,以判定个体患乳腺癌或卵巢肿瘤的风险程度。此外,越来越多的肿瘤基因检测产品进人临床应用领域。例如,2017年12月,美国FDA批准首个肿瘤基因检测盒上市,这款由波士顿一家名为Foundation Medicine生物公司制造的产品“Foundation One CDx",可通过对324个特定肿瘤基因的深度测序来检测变异情况.对肺癌、乳腺癌、直肠癌和卵巢癌等四种常见恶性肿瘤进行早期诊断。
随着科学技术的迅速發展,基因测序技术也正在发生着重大的改进。由于NGS技术的测定序列“读长”较短,通常在200~300碱基对;研究者又开发出第三代测序技术,其“读长”平均可达10千碱基对以上。研究者利用第三代测序技术能够进一步揭示肿瘤细胞基因组的变异特征和复杂性。例如在一项针对乳腺癌细胞系的测序工作中,研究者利用第三代测序技术鉴定出17313个长度大于50碱基对的基因组结构变异,包括插入、缺失、重复、倒位和其他特殊变异类型;而用NGS技术只检测到4174个基因组结构变异”。可见第三代测序技术在基因组结构变异检测上具有更高的灵敏度与准确度。
虽然研究者利用先进的测序技术发现了肿瘤细胞中大量的基因变异,但是对这些基因变异的生物学意义或在肿瘤发生发展过程中的病理机制方面仍知之甚少。例如研究者已经在与乳腺癌或卵巢癌高度相关的抑癌基因BRCA1的13个外显子上发现近4000种单核苷酸变异(single-nucleotide variant,SNV),但大部分SNV的生物学含义或者在癌变中的作用并不很清楚。不久前研究者采用CRISPR一Cas9基因组编辑技术系统性地评估了整个BRCA1的外显子序列上几乎所有的SNV,鉴定出400多个SNV是非功能性错义突变(non-functional missense mutation),同时发现了能抑制BRCA1表达的近300个SNV。可以认为,确定基因变异在肿瘤形成中的作用依然是当前基因检测领域的主要挑战。
需要指出的是,即使知道了肿瘤细胞里基因突变的作用或功能,也并不意味着能给患者带来益处。一项对5000多例非小细胞肺癌患者的基因检测方式与生存率的相关性研究揭示,那些接受了30种基因以上的“广谱基因”检测的患者与只接受了单纯的EGFR/ALK检测的患者,在12个月生存率上没有显著差异3。研究者发现,除了针对EGFR/ALK相关的靶向治疗外,在携带其他类型基因突变的患者中只有4.5%的人得到相应的靶向治疗3。换句话说,检测到了有临床意义的突变不等于获得了有效的治疗药物。当前的基因检测能力已经远远超过人们研发靶向药物的能力。
追踪肿瘤动态变化的利器:液体活检
肿瘤最具挑战性的特点除了高度异质性之外就是高度可变性,即肿瘤细胞随着病程或者治疗过程时刻发生着各种各样的变化。这种特点使得传统的病理诊断或者影像诊断难以满足肿瘤治疗的需求,迫切需要一个能够无创地动态跟踪肿瘤细胞变化的检测技术。液体活检技术就是一种能满足这种需求的检测技术,该技术可能是近年来在临床上,尤其在肿瘤诊治领域发展最快的检验方法,曾被《麻省理工科技评论》评为“2015年十大突破技术”。该技术通过非侵入性方式检测血液或尿液等体液中特定的生物标志物,从而对癌症等疾病做出相应的诊断。目前肿瘤液体活检的分析重点是血液中的循环肿瘤细胞(circulating tumor cell,CTC)、循环肿瘤DNA(circulating tumor DNA,ctDNA),以及肿瘤细胞分泌的含有核酸、蛋白质和脂质的囊泡状外泌体(exosome)。
对血液中的CTC和ctDNA进行检测是目前临床应用中最常见的液体活检形式,尤其是ctDNA,它作为监测肿瘤发生发展过程和药物响应的生物标志物具有巨大的潜力。首先,通过对ctDNA的分析,能够获得肿瘤基因组的综合性信息,并找到在病理组织活检中常常无法发现的体细胞突变,从而用于判断肿瘤对药物的敏感性或耐药性。比如从非小细胞肺癌患者的ctDNA中检测到EGFR基因突变,就可用于指导临床用药。此外,通过对ctDNA的深度测序,可以发现只在部分肿瘤细胞中出现的基因突变,从而有助于解决肿瘤组织的内部异质性问题。
虽然液体活检技术在临床上得以迅速推广,但该方法的临床有效性并没有得到很好的研究。美国临床肿瘤学会和美国病理医师学会,针对已发表的1338篇关于ctDNA临床检测的论文,从分析有效性(analytical validity)、临床有效性(clinical validity)和临床实用性(clinical utility)三方面进行了系统分析15]。分析结果指出:目前发表的与ctDNA分析有效性相关的研究都是通过比较肿瘤组织和血浆中致病突变的一致性得出结论,但实际上有很多生物学因素也会影响这种一致性;虽然ctDNA检测到的阳性结果可以用于指导临床治疗,但是检测结果为阴性的患者仍然需要进行肿瘤组织检测,因为这类患者在组织病理检测中可能是阳性结果。所以,尽管当前研究者很看重ctDNA的检测潜力,但是在付诸日常临床实践时,尚需要更多的临床有效性证据。
液体活检技术除了关注血液中的CTC和ctDNA外,还涉及血液中RNA和蛋白质等其他组分。血液蛋白质在过去的临床实践中已被视为重要的生物标志物来源,其中就有数十种肿瘤抗原或肿瘤分泌蛋白被广泛用于诊断肿瘤发生或判断治疗效果和预后,近年来研究人员利用蛋白质组技术进一步发展出针对血液蛋白质的液体活检技术。显然,如何将血液中各种组分充分用于肿瘤液体活检是研究者需要认真考虑的问题。
腫瘤的分子分型:基于生物标志物的两种策略
传统的肿瘤分类是基于解剖位置和病理性状,属于“粗放型”。由于肿瘤存在高度的异质性,相似病理形态的肿瘤往往表现出不同的临床症状和不同的药物响应。随着精确医学的出现,研究者逐渐将基因和蛋白质等生物大分子作为肿瘤分类的基础。其中,分子分型的结果在抗肿瘤药物的研发中发挥了重要作用。例如,在原创药拉罗替尼(larotrectinib)[原肌球蛋白受体激酶(TRK)的小分子抑制剂]的临床试验中,人选的患者涉及13种不同的实体瘤类型,但每位患者都有一个共同的分子标志物——TRK基因的融合变异。
目前肿瘤细胞的基因变异信息是肿瘤分子分型最常用的分子标志物;美国在启动TCGA项目时,从其名称就可看到是把肿瘤的分类目标定在肿瘤细胞的基因组测序上。但是,研究者很快就认识到,单一的基因变异分子特征很难应用于大部分癌症类型。随着TCGA项目的推进,美国NCI又启动了一个针对肿瘤蛋白质组的项目——“The Clinical Proteomic Tumor Analysis Consortium”(CPTAC),不仅要获得肿瘤细胞的蛋白质组数据,而且要把基因组和蛋白质组数据整合在一起进行分析。研究者为此专门创造了一个词“蛋白质组一基因组学”(proteogenomics)。该项目的第一篇研究论文于2014年发表。在此项研究中,研究者首先将已被TCGA进行过基因组测序的95个人类结直肠癌样本做了蛋白质组分析,然后将这些蛋白质组数据和对应的基因组数据进行整合,进而更完整地揭示了这些肿瘤细胞的分子特性。
随着研究工作的深人,人们发现不同类型的生物大分子乃至其化学修饰在肿瘤鉴定和分类中都有着特定的价值。例如不久前发表的一项工作,利用改进的液体活检技术分析血液中游离DNA(cell-free DNA,cfDNA)的甲基化信息,成功进行了早期肿瘤检测,并做了正确的分类。
显然,要实现肿瘤的精确分子分型,并用来指导个性化抗肿瘤药物的研发,研究者必须改变那种依赖于单一类型生物标志物乃至单个分子标志物的简单化思路,发展基于多个生物标志物指标的整合型评估技术,即通过建立特定的评估模型,确定不同指标之间的权重分配.进行多指标相互关联分析,从而确定个体患者的肿瘤分子特征、预测其可能的药物响应情况。例如,TCGA项目的研究者在肿瘤分子分型方面,不仅利用了肿瘤细胞基因组序列的信息,而且还整合了相关的染色体非整倍性、DNA甲基表达谱、基因表达谱、microRNA表达谱和蛋白质表达谱等数据,从而将传统分类确定的33种肿瘤类型按照这种多组学整合的分子分型方法分为28种类型。
肿瘤分子分型的目标,不仅要找出具有相同病理形态的肿瘤的不同分子特征,还要提炼出不同病理形态的特定类型肿瘤的共同分子特征,即构造出一种称为“泛肿瘤”(pan-cancer)的类型。不久前,美国研究人员采集了近1700例年龄20岁或以下的包括6种白血病和实体瘤的青少年肿瘤(paediatric cancers)样本,检测了其全基因组、全外显子组和转录组序列,发现了一系列青少年肿瘤基因组所共有的特征,比如在这些样本中找到142个驱动基因,其中只有45%能够在成人各种类型的肿瘤中找到。又例如,研究者收集了卵巢癌、子宫内膜癌.宫颈癌、子宫肌瘤和乳腺癌共2500多例样本,对这些样本的基因组、表观遗传组、转录组以及蛋白质组等多组学数据进行了整合,发现了16种与临床相关的分子特征,在此基础上进行了泛妇科肿瘤综合分子分型,得到与预后和靶向治疗显著相关的5种分子亚型。
由此可以看出肿瘤分子分型的两种主要策略:基于特定分子标志物的“跨瘤种”分子分型,以及基于多组学数据整合的“泛肿瘤”分子分型。前者注重不同肿瘤类型间的分子个性特征,后者注重具有特定生物学共性(如“青少年肿瘤”或“妇科肿瘤”)的不同肿瘤类型间的分子综合信息。两者都超越了基于组织病理形态特征的传统肿瘤分类,从分子层面去揭示各种类型肿瘤之间的内在联系。
[1] Nattestad M, Goodwin S, Karen N, et al. Complex rearrangements and oncogene amplifications revealed by long-read DNA and RNAsequencing of a breast cancer cell line. Genome Res, 2018, 28:1126-1135.
[2] Findlay G M, Daza R M, Martin B, et al. Accurate functional classification of thousands of BRCAI variants with saturation genomeediting. Nature, 2018, 562:2 17-222.
[3] Presley C J, Tang D, Soulos P R, et al. Association of broad-based genomic sequencing with survival among patients with advanced non-small cell lung cancer in the community oncology setting. JAMA,201 8, 320:469-477.
[4] Heitzer E, Haque I S, Roberts C E S, et al. Current and future perspectives of liquid biopsies in genomics-driven oncology. Nat RevGenet, 2019, 20:71-88.
[5] Merker J D, Oxnard G R, Compton C, et al. Circulating tumor DNA analysis in patients with cancer: American Society of Clinical Oncologyand College of American Pathologists joint rev iew. J Clin Oncol, 2018,36:1631-1641.
[6] Kim Y, Jeon J, Mejia S, et al. Targeted protcomics identifies liquid-biopsy signatures for extracapsular prostate cancer. Nat Communi,2016, 7:11906.
[7] Zhang B, Wang J, Wang X J, et al. Proteogenomic characterization of human colon and rectal cancer. Nature, 2014: 513:382-387.
[8] Shen S Y, Singhania R, Fehringer G, et al. Sensitive tumour detection and classification using plasma cell-free DNA methylomes. Nature,2018, 563: 579-583.
[9] Hoadley K A, Yau C, Hinoue T, et al. Cell-of-origin patterns dominate the molecular classification of 10,000 tumors from 33 types of cancer.Cell, 2018, 173:291-304.
[10] MaX T, Liu Y, LiuY L, et al. Pan-cancer genome and transcriptome analyses of 1,699 paediatric leukaemias and solid tumours. Nature,2018, 555:371-376.
[1] Berger A C, Korkut A, Kanchi R S, et al. A comprehensive pan-cancer molecular study of gynecologic and breast cancers. Cancer Cell, 2018,33: 690-705.
關键词:生物标志物 肿瘤 药物研发