基于长读长高通量基因测序技术在肿瘤融合基因检测中的应用进展

2020-02-22 11:17万绍贵刘晓平
赣南医学院学报 2020年12期
关键词:高通量测序基因

刘 政,黄 玲,万绍贵,刘晓平

(1.赣南医学院第一临床医学院;2.赣南医学院基础医学院;3.赣南医学院分子病理中心;4.赣南医学院第一附属医院普外科,江西 赣州 341000)

过去数十年的研究证实基因突变是肿瘤形成的重要因素,融合基因是其典型例子[1]。融合基因是肿瘤产生、发展的重要驱动因素,同时也作为临床重要的分子生物学标志,在癌症的诊断、靶向治疗以及预后具有重要的意义[1-2]。然而现有的临床检测技术都存在一些不足。第二代测序技术(Second generation sequencing,SGS)凭借其高通量和相较于第一代基因测序技术更低的价格,成为现代医学遗传常规诊断工具[3-4]。但其短读长及过高的价格,限制了其在临床上的应用。近年来第三代基因测序技术(Third generation sequencing,TGS)的出现为高通量测序技术的临床应用带来了曙光,TGS 技术最大的特点就是单分子实时测序,相对于SGS技术,不仅在价格上具有优势,其独特的长读长测序在结构变异及重复序列检测方面更加准确,更加适用于融合基因检测。

1 融合基因及其检测技术

融合基因是两个独立的基因串联产生的染色体结构变异(图1)。碱基的缺失、重复和倒置,且错误序列达到50 bp以上时,就能产生融合基因[2]。近些年也有研究表明,临近基因的转录通读或mRNA分子的剪接,前信使RNA 的反式和顺式剪接是导致融合基因产生的重要原因[5-6]。关于融合基因导致癌症的产生机制,目前已知的有两种:癌基因与强启动子融合而导致其表达上调[7];融合基因可以翻译两个基因的嵌合结构域,从而表达融合蛋白,使得这种嵌合蛋白的活性异常或者内源性蛋白功能丧失。如NRG1 融合蛋白可通过MAPK 或其他途径促进病理信号转导,CCDC6 与RET 融合后导致RET过度表达从而促进甲状腺发生癌变,分别对应着第一种和第二种[8]。

图1 染色体易位导致融合基因的生成

融合基因在人类肿瘤中虽然并不常见,但融合基因往往是致癌基因。因此,不管是对肿瘤生物学研究还是在临床,鉴定融合基因都有重要意义[9]。ARDINI 等[10]报 告 了CRC 中 复 发 性 的 融 合 基 因TPM3-NTRK1,并且还发现恩替替尼(NMS-P626;RXDX-101)是新型、高效且选择性的pan-Trk 抑制剂。对TPM3-NTRK1 的CRC 患者使用恩替替尼进行治疗,不仅能缓解症状,同时也减少了肝脏和肾上腺的转移性病变[11]。此外,在人类GBM 中首次发现FGFR-TACC 融合体之后,也在其他肿瘤中检测出FGFR-TACC 基因融合体,其频率通常在1%~4%之间[12],是迄今为止人类癌症中最常见的染色体易位。研究人员发现,FGFR3-TACC3融合蛋白在肿瘤块内均有表达,可作为治疗的最佳靶点[9]。近些年的临床试验也在研究其抑制剂,包括PRN1371、TAS120、H3B-6527等[13-15]。

目前临床上使用的融合基因检测技术包括细胞遗传学技术[16]、RT-PCR[17]、荧光原位杂交(Fluorescence in situ hybridization,FISH)[18]、免 疫 组 化(immunohistochemistry,IHC)[19]等。但这些方法操作复杂、周转时间长且对某些特定融合不敏感、存在假阳性、只能检测已知融合并且容易受到样本材料的限制[20-24](表1),使得他们在临床上的应用受到限制。近些年SGS 技术凭借其高通量的优点[3-4],成为现代医学遗传常规的诊断工具。然而SGS 短读长,使得其在结构变异、重复区域、等位基因的分期和区分高度同源的基因区域存在不足[25-26]。TGS 技术的出现在检测基因结构变异方面取得了巨大突破,TGS 即单分子实时测序技术,具有长读长,高通量、单分子实时测序的优点,该技术能对每一条核酸分子进行单独测序且测序前无需经过PCR。目前常用的TGS 测序平台有PacBio 公司的SMART(Single Molecule Real-Time)测序和Oxford Nanopore Technologies(ONT)公司的纳米孔测序,他们在测序的原理上各有不同。SMART 测序仪采用的是边合成边分析的化学信号分析方式,以环状DNA 为模板,4 种荧光标记的dNTPs 为底物。当dNTPs 在单分子DNA 聚合酶的作用下与模板发生碱基配对,就能产生识别碱基的光脉冲[27-28],从而可以直接识别碱基序列。与SMART 不同,Nanopore是通过电信号识别碱基序列,双链DNA 分子在马达蛋白作用下解螺旋并在其牵引下通过纳米孔,DNA 分子在穿过孔道时,不同碱基产生不同的偏转电流,将记录的电信号经过特定的软件BaseCalling,转化为所需的碱基序列[29]。

表1 各种融合基因检测技术的优缺点

2 TGS技术在融合基因检测中的优势

目前常用的融合基因检测技术虽能检测到融合基因及其融合伴侣,但难以了解融合序列的具体信息。YASUDA 等[30]对急性淋巴细胞白血病(ALL)患者使用PacBio SMRT 测序技术发现了一种独特的融合基因,并使用全长转录组测序对其进一步研究。在对73 名Ph-患者使用基于SGS 技术的RNA-seq 鉴定其融合转录本后,研究人员得到26 种融合基因,其中12 种为新发现的融合基因。在新发现的融合基因中发现了一种只存在于青年人群中的特殊融合——DUX4-IGH。该技术虽能检测到融合基因,但其短读长的缺陷,使得研究人员无法窥得该融合基因的全貌。为了深入研究该融合基因的结构,有学者使用TGS 技术对一位19 岁的ALL 患者进行全基因组测序,结果显示D4Z4 序列中有两个拷贝易位到IGH 位点。此外,IGHD2-15 和IGHVII-60-1 区域发生了轻微重排。实验结果表明,基于长读长高通量基因测序技术可以检测融合基因的全貌,能够作为其他鉴定技术的补充,进一步深入了解融合基因的具体结构。

此外,融合基因融合位点还可以作为分子检测的生物学标记,对疾病的诊断、预后、治疗靶点的确定以及血液恶性肿瘤的检测具有重要意义。CHUN HANG AU 等[31]以一位64 岁中国妇女白血病患者(根据临床症状、体征以及辅助治疗确诊)外周血为样本,通过FISH 鉴定出该患者存在NUP98 易位突变,并且通过SGS 测序准确检测出了该患者存在NUP98-NSD1 以及NSD1-NUP98 的突变。尽管我们已知NUP98-NSD1 是一个潜在的驱动突变,但其易位特性并不明确,临床上需要进一步鉴定其DNA 断裂点。研究人员使用基于三代测序的纳米孔Min-ION sequencer 对患者外周血进行全基因组测序。随着实时长读长测序的进行,在短短6.4 h 内,不仅得到了NUP98(染色体11p15.4)和NSD1(染色体5q35.3)之间确切的断裂点,同时还发现了另一组潜在的融合基因——DUSP13-GRIN2B(两个基因分别为于10 号染色体和12 号染色体),并且获得其准确的断裂位点。不同于SGS全基因组测序成本高而且操作复杂。纳米孔全基因测序,不仅具有成本低、耗时短的优点,且对潜在融合具有较高的敏感性,在临床应用方面比SGS更具有优势。

3 TGS在融合基因检测中的应用

由t(9;22)(q34;q11)融合产生的22 号染色体被称为费城染色体(Ph)是慢性粒细胞白血病(CML)的标志[32]。伊马替尼是治疗慢性粒细胞白血病(CML)的特异性靶向药物,能与Bcr-Abl融合蛋白高度特异性结合,抑制酪氨酸激酶的活性[33-34]。此外,在急性淋巴白血病部分患者中也存在BCR-ABL基因融合,一旦发现该种融合,则表明患者预后不良[35]。MINERVINI 等[36]利用纳米孔MinION 技术的深度测序对BCR-ABL1 阳性白血病的突变分析,实验样本是24名Ph+患者,并分为两组,第一组包括11名TKI 治疗过程中出现抗药性的患者和1 名新诊断的ALL 患者;第二组包括新诊断的8 名CML 患者和4名ALL患者。使用RNasy Mini Kit(QIGEN)从外周血细胞中提取细胞总RNA经过反转录扩增合成cDNA,对样品进行纯化、定量和评估后,根据ONT 测序试剂盒(SQK-MAP006)构建文库,将样品加入MinION flowcell 后进行测序并对数据进行分析。结果显示,在第一组的9 名患者中发现10 个BCR-ABL1 KD 突变,其中4 号患者为复合突变。此外,10 号患者在BCR-ABL1 KD 中显示了单核苷酸多态性。测序结果还与Sanger测序进行对比,结果一致性达到92%。此外,Sanger 测序最初未检测到低水平突变的2 号患者和8 号患者。Nanopore 测序技术不仅能准确检测耐药患者存在BCR-ABL1 融合突变,还能识别潜在的低水平变体(小于15%~20%变体频率,超出Sanger测序能力检测范围)和区分“复合突变体”。

临床发现BCR-ABL1融合转录本发生突变会导致临床靶向药物的治疗效果不佳。CAVELIER 等[37]使用了一种基于PacBio测序技术的检测方法,通过使用长读长测序技术直接对整个1 578 bp的BCR-ABL1转录本进行测序来检验转录本突变,样本来自Uppsala University Hospital 的6名确诊为CML且TKI治疗效果不佳的患者,将BCR-ABL1 样品进行不同梯度稀释之后使用Clontech Advantage PCR 试剂盒(Clontech,CA,USA)对BCR-ABL1 p210 转录本进行反转录,扩增后制备试剂盒构建文库,将所得的文库在PacBio SMRT cell 上进行测序并对数据进行分析,并在3 天内出结果报告,除了1 名患者外,其他5名患者均发现了耐药性的突变并且在其中2名患者中还发现了BCR-ABL1 多种转录本亚型。结果表明,PacBio 测序法对诊断和后续CML 患者样品中的BCR-ABL1 耐药性突变不仅具有较高的敏感性,还能同时鉴别多种转录本亚型。说明在同时检测多个转录本亚型方面,SMRT 相对于常规的检测方法如Sanger、RT-PCR更有优势。

高度同源的RLN1 和RLN2 基因在前列腺中同时表达,导致了难以检测单个松弛素在前列腺中的准确表征和功能研究。为了全面识别RLN1和RLN2转录变体,GREGOR 等[38]使用PacBio 的SMART 测序技术和RNA-Seq 分析技术对LNCap 细胞的中的RLN1和RLN2 转录本进行测序。为了全面的鉴别RLN1 和RLN2 的变体,实验人员使用long cDNACap 和SMRT sequencing 检测LNCap 细胞,并且在与环状共识序列上(circular consensus sequences,CCSs)的RLN1-RLN2 位点进行比对,结果只检测到RLN1 基因,并未检测到RLN2基因。除此之外,科研人员还检测到了两条较长的RLN2突变转录本,它们分别与RLN1基因融合,生成两个融合转录本RLN1-RLN2-1和RLN1-RLN2-2。对新发现的融合转录本进一步解析,研究人员还研究了其具有编码的开放阅读框,以及解释了合转录本的表达和调控之间的关系,并发现RLN1 在PCa 细胞系中的表达不足。该实验可以说明,三代测序技术的转录本测序,不仅可以检测转录本的完整性,同时可以解释其变异类型,为后续研究提供可靠的基础。

为了进一步提高融合基因检测效率,CHRISTINA STANGL等[39]还基于纳米孔测序技术,开发了FUDGE(FUsion Detection from Gene Enrichment),一种基于纳米孔和测序通过CRISPR-Cas9靶向富集检测融合基因。FUDGE 靶向富集的原理是针对具有多个伴侣的融合基因,以其共有融合片段作为切割的靶点并设计引物,通过引物与PAM 的位置决定测序的方向。将提取好的DNA 进行去磷酸化,并使用我们设计好的引物引导Cas9 结合到目标靶点并切割,切割的端口处于磷酸化状态。由于Cas9 蛋白与能与PAM 远端发生结合,从而覆盖了这一端的磷酸化侧,而暴露了近侧的磷酸化末端。断裂的末端具有dA 尾能与适配器发生连接,从而将DNA 引导入纳米孔进行测序(图2)。理论上说,我们只对需要的序列进行富集,而无关序列则不会被检测,因此我们能在低通量的情况下得到我们想要的序列。不仅如此,该技术只对已知的伴侣基因进行切割。因此只需要了解其中一个伴侣基因的资料便可,不仅可以检测已知的融合以及其断裂点,也能检测到目前尚未发现的融合伴侣和断点,这对融合基因检测技术上来说是巨大的进步。

图2 CRISPR-Cas9靶向富集检测融合基因原理

4 总结与展望

TGS 测序是近些年出现的新型测序技术,在融合基因检测中的初步应用已显示出其检测优势。如通过检测白血病患者BCR-ABL1突变而指导临床用药;检测BCR-ABL1 融合位点作为生物学分子标记;以及检测发现新的未知融合伴侣和新的融合位点。上述均体现了TGS在融合基因检测方面具有不小的优势。尤其是基于纳米孔测序技术CRISPR-Cas9靶向富集的发明,使得研究人员在只知道其中一个融合伴侣的保守序列的情况下,可同时检测多个融合伴侣且获得其结构和断裂位点。随着三代测序技术的应用和检测方法不断地推陈出新,基于长读长高通量基因测序技术在肿瘤融合基因检测无疑拥有更为广阔的应用前景。

猜你喜欢
高通量测序基因
Frog whisperer
外显子组测序助力产前诊断胎儿骨骼发育不良
高通量血液透析临床研究进展
Ka频段高通量卫星在铁路通信中的应用探讨
修改基因吉凶未卜
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
创新基因让招行赢在未来
中国通信卫星开启高通量时代