强晓 耿贝贝 刘四喜 夏婷
1天津科技大学生物工程学院(天津 300457);2深圳市儿童医院血液肿瘤科(广东深圳 518038)
急性白血病(acute leukemia, AL)是常见的血液系统恶性肿瘤疾病,AL 的发生和发展与染色体和基因异常密切相关[1-2]。在基因水平上主要是拷贝数变化、结构变异、缺失、插入或单核苷酸序列变异(single nucleotide variations, SNV)。基因水平的异常会导致AL 细胞转录程序的改变,通过这些改变的转录基因来推断白血病样本的细胞来源和分型,进而指导AL 患者的治疗方案和预后[3]。同时,也可对这些改变的转录基因进行干扰,为AL患者的靶点治疗提供新的策略[4]。因此,转录组学技术在AL 诊治中的研究越来越受到国内外学者的广泛关注,是目前研究的热点,但既往相关的综述较少。根据转录组学研究技术的发展先后分为微阵列技术和测序技术,目前常用的是后者。在测序技术中RNA 测序(RNA-sequencing,RNA-seq)技术近年发展迅速,被广泛应用。利用RNA-seq 技术,不仅能够检测出细胞中所有的基因表达水平,还可以识别mRNA 水平的结构改变,包括选择性剪接和融合基因,而融合基因是导致白血病发生的关键致癌驱动因素[5],为白血病的治疗和诊断提供有价值的依据。本文基于转录组学技术,尤其是RNA-seq 技术在AL 诊断与治疗中的研究应用作一综述,为AL 分子生物学提供新的理论基础,也为AL 的治疗提供新的靶标。
在AL 的诊断、治疗及预后判断过程中,基因异常是一项重要指标,而以往常用的检测方法无法发现一些较为隐匿的基因融合和在转录过程中发生的序列变异[6]。近年研究发现RNA-seq技术可以检测出全部融合基因,且不受染色体断裂及基因重组等因素的限制,为发现隐匿融合基因提供了新的方法和手段[7]。多项研究利用RNA-seq技术发现了多种新的融合基因,如IGKV4-1-IGKC,HBA2-HBB,ETV6-NID1,IKZF1-NUTM1。此外,RNAseq 技术还可检测AL 基因的局部变化,如:SNV、序列插入和丢失等,以及不同的转录异构体、剪接变异体等,为AL的诊断与分型提供了可靠依据[7-8]。
1.1 急性髓系白血病急性髓系白血病(acute myeloid leukemia,AML)的发病原因是由基因突变或表观遗传学变化导致髓系前体细胞无限增殖和成熟停滞,从而产生未成熟的髓系细胞的克隆[9]。AML 在儿童和成人中均有发生,目前根据世界卫生组织血液恶性肿瘤分类将AML 区分为六大类,在AML 病例中,仅有50% ~ 55%的遗传变异可通过风险评估进行精确分类,当前使用的技术平台中,AML 的诊断和风险评估存在着复杂、昂贵且结果信息不完整的问题[10]。
近年RNA-seq 技术在AL 诊断方面的应用弥补了当前不足。ARINDRARTO 等[11]利用RNA-seq技术建立了一个专业、全面和灵敏的人类急性髓细胞白血病快捷转录组学(human AML expedited transcriptomics, HAMLET)平台用于AML 诊断。HAMLET 可以同时检测融合基因、微小变异、串联重复、易位和基因表达水平,对AML 进行分类和风险评估。目前该平台已作为常规诊断程序在莱顿大学医学中心应用,为AML 分类、风险评估和靶向治疗提供更为准确全面的诊断信息,大大推动了AML 的风险分类和个性化医疗。江梅等[12]利用RNA-seq 技术对3 例染色体核型正常的AML 患者进行转录组学分析,结果发现3 种少见型融合基因BCR-FGFR1、CPSF6-RARG和NUP98-RARG。而这些融合序列存在微缺失或者隐匿性较强的特点,不易被其他检测手段发现和鉴定。RNA-seq技术的应用提高了这些少见型融合基因的测出率,从而增强了AML 的诊断精准度。
1.2 急性淋巴细胞白血病急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)在儿科各种恶性肿瘤的发病率中居于首位[13]。ALL 的基因组特征之一是染色体易位,它会导致产生新型特异性融合蛋白,新的融合基因的发现对于ALL 的诊断、靶点治疗和预后具有重要的临床意义。和T系ALL相比,B 系ALL 患者的复发率高,预后依然不佳。费城染色体样(Ph)染色体是ALL 中最常见的染色体异常,在B 细胞发育基因中参与的缺失频率高达82%,Ph 染色体异位后产生BCR-ABL1 融合基因,占所有急性前体B 淋巴细胞白血病(precursor B cell acute lymphoblastic leukemia, preB-ALL)病例的20% ~ 30%,BCR-ABL 亚型ALL 对L-天冬酰胺酶和柔红霉素有较强的耐药性,因而这种类型患者的治疗效果不佳,是一种高风险ALL 亚型[14]。RNA-seq 技术可检测出BCR-ABL1 融合基因,从而大大提高了Ph 样ALL 的诊断精准度,为高危ALL的治疗提供重要的临床线索[15]。YASUDA 等[16]利用RNA-seq 技术分析了354 例ALL 患者的转录组,在193 例15 ~ 39 岁ALL 患者的B 细胞中发现IGH基因座中频繁插入含有DUX4 基因的D4Z4 重复序列,导致具有C 末端的DUX4 蛋白过度表达。另发现DUX4 基因融合仅在15 ~ 39 岁ALL 患者中检测到,提示该年龄段与其他年龄段ALL 患者表现出不同的临床特征和DUX4 基因融合密切相关,RNA-seq技术为此年龄段的ALL诊断和预后提供重要的临床参考。另外染色体t(12;21)易位会导致两个关键造血转录因子ETV6 和RUNX1 的嵌合转录,形成新的融合基因,致使特异性促进祖B 淋巴细胞扩增,并阻碍B 淋巴细胞的分化,从而导致B系AL 的发生,利用RNA-seq 技术检测出异常的ETV6-RUNX1 融合基因,为ETV6-RUNX1 阳性ALL的靶向治疗提供新的手段[17]。综上所述,RNA-seq技术在AL 中的应用,能够发现AL 转录组中更多的融合基因,提高ALL 诊断准确率,并为临床治疗提供更加可靠的依据。
AL 目前主要根据患者的细胞遗传学、分子生物学和诱导治疗后微小残留病进行风险分层,不同的风险分层对预后有显著差异[18-19]。利用RNAseq 检测结果对AL 进行风险分层,根据潜在的生物标志物和靶点,对高风险患者选择精准的靶点治疗方案,对于提高临床预后具有积极的意义[20]。
微小RNA(microRNA,miRNA)具有丰富的生物学功能,在AML 的发病机制和预后中起着关键作用。ESPERANZA 等[21]利用RNA-seq 技术分析了110 例AL 患者的转录组学,结果发现24-miRNA标记与白血病干细胞评分和患者的潜在遗传学显著相关。并且24-miRNA 标记提供了AL 的表观遗传学数据,整合到遗传学、微小残留病和干细胞相关白血病的评分中,以完善儿童AML患者的风险分层,结合临床学表现,构建一套简单、有效的评分系统。另有研究者利用RNA-seq 技术对1 362 份患者样本进行了miRNA 测序,经分析确定了36 个miRNA 表达水平与患者复发率高度相关。随后建立了一个基于这36 种miRNA 的风险分类系统——AMLmiR36,此系统可对不同复发风险的患者进行预测,更好地指导临床治疗[22]。
除了miRNA 外,非编码RNA 中的长链非编码RNA(long noncoding RNAs, lncRNA)的异常表达也在白血病的发生和预后预测中起着重要的作用。LI 等[23]使用lncRNA 微阵列和RNA-seq 技术分析了7 个N6-甲基腺苷相关的lncRNA 风险信号,经竞争性內源RNA 网络和功能富集分析后,结果发现这7 个与N6-甲基腺苷相关的lncRNA 可以充分预测AML 的预后,为AML 患者提供新的治疗靶点。
白血病复发是影响临床预后和治疗效果的主要原因,而导致复发的生物学因素尚不明确。STUKAITE-RUIBIENE 等[24]通过RNA-seq 技术对复发的高危B 系ALL 患者进行转录组测序,结果发现新的基因融合-NUP214-ABL1。此基因在B 系ALL 中罕见,会导致JAK 激酶(属于酪氨酸激酶)信号异常,预后不佳。经体内试验显示具有这种NUP214-ABL1 融合基因的B-ALL 患者对酪氨酸激酶抑制剂(tyrosine kinase inhibitor, TKI)—伊马替尼敏感,结果提示可选用TKI 作为NUP214-ABL1基因融合的B 系ALL 的靶点治疗。此外,基于RNA-seq技术,在preB-ALL亚型中发现含有MEF2D融合,针对这种基因融合选用组蛋白脱乙酰酶抑制剂(如伏立司他和帕比司他)对preB-ALL 患者进行治疗,可显著改善了患者预后,使患者的5 年总生存率从50%以下增加到75%[25]。KERBS 等[26]利用RNA-seq 技术对806 例AML 患者进行融合基因检测,结果发现157 个的新型候选融合基因,与ChimerDB 或Mitelman 数据库比对后,有14 例患者中有新型复发融合基因,其中包括NRIP1-MIR99AHG融合基因和融合基因。因此,RNA-seq 技术在提高融合基因的全面系统检测方面具有很大潜力,为其临床应用提供了有利工具。总之,利用RNA-seq技术是识别 AL 中新的融合基因,并针对融合基因对AL 进行更精准的诊断和分型,从而指导AL 的靶向药物治疗,能有效改善患者预后。
目前利用RNA-seq 技术检测AL 样本中的所有RNA 转录组,以研究基因结构和功能,并发现新型融合基因。但呈现的是所有RNA 的平均数据,不能很好地描述细胞之间的基因差异,也不能准确地判断表达异常的基因是所有细胞还是某种细胞群引起的。而近年来迅速发展起来的单细胞RNA 测序(single-cell RNA sequencing,scRNA-seq)技术能够提供组织或器官中每个细胞的RNA 表达谱,揭示每种细胞的转录状态,从而鉴定出样本中基因差异的细胞亚群和细胞异质性[27-28]。VAN GALEN 等[27]对16 例AML 患者和5 例健康人骨髓抽吸物中的38 410 个细胞进行scRNA-seq 和基因分型,并通过机器学习对细胞进行分类。结果发现与健康个体相比,AML 患者中含有6 种与AML密切相关的恶性细胞亚群(造血干细胞样、祖细胞样、粒细胞-巨噬细胞祖细胞样、原单核细胞样、单核细胞样以及传统树突状细胞样恶性细胞亚群)。其中造血干细胞样和祖细胞样恶性细胞亚群富含FLT3-ITD基因突变,单核细胞样恶性细胞亚群富含FLT3-TKD基因突变,促进AL 的发展。同时发现富含FLT3-ITD基因突变的造血干细胞样和祖细胞样恶性细胞亚群患者预后更差。这项研究结果揭示了不同细胞亚群与AL 的发生发展密切相关,针对AML 细胞亚群的精准药物治疗和免疫治疗,为提高AML 的预后提供了新的策略。WITKOWSKI 等[28]采用scRNA-seq 绘制了健康人群和处于诊断、缓解和复发3 个不同阶段的B-ALL患者的骨髓免疫微环境综合地图,结果发现在诊断和复发的B-ALL 患者中存在非经典单核细胞在髓样区内富集和重新出现,并且单核细胞数量增加的B-ALL 患者生存率较差。在B-ALL 小鼠模型中,通过阻断CSFR1 受体靶向非经典单核细胞,致使其数量减少,进而增强B-ALL 对TKI 的化疗敏感性,提高生存率。这项研究表明,scRNA-seq 技术可以更好地分析AL 不同发展阶段的RNA 表达谱,并为不同阶段的B-ALL 患者治疗提供更精准的靶向方案。烟酰胺腺嘌呤二核苷酸(NAD)的消耗是B-ALL 的一种潜在治疗方法,LIN 等[29]利用scRNA-seq技术在51例B-ALL患者中寻找NAD代谢相关基因(NMRGs),结果通过机器学习从23 个差异表达NMRGs 中找到3个生物标志物(NADSYN1,SIRT3 和PARP6),从而为B-ALL 复发治疗提供相关靶点。总之,scRNA-seq 技术的应用极大地推进了遗传学领域的发展,使不同细胞亚群得以精细区分,从而在单细胞水平进行AL 机制研究,指导AL 的靶向治疗。但是,目前单细胞测序技术依然存在成本较高、分选细胞时容易被污染、容易受到损伤等弊端,有待进一步完善。
由于AL 可能涉及多种机制的基因异常,因此单一水平的组学数据不能全面地解析AL 的发生发展机制,而将转录组、基因组和蛋白组数据联合分析能弥补使用单一技术在AL 研究中的不足。染色体易位t(8;21)是AML患者中最常见的细胞遗传学异常,重排后AML1的DNA结合结构域与转录抑制因子ETO 融合,导致AML1-ETO 融合转录因子的表达,而AML1-ETO 进一步抑制正常AML1 功能的转录活性,阻断其分化并促进自我更新。数据非依赖性的扫描模式(data-independent acquisition,DIA)是一种新的质谱数据采集方式。与此技术结合的蛋白组学称为DIA 蛋白组学。SCHNOEDER等[30]采用DIA 蛋白组学与转录组学结合,研究发现AML1-ETO 型白血病的PLCG1 蛋白表达显著变化。AML 中PLCG1 的基因失活可抑制AML1-ETO 依赖的自我更新、白血病增殖和体内白血病维持。结果表明PLCG1通路可作为AML1-ETO 阳性AL 的重要治疗生物标志物,为AL临床治疗提供了新的思路。
RNA-seq 技术与其他技术[如全基因组测序(whole-genome sequencing,WGS)、全外显子组测序(whole-exome sequencing,WES)、全免疫组测序等]联用通过对遗传组信息和多组学数据综合分析,能够为揭示AL 的发病机制与预后提供更多的实验证据[31]。CHEN 等[32]将WES 和RNA-Seq 联合应用,对61 例成人和69 例儿童T 系T-ALL 样本进行基因组和转录组特征的鉴定。结果发现突变率> 3%的基因有48 个,其中有6 个为新发现的突变基因:PAK4、CELSR3、MINK1、NR4A1、BOD1L1和VCP,并且检测到NOTCH1,FBXW7,PHF6,JAK3,PTEN和JAK1基因的突变率较高(74.6% ~ 10%)。随后通过转录组学功能分析,发现这些> 3%的突变基因被聚集在七个功能类别中:NOTCH1 通路、信号通路、表观遗传因子、转录因子、细胞周期调节因子、翻译和RNA 稳定性相关分子以及其他功能,将突变基因及其在疾病中的功能联系起来。LAI等[33]将RNA-seq、WGS、WES以及单核苷酸多态性阵列技术联用,分析了2 例具有亲缘关系(父子对)的AML 患者的基因组和转录组图谱。结果发现2 例患者有超过200 个常见外显子突变基因,在这些基因中父子双方都有FLT3 突变,且在AML 中的表达增加。结果提示AML 可能是多个基因联合作用的结果。KIMURA 等[34]将RNA-seq 和WGS技术联用,分析了3 221例新诊断的和177例复发的B-ALL 患者的基因组和转录组图谱。结果发现CDX2 失调,融合基因UBTF-ATXN7L3 能够迅速诱发特征明显的AL。因此,CDX2/UBTF 独特的基因组和临床特征可能有助于指导青少年和年轻成人白血病患者在诊断时进行预测,并改善预后。综上所述,转录组学与其他方法学的联合使用可以站在基因表达全局对AL 进行研究,扩大研究层面从而指导白血病的诊断分型、预后风险分层和靶向治疗。
目前RNA-seq 技术较成熟,是研究AL 转录组的常用技术。通过RNA-seq技术在RNA层面对AL的基因结构和功能能够更精准地分析,更好地揭示AL 的生物学特征和疾病发生发展的分子机制,为AL的临床诊断和靶点治疗提供了更精准的手段,在AL的诊治中发挥着不可替代的作用。在AL的诊断中,RNA-seq 的一个关键优势是能够更灵敏地识别那些非常隐蔽、采用传统诊断方法检测可能被遗漏的融合基因和结构异常基因,从而对AL 进行更精准的亚型分类。在AL的临床治疗中,RNA-seq能根据识别的特征分子标志物和异常基因,对不同患者人群进行AL的复发风险评估以及采取精准靶向治疗,具有独特优势。随着RNA-seq 分析AL 样本量的增加,目前RNA-seq 技术在AL 诊断和治疗中的应用,主要面临数据分析与可视化方面的挑战。针对以上问题,将来需要提供一个或多个RNA-seq数据共享平台,统一RNA-seq 结果的临床报告通用规范,以便更好地利用AL 转录组学资源,实现AL的精准分析与临床应用。另外,RNA-seq对AL的数据分析,需要与具有临床背景的数据库及其他组学数据库结合,能够全面地分析AL 患者的个体化差异,将来为AL精准医疗提供更精准的生物学信息。相信随着转录组技术应用的不断深化,将拓展AL发生发展的分子机制,为AL 患者精准个体化治疗提供新的策略,以提高AL患者的疗效及预后。
【Author contributions】QIANG Xiao wrote the article. GENG Beibei performed the investigation. LIU Sixi performed the conceptualization. XIA Ting revised the article. All authors read and approved the final manuscript as submitted.