基因融合与癌症发生发展关系及其致病机制的研究进展

2022-11-26 00:43阳雪兰
吉林大学学报(医学版) 2022年2期
关键词:激酶染色体蛋白

阳雪兰, 曾 雷

(吉林大学第一医院表观遗传医药研究所,吉林 长春 130021)

基因融合是指2 个或者多个不相关的异位基因所在的染色体发生重排,使这些基因处于同一套调控元件控制下,形成一种新的基因产物嵌合基因。与融合前比较,融合基因常具有不同的特征和功能。大部分基因融合是由于DNA 双链断裂导致染色体畸变而形成的[1],但是在恶性肿瘤中特定的外部或者内部因素是否对基因融合的发生有实质性作用,目前的研究尚未阐明。

染色体重排包括平衡重排和不平衡重排2 种形式[2-3]。典型的不平衡重排是染色体间质片段丢失,而平衡重排中保留重排染色体片段,不发生遗传物质丢失。其中最常见的染色体重排是易位,即染色体片段在染色体间的转移交换,这几乎在所有类型的肿瘤中都能检测到。相互易位产生的2 条衍生染色体,每一条都可能包含致病融合基因。平衡重排还包括插入(染色体片段在同一或另一条染色体的新的间隙位置)和倒置(染色体片段旋转180°)[2]。多数平衡性异常具有显著的特异性,与肿瘤类型、临床特征以及特征性的全基因组表达谱有关[4-6]。

1914年BOVERI 首次提出获得性染色体异常是癌症发生的原因,这一假设直到20 世纪60年代后 才 得 以 验 证。 1960年 NOWELL 和HUNGERFORD 在慢性粒细胞性白血病(chronic myeloid leukemia,CML) 中发现了人类肿瘤中的第一个特异性易位t(9;22)(q34;q11),研究[7]结果显示:9 号染色体长臂上的原癌基因ABL1 和22 号染色体上的BCR 基因重新组合形成了一种融合基因,即费城染色体。

20 世纪70年代早期,染色体显带技术(核型分析)被发现可用于识别每条染色体区域,检测染色体重排。之后多种细胞遗传学技术也被应用于癌症中融合基因的鉴定,包括应用探针与异常中期染色体杂交来寻找染色体断点的荧光原位杂交(fluorescencein situhybridization,FISH) 技术和准确定位断点的分子克隆技术(Southern 印迹杂交法和PCR 法)[8]。近年来高速发展的第2 代高通量测序技术等使癌症分类更加精确,诊断更加快捷[9-10]。随着细胞遗传学技术和融合基因鉴定技术的发展,研究人员陆续在多种人类肿瘤中检测到融合基因, 如在急性淋巴细胞白血病(acute lymphocytic leukemia,ALL) 中检测到t(8;21)(q22;q22)易位,在伯基特淋巴瘤中检测到t(8;14)(q24;q32)易位等[11]。

目前为止,在改进版的嵌合转录本和RNA-seq数据库(ChiTaRS 3.1),癌症相关转录本融合的整合资源数据库,以及癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中共收集到48117个融合基因,并鉴定出337 个参与良性和恶性肿瘤发生的融合基因[12]。其中,个别融合基因可以在多种恶性肿瘤中被检测到,如ETV6-NTRK3 融合基因在急性淋巴细胞白血病、婴儿纤维肉瘤和涎腺腺泡细胞癌等完全不同组织来源的肿瘤中均能被检测到[13-15]。但某些特定的融合基因仅在特定的恶性肿瘤中形成,是该恶性肿瘤的重要发病驱动,可以作为诊断该肿瘤的依据之一,如NUT 癌 中 的BRD4-NUT 融 合 基 因[16],急 性 早 幼粒细胞白血病(acute promyelocytic leukemia,APL) 中的PML-RARA 融合基因[17]等。由于一些融合基因在所有与恶性肿瘤发生相关的突变基因中占很大比例,如在血液系统恶性肿瘤(白血病等)中,已经确认的融合基因占已知的人类肿瘤融合基因的75%[1],因此血液肿瘤中的融合基因的功能机制和靶向治疗是生物医学研究的重点,并取得了许多关键成果。 如ALL 中的RUNX1-RUNX1T1 融 合 基 因,CML 中 的BCR-ABL1 融 合基因,APL 中的PML-RARA 融合基因等。在临床应用中,APL 可以通过全反式维甲酸进行治疗[18];CML 能通过伊马替尼等酪氨酸激酶抑制剂进行靶向治疗[19]。

然而,在大部分已知的实体肿瘤(间质瘤和上皮性肿瘤)中,许多关键的融合基因/融合蛋白的生物功能和作用机制尚不十分明确,融合基因和融合蛋白的相关致癌机制仍需深入探讨。虽然已有研究[20-21]报道阐述恶性肿瘤的发生与基因融合具有相关性,部分融合基因也与肿瘤的预后不良有关,但仅有少数研究探讨了导致肿瘤发生的融合基因的发病机制,因此融合基因在肿瘤中的发病机制研究仍具有广阔的研究空间。鉴于国内外报道尚缺乏对融合基因在恶性肿瘤机制研究中的充分阐述,本研究概括总结了已知融合基因致病机制,并将其分为4 类。这有助于深入了解融合基因在恶性肿瘤中的致病机制,对理解疾病的发生具有重要意义,有望为肿瘤的诊断和临床治疗提供新的方法和思路。

1 融合基因在癌症中的致病机制

1.1 融合基因促进基因表达当原癌基因与组成性表达基因融合时,如受体基因和免疫球蛋白基因等,原癌基因表达受到组成性调控元件的调控,引发原癌基因表达的持续激活,从而促进原癌基因的异常转录。在B 和T 细胞谱系的淋巴细胞白血病和淋巴瘤中,这种致病机制普遍存在,多种融合基因通过此机制诱导恶性肿瘤的发生。其中,伯基特淋巴瘤中涉及的就是典型的基因融合,由于存在3 种染色体易位:t (8;14)(q24;q32)、t (2;8)(p12;q24) 或t(8;22)(q24;q11),8 号染色体上编码MYC 蛋白的基因与编码免疫球蛋白重链(immunoglobulin heavy chain,IGH)、免疫球蛋白轻链K (immunoglobulin Kappa,IGK) 或免疫球蛋白轻链λ (immunoglobulin lambda,IGL) 的基因发生融合,产生IGH-MYC、IGK-MYC 和IGLMYC 融 合 基 因[22],导 致MYC 基 因 转 录 受 到 免 疫球蛋白元件的增强调控,使MYC 蛋白组成性过度表达。MYC 基因是一组癌基因,包括C-Myc、N-Myc 和L-Myc 等,MYC 癌基因的过表达异常地调节了Wnt-APC 和Notch 等多种信号通路,促进细胞紊乱生长和增殖[23-24]。这一由免疫球蛋白增强子驱动的基因异常高表达机制,在成熟B 细胞恶性肿瘤和B 细胞谱系急性淋巴细胞白血病中,分别占据所有已鉴定的基因融合机制的2/3 和1/4[1]。另外,在成熟T 细胞恶性肿瘤和T 细胞谱系急性淋巴细胞白血病中,也存在类似的融合基因调控机制,可以通过与T 细胞受体(T cell receptor,TCR)基因发生融合使其调控元件调节融合基因。有22 种不同的癌基因被确定为TCR 易位基因,常见的有LMO2、TAL1 和TLX1 基因[25]。

在实体肿瘤中, 隆突性皮肤纤维肉瘤(dermatofibrosarcoma protuberans,DFSP) 存在的COL1A1-PDGFB 融合基因也是利用此致病机制诱导癌症发生。DFSP 是一种常见的、生长缓慢的、易复发的恶性肿瘤。DFSP 起源于皮肤真皮层,占所有软组织肉瘤的1%~2%, 占所有肿瘤的0.1%[26]。COL1A1-PDGFB 融 合 基 因 是 由 位 于17 号染色体上的COL1A1 基因的可变部分与22 号染色体上的PDGFB 的外显子2 发生物质交换而形成的[27]。上述变化可能以平衡或不平衡的形式出现,致使COL1A1的调控元件取代PDGFB外显子2的上游序列,PDGFB 外显子2 的上游序列包含了PDGFB 转录和翻译的抑制因子元件,因此形成的COL1A1-PDGFB 融合基因使PDGFB 基因的翻译水平失去了上游抑制因子的调控,导致融合基因在COL1A1 基因调控元件启动下大量产生COL1A1-PDGFB 嵌合mRNA,所编码的PDGFB 蛋白表达水平的异常升高,激活PDGFB 及其相关的多种信号通路,参与促进细胞增殖和诱导肿瘤形成等病理过程[28]。融合基因的形成也上调17 号和22 号染色体扩增区的几种基因,包括TBX2、PRKCA、MSI2、SOX9、SOX10 和PRAME 基因等[29]。

除上述融合基因外,还存在其他融合基因通过该机制促进癌症的发生发展,如肉瘤中的BCORCCNB3 融合基因[30]和前列腺癌中的TMPRSS2-ERG 融合基因等[31]。

1.2 融合基因异常激活激酶活性当融合基因中存在激酶编码基因,表达的融合蛋白通常具有异常激活的激酶活性,导致激酶在无配体的情况下被激活。这种机制已经在多种血液系统恶性肿瘤和实体肿瘤中被发现,包括上皮细胞肿瘤、神经胶质肿瘤和脂肪细胞肿瘤等。费城染色体形成的融合基因就是典型的一种,其在超过90% CML 患者中均能检测到[32]。费城染色体是指位于22q11 染色体上的BCR 基因的3′端与位于9q34 染色体上的ABL1 酪氨酸激酶编码基因的5′端发生易位,形成BCRABL1 融合基因,其中包含BCR 蛋白的卷曲螺旋域和酪氨酸残基[33]。这种卷曲螺旋域有助于融合基因二聚化,导致在无配体的情况下ABL1 酪氨酸激酶活性异常激活,从而激活酪氨酸激酶介导的信号通路,促进细胞增殖并抑制凋亡发生[34]。因此开展费城染色体的标志物分析对血液肿瘤的诊断和预后预测具有重要意义。

在甲状腺癌和肺腺癌等中发现的CCDC6-RET融合基因,在胆管癌、乳腺癌和前列腺癌患者染色体中发现的CCDC6-FGFR2 融合基因,在胶质母细胞瘤、结直肠癌和卵巢癌患者染色体中发现的CCDC6-ROS1 融合基因等,均利用CCDC6 蛋白的螺旋状线圈结构域促进激酶蛋白二聚化,激活了激酶的催化活性,进而通过异常调节激酶介导的信号通路促进细胞生长,抑制细胞凋亡,并诱导肿瘤的发生[35]。

个别含有激酶编码基因的融合基因无异常激活激酶活性的功能,如B-ALL 中的RCSD1-ABL1 融合基因[33,36]。在激酶活性增强机制中,融合基因所编码的蛋白几乎都含有卷曲螺旋域,能够在无配体存在的情况下促进融合基因二聚化,从而实现激酶活性的异常激活。因此,融合基因所引起的二聚化是促进此机制发生的关键。

1.3 染色体重排后基因的功能丢失当染色体重排的位点位于抑癌基因中或其附近时,染色体重排后,抑癌基因或其位点附近的基因会发生缺失,从而无法实现抑癌作用,最终导致恶性肿瘤的发生并促进其发展。这种机制已经在血液系统恶性肿瘤和实体肿瘤中均得到了验证。在约50%的ALL 病例中均可检测到伴ETV6-RUNX1 融合基因的ETV6正常非易位等位基因的序列缺失,使ETV6 蛋白抑癌功能丧失,影响细胞造血功能,诱导ALL 的发生[37]。在小儿急性髓系白血病(pediatric acute myeloid leukemia,p-AML)中,CDKN2A/B 基因的缺失与ETV6-RUNX1 融合基因形成存在一定关联,影响细胞凋亡和细胞周期进程,因此CDKN2A/B 基因的缺失在p-AML 的发生发展中具有重要意义[38]。此外,在乳腺癌、宫颈癌和小细胞肺癌等患者实体肿瘤中也存在染色体重排后FHIT 基因丢失[39]。这些基因在染色体重排后的缺失影响疾病的预后,导致病情复发,但目前的研究尚未明确这种基因缺失在肿瘤的发生发展中的具体致病机制。

1.4 融合基因通过表观遗传修饰调控基因表达一类融合基因既不直接影响融合基因本体表达,也不包含激酶编码基因,因此不能增强激酶活性。但这类融合基因能够通过表观遗传在染色质上的动态修饰,调控靶标基因的表达水平,如NUT癌患者染色体中发现的BRD4-NUT 融合基因就是这类融合基因中的一种。NUT 癌是指伴有睾丸核蛋白基因重排的鳞状细胞癌,是一种罕见的组织起源不明、病因不明的高度侵袭性和高致死性癌症[16]。约75% NUT癌病例中发现NUT 基因与位于19q13.1 染色体上的溴结构域和超末端结构域(bromodomain and extra-terminal domain, BET)家族中的BRD4 基因发生易位,形成BRD4-NUT融合基因并编码BRD4-NUT 融合蛋白。该融合蛋白包含BRD4 蛋白的N 末端(氨基酸1~720)和几乎整个NUT 蛋白序列(氨基酸6~1127)[16,40-41]。在正常生理条件下,BRD4 蛋白作为转录辅助因子调控基因表达[42],NUT 蛋白仅保守地在减速分裂后的精子细胞中表达[20]。研究[43-44]表明:BRD4-NUT 融合蛋白可通过BRD4 部分的串联溴结构域(BD1 和BD2)结合染色质组蛋白上的乙酰化赖氨酸, 尤 其 是 H3K9ac、 H3K27ac、 H4K5ac 和H4K98ac,作为表观遗传识别器,并作为一种支架蛋白通过NUT 部分招募组蛋白乙酰化酶p300/CBP,富集于特定基因调控位点SOX2 和MYC 等癌基因,促进组蛋白高度乙酰化,并进一步招募RNA Pol Ⅱ和p-TEFb 等一系列转录调节因子,激活原癌基因转录,从而促进细胞增殖,增加细胞侵袭能力,抑制细胞自噬和凋亡。此外,尤文氏肉瘤中的EWSR1-FLI1 融合基因也是通过调节活性调节原件的表观遗传特征,增强增强子活性,从而异常调控相关基因表达,促进肿瘤增殖[45]。

在血液系统恶性肿瘤中,APL 中的PMLRARA 融合基因、AML 中的RUNX1-RUNX1T1融合基因和混合谱系白血病中的MLL 融合基因[46]也能通过表观遗传修饰调控基因异常表达,从而促进肿瘤发生。RUNX1-RUNX1T1 融合基因是由21 号染色体的RUNX1 基因和8 号染色体的RUNX1T1 基因发生染色体易位而形成的,RUNX1-RUNX1T1 融 合 蛋 白 与CBF β、 LYL1、E 蛋白TCF3 和TCF12、桥联因子LMO 及LDB1形成复合物,增加DNA 结合亲和力,抑制p300/CBP 共 激 活 因 子 的 招 募[47]。 同 时RUNX1-RUNX1T1 融合蛋白招募组蛋白去乙酰化酶(histone deacetylases,HDACs) 并与DNA 甲基化酶 1 (DNA methyltransferase 1, DNMT1) 和DNMT3A相互作用[48]。而在生理条件下,RUNX1蛋白能够招募p300 和TET 组蛋白去甲基化酶[47]。在病理条件下,RUNX1-RUNX1T1 融合蛋白利用RUNX1T1 片段在转录调控上发挥与RUNX1 蛋白相反的作用,从而抑制细胞的分化,促进细胞的自我更新和增殖,改变RUNX1 在造血细胞分化和成熟中的作用,在AML 发生的起始阶段发挥重要作用[49]。但是,这些融合基因如何作为转录调节因子,在肿瘤发生中的致病机制目前尚不十分清楚,需要进一步的研究。

2 总结与展望

由染色体重排产生的基因融合与多种肿瘤的发生发展相关,在肿瘤的分类、诊断、治疗和预后预测中起着至关重要的作用。随着测序技术的深度发展,大量的融合基因在人类肿瘤中得到鉴定。尽管融合基因具有致癌的驱动作用,但是目前对于融合基因研究较少,其作用和致病机制尚未完全明确,因此本文就现有的融合基因致病机制进行了探讨:其中融合基因通过上调基因表达、增强激酶活性、诱导基因缺失和调控表观遗传修饰等多种方式促进肿瘤发生,为进一步开展融合基因和融合蛋白的研究提供参考。

疾病的靶向治疗已成为临床治疗研究的热点。虽然在多种癌症中融合基因已被认为具有致癌作用,可作为潜在的特异性治疗靶点,但是只有少数临床药物在靶向融合基因疾病治疗中得到应用,在大部分融合基因相关的癌症中,特别是实体肿瘤中仍缺乏有效的治疗手段,因此亟需研究其致病机制,开发创新型药物。目前,BRD4 抑制剂[50]和p300 抑制剂[51]被用于NUT 癌患者的临床实验中,在治疗初期显示一定的药效性,但患者最终仍产生抗药性和药物毒性反应,显示融合基因在癌症致病机制的复杂性,因此深入研究融合基因的致病机制,将为寻找新的特异性潜在治疗靶点,研制全新的抗肿瘤药物提供新的方向。

目前研究仍难以明确融合基因产生的阶段和机制,尽管普遍认为DNA 双链断裂是导致基因融合的染色体畸变所必需的,但是尚未找到对DNA 双链断裂具有实质性影响的外部因素和内部因素。此外,在多个年龄阶段都已诊断出发生染色体重排和基因融合的肿瘤,如ETV6-NTRK3 融合基因在1 例患者散发性小儿甲状腺乳头状癌的7 岁患者和1 例患有类似乳腺分泌性癌的72 岁患者中被检测到[52-53]。因此准确地确定机体中不同类型的细胞出现染色体易位和基因融合的时机以及融合基因发生的因素和机制十分重要,这将为存在融合基因的癌症的预测和治疗提供理论基础。

猜你喜欢
激酶染色体蛋白
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
锌指蛋白与肝细胞癌的研究进展
细砂糖对法式蛋白糖的质量影响研究
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
水通道蛋白的发现
癌细胞“杀手”
真假三体的遗传题题型探析
抑制糖原合成激酶3a可减轻6—羟基多巴引起的SH—SY5Y细胞损伤
能忍的人寿命长