赵飞燕,吴宇轩
华东师范大学 生命科学学院,上海市基因编辑和细胞治疗前沿科学研究基地,上海市调控生物学重点实验室,上海 200241
β-血红蛋白病(β-hemoglobinopathy)包括镰状红细胞贫血(SCD)和β-地中海贫血,均为常见的单基因遗传性血红蛋白疾病,致病机制主要为珠蛋白基因缺陷导致血红蛋白的珠蛋白肽链合成异常,从而形成无效的血红蛋白。SCD患者的β-珠蛋白第六位谷氨酸突变为缬氨酸;β-地中海贫血患者与其类似,因β-珠蛋白亚基突变而患病,迄今为止已发现200多种突变类型,主要出现α-珠蛋白过量、血红蛋白异常、红细胞损伤、氧运输能力下降,以及溶血、贫血等症状[1-2]。目前我国“地中海贫血”基因携带者约3 000万人,中度至重症地中海贫血患者约30万人,尤其以南方地区分布更为广泛,广西地区的发病率居于首位。全世界每年约有30万婴儿出生时患有镰状细胞病,还有数万名婴儿患有严重的β-地中海贫血。β-血红蛋白病由于居高不下的携带率和发病率,迫切地需要有效的治疗手段,从源头上根治该类疾病。
红细胞具有为人体的组织和器官供氧的作用,血红蛋白是红细胞中运输氧气的分子[3]。早在19世纪末人们就发现新生儿的血红蛋白与成人的血红蛋白相比对碱的敏感性不同。20世纪中期,人们证明胎儿血红蛋白与成人血红蛋白表型不同,描述了人类和几种动物发育过程中不同的血红蛋白种类的现象。20世纪70年代,胎儿血红蛋白向成人血红蛋白转换的细胞控制实验始于造血细胞红系培养技术的引入,并利用荧光抗体技术分析来自单个红系祖细胞生长的集落的亚克隆及组成亚克隆的细胞中产生的血红蛋白的类型。多数集落既含有合成胎儿珠蛋白的细胞,也含有合成成人珠蛋白的细胞,揭示了血红蛋白转换现象是由于同一干细胞谱系的细胞中发生的转录程序的变化[4-5]。20世纪80年代,人胎儿红细胞和小鼠红白血病细胞杂交后的杂交体主要表达人的胎儿珠蛋白,连续培养后转换为主要表达成人珠蛋白,并且体细胞杂交实验证明γ到β-珠蛋白基因转换可以发生在单个细胞系中[6]。卵黄囊早期主要表达ζ-珠蛋白和ε-珠蛋白,随着胚胎的发育逐渐由α-珠蛋白和γ-珠蛋白替代,成年后γ-珠蛋白水平降低,由α-珠蛋白和β-珠蛋白组成的成人血红蛋白增多。从ε到γ再到β-珠蛋白基因表达的转换只受转录水平的控制,而ζ到α-珠蛋白基因表达转换受一定程度转录后机制的调控[7-8]。
规律输血治疗、除铁治疗、药物治疗、脾切除等传统的治疗方法只能维持患者的生命,却无法治愈疾病。异体造血干细胞移植可以将仅含一个野生型HBB基因的造血干细胞移植入患者体内,有望根治这类单基因遗传性疾病。然而,这种移植技术受到移植物抗宿主病、免疫匹配供体缺乏、费用高昂等因素的限制[9]。基因疗法,即从分子水平上纠正突变基因的表达,成为SCD和β-地中海贫血治疗的新方向。基因治疗目前有两种方式:一是可以通过病毒载体递送,携带一个或多个治疗基因拷贝的载体转导至患者自体造血干细胞。但这种仅仅通过病毒载体递送的基因治疗策略,存在病毒载体制造复杂且非常昂贵、导入的基因转移载体持续存在于患者体内、治疗基因的表达水平难以精密调控、正常血红蛋白与异常血红蛋白形成嵌合体等问题,从而限制了病毒表达系统的临床推广价值[2,10]。二是通过基因编辑技术对自体造血干细胞进行基因修饰。这两种策略都是将具有正常HBB基因的造血干/祖细胞(hematopoietic stem/progenitor cells, HSPCs)或经过基因编辑的造血干/祖细胞重新移植入患者体内,随后基因修饰的造血干细胞进行自我更新并建立一个修饰细胞群体,该群体在分化时将转基因传递给子代血细胞,达到治疗目的,故称为HSPCs基因疗法。
在过去的几十年里,基因组编辑技术以惊人的方式发展,允许在体外和体内对许多不同的细胞类型进行遗传修饰。对某一靶点进行特异性基因组编辑常用的方法包括人工锌指核酸酶(zinc finger nucleases, ZFNs)、转录激活因子样效应核酸酶(transcription activator-like effector nucleases, TALENs)以及成簇的规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeats, CRISPR)/CRISPR 相关蛋白(CRISPRassociated proteins, Cas)系统,它们将引起目标基因的双链断裂[11-13]。通过非同源末端连接(NHEJ)或者同源重组修复(HDR),HSPCs基因疗法的基因编辑技术可以使有害等位基因失活、转录阻遏物表达或其结合位点失效,精确纠正突变或将健康基因插入宿主的基因组[14]。基因组编辑技术在体内发挥作用需要将功能元件以及相应基因片段递送入人体或动物细胞中,常用的递送技术包括逆转录病毒、腺相关病毒以及慢病毒等病毒载体转导法和电穿孔技术[15-20]。Cas9和单导向RNA(sgRNA)核糖核蛋白复合物的电穿孔递送技术能够克服常用的病毒载体递送技术脱靶率高、整合效率低、耗费时间久的限制,将基因组编辑工具瞬时脉冲递送至人类细胞[19-20]。
通过使用ZFNs或CRISPR/ Cas9基因编辑系统联合病毒载体或者RNP电转技术进行供体DNA模板递送,这种β-血红蛋白病基因治疗策略能够实现造血干细胞中HBB基因的同源重组,但基因编辑效率不高[18,21-23]。在β-珠蛋白缺乏的β-地中海贫血中,γ-珠蛋白表达的增加能够减少α和β-珠蛋白链的不平衡,减轻贫血症状。对于镰刀状细胞贫血症,胎儿血红蛋白(HbF)水平的升高干扰异常血红蛋白(HbS)的聚合(镰状化),从而改善SCD[24-25]。因此,胎儿血红蛋白再生可以作为治疗β-血红蛋白病的一种有效策略。
2.1.1 BCL11A基因及增强子的发现
Bcl11a是首先在髓系白血病小鼠中发现的一个常见的逆转录病毒整合位点,而后在人类中也发现了BCL11A基因,它作为B细胞恶性肿瘤原癌基因在正常的淋巴细胞发育过程中是必不可少的[26-27]。Menzel等[28]将F细胞(测量到胎儿血红蛋白存在的细胞)数量性状基因定位于染色体2p15上。随后,全基因组相关性分析(GWAS)广泛应用于寻找遗传连锁及其与HbF水平的关联,以及其他与红细胞相关的性状。GWAS提供了第一个遗传学证据,发现BCL11A基因与红细胞发育以及胎儿血红蛋白抑制相关,其编码一种锌指转录因子,作为一种重要调节因子能够直接与富含GC的基序结合,有助于开发治疗β-地中海贫血和镰状细胞性贫血的新方法[29]。有研究通过RNA干扰(RNAi)敲除红系分化终末期HSPCs的BCL11A基因,表明BCL11A为HbF的阻遏物,并且敲除后对细胞生长和分化没有明显影响[30]。在SCD转基因小鼠中红系特异BCL11A基因失活能够诱导高水平HbF从而纠正SCD相关的血液学和病理缺陷,单一基因失活实验确定了这种单一因素的贡献[31]。BCL11A和SOX6与GATA1共同占据人β-珠蛋白簇,在红系成熟过程中存在物理和功能上的相互作用,能够协同沉默成人红系祖细胞的γ-珠蛋白表达。其他参与调节的红系转录因子还包括FOG1、RUNX1和IKZF1等[32-33]。
GWAS精细图谱揭示了与HbF升高相关的单核苷酸多态性(SNPs)位于BCL11A的红系增强子处,包括三个红系特异性DNase I超敏位点(DHSs),根据它们与BCL11A转录起始点(TSS)的千碱基距离分别命名为+62、+58和+55。红系增强子内的单核苷酸替换对转录因子结合、BCL11A表达和HbF水平的影响不大,只会导致增强子活性的轻微损失,而BCL11A红系增强子的缺失会导致BCL11A在红系中不表达[34]。随后Canver等人[35]以 CRISPR-Cas9-sgRNA文库对HUDEP-2细胞增强子进行原位饱和诱变,揭示了GATA1结合位点赋予BCL11A红系增强子主要活性,该结合位点定位于+58的离散序列。
2.1.2 BCL11A红系增强子位点基因编辑
Chang等[36]通过使用锌指核酸酶靶向破坏人类骨髓CD34+造血干/祖细胞BCL11A基因,发现BCL11A基因2号外显子双等位基因移码突变在上调胎儿珠蛋白表达的同时降低了红系去核率,损害移植后的造血重建。这是由于BCL11A基因完全沉默。Brendel等[37]使用嵌入微小核糖核酸(microRNA)结构的shRNA(short hairpin RNA)(又称shRNAmiR)对BCL11A的敲除损害了人和小鼠HSPCs的长期移植,其原因是造血干细胞的衰竭。在正常或SCD HSPCs中利用β-珠蛋白位点控制区(LCR)-shRNAmiR载体表达的红系特异性shRNAmiR介导BCL11A抑制,产生的红系细胞BCL11A蛋白表达减少90%,60%~70%的γ-珠蛋白链表达以及HbF水平升高,并不影响基因修饰细胞的长期移植。后续,为了克服慢病毒载体(LVV)滴度低的问题研究者开发了一种新型慢病毒载体BCH-BB694。BCH-BB694慢病毒载体改造经历了几个发展阶段,包括应用聚合酶II驱动shRNA、将shRNA置于红系特异性启动子/增强子元件的控制之下以及改造载体骨架等,以>5的载体拷贝数和>80%基因标记率的临床前实验数据解决了各种限制临床适用性的问题。在红细胞特异性启动子控制下表达shRNAmiR的LVV转导自体造血干细胞,导致健康或镰状细胞供体CD34+细胞中γ-球蛋白基因再激活,并且不影响体外或体内基因修饰细胞的生长、分化和植入。作为RNAi用于单基因血液疾病基因治疗的第一个临床应用实例,这对使用shRNAmiR进行其他血液疾病的基因治疗具有借鉴意义[38]。
同样,针对BCL11A红系增强子,Wu等[39]利用Cas9:sgRNA核糖核蛋白介导+58 BCL11A红系增强子GATA1结合位点的切割,造成BCL11A表达的降低和胎儿γ-珠蛋白的诱导。该研究使用体外转录产生靶向BCL11A增强子的sgRNAs,并将RNP复合物电穿孔至健康供体CD34+造血干/祖细胞,在八个靶向CD34+HSPCs中BCL11A+58红系增强子核心的MS-sgRNAs中,编辑效率在66.1%~90.7%。该实验中用3xNLS-Cas9和MS-sgRNA-1617的RNP电穿孔进行基因编辑。3xNLS-Cas9是指SpCas9蛋白羧基末端附加两个SV40核定位序列(nuclear localization sequences, NLS)以及氨基末端附加了一个c-Myc-like的NLS。3xNLS-Cas9 RNP电穿孔方案在HSPCs中实现最大化编辑效率,在CD34+细胞中的indels率高达98.1%,其中最常见的突变是+1碱基对(bp)插入,其次是15 bp和13 bp缺失(图1)。它直接在+58 BCL11A增强子核心的GATA1结合基序内切割,导致HbF蛋白水平升高37.6%。实验结果表明,在sgRNA-1617切割位点的单碱基突变与较长缺失诱导HbF升高的水平一致。免疫缺陷型NBSGW小鼠体内实验表明,四个月后移植入编辑和未经编辑的CD34+造血干细胞的受者在骨髓中淋巴系、髓系和红系细胞的重建情况十分相似,并且编辑后的红细胞中BCL11A转录水平降低了80.0%,强烈诱导γ-珠蛋白水平从1.8%增加到46.8%。此外,研究人员还利用CIRCLE-seq证实了这种基因编辑极为安全,大量潜在脱靶位点以及可能的白血病突变位点没有异常突变。最后,编辑镰刀状贫血病患者来源的CD34+细胞校正效率同样高效,且在编辑后移植至小鼠体内能够重建人源血液系统,同时红细胞中HbF的提升水平足以帮助细胞对镰状化产生抗性,恢复正常细胞形态。而β-地中海贫血患者的红系后代珠蛋白链平衡恢复,证明了在造血干细胞中基于非同源末端连接修复的BCL11A增强子编辑是一种可行的治疗策略。
图1 CD34+ HSPC 3xNLS-Cas9 RNP BCL11A增强子编辑后深度测序结果[39]
遗传性疾病大多数是单核苷酸突变引起的,因此碱基编辑系统(base editing, BE)作为一种基因校正和体内靶向诱变的有力工具引起了科学家的广泛关注。Zeng等[40]利用电穿孔技术递送包括A3A(N57Q)-BE3和化学修饰的合成sgRNA的RNP复合物至人动员外周血来源的CD34+造血干/祖细胞。A3A(N57Q)第三代碱基编辑器(BE3)使用一个工程化的人APOBEC3A结构域,根据TCR>TCY>VCN等级优先脱氨基化特定基序中的胞苷,该结构域的特点以及N57Q突变均能有效减少非靶突变[41]。五种sgRNA分别产生不同的单碱基编辑效率,最高可达81.7%。与在同一靶点进行编辑的核酸酶系统比较发现,C>T或C>G的双等位基因碱基编辑产生与双等位基因indel相同水平的HbF诱导效果。此外,通过同时破坏BCL11A红系增强子和纠正HBB基因-28 A>G启动子突变,能实现有效的多重编辑。最后,小鼠体内实验表明A3A(N57Q)-BE3的RNP电穿孔策略可以在自我更新的人造血干细胞中产生碱基编辑,随后在体内有效诱导HbF表达。BCL11A增强子的单碱基编辑能够抵抗镰状细胞病人镰状细胞增多以及改善β-地中海贫血患者红系后代珠蛋白链不平衡的症状。
有临床试验表明,清除骨髓细胞后一名β-地中海贫血患者和一名SCD患者接受CRISPR/Cas9编辑技术靶向BCL11A增强子的自体CD34+细胞,12个月内患者骨髓和血液中的等位基因编辑效率仍保持较高,并且血液循环中超99%的红细胞表达胎儿血红蛋白。两位患者不再需要输血治疗,并且该疗法在SCD患者中消除了血管闭塞症[42]。综上所述,BCL11A红系增强子的基因编辑对红系细胞的负面影响较小,可作为一种有效且可持续的β-血红蛋白病细胞疗法。
研究人员发现一种罕见的良性疾病——胎儿血红蛋白遗传持久性(HPFH),常见的变异包括β-珠蛋白基因簇缺失以及γ-珠蛋白基因启动子碱基替换或微缺失。例如,包含β和δ-珠蛋白基因的β-珠蛋白基因簇中自然发生的大片段缺失导致HPFH,这种情况减轻了镰状细胞病和β-地中海贫血的临床严重性。研究人员通过CRISPR/Cas9策略破坏SCD患者来源HSPCs的一个13.6 kb基因组区域,该区域包含δ和β-珠蛋白基因以及一个假定的γ-δ基因间HbF沉默子。13.6 kb区域的缺失或倒置导致成人HbF合成的强烈激活以及镰状细胞表型的改善,这与表观遗传修饰和β-珠蛋白基因染色质构象变化有关。13.6 kb区域缺失导致HbF再激活的一个因素可能是β-珠蛋白增强子与γ-珠蛋白基因的并列,而13.6 kb区域的倒位同样使成人β-珠蛋白基因失活。13.6 kb区域构型的改变使LCR与γ-珠蛋白基因启动子重新结合,也可能削弱了假定的基因间沉默子的抑制活性,即消除HbF抑制序列[43]。
HBG基因启动子上存在许多HPFH突变(图2)。例如,HPFH可由γ-珠蛋白基因启动子-175 T>C点突变造成,使患者在整个成年期都表达γ-珠蛋白基因。为此,科学家使用TALENs靶向γ-珠蛋白基因启动子,同源重组引入-175 T>C点突变,从而重现了一个自然发生的HPFH相关突变。HBG1和HBG2基因表达增加而HBB基因表达减少,表明γ-珠蛋白向β-珠蛋白转换的逆转,这是由于该突变能够招募激活剂TAL1到γ-珠蛋白基因启动子上,通过促进上游增强子LCR与γ-珠蛋白基因启动子结合而增加胎儿珠蛋白的表达[44]。
图2 γ-珠蛋白启动子上的HPFH突变[45]
位于转录起始位点上游约115和200 bp区域的γ-珠蛋白基因启动子的点突变与胎儿γ-珠蛋白水平升高有关,它们分别是BCL11A和ZBTB7A的结合位点。有研究通过CRISPR/Cas9介导的基因组编辑使人HSPC的HBG1和HBG2基因启动子中横跨BCL11A结合位点的13-nt序列(102~114)发生缺失,删除的区域包含一个CCAAT盒和一个直接重复(DR),两者都通过招募转录阻遏蛋白(主要阻遏物为BCL11A)来介导胎儿出生后γ-珠蛋白向β-珠蛋白的转换。编辑后的HSPCs的HbF水平升高,为β-血红蛋白病的基因组编辑介导治疗确定了一个潜在的DNA靶点[46]。Metais等[47]通过CRISPR/Cas9破坏正常CD34+以及SCD供体CD34+造血干/祖细胞中转录阻遏物BCL11A结合的HBG1/HBG2基因启动子基序,在NBSGW免疫缺陷小鼠的体内研究中发现红系后代HbF水平诱导至治疗水平,且没有检测到脱靶突变。同样,有科学家利用Cas9:sgRNA和hA3A-BE3: sgRNA RNP电穿孔技术模拟血红蛋白遗传持久性患者中鉴定的HBG1基因启动子(102~114)天然存在的13 bp等位基因缺失和-114 C>T,证明了β-地中海贫血患者来源的HSPCs中高效的HBG基因启动子编辑破坏BCL11A结合域,导致红细胞终末分化率提高以及γ-珠蛋白再激活[48]。
ZBTB7A结合位点也是SCD和β-地中海贫血基因组编辑治疗的有效靶点。有研究设计了靶向γ-珠蛋白基因启动子-200区(-197、-196和-195)和-158区(-158、-152和-151)的导向核糖核酸,使用CRISPR/Cas9模拟HBG基因启动子中的HPFH突变,造成患者来源的造血干/祖细胞中阻遏物LRF结合位点的插入和缺失,进而导致γ-珠蛋白去抑制和镰状细胞表型的校正[49]。
研究人员使用CRISPR介导的基因组编辑模拟HPFH患者将人类红系HUDEP-2细胞中胎儿珠蛋白基因启动子-198位的T替换为C,体外和体内研究结果表明,该突变为转库激活因子KLF1创造了一个新的结合位点,HbF水平升高至20%,足以改善β-血红蛋白病的症状[50]。
胎儿到成人珠蛋白表达转换的关键调节因子除了BCL11A和ZBTB7A之外,核小体重塑和去乙酰化酶(nucleosome remodeling and deacetyla, NuRD)染色质复合物也是抑制HbF表达的关键因子,该复合物成分包括CHD4、GATAD2A、MBD2、MTA2和HDAC2[51]。γ-珠蛋白基因启动子中的TGACCA基序与CCAAT基序重叠,CCAAT基序主要由核转录因子Y(NF-Y)等转录激活因子结合,NF-Y喜欢近端基序,而BCL11A在体内优先占据远端基序(图2)[52]。胎儿体内BCL11A水平低时,NF-Y可能通过近端基序指导γ-珠蛋白的主动转录。成年后,体内BCL11A水平增加,BCL11A与γ-珠蛋白启动子远端基序结合,可能通过NuRD募集将染色质凝集化,从而阻止NF-Y结合并沉默γ-珠蛋白表达[24]。因此,多种NuRD成员与HbF的发育沉默有关。CHD4的条件敲除导致β-YAC转基因小鼠γ-珠蛋白表达激活,在原代人红系细胞中敲除CHD4也导致γ-珠蛋白表达的强烈增加[53]。敲除MBD2诱导γ-珠蛋白在人β-珠蛋白基因转基因小鼠[54]和人CD34+造血干/祖细胞衍生的成人红系细胞[53]中的表达。研究表明,GATAD2A、MBD2、HDAC1和HDAC2的基因敲除在成人红系祖细胞中产生类似效果[55-57]。
最近,有研究通过CRISPR/Cas9基因筛选鉴定了一种DNA结合蛋白ZNF410,在人类红系细胞中它是一种只特异性增强CHD4表达的HbF阻遏物,与传统转录因子结合并直接控制成千上万个基因表达的调控模式不同[58-59]。在成人红细胞培养系统和异种移植系统中ZNF410的缺失可降低CHD4水平并解除胎儿血红蛋白基因的抑制[58]。ZNF410的完全敲除不影响整个红细胞生成、造血和哺乳动物发育,这可能是因为CHD4的剩余水平足以维持细胞功能[59]。敲除潜在靶点使胎儿血红蛋白表达增强,为β-血红蛋白病的治愈带来新的希望。
几个核因子被认为有助于血红蛋白的转换过程,包括红系Kruppel样因子 (Kruppel-like factor, KLF1)[60]、 MYB[61]和核受体TR2/TR4[62]等。
敲除人类和小鼠成体红系祖细胞中的KLF1基因显著降低了BCL11A水平并增加了人类γ-globin表达,KLF1通过直接激活β-珠蛋白和间接抑制γ-珠蛋白基因表达来控制人类γ-珠蛋白向β-珠蛋白的转变[63-64]。在β-地中海贫血/HbE衍生的成红细胞中KLF1的实验性下调显著增加了HbF的产生(高达(52.3±2.4)%),但仍不足以缓解临床表型[64]。有研究使用CRISPR/Cas9靶向CD34+HSPCs中KLF1基因的第2和第3号外显子,造成较高的indel效率、KLF1和BCL11A转录物的下调以及γ-珠蛋白基因表达的升高。尽管KLF1基因编辑导致HbF水平增加高达25%且GUIDE-seq高通量测序技术未检测到脱靶,但RNA-seq分析中观察到KLF1基因敲除的负面影响[65]。KLF1不仅在血红蛋白转换中起作用,而且还协调数百种参与红细胞生成的必需红细胞基因的表达调节[66]。控制成人红系祖细胞中的KLF1基因表达可能提供了一种激活β-地中海贫血或镰状细胞病个体中胎儿血红蛋白表达的方法,但KLF1基因突变使红细胞终末分化略有延迟,并且不能缓解严重的表现型,直接操纵KLF1基因可能不是缓解β-血红蛋白病的可行方法[64]。
成人β-珠蛋白基因本身的校正,原则上可以应用于所有SCD和β-地中海贫血患者。但HDR主要发生在增殖的祖细胞中,而在造血干细胞中不太常见,导致长期移植细胞中的HDR发生率低于最初在编辑的细胞群中检测的编辑效率,从而限制了其临床应用。一种非常有前景的治疗策略是,通过敲除参与HbF抑制的基因或破坏γ-珠蛋白基因(HBG1/2)中几种转录因子的结合位点来诱导HbF,达到基因治疗的目的。这几种不同的CRISPR/Cas9基因破坏策略,HbF诱导均达到治疗水平,但BCL11A最具临床价值,是一个很好的基因治疗靶点,而HBG1/2可能是治疗β-血红蛋白病的一种有前途的替代方法,临床价值较高。
基因编辑技术实现了精准靶向的基因治疗,为未来基因缺陷性疾病的成功治愈提供了无限可能。相信随着基因编辑技术的发展和不断完善,会有更多新技术和方法问世,未来会有更多的HSPCs基因治疗研究成果成功向临床转化,更好地造福人类。
(2021年11月12日收稿)