基于CRISPR系统的基因编辑技术的研究进展

2021-12-02 07:08郑基坛综述闫娜娜左二伟审校
福建医科大学学报 2021年3期
关键词:碱基编辑器突变体

郑基坛(综述), 闫娜娜, 左二伟(审校)

CRISPR(clustered regularly interspaced short palindromic repeats)系统,即成簇的、间隔规律的短回文重复序列。该系统广泛存在于40%的细菌及90%的古细菌中,主要用于应对外源DNA或者病毒入侵的免疫防御[1]。根据该特性,Jinek等[2]将tracrRNA及crRNA整合形成单链引导RNA(small guide RNA,sgRNA),该sgRNA由5′端负责与靶序列互补配对的20个核苷酸及3′端参与Cas9蛋白识别的发卡结构组成,首次在体外实现对靶标序列的切割,为CRISPR/Cas基因编辑技术的广泛应用奠定了重要基础。随后,Cong等[3]和Mali等[4]同时发表CRISPR/Cas9系统应用于哺乳动物细胞基因组编辑的研究,极大地推动了基因编辑技术的发展与应用。2016年以来,Gaudelli等[5]和Komor等[6]基于脱氨酶与CRISPR/Cas9系统相继开发了胞嘧啶碱基编辑器(cytosine base editor, CBE)和腺嘌呤碱基编辑器(adenine base editor, ABE),Kurt等[7]和Zhao等[8]开发了C到G碱基编辑器(C-to-G base editor, CGBE),为基础医学和精准基因治疗提供了重要技术手段。2019年,Anzalone等[9]又开发了精准基因编辑工具引导编辑器(prime editor, PE),为单碱基编辑技术无法进行的编辑领域提供了另一重要选择。

1 CRISPR/Cas系统概述

1.1 CRISPR/Cas核酸酶介导的基因编辑技术 目前已经发现3种不同类型的CRISPR/Cas系统,其中第2类最为简单,只需要1种Cas蛋白参与即可完成对靶序列的识别与切割,更适合用于基因编辑,目前广泛应用的Cas9蛋白就属于第2类[1]。CRISPR/Cas在sgRNA的指导下,可对基因组靶序列进行切割,造成DNA双链断裂(double strands break,DSB)。DSB主要通过2种方式进行修复,即非同源末端连接(non-homologous end joining,NHEJ)与同源重组(homology-directed repair,HDR)。CRISPR/Cas造成的DSB通常在NHEJ修复方式下,造成特定位置的碱基插入或缺失,从而通过移码突变使基因丧失功能。因此CRISPR/Cas常被用于基因敲除的研究。这种修复方式经常会造成DNA的插入缺失、倒位和易位等问题,使得基因治疗存在严重的安全风险。另外,在含有双链DNA或者单链DNA同源重组模板供体的情况下,DSB可以通过HDR修复方式对基因组进行精准编辑,包括碱基替换、精准插入和精准删除等。但是,HDR一般发生于分裂细胞周期的G2和S期,细胞内主要以NHEJ修复方式为主,导致HDR介导的精准编辑效率很低。

但是,研究表明,CRISPR/Cas和sgRNA诱导的DSB可以导致基因组较大片段的改变,如易位或者大片段删除[10-11],或是激活细胞内p53通路[12-13]。而近期研究报道,Cas9蛋白即使在没有外源sgRNA的条件下,过表达也可激活多种细胞系中的p53通路,并促进p53失活型突变的选择性富集[14]。

1.2 扩展CRISPR/Cas基因编辑范围 Cas蛋白结合DNA靶序列需要有特定的前间隔序列邻近基序(protospacer adjacent motif,PAM)存在,极大限制了合适sgRNA的选择。最早开发并广泛应用的来源于化脓性链球菌(Streptococcuspyogenes)的Cas9蛋白所识别的PAM为NGG[15]。科研人员一直致力于开发识别不同PAM的Cas蛋白以扩展其应用范围,主要从以下2个方面进行研究:一是通过寻找不同来源的Cas蛋白,例如金黄色葡萄球菌(Staphylococcusaerou)来源的SaCas9识别“NNGRRT”PAM,具有的蛋白更小,更适合病毒包装递送到体内[16];二是通过构建Cas蛋白的不同突变体,例如SpCas9-EQR、SpCas9-VQR和SpCas9-VRER可以分别识别“NGAG”“NGA”和“NGCG” PAM。尽管这些不同来源或不同突变体蛋白可以识别不同PAM,但还是有很多位点难以编辑。2020年,Walton等[17]通过生物工程技术开发了一种SpCas9的突变体SpRY,该突变体几乎不需要PAM,可以靶向绝大部分基因组位置,并且具有较高的基因编辑效率。该进展突破了CRISPR/Cas系统因需要特定的PAM而产生的限制,为很多之前不可用的位点提供了被编辑的可能,极大扩展了其编辑范围。

1.3 提高CRISPR/Cas基因编辑特异性 Cas9蛋白的精确靶向编辑主要取决于它能够从基因组序列中识别能与sgRNA互补的靶向DNA,但也存在无法区别相似序列的情况,造成sgRNA依赖性脱靶。通过生物工程技术,工程化改变Cas9蛋白的氨基酸序列,能够降低脱靶编辑。Slaymaker等[18]通过筛选突变体发现了一种含有K848A、K1003A和R1060A突变组合的SpCas9变体eSpCas9(1.1),既可以有效编辑靶位置,又可以减少在非靶位置的编辑。Kleinstiver等[19]也开发了N497A、R661A、Q695A和Q926A突变组合的SpCas9-HF1突变体,该突变体具有更好的保真性。Chen等[20]研究了高保真性的Cas9蛋白减少脱靶的生化机制,研发了包含N692A、M694A、Q695A和H698A突变的高保真HypaCas9。eSpCas9(1.1)、SpCas9-HF1和HypaCas9是在一定理论基础上设计得到的,Casini等[21]在酵母系统里通过文库筛选的方法开发了新的高保真的SpCas9突变体,即evoCas9。Lee等[22]在大肠杆菌中应用文库筛选方案研发了名为Sniper-Cas9的高保真SpCas9突变体。总而言之,通过各种生物工程技术优化CRISPR/Cas系统,降低无法区别相似DNA序列的可能性,提高基因编辑的特异性,为应用于临床奠定基础。

2 基于CRISPR/Cas的单碱基编辑技术

单碱基编辑技术是基于CRISPR/Cas系统改造的新型基因编辑技术,可精确、高效地将DNA或者RNA中的一个碱基替换为另一个碱基。该技术因具有不产生双链断裂、无需供体、效率高、普适性等特点,成为基因编辑领域的新宠。目前,已开发的单碱基编辑器包括可将胞嘧啶(C)替换为胸腺嘧啶(T)的CBE[23]、将腺嘌呤(A)替换为鸟嘌呤(G)的ABE[5],以及最近新开发的可进行C到G碱基颠换的CGBE[7-8]。

2.1 CBE碱基编辑器 常用的CBE主要由大鼠的胞嘧啶脱氨酶(rApobec)、切口酶活性的nCas9(D10A)以及尿嘧啶DNA糖基化酶抑制剂(uracil glycosylase inhibitor, UGI)组成。胞嘧啶脱氨酶将编辑窗口的胞嘧啶(C)脱氨形成尿嘧啶(U),由CG配对变成UG配对的中间体,在DNA错配修复的修复机制下,U会被识别为T,实现CG配对向TA配对的转变,利用nCas9切口酶在非编码链上产生缺口,则会极大提高转变的效率,UGI的作用则是抑制细胞内碱基错配切除修复。

为了优化CBE编辑器,科研人员从许多方面进行改造,开发了许多改良版的CBE。例如通过增加核定位信号(nuclear localization signal, NLS)个数优化等构建的BE4max、AncBE4max或FNLS-BE3等,均可通过提高碱基编辑器的表达水平,提高编辑效率。CBE的编辑产物纯度不是很高,其中非特异性的产物包括靶位点处的C到A或G编辑、indels以及旁观者编辑(bystander editing)。科研人员通过融合多个UGI可以提高C-T编辑产物的纯度[6,24];还可以通过突变rAPOBEC1上与DNA的作用位点(例如YE1、YE2、YEE和EE等)将编辑窗口变窄,从而减少旁观者编辑[25]。Doman等[26]和Zuo等[27]报道了YE1突变体(YE1-BE4或YE1-BE3-FNLS)能够在保证编辑效率不下降的同时显著减少脱靶效率。另外,为了进一步扩大CBE的可编辑范围,可以将CBE中的SpCas9换成其他Cas蛋白或其突变体,如SaCas9、SpCas9-EQR、SpCas9-VQR、SpRY等,在不同PAM位点进行编辑[16-17]。

2.2 ABE碱基编辑器 ABE碱基编辑器由人工定向进化的腺嘌呤脱氨酶TadA和nCas9组成。TadA将靶序列的A脱氨变为肌苷I,随后在DNA复制过程中,I被当作G进行读码,最终实现A到G的替换[5]。

为了提高ABE碱基编辑效率,Koblan等[28]通过增加NLS个数及密码子优化构建的ABEmax显著提高了A到G的编辑效率。最近,该实验室又通过噬菌体辅助的非连续和连续进化(PANCE和PACE)技术手段,通过引入8个突变位点构建了ABE8e版本,其效率比ABE7.10提高了590倍[29]。虽然ABE相对CBE的保真性更高,但也存在大量RNA脱靶,Zhou等[30]构建的ABE7.10-F148A以及Grünewald等[31]构建的miniABEmax-V82G等均可显著降低RNA脱靶。

2.3 CGBE碱基编辑器 Kurt等[7]和Zhao等[8]研究报道,使用尿嘧啶-N-糖基化酶(uracil-N glycosylase, UNG)替换掉CBE系统中的UGI,构建了能够在哺乳动物细胞上介导C到G碱基颠换的新工具CGBE编辑器。前者还开发出可在原核生物中使用的C-A碱基编辑系统UNG-nCas9-AID,不过目前在真核生物细胞中还不能实现C>A的碱基改变。该编辑器的作用原理是在胞嘧啶脱氨酶的作用下,使靶序列的C变为U,然后在UNG的作用下去除U,形成一个无碱基无嘧啶位置(AP site),同时在nCas9的作用下切割互补链,造成该链断裂,随后进行DNA修复,遇到AP site时大概率以C填上去,随后复制形成C∶G互补配对,最后达到C到G的颠换。

2.4 单碱基编辑系统的脱靶检测 虽然碱基编辑系统简易高效,但也存在大量DNA和RNA脱靶效应。碱基编辑系统的脱靶主要分为sgRNA依赖性脱靶以及非sgRNA依赖性脱靶。sgRNA依赖性脱靶是指sgRNA错误识别基因组上与靶位点序列相似性很高的位点,引导Cas9发挥功能造成的脱靶。这类脱靶位点可以通过一些在线工具(例如Cas-OFFinder)根据DNA序列的相似程度预测,然后通过T7EI、Sanger测序或者高通量测序检测。非sgRNA依赖性脱靶指与sgRNA无关、无法通过软件预测、随机分布在基因组的脱靶位点。对于基因组水平的随机脱靶,研究人员建立了多种实验方法,例如SITE-Seq[32]、LAM-HTGTS[33]、GUIDE-seq[34]、CIRCLE-seq[35]等进行检测,但这些研究手段都存在一定局限性,不能高灵敏地检测脱靶突变。2019年,Zuo等[36]开发了新一代基因编辑工具脱靶检测技术——GOTI(genome-wide off-target analysis by two-cell embryo injection),该技术可在不借助任何脱靶位点预测技术的情况下发现之前脱靶检测手段无法发现的脱靶位点,显著提高了脱靶检测的灵敏性,为基因编辑工具的安全性评估带来突破性。对于转录组水平的随机脱靶,可通过转录组深度测序来检测[30-31]。

3 基于CRISPR/Cas的PE引导编辑系统

为实现任意碱基的插入、缺失或者替换,最近Anzalone等[9]报道了一种被称为Prime Editor的引导编辑器PE,不需要产生DSB及外源模板DNA存在的情况下,PE不仅能够实现12种不同方式的碱基替换,而且能完成任意碱基的插入、缺失。研究人员将逆转录酶与与催化能力部分缺失的Cas9蛋白(H840A)融合表达,并利用与之相应的pegRNA(prime editing guide RNA)最终实现靶位点的基因编辑。pegRNA主要包括3部分,主要在sgRNA的表达载体进行改造,5′端的sgRNA部分、sgRNA 3′端发卡结构后加入逆转录的模板(RT template)、与sgRNA反向互补的PBS(primer binding site)序列。模板DNA中包含需编辑的碱基序列,PBS序列作为逆转录引物结合位点,一般为13个碱基左右,成功将sgRNA、逆转录的模板、引物结合位点表达在同一条RNA上,在此基础上形成第一代PE1,碱基替换效率达0.7%~5.5%,插入和缺失效率达4%~17%。PE1虽然可以实现基因组的精确编辑,但效率相对较低。为进一步提高基因编辑的效率,将PE1融合蛋白5个位点进行突变,以提高逆转录酶热稳定性、合成能力、与DNA及RNA底物的结合、RNA酶H活性等,形成PE2,靶位点突变的效率提升了1.5~5.1倍。研究表明,在非编码链上产生切口,DNA在修复的过程中以编码链为模板修复,能极大提高修复的效率。因此,在pegRNA靶序列的下游设计一个sgRNA,利用PE2中Cas9 H840A在非编码链上产生切口,进一步提升编辑效率,建立PE3。相对于CRISPR/Cas9、CBE及ABE系统,PE有着不可比拟的优势。首先,PE利用切口酶nCas9(H840A),在编辑的过程中不会产生DSB,相对于CRISPR/Cas9介导的HDR或者NHEJ的修复方式,产生的插入或缺失突变更少。其次,PE以pegRNA为模板进行逆转录修复,不仅能够实现12种不同的碱基替换方式,还可以实现单个或多个碱基的插入或缺失,最长可达80个碱基。因此PE不仅可以修复因各种点突变造成的遗传疾病,还可以修复因碱基插入或缺失造成的遗传疾病,应用范围更广。再者,受到PAM及编辑窗口的限制,BE系统只能在有限的窗口实现基因编辑,考虑到NGG序列在基因组中出现的频率,PE则可以在任何位置实现编辑,不会受相应的限制。PE系统无论在生物学研究,还是在未来的临床治疗中都表现出广阔的前景,数据表明,89%的遗传疾病可以通过PE修复治疗。

4 CRISPR/Cas基因编辑技术在遗传疾病中的应用与限制

CRISPR/Cas基因编辑技术快速发展与优化的终极目标是使其应用于疾病治疗。目前,CRISPR/Cas相关技术已经成功应用于各种遗传性疾病的治疗。2020年,有1篇发表于《NEJM》的文章首次在临床中证实CRISPR/Cas9技术可有效治疗镰刀型红细胞贫血(sickle cell disease, SCD)和β-地中海贫血(β-thalassemia, TDT)。研究人员利用CRISPR/Cas9技术编辑1例SCD患者和1例TDT患者自体CD34+细胞的BCL11A基因,回输编辑后的细胞,12个月内2例患者在骨髓和血液中都有高水平的等位基因编辑,目前已不需要接受输血治疗[37];2018年,有2篇文章同时报道利用CBE对小鼠遗传性肝脏疾病进行了成体治疗[38-39];2020年,研究人员利用ABE实现了对先天性黑蒙症小鼠模型突变基因的高效修复,有效恢复了小鼠模型的视觉能力[40]。由此可见,基于CRISPR/Cas系统的基因编辑工具是可应用于基因治疗的。但CRISPR/Cas系统仍存在一些问题,其一就是编辑效率问题,影响成体治疗编辑率的可能因素有很多,首当其冲的就是递送系统,目前常用的递送系统主要为腺相关病毒(adeno-associated virus,AAV),但其载量有限,需将Cas9蛋白拆成两部分,共同递送到细胞内再结合发挥其作用,这在一定程度上影响了其编辑效率,因此,研发出更高效、安全的递送系统是推进CRISPR/Cas系统在基因治疗领域发展的一个重要方向。另一个问题就是安全性问题,到目前为止,尚未系统地分析CRISPR/Cas系统在体内发挥靶位置编辑的同时是否会产生一些不良影响,这也是亟待解决的问题。

5 展 望

CRISPR/Cas系统的发展速度惊人,这些工具已经改变了生命科学,使基础研究取得了许多进步,并为开发新一代基因疗法带来曙光,可以治疗甚至可能治愈人类许多具有遗传成分的疾病。之后的研究不仅要致力于进一步开发编辑效率更好、安全性更高的基因编辑工具,更需要开发高效且安全的递送系统,确保将基因编辑工具准确送到靶位置。此外,科研人员也需合乎伦理地规范应用基因编辑工具,造福人类。

猜你喜欢
碱基编辑器突变体
水稻胚胎和胚乳双缺陷突变体eed1的表型与遗传分析
水稻细长秆突变体sr10的鉴定与基因定位
华中农业大学番茄团队揭示番茄果实颜色形成的新机制
基因“字母表”扩充后的生命
司空见惯感觉烦 锁屏画面快走开
创建新型糖基化酶碱基编辑器
编辑精选APP
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
你距离微信创作达人还有多远?