CRISPR/Cas9系统技术难关:脱靶效应及其优化方法

2023-03-30 10:56于宗菲翁丽涵孙诚诚曹晓钰
关键词:变体靶向特异性

于宗菲 翁丽涵 孙诚诚 曹晓钰 叶 振

1. 山东第一医科大学(山东省医学科学院)临床与基础医学院,山东 济南 250117;2. 山东第一医科大学(山东省医学科学院)第二附属医院中心实验室,山东 泰安 271000

作为第三代基因编辑技术,CRISPR/Cas9 系统在基因编辑特异性以及效率方面的优越性赶超锌指核酸内切酶(zinc-finger nucleases,ZFNs)和转录激活因子样效应物核酸酶(transcription activatorlike effectors nucleases,TALENs),但其存在的脱靶问题至今仍未完全解决,严重限制了CRISPR/Cas9系统的进一步发展。在生物体研究中,脱靶意味着基因编辑的准确性低,基因治疗效果得不到保证。目前,科学家们仍致力于开发和研讨如何使脱靶效应最小化。因此,亟需明确CRISPR/Cas9 系统潜在的可产生脱靶效应的环节,并对此制定降低脱靶效应的策略,解决了脱靶效应的限制,CRISPR/Cas9 系统基因编辑潜力会得到更充分的发挥。

1 CRISPR/Cas9系统

1.1 CRISPR/Cas系统概述

CRISPR作为基因编辑领域3大编辑工具之一,经证实为细菌和古细菌免疫系统的防御武器。CRISPR/Cas 系统由成簇的规律间隔短回文重复基因序列CRISPR与Cas基因家族共同组成。CRISPR基因序列主要包括3部分:基因前端的前导序列、短而高度保守的重复序列以及大量间隔序列。CRISPR 通过间隔序列与靶基因进行识别并形成分子记忆,当相应的外源DNA 再次入侵时,CRISPR/Cas 系统可发挥精准靶向作用[1]。Cas 基因也称CRISPR关联基因,位于CRISPR基因周围或分散在基因组其他位点,编码的蛋白可与CRISPR 序列发生作用。根据编码蛋白的不同可将CRISPR/Cas 系统分成单Cas蛋白复合体和多Cas蛋白复合物2类,分别包括Ⅱ型、Ⅴ型、Ⅵ型和Ⅰ型、Ⅲ型、Ⅳ型[2]。其中Ⅱ型CRISPR/Cas 系统中的Cas9蛋白已广泛应用于基因工程。

1.2 CRISPR/Cas9的作用原理

第一步:俘获外源基因。Cas1和Cas2蛋白识别出首次入侵的外源DNA 的前间隔区序列邻近基序(protospacer adjacent motif,PAM)区域,选取与PAM邻近的靶基因进行切割,进而将这一靶基因序列整合至CRISPR 序列前导区下游,作为一种分子记忆来防止同一外源基因的后续入侵[3]。第二步:sgRNA-Cas9 复合物的合成。CRISPR 基因进行表达,在前导区的调控下,CRISPR 序列转录形成前体crRNA(precursor RNA, pre-crRNA)和 反 式 激 活CRISPR RNA (trans-activating CRISPR RNA,tracrRNA),随后pre-crRNA 在RNase Ⅲ核酸酶的加工剪切下成熟。成熟的crRNA(CRISPR RNA)与tracrRNA 结合组成sgRNA, Cas 蛋白与sgRNA 组成最终的复合物[4]。第三步:靶向干扰。复合物通过与识别出的PAM 序列相结合。由Cas9 酶的HNH(作用于与crRNA 互补的链)和RuvC(作用于非互补链)核酸酶结构域切割入侵基因[5],DNA 双链被解开,形成“R-Loop”(图1)。当存在同源DNA 序列时,断裂位点可进行精确的同源重组修复(homology directed repair,HDR)。源DNA 序列时,断裂位点将依靠DNA 连接酶进行非同源末端连接(non-homologous end joining,NHEJ)[6]。

图1 CRISPR/Cas9系统的作用原理

1.3 CRISPR/Cas9系统在医学肿瘤领域的应用

CRISPR/Cas9系统促进肿瘤基因水平治疗突破性发展,如构建肿瘤模型、靶向敲除癌基因致病位点、恢复抑癌基因活性、减少肿瘤细胞耐药性、进行肿瘤免疫治疗等。Ciampricotti 等[7]使用CRISPR/Cas9 体细胞编辑技术获得RLF-Mycl 基因融合的小细胞肺癌(small cell lung cancer, SCLC)小鼠模型,与人类RLF-MYCL SCLC 的基因表达相似。RLFMYCL融合加速了小鼠SCLC的转化和增殖,增加了转移性传播和转移部位的多样性。研究发现,利用CRISPR 技术敲除肺癌患者程序性死亡受体-1(programmed cell death protein 1,PD-1)可促进T 细胞启动免疫反应肺癌[8]。Dong 等[9]发现敲除RNA解旋酶DHX37 基因可提高抗原特异性CD8+T 细胞对 三 阴 性 乳 腺 癌(triple negative breast cancer,TNBC)免疫治疗靶点上的有效性。Kim 等[10]使用CRISPR 技术编辑的CD33 基因敲除的造血干细胞和原代细胞可以产生功能性造血,但对抗原靶向治疗有抵抗力,不受CD33靶向CAR-T细胞的影响,使CAR-T 细胞免疫治疗急性髓系白血病成为可能。Wang等[11]对TNBC小鼠模型进行体内CRISPR基因剔除(knockout, KO)筛选发现,在癌细胞中删除E3泛素连接酶Cop1 会减少巨噬细胞相关趋化因子的分泌,减少肿瘤巨噬细胞浸润,增强抗肿瘤免疫力,并加强免疫检查点阻断(immune checkpoint blockade,ICB)治疗癌症。CRISPR/Cas9技术介导实现基因敲除肽基丙基异构酶A (peptidylprolyl isomerase A,PPIA),有效提高了多发性骨髓瘤细胞对蛋白酶体抑制剂的敏感程度[12]。

2 CRISPR/Cas9系统的脱靶效应

设计的特异sgRNA 与非靶位点DNA 序列形成错配,导致基因位点发生非预期的突变,称为脱靶效应(off-target effects)。非靶位点的sgRNA 局部错配的形式有2 种:(1)脱靶DNA 序列与sgRNA 只出现碱基的错误匹配,长度一致;(2)脱靶DNA序列与sgRNA的长度不同,通过DNA序列的插入或缺失使其出现碱基错配[13]。研究显示,脱靶不仅会降低基因组编辑效率,还会导致染色体的重新排列,甚至会破坏不完全匹配的基因[14]。除此之外,还可能会导致功能基因丧失活性[15]。

2.1 影响CRISPR/Cas9系统脱靶的因素

2.1.1sgRNA 对脱靶的影响 sgRNA 与靶序列的错误匹配是造成脱靶现象的关键因素。研究显示,在一定范围内,体内sgRNA质粒转染的相对浓度越低,靶点的专一性越高[16]。酵母双杂交实验研究显示[17],短sgRNA序列与标准sgRNA序列相比,前者的脱靶率更低;且脱靶出现的概率和sgRNA序列与靶基因sgRNA序列的同源程度呈正相关。研究表明,在不降低切割活性的基础上,将sgRNA 5’端的2 ~3个碱基截短,能够大大降低脱靶率[18]。综上表明,sgRNA本身序列、浓度、长度及其与靶基因的同源性在一定程度上决定CRISPR/Cas9系统的靶向性。

2.1.2PAM对脱靶的影响 PAM序列是区分靶序列与其他DNA序列的一段高度保守区域,其可以限制基因组的编辑[19]。在CRISPR/Cas9系统的基因编辑过程中,Cas1、2 蛋白和sgRNA-Cas9 复合体先后对PAM序列进行特异性识别[20],最终精准获取目的基因。金黄色酿脓葡萄球菌Cas9蛋白(staphylococcus aureus, SaCas9)识别的PAM 区为NNGRRT,该系统用于体内基因组编辑,即表明使用较长的PAM 序列,潜在的脱靶位点少,脱靶出现的可能性小[21]。近来通过对sgRNA 的活性及特异性进行检测与评估,发现PAM 近端1 ~ 5 位碱基序列是更精准地决定sgRNA特异性的种子区域(seed sequence)[22]。综上所述,PAM自身序列、长度、邻近的种子区域等在一定程度上能够对脱靶产生影响。

2.1.3Cas9 对脱靶的影响 Cas9 自身结构、剪切活性、质粒转染浓度等在一定程度影响脱靶。野生型Cas9蛋白形成的双链断裂可致脱靶,通过对Cas9进行改造可提高切割靶基因的特异性。Cas9 的HNH结构域通过调控剪切活性,干预sgRNA与靶位点结合能力,进而影响脱靶效应。其中,Cas9 的剪切活性与错配碱基的位置分布、数量密切相关。紧邻PAM 序列的DNA-RNA 双链错误匹配会降低Cas9活性,此外发生两个或更多碱基的错配对降低Cas9活性的程度远高于单碱基错配[23]。研究显示,Cas9 蛋白能容忍sgRNA 与DNA 的错误匹配,由此推测,一定范围内,细胞内Cas9 质粒转染的相对浓度越低,靶点的专一性越高[24]。通过修饰Cas9自身结构,已形成多个高保真性Cas9 突变体,对脱靶的改进具有质的提升[20]。

2.1.4其他因素对脱靶的影响 Cas9与sgRNA作为CRISPR/Cas9 系统的重要组成部分,二者既可相对独立又可相互联合对脱靶产生影响。研究显示,体外Cas9/sgRNA 的丰度值过高,容易切割PAM 区域的非靶向位点,使sgRNA 错配发生的机率升高[25]。此外,标靶序列的CpG岛甲基化也会对脱靶产生影响,CpG 岛甲基化与基因沉默表达相关。研究表明,超过一定范围,随着甲基化程度增高,Cas9蛋白与标靶基因的亲和力降低,靶点结合的专一性降低,进而增加脱靶效应[26]。值得注意的是,转染细胞的类型也是影响脱靶的一个关键因素。通过质粒转染技术将外源基因导入斑马鱼胚胎细胞和小鼠体内[27],其靶向突变率极高;而通过质粒转染技术将外源基因导入人K562 细胞[28],其脱靶率保持在较低水平,且CRISPR/Cas9 系统具有较高的活性。

2.2 CRISPR/Cas9系统脱靶效应的优化方法

2.2.1以sgRNA为基础的改进策略

2.2.1.1修饰sgRNA 研究证实,sgRNA 的基因编辑准确率和特异性同sgRNA种子区GC含量成正比,当GC 含量在40% ~ 60%时,不易发生脱靶;当在sgRNA 的5’末端添上2 个G 碱基时,可降低脱靶事件的发生率[29]。Kocak等[30]将sgRNA 5'端设计延伸20个核苷酸,使其自身折叠形成发夹二级结构并插入到间隔上,发夹结构指导RNA(hairpin construction, hp-sgRNA)可以作为R 环形成的空间和能量屏障,阻断SpCas9 构象转变为活性脱靶核酶,导致Cas9 特异性的增加。死亡RNA 脱靶抑制(dead RNA off-target suppression, dOTS)方法中,脱靶位点可以通过协同使用dead-RNAs (dRNAs)来屏蔽活性Cas9-sgRNA 复合体,截短的引导RNA 直接与Cas9 结合但不切割。dRNAs 可以在保持对靶标编辑的同时,以最小的优化有效抑制大范围的脱靶[31]。

研究发现,对PAM 近端、远端的sgRNA 碱基序列进行调整可使目标位点DNA 发生精确断裂。如果PAM 远端第15 个碱基是胞嘧啶,可以提高sgRNA 的特异性;对于PAM 近端sgRNA 序列来说,种子区第1 个碱基通常选择鸟嘌呤,因鸟嘌呤使sgRNA 有更大的折叠倾向,形成的结构更加稳定,脱靶出现减少[32]。

2.2.1.2截短sgRNA 序列 CRISPR/Cas9 的基因靶向性会受到sgRNA 序列长短的影响[33]。降低脱靶率最快捷简便的方法就是将sgRNA截短,但这一方法可能会导致特异性sgRNA 与靶点结合的效率降低。如果把常用的由20 个核苷酸组成的sgRNA引导序列截短2 ~ 3个核苷酸,则既能保证靶向结合位点的效率,还可使脱靶的发生比例降低[34]。

2.2.1.3采用RE-DSRNP 技术策略 RE-DSRNP(reporter RNA enriched dual-sgRNA/CRISPR/Cas9 ribo-nucleoproteins)的方法通过使用双sgRNA 结合报告RNA富集CRISPR/Cas9核糖核蛋白,最终生成精确编辑的供体细胞,以供基因组学和疾病研究[35]。RE-DSRNP 技术优势在于双sgRNA 精准靶向系统具有较高的编辑效率、较低的脱靶效应。研究发现,当使用RE-DSRNP 来生产带有野生型p53诱导的磷酸酶1 (WIP1)基因缺失的克隆猪时,在32头断奶克隆猪中,31头(97%)携带WIP1编辑,15头(47%)为设计的片段缺失的纯合子,使用该方法后没有检测到脱靶事件。

2.2.1.4采用Bi-PE 策略 新型编辑技术先导编辑(prime editing,PE)能直接支持小规模的靶向点突变、精准插入和删除,同时不会导致DNA 双链的断裂,但编辑效率较低。2022 年,四川大学姚少华团队[36]提出双向启动编辑(Bi-PE)策略,其在目前优化的先导编辑(PE)工具基础上进行改进,通过nick sgRNA 定位在prime editing guide RNA(pegRNA)的模板序列附近,并且将2 个引导RNA 工程化为pegRNA 以实现Bi-PE,大大提高靶向准确性和基因编辑的效率。

2.2.2以Cas9为基础的改进策略

2.2.2.1突变体Cas9 策略 Cas 蛋白有2 个核酸酶结构域RuvC和HNH,RuvC负责切割与sgRNA互补的DNA,HNH负责切割另一条DNA。当Cas活性位点H840A失活时,得到仅具有切割DNA的1条链能力的nCas9(Cas9 nickase)[37];当2 个活性位点D10A和H840A均失活时,得到无切割能力的dCas9(dead Cas9)[38]。融合dCas9 和野生型Fok I 核酸内切酶的功能结构域,得到融合蛋白dCas9-Fok I,由核酸内切酶Fok I 行使切割双链DNA 的作用,核酸内切酶Fok I 需要进行二聚化才发挥切割作用。融合蛋白d Cas9-Fok I 单体只有和2 个sgRNA 结合在一起时才有切割能力,进而形成正确的双链切口,降低脱靶[39]。

2.2.2.2SpCas9变体 普遍运用于基因编辑的化脓性链球菌Cas9 (streptococcus pyogenes, SpCas9)识别的PAM 序列为NGG。若将N 固定为一种核苷酸或将PAM 序列延长,均可则可减少Cas9 识别的目标序列,提高靶向专一性[40]。

2015 年,D1135V/R1335Q/T1337R(VQR)和D1135V/G1218R/R1335E/T1337R(VRER)等变体相继衍生。VQR-SpCas9 变体在位点分析结果中,耗尽了带有NGAN 的PAM 位。VRER-SpCas9 变体在定量分析增强绿色荧光蛋白(enhanced green fluorescent protein,EGFP)中,于NGCG PAM 上显示最高的活性[41]。这些变体的全基因组特异性更好,极大地保证了靶向效应的准确性。此外,有研究者使用噬菌体辅助连续进化系统(phage-assisted continuous evolution, PACE)得 到 了SpCas9 变 体xCas9,经过相关实验验证,其可识别更广泛的PAM序列(NG、GAA 和GAT 等),兼容性更广,一定程度上扩大了基因靶向范围,同时新的变体表现出更高的特异性[42]。研究人员筛选了一个在REC3域携带随机突变的SpCas9变体库,确定了既可以保证编辑效率同时具有较高编辑准确性的突变体,如HypaCas9。另外发现,通过结合4 个有益突变生成的evoCas9 变体的保真度超过野生型,其目标编辑效率与野生型保持一致。与HypaCas9 相比,evoCas9 的特异性更高,产生的脱靶位点更少[43]。通过变体对PAM 序列进行限定或拓展进而降低脱靶风险到目前为止仍在探索研究。

2.2.2.3SaCas9 变体 SaCas9 通常被用于进行体内的基因组编辑,但是野生型SaCas9在单核苷酸分辨率上有脱靶效应。研究发现,在不影响靶标效率的前提下,可设计具有高度特异性的全基因组活性的SaCas9 工程变体(SaCas9-HF)。在15 名受试者中,该变体几乎不会对目标基因位点发生偏离,并且在一些极易发生脱靶的序列位点处,SaCas9-HF与野生型相比其脱靶活性也显著降低。对该变体做进一步改变并命名为KKH-SaCas9,其具有更大的PAM识别范围,脱靶活动也显著减少[44]。利用定向筛选系统,研究者在人类细胞中鉴定出了增强保真度SaCas9(efSaCas9),可以有效地辨别单碱基对发生的不匹配情况,并进一步避免该情况的发生[45]。

2.2.2.4改变Cas9 蛋白的带电性 Slaymaker等[46]发现,改变Cas9 蛋白的氨基酸带电性,如把正电性氨基酸残基变为电中性,会减少与非靶向链的互补作用,降低脱靶率。

2.2.2.5终止Cas9 酶活性 CRISPR/Cas9 介导的基因编辑可永久逆转病理性DNA突变,在完成治疗性DNA 修饰后需要终止Cas9 酶活性,避免潜在的非靶向编辑。

实验证明,用抗寡核苷酸可以关闭Cas9 活性,从而减少或防止非目标DNA编辑,开辟了一条通过Cas9 核糖核蛋白失活提高基因编辑安全性的途径[47]。在临床应用中,若只需要在一个组织中编辑目标基因,那么在非目标组织中预先给予抗寡核苷酸可防止非靶向效应。针对此问题,利用荧光偏振技术对SpCas9-PAM 的相互作用进行初步筛选分析,通过结构-活性关系确定了抑制SpCas9 的药效团为BRD0539,BRD0539 通过与NGG 竞争或结合到变构点来发挥作用,可以有效停止对非靶向基因的编辑[48]。通过以核糖核蛋白(ribonucleoprotein,RNP)形式传递Cas9和sgRNA限制Cas9活性的持续时间,减少脱靶突变效应[49]。

在噬菌体和质粒等遗传元件中存在抗CRISPR蛋白(anti-CRISPR proteins, ACR),其中该蛋白家族的AcrIIA17 和AcrIIA18,也已被研究证实可以通过调节sgRNA来抑制Cas9活性[50]。

2.2.2.6开发Cas9同源蛋白 来自于不同细菌种类的Cas9 蛋白具有不同的识别PAM 序列的能力,所以如果改变Cas9蛋白的细菌来源,可以在一定程度上减少脱靶事件的发生。脑膜炎奈瑟氏球菌Cas9 (neisseria meningitidis, Nm Cas9)识别的PAM序列为5’-NNNRRT-3’或5’-NNNNGMTT-3’[51],由于PAM序列较长,Cas9识别PAM的特异性更高,出现脱靶的可能性减少。同样识别较长PAM 序列的还有嗜热链球菌Cas9(streptococcus thermophilus,St1Cas9)[52]、空 肠 弯 曲 杆 菌Cas9 (campylobacter jejuni, CjCas9)[53]。

2.2.3改进CRISPR/Cas9系统的递送方式 CRISPR/Cas9系统本身组件为大分子,需整合至细胞内发挥作用。目前体外递送技术有一定发展,如电穿孔[54]、脂质转染等[55]。许多体内递送系统正不断改进,如用由疏水尾的二硫键组成的生物可还原脂质纳米BAMEAO16B 输送[56]、质粒/病毒载体递送[57]、非病毒载体递送[58]、新型病毒载体递送[59]、结合质粒供体DNA 模板和Cas9-RNP 方法[60]、选择性响应加速基因递送系统(HPT-PFs)[61]、新型基因递送载体(CA3S2)[62]。最新开发的低脱靶效应的CRISPR /Cas9 质粒和模板DNA 传递系统-CRISPR/Cas9 复合聚乙烯亚胺磁性纳米颗粒(polyethyleniminemagnetic nanoparticles,PEI-MNPs),PEI-MNPs 有效提高基因编辑的安全性和实用性[63]。

2.2.4其他优化方法 (1)集成学习框架的提出。有研究者提出将一系列单一非目标预测工具与基因组注释联合应用,把多种组合进行比较,择出最优组合,最大限度提高对非目标活动的预测[64]。该研究协同工具进行CRISPR/Cas9脱靶预测以实现整体洞察和实际应用,对精准医学有重要研究价值。(2)利用高通量方法CHANGE-seq,用于在体外确定CRISPR/Cas9 核酸酶的全基因组活性,探究影响Cas9活性的靶向和非靶向序列的因素,预测非靶点活性,选择出高度特异的靶点,识别与非靶点突变相关的染色质特征,并测量人的遗传和变异对核酸酶活性的影响[65]。(3)应用去甲基化技术。表观遗传学相关的理念也可以用于降低脱靶率的发生。TET1 作为一种双加氧酶,可以帮助启动DNA 去甲基化。将TET1 催化结构域(TET1-CD)连接到已插入噬菌体MS2 RNA 的sgRNA2.0 系统,引导dCas9和MS2 菌噬菌体涂层蛋白来靶向特定基因组位点去甲基化,有效降低脱靶率[66]。(4)减少Cas9/sgRNA复合物的浓度。以质粒为工具转染细胞时,若直接减少sgRNA 用量或者改变所用的启动子种类来影响sgRNA 的转录,达到降低复合物浓度的目的,降低脱靶[67]。但需要通过实验确定合适的Cas9/sgRNA 浓度,尽可能避免复合物浓度的减少所带来的切割效率降低。

3 小结与展望

作为一种新颖的基因治疗法,CRISPR/Cas9 技术因精准高效、易于操作等优势,已逐渐成为具有前瞻性、创新性的基因组定点编辑技术,展现出强大的临床应用潜力。目前,CRISPR/Cas9 系统与多种技术结合,可实现对肿瘤等相关疾病的精准治疗。但是,明确和优化脱靶效应是当前解决临床应用的关键问题之一,同时也需重点关注CRISPR/Cas9系统的递送方式地改进、提高脱靶检测准确度的方法等。希望通过研究人员的不懈努力,CRISPR/Cas9 基因编辑技术将会不断优化,在医学等各领域发挥更加重要的作用。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢
变体靶向特异性
如何判断靶向治疗耐药
基于DDPG算法的变体飞行器自主变形决策
MUC1靶向性载紫杉醇超声造影剂的制备及体外靶向实验
毛必静:靶向治疗,你了解多少?
精确制导 特异性溶栓
非仿射参数依赖LPV模型的变体飞行器H∞控制
BOPIM-dma作为BSA Site Ⅰ特异性探针的研究及其应用
《庄子》成语的隐喻转喻特点及其变体的认知构式研究
耀变体喷流高能电子谱的形成机制
重复周围磁刺激治疗慢性非特异性下腰痛的临床效果