CRISPR技术在生物学与医学中的研究进展

2020-02-20 03:29杨悦高郡茹杨柳
生物技术通报 2020年3期
关键词:碱基靶向位点

杨悦 高郡茹 杨柳

(1. 广西师范大学生物医学研究中心,桂林 541004;2. 广西师范大学干细胞与医药生物技术重点实验室,桂林 541004;3. 广西师范大学生命科学学院,桂林 541004)

1 CRISPR技术简介

CRISPR/Cas(Clustered regulatory interspaced short palindromic repeats/CRISPR-associate)是微生物体内基于RNA介导的核酸酶切割清除外源核酸的适应性免疫系统[1]。与人体自身的免疫系统相似,微生物体内的免疫需要经历适应(感染)→表达(防御/切割)→插入(记忆)3个过程[2]。这3个过程主要由CRISPR系统完成,其中“表达”过程中会产生多种Cas蛋白。Cas1和Cas2负责将外源基因整合到CRISPR阵列中,Cas4负责对外源基因形成免疫记忆[3],Cas9则在RNA引导下对外源核酸进行切割。根据Cas蛋白的不同,CRISPR/Cas系统可分为5类,I、III和IV型系统均需要借助复杂的蛋白复合体,而II和V型系统仅需要RNA和Cas蛋白。大多数CRISPR系统都依赖于邻近crRNA靶向位点的PAM(Protospacer adjacent motif)序列,缺失PAM序列将会导致CRISPR系统的自我切割[3]。

基因编辑中最常用的CRISPR/Cas9属于II型CRISPR系统,由Cas9蛋白和特异性选择CRISPR RNA(crRNA)和辅助反式激活crRNA(tracrRNA)组成[4]。其中crRNA与tracRNA的结合体可被重新设计为包含Cas9结合和DNA靶位点特异性识别的单个转录物(single-guide RNA,sgRNA),在sgRNA协助下,Cas9蛋白可切割DNA上可被引物RNA识别并包含PAM(NGG序列)序列的位点[5]。相较于第一、二代基因编辑技术——ZFN和TALEN,CRISPR操作简便,设计简单,识别不受基因组甲基化的影响,近乎可以靶向任意细胞的任意序列,同时靶向多个位点,编辑效率更高。

2 CRISPR系统的改造与开发

2.1 DNA编辑

目前较成熟的两种CRISPR系统为II型Cas9和V型Cpf1(原Cas12a)。2018年2月,David Liu实验室利用PACE(Phage-assisted continuous evolution)技术对spCas9蛋白进行快速进化和筛选,获得了PAM序列兼容性更高、脱靶率更低的spCas9变体,命名为 xCas9 3.7[6]。相对之前的 spCas9,xCas9 3.7不仅具有更高的DNA特异性,且在所有NGG靶向测试中的脱靶率更低,在非NGG PAM靶向测试中也有着极低的脱靶率。这一发现打破了之前对Cas9的编辑效率、PAM序列兼容性和DNA靶向精确性三者之间相互制衡的认知,扩大了CRISPR系统的DNA靶向范围,提高了基因编辑的准确性和灵活性。此外,中科院动物研究所李伟研究组在酸性脂环酸芽孢杆菌中发现了另一种 Cas12b(AaCas12b)[7]。虽然AaCas12b的RuvC结构域与Cas9和Cas12a相似,但其推定的Nuc结构域与Cas9的HNH结构域和Cas12a的Nuc结构域没有序列或结构相似性。相较于spCas9和Cfp1,AaCas12b具有尺寸更小、适用于包装腺病毒、能识别更简单的PAM序列、在人类血浆中稳定性增强、脱靶效应最低、特异性高等特点。相较Cas12b的最佳剪切温度(40-55℃),AaCas12b的最适活性温度为31-59℃,更适应用于哺乳动物细胞的基因编辑。

2018年 10月,Doudna团队[8]发现了一套来自野生型古生菌的CRISPR/Cas系统,其中包含Cas14—一个异常紧凑的RNA引导的核酸家族[8]。对比分子较大的Cas9蛋白(950-1 400 aa),Cas14a蛋白的分子量更小(400-700 aa),并能在RNA介导下对无限制性序列的单链DNA进行靶向切割。Cas14蛋白的小尺寸及其与V型Cas蛋白的相似性表明RNA介导的ssDNA切割可能先于第二类CRISPR系统出现,且可能第二类CRISPR系统正是由其发展而来。Cas14的发现证实了微生物体内CRISPR系统的多样性,同为CRISPR系统,Cas9和Cpf1等主要作用于dsDNA,而Cas14等主要作用于ssDNA,为微生物抵抗外源病毒的侵袭提供了多样的免疫方式。对此类微生物的进一步探索有助于加强对微生物免疫“军备竞赛”的了解,也为发现更多有价值的CRISPR系统提供了线索。

2019年1月,Doudna团队[9]揭示了新型基因编辑工具CRISPR/CasX的潜在机制,该工具使用独特的结构进行可编程的双链DNA结合和切割。生化分析和细胞内实验表明CasX对大肠杆菌和人类的基因组具有修饰活性。CasX蛋白的结构和大小以及最小的反式切割活性表明这是一个与Cas9和Cas12a完全不同的、全新的Cas蛋白家族。研究证明,CasX是一种由RNA介导的DNA核酸内切酶,可在sgRNA介导下对双链DNA进行切割。CasX蛋白大小紧凑,不到1 000 aa,更容易包装入AAV病毒,为基因治疗的体内递送提供了更高效的可能性;且CasX来源自非病原微生物,因此也更安全。

2016年,David实验室[10]利用失活的Cas蛋白与APOBEC1(胞苷脱氨酶1)共表达,开发了单碱基编辑系统(Base Editor,BE),可在不对DNA双链进行切割的条件下完成单碱基(C→T)的永久突变。这种单碱基编辑系统中的dCas9保留了其在sgRNA介导下定位到DNA靶位点的能力,但不会对DNA双链进行剪切,共表达的胞苷脱氨酶将目标胞苷直接转化为尿苷,然后利用体内的DNA修复机制将尿嘧啶永久转化为胸腺嘧啶。由于体内尿嘧啶糖基化酶的作用,第一代BE的编辑效率较低。研究者在其基础上融合了尿嘧啶糖基化酶抑制剂,开发出第二代BE,进而融合了针对未编辑链的Cas9切口酶,以促进DNA的修复反应,形成第三代BE。在进一步的实验中,研究人员通过筛选融合不同突变型的胞苷脱氨酶,将BE3的编辑窗口由5个缩窄至1-2个,并能够区分相邻的胞嘧啶,使之优先纠正与疾病相关的目标胞嘧啶的效率增加一倍[11]。经过实践观察,2017年,实验者在BE3的基础上融合共表达噬菌体Mu蛋白Gam,开发出BE4[12]。实验证明,BE4的编辑效率较BE3提升50%,且由于Gam能够与DSB结合,错配率进一步降低,编辑副产物减少一半。

BE系统中的dCas9主要识别的PAM序列为NGG形式,使之在富T序列中的编辑效率较低。针对此类问题,上海科技大学的陈佳团队构建了以CRISPR/Cpf1为基础的单碱基编辑系统[13]。Cpf1蛋白可识别富含A/T的PAM序列,结合了Cpf1的单碱基编辑系统在A/T富集区域亦可实现编辑作用,在扩展了可编辑范围的同时,产生的编辑副产物也较低,因此具有更高的编辑精确度。这种单碱基编辑器可与BE系统实现碱基编辑的有效互补。由于BE系统仅在C→T碱基编辑中有较高效率,而A→G碱基编辑效率低。因此,David Liu团队将一种RNA腺苷脱氨酶与dCas9融合共表达,开发了腺嘌呤碱基编辑器(Adenine base editor,ABEs)[14]。ABEs系统与BE系统原理相似,在RNA腺苷脱氨酶作用下将目标腺嘌呤脱氨形成肌苷,再在聚合酶作用下转化为鸟嘌呤。与BE系统相比,ABEs系统引入点突变的效率更高、错配率低、编辑产物纯度更高、副产物更少、对非靶基因的影响也更少[14]。

2.2 RNA编辑

相关研究发现CRISPR/Cas13a能够切割细菌的特定RNA序列。Doudna团队亦报道证实,CRISPR/Cas13a可用于RNA检测[15]。2017年10月,张锋实验室首先证实CRISPR/Cas13a可靶向编辑哺乳动物体内RNA。比起RNAi,Cas13a有着更强的特异性,并且由于其对哺乳动物细胞而言是非内源性的,因此扰乱细胞中天然的转录后网络的可能性极低[16]。Hsu团队通过生化表征和蛋白质工程对7种不同的直系同源物进行分析筛选出Rosenococcus flavefaciens的 XPD3002(CasRx)[17]。并利用 HEPN 结构失活的dCasRx靶向剪切前mRNA顺式元件,在额颞叶痴呆神经元模型中成功纠正了失调的tau蛋白异构体比例。由于CasRx的尺寸较小,更易包装入病毒载体应用于治疗。且相较于传统的RNA干扰技术,CasRx拥有较高的剪辑效率和精确性,不易产生明显的脱靶效应。据研究估计,RNA拼接错误疾病占遗传疾病的15%[18]。CasRx等RNA编辑蛋白的出现展现出了其在RNA多重靶向上的潜力。此外,靶向AAV递送CasRx至特定的有丝分裂后细胞类型(如神经元)中,则具有介导纠正单元的长期表达的潜力,避免了永久性遗传修饰或纠正技术的频繁施用,对其他核酸靶向技术进行了补足,使核酸编辑技术得到了极大的扩展[17]。

2.3 CRISPR的负面效应

CRISPR技术发展迅速,然而其对目标DNA的匹配有一定的容忍度,即可允许个别碱基的错配,这一特点导致Cas蛋白也会切割与目标DNA有较少碱基差别的非目标DNA,这一现象被称为脱靶效应[19]。脱靶效应是CRISPR技术临床应用的最大挑战。除此之外,也有研究显示,CRISPR/Cas9系统似乎在编辑p53基因突变的细胞时拥有更高的编辑效率[20],而作为已知最重要的抑癌基因之一,p53的突变会使细胞癌变的风险增高[21]。更严重的是,法国波尔多大学的研究人员发现,利用CRISPR/Cas9系统进行基因组编辑会诱导出现百万碱基规模的染色体大片缺失,而这种缺失,比起脱靶效应更为严重[22]。还有研究显示,当被CRISPR/Cas9编辑后的细胞进行自身修复时,会在靶位点出现的大片缺失和更复杂的基因重排[23]。在此之前,对所有CRISPR基因编辑结果的分析,通常只关注靶点的邻近序列以及远端的脱靶序列周围很小的部分,并由此得出的CRISPR-Cas9精确特异性的结论。通过长读取测序和长链PCR基因分型显示,sgRNA/Cas9介导的DNA断裂会导致许多一千以上碱基的缺失。此外,还发现了切割位点远端的突变和交叉事件[23]。在临床同时编辑数十亿细胞的情况下,产生的大量突变可能导致每例治疗方案中一个或多个细胞携带致命突变。进而导致癌变和肿瘤的形成。不过幸运的是,Kim等[24]开发的用于体外检测CRISPR脱靶效应的工具——Digenome-seq的检测结果和高彩霞团队[25]的研究均显示,经过精准设计的sgRNA介导的CRISPR/Cas9系统脱靶率极低。

比起经典的CRISPR/Cas9系统,BE系统拥有诸多优点,且已有研究者在治疗遗传性疾病中利用该系统取得了一定的治疗成果[26-27]。然而,中科院遗传与发育研究所的高彩霞研究组通过对BE3、HF1-BE3与ABE单碱基编辑器的特异性进行全基因组水平评估,全面分析比较了这3种单碱基编辑器系统在基因组水平上的的脱靶效应。结果表明,无论是否有sgRNA的引导,BE3和HF1-BE3均可在水稻基因组中造成大量的单核苷酸变异(SNVs),且大部分为C>T类型的碱基突变[25]。同时,杨辉团队建立了一种命名为GOTI(Genome-wide Off-target analysis by Two-cell embryo Injection)的新型脱靶检测技术,并用该技术检测单碱基编辑的脱靶效应,得到了与前者一致的结果[28]。GOTI的检测显示,BE3的脱靶效应非常严重,但之所以之前的方法一直未能发现这一问题,是因为这些脱靶大多出现在传统脱靶预测认为不太可能出现的脱靶位点,进一步分析发现,脱靶位点有部分出现在原癌基因和抑癌基因上,介于此类隐患,研究者认为BE3并不适合作为临床治疗工具[28]。虽然CBE系统的脱靶效应令人担忧,值得欣慰的是,不论是高彩霞研究组的研究还是GOTI的检测,都显示ABE系统依旧拥有极高的特异性。但也有研究认为ABE系统并不如想象中的那么保险,经中山大学研究团队开发的首个检测ABE系统全基因组范围内脱靶效应的方法——EndoV-seq检测显示,ABE系统虽然特异性非常高,但仍然具有脱靶效应[29]。而Jin-Soo Kim的研究则显示,ABE系统的脱靶效应虽低于Cas9,却高于BE3[30]。

具备无需DNA双链断裂和极低的错配率等优点,单碱基编辑系统的高效性和低风险性使其在单点突变导致的遗传病的治疗中拥有极大地应用潜力。但基于上述研究,单碱基编辑系统在投入临床之前还需要进行进一步的风险评估,应通过优化sgRNA序列、CRISPR核酸复合物递送和优化Cas9蛋白等方式[30]提升CBE和ABE系统的精确性。并且在利用CRISPR技术进行临床应用之前,对患者细胞进行全面基因组分析,确定其具有正常的基因组,以降低治疗风险[23]。

3 CRISPR技术应用进展

3.1 构建模型生物

2017年3月,韩国基础科学研究所的研究人员利用CRISPR技术成功构建单核苷酸编辑小鼠[31]。IBS的研究人员使用BE技术在小鼠胚胎中高效诱导碱基替换,从而培育出具有疾病表型的小鼠,为囊性纤维化、镰刀形红细胞贫血症、苯丙酮尿症等单碱基突变引起的疾病提供了有效模型。2018年3月,暨南大学李晓江课题组利用CRISPR技术成功建立亨廷顿舞蹈症基因敲入猪模型[32]。作为神经退行性疾病研究领域的里程碑式的发现,亨廷顿舞蹈症基因敲入猪的建立为深入了解神经细胞死亡的机制及寻找有效的理疗方法提供了极佳的动物模型。2019年2月,李晓江课题组再次利用CRISPR技术成功构建了PINK1基因突变的帕金森恒河猴模型[33]。PINK1突变猴中观察到的显著神经元丢失未在PINK1敲除小鼠或猪模型中报告,而这一现象可能与PINK1在灵长类动物体内的特异性表达和功能有关。PINK1突变猴的构建揭示了PINK1在灵长类大脑中的关键功能,并将提供一个新的研究PINK1的多种功能和与PINK1功能障碍相关的发病机制的工具[33]。

3.2 监测活细胞内反应进程

科学家们一直致力于寻找一种可观察和记录细胞生命活动的方法但收效甚微。2017年12月,哥伦比亚大学的研究人员将CRISPR改造成“录音笔”以记录生物体内转瞬即逝的生理信号[34]。长期以来,人们大多关注于CRISPR强大的基因编辑功能,而忽略了其原本是一种来源于细菌的免疫机制。在细菌里,CRISPR-Cas系统能把外来病毒的DNA片段切断,并整合到自己的CRISPR位点中,形成免疫记忆。因此,当再有同样的病毒入侵时,细菌就能根据CRISPR位点中的免疫记忆快速地、有针对性地启动防御。基于该原理,研究者构建了两种质粒,一种质粒能够对外来的特性生理信号做出反应,并随之扩增;另一种质粒则能表达CRISPRCas系统元件。根据设想,当没有外来生理信号出现时,CRISPR表达质粒会不断地向细菌的CRISPR位点插入空白序列;当有外来信号出现时,前一种质粒就会启动并扩增,在CRISPR位点上留下印记。经过一段时间后,对细菌的CRISPR位点进行测序和分析,就能知道是否有监控所需的生理信号。根据印记所在位置还能够反推该信号产生的时间。这一设想已通过实验得到验证,研究者表示,这套系统在大肠杆菌中可以同时记录了三种不同的生理信号,并持续记录数天。2018年2月,美国布罗德研究所的Weixin Tang和David R. Liu共同开发出一种称为CAMERA(CRISPR-mediated analog multievent recording apparatus)的CRISPR介导的模拟多时间记录装置,并利用这种技术构建出两种类型的细胞记录系统——CAMERA 1和CAMERA 2[35]。在CAMERA 1中,研究人员将两种不同的质粒注入细菌细胞中,在刺激物诱导下,利用CRISPR Cas9切割其中一种质粒,以诱导细胞产生另一种质粒来取代之前的质粒,由此完成对整个事件进行记录。这种记录系统能够帮助研究人员记录细胞如何对营养物或抗生素等刺激物做出反应。而在CAMERA 2中,当所需的信号在细胞中发生时,研究人员利用碱基编辑器改变遗传密码中的单个碱基。由此可记录当细胞接触病毒、营养物和抗生素等刺激物时,细胞如何作出反应。据报道称,研究人员已将该技术成功应用于细菌细胞和人细胞中。此外,2018年4月,Spanjaard等[36]开发了利用CRISPR技术诱导的DNA瘢痕序列追踪细胞谱系的技术,并命名为 LINNAEUS(Lineage tracing by nuclease-activated editing of ubiquitous sequence,通过对普遍存在的序列进行核酸酶激活的编辑来开展谱系追踪)。这种技术基于DNA中的瘢痕序列,当这些瘢痕序列汇总在一起时就像条形码一样,能够确定细胞的谱系。

3.3 疾病检测及治疗

CRISPR技术同样可以用于癌症、遗传病、AIDS等疾病的检测和治疗。2017年11月,弗吉尼亚联邦大学的研究人员将HS-AFM(高速原子力显微镜)与一种基于CRISPR的化学条形码技术结合起来,开发出了一种新的纳米绘图技术[37]。他们用Cas9-sgRNA复合物标记目标DNA,然后用HS-AFM对目标DNA成像并测定DNA上的标记。由此可对肿瘤细胞中突变基因进行精确定位并分析。由于该技术的要求设备占地小,且可直接用DVD光学元件检测成像,因此有望在医院和实验室中得到普及。2018年4月,来自斯坦福大学的科学家发现了一种修饰肺癌小鼠肺部的一对癌症相关基因的新方法,之后还能精确地追踪肿瘤中的每一个细胞[38]。他们将CRISPR/Cas9与DNA条形码技术相结合开发出了组合性技术,以此来追踪癌症的生长发展情况。这种技术能帮助研究者在实验室中复制出在癌症患者体内所观察到的肿瘤的遗传多样性,也有助于研究者克服在研究癌症复杂性中产生的畏难情绪。2017年2月,美国斯隆—凯特琳癌症中心的研究人员使用腺相关病毒(AAV)介导,将CRISPR/Cas9技术应用于CAR-T疗法[39]。研究者利用CRISPR/Cas9技术构建出更加强效的嵌合抗原受体(Chimeric antigen receptor CAR)T细胞(CAR-T细胞),从而增强小鼠体内的肿瘤免疫排斥。这一发现揭示出CAR免疫疗法的一些细节,并且突出展现了利用CRISPR/Cas9基因组编辑技术推动癌症免疫疗法的潜力。该研究避免了传统CAR-T疗法的随机整合可能存在的潜在危害,也极大地降低了CAR-T细胞发生分化或癌变的风险。

2019年2月,Natrue Medicine上发表了针对早衰症和杜氏肌营养不良症的CRISPR基因治疗成果。早衰症是由于LMNA基因发生突变,导致一个选择性前体mRNA(pre-mRNA)剪接位点被激活,并表达progerin(一种缺失50个氨基酸的lamin A蛋白突变体)引发的一种遗传病。Progerin在核膜上的积累会损害核结构的完整性、异染色质维持、DNA修复和氧化还原稳态,并促进细胞衰老。针对早衰症的致病机理,西班牙和美国的研究团队[40]开发了相应的CRISPR/Cas9治疗策略——通过破坏LMNA基因的最后部分,在不影响lamin C表达的情况下,阻碍lamin A/progerin的生成。出于安全性和广泛的组织亲和性,研究者选择AAV 9作为递送载体,分别通过腹腔注射或静脉注射注入早衰症小鼠模型。实验结果表明,与对照组小鼠相比,经过CRISPR/Cas9治疗的小鼠中的progerin蛋白显著减少,平均寿命延长25%以上。杜氏肌营养不良症是一种发病率相对较高的,由X染色体上编码抗肌萎缩蛋白基因(Dystrophin)突变所致的单基因疾病。Gersbach团队通过CRISPR技术直接删除dystrophin基因突变位点附近的碱基,使之表达缩短版的抗肌萎缩蛋白,以此恢复部分肌肉能力[41]。实验结果表明,通过静脉单次注射AAV 8装载的CRISPR后,基因组编辑效果在肌营养不良症小鼠模型体内可持续长达一年的时间,且在此间抗肌萎缩蛋白表达的恢复得以维持[41]。

2018年4月,郭斐团队报道称,已使用CRISPR/Cas9技术成功抑制了艾滋病病毒HIV-1的多个感染步骤[42]。研究者在文章中进一步探讨了CRISPR/Cas9抑制HIV-1感染的分子机制——Cas9不仅在病毒DNA中导致插入缺失,并且降低了晚期病毒DNA产物和整合病毒DNA的水平。实验还表明,只有当Cas9存在于细胞质中时,才能对新合成的HIV-1 DNA进行编辑,并抑制病毒的感染。

4 小结

伴随着CRISPR技术在生物医学等领域的广泛使用,并与多种传统的研究技术相结合,其在癌症的治疗和遗传性疾病方面的应用取得多项喜人的研究成果。而同时,虽然相较于第一代和第二代基因编辑技术,CRISPR技术在精确性和特异性上均有极大提升且更易操作,但脱靶效应仍是其大规模应用于基因治疗的主要掣肘,因此,如何降低脱靶率,提高精确性、特异性和稳定性依然是CRISPR技术急需解决的问题。尽管如此,作为具备众多优点的新一代基因编辑技术,CRISPR技术在科学研究中的发展应用依然值得我们期待。

猜你喜欢
碱基靶向位点
新型抗肿瘤药物:靶向药物
如何判断靶向治疗耐药
镍基单晶高温合金多组元置换的第一性原理研究
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
靶向治疗 精准施治 为“危改”开“良方”
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
二项式通项公式在遗传学计算中的运用*