CRISPR-Cas系统的研究进展及应用

2018-03-30 05:01俞珺瑶杜华平
生物技术通讯 2018年3期
关键词:外源结构域核酸

俞珺瑶,杜华平

浙江大学医学院附属邵逸夫医院 血液科,浙江 杭州 310016

CRISPR-Cas(clustered regularly interspaced short palindromic repeats/CRISPR associated pro⁃teins,CRISPR/Cas)系统是细菌和古细菌在生物进化过程中形成的一种适应性免疫防御系统,用来对抗入侵的噬菌体及其他外源质粒核酸(包括DNA和RNA)。CRISPR-Cas系统先将外源核酸片段整合到CRISPR回文重复序列中,当外源核酸再次入侵时,细胞表达的CRISPRRNA(crRNA)引导Cas核酸内切酶迅速切割外源核酸,从而起到免疫防御的作用[1-3]。该过程主要包括以下几个步骤[4-5]:①CRISPR间隔区的获得:将外源核酸序列整合到CRISPR基因组5′端2个重复序列之间得到间隔区(interspacer),对应的外源核酸序列称为protospacer;②CRIPSR基因座的表达(包括转录和转录后的成熟加工):以间隔区核酸序列为模板转录的前体crRNA(pre-RNA)在Cas蛋白和tracrRNA帮助下剪切成小的RNA,即成熟的crRNA;③CRISPR/Cas系统对外源入侵核酸的切割:成熟的crRNA与具有核酸内切酶活性的Cas蛋白(如Cas9、Cas12、Cas13等)形成核酸核蛋白复合物,crRNA能与外源核酸的protospacer互补配对,引导Cas蛋白在特定位置对外源核酸进行切割。CRISPR-Cas系统主要分为ClassⅠ和Ⅱ两大类,每个大类又分为不同型(type)和亚型(sub⁃type)。ClassⅠ CRISPR-Cas系统在细菌和古细菌中较多见,但因成分相对复杂不适合作为工具使用而较少被研究[6]。ClassⅡ CRISPR-Cas系统(包括typeⅡ、typeⅤ、typeⅥ等)虽然少见,但其识别和切割外源核酸的靶序列只需一种Cas蛋白,因此被改造成基因编辑工具而受到越来越多的关注[7-8]。CRISPR-Cas系统又可根据功能分为靶向DNA和RNA等2种。以下对各种类型的CRISPRCas系统做具体阐述。

1 靶向结合DNA的CRISPR-Cas系统

1.1 CRISPR-Cas9系统

发现于酿脓链球菌(Streptococcus pyogenes)和嗜热链球菌(S.thermophilus)的CRISPR-Cas9系统属于ClassⅡtypeⅡ CRISPR-Cas系统,其组成包括crRNA、tracrRNA和Cas9,由于成分简单,最早被用于基因编辑的工具而被广泛研究。研究者将tracrRNA和crRNA连接形成一个guideRNA(gRNA),使得CRISPR-Cas9系统进一步简化为只有gRNA和Cas9这2种组分的系统。gRNA利用一段约20个核苷酸的RNA序列通过碱基互补配对原则与靶DNA结合,Cas9在gRNA的引导下在靶DNA的特定位置对其进行切割。同时发现,外源 DNA5′-PAM(protospaceradjacentmotifs)结构的存在对Cas9作用的发挥是必要的[9-10]。

CRISPR-Cas系统对基因组特定的DNA片段进行切割,形成DNA双链切口(double-strand breaks,DSBs)。在真核细胞内,对DSBs的修复机制有2种:非同源末端连接(non-homologous endjoining,NHEJ)和同源重组(homologous recombina⁃tion,HR)。NHEJ是不依赖于模板的切口修复,通过对断端的单纯连接来实现,会导致核苷酸插入与缺失[11]。HR以同源DNA为模板,通过同源重组的方式修复DSBs,这种修复方式更精确。通过设计同源DNA模板,可以人为地将外源DNA片段插入基因组特定位点中[12-13]。

Cas9有2个发挥切割作用的结构域——HNH和RuvC,分别切割靶序列的非互补链和互补链。有研究报道[14],突变RuvC或HNH可以产生切口酶,切口酶只有单链切割活性,可以降低Cas9的脱靶效应。另外,同时突变HNH和RuvC结构域,可以得到没有切割活性的dCas9[7]。dCas9保留了特异性结合DNA的功能,可以通过联合转录调控因子,如转录抑制因子(KRAB、Mxi1等)[15-16]或转录激活因子(VP64、p65等)[17-18]来调控DNA的转录过程。

1.2 CRISPR-Cas12a系统

Cas12a(之前被命名为Cpf1)是CRISPR-Cas ClassⅡtypeⅤ-A系统的一种核酸内切酶。与Cas9不同,Cas12a对DNA的切割不需要tracrRNA的协助[19],同时它参与前体crRNA的成熟过程[20]。因此,CRISPR-Cas12a系统对DNA进行靶向切割只需要crRNA和Cas12a这2种组分。

RuvC和Nuc是Cas12a蛋白对DNA进行切割的2个结构域[21-22]。与Cas9的RuvC结构域不同,Cas12aRuvC直接切割DNA双链,Nuc在这个过程中起辅助作用[22-23]。因此,Cas12a蛋白RuvC结构域的突变直接导致其DNA切割作用的丧失。CRISPR-Cas12a系统对靶DNA的切割依赖于对非互补链上富含T的PAM序列的识别[19,24],Cas12a蛋白在远离PAM端对DNA双链进行切割[19,25]。

与CRISPR-Cas9系统相比,CRISPR-Cas12a更适于编辑富含AT的DNA序列,因其切割作用的发挥依赖于富含T的PAM的存在。同时,Cas12a蛋白切割DNA双链形成互补的粘性末端,能增加同源重组修复的几率,从而提高外源基因导入效率[19]。在特异性方面,也有研究报道,Cas12a的脱靶效应比Cas9更低[26-27],这些优势让CRISPRCas12a系统有望成为比Cas9更适于靶向基因编辑的工具。

2 靶向结合RNA的CRISPR-Cas系统

2.1 CRISPR-RCas9

2014 年,O′Connell等[28]通过体外实验发现酿脓链球菌Cas9(SpCas9)可以对ssRNA进行切割。我们知道,SpCas9识别和切割DNA作用的发挥依赖于非互补配对链上5′-NGG-3′PAM的存在。O′Connell等通过外源提供一段含有PAM序列的ssDNA寡聚核苷酸链(称为PAMmers),这段序列能与靶ssRNA互补配对,SpCas9就能在crRNA的协同作用下识别PAM结构,在靶ssRNA的特定位点进行切割。

RCas9系统对靶RNA的切割需要SpCas9、gRNA和PAMmer这3种组分。如何有效地将3种组分转入细胞并发挥作用,是该系统实际应用的难题之一。其次,PAMmer是一段寡聚核苷酸单链,在细胞内容易被RNaseH降解[28-29]。另外,该系统也会对含有PAM结构的细胞核DNA进行攻击,造成基因突变。这些缺点限制了RCas9在科学研究中的使用。

2.2 CRISPR-FnCas9

CRISPR-FnCas9是CRISPR-CastypeⅡ的一种亚型。FnCas9的作用方式与SpCas9相似,在crRNA和tracrRNA的协同作用下,通过识别5′-NGG-3′PAM结构对dsDNA进行切割[30]。但与CRISPR-SpCas9不同的是,CRISPR-FnCas9中存在一种被称为 scaRNA(smallCRISPR/Casassociat⁃edRNA)的小RNA,能与tracrRNA形成杂合双链RNA,scaRNA:tracrRNA杂合双链引导FnCas9对真核细胞中的病毒RNA进行切割[31]。CRISPR-Fn⁃Cas9对靶RNA的识别不依赖PAM结构[32]。Price等[32]对CRISPR-FnCas9系统进行改造,将tracrRNA和scaRNA整合形成rgRNA(RNA-targetingguide RNA),利用FnCas9:rgRNA复合物对人肝癌细胞中的丙肝病毒(HCV)基因进行失活,检测结果显示病毒蛋白的表达下降约60%。然而,FnCas9靶向切割RNA的机制并不清楚[30],Price等发现Fn⁃Cas9对HCV的表达抑制似乎是通过抑制病毒本身的复制和翻译过程实现的,而不是直接降解病毒RNA。另外和CRISPR-RCas9一样,CRISPRFnCas9同样可以对细胞核的DNA发生作用,这种脱靶效应的存在限制了它的使用。

2.3 CRISPR-Cas13a

CRISPR-Cas13a系统属于CRISPR-CasClassⅡ typeⅥ-A,最早由Abudayyeh等在纤毛菌Lepto⁃trichiashahii中发现[33]。Abudayyeh 等[33]发现L.sha⁃hiiCas13a(LshCas13a)蛋白能在一段含28个核苷酸的特异性RNA序列的协同作用下,帮助大肠杆菌抵御噬菌体MS2(一种ssRNA病毒)的入侵。同时他们发现在Cas13a的切割过程中存在其他旁系ssRNA的非特异性切割,这种作用机制可能与病毒入侵过程中诱导宿主细胞程序性死亡有关。之后该系统的作用机制逐渐被阐明。该系统主要包括crRNA和Cas13a(之前被命名为C2c2)蛋白2种组分。成熟的crRNA由含有28个核苷酸的靶RNA结合序列和骨架结构组成。Cas13a蛋白是具有双重作用的RNA酶[34],不仅参与crRNA的成熟过程,同时能特异性地对靶RNA进行切割。Cas13a切割活性的发挥主要依赖2个HEPN结构域,对HEPN结构域的组氨酸和精氨酸残基进行突变可造成Cas13a的失活,形成dCas13a。dCas13a保留ssRNA的结合能力,但不能对其进行切割。同时,Liu等发现靶RNA3′端的Non-GPSF(protospacerflankingsite)结构的存在对crRNA和Cas13a作用的发挥至关重要[35]。

2017年,Abudayyeh等[36]进一步发现纤毛菌L.wadei来源的Cas13a(LwaCas13a)蛋白的切割活性和特异性比包括之前发现的LshCas13a在内的其他Cas13a蛋白都高,并且第一次利用多个crRNA在真核细胞中实现对ssRNA的多位点打靶,另外并没有观察到因Cas13a的非特异性切割而造成真核细胞的死亡。CRISPR-Cas13a系统展现出与RNA干扰相同的作用效果,但较后者有更高的特异性,同时该系统组分简单,易于作为RNA编辑工具使用,目前已越来越受到研究者的关注。

2.4 CRISPR-Cas13b

Cas13b是属于CRISPR-CasClassⅡ typeⅥ-B的Cas蛋白。Smargon等[37]研究发现,Cas13b的作用机制基本与Cas13a相同,例如靶向切割ssRNA而不能切割dsRNA,参与前体RNA的成熟过程,存在对旁系ssRNA的非特异性切割等。但与Cas13a不同的是,Cas13b发挥作用需要靶RNA的两端均存在PFS结构,增加了该系统对ssRNA打靶的限制。Smargon等[37]同时也发现2种小的功能蛋白Csx27和Csx28,Csx27能抑制Cas13b对靶RNA序列的识别和切割作用,而Csx28则正好相反,能加强Cas13b的这种作用。

3 CRISPR-Cas系统的应用及潜在应用价值

3.1 靶向结合DNA的CRISPR-Cas系统

3.1.1 寻找新的功能基因或致病基因 已有研究者[38-39]利用多个gRNA组成的gRNAlibrary联合Cas9对不同基因中编码外显子的序列进行打靶,造成相应基因表达蛋白功能的丧失,再经后续的阴性和阳性筛选过程,帮助找到影响细胞正常功能或导致疾病的关键基因。虽然用传统的RNA干扰技术也能实现全基因组功能基因筛选,但CRISPR-Cas9系统特异性更高,适用范围更广。

3.1.2 构建疾病动物/细胞模型 将Cas9和gRNA注入实验动物的受精卵中修饰特定的基因,获得可以遗传的基因型,从而得到转基因动物模型。这种方法的优势在于明显缩短了建模时间,编辑特异性高,适用于大规模操作等。已有利用CRISPR-Cas9系统建立灵长类动物模型来研究神经精神疾病的研究[40]。目前,该方法建立动物模型最大的挑战在于存在遗传学嵌合现象(genetic mosaicism),产生该现象部分受到CRISPR-Ca9s系统基因打靶效率的影响。

也有研究[41]利用CRISPR-Cas9系统在人诱导多能干细胞(hiPSC)中插入2种与产生阿尔兹海默症β淀粉样蛋白有关的遗传突变,随后诱导这些干细胞转化为神经元细胞并产生大量β淀粉样蛋白,从而模拟阿尔兹海默症的疾病表现。

3.1.3 用于转录调控 dCas9可以通过直接与DNA作用元件结合,或联合转录激活因子或抑制因子,来调节DNA转录过程,但目前认为dCas9的这种调节作用相对较弱。有研究[18,42-43]利用多个gRNA引导携有不同转录因子的dCas9结合同一个DNA作用元件(如转录启动子),不同转录因子之间发挥协同作用,从而大大增强了dCas9对转录过程的调节效应。

3.1.4 用于活细胞的基因/蛋白显像 带有荧光蛋白标签的dCas9能结合特定的DNA序列,通过荧光蛋白显示活细胞内某个基因的空间位置。传统用于标记DNA的荧光原位杂交(FISH)技术需要固定细胞,无法用于活细胞的基因追踪。CRISPR-dCas9系统这种显像的功能不仅可以用于检测某种特定基因,还可用于研究基因组中各功能和结构元件之间的空间位置关系。

Yasuda等[44]利用CRISPR-Cas9介导同源重组修复对内源性蛋白进行单细胞标记(single-cell labeling of endogenous proteins by CRISPR-Cas9-mediated homology-directed repair,SLENDR)精确标记发育大脑中的内源性蛋白。更实际的一项研究[45]利用CRISPR-Cas9辅助的基于纸片的诊断模块来检测血液、尿液或唾液样品的寨卡病毒(Zikavirus,ZIKV)

3.1.5 在基因治疗上的潜在应用 CRISPR-Cas9能在特定位点切割DNA形成DSB,再通过NHEJ或HR方式引起异常基因失活及正常基因重建,从而修复特定的基因功能,为人类遗传性疾病提供了新的治疗手段。近年,利用CRISPR-Cas9系统治疗镰刀形贫血[46]、杜氏肌营养不良症[47]等遗传性疾病及清除受感染细胞中的人免疫缺陷病毒(HIV)治疗艾滋病[48-49]的研究取得了较大进展。

3.2 靶向结合RNA的CRISPR-Cas系统

CRISPR-RCas9、CRISPR-FnCas9、CRISPRCas13系统均能靶向作用于ssRNA,被认为是对mRNA转录组水平进行调控的重要工具,mRNA转录组水平的调控相较于DNA基因组水平的调控更加灵活、直接。自2014年O′Connell等发现RCas9可以靶向切割ssRNA以来,研究者就开始关注靶向结合RNA的CRISPR-Cas系统在mRNA转录调控、mRNA显像、mRNA定向定位、RNA病毒干扰等方面的潜在应用价值,并做了初步探索。而最新发现的CRISPR-Cas13系统,由于其组分简单、特异性高、作用机制相对明确等优点,成为研究者关注的焦点。以下以CRISPR-Cas13系统为例做进一步阐述。

3.2.1 利用CRISPR-Cas13系统对RNA的直接切割作用 Cas13可以通过直接切割特定mRNA来下调基因的表达,与传统的RNA干扰技术相比,其适用范围更广。crRNA可以设计成gRNA库,同时针对mRNA的多个位点进行打靶,实现对多个基因表达的下调。另外,先前有研究[50]将一段RNA剪切结构域和RNA结合结构域Pumilio/fem-3整合成一个人工RNA核酸内切酶,利用该酶对细菌和人的多种RNA实现表达沉默。Cas13的出现使上述过程的实现变得更加容易,可以用于沉默人体细胞中致病mRNA的表达[51]。

3.2.2 利用CRISPR-dCas13系统对RNA的特异性识别作用 通过对dCas13的切割结构域进行突变,可以得到没有切割活性的dCas13蛋白。dCas13保留了特异性结合ssRNA的功能,可以作为一种gRNA引导的RNA结合蛋白应用于转录及转录后水平的编辑。

①转录后水平的mRNA编辑 利用dCas13能靶向结合但不能切割RNA的这一特性,联合GFP等荧光显示蛋白,可以用于显示细胞内mRNA的活动轨迹。2016年Nelles等[29]最先利用没有切割活性的RCas9-GFP、sgRNA和PAMmer追踪ACTB mRNA从细胞核内转移到细胞质中的过程,同时通过FISH观察到ACTB、CCNA2和TFRC等3种mRNA的聚集现象。同样我们可将dCas13蛋白与GFP等荧光显示蛋白结合,用于显示特定mRNA在细胞内的位置及转移轨迹,从而监测细胞在不同环境状态(如应激、损伤、疾病及药物干预等)下mRNA转录组的行为学变化。更实际的应用价值在于利用dCas9的这种追踪定位功能来富集某些表面标志不明确的成体干细胞,利用这些成体干细胞表达某种特定的mRNA,通过CRISPRCas13系统进行显示来达到分离纯化这些细胞的目的[52]。

其次,CRISPR-dCas13系统可以在转录后水平增强或抑制基因的表达。通过与调控转录后翻译的增强子或沉默子结合,dCas13可以在没有改变mRNA数量的情况下增强或抑制某个特定基因的蛋白表达,这种调控基因表达的方式不会对基因组本身造成影响。

另外,dCas13可以帮助mRNA定位到细胞的特定位置从而发挥其功能。例如,在神经元细胞中维持突触结构和活性的PSD-95(postsynaptic densityprotein95)蛋白,其mRNA需要通过树突到达特定作用部位后再翻译成PSD-95蛋白[53],发挥相应的功能。dCas13可以通过与转运因子结合帮助mRNA运输到特定部位,如突触前或突触后末端,从而维持突触的生长和功能,这对神经元损伤后再生修复有重要意义[52]。

②pre-mRNA水平的编辑 dCas13可以引导剪接因子至pre-mRNA的特定位置,从而调控mRNA的剪接过程。之前有研究[54-55]利用RNA结合蛋白(如PUF、MS2等)联合剪接增强因子(如富含精氨酸/丝氨酸的结构域)或剪接抑制因子(如富含甘氨酸的结构域)来改变特定mRNA的剪接模式。Cas13能使靶向pre-mRNA的过程更容易实现,并且能对多个位点同时进行操作,可用于干预mRNA的异常剪接过程,从而逆转因mRNA的异常剪接而导致的细胞功能异常等后果。

另外,dCas13可用于REPAIR的编辑过程,REPAIR的全称为RNA Editing for Programmable adenosine-to-inosine(A-to-I) Replacement。已有研究[56]利用dCas13b-ADARDD实现了这一编辑过程。其意义在于,许多疾病如局灶性癫痫、杜氏肌营养不良症及帕金森病等都与G-to-A的基因突变有关,REPAIR过程可以在mRNA水平逆转A突变,从而达到治疗疾病的目的。

3.2.3 对RNA病毒的干扰 发现于细菌体内的CRISPR-Cas13系统不仅能直接对侵入细菌的噬菌体RNA进行切割,同时能激活细菌的免疫系统来抵御外来的噬菌体RNA[33]。利用CRISPRCas13系统的这一特性,可以干扰RNA病毒在真核细胞中的表达。早前也有研究[32]利用FnCas9来抑制真核细胞中人HCV的表达。相较于Fn⁃Cas9,Cas13的作用机制更加明确,不仅可以直接或通过细胞自身的免疫系统抑制RNA病毒的活性,而且可以用于干扰需要转录成RNA发挥作用的DNA病毒。

3.2.4 肿瘤等疾病的治疗 目前肿瘤的治疗注重于靶向杀伤肿瘤细胞而不对正常细胞造成影响。理论上,CRISPR-Cas13系统能特异性结合肿瘤细胞的mRNA,能够直接影响某一特定mRNA功能的发挥,同时可以激活细胞程序性死亡过程,直接杀死肿瘤细胞[57-58]。目前尚须进一步的研究来验证和完善这一推论,但Cas13用于肿瘤靶向治疗的前景不容忽视。

4 结语

参考文献

猜你喜欢
外源结构域核酸
具有外源输入的船舶横摇运动NARX神经网络预测
全员核酸
核酸检测点上,有最可爱的平江人
第一次做核酸检测
核酸检测
外源铅胁迫对青稞生长及铅积累的影响
蛋白质结构域划分方法及在线服务综述
外源钙对干旱胁迫下火棘种子萌发的影响
外源添加皂苷对斑玉蕈生长发育的影响
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析