尹玉伟,代 静,茆安婷,马世宏,郭曦尧,张林波,李月红
(1.吉林农业大学动物科学技术学院,吉林 长春130118;2.内蒙古乌兰察布市兽医监察所,内蒙古 乌兰察布012000)
1987 年,Ishino[1]等人在大肠杆菌中发现了一个串联间隔重复序列,但这些序列的生物学意义尚不清楚。随后,Mojica[2]等人发现了类型的重复序列,即规律成簇间隔短回文重复序列。2002 年,Jansed[3]等将其命名为CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)。到2012 年科学家开发利用CRISPR[4],使其成为生物医学史上第一种可高效、精确、程序化的修改细胞基因组包括人类基因组的工具。CRISPR 存在于90%的古细菌及40%的细菌中[5]。CRISPR/Cas9 是细菌和古细菌在长期选择压力中形成的一种适应性免疫防御,可用来有效抵御病毒及外源DNA 的入侵。CRISPR/Cas9 系统可以识别出外源DNA,并将它们剪断,沉默外源基因的表达,利用细胞的非同源性末端(Non-homologous end joining,NHEJ)连接或同源重组(Homologous recombination,HR)修复机制对断裂的DNA 进行插入缺失、修复、替换[6]。这与真核生物中RNA 干扰(RNAi)原理是相似的[7]。2012年和2015 年,CRISPR 基因组编辑技术连续被Science 公布为十大突破[8]。本文将从CRISPR/Cas9的结构,特点和在斑马鱼中的研究阐述。
CRISPR 序列由众多短而保守的重复序列区(Repeat)、间隔区(Spacer)和前导区(Leader)组成。重复序列区含有部分回文序列,可以形成发卡结构,这段序列一般存在1 ~3 个碱基差异,这种差异被称为退化重复(DR)[9]。重复序列被间隔序列隔开,间隔序列一般没有相似或相同的序列,间隔区可以识别被细菌俘获的外源DNA 序列,这相当于动物的二次免疫,当这些外源遗传物质再次入侵时,CRISPR/Cas 系统就会予以精确剪切。上游的前导区是一段富含AT 的序列,是CRISPR 系统的启动子所在区。另外,CRISPR 系统还有一个重要的多态性的家族基因,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR 关联基因(CRISPR associated,Cas)。Cas 蛋白一般位于CRISPR 位点下游,或者分散在基因组的其他地方。目前为止,已有40 多种伴随CRISPR位点的Cas 蛋白被鉴定[10]。Makarova[11]等根据其Cas 蛋白类别和作用的不同,将CRISPR/Cas 系统分为I 型,Ⅱ型,Ⅲ型,Ⅳ型和Ⅴ型,Shmakov[12]等人发现了CRISPR 系统Ⅴ型的另外两个亚型及Ⅵ型新系统。CRISPR 的Ⅱ型因其蛋白单一,结构简单被广泛应用于基因工程,即CRISPR/Cas9。中插彩版图1 为目前发现的CRISPR/Cas 系统。
CRISPR/Cas9 它包含Cas9,pre-crRNA(pre-CRISPRderived RNA),tracrRNA(Trans-activating crRNA)[14],pre-crRNA 是由整个CRISPR 序列转录而成的大型RNA 分子,在Ⅱ型系统中pre-crRNA 的加工由Cas9 单独参与。Cas9 含有在氨基末端的RuvC 和蛋白质中部的HNH2 个独特的活性位点,在crRNA成熟和双链DNA 剪切中发挥作用。此外,precrRNA 转录的同时,与其重复序列互补的反式激活crRNA(Trans-activating crRNA,tracrRNA)也转录出来,并且激发Cas9 和双链RNA 特异性RNaseⅢ核酸酶对pre-crRNA 进行加工。 加工成熟后,crRNA、tracrRNA 和Cas9 组成复合体,识别并结合于crRNA 互补的序列,然后解开DNA 双链,形成R-loop,使crRNA 与互补链杂交,另一条链保持游离的单链状态,然后由Cas9 中的HNH 活性位点剪切crRNA 的互补DNA 链,RuvC 活性位点剪切非互补链[15],最终引入DNA 双链断裂(DSB),进而实现基因的敲除和插入[16](见中插彩版图2)。其中crRNA 含有能够识别20 bp 靶向互补序。
CRISPR/Cas 系统基因编辑技术已经是生物领域中热门研究。该技术已经广泛用于小鼠、大鼠、斑马鱼、果蝇等多种模式动物的研究,包括基因功能研究、基因治疗、疾病模型研制等[18]。斑马鱼因其繁殖周期短并与人类的器官高度相似等特点成为重要的模式生物,斑马鱼已经成为大量的人类疾病研究模型。而相比于小鼠等模式生物,斑马鱼具有它们所不具有的特点[19],斑马鱼的胚胎在显微镜下观察是透明的,可以看到各个器官和血管的发育;体外受精,试验周期短。早在1930 年,斑马鱼就成为生物医学研究的一个经典的发育和胚胎模型[2]。
干扰素γ 诱导蛋白30(ifi30)参与机体病毒免疫、肿瘤免疫,曹顶臣[21]等通过CRISPR/Cas9 系统敲除了斑马鱼ifi30 基因后胚胎死亡,证明ifi30 基因是胚胎发育过程中不可缺少的蛋白。刘菁[22]等通过CRISPR/Cas9 系统敲除了斑马鱼faf1 基因,faf1 基因参与早期胚胎的神经嵴细胞迁移分化,通过显微注射敲除该基因后斑马鱼的色素沉积延迟及尾部肌节部位出现“结节样”变化。黄红辉[23]等敲除了斑马鱼atp1a1a.1,atp1a1a.2, atp1a1a.3,atp1a1a.4,atp1a1a.5,pkd2,aqp3a,bmper,is12a 和tbx2a10 个前肾表达基因,经过三代的筛选发现只有atp1a1a.2 和pkd2 致斑马鱼胚胎发育缺陷。dync1h1 基因是细胞质动力蛋白复合体的核心结构,而细胞质动力蛋白在神经系统中起着重要作用,钱亭[24]等敲除了斑马鱼dync1h1 基因,导致斑马鱼脊髓肿胀,脊髓神经细胞数目显著减少,背部血管存在发育畸形,并于受精后5 ~6 d 死亡。造血干细胞是一群具有高度的自我复制及多项分化潜能的最原始的造血细胞。hoxb4 基因在造血干细胞有重要的调控作用,袁梦[25]等通过上调和下调hoxb4 基因发现hoxb4 基因上调后导致原始造血干细胞数量增加;抑制hoxb4 基因可看到心包增大、心腔壁变薄及血细胞减少。
基因敲入(Knockin,K I)技术是指利用随机整合、转座子系统、同源重组等方式将外源功能基因插入到基因组中,使其在细胞内进行表达的基因编辑技术。研究人员[26]已经利用CRISPR 系统通过非同源重组方式将Gal4 和EGFP 插入斑马鱼中,在此基础上,杜久林[27]团队设计了内含子靶向介导和同源重组(HR)高效独立的替换方法,通过非同源重组方式和CRISPR/Cas9 将内含子靶向基因敲入斑马鱼中而不破坏目标性内源基因,相比于HR,利用非同源性末端接合(Non-homologous end joining,NHEJ)在斑马鱼中实现非HR 基因敲入有两个优势。第一,在斑马鱼早期发育中NHEJ 比HR 的活性至少高10 倍。第二,不同于HR,NHEJ 不需要亲本斑马鱼基因组序列与靶向供体之间具有精确的同源性,避免了对亲本斑马鱼耗时的筛选和基因分型。
近两年CRISPR 技术迅速发展,随着CRISPR 系统和相关蛋白的研究越来越多,不断的完善和优化,推动人类疾病和动物模型的研究。CRISPR 系统相对于之前的锌指核酸酶和类转录激活因子效应物核酸酶基因编辑技术操作简单,周期短,应用范围大。但是CRISPR 技术存在着脱靶的问题,研究人员也在解决这一问题,如在设计sgRNA 时增加几个核苷酸可以减少错配率[28],较长的PAM 序列可以减少脱靶问题的发生[29]。
斑马鱼广泛应用于遗传学、发育生物学和神经生物学的研究,结合斑马鱼幼时全身透明的特点,基因组编辑技术在斑马鱼中将会提供更多更好的研究思路。