支大龙 季维智 牛昱宇
从现代遗传学之父——孟德尔发现遗传规律开始,到剑桥大学两位年轻科学家——沃森和克里克发现DNA是由两条核苷酸链组成的双螺旋结构,再到现如今在人类胚胎上实现基因组的定向修饰,科学家从未停止对生物遗传信息的研究。那么科学家是用什么工具研究基因的功能,甚至去编辑基因信息呢?对基因组的编辑好比对文本进行修改一样,首先找到“文本”的错误或者想要修改的地方,然后删去错误的地方或加入“文字”。基因组编辑过程中,如何找到目的基因,并对它进行编辑呢?
什么是基因组编辑
基因是决定生物性状的基本遗传单位。基因通过复制稳定地保持生物的基本特征,但是这个过程有时会受到外界环境的干扰。比如,在受精卵的发育过程中。外界环境的影响可能使子代的基因组发生变化,这种影响可能导致基因碱基的缺失、插入甚至突变。造成机体发生病变,这类疾病通常会遗传给下一代,也就是通常所说的遗传性疾病。对这类疾病发病机理的研究需要构建人类疾病动物模型,通过对基因组修饰的方法加以研究,这种技术称为基因组编辑技术。具体修饰方式与遗传性疾病的形成方式相类似:基因的定点突变、小片段的删失,以及目的基因的插入等。该技术被形象地誉为“DNA巡航导弹”,曾荣获《自然》周刊年度最受关注的技术。在生物医学领域,基因编辑技术不仅可以深入了解疾病发病机理,构建具有人类疾病模拟表现的动物和探索新型疾病治疗方案,还可以更准确地探究基因功能,是后基因组时代研究基因功能的重要手段。
传统的基因组编辑技术是利用胚胎于细胞(embryonic stem cell,ES细胞)与同源重组技术(即非姐妹染色单体间发生遗传信息的重组),对基因组进行定点修饰,这是最常见的一种定向改变生物活体遗传信息的实验手段。该技术首先需要获得ES细胞系,然后利用同源重组技术获得经过基因编辑的ES细胞,通过显微注射方式将经过修饰的ES细胞注射至受体胚胎内。这种经过遗传修饰的ES细胞仍具有分化成机体所有类型细胞的能力,可以与受体胚胎进行整合,使得被修饰过的遗传信息传递给受体,并最终实现生殖系遗传。
然而,这种基于ES细胞的同源重组基因打靶技术虽然能够实现基因组的定点突变,但是依赖于胚胎干细胞的获得、胚胎干细胞嵌合到动物生殖细胞的能力,以及同源重组在胚胎干细胞中的重组效率等因素,导致这种基因打靶技术周期长、效率低、耗时长,并有明显物种限制等缺陷。与上述基因打靶技术相比,基于人工核酸酶的基因组编辑技术,凭借其效率高、特异性强等特点,迅速成为生物医学研究的新热点。
人工核酸酶介导的基因组编辑
核酸酶可以水解DNA的特异碱基序列,通过人为改造,可实现对基因的修饰。目前主要的人工核酸酶有三种:锌指核酸酶(zinc finger nucleases,ZFN)、类转录激活因子核酸酶(transcription activator-like effectornucleases。TALEN)和规律成簇的间隔短回文重复序列系统(clustered regularly interspaced short palindromic repeats,CRISPR)。这三类人工核酸酶的结构组成大致可以分成两部分:DNA识别区域和DNA切割区域,但是每一种人工核酸酶的识别和切割方式不同,ZFN和TALEN是通过氨基酸与碱基的一一对应关系进行识别,而CRISPR系统则通过碱基互补配对原则完成这一过程。
这三种基因组编辑技术的工作原理大致相似:DNA的特异性结合,限制性内切酶在特定DNA位点进行切割,DNA双链断裂诱导细胞产生修复机制。修复机制有两种:非同源末端连接和同源重组修复机制。对损伤DNA进行修复,从而实现对基因组的定点修饰。
锌指核酸酶
锌指核酸酶是第一代人工核酸酶,由锌指蛋白(zinc finger protein,ZFP)实现对DNA的识别,核酸酶Fok I对DNA进行精确切割。其中ZFP负责识别和结合三个连续的碱基,而核酸酶Fok I则需要与两个锌指蛋白形成二聚体才具有酶切活性。将DNA双链切开,诱发细胞的DNA损伤修复机制。经过十几年的发展,锌指核酸酶技术已经应用于果蝇、斑马鱼、大鼠、小鼠等多种模式动物的遗传研究,成功实现了基因的修饰,在2005年,锌指核酸酶技术首次实现了对人类细胞的基因的定点修饰。
ZFN技术是最先应用的人工核酸酶技术,它与ES细胞同源重组基因打靶技术相比有以下几点优势:基因组定点修饰不需要获取ES细胞就能实现,敲除效率明显提高,无明显的物种限制。然而在利用ZFN对靶位点进行基因修饰的实际的操作过程中,每一个特定靶点都需要构建庞大的锌指表达文库才能更精确地识别目的基因,这一过程需要在体外或细菌、酵母等体系中检测ZFN的切割活性,并从中筛选出具特异性且高效表达的锌指蛋白,这一构建过程需要投人大量时间和精力,且费用较高。
类转录激活因子核酸酶
类转录激活因子核酸酶是第二代人工核酸酶。TALEN的结构与ZFN类似,其中TALE蛋白完成对DNA的识别,而核酸酶Fok I仍然是对DNA进行切割。与在ZFN中一样。核酸酶Fok I需要与两个TALE蛋白结合形成二聚体,才能完成对靶位点的精确切割,诱导细胞DNA修复机制从而实现靶位点的基因修饰。目前TALEN技术已成功应用于包括果蝇、斑马鱼、大鼠、小鼠以及人多能干细胞等的基因组修饰。2014年。中国科学家利用TALEN技术实现对非人灵长类X染色体连锁基因MECP2基因的敲除。
TALEN技术与ZFN技术相比实现了巨大的突破。第一,TALEN在构建上比ZFN更容易和高效,且TALEN的筛选只需要简单的分子克隆技术就可以完成;第二,TALEN有更加广泛的靶位点选择范围,且在DNA序列的特异识别上能力更强,效率也高。但TALEN的缺陷是:TALEN与ZFN一样,识别靶向基因的成分是蛋白质,当需要构建识别20bDDNA的TALEN蛋白时,可能需要设计含有一千多个氨基酸的TALEN蛋白,该过程耗时耗力,还可能引起未知的机体免疫反应,降低TALEN在细胞中的作用;另外,目前TALEN还不能很好地解决高效识别目的基因的问题,而这正是基因敲除中的重要环节。
规律成簇的间隔短回文重复序列系统
规律成簇的间隔短回文重复序列系统是第三代人工核酸酶,该系统最初在原核生物中被发现,它使生物具有某种获得性免疫功能,从而具备抵抗噬菌体、质粒等外来DNA入侵的免疫能力。直到2013年,该系统才被改造成为一种新型的基因组编辑技术,该系统凭借其独特的优势迅速成为全球生物医学领域的新宠。
CRISPR系统一般由两部分构成:CRISPR基因座转录的RNA以及CRISPR-associated(Cas)蛋白,其中II型CRISPR系统即CRISPR/Cas9系统被广泛应用于基因组编辑。与ZFN和TALEN不同,在CRISPR系统中CRISPR基因座负责特异性识别DNA,而Cas9核酸酶则具有与ZFP和TALE蛋白相似的功能,即切割DNA片段,使DNA发生双链断裂进而诱导细胞产生DNA损伤修复。目前,CRISPR/Cas9已经在斑马鱼、大鼠、小鼠、猴以及人类细胞等成功实现基因的靶向修饰。
CRISPR/Cas9系统相比于ZFN和TALEN有着明显的优势:由于CRISPR/Cas9系统是通过碱基互补配对进行基因的定位,因此与ZFN和TALEN相比,它在基因组中搜索的范围更广;CRISPR/Cas9系统可同时设计多个基因识别序列,可以完成ZFN和TALEN不能实施的对多个基因同时定点修饰的功能:CRISPR/Cas9系统在构建方面比ZFN和TALEN更简易且成本较低;CRISPR/Cas9系统易于改造,以实现更多生物学功能。然而,与ZFN、TALEN这些人工核酸酶一样,CRISPR/Cas9系统也存在不能高效识别目的基因的问题。
基因组编辑技术的应用
基因功能研究
随着高通量测序技术的快速发展,科学家迫切希望对基因功能进行更加深入的研究,其中将目的基因敲除是基因功能研究中不可缺少的环节。随着ZFN、TALEN和CRISPR/Cas9系统的发展,许多物种实现了单个或者多个靶基因的敲除,极大地推动了基因功能的研究。例如,利用ZFN技术在大鼠上成功实现靶基因的敲除,并证实该基因突变可稳定遗传至下一代;运用TALEN技术对斑马鱼的Tnikb和Dip2a两基因进行定点突变,随后证明这种突变可稳定遗传:利用CRISPR/Cas9系统同时编辑5个不同基因,使得深入研究基因家族成员的功能相关性成为可能。
基因治疗
基因治疗是将表达异常的致病基因利用基因编辑技术,将其改造为正常基因,实现治疗疾病的目的。传统基因治疗方法不仅很难将细胞中的缺陷基因的精准替换为正常基因,而且可能会将外源遗传信息遗留在细胞内,对细胞产生不可预知的作用。而人工核酸酶技术则可以在靶位点对基因实施精确的编辑或敲除,实现基因治疗的目的。
ZFN和TALEN作为最先发展的人工核酸酶技术,在基因治疗方面有着广泛的应用。利用ZFN技术在敲除小鼠突变的血友病基因后,再利用病毒载体将正常基因导入小鼠体内,从而实现血友病的治疗。此外,利用传统的基因编辑技术很难实现对线粒体遗传信息的改造。而将TALEN技术成功应用于线粒体突变基因的敲除,则使得治疗由线粒体DNA突变引起的疾病成为可能。
CRISPR/Cas9系统作为第三代人工核酸酶技术,被广泛应用于疾病的基因治疗。胡文辉等运用CRISPR/Cas9技术首次将艾滋病病毒从人细胞中清除,这对于艾滋病的治愈有着重要意义;尹浩等利用CRISPR/Cas9技术修饰了可导致酪氨酸血症I型的基因,成功纠正了部分存在于肝细胞中的突变基因,将正常肝细胞恢复至总量的三分之一,这足以治愈该病,
人类疾病模型
在人类疾病发病机制和药物筛选研究中,构建人类疾病动物模型有着不可替代的重要作用。灵长类动物是生物医学研究中广泛使用的实验动物,由于其在生理生化和遗传上与人类高度接近,成为研究人类疾病适宜的动物模型。
2014年,笔者所在研究组与合作者利用TALEN技术实现了对食蟹猴x染色体连锁基因MECP2基因的敲除,首次成功构建非人灵长类动物模型。MECP2基因位于x染色体,该基因的突变通常会造成雄性胎儿在妊娠中期发生死亡,而雌性胎儿则可顺利出生并存活,该胎儿在出生后6-18个月发生病变,表现出自闭症特点的“Rett综合征(Rett syndrome)”,这是一种严重影响女性神经系统发育的疾病。
同年,笔者与合作者又利用CRISPR/Cas9技术对食蟹猴基因组进行修饰,获得多位点基因敲除的双胞胎食蟹猴,这是CRISPR/Cas9技术首次应用于非人灵长类,对于一些由多基因控制的神经退行性疾病的研究(例如帕金森病)和相关疾病动物模型的构建有着非常重要的意义。通过进一步检测新生小猴脐带和胎盘的DNA样本,没有发现脱靶现象。此外,对流产胎儿的生殖系细胞利用单细胞测序技术进行检测后,发现生殖细胞也发生了基因突变,首次证明运用CRISPR/Cas9技术介导的基因突变可以实现生殖系遗传。
挑战与展望
传统的基因打靶技术在人类疾病动物模型建立和发展新的基因治疗手段中,发挥着重要的作用,而人工核酸酶介导的基因编辑技术凭借独特优势,更是极大地推动了生命科学研究的进程,其中利用CRISPR/Cas9构建的灵长类动物模型对于研究人类疾病具有里程碑式的意义。但即使是TALEN,CRISPR/Cas9这些能精确进行基因修饰的人工核酸酶技术也处于发展的初级阶段,很多问题有待解决,如怎样提高打靶效率获得纯合的基因编辑子代,外源基因的定点敲入等。此外。体细胞核移植技术是获得转基因动物最为可靠和有效的方法,在未来的研究中将人工核酸酶技术与核移植技术结合,可以更高效地建立人类疾病的动物模型,为深入研究疾病发病机制和探索新的治疗方案提供更多可能。