我们都知道保持自然界丰富多彩的生物学基础是遗传和变异,遗传可以让物种一代一代的稳定存在,而变异又可以让物种变得多姿多彩,使物种内的个体不会一模一样。而遗传和变异的基础是DNA或RNA。DNA的变异可能产生有益基因,也可能会产生有害基因,导致不良性状的产生。因此生物学家们一直梦想可以在细胞内对遗传物质或者叫基因进行精准的修改。作为农业科学工作者或者育种家,当需要把某个优良基因导入到栽培品种中时,在基因编辑时代之前,通常采用的方法是杂交育种、诱变育种等。要把优良基因导入栽培品种,需要育种家一年又一年的田间筛选工作,往往从青年熬到中年,即便如此,能够培育出较突出的优异品种的也是凤毛麟角。对育种人来说真的太难了。而基因编辑技术出现后,只需要对目标基因进行修改,一两年内就可以获得一系列理想中的品种。
所谓基因编辑,是指在细胞内对遗传物质进行修改。目前常用的基因编辑主要是CRISPR/Cas9(Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR) and CRISPRassociated(Cas)9)系统,它主要由两部分组成,一是Cas9蛋白,该蛋白含有核定位信号,可以将表达的Cas9蛋白转运到细胞核内;另一部分是sgRNA(Single guide RNA),包括5’端20个碱基的引导RNA和3’端的颈环结构,20个碱基通过序列互补识别目标基因,颈环结构被Cas9识别,二者结合形成复合体(图1)。Cas9蛋白与sgRNA形成复合体后,可以快速的对基因组内的NGG位点(PAM位点)进行扫描,一旦找到与引导RNA(20个碱基)互补的基因组DNA,Cas9/sgRNA复合体就会停止移动,Cas9蛋白就会对基因组进行剪切,在DNA修复过程中就会产生各种变异,从而达到对靶标基因进行编辑的目的[1]。
图1 CRISPR/Cas9系统的组成单元[1]
基因编辑从诞生起,就对生物领域产生了广泛的影响,它在疾病治疗、农业生产、药物开发等多个方面具有巨大的应用价值。在农业上,基因编辑可以极大地推动基因功能研究,而基因功能的清晰明了可以进一步促进农作物的按需改造,培育优质高产、抗逆、抗病和环境友好型的基因编辑农作物。
从1987年发现CRISPR/Cas9的第一个元件开始,到2012年CRISPR/Cas9系统开始应用到细菌中,再到随后几年相关研究的爆发性增加,我们还在惊叹它的迅猛势头和强大功能之时,很多相关技术却已经成为了历史。
1987年,日本的Nakata科研团队对大肠杆菌iap基因进行测序时,发现在该基因终止子后存在一串间隔重复回文序列(图2),由于可以形成串联的二级结构,他们推测该序列可能和mRNA稳定有关[2]。
图2 基因iap序列中的间隔重复回文序列[2]
1995年,读博士的Mojica在几种古细菌中也发现了类似的序列(图3)[3],他对这种有规律的序列十分好奇,他推测与细菌的繁殖有关。但是重复序列在基因组中实在太常见了,没有多少人在意这些看似没有功能的序列。随着测序技术的发展,2000年,Mojica收集了更多的类似序列,他发现40%的细菌和90%的古细菌都有这种短的间隔重复回文序列(图3)[4]。
图3 细菌和古细菌中的间隔重复回文序列[3-4]
2002年,Jansen等发现,这类间隔重复回文序列相邻的区域,都存在着比较保守的基因(图4),这些基因现在统称为Cas基因[5]。Jansen和Mojica一起命名了CRISPR(Clustered regularly interspaced short palindromic repeats)和Cas gene(CRISPR-associated gene )。
图4 间隔重复回文序列相邻的Cas基因[5]
2005年,生物学家Bolotin对间隔重复回文序列之间的间隔序列产生了兴趣,他们把间隔序列与DNA数据库进行比对分析,结果令人十分震惊,原来这些间隔序列大部分来自于噬菌体。学者Mojica也发现这些序列来自于噬菌体或质粒,他们都推测这些间隔序列可能和细菌防御外来遗传物质侵染有关[6]。同年,Pource等进一步发现这些间隔序列的排列具有一定的规律性,越是古老的序列,位置离转录起始越远[7]。由此他们提出CRISPR可能参与细菌的免疫功能的假说。
2007年,Horvath课题组的Barrangou博士首次证明了CRISPR系统是细菌的免疫系统:当噬菌体侵染细菌时,在细菌的CRISPR处获得了新的来源于噬菌体的间隔序列,同时新的菌株能对噬菌体产生抗性;另外,Cas基因的突变使细菌丧失了抗性(图5)[8]。
图5 CRISPR系统是细菌的免疫系统[8]
既然CRISPR系统与细菌的免疫系统有关,当噬菌体入侵细菌遗传系统后,细菌就会对外源DNA进行剪切,从而产生抗性。2008年,Deveau等发现了Cas蛋白剪切位点(PAM位点)具有保守性[9]。2011年,Charpentier教授刚工作不久,也对这类系统产生了十分浓厚的兴趣,她找了个硕士研究生Deltcheva进行相关研究,他们发现一段非编码RNA介导了DNA的剪切(图6)[10],研究结果发表在顶尖级学术杂志Nature上。
图6 非编码RNA介导DNA的剪切[10]
至此,CRISPR/Cas作为细菌的免疫防御系统的作用机制已大致清晰:当外来DNA入侵细菌时,CRISPR/Cas可以捕获外来DNA片段到CRISPR的间隔区,该序列表达后与tracRNA互补与Cas9结合形成复合体,从而对外来DNA进行剪切(图7)[11]。同样,作为基因编辑系统的几个重要要素都已清晰,包括Cas9蛋白,sgRNA,PAM位点,tracRNA等[12]。
2012年9月,Siksnys首次在细菌内表达Cas9和RNAs,实现了对细菌基因组DNA的剪切(图8)[13]。2012年4月6日Siksnys将手稿投递给Cell杂志,6天后该杂志通知其拒稿。Virginijus Siksnys于当年5月21日将该稿投给PNAS杂志并于9月4日在线发表。
图7 CRISPR/Cas9作为细菌的免疫防御系统的作用机制[11-12]
图8 细菌内表达Cas9和RNAs实现对细菌基因组DNA的剪切[13]
同年7月,来自加州大学伯克利分校的结构生物学家詹妮弗·杜德纳(Jennifer Doudna)和瑞典于默奥大学的埃马纽埃尔·卡彭蒂耶(Emmanuelle Charpentier)合作将tracRNA和crRNA整合成一条RNA,并发现只需Cas9和人工sgRNA在细菌内就能对DNA进行剪切(图9)[14]。2012年6月8日将论文投与Science杂志,并于6月28日发表。她们的研究证明了在双链RNA指导下切割双链DNA断裂的内切酶家族并揭示了CRISPR/Cas系统在RNA指导下进行基因编辑的巨大潜力。
2013年2月,Science背靠背发表了麻省理工学院博德研究所的张锋课题组和来自于哈佛大学医学院的George Church课题组关于CRISPR系统在动物细胞系中的编辑功能(图10)[15-16]。加州大学旧金山分校系统及合成生物学中心的华人齐磊(Lei S.Qi)实验室,同年也成功将CRISPR/Cas系统应用到哺乳动物细胞中,研究结果发表在Cell杂志上[17]。随后,人们实现了对果蝇、线虫、大鼠、猪、羊、等多种动物的基因编辑。同时,基因编辑技术在医学领域如癌症治疗,胚胎编辑,干细胞等方面的应用在中美两国像展开竞赛一样,只要有人通过创新领先一步,其他人就会奋起直追。
图9 Cas9和人工sgRNA在细菌内表达实现对细菌DNA的剪切[14]
图10 CRISPR系统在动物细胞系中实现基因编辑[15-16]
同年,在植物中也有了相关报道。其中中国科学院遗传所的高彩霞老师开发了多种基因编辑工具,用于植物的基因编辑,极大地推动了植物的基因编辑的发展[18-19]。且高彩霞老师课题组创建了首个具有应用价值的基因编辑农作物,抗白粉病的面包小麦(图11)[20]。
图11 基因编辑的抗白粉病面包小麦的创制[20]
基因编辑技术在农业领域的应用也展露头角。除了上面提到的基因编辑的抗白粉病小麦,还有像花束一样的基因编辑西红柿,美国冷泉港实验室通过对控制株型紧凑快速开花的基因SP5G和终止生长,提前成熟的基因SP进行基因编辑,创制出早花早熟,果实成束,颜色多彩的城市西红柿(图12)[21]。日本的筑波大学通过对花青素合成酶基因DFR-B进行基因编辑和修饰,得到了色彩斑斓的牵牛花(图12)[22]。而宾夕法尼亚大学的白蘑菇也只是对一个多酚氧化酶基因PPO进行了编辑就实现了多酚氧化酶活性降低30%,从而减少了白蘑菇在空气中的褐化(图12)。而且,据nature news报道这种基因编辑蘑菇已经不在美国农业部监管范围内[23]。欧洲对转基因比较保守,甚至影响了基因编辑作物的发展。数据显示,从2007年到2011年,35%的基因编辑的科学出版来自欧洲,但之后被美国超过。也有科学家呼吁欧盟放松作物基因组编辑监管[24]。中国虽然在研究水平上处于世界领先地位,但由于公众舆论压力大,即便是基因编辑领域的专家也是小心谨慎,我们也只能从一些学术会议上听到科学家们呼吁我国应该放松对基因编辑作物的监管的“建议”。
短短几年时间,基因编辑系统深刻的改变了生命科学研究。当我们还在惊叹于系统内某项新技术功能强大之时,它已经被更绝妙的方法所替代,而上一项技术已然成为了历史。基因编辑技术在医学、农业等领域的应用以及由此而产生的基因编辑产品也是让人目不暇接,似乎只有如何监管已经成为了一个被追着跑的问题。
图12 基因编辑西红柿,蘑菇和牵牛花[21-23]