赵旭东 黄永志 毕延震 董发明
(1. 河南科技大学动物科技学院,洛阳 471023;2. 动物胚胎工程及分子育种湖北省重点实验室 湖北省农业科学院畜牧兽医研究所,武汉 430064)
当今,动物转基因技术主要应用于动物遗传改良、培育动物新品种、制造生物反应器、建立疾病模型和器官移植等[1-4],部分动物转基因产品已经实现了商业化开发。如在2015年美国FDA批准了转基因三文鱼上市,成为世界上首个获批可用作食材的转基因动物[5]。目前,动物转基因遇到的瓶颈是外源基因表达沉默。其原因主要集中在以下两个方面:染色体DNA水平上的位置效应[6]和外源基因表观修饰异常。近些年,随着定点整合技术的飞速发展和友好位点的开发与应用,克服外源基因表达沉默有了新的解决方案。为此,本文对动物转基因高效表达策略进行了归纳和论述,以期对转基因动物研制和推广有所裨益。
当前,基因编辑技术的发展使外源基因定点敲入变得相对简单且高效,但不能忽视的是外源基因依然面临着敲入到何处的难题,这是因为基因敲入的区域不同,将直接造成基因表达的效率差异。友好位点就是基因组中表达外源基因较为活跃的区域。因此,利用定点整合技术将外源基因插入至友好位点将是解决外源基因表达沉默的有效途径。友好位点的探索、挖掘与验证工作,已历经了长达20多年之久,在哺乳动物中已成功鉴定出多个可行的友好位点。例如,Rosa26、Hipp11、chr1-attP等位点。
Rosa26位点是一种最常用的友好位点,已经广泛应用在以小鼠、大鼠、猪等为实验对象的研究之中[7-9]。 早 在 1991 年 Friedrich 和 Soeiano[10-11]使用逆转录捕获技术在小鼠基因组中率先发现并鉴定出Rosa26位点。他们设计一个报告基因 β-geo(由β-半乳糖(β-gal)和新霉素磷酸转移酶(neo)形成的融合基因),利用该报告基因载体共筛选出了29个阳性单克隆ES细胞。后分析发现代号为ROSAβgeo26小鼠品系的纯合子和杂合子小鼠均无任何异常表型,报告基因 β-geo在该品系小鼠所有细胞和成体组织中都呈高表达,且该位点有着极高的插入效率,Rosa26位点已广泛的运用在外源基因的定点整合中。Carreras等[12]将人的PCSK9基因插入至小鼠Rosa26位点,得到了高胆固醇血症疾病的小鼠动物模型。2007年,Irion等[13]首次在人的胚胎干细胞基因组中鉴定出Rosa26位点。2012年,Kobayashi等[14]在大鼠基因组中同样发现了Rosa26位点。2014 年,Li等[15]利用同源比对的方法找到了猪源Rosa26 位点,通过转录激活样效应因子核酸 酶(Transcription activator-like effector nuclease,TALEN)技术将报告基因插入到该位点,实现了绿色荧光蛋白在猪胎儿成纤维细胞(Porcine fetal fibroblast,PFF)内的定点整合表达,并利用体细胞核移植技术得到了在Rosa26位点定点整合绿色荧光蛋白的仔猪,后经荧光检测证实敲入此位点的报告基因在猪全身各组织器官都能高表达,证明了猪源Rosa26位点同样是利于外源基因表达的一个友好位点。目前,利用该位点已成功开发了数种表达外源基因的转基因动物或细胞系。
Hipp11 位点是由斯坦福大学的Hippenmeyer等[16]发现并命名,它位于小鼠基因组第11号染色体 Eif4enif1与 Drg1 基因之间,由于Eif4enif1、Drg1两个基因的侧翼序列区域具有广泛的空间和时间表达序列标签(Expression sequence tag,EST)表达模式,能够使整合在此的外源基因受指定启动子的驱动而稳定高表达,且该位点的纯合敲入小鼠可正常发育和繁殖,因此Hipp11是一个表达外源基因的友好位点。介于鼠源Hipp11位点具有安全性高,无基因沉默和广泛表达活性的特点,阮进学团队相信猪源Hipp11位点也极具潜力,2014年,Ruan等[17]使用同源比对方法在猪基因组中找到了猪源Hipp11位点,并利用TALENs和CRISPR/Cas9等基因编辑技术对其进行了基因打靶。不仅实现对猪源Hipp11位点的鉴定,更证明该位点为猪基因组上一个表达外源基因的友好位点,这为外源基因在猪基因组内高效表达定点整合提供了新的选择。
众所周知,链霉菌噬菌体φC31整合酶具有将attB位点与attP位点特异性结合的特点,该系统通过attB介导外源基因可以实现在attP位点的定点整合。研究表明多种真核动物体内都存在假attP位点[18-23]。在此基础上,毕延震等[24-26]通过构建内含attB和增强绿色荧光蛋白基因(Enhanced green fluorescent protein,EGFP)的报告载体与φC31整合酶表达载体共同转染PK-15细胞系,在猪基因组中找到4个假attP位点。随后通过显微注射φC31整合酶mRNA和EGFP报告载体至猪一细胞受精卵中,得到了转基因仔猪。通过对转基因仔猪耳源组织成纤维细胞进行检测,发现4个假attP位点中的chr1-attP位点对EGFP有较高水平的表达,从而确定chr1-attP位点是个利于外源基因高效表达的友好位点。
Pifs 501位点是Ma等[27]于2018年分析鉴定出的1个猪源友好位点。先使用In Silico生物学方法在猪基因组中预测了多个备选位点,通过对其中评分较好的两个位点Pifs 501和Pifs 302,使用CRISPR/Cas9介导位点特异性重组系统,将EGFP插入其中,并与pRosa26位点横向比对,结果显示pRosa26和Pifs 501对外源基因的表达水平均远高于Pifs 302,尽管pRosa26对EGFP表达更高,然而Pifs 501同样是一个有利于外源基因表达的猪源友好位点。
要利用友好位点,就不得不提到定点整合技术。如果把友好位点比喻为“目的地”,那么定点整合技术就是到达目的地的“路径”。当前的定点整合技术主要有以下几种:基因编辑技术、位点特异性重组系统和转座子系统。
时至今日,基因编辑技术已经历3次变革,锌指核酸酶(Zinc finger nucleases,ZFNs)[28]是最早开发使用的基因编辑系统。该系统由特异识别DNA的锌指核酸序列和非特异性核酸切割酶组成[29]。Bibikova等[30]通过构建ZFN靶位点载体和ZFN表达载体,并将其共转然细胞,发现了ZFNs能将基因组切割开的基因编辑能力。Perez-Pinera等[31]在2011年通过ZFNs系统配合同源重组,成功地在Rosa26位点实现外源基因的插入表达,证明了ZFNs系统可以实现外源基因的定点整合。第二代基因编辑技术TALENs又名转录激活样效应因子核酸酶[32]。2014 年,李小平[33]借助 TALENs基因编辑技术实现了对猪友好位点的精确敲入。相比于前代ZFNs,TALENs具有构建更为简单、细胞毒性更小、切割效率更高等特点[34]。Wu 等[35]利用 TALENs将小鼠的SP110基因敲入至牛基因组中,最终得到抗肺结核菌的转基因牛抗病模型。第三代基因编辑技术CRISPR/Cas系统是学者们在研究细菌和古细菌的免疫机制中发现的[36-37]。以CRISPR/Cas9为例,早期的CRISPR系统需要crRNA(CRISPR-derived RNA)与tracrRNA(Trans-activating RNA)参与并结合Cas9蛋白表达以实现对基因组的切割[38]。而后优化的CRISPR/Cas9系统由一条单链sgRNA即可引导Cas9切割sgRNA靶位点区域,实现对基因组靶位点区域的定向编辑。相较于前两代基因编辑技术,CRISPR/Cas系统更易于操作、构建简单、效率更高。Yang等[39]在2013年使用该基因编辑技术,利用同源重组(Homologous recombination,HR)修复机制将报告基因插入至小鼠基因组中,实现了定点整合稳定表达。阮进学[40]同样使用该基因编辑技术在细胞内引起DNA双链断裂(Double strand break,DSB),利用同源重组介导外源基因,实现了大片段基因的插入。
虽然CRISPR/Cas9利用同源重组介导能够实现外源基因的插入,但是由于同源重组的效率极低,严重影响了定点整合的敲入效率。当然,同源重组只是DNA发生双链断裂之后其中一种修复途径,非同源末端链接(Non-homologous end joining,NHEJ)[41-42]修复也是其中一种。由NHEJ介导同样可以实现外源基因的插入,美中不足的是尽管NHEJ在插入效率上远高于HR,但它属于一种易错修复,会造成插入的外源基因出现缺失,因此当需要精确、高保真的定点整合外源基因时,NHEJ也非最佳的选择。Nakade等[43]和 Sakuma等[44]提出利用微同源的末端链接(Microhomology-mediated end joining,MMEJ)介导的外源基因插入,并将这种方法称为精确整合到靶染色体系统(Precise integration into target chromosome,PITCh)。实验结果显示,无论是利用TALENs构建的TAL-PITCh系统或是利用CRISPR/Cas构建的CRIS-PITCh系统都具备高效的外源基因插入能力。随后Sakuma团队[45-47]又在多种动物或细胞上证明,MMEJ具有高保真和高效率的敲入特性,是介导外源基因敲入的良好方法。
相较于当前使用的基因编辑技术去实现基因的定点插入,早期的定点整合主要是通过位点特异性重组系统实现的。比较有代表性的是Cre/Loxp、Flp/FRT和φC31。Cre/Loxp重组系统[48]由Loxp序列和Cre重组酶组成。Flp/FRT重组系统[49]由FRT序列和Flp重组酶组成。φC31系统[50]源于链霉菌噬菌体,由识别序列attB、attP和φC31重组酶组成。Cacciatore等[51]在综述位点特异性重组系统时详细列举介绍了这3个系统。Cartwright等[52]利用Cre/Loxp系统成功构建了表达多种功能蛋白的小鼠模型。Bischof等[53]利用φC31特异性重组系统构建了转基因果蝇,实现了大片段cDNA的插入。不过这3种技术均有不足,Cre/LoxP和Flp/FRT均需要在宿主基因组内“预植”识别位点,这本身就增加了操作难度。φC31整合酶的识别位点不是“唯一”的,可能带来多位点整合,同样为后续研究增加了复杂性。
转座子(Transposon)也称转座元件,是一类可以在基因组中某一位点转移或自我复制到另一个位点从而改变它们在基因组中原有位置或增加其拷贝数的遗传因子。转座是一种特殊的遗传重组,目前转座子按其转座的方式可以分为两大类:一类直接以DNA到DNA的形式在转座酶的参与下进行“剪切-粘贴”式转座,称为DNA转座子;另一类则以RNA为中介,在反转录酶参与下完成“复制-粘贴”式转座,称为反转录转座子。
随着研究的深入,科研人员还创造了转座子与基因编辑结合的系统。2017年8月,Peters等[54]发现了一类编码在Tn7-like转座子中的CRISPR/Cas系统。在此基础上,2019年6月,美国麻省理工学院的张锋研究组[55]证实了蓝细菌中CRISPR-associated transposase(CAST))系统具有RNA引导转座酶进行目的DNA插入的能力;同一时间美国哥伦比亚大学的Klompe等[56]也证明了霍乱弧菌中的一种Tn7-like转座子相关CRISPR/Cas(Cascade)系统的基因编辑能力。两个系统分别基于V-K CRISPR/Cas和 I-F CRISPR/Cas系统,都能实现不产生DSB的情况下将外源DNA片段定向插入到细菌基因组DNA中。两个系统虽然都不够完善,但是相比于利用同源重组的编辑方式在安全性和效率上都具备天然的优势,也为基因编辑定点整合至基因组DNA提供了新的研究方向。
总的来说,虽然几大系统都可以实现外源基因的定点敲入,但各系统还是存在着不同的优点和缺陷。就基因编辑技术而言,它的优势是可用靶点众多,且构建简单。例如CRISPR/Cas9系统依靠 PAM 序列和 sgRNA 就可实现靶位点的识别;劣势是虽然能够实现外源基因的定点整合,但是目前多是利用HR的DNA修复方式完成,由于HR效率过低,给阳性克隆的筛选带来了很大的难度。科研人员在后续的研究中为克服HR的低效问题陆续提出了非同源末端链接(NHEJ)、微同源介导的末端链接(MMEJ)、独立的同源性靶向整合(Homology-independent targeted integration,HITI)[57]、同源介导的末端链接(Homology-mediated end joining,HMEJ)[58]等方式,但这些介导插入方式仍然存在着外源基因插入效率不够高或是插入DNA序列保真性较差等不足。位点特异性重组系统和转座子系统虽然存在着可用靶点少的问题,但其在插入效率上要明显高于HR、MMEJ或NHEJ,故这些系统有其独特的优势。
通过基因编辑技术与位点特异性重组系统或转座子系统之间的结合使用,先利用基因编辑技术将位点特异性系统或是转座子系统识别序列携带报告基因一同插入至友好位点内,后使用位点特异性重组系统或是转座子系统,则会较好地实现外源基因高效、高保真度的定点敲入。Zhu等[59]等就是先利用TALENs将内含φC31-attP、报告基因、Bxb1-attP序列的表达盒插入至人源细胞Hipp11位点处,又利用双噬菌体重组酶表达载体和φC31-attB、外源基因、Bxb1-attB序列的表达载体,通过位点特异性重组系统将新的外源基因插入在位于Hipp11位点内的φC31-attP、Bxb1-attP序列中,得到表达该基因的细胞系,成功构建了一个疾病细胞系模型。这种策略先利用基因编辑技术弥补位点特异重组系统插入位点单一和敲入区域少的短板,后使用位点特异重组或是转座子系统解决基因编辑效率低下的问题,从而实现在友好位点反复插入其他功能基因的目的。de Leon等[60]利用CRISPR/Cas9使用与Zhu课题组相同的双整合酶盒式交换系统(Dual integrase cassette exchange,DICE),通过先CRISPR后DICE得到了表达RyR1基因的细胞系疾病模型,同样证明了该系统的高效敲入性和在精确编辑上的巨大潜力。
顺式作用元件是广泛存在于基因旁侧序列中,能影响直接基因表达的序列。通过优化外源基因的顺式作用元件能够提高外源基因的表达效率,此方法主要体现在对表达载体的优化,包括优化启动子、增强子、添加内含子、使用染色质开放元件、添加核基质附着区等。
启动子是RNA聚合酶进行高效准确转录所必须的,通常来说增强子包含在启动子之中。现如今发现的启动子种类有很多,像CMV、β-肌动蛋白、c-fos、U6等。如要实现外源基因的特异性表达,应选择组织特异性或时空特异性的启动子、增强子。Ostroweki等[61]为了实现标签基因在呼吸系统中的特异性表达,选用了纤毛特异性启动子作为其表达元件,最终实现绿色荧光蛋白的特异性表达。Bi等[62]对比试验发现c-fos启动子对绿色荧光蛋白较CMV启动子有更高表达效能。赵芳等[63]使用肌肉特异性启动子SP和CMV双启动子,成功地在肌肉组织中特异表达EGFP。Colella等[64]为实现在特异性多区域或组织器官中的表达,研究设计开发了一种串联启动子,这种启动子是通过对肝细胞、肌肉细胞和神经元中的具有活性的特定组织调控元件进行组合得到的,这种串联启动子可实现标签蛋白在肝脏和肌肉中高效表达。
内含子对基因表达同样有重要的影响。事实上在选取目的基因时,使用基因组DNA或使用添加内含子的cDNA,能显著提高该基因的表达。Brinster等[65]采用cDNA构建的载体在转基因鼠中未能激活该基因。研究发现β-球蛋白基因在小鼠中表达时,第2内含子对于该基因的表达是必需的,从而发现内含子在外源基因的表达中具有相当重要的作用。Lu等[66]通过开发一种小内含子质粒表达载体系统,载体元件的一个通用型5'UTR中内含一小型工程内含子,该系统不仅克服了基因沉默,较使用典型小圆环DNA质粒载体相比同一外源基因的表达量提高了10倍。Gallegos等[67]系统叙述了内含子增强基因表达的一系列现象。Jaeger等[68]设计网络工具Intronserter,利用该工具可以在cDNA作为外源基因序列中设计添加内含子,实验证明改造后外源基因的表达量提高数倍之多。
染色质开放元件(Ubiquitous chromatin opening elements,UCOE)是内嵌于甲基化的CpG岛且内含双向启动子的基因片段,当它连接在载体启动子上游时,既具有染色质重塑功能,还有抵抗基因沉默的作用[69]。Boscolo等[70]发现源于人的HNRNPA2B1/CBX3基因座上的UCOE可以提高CHO细胞中重组蛋白的表达水平3-10倍。高会贞等[71]利用HNRNPA2B1/CBX3同源比对得到多个猪源UCOE序列,通过实验筛选出了一个猪源UCOE能使报告基因绿色荧光蛋白GFP稳定高效表达,也进一步证明了UCOE具有提高外源基因表达的作用。
核 基 质 附 着 区(Matrix attachment regions,MARs)又称核骨架附着区,指的是染色体上专一的与核骨架结合的DNA序列。该序列AT含量丰富,且内含拓扑异构酶H保守序列。研究表明在载体元件中添加MAR能够显著地消除转基因沉默,消除异染色质对外源基因表达的影响。李琴等[72]在2017年利用重组CHO细胞探究载体内是否含有MAR对转基因表达的影响,结果显示使用CMV启动子配合β-珠蛋白MAR比无MAR配合的转基因表达提高了2.14倍。
为高效地筛选表达外源基因的阳性克隆细胞,常会使用标记基因与之共同表达。研究发现,通过弱化抗性标记基因的表达可以降低筛选浓度,减少对细胞生长速率的影响,从而获得细胞上更高水平的重组蛋白表达。当前弱化抗性标记基因的方法主要是突变筛选标记基因降低其活性表达。刘苏等[73]将表达载体上的新霉素磷酸转移酶(NPT)序列中的一个天冬氨酸突变为甘氨酸,试验结果表明突变型NPT对抗生素G418抗性减弱,其突变型细胞的EGFP表达量显著高于野生型。
除了上述几种优化顺式作用元件的方法,还有一些研究思路同样能够实现外源基因的高效表达。Deykin等[74]测试了在转基因序列边界加上转录终止序列(Transcription terminator sequences,TTS)是否对转基因表达有影响。他构建了以山羊β-酪蛋白基因启动子表达Fluc报告基因的双顺反子表达载体,对照组启动子上游无调控元件,实验组在启动子上游插入染色质绝缘子(HS4)或两个双向TTS,结果使报告基因的表达量提高约10倍,证明了在启动子上游加入TTS能够促进外源基因的表达。
转基因表达沉默是普遍存在的现象,常规质粒载体并不能解决这一问题。有报道称,某些高含量的An/Tn片段可以消除表达系统中的基因沉默,为此Lu等[75]通过在质粒骨架中设计加入An/Tn序列组(优化An/Tn数量不改变编码氨基酸),实验结果表明加入An/Tn序列后,不仅阻止了外源基因的转录沉默,得到的表达载体具有在小鼠肝脏中持续转基因表达的特性。
从生物安全的角度看,仅仅实现外源基因高效表达是不够的,还应该注意衍生的问题,特别是外源基因整合过程中可能引入选择标记,选择标记的残留可能造成生物安全隐患,所以在设计外源基因高效表达方案时,还应同时考虑如何处理标记,确保最终产品满足安全要求。例如,王志蕊[76]提出的使用Cre/Loxp可以做到基因组的无选择标记基因修饰,实现对选择标记基因完全删除。此外,Kim等[77]提出并证明使用微同源末端连接(Microhomologymediated end joining,MMEJ)技术同样可以实现对选择标记的无痕删除。
相信随着对基因沉默机理的深入揭示、友好位点的不断挖掘和转基因技术的改良和创新,通过以基因编辑技术为主的多系统灵活运用,必将把动物转基因研究推向新的高度,更好地用于动物育种和生产。
总的来说,为了提高外源基因的表达效率,当前的策略是通过利用友好位点和优化顺式作用元件等灵活叠加使用实现的。这种策略不仅克服了单一定点整合技术的局限性,更发挥了各技术的集成优势。但就近几年的实践来看,仍然有几个问题是要下力气解决的。
一是定点整合的效率不够高。虽然动物转基因得益于基因编辑技术的发展,广泛的定点整合已成为可能,但定点整合的效率依然处于较低水平。究其根源:其一,定点整合首先依赖于DNA的双链断裂;其二,在出现DSB之后,切口附近需要足够的模板DNA引发整合。未来解决这个问题的思路应该是增大DSB的产生概率或是使用更有效的整合方式介导外源基因的插入,比如开发切割效率更高的工具酶或是找到合适的方法使DSB附近招募整合更多的模板DNA,提高引发整合的概率。
二是可用的友好位点数量较少。对基因工程动物育种来说,目前仅有Rosa26、Hipp11等少数几个友好位点。从长远发展看,友好位点的数量不足,不可避免会引起知识产权的冲突。另外,为追求更高效的友好位点,仍然需要在动物基因组内做深入的挖掘工作。