黄广燕,王豪强,李国玲,吴珍芳,2,张献伟,2
(1 华南农业大学 动物科学学院/国家生猪种业工程技术研究中心,广东 广州 510642;2 温氏食品集团股份有限公司,广东 云浮 527400)
近年来,来自化脓性链球菌Streptococcu pyogenes的II型CRISPR/Cas9系统因其能够高效产生基因组双链断裂 (Double-strand break, DSB),在人类疾病模型制备[1]、基因治疗[2-3]和农业遗传改良[4-5]等方面得到广泛应用。当细胞产生DSB后,机体主要通过非同源末端连接(Nonhomologous end joining, NHEJ) 或同源定向修复(Homology-directed repair, HDR)竞争修复 DNA 损伤,以保持基因组的完整性[6]。其中NHEJ介导的DNA修复容易出错,常常会引入碱基对的随机插入或缺失[7];而HDR利用同源染色体作为模板可以精准修复受损DNA,为定点转基因或基因敲入(Knock-in, KI)技术提供了理论基础[8]。自然情况下,哺乳动物基因组的同源重组频率很低,约10−4~10−6[9]。尽管 Cas9 系统高效地引入了 DSB,但目前由HDR介导的KI效率仍较低[9]。因此,寻找一种促进HDR的方法是提高哺乳动物细胞基因KI效率的关键。
HDR过程相对NHEJ较为复杂。以哺乳细胞为例,当DNA损伤传感器MRE11-RAD50-NBS1复合物检测到有DSB产生后,与DNA损伤检验有关的毛细血管扩张性共济失调突变(Ataxia telangiectasia mutated, ATM)因子被招募到断裂位点上,并激活感知基因完整性检查点。通过一系列的磷酸化激活中心效应酶CHK1和CHK2传播信号,核酸酶不断地聚集并切除5′端DNA,使断裂处变成单链 DNA(Single-strand DNA, ssDNA)。ssDNA 先与复制蛋白 (Replication protein A,RPA)因子结合,随后RAD51代替RPA结合到ssDNA上,产生RAD51-ssDNA核蛋白丝。该细丝在入侵的DNA和同源dsDNA模板之间形成物理连接,搜索同源序列,并在供体位点形成异源双链D环。当断裂的其中1条ssDNA修复后,细胞会根据碱基互补配对原则用这条修复好的单链修复另1条ssDNA,至此完成同源修复的过程。RAD51的重组酶活性是HDR通路的催化核心,且能作为复制阻断酶来维持脊椎动物细胞染色体DNA的稳定。RAD18不是HDR关键因子,但其广泛参与有丝分裂细胞复制损伤旁路,是基因复制后修复的必需蛋白。研究表明,RAD18基因敲除后的细胞有表现出明显的HDR依赖性修复降低以及对拓扑异构酶I抑制剂喜树碱敏感[10],这说明了RAD18对维护基因组稳定性有十分重要的作用。当DNA损伤引发模板链复制停滞,ssDNA暴露出来,被RPA复合物包裹后,ATR/Chk1信号通路激活[11]。随后RAD18被招募到复制停滞位点,并与酵母中的RAD6或人类中的HHR6A/HHR6B结合形成紧密的E2-E3复合物。RAD18-RAD6复合物及其介导的增殖细胞核抗原 (Proliferating cell nuclear antigen, PCNA)单泛素化构成分子开关,招募复制性聚合酶如polδ、polη等开始修复。因此,单泛素化后的PCNA是DNA翻译合成聚合酶转换的关键,如RAD18经c-Jun N端激酶特异性磷酸化后,会单泛素化PCNA,从而促进polη与停滞的复制叉结合并促进损伤合成[12]。蛋白激酶CDC7可以通过磷酸化酵母RAD18来诱导PCNA修饰,泛素化的PCNA招募polκ聚合酶达到消除停滞分叉的目的,从而减弱DNA合成S期检查点[13]。此外,RAD18是电离辐射环境下DNA损伤修复的关键介体,可以激活G2/M检查点来确保基因组的完整性[14],在一定程度上增加DNA损伤修复反应效率,但具体的协调机制尚不清楚。研究表明,RAD18在鸡和人细胞中能抑制NHEJ对HDR的毒性作用,从而促进HDR的过程[15],这说明RAD18能在DNA损伤信号通路中发挥作用,并传递信号,引起DNA损伤后的同源重组修复。DSB发生会引发DNA受损应激中心ATM介导的H2AX磷酸化,磷酸化后的H2AX直接与MDC1的BRCT域结合进而招募修复因子MDC1。随后与RAD18的锌指结构域以aRNF8/UBC13方式结合,RNF E3连接酶以此不断地将RAD18加载到损伤位点,从而激活HDR修复。但此修复过程独立于RAD18的E3连接酶功能和PCNA泛素化。同时RAD18作为衔接蛋白,直接与RAD51结合发挥作用,引导损伤信号通路促进HDR[16]。
前期研究表明,激活或过表达HDR关键蛋白可以显著提高KI效率。Song等[17]研究发现通过RAD51激活剂RS-1激活RAD51表达,可以显著提高GFP基因靶向大鼠RLL基因KI效率。因此,本研究在HEK293T细胞系中,比较了Cas9-RAD51、Cas9-RAD18融合蛋白以及过表达RAD51、RAD18对HDR效率的影响,旨在提高动物细胞KI效率。
eSpCas9 (1.1)质粒 (#71814)、pU6-(BbsI)_CBh-Cas9-T2A-mCherry质粒(#64324)和pcDNA3.1(+)质粒(#V790-20)购自美国Addgene,hGAPDHP2A-EGFP质粒由南京金斯瑞生物科技有限公司合成。HEK293T细胞系(#ACS-4500)购自美国ATCC。
本研究所用引物信息见表1,均由北京六合华大基因科技有限公司合成。
表 1 引物序列和用途Table 1 Sequence and use of primer
采用表1中的引物进行PCR扩增,其中引物XTEN的上下游有20 bp的互补序列,可在不加入任何模板的情况下扩增出目的片段;引物IF-Cas9-RAD51和IF-Cas9-RAD18的模板为HEK293T细胞DNA;引物L200R800和IF-T2A-mCherry的模板分别为hGAPDH-P2A-GFP质粒和pU6-(BbsI)_CBh-Cas9-T2A-mCherry质粒。PCR体系和程序参照 PrimeSTAR®Max DNA Polymerase(TaKaRa)说明书。
gRNA载体构建(图1A):根据NCBI数据库中人GAPDH基因(Gene ID:2597)设计gRNA并合成 oligo[18]。分别取 5 μL10 mmol/L 的 gRNA-hGAPDH上下游引物,混匀后做退火处理:95 ℃5 min,10 ℃ 1 min,2 个循环;95 ℃ 5 min,10 ℃3 min。参考 FastDigestBpiI(Thermo Fisher Scientific)说明书酶切eSpCas9 (1.1)质粒,切胶回收后参考T4 DNA连接酶(TaKaRa)说明书16 ℃过夜连接退火后的gRNA-hGAPDH和线性化eSpCas9 (1.1)质粒。随后将连接后的DNA转化至Trans10感受态细胞(#C101-01,北京全式金)中,并划线涂板,待单克隆菌落成形后使用带氨苄抗性的培养基扩大培养并交由北京六合华大基因科技有限公司进行Sanger测序,测序引物为hU6-F,测序正确的菌液命名为eSpCas9-hGAPDH并扩大培养,随后根据 Endo-Free Plasmid Mini Kit II (Omega Bio-Tek)说明书进行质粒抽提和保存。
利用16个氨基酸的XTEN肽将RAD51/RAD18蛋白串联至Cas9蛋白的C端表达(图1A)。主要构建过程如下(图1B):将纯化后的XTEN产物与经FseI (NEB)酶切后的线性化eSpCas9-hGAPDH质粒进行无缝克隆,参照 In-Fusion HD Cloning Kits(TaKaRa)说明书。随后,如上述的方法进行转化、测序(引物BGH-R)和质粒抽提,正确的菌液和质粒命名为eSpCas9-XTEN-hGAPDH。采用FastDigestHindIII(Thermo Fisher Scientific)酶切 eSpCas9-XTEN-hGAPDH质粒,使用IF-Cas9-RAD51和IF-Cas9-RAD18引物进行PCR扩增,随后将这2种产物纯化后分别与线性化的eSpCas9-XTEN-hGAPDH质粒进行无缝克隆,测序引物为BGH-R,其中测序无误的克隆菌分别命名为eSpCas9-RAD51-hGAPDH和 eSpCas9-RAD18- hGAPDH。
图 1 不同eSpCas9系统的构建及KI模式图Fig.1 Construction of different eSpCas9 systems and KI pattern diagram
为了减少细胞转染效率对基因KI效率的影响,本研究使用T2A连接肽将红色荧光蛋白(mCherry)构置于Cas9-HDR融合蛋白C端(图1A),主要用于矫正转染效率,进而反映出真实的HDR效率。Cas9-mCherry系统的构建(图1B):使用FseI酶切 eSpCas9-hGAPDH、eSpCas9-RAD51-hGAPDH和eSpCas9-RAD18-hGAPDH质粒,将酶切后的产物分别与纯化后的PCR产物IF-T2A-mCherry进行无缝克隆,测序引物为mCherry-R。其中测序无误的克隆菌分别命名为eSpCas9-mCherryhGAPDH、eSpCas9-RAD51-mCherry-hGAPDH 和eSpCas9-RAD18-mCherry-hGAPDH。
使用引物IF-RAD51-NLS和IF-RAD18-NLS分别对eSpCas9-RAD51-hGAPDH和eSpCas9-RAD18- hGAPDH进行PCR扩增,用FastDigestBamHI和 FastDigestNotI (Thermo Fisher Scientific)对pcDNA3.1 (+)质粒双酶切,并切胶回收长片段。随后将纯化后的PCR产物分别与线性化质粒无缝克隆,成功克隆的质粒分别命名为pcDNA3.1-RAD51 和 pcDNA3.1-RAD18 (图 1B),测序引物为T7-F和BGH-R。
从液氮中取出HEK293T细胞,并迅速放入37 ℃水浴锅中不断搅拌解冻。向解冻后的细胞中加入2 mL完全培养基(体积分数为10%的胎牛血清和体积分数为90%的DMEM培养基混合),经800 r/min、5 min 离心后加入 8 mL 完全培养基重悬细胞至10 cm细胞培养板中。十字划线混匀细胞后,将细胞放置于37 ℃、CO2体积分数为5%的恒温箱中培养。待细胞生长至90%时使用PBS缓冲液清洗细胞2次,随后加入适量的Trypsin/EDTA(0.5 g/L,Gibco)消化 1 min。向消化好的细胞中加入2倍体积的完全培养基终止消化,经800 r/min、5 min离心后将细胞重悬并按照1∶3~1∶5的比例接种于新的细胞板中培养。转染前将细胞传代至24孔板中,待细胞生长至70%~90%时参照Lipofectamine 3 000 Reagent说明书进行转染。为了研究Cas9串联表达HDR因子对基因KI效率的影响,本研究将eSpCas9-mCherry载体和供体共转染至HEK293T细胞中。供体由PCR扩增并纯化得来,包含200 bp的左同源臂、绿色荧光蛋白基因(P2A-EGFP)和800 bp的右同源臂。本研究设计的gRNA位于人GAPDH基因终止密码子附近,当DSB产生后,供体模板能够充当基因组模板对DNA进行修复,进而实现目的基因的插入(图1C)。其中Cas9质粒和供体用量分别为每孔500和125 ng,过表达质粒用量存在5个梯度,分别为17、33、100、250和500 ng。pRAD51和pRAD18分别为共转染eSpCas9+Donor+pcDNA3.1-RAD51和eSpCas9+Donor+pcDNA3.1-RAD18组。转染 6 h后更换新的完全培养基,48 h后收集细胞。
将转染48 h的细胞用PBS缓冲液清洗后,加入适量的含1 mmol/L PMSF的Western及IP细胞裂解液裂解细胞。经 3 000 r/min、5 min 离心后,取微量上清液用于BCA法蛋白浓度测定。向剩余蛋白上清液中加入5×蛋白缓冲液,沸水煮 5~10 min 后用于 SDS-PAGE 电泳。70 V 电泳 30 min,90 V 电泳 1~2 h,随后使用 iBlot 2 Gel Transfer Device系统(Invitrogen)将蛋白条带转移至PVDF膜上。50 g/L脱脂奶粉封闭2 h后,参照说明书推荐浓度4 ℃条件下过夜孵育anti-RAD51(Proteintech)/anti-RAD18 (Proteintech)/anti-GFP(Absin)/anti-β-actin (Proteintech),经 TBST 洗膜3次,TBS洗膜1次后,室温孵育相应二抗2 h,并按上述方法洗膜。将清洗好的膜浸湿在适量的超敏ECL发光液中,避光孵育2 min后置于UVP显色装置曝光拍照。
将转染48 h的细胞用PBS缓冲液清洗后,使用 Total RNA Kit II (Omega)抽提总 RNA。随后参照 PrimeScrip RT reagent Kit with gDNA Eraser(TaKaRa)说明书进行反转录,将稀释好的cDNA按照 PowerUp SYBR Green Master Mix (Applied Biosystems)的说明书进行PCR体系配制。采用2−△△Ct法[19]分析目的基因的表达量。
用PBS缓冲液清洗转染48 h的细胞,800 r/min、5 min离心后加入PBS缓冲液重悬,用于流式细胞术 (BD accuri C6 plus)检测。使用 FL1 通路检测绿色荧光细胞比例,FL3通路检测红色荧光细胞比例。
将转染48 h的细胞用PBS缓冲液清洗后,用预冷的体积分数为70%的乙醇溶液4 ℃条件下过夜固定。经 800 r/min、5 min 离心后加入适量碘化丙啶并充分混匀,4 ℃条件下避光孵育30 min后,使用流式细胞仪上机检测。随后用FlowJo 10软件分析细胞周期。
所有数据均使用 IBM SPSS Statistics 26 软件进行独立样本t检验或单因素ANOVA分析,数据结果以平均值±标准差表示。
在HEK293T细胞中转染eSpCas9-HDR-mCherry后,XTEN肽在翻译过程不会被切断,T2A在翻译后会被切断,从而变成前后2个独立的蛋白。将构建的eSpCas9质粒进行Sanger测序,结果显示所有eSpCas9质粒均符合预期,序列正确(图2)。将不同的eSpCas9载体(eSpCas9、eSpCas9-RAD51/RAD18、eSpCas9+pcDNA3.1-RAD51/RAD18)分别转染至HEK293T细胞中,48 h后发现,Cas9-HDR融合蛋白均能够正常表达(图3)。其中,eSpCas9-RAD51融合蛋白相对分子质量约为200 000,eSpCas9-RAD18融合蛋白相对分子质量约为219 000。有趣的是,过表达RAD18的蛋白量没有过表达RAD51时提高的那么显著。通过荧光定量PCR发现,过表达RAD18仅能提高其5~6倍的转录水平,而过表达RAD51能提高自身174~356倍的mRNA表达量(图4)。
图 2 Sanger测序结果Fig.2 Sanger sequencing results
图 3 不同融合蛋白的表达结果Fig.3 The expression results of different fusion proteins
图 4 RAD51/18过表达后mRNA表达水平Fig.4 mRNA expression level after RAD51/18 overexpression
哺乳动物细胞的KI效率主要受Cas9系统的递送效率(转染效率)、Cas9蛋白对基因组的切割效率和细胞的HDR效率影响。为了降低不同系统间递送效率和随机整合的误差,本研究使用P2A连接肽在eSpCas9蛋白C端串联表达mCherry进行矫正。因此,只有既表达红色荧光又表达绿色荧光的细胞才是真正的KI细胞(图5)。由流式结果得出,不同eSpCas9系统具有不同的转染效率和KI效果(图6)。将不同eSpCas9系统的转染效率矫正后,eSpCas9-RAD18-mCherry系统的KI效率(45.91%)显著高于eSpCas9-mCherry系统(27.69%),而其他系统不能显著提高KI效率(表2)。调整过表达RAD51/18的质粒用量后,仍无法显著提高HEK293T细胞的KI效率(图7)。另外,当不使用mCherry蛋白矫正转染效率时(结构图如图8所示),eSpCas9-RAD18系统的KI效率是eSpCas9系统的1.4~1.9 倍 (图 9)。
图 5 eSpCas9-mCherry系统的荧光图Fig.5 Fluorescence image of eSpCas9-mCherry system
图 6 eSpCas9-HDR-mCherry系统对基因KI效率的影响Fig.6 The effect of eSpCas9-HDR-mCherry system on gene KI efficiency
表 2 mCherry蛋白矫正不同eSpCas9系统的KI效率1)Table 2 The effect of different eSpCas9 systems on KI efficiency
图 7 过表达不同浓度HDR因子对KI效率的影响Fig.7 The effect of overexpression of HDR factors with different concentrations on the KI efficiency
图 8 eSpCas9-HDR载体结构图Fig.8 eSpCas9-HDR carrier structure diagram
图 9 eSpCas9-RAD18系统的KI效率Fig.9 KI efficiency of eSpCas9-RAD18 system
将eSpCas9-RAD18系统转染至HEK293T细胞中,48 h后发现eSpCas9-RAD18能够促进细胞增殖(图10A)。其中G1期显著减少,S期增加。为了进一步研究eSpCas9-RAD18系统对DNA修复途径的影响,本研究检测了NHEJ和HDR因子的表达水平。结果显示,与eSpCas9系统相比,Cas9-RAD18系统能分别提高CtIP、RAD50和LIG4基因82%、171%和115%的mRNA表达水平(图10B)。另外,我们也检测到了Cas9-RAD18系统具有比Cas9系统更高的外源基因EGFP的蛋白表达水平(图11),揭示了Cas9-RAD18系统具有更高的KI效率。Sanger测序结果表明外源基因EGFP确实整合到了靶位点处(图12)。
图 10 eSpCas9-RAD18系统对细胞周期和DNA修复因子表达的影响Fig.10 The effect of eSpCas9-RAD18 system on cell cycle and expression of DNA repair factors
图 11 eSpCas9-RAD18系统提高外源EGFP的表达Fig.11 eSpCas9-RAD18 system improves the expression of exogenous EGFP
图 12 EGFP定点整合至人GAPDH位点Fig.12 EGFP site-specific integration into human GAPDH site
CRISPR/Cas9系统能够高效、特异地切割目的基因并产生相应的DSB,但其介导的基因组定点整合和修复被低效的HDR效率限制。由于人为构建的CRISPR/Cas9系统中Cas9核酸酶产生的DSB更容易被有偏的NHEJ途径修复,因此及时激活HDR对修复DSB和维护基因组稳定性是非常必要的。在哺乳动物细胞中,RAD51和RAD18对HDR通路的激活有着重要作用。本研究通过eSpCas9融合HDR因子或过表达HDR因子以提高基因KI效率,结果发现仅有融合RAD18的eSpCas9系统能显著提高哺乳动物细胞的KI效率;而过表达RAD18不具备提高HDR效率的趋势。这可能是由于RAD18在细胞核内的定位和剂量差异导致的。eSpCas9-RAD18系统的RAD18主要分布在靶位点处,且受eSpCas9系统的低转染效率限制;而过表达的RAD18在全细胞核中高表达(5~6倍)。尽管仅依赖RAD18的UBZ结构域就足够促进HDR[20],但目前并没有关于靶位点处不同RAD18剂量对HDR影响的研究。另外,RAD18在细胞中存在至少2种形式,包括无活性的单泛素化形式(RAD18-Ub)和有活性的非泛素化形式,前者对后者有着强烈的结合偏好[21],而eSpCas9-RAD18融合蛋白似乎不产生泛素化形式。因此RAD18的泛素化可能对提高KI效率是无益的。研究表明,UBZ结构域的完整性对抑制53BP1有着决定性作用[22],而缺失SAP结构域RAD18能够拦截53BP1向DNA损伤位点的募集,进而增强Cas9介导的报告载体的HDR效率[20],但是否影响RAD18-Ub的形成目前不能确定。因此,构建Cas9融合突变型RAD18可能更有利于提高细胞的KI效率。调节NHEJ和HDR的平衡一直是提高基因编辑效率的重要手段。研究表明,将HDR因子CtIP蛋白与Cas9蛋白融合后,Cas9介导的KI效率增加了1.5~2.5倍[23]。MRE11和RAD52分别与Cas9蛋白融合后,HDR效率均提高了2倍,而NHEJ显著降低[24]。这些策略说明Cas9与HDR因子融合表达能够特异性提高靶位点处的HDR效率。研究表明,将突变型hRAD51融合到Cas9蛋白的N端或将其融合至Cas9 (D10A)切口酶C端均无法提高HDR效率,而将其融合至Cas9 (D10A)切口酶N端能够将HDR效率提高2.4倍[25]。这表明RAD51的融合方式影响哺乳动物细胞的KI效率。Kurihara等[26]在小鼠神经元细胞中过表达RAD51发现,其提高了Cas9的基因KI效率。在人胚胎干细胞、诱导性多功能干细胞和HCT116大肠癌细胞中也同样实现了编辑效率的提高[27]。然而,Paffett等[28]发现在酵母细胞中,过量的RAD51会抑制SRS2对RAD51核蛋白丝的分解来抑制DSB引发的同源重组。Kim等[29]证实人源的RAD51在中国仓鼠卵巢细胞和人类细胞中高水平表达对同源重组有显著的负面影响。RAD51作为DNA修复核心蛋白,先与ssDNA缠绕形成突触细丝,细丝搜索同源序列,并形成D环结构。随后重组与ssDNA结合,过程中会得到RAD52、BRCA2和RAD51旁系复合物的支持[30]。过量的RAD51可能会与多个蛋白相互作用,来促进DNA损伤修复中间体的分离或者阻碍HDR相关蛋白有序地被招募到DSB位点[31]。同时,过多的RAD51聚集,使核蛋白丝延长,从而增加同源链搜索和侵入的难度。而本研究过表达不同浓度的RAD51均未能提高HEK293T细胞的KI效率。因此,在不同的物种或细胞类型中,过表达内源或外源的RAD51会产生不同的变化。
RAD51和RAD18在DNA修复过程中是独立的,作用不同。但并不排除这2条通路之间可能存在重叠。Huang等[32]发现RAD18能促进HDR通路关键蛋白RAD51C的积累,证实它们之间存在物理相互作用。此外,RAD18和RNF8对RAD51在放射治疗诱导的DSB位点聚合有关键作用[33]。Branzei等[34]发现RAD51和RAD18可能协同促进复制叉处X形姐妹染色单体连接来影响复制完成并抑制异常同源重组的发生,但目前对2个通路之间存在何种协调尚不清楚。本研究发现eSpCas9-RAD18融合蛋白不能调节RAD51的表达,而能够上调CtIP、RAD50和LIG4因子的表达,促使KI效率提高。另外,RAD18调节细胞增殖,这与其E3连接酶功能和PCNA单泛素化无关,而可能与PI3K-Akt通路和细胞周期蛋白D1有关[35]。本研究揭示了eSpCas9融合RAD18因子能够提高基因KI效率,为细胞DNA损伤修复的研究及快速获得基因修饰细胞系/动物模型提供一种新方法。