韩 玲,杨 科,薛 征,吕 湘
(中国医学科学院基础医学研究所 北京协和医学院基础学院 医学分子生物学国家重点实验室, 北京 100005)
CRISPR/Cas9介导的同源重组已广泛用于精确的DNA编辑[1],为遗传性疾病的彻底治疗带来希望。其编辑效率相对经典同源重组修复(homology-directed repair,HDR)显著提高,达0.35%~10%,但总体效率仍偏低[2-4]。结合非特异突变的引入和单细胞克隆形成率低等因素,获取成功编辑的单克隆细胞株仍然费时费力。单碱基编辑技术在嘧啶之间或嘌呤之间实现高效转换,但转换形式受限且特异性较差[5-6]。最新的先导编辑(prime editing)实现了碱基间自由转换,且脱靶和插入缺失率低[7],而编辑区段偏小,目前也无法完全替代同源重组法构建突变细胞。
本研究旨在改进同源重组法构建定点突变细胞株的后期筛选策略,提高对成功编辑细胞的单克隆筛选效率。以rs826415位点[8]为例,通过CRISPR/Cas9同源重组法在K562细胞中引入G/G 到T/G突变。打靶细胞多克隆培养后,通过阵列式标签高通量测序法分析确定阳性率最高的多克隆细胞,再从中筛选成功编辑的单克隆细胞株。
1.1.1 质粒载体和同源重组修复模板:pX330载体[Addgene(Ad42230)],同源重组模板包含T-型rs826415位点及其两侧各50 nt的序列(5′-TCA GCTAGAGCTAGCACCGCTGCTATCTCCTGTGCCCAG GCTGTTTGTCATCTTTTTACCTCCTCTGCTTCTGAGG CTGACTTTAGCTGTGGGGAGACCTG-3′)。
细胞系:人胚肾上皮细胞系HEK293T、人慢性髓系白血病细胞系K562(由本实验室保存)。
1.1.2 试剂:超低内毒素质粒DNA小量提取试剂盒(Magen公司);限制性内切酶、T7E1内切酶和高保真PCR酶(NEB公司);DNA胶回收试剂盒和DNA clean &concentrator-5试剂盒(ZYMO公司),LB Broth Powder(Sangon公司);氨苄西林钠(山东鲁抗医药公司);VigoFect高效真核转染试剂(Vigorous公司);NeonTM转染系统、DMEM培养基和RPMI 1640培养基(Invitrogen公司);胎牛血清(Hyclone公司); 2×Phanta Max Master Mix高保真DNA聚合酶和N411 DNA纯化磁珠(Vazyme公司)。
1.2.1 pX330-sgRNA-1~6质粒的构建:根据CRISPR DESIGN(http://crispr.mit.edu/)在rs826415位点附近设计CRISPR/Cas9 sgRNA,并通过Blast分析其序列特异性,共设计6条sgRNA(表1, 图1A),末端添加BbsI接头序列,sgRNA双链退火后连接到经BbsⅠ线性化的pX330载体。
表1 靶向rs826415邻近区域的sgRNA-1~6引物序列
1.2.2 细胞的培养:用DMEM完全培养基,于37 ℃,5% CO2培养箱中培养293T细胞。用RPMI 1640完全培 养基,于37 ℃、5% CO2培养箱中培养K562细胞。
1.2.3 细胞的转染:提前24 h将5×105个293T细胞铺到12孔板中,转染前2 h换为新鲜的完全培养基,转染时分别混匀1 μL vigoFect和50 μL 0.9% 氯化钠溶液,及1 μg pX330-sgRNA-1~6质粒和50 μL 0.9%氯化钠溶液,然后将两种溶液混合,室温静置10 min,逐滴加入细胞中,于37 ℃、5% CO2培养箱中继续培养。
收集1×106个K562细胞,用PBS清洗,每孔以110 μL NeonTM转染系统配套的R缓冲液重悬细胞,将5 μg pX330-sgRNA-6质粒、1 μL同源重组模板(100 μmol/L)和110 μL细胞重悬液混合,取100 μL混合液置于Neon Tube,按以下参数:1 450 V,3(ms),10 pulse进行电转,将电转后的细胞放入提前准备好的含10% FBS的1640培养基中,于37 ℃、5% CO2培养箱中继续培养。
1.2.4 T7E1酶切实验:通过PCR扩增含有sgRNA靶向位点的DNA片段(表2),电泳并纯化回收PCR产物,取250 ng回收产物加入2 μL 10×NEB 限制性内切酶缓冲液2,加ddH2O至20 μL后变性和退火,向退火产物中加入1 μL T7E1内切酶混匀37 ℃酶切30 min,加1 μL蛋白酶K,37 ℃孵育5 min失活T7E1,2%琼脂糖凝胶电泳检测切割效率。
表2 T7E1酶切实验引物序列
1.2.5 阵列式标签法PCR扩增:1)有限稀释法获取多克隆细胞:电转细胞48 h后,使用有限稀释法于96孔板中按每孔10~20个细胞接种,获取多克隆细胞。2)裂解细胞:待细胞扩增至约104个/孔的密度后,取各孔半数细胞加50 μL消化液(100 mmol/L Tris-HCl pH8.0,500 mmol/L KCl,0.1 mg/mL gelatin,0.45% NP40)及1 μL蛋白酶K,65 ℃水浴4 h裂解细胞,100 ℃,10 min终止反应。3)阵列式标签PCR(1st round PCR):以1 μL消化产物为模板,通过PCR扩增各孔细胞的基因组DNA。针对rs826415两侧序列(-220 bp~79 bp,总长300 bp)设计引物,在引物中加入barcode标签序列以区分来自各孔细胞的扩增产物,并加入不同长短的stagger序列以平衡混合PCR产物二代测序时序列读出的准确性。由于二代测序的接头序列加上特异引物长度较长(总长达85~97 bp),采用两步PCR进行扩增,本步骤为第1轮扩增。上游引物组成:5′-P5 adapter(truncated)+stagger+barcode_P5+primer-F-3′,其中的barcode_P5共12种,分别标记96孔板的12纵列引物分别命名为P5_1~12;下游引物组成:5′-P7 adapter(truncated)+stagger+barcode_P7+primer-R-3′,其barcode_P7共8种,分别标记96孔板的8横排,引物分别命名为P7_A~H(表3)。4)PCR产物纯化和2次PCR扩增(2nd round PCR):混合上述来自不同多克隆细胞的PCR产物(共96个),加2.5倍体积的无水乙醇,0.1倍体积的3 mol/L 醋酸钠(pH 5.2),-20 ℃冰箱静置30 min,4 ℃,12 000×g,离心10 min,弃上清,加75%乙醇洗涤2遍后,以预热的ddH2O溶解沉淀,并通过DNA回收试剂盒柱纯化回收。通过高保真的2×Phanta Max Master Mix对纯化的DNA进行2次PCR扩增,引入完整的P7/P5二代测序建库引物和用以区分本实验与他人测序样品的index序列(表4)。扩增产物用磁珠纯化去除引物等小片段后送二代测序。
1.2.6 二代测序数据分析:Illumina双端测序得到fastq.gz文件,Trimmomatic软件分析去除低质量reads得到fastq.gz格式的cleandata。用migec软件[9]根据双端测序文件中的barcode,把fastq.gz文件拆成96对不同fastq.gz文件,具体来说,先通过P5端所含的12种barcode拆分成12种fastq.gz文件,再通过P7端所含的8种barcode将上步所得12种fastq.gz文件进一步拆解成96种,分别对应各培养孔内的多克隆细胞。最后通过CRISPR-DAV[10]中的crispr.pl软件批量分析96对双端测序文件中发生同源重组和非同源末端连接产物的比例,将编辑后的细胞基因组分为未发生同源重组(wild type)、同源重组但伴随插入缺失(HDR with indel)和同源重组且无插入缺失(HDR without indel)3种情况,其中‘HDR without indel’类型为成功突变的阳性细胞。根据重组率、错配率指标筛选‘HDR without indel’比率最高的多克隆。
表3 阵列式标签PCR引物序列设计
Orange: P5 adapter(truncated); green: P7 adapter(truncated); underline: overlap with the 2ndround PCR primers; yellow: stagger; red: barcode_P5/P7; blank: primer-F/R specific for the rs826415 surrounding region.
表4 二次PCR扩增引物序列
Orange: P5 adapter; green: P7 adapter; dark green: index; underline: overlap with the 1stround PCR primers.
1.2.7 进一步单克隆培养及基因型的鉴定:通过流式分选将选定的多克隆中细胞单个分配到96孔板的每个孔,待细胞扩增至约104个,取部分细胞裂解,通过未加barcode的primer-F/R扩增含有rs826415位点的目的片段(primer-F:5′-TAGGAT CTCCACAGCTAGCCA-3′,primer-R:5′-GAGGTAAA GGCTCTGCCAGG-3′),而后通过Sanger测序鉴定基因型。
将电转后的K562细胞进行单克隆培养,14 d后统计单细胞存活率,8个96孔细胞培养板中共138个孔有活细胞,概率约为17.9%。另外,CRISPR/Cas9介导的同源重组效率常出现低于1%的情况[3](本文是0.62%),并可高比例伴随插入/缺失等其他形式突变,按传统方法获得携带目的突变的单克隆细胞株通常需要筛选10~20块以上的96孔板。
单核苷酸多态性rs826415(T/G)位点常见等位基因T,少见等位基因为G,在K562细胞中rs826415位点为G/G纯合型。在rs826415附近设计6条sgRNA(sgRNA-1~6)(表1,图1A)克隆到pX330质粒载体,同时根据rs826415前后各50 bp的序列设计总长101 bp,rs826415位点为T的ssDNA作为同源重组模板(图1B)。在293T细胞中分别转染pX330-sgRNA-1~6质粒,PCR扩增靶位点后用T7E1酶检测Cas9的切割效率,结果显示sgRNA-3、sgRNA-5、sgRNA-6切割效率较高(表2,图1C),选择pX330-sgRNA-6质粒与同源重组模板共同电转K562细胞。
转染后的K562细胞于96孔板中多克隆培养,克隆形成率为100%。通过两步PCR法扩增各多克隆细胞中含有rs826415的区域,并在双端引物中分别加入barcode_P5_1~12和barcode_P7_A~H对各多克隆扩增产物予以特异标记,引物设计和标记排布方式如图表所示(表3,4;图2A,B)。扩增产物的混合文库用于进一步的二代测序分析。考虑添加了barcode等附加序列可能会影响引物结合的序列特异性,在正式扩增鉴定细胞克隆之前先确定引物扩增的特异性,结果显示分别添加不同长短附加序列的3对引物均可获得特异性良好的扩增条带(图2C)。
阵列式标签PCR扩增的混合文库首先通过Agilent 2100 Bioanalyzer进行质量控制检查,检测结果显示文库主带在431 bp左右,产物大小合适,没有小片段污染,说明文库建库质量合格(图3A),双端测序(2×150 bp)后分析每孔多克隆细胞的同源重组率和插入缺失率。96个多克隆的HDR发生率在0%~9.79%之间,平均(总HDR/ 总reads数)为0.62%,其中效率最高的4个多克隆为克隆‘B7’、‘D2’、‘D8’和‘H2’(图3B)。进一步indel分析提示克隆‘B7’、‘D2’、‘H2’中的重组以‘HDR with indel’为主, ‘D8’的‘HDR without indel’比率最高,达4.35%(图3C)。96个多克隆的平均‘HDR without indel’仅为0.21%。克隆‘D8’中阳性细胞率显著高于平均水平,可用于进一步的单克隆培养鉴定。
A.candidate sgRNAs at the rs826415 surrounding region;B.single strand oligo (SSO) used as homologous template for G to T mutation;C.T7E1 assay of candidate sgRNA activity; the size of uncut PCR product was 498 bp, T7E1 cut resulting bands of different size depending on specific position of each sgRNA; positive control was a rs826415-irrelevant sample provided with T7E1 enzyme
图1 利用CRISPR/Cas9介导的同源重组在K562 rs826415位点引入G 到T点突变
Fig 1 Introducing G to T point mutation at rs826415 site of K562 cells using CRISPR/Cas9-mediated homologous recombination
A.primer designing for the array tagged PCR amplification;B.array arrangement of barcode sequences tagged to the primers (P5_1~12, P7_A~H) for the rs826415-targeted K562 polyclone screening on a 96-well plate;C.examination of sequence specificity of the tagged primers; #1: specific primers for rs826415 surrounding region (untagged, as shown in black in Table 2); #2: the P5_1 and P7_A primers used for the 1st round PCR amplification; #3: primers for the 2nd round PCR amplification;PCR product products were 300 bp, 378 bp and 434 bp in length for primers #1, #2 and #3 respectively
图2 阵列式标签PCR扩增法构建rs826415位点打靶的多克隆K562细胞二代测序文库
Fig 2 Array tagged PCR amplification to generate NGS library from the rs826415-targeted K562 polyclones
从克隆‘D8’中分选出96个单细胞扩大培养,共获得30个单克隆,克隆形成率为31.25%(30/96)。从每个单克隆中取部分细胞用作基因型测序鉴定,经序列比对及原始数据分析,成功筛选到一个rs826415位点突变为T/G杂合基因型且没有其他插入缺失突变的单克隆细胞株(图4A,B),阳性率为3.33%(1/30),与克隆‘D8’中4.35%的阳性率相符,未检测到纯合型突变细胞。
CRIPSR/Cas9系统为基因编辑提供了有效的工具,但其介导同源重组获得精确编辑的点突变细胞效率仍然偏低,相对早期胚胎和干细胞来说,体细胞中的编辑效率更低,常在1%以下[3],因而需要筛选大量细胞以获得阳性克隆。筛选过程中由于转染和流式分选等引起细胞损伤、单细胞不易增殖及流式分选不能确保每个培养孔都分到单细胞等因素,常导致基因打靶后细胞在单克隆培养过程中克隆形成率低,筛选鉴定工作费时费力。使用正负筛选标记可大大提高阳性克隆率,减少基因鉴定的工作量,但细胞培养消耗不减且需要更为复杂的打靶设计。
A.Agilent 2100 Bioanalyzer analysis of the NGS library constructed from the rs826415-targeted K562 polyclones; B.percentages of wide type (WT), edited (include HDR) and HDR reads in the four rs826415-targeted K562 polyclones of the highest HDR ratio; C.indel analysis of the HDR reads in the four polyclones as shown in panel B
图3 二代测序分析筛选阳性率最高的rs826415位点打靶K562细胞多克隆
Fig 3 NGS analysis to identify the rs826415-targeted K562 polyclone with the highest ratio of ‘HDR without indel’
已有研究通过标签标记的二代测序法筛选96孔板中CRISPR/Cas9编辑的单克隆细胞,提高筛选效率,但只针对单克隆细胞进行筛选,未解决单细胞存活率低及HDR效率低等问题[11]。本研究通过多克隆法先分得每孔10~20个细胞以提高细胞存活率,通过阵列式标签标记的二代测序分析筛选‘HDR without Indel’比率最高的多克隆,与平均HDR相比筛选出的多克隆细胞HDR效率显著增加,仅筛选两个96孔板即获得阳性突变克隆。其中多克隆培养时每孔的初始细胞数目可根据情况调整。本研究取10~20个细胞/孔,预期阳性孔中HDR效率可提高到5%~10%。若平均HDR效率较高时可将每孔接种的细胞数减少,再分选单细胞克隆时阳性率会更高。
目前本研究只获得了杂合型的定点突变克隆,为提高精确基因编辑的纯合型细胞得率可采取添加非同源末端连接(non-homologous end joining, NHEJ)抑制剂,使用Cas9的不同变体[2]、CRISPR核糖核蛋白[CRISPR ribonucleoprotein(RNP)]等方法提高HDR效率。另有研究发现β-肾上腺素受体激动剂小分子L755507显著促进HDR效率、 在CRISPR/Cas9及单链寡核苷酸介导的基因精确编辑中促进作用高达9倍[12]。
A.sanger sequencing of rs826415 surrounding region (complementary strand is shown), WT: wildtype K562 cells; heterozygote: K562 cells showed G/T heterozygous at rs826415 site without indel, heterozygote with indel: K562 cells showed G/T heterozygous at rs826415 site with undesired indel mutation detected; B.analyzed and RAW electropherograms of rs826415 surrounding region in the heterozygote K562 cells;*background signal
图4 Sanger测序鉴定rs826415位点成功G到T点突变的K562单克隆细胞株
Fig 4 Sanger sequencing identification of monoclonal K562 cells harboring the desired G to T mutation at rs826415 site
本研究优化出一套通过标签标记的高通量测序策略预筛选多克隆细胞,进而高效鉴定点突变单克隆细胞株的方法。除点突变之外,该方法也适用于对更长序列进行编辑时提高打靶细胞的筛选效率,在当前精确基因编辑效率仍偏低的情况下,为后续在细胞及临床水平进行基因精确编辑的研究和应用提供便利。