安欢欢 ,钱莎莎 ,于代冠 ,申硕 ,2,3
1.武汉生物制品研究所有限责任公司,湖北武汉430207;2.国家联合疫苗工程技术研究中心,湖北武汉430207;3.湖北省疫苗技术创新中心,湖北武汉430207
2019 年12 月,中国湖北省武汉市监测发现不明原因新型冠状病毒肺炎,简称“新冠肺炎”。2020 年2 月 11 日,世界卫生组织(World Health Organization,WHO)正式将此新冠肺炎命名为2019 年冠状病毒病(Coronavirus Disease 2019,COVID-19)。国际病毒分类学委员会(The International Committee on Taxonomy of Viruses,ICTV)将引起 COVID-19 的病毒命名为严重急性呼吸道综合征冠状病毒2(severe acute respiratory syndrome coronavirus-2,SARS-CoV-2)[1]。新冠肺炎已纳入《中华人民共和国传染病防治法》规定的乙类传染病,并按照甲类传染病管理,其具有传染性强、潜伏期长、传播途径复杂等特点,感染患者的临床病征表现为发烧、呼吸道症状、严重的呼吸系统疾病和肺炎[2]。
SARS-CoV-2 是单股正链RNA 病毒,基因组长度约为29 800 bp,拥有已知RNA 病毒中最大的基因组。SARS-CoV-2 基因组结构遵循冠状病毒(coronaviruses,CoVs)已知的特定基因特征,5′端具有帽子结构,3′端具有多聚腺苷酸尾巴。SARS-CoV-2 基因组含有10 个开放阅读框(opening reading frame,ORF),可能共编码至少 29 种蛋白质[3]。位于基因组5′端且超过 2 / 3 的区域含有 1 个具有移码重叠位点的ORF,称为ORF1ab,翻译可生成两条多聚蛋白pp1a 和pp1b,后者通过核糖体移码机制进行翻译,并由病毒编码的蛋白酶(main protease 和papain-like protease)剪切加工生成16 个非结构蛋白(分别命名为 NSP1 ~ NSP16),组装释放复制-转录复合体[4]。位于基因组3′端的1 / 3 区域编码4 种病毒结构蛋白,包括刺突糖蛋白(spike glycoprotein,S)、包膜蛋白(envelope protein,E)、膜蛋白(membrane protein,M)和核衣壳蛋白(nucleocapsid protein,N)。此外,SARS-CoV-2 基因组3′端还编码每个CoV 特有的种属特异性辅助蛋白,分别为ORF3a、ORF6、ORF7a、ORF7b、ORF8、ORF9b 和 ORF10,由 3′端一系列亚基因组 mRNAs(subgenomic mRNAs,sgmRNAs)表达[5]。其中一些辅助蛋白装配于病毒颗粒,如3a 在SARSCoV 被发现为结构蛋白[6],3a 在 SARS-CoV-2 的分子数与分子数丰度最高的结构蛋白M 相当[7]。
反向遗传学(reverse genetics)是通过其表型变化来确定该基因功能的遗传学研究方法。因为对非逆转录RNA 病毒而言,其复制表达的过程不会形成DNA 中间体,而目前绝大多数高效的分子生物学技术均是针对DNA 进行操作[8]。由于CoV 基因组是RNA 病毒中已知最大的基因组,且其携带的复制酶基因以cDNA 克隆形式在细菌中增殖时存在不稳定性,加上体外合成全长转录本难度大,使得CoV 全长感染性cDNA 的构建受到极大的阻碍[9]。为了克服这些困难,目前已建立3 种不同于传统途径的创新性研究方法来建立CoV 的反向遗传学系统,包括cDNA 片段的体外连接[10]、细菌人工染色体(bacterial artificial chromosomes,BACs)的使用[11]及以痘病毒为载体进行 CoV 全长 cDNA 的增殖[12]。
为了更好地研究SARS-CoV-2 基因组的结构与功能以及快速应对目前所出现的多种变异株,其全长感染性cDNA 的构建必不可少。本研究采用 In-Fusion、Gibson Assembly 以及 Recombineering技术对SARS-CoV-2 基因组进行全长cDNA 的构建[13],区别于传统的酶切连接方法。本研究可为大基因组病毒如CoV 的全长cDNA 构建提供全新思路,也可为SARS-CoV-2 突变株全长cDNA 的改造、病毒复制子的研究以及减毒灭活疫苗的研发奠定理论基础。
1.1 病毒、细胞、载体及细菌 SARS-CoV-2 WIV04株(GenBank 号:MN996528.1)灭活病毒原液由中国科学院武汉病毒研究所提供;Stellar Competent cell购自日本 TaKaRa 公司;pUC19 载体和 pBR322 载体购自生工生物工程(上海)股份有限公司;pBelo-BAC11 质粒(简称 pBac)购自 BioVector 质粒载体菌种细胞基因保藏中心;DY380 细菌由于代冠课题组惠赠。
1.2 主要试剂 RNA 提取试剂盒、质粒大提试剂盒和DNA 纯化试剂盒购自德国Qiagen 公司;凝胶回收和PCR 清洁试剂盒购自美国Clontech 公司;KpnⅠ、HindⅢ、AscⅠ和 NotⅠ等限制性内切酶、CIP 酶、Q5高保真酶和Phusion 高保真聚合酶购自美国NEB 公司;Premix Taq 聚合酶、PrimeScriptTM1st Strand cDNA Synthesis Kit 和 In-Fusion HD Cloning System 购自日本TaKaRa 公司;Gibson Assembly Kit 购自美国Thermo Scientific 公司。
1.3 SARS-CoV-2(含 2GC)全长 cDNA 的构建
从SARS-CoV-2 灭活病毒原液中提取病毒RNA,经逆转录获得cDNA,以其为模板,首先将SARS-CoV-2 基因组全长分成17 个小片段扩增出覆盖全长的DNA 片段;然后利用In-Fusion 克隆将这些小片段分为6 个5 000 bp 的DNA 片段,分别连接至pUC19 载体,得到相应的重组质粒;再利用Gibson Assembly kit 将这6 个重组质粒分3 次逐步连接至pBR322 载体上,每次连接2 个片段即10 000 bp 长度,连接形成的重组质粒经SARS-CoV-2 基因组片段右侧的NotⅠ位点酶切线性化,再连接第2 个10 000 bp片段,第3 个10 000 bp 采取的连接方式类似,以此得到全长30 000 bp 的重组质粒。由于Gibson Assembly kit 中存在5′-3′核酸外切酶,可消化中间过程中的重组质粒经NotⅠ酶切形成的5′overhang,导致在连接第 2 个 10 000 bp 及第 3 个 10 000 bp 时 NotⅠ酶切位点3′端2 个碱基GC 的滞留。采用Recombineering 技术修复这两处多余的碱基GC。为了区别于野生型SARS-CoV-2,在全长8 791 nt 和12 655 nt处引入了2 个同义突变,分别生成了2 个BglⅠ酶切位点,以此作为遗传标记。SARS-CoV-2 全长cDNA克隆质粒的构建策略见图1。
图1 SARS-CoV-2 全长cDNA 构建策略示意图Fig.1 Schematic diagram of construction strategy for full-length cDNA of SARS-CoV-2
1.3.1 SARS-CoV-2 cDNA 的获取 用RNA 提取试剂盒抽提SARS-CoV-2 灭活病毒原液RNA,通过PrimeScriptTM1st Strand cDNA Synthesis Kit 逆转录获得cDNA。
1.3.2 SARS-CoV-2 全长小片段扩增 以1.3.1 项获得的cDNA 为模板,用Phusion 或Q5 高保真酶扩增 SARS-CoV-2 各 片 段(A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P 和 Q)。反应条件为:98 ℃ 30 s;98 ℃10 s,50 ~ 72 ℃ 30 s,72 ℃ 20 ~ 30 s / kb,共 30 个循环;72 ℃2 min。利用SnapGene v 5.2.4 软件设计各片段扩增引物,由生工生物工程(上海)股份有限公司合成,引物序列见表1。
表1 SARS-CoV-2 全长小片段扩增引物Tab.1 Primers used for amplification of small fragments of SARS-CoV-2
1.3.3 含5 kb SARS-CoV-2 基因组重组质粒的构建 利用In-Fusion HD Cloning kit 将1.3.2 项中扩增得到的各段 PCR 产物以 A + B + C(F1)、D + E +F+G(F2)、H+(IF3)、J+K+L(F4)、M +N +O(F5)和P + Q(F6)混合的方式,分别连接至经KpnⅠ和Hind Ⅲ双酶切的 pUC19 载体(约 2 600 bp),反应条件为50 ℃孵育15 min。各取5 μL 连接产物转化至50 μL Stellar Competent Cell,并涂布于含氨苄青霉素(100 mg / mL)的 LB 固体培养基。第 2 天对转化子进行菌落PCR 鉴定,筛选阳性克隆,提取质粒,酶切鉴定,鉴定正确的质粒送至生工生物工程(上海)股份有限公司测序。6 个含5 000 bp SARS-CoV-2 cDNA 片段的重组质粒(约7 600 bp)分别命名为pUC19-F1、pUC19-F2、pUC19-F3、pUC19-F4、pUC19-F5 和pUC19-F6。以重组质粒pUC19-F1 为例说明利用In-Fusion 克隆合成6 个含5 000 bp 病毒基因的重组质粒的构建过程见图2(以基因组1-5 012 nt的连接为例)。
图2 In-Fusion 连接示意图Fig.2 Schematic diagram of assembly by In-Fusion
1.3.4 含30 kb 目的基因重组质粒的构建 将pUC19-F1 ~pUC19-F6 重组质粒作为模板,利用表2 中的引物分别扩增 F1 ~ F6。反应条件为:98 ℃ 30 s;98 ℃10 s,50 ~ 72 ℃ 30 s,72 ℃ 20 ~ 30 s / kb,共 30 个循环;72 ℃ 2 min。先将 F1 和 F2 组合,与经 PCR 背向扩增的pBR322 线性化质粒(约3 200 bp)进行Gibson Assembly 连接(反应体系及程序详见Gene-ArtTMGibson Assembly®EX Cloning Kits 使用手册),构建得到长度约为13 000 bp 的重组质粒,命名为pBR322-SARS-CoV-2-Ⅰ(1-9 975)。其中,线性化的pBR322 载体通过正反向引物分别在5′和3′端引入AscⅠ和NotⅠ酶切位点。对pBR322-SARS-CoV-2-Ⅰ(1-9 975)质粒进行NotⅠ单酶切和CIP 去磷酸化处理,并切胶纯化后,再与F3 和F4 一起混合,进行第2 轮Gibson Assembly 连接,得到长度约23 000 bp的重组质粒,命名为pBR322-SARS-CoV-2-Ⅱ(1-19 975&1GC)。以相同策略进行F5 和F6 与载体的第3轮 Gibson Assembly 连接,得到长度约 33 000 bp 的重组质粒,命名为 pBR322-SARS-CoV-2-FL(2GC)。以F1 + F2 连接第1 个10 000 bp 为例,利用Gibson Assembly 构建重组质粒pBR322-SARS-CoV-2-Ⅰ(1-9 975)的过程见图3。用AscⅠ和NotⅠ对3 个重组质粒进行酶切鉴定。
图3 Gibson Assembly 连接示意图Fig.3 Schematic diagram of assembly by Gibson Assembly
1.4 质粒 pBR322-SARS-CoV-2-FL(2GC)的修复
质粒构建过程中产生的2 处多余GC 碱基(9 975 nt 和19 975 nt)的修复可利用Recombineering技术完成,而Recombineering 必需依赖单拷贝质粒,因此选择pBac 质粒来删除这两处GC 碱基。
1.4.1 pBacm-SARS-CoV-2-FL(2GC)的构建 设计分别与SARS-CoV-2 全长基因组3′端和 5′端同源50 bp 的正反向引物,并通过引物分别引入NotⅠ及AscⅠ酶切位点,以pBac 质粒为模板,背向扩增其载体骨架(约6 300 bp),简称为pBacm。反应条件为:98 ℃ 30 s;98 ℃ 10 s,55 ℃ 30 s,72 ℃ 2.5 min,共30 个循环;72 ℃ 2 min。再将 pBR322-SARS-CoV-2-FL(2GC)质粒进行AscⅠ和NotⅠ酶切,通过酚氯仿抽提及异丙醇沉淀的方式纯化酶切后的载体。利用Gibson Assembly Kit 将该酶切回收后载体与经PCR扩增线性化的pBacm 质粒进行连接。在两个连接处分别设计进行菌落PCR 鉴定的引物。构建的新重组质粒命名为 pBacm-SARS-CoV-2-FL(2GC),通过电击转化至DY380 温度敏感型感受态细胞中,挑取单个菌落,30 ℃过夜培养。
1.4.2 两处GC 碱基的删除
采用两步筛选法进行Recombineering,即先用含有正、负筛选标记的SacB + Kan 片段替换待修复区域,再用正确的病毒基因组序列替换SacB + Kan片段。由于9 975 nt 和19 975 nt 两处均存在多余的GC 碱基,需先修复第1 处序列,再在此基础上,进行第2 处序列的修复,因此共需经历4 轮Recombineering。
1.4.2.1 正、负筛选标记SacB + Kan 的插入 设计带有50 bp 与SARS-CoV-2 基因组同源的引物(引物序列见表3),PCR 扩增SacB + Kan 片段并进行纯化。反应条件为:98 ℃ 30 s;98 ℃ 10 s,60 ℃ 30 s,72 ℃ 1.5 min,共 30 个循环;72 ℃ 2 min。在同源臂以外区域设计菌落PCR 鉴定引物。Recombineering技术操作如下:取200 μL 含pBacm-SARS-CoV-2-FL(2GC)质粒的DY380 菌液,转接至新鲜的11 mL LB液体培养基中,30 ℃培养。待菌液A600= 0.6 ~0.9时,将其在42 ℃诱导15 min,迅速置于冰上10 min。将菌液离心后弃去LB 液体,以无菌水洗涤两次后,制备成电转感受态细胞。向感受态细胞中加入清洁回收的SacB + Kan PCR 产物(约500 ng)进行电击转化。取100 μL 转化菌液,涂布于含卡那霉素(30 mg /mL)的 LB 固体培养基,30 ℃倒置过夜培养。第2 天进行菌落PCR 鉴定,选取正确插入SacB+Kan的阳性转化子,记为pBacm-SARS-CoV-2-(SacB+Kan)-9 975 / 19 975,30 ℃摇床过夜培养。
1.4.2.2 正确序列的替换 以cDNA 为模板扩增横跨9 975 nt 或19 975 nt 处前后约600 bp 的正确序列(引物序列见表3),并进行纯化。反应条件为:98 ℃ 30 s;98 ℃ 10 s,58 ℃ 30 s,72 ℃ 30 s,共 30 个循环;72 ℃2 min。该正确序列位置与上一步插入的(SacB-Kan)-9 975/19 975 位置相同。将正确序列通过Recombineering 技术电击转化至含pBacm-SARSCoV-2-(SacB + Kan)-9 975 / 19 975 质粒的DY380感受态细胞中,操作步骤参照1.4.2.1 项。对阳性转化子大量培养,提取重组质粒。经4 轮Recombineering 过程得到的重组质粒命名为pBacm-SARS-CoV-2-FL,酶切鉴定,鉴定正确的质粒送至生工生物工程(上海)股份有限公司测序。
表3 SARS-CoV-2-FL(2GC)修复扩增引物Tab.3 Primers used for modification of SARS-CoV-2-FL(2GC)
2.1 含5 kb SARS-CoV-2 基因片段扩增产物的鉴定 1%琼脂糖凝胶电泳分析显示,6 个5 000 bp的病毒基因片段(F1 ~F6)扩增产物大小正确,见图4。
图4 含5 kb SARS-CoV-2 基因片段的PCR 扩增产物电泳图Fig.4 Electrophoretic profile of PCR products containing 5 kb SARS-CoV-2 gene fragments
2.2 含30 kb 目的基因重组质粒的鉴定 1%琼脂糖凝胶电泳分析显示,重组质粒pBR322-SARS-CoV-2-Ⅰ(1-9 975)、pBR322-SARS-CoV-2-Ⅱ(1-19 975&1GC)和 pBR322-SARS-CoV-2-FL(2GC)经 AscⅠ和NotⅠ双酶切后,分别可见大小约为10 000、20 000和30 000 bp 的病毒基因组cDNA 条带以及3 000 bp的pBR322 载体条带,大小均与预期相符,见图5。
图5 重组质粒 pBR322-SARS-CoV-2-Ⅰ(1-9 975)、pBR322-SARS-CoV-2-Ⅱ(1-19 975&1GC)、pBR322-SARS-CoV-2-FL(2GC)的酶切(AscⅠ/ NotⅠ)鉴定Fig.5 Restriction map of recombinant plasmids pBR322-SARS-CoV-2-Ⅰ(1-9 975),pBR322-SARS-CoV-2-Ⅱ(1-19 975&1GC)and pBR322-SARS-CoV-2-FL(2GC)(AscⅠ/ NotⅠ)
2.3 pBacm-SARS-CoV-2-FL 质粒的鉴定 通过Gibson Assembly 连接及Recombineering 修复,成功获得了SARS-CoV-2 的全长基因组cDNA 克隆,修复测序结果见图6。重组质粒pBacm-SARS-CoV-2-FL(约36 300 bp)经AscⅠ和NotⅠ双酶切,可见约30 000 bp的SARS-CoV-2 全长基因组cDNA 条带和6 300 bp的pBacm 载体条带,见图7,表明成功构建了SARSCoV-2 WIV04 株的全长cDNA。
图6 SARS-CoV-2 全长cDNA 9 975 nt(A)和19 975 nt(B)修复结果Fig.6 Modified results of 9 975 nt(A)and 19 975 nt(B)in full-length cDNA of SARS-CoV-2
图7 重组质粒pBacm-SARS-CoV-2-FL 的酶切(AscⅠ/NotⅠ)鉴定Fig.7 Restriction map of recombinant plasmid pBacm-SARSCoV-2-FL(AscⅠ/ NotⅠ)
为验证遗传标记BglⅠ的正确引入,分别在基因组全长8 791 nt 前后区域设计引物扩增覆盖此处BglⅠ的约1 700 bp 的片段和12 655 nt 处约2 000 bp的片段,分别以构建好的含全长cDNA 的重组质粒pBacm-SARS-CoV-2-FL 和由病毒逆转录获得的cDNA为模板,扩增这两处片段,并通过BglⅠ酶切鉴定。由cDNA 为模板扩增的 PCR 产物(7 945-9 655 和 11 419-13 298)不能被BglⅠ酶切,而以pBacm-SARS-CoV-2-FL 重组质粒为模板扩增的两段PCR 产物能被BglⅠ酶切,见图8,表明本实验构建的pBacm-SARS-CoV-2-FL 重组质粒成功引入了两处BglⅠ位点作为遗传标记,可与野毒株进行区分。
图8 8 791 nt 和12 655 nt 处BglⅠ酶切位点验证Fig.8 Validation for BglⅠrestriction sites at 8 791 nt and 12 655 nt
反向遗传学作为一项新型的分子生物学技术,可在分子水平分析和改造病毒基因组,为RNA 病毒的分子生物学研究(如病毒的复制、致病机理以及防治等)开辟了新途径[8]。而针对于冠状病毒的反向遗传学技术在传染性胃肠炎病毒(transmissible gastroenteritis virus,TGEV)上得到了首次应用,TGEV的全长感染性cDNA 克隆是利用BAC 方式生成的[14],同样,基于细菌人工染色体的SARS-CoV、MERSCoV[15]和 SARS-CoV-2 等[11,16]的全长感染性 cDNA也成功构建。另一种研究CoVs 的生物学及致病机理的替代性反向遗传学技术依赖于以痘病毒为载体进行CoV 基因组cDNAs 的克隆和增殖。目前已使用痘病毒载体成功构建 HCoV 229E[12]、IBV[17]和MHV-A59[18]的全长冠状病毒cDNA 等。这种有益的病毒基因组改造技术已广泛应用于疫苗和其他治疗性药物的研发、临床研究及预防接种。如流感病毒灭活疫苗减毒疫苗株骨架构建的新变异毒种、以减毒株为骨架的四价登革病毒疫苗及以动物轮状病毒为减毒骨架接入人轮状病毒中和基因的四价、六价轮状病毒基因重配伍疫苗等。
目前文献报道的关于SARS-CoV-2 以及其他冠状病毒全长cDNA 或复制子的构建大多采用体外酶切连接的方式[10]。这种方式在进行大基因组多个cDNA 片段的连接时,常选用的是ⅡS 类型限制性内切酶(如 Esp31、SapⅠ、BsaⅠ和 BsmⅠ等),使用这些酶切位点可实现在体外连接两个连续的cDNA 片段。组装的全长cDNA 在5′末端包含1 个T7 RNA聚合酶启动子,在3′末端包含1 个poly(A)尾巴和T7 终止子序列,在体外转录以生成加帽的全长转录本,这些转录本与同时加帽的N 基因转录本一起转染易感细胞后,拯救得到感染性病毒。体外cDNA组装方法简单直接,且允许使用常规技术,并可快速进行独立的cDNA 片段突变,同时可与BAC 载体或痘病毒载体互相结合[11-12]。
本研究采用了与传统酶切连接方式不同的方法,基于无缝克隆及细菌体内同源重组技术成功构建了SARS-CoV-2 的全长cDNA。在此构建过程中融合了 In-Fusion、Gibson Assembly 和Recombineering 3 种技术。
Recombineering 技术的原理是利用一个温度敏感型菌株DY380 进行DNA 片段的同源重组,该菌株在42 ℃诱导时会表达与同源重组相关的3 个重组酶,而在32 ℃时相关基因受到抑制作用不能表达。值得注意的是,Recombineering 仅适用于单拷贝质粒(如BAC 载体)。为了提高阳性克隆的筛选效率,本研究创新性地设计两步筛选法来进行修复:①通过同源重组方式将正、负筛选标记(Kan + SacB)插入待修复区域,利用Kan 抗性基因筛选正确的重组质粒;②在相同位置通过同源重组方式将正确序列替换正 / 反向标记,利用Chl 抗性基因和SacB 基因筛选含有正确序列的重组质粒,后者具有蔗糖致死效应。
本研究论述的方法为冠状病毒等大基因组的全长感染性cDNA 克隆的构建提供了全新的思路。此外,构建的SARS-CoV-2 全长cDNA 是连接于pBacm单拷贝质粒上,与BAC 载体相兼容,方便提取、保存以及进行后续的分子生物学实验操作。同样,利用Recombineering 技术使得对SARS-CoV-2 全长cDNA进行点突变或部分基因片段的缺失、替换等变得简易可行。这种方法不需要像传统酶切连接方法一样,必须从最初的含有突变或缺失、替换的cDNA 片段扩增步骤开始,再进行后续的酶切与连接。本研究提供的全长cDNA 构建思路也可应用于其他小基因组RNA 病毒,如肠道病毒、麻疹病毒等病毒的cDNA 构建。
由于SARS-CoV-2 的高危性,关于其全长cDNA的感染性验证和病毒拯救必须获得国家生物安全主管部门批准后,在法规严格监管下,在生物安全等级 3 级(biosafety laboratory-3,BSL-3)以上的实验室进行。但质粒构建及cDNA 上的改造修饰等前期工作可在生物安全等级2 级实验室进行,如利用Recombineering 技术进行SARS-CoV-2 减毒株、复制缺陷株以及复制子的构建[19-22]。SARS-CoV-2 减毒株可作为候选灭活疫苗的疫苗株,减轻新冠灭活疫苗生产过程中所面临的生物安全风险及对周边环境的潜在威胁。SARS-CoV-2 复制子可作为高通量的筛选工具,用于抗病毒药物或治疗性抗体的筛选研究[21-23],由于复制子只保留了与复制相关的基因而去除了与病毒毒力相关基因如E、S、M 等,使得抗病毒药物的筛选可在生物安全等级2 级实验室进行[23],保障了科研人员的安全。同时,敲除或改造SARS-CoV-2 复制子中某个或多个非结构蛋白如nsp1、nsp14、nsp15 等,可用于研究病毒非结构蛋白的功能及病毒RNA 分子的合成机制[24]。另外,针对目前出现的多种SARS-CoV-2 变异株及免疫逃逸株,可对构建的全长cDNA 进行相应位点的突变即可实现变异株的cDNA 构建[25],研发基于减毒株并针对免疫逃逸株的新一代灭活疫苗。
为了更加深入地研究病毒基因结构与功能,SARS-CoV-2 全长cDNA 作为一个重要的工具,对基础研究和应用研究必不可少。本研究的构建方法为大基因组RNA 病毒全长cDNA 的构建提供了全新的思路,也为其他RNA 病毒全长cDNA 的构建奠定了基础。