朱向星,文健聪,林子盛,陈彩悦,吴耀冰,林晓微,罗靖维,钟 斐,田壮壮,龚道元,翁闪凡(通信作者)
(佛山科学技术学院医学院医学检验系 广东 佛山 528000)
CRISPR 基因编辑技术是过去十多年来全球生物科技领域的重大突破。1987 年,日本科学家石野良纯在研究碱性磷酸酶同工酶相互转化机理时,意外发现了5 个具有高度同源性的间隔重复序列[1]。这一序列的主要结构特征是:重复序列与非重复序列交替排列,并且二者大小在21 ~37 bp 不等。进一步研究发现重复序列普遍存在于细菌和古细菌基因组中[2],这种间隔重复序列在2002 年被统一命名为“成簇的规律间隔的短回文重复序列”(Clustered regularly interspaced short palindromic repeats, CRISPR)。通过比对不同原核生物CRISPR 序列两侧的基因,发现了4 种具有同源性的CRISPR 相关蛋白(CRISPR-associated protein, Cas)编码基因。2005 年,发现CRISPR 序列中的间隔序列与噬菌体和接合质粒内的序列具有相似性[3-4]。后续研究表明CRISPR 序列及Cas基因与细菌抵抗噬菌体入侵有关,并且发现CRISPR/Cas系统能够限制细菌的水平基因转移[5-6]。2012 年,CRISPR/Cas 系统最终被阐释为一种在细菌和古细菌中抵抗噬菌体和质粒入侵的适应性免疫系统[7]。
经过近几年的研究,大多数CRISPR/Cas 系统已经被明确,利用不同类型系统的生物学特征开发出了许多CRISPR 工具。基于CRISPR/Cas 原理的新型核酸检测技术在传染性病原微生物核酸快速检测中具有重要。结合快速核酸提取技术、等温扩增技术等体外诊断技术,使得CRISPR/Cas 系统在病原微生物核酸快速检测领域有了更加广泛的应用[8]。
研究表明,由于CRISPR 系统进化迅速,因而其分类体系异常复杂。为了更好地展示CRISPR 分类面貌,科学界设计了一种特殊的分类方法,该方法多方面考虑了CRISPR 系统的亚型Cas 基因特征、多个同源Cas 蛋白之间的序列相似度、最保守的Cas1 蛋白的系统发育、CRISPR/Cas 基因座中基因的结构以及CRISPR 序列自身的结构[9-10]。这些标准的综合应用使得CRISPR 系统被划分为2 个不同的大类别,进一步细分为6 种类型和48 个亚型[11]。第一大类别约占已鉴定的CRISPR 系统约90%,最常见于细菌和古细菌,包括类型Ⅰ、Ⅲ、Ⅳ,共22 个亚型。这3 个类型的共同特点是具有异聚体多蛋白效应复合物。第二大类别约占已鉴定CRISPR 系统约10%,几乎只存在于细菌中,以具有单个多结构域效应蛋白为特征,包括类型Ⅱ、Ⅴ、Ⅵ,共26 个亚型[12]。
由于第2 大类别效应器复合体具有相对更简单的结构,使得其能够被开发成核酸检测技术[13]。应用最为广泛的Ⅱ型系统即CRISPR/Cas9 系统被研究开发成各种工具。Cas9 效应蛋白具有HNH 和RuvC 两种核酸酶结构域,HNH 活性位点负责切割与CRISPR RNA(crRNA)结合的(+)链上,RuvC 活性位点则切割另一条链,造成靶序列发生双链断裂(double-strand break,DSB)[14-15]。CRISPR/Cas9 系统中存在一个额外的小非编码RNA,称为反式激活核糖核酸(trans-activating crRNA,tracrRNA),与crRNA 上的重复序列互补,形成成熟的crRNA[16]。成熟的crRNA 指导Cas9 蛋白切割含有20 个互补核苷酸(nt)和相邻PAM 的靶序列[17]。属于Ⅴ型系统的Cas12 蛋白只包含一个RuvC 样核酸酶结构域,不存在tracrRNA,是由单个crRNA 引导的核酸内切酶[18]。属于Ⅵ型系统中的Cas13 蛋白具有两个HEPN 结构域[19],同样也是利用crRNA 指导实现干扰靶向目标序列,同时也具有靶识别效应触发的非特异性核糖核酸酶活性的特性[20]。以上这些生物学特性很好地被应用到病毒核酸体外诊断技术上[21]。
CRISPR/Cas 免疫反应包括适应、表达和干扰3 个主要阶段[22]。在适应阶段,Cas 蛋白复合物在识别出一个独特的短基序(Protospacer-adjacent motif, PAM)后,与靶DNA 结合并切割出靶DNA 的一部分,即原间隔序列[22]。然后原间隔片段插入CRISPR 阵列中,使成为间隔序列的其中一员。适应阶段由Cas1 和Cas2 蛋白的复合物介导,是已知的CRISPR-Cas 系统所共有的,有时还会涉及额外的Cas 蛋白,例如几个亚型中的Cas4 核酸酶、Ⅱ-A 亚型中的Csn2 蛋白和许多Ⅲ型系统中的逆转录酶[23]。
在表达阶段,CRISPR 阵列大多情况下被转录为单个转录物——pre-crRNA,然后pre-crRNA 再被加工成为成熟的crRNA,每个转录物都包含间隔序列和部分侧翼重复序列[22]。在不同的CRISPR/Cas 衍生体中,pre-crRNA加工由Cas 蛋白复合物的不同亚基、单结构域、多结构域Cas 蛋白或非Cas 的宿主核糖核酸酶(RNases)介导。在第一大类CRISPR/Cas 系统中,根据类型和亚型有不同的组合,效应模块由多种Cas 蛋白组成,已知有Cas3、Cas5、Cas6、Cas7、Cas8、Cas10 和Cas11。相比之下,在第二大类CRISPR/Cas 系统中,通过单一的大蛋白质Cas9、Cas12 或Cas13 中的功能结构域发挥作用[23]。在干扰阶段,成熟crRNA 识别噬菌体或质粒入侵基因组中的原间隔区,募集Cas 核酸酶或多种核酸酶切割外源基因而使其沉默[23-24]。
寨卡病毒是一种节肢动物传播的RNA 病毒,其引发的寨卡热的临床表现并无特异性,易误诊为其他传染病,例如登革热等虫媒病毒引起的传染病[25]。传统诊断依赖于病毒分离或ZIKV 特异性RNA 的检测。由于黄病毒属成员之间的交叉反应使血清学诊断变得复杂起来,因此开发一种更加快速高效、灵敏、重复性好的新型检测方法很有必要[26]。2016 年Collins 团队开发了一种用于检测寨卡病毒的便携式低成本诊断平台,灵敏度达到fM 水平[27]。Collins 团队利用生物分子传感器和基于CRISPR/Cas9 的诊断平台,允许在实验室外快速、特异和低成本地检测寨卡病毒。使用依赖核酸序列的扩增技术将提取的病毒RNA 进行扩增,利用设计好的Cas9-sgRNA 复合体特异性结合病毒RNA 的原理,结合冻干纸基传感器,寨卡病毒RNA 检测便可通过纸基的颜色转变判断。2017 年Zhang 实验室将等温扩增技术和CRISPR/Cas 系统相结合,建立了全新的核酸检测技术——SHERLOCK(Specific High-sensitivity Enzymatic Reporter unLOCKing)[28]。该研究通过重组聚合酶扩增(Recombinase Polymerase Amplification, RPA)技术进行核酸预扩增,再通过T7 RNA 聚合酶转录以得到大量RNA拷贝,而后用Cas13-靶特异性crRNA 复合体识别扩增产物,激发Cas13 非特异性核酸内切酶活性,连接淬灭基团和荧光报告基团的双链DNA 被切割,从而产生荧光信号。一年后,该团队进一步开发了新版本SHERLOCKv2,相比第一代技术显著降低了反应体系引物浓度,并增加多种荧光信号同时可检测多个靶序列,对于寨卡病毒检测限低至2aM(2×10-18mol/L)[29]。同年该团队继续推进SHERLOCK 在病毒快速检测领域的应用,采取患者的尿液或唾液经HUDSON(Heating Unextracted Diagnostic Samples to Obliterate Nucleases)处理,无需提取步骤即可在复杂现环境下部署快速检测,达到2 h 内从患者样本中直接进行无仪器寨卡病毒检测的目的,进一步设计还可以区分区域特异性毒株[30]。
宫颈癌是由人乳头瘤病毒(Human papilloma virus,HPV)感染所引起的一种可传染性癌症[31]。大部分人感染HPV 是无临床症状的并且会被免疫系统所清除,但是感染高风险人乳头瘤病毒(尤其是16 型)会导致宫颈癌、外阴癌和口咽癌等各种上皮癌症。HPV 检测对于低级别细胞学分诊的二级预防和治疗后治愈的检测具有良好的临床价值[32]。2018 年东南大学王进科团队开发了一种基于Cas9 核酸酶检测和分型的方法,被命名为CRISPR 分型PCR(CRISPR-typing PCR, ctPCR)[33]。该技术可以简单、快速、特异、灵敏地检测和分型目标基因。该技术主要步骤如下:使用一对通用引物对目标DNA 进行扩增;Cas9/sgRNA 复合体特异性切割扩增产物;切割产物加上A 加尾和T 接头;而后通过一对通用特异性引物扩增处理后的DNA;对处理后的产物进行电泳,从而判断是否感染人乳头瘤病毒。在该方法中,进行第一次PCR以确定检测到的DNA 样本是否包含目标DNA,而执行第二次PCR 则可以区分检测到的DNA 样本中存在哪些病毒亚型。该研究提供了一种新的基于CRISPR/Cas9 系统的DNA 检测和分型方法。
不久后,王进科团队又开发了ctPCR2.0 版本,即Cas9/sgRNAs 相关反向PCR(Cas9/sgRNAs-associated reverse PCR, CARP)[34]。该技术主要步骤如下:靶DNA首先在含有两种特异性sgRNA 的复合物中被Cas9 核酸酶切割。用T4 DNA 连接酶连接Cas9 切割的靶DNA,最后用PCR 扩增。由于扩增所选的是一对反向引物,方向相反导致无法扩增靶DNA。然而,一旦靶基因被Cas9/sgRNA 复合体切割,连接后形成分子间相接的线性或分子内环形DNA,反向引物就会变成正常引物,这样靶基因就可以通过PCR 扩增。为了进一步简化流程,该团队很快又开发了ctPCR3.0 版本,这项技术只需一个步骤就能检测到目标DNA:定量聚合酶链反应(qPCR)扩增Cas9/sgRNA 复合体切割的DNA 样本。在整个检测流程中无需打开检测管,就可以像传统的qPCR 检测一样检测目的基因。该技术同样得到了人乳头瘤病毒检测分型实验充分验证[35]。2018 年,诺奖得主Doudna JA 的实验室创立了一种DNA 核酸内切酶靶向CRISPR 的反式报告方法(DNA Endonuclease Targeted CRISPR TransReporter,DETECTR)[36]。Cas12a 蛋白是RNA 引导的DNA 靶向酶。当RNA 引导Cas12a 与DNA 结合时,就会触发Cas12a 切割单链DNA(ssDNA)活性,能够完全降解线性和环状ssDNA 分子。为了提高检测灵敏度,进一步结合了重组聚合酶扩增(RPA)技术。通过荧光基团-ssDNA-淬灭基团复合物在反应过程中释放的荧光信号来达到检测目的。在一小时内,DETECTR 准确地识别了25 个患者样本中是否存在HPV16 和HPV18,PCR 的强度和DETECTR 荧光信号之间具有良好的相关性,并且相比ctPCR 技术在时间上有了很大的提升。
2020 年,宾夕法尼亚州立大学Guan 团队开发了一种利用CRISPR/Cas12a 辅助纳米孔序列特异性地识别HIV-1 基因的技术[37]。固态纳米孔传感器由于其对单分子的高灵敏度和可重复使用性,在检测单分子方面显示出巨大的潜力。当带电荷的生物大分子(如DNA)被电场驱动通过纳米孔,这暂时妨碍了离子的通过,导致电流下降。通过对电流的下降幅度、形状、持续时间和速率的分析可以解析出分子的长度、形状、电荷。该技术使用玻璃纳米孔可对单链环状DNA 进行准确的定量,Cas12a 在crRNA 的引导之下特异性地结合目标DNA,激发Cas12a 切割单链环状DNA 的活性,线性和环状的DNA分子通过玻璃纳米孔时产生特异性的电流信号,以此来检测HIV。大多数CRISPR 介导的检测技术使用荧光来产生信号。在此之前需要报告基团的额外设计和合成,如荧光/猝灭剂报告复合物。总之,该团队将Cas12a 依赖靶DNA 激活的非特异性核酸内切酶特性和玻璃纳米孔传感器的高灵敏度结合到一个电子传感平台上,用于序列特异性HIV-1 检测,为在检测点开发快速和低成本的核酸检测提供了一种可靠的方法[37]。
CRISPR/Cas 系统由于具备特异性识别和切割核酸序列的能力,基于其开发的核酸检测技术具备高灵敏度、高特异性和简便快速等诸多优点,因而在病原微生物核酸体外诊断行业有着巨大的发展潜力。目前CRISPR/Cas体外诊断技术尚处于基础研发阶段,在广泛用于临床之前,还需要不断改进。随着等温扩增技术、SHERLOCK、DETECTR、SHINE 等技术不断更新应用,将极大推动CRISPR/Cas 体外诊断技术在更广阔的领域得到普及。