王雅轩,朱晓雁,苏建荣
CRISPR/Cas系统存在于细菌和古细菌中,它们的主要作用是保护生物体免受如质粒和噬菌体等外源DNA的入侵。1987年, Ishino等[1]于E.coli编码碱性磷酸酶的iap基因附近首次发现了一种特殊的重复序列。由于这个新颖的重复DNA序列家族的特征是具有21~37 bp的直接重复序列,并由大小相似的非重复序列分隔,故Jansen等[2]于2002年将其命名为簇状规律间隔的短回文序列(Clustered Regularly Interspaced Short Palindromic Repeats),即CRISPR。2005年,Bolotin等[3]发现,CRISPR表观出稳定性和广泛存在性可能是由于它们具有抵抗外源DNA入侵的保护作用。2007年,研究表明原核生物内可能存在一种基于核酸的免疫系统,其特异性由CRISPR间隔区决定,而抗性由Cas酶决定,并说明CRISPR是一种可以保护嗜热链球菌免受外来噬菌体侵袭的适应性免疫系统[4]。2011年,通过对化脓性链球菌进行分析发现了一种反式编码小RNA,即tracrRNA。tracrRNA通过广泛保守的内源性RNase III和CRISPR相关的Csn1蛋白的活性来指导crRNA的成熟。所有这些成分对于保护该菌免受原噬菌体衍生的DNA侵袭至关重要[5]。2012年,研究人员揭示了一个通过反式激活tracrRNA与配对的成熟crRNA形成的双RNA进行位点特异性DNA切割的核酸内切酶家族,并指出了该家族进行基因编辑的潜力[6]。近几年,Doudna研究组和张锋研究团队等相继将CRISPR/Cas系统应用于核酸检测领域,并且通过将重组酶聚合酶扩增(Recombinase Polymerase Amplification,RPA)等等温扩增反应与其结合,实现了单个核酸分子的检测。本文将主要对CRISPR/Cas中的Cas9、Cas12、Cas13以及Cas14在病原体检测方面的最新进展进行阐述。
Cas9是Ⅱ型 CRISPR / Cas 系统中被广泛应用的标志性核酸酶,在由tracrRNA 与成熟 crRNA 形成的tracrRNA / crRNA的引导下,特异性切割靶标双链 DNA(double strands DNA, dsDNA)。由于 tracrRNA / crRNA 的设计较复杂,研究者将二者整合为单一向导RNA(single-guide RNA, sgRNA),大大简化了操作步骤。Cas9介导的位点特异性切割依赖于sgRNA对靶序列dsDNA上原型间隔序列毗邻基(protospacer adjacent motif, PAM)序列的特异性识别,不同来源的 Cas9 识别的 PAM 序列不同。其中,应用最广泛的化脓性链球菌 Cas9切割靶标时所识别的PAM序列为NGG。
Pardee等[7]发明了一种将等温RNA扩增反应与RNA传感器相结合用于检测寨卡病毒的纸基传感器,可以在7 h内组装并测试48个寨卡病毒株。当与一种基于CRISPR/Cas9的模块结合使用时,可以区分具有单碱基差异的病毒株。研究人员成功展示了一种简单且可以现场使用的样本处理流程,并从一只患有病毒血症的猕猴血浆中检测到了寨卡病毒。基于CRISPR/Cas9和切口核酸内切酶(Nicking Endonuclease, NEase)介导的核酸扩增,Huang 等[8]建立了一种由CRISPR/Cas9引发的等温指数扩增反应(CRISPR/Cas9 triggered isothermal exponential amplification reaction,CAS-EXPAR)策略,用于进行快速且位点特异性的核酸检测。该策略的引物由Cas9/sgRNA指导的靶点特异性切割产生,并在反应过程中积累。该方法可以检测DNA甲基化和单核细胞增生李斯特菌总RNA,检测限可达0.82 aM,且在区分单碱基错配方面具有良好的特异性。CRISPR-dCas9是一种由RNA引导的蛋白质系统,能够特异性地与目标DNA序列结合。在Yang等[9]进行的检测CRISPR-dCas9的纳米孔实验中,该蛋白表现出了明显的阻断信号,这将有助于目标序列的鉴定。即使在纳米孔实验所需的高盐条件下,dCas9蛋白仍能稳定结合,靶序列的结合位置可以从DNA信号峰值的位置读出。Wang等[10]将CRISPR/Cas系统与侧向流动核酸检测(lateral flow nucleic acid assay,LFA)相结合形成了CASLFA检测系统,用于鉴定单核李斯特菌、转基因生物和非洲猪瘟病毒,可在1 h内检测数百份样本。在非实验室环境下检测样本时,与实时PCR相比,其准确性可达100%。除此之外,研究人员开发了一种基于Cas9切口酶的扩增方法(Cas9 nickase-based amplification reaction,Cas9nAR),该方法将具有精确的靶点识别和单链切割能力的RNA引导的Cas9n与具有链置换能力的外Klenow聚合酶相结合,并将其用于从基因组DNA中扩增目的片段。该方法可在60 min内达到10~21摩尔的检测限[11]。Wang等[12]将Cas9nAR与侧向层析试纸条相结合,开发了一种可以鉴定鼠伤寒沙门菌和大肠杆菌的双重检测系统。该系统采用sgRNA和针对目标基因设计的引物,对基因组DNA的检测限可达100拷贝。
Cas12,又称为Cpf1,是属于V型CRISPR/Cas系统的核酸内切酶。crRNA-Cas12复合物可切割在非目标链5′端具有富含T碱基的短PAM序列的dsDNA。Cas12也因此成为了一种强大的基因编辑工具[13-14]。2018年,Chen等[15]检测了毛螺旋菌科细菌(Lb)ND2006 Cas12a(LbCas12a)的由RNA引导的单链DNA(single strand DNA, ssDNA)切割能力。结果表明,与crRNA互补的ssDNA或dsDNA都能够触发LbCas12a非特异性切割ssDNA-FQ报告底物,证实了LbCas12a具有DNase活性。研究人员通过将RPA反应与LbCas12a结合,建立了名为DETECTR的检测方法,能够于1 h内在含有不同亚型人类乳头瘤病毒(human papillomavirus,HPV)的样品中准确地识别HPV16和HPV18,灵敏度可达aM。2019年,Li 等[16]利用来自V-B型 CRISPR/Cas系统、由嗜热RNA引导的内切酶Cas12b(以前称为C2c1),建立了一种名为HOLMESv2的检测方法。在HOLMESv2中,LAMP反应和Cas12b被集成到一个体系中,并且通过使用依赖RNA的DNA聚合酶省略了额外的逆转录步骤,使检测过程更加便利。随后,Teng等[17]开发了一种由Cas12b介导的DNA检测策略(Cas12b-mediated DNA detection, CDetection), 该方法的灵敏度可达1 aM。近期,一种基于超灵敏探针的侧向流动传感器被开发出来,该传感器结合了CRISPR/Cas系统和LAMP反应,可检测到单拷贝的铜绿假单胞菌酰基转移酶基因以及1 cfu/mL包含大肠杆菌DH5α 纯培养物的质粒[18]。研究表明,Cas12a能够检测EB病毒以及碳青霉烯酶抗性基因(如KPC、NDM和OXA)。同时,通过增加一个逆转录步骤,还能够对登革病毒、寨卡病毒和汉坦病毒进行检测,证明Cas12a能够同时检测DNA和RNA靶标[19]。除此之外,Cas12能够通过与其他材料结合被用于病原体诊断。CRISPR相关核酸酶的可编程性能够激活含有DNA的水凝胶,当被输入序列激活后,Cas12a在凝胶中裂解DNA,从而将生物信息转化为材料性质的变化[20]。Peng等[21]首次将CRISPR/Cas12a与生物分子逻辑门相结合,构建了3个2-输入的“与”“或”“抑制”逻辑门。其中,“与”门对金黄色葡萄球菌等外部病原菌具有较高的灵敏度和特异性。进行靶序列扩增后,应用该方法进行细菌检测,总的采样-应答时间为2 h,检出限为103cfu/mL,动态范围为103~107cfu/mL。该研究验证了利用CRISPR/Cas系统构建生物计算设备的可能性。细胞相关的人类免疫缺陷病毒(human immunodeficiency virus,HIV) DNA是证明HIV在感染细胞中持续存在的最常使用的标志物。通过将Cas12a与玻璃纳米孔传感器结合形成电子传感平台,并使用ssDNA作为报告基因,Nouri等[22]成功地在1 h内检测到10 nmol/L以上的目标DNA,并发现报告子的切割速率与目标分子浓度成正比。
2019年年底以来,新冠肺炎出现并迅速传播,亟需建立可以快速检测SARS-CoV-2的方法。2020年5月,Huang等[23]报告了一种基于RT-PCR与CRISPR/ Cas12的用于检测鼻拭子中SARS-CoV-2的侧向流动方法。该方法可在未配备q-PCR检测系统的现场进行使用,并且可检测到包含2拷贝靶标RNA的样本。除此之外,Ding等[24]提出了一种一体化双重CRISPR/ Cas12a(All-In-One Dual CRISPR-Cas12a,AIOD-CRISPR)检测方法,该反应引入了两个靶向SARS-CoV-2 N基因的crRNA,并与RPA反应相结合,高效启动了基于CRISPR的检测系统。通过低成本的暖手器作为反应孵育器,可在20 min内实现对临床样本的检测。Lucia等[25]也针对SARS-CoV-2的ORF1ab区设计了结合RPA反应与CRISPR/ Cas12a进行检测的系统,检测限可达10拷贝/μL,且能够与侧向层析联用。
2016年,张锋团队[26]通过纯化的LshC2c2蛋白证明了C2c2(现称为Cas13a)和crRNA在体外足以实现由RNA引导的RNA切割。这种切割优先发生在ssRNA区域的尿嘧啶残基上,并依赖于两个高等真核生物和原核生物结合核苷酸(higher eukaryotes and prokaryotes nucleotide-binding, HEPN)结构域内的保守催化残基。C2c2一旦被同源靶标启动,就可以在体外切割其他(非互补的)RNA分子,并在体内抑制细胞生长。同年,Doudna课题组[27]证实,在VI型系统中,C2c2蛋白是RNA引导的RNA内切酶,并且具有一种独特的核糖核酸酶活性,能够负责crRNA的成熟,这与它的ssRNA降解活性不同。
2017年,Gootenberg等[28]建立了一种由RPA反应、T7 RNA聚合酶和Cas13a组合检测靶标RNA/dsDNA的系统,称为SHERLOCK。结果表明,SHERLOCK在检测时发生的变异小于ddPCR、qPCR和RPA。此外,该系统具有aM的敏感性和识别单碱基错配的特异性,能够检测特定的寨卡病毒和登革病毒株、区分病原菌、对人类DNA进行基因分型,并可以鉴定细胞游离肿瘤的DNA突变。此外,SHERLOCK的反应试剂可以进行冷冻干燥,便于储存和现场应用。2018年,Gootenberg等[29]建立了SHERLOCK v2系统。为了放大检测信号,研究者利用了CRISPR III类效应器核酸酶Csm6,它能够被环腺苷酸分子或以2′,3′-环磷酸为末端的直线型腺嘌呤均聚物激活。LwaCas13a和PsmCas13b附属切割产生带有羟基化的5′末端和2′,3′-环磷酸端的切割产物,表明Cas13的附属切割可以产生Csm6激活物,这将使其可以在SHERLOCK中进行放大的信号检测。除此之外,研究者建立了一个基于FAM-生物素报告系统的、可以在侧向流动试纸条上进行检测的方法。基于这种设计对寨卡病毒或登革病毒ssRNA进行检测,可以在90 min内得到信号,且灵敏度达2 aM。2019年,Qin等[30]报道了一种利用Cas13a检测埃博拉病毒RNA的自动化POC系统。在进行混合和杂交后,可在5 min内检测出20 pfu/mL(5.45×107copy/mL)的纯化埃博拉RNA。同年,Myhrvold等[31]开发了能够与SHERLOCK组合使用,进而从体液中直接进行病毒检测的HUDSON系统。该系统可以通过加热和化学还原裂解病毒颗粒,并灭活体液中高水平的核糖核酸酶,使其在2 h内直接从患者样本中检测到登革病毒。除此之外,基于SHERLOCK和HUDSON系统,实现了对与病毒性出血热相关的埃博拉病毒和拉沙病毒的检测,每个样本的检测成本不足1美元[32]。近期,一个可用于多重核酸检测的组合阵列反应(CARMEN)平台被开发出来。在该平台上,含有基于CRISPR的核酸检测试剂的纳米液滴在微孔阵列中与扩增样品的液滴进行配对,测试每个样本与crRNA的反应情况。CARMEN-Cas13可以在单个阵列上对超过4 500个crRNA-目标序列对进行准确的检测。该平台能够通过至少10个已发表的基因组序列同时区分169种人类相关病毒,并且可以对COVID-19的病原体进行检测。该平台还实现了对A型流感病毒多种亚型毒株的区分和对数十种HIV耐药突变的鉴定[33]。Kaminski等[34]将RPA反应与Cas13结合用于从患者的血液和尿液等样本中准确检测出BK多瘤病毒DNA和巨细胞病毒DNA,这两种常见的机会性病毒与肾移植患者以及其他免疫功能低下的患者密切相关。
2020年8月,我国研究者Hou等[35]将RPA反应与Cas13a相结合用于检测SARS-CoV-2,具有高度特异性,且可以在40 min内完成检测。9月,Fozouni等[36]在medRxiv网站上预先发表了最新研究成果,她们基于CRISPR/Cas13a实现了对SARS-CoV-2的直接检测,并与移动电话相结合实现了病毒RNA的定量。该方法无需预先扩增病毒基因,将多个crRNA进行组合来增加Cas13a的激活。通过检测反应过程中荧光值的变化,可以在30 min内实现对低至100 copy/μL SARS-CoV-2 RNA的检测,还可以在5 min内检测出所有受试的阳性患者样本。该方法为SARS-CoV-2的筛查提供了快速和便携的新选择。
2018年,Harrington等[37]在未经培养的古生菌中发现了一套包含Cas14的CRISPR/Cas系统。这是一个非常紧凑的由RNA引导的核酸酶家族,长度为400~700个氨基酸。它能够在无需限制性序列的条件下靶向切割ssDNA,且会引发对ssDNA分子的非特异性切割,因此它有望被用于检测重要的ssDNA病毒。然而,它能否被用于除诊断以外的其他用途,如研究新病毒的系统发育关系以及与其他病原体的流行病学关系等仍未知。
SHERLOCKv2可以通过侧向流动试纸检测登革病毒或寨卡病毒以及患者体液活检样本中的变异,突出了其用于多重检测的潜力。研究者进一步将检测扩展到4个靶标,分别在FAM、TEX、Cy5和HEX通道中使用LwaCas13a、PsmCas13b、CcaCas13b和AsCas12a,成功区分了所有靶标的组合。当与RPA结合时,能够在aM的浓度下检测到两个DNA靶标(铜绿假单胞菌酰基转移酶基因和金黄色葡萄球菌热核酸酶基因)。同样,由PsmCas13b和LwaCas13a组成的多重SHERLOCK实现了aM浓度寨卡病毒和登革病毒RNA的检测以及人类唾液样本的等位基因特异性基因分型[29]。除此之外,Yuan等[38]提出了一种基于CRISPR/Cas系统的比色基因传感平台。在该平台中,Cas12a/crRNA对DNA和Cas13a/crRNA对RNA的识别通过互补序列激活反式ssDNA或ssRNA切割,进而触发设计的AuNPs DNA探针对发生聚集行为的改变,在1 h内完成基因检测,同时,这个平台也有望利用16S rDNA或16S rRNA进行细菌的鉴定。近期,Xu等[39]开发出一种由于靶标信号诱导表面信号探针(含电化学标记)发生构象变化,从而导致电化学标记的电子转移速率发生变化的CRISPR/Cas系统增强型电化学DNA传感器,可在无需酶催化的条件下达到fM的检测限。
本文对CRISPR/Cas中的Cas9、Cas12、Cas13以及Cas14在病原体检测方面的应用进行了详细的阐述,它们不但可以对病原体进行鉴别诊断,如区分寨卡病毒和登革病毒、HPV16和HPV18等,还可以用于检测生物酶、生物标志物和区分人类SNP位点等。基于CRISPR/Cas系统的检测方法可达aM的灵敏度,且能够实现区分单碱基差异的特异性(如SHERLOCK和DETECTR)。在成本方面,基于SHERLOCK和HUDSON的检测成本低至1美元,其他几种相关的检测方法也成功实现了低成本。此外,为了增加使用的便捷性,研究人员开发了多种不同形式的检测系统,包括将其与侧向层析试纸相结合、省略核酸扩增步骤直接进行检测、将等温扩增反应与Cas蛋白结合进行一步法反应等。未来,我们应该开发一种集病原体核酸扩增、Cas蛋白检测与反应信号读取于一体的设备,这将更适用于进行现场检测。虽然越来越多利用CRISPR/Cas系统的检测方法被开发出来,但它们对大规模临床样本检测的准确性仍有待验证。此外,目前大多数反应需要先进行核酸扩增,再利用CRISPR/Cas系统检测,但扩增步骤大大增加了检测时间,故我们可以尝试通过在体系中加入多条针对目标序列不同位点的crRNA,进而达到提高灵敏度的目的,相关研究还有待进一步实施。随着研究的不断深入,CRISPR/Cas系统在病原体检测方面的应用将更加广泛,并可能成为新一代病原体检测的有力工具。