刘 珂,靳 宇,梁建功,吴 园
(华中农业大学理学院,武汉430070)
核酸适体是指通过指数富集配体系统进化技术(SELEX)筛选得到的一段单链DNA(ssDNA)或RNA(ssRNA)寡核苷酸,长度通常为10~100个碱基,通过形成特定的二级或三级结构可以高亲和性、高特异性地与靶标结合[1,2].这种特定结构是由核酸适体与其靶标之间的分子形状互补性以及核酸适体-靶标分子间相互作用折叠而成的,如形成环、凸起、发夹和假结等[3].核酸适体-靶标分子间的相互作用力包括氢键、静电、碱基对堆积作用、偶极-偶极相互作用、疏水相互作用和π-π堆积等协同作用[4,5].
SELEX技术由2个独立的研究小组于1990年首次报道,至今经历了很多变化和改进[1,2].传统SELEX技术的操作步骤如图1所示:(1)人工设计并化学合成库容量为1015~1018的随机寡核苷酸文库;(2)在特定的缓冲溶液和适宜的温度下,将文库与靶标一起孵育,形成靶标-核酸适体复合物;(3)通过特定的方法分离已结合及未结合靶标的核酸序列;(4)分离出来的与靶标特异性结合的核酸序列通过聚合酶链扩增反应(PCR)富集,生成次级文库;(5)引入负筛,以除去与靶标非特异性结合的核酸序列.重复(2)~(4)操作.通过反复筛选,得到潜在的核酸适体进行测序,并进行分子结构、识别位点和靶标结合动力学分析,选取与靶标特异性强、亲和力高的核酸适体用于后续研究工作.
核酸适体与靶标之间优异的亲和识别作用使核酸适体在构建生物传感器、鉴定生物医学肿瘤标志物、药物开发及疾病诊断和治疗等领域中展现出重要的应用价值.因此,研究者开发出基于核酸适体连接的固定化吸附测定(ALISA)和基于核酸适体的侧向流式免疫检测方法[6,7];也有大量基于核酸适体的电化学、比色或荧光等检测方法的研究报道,如检测氧氟沙星抗生素[8]和腺苷二磷酸[9];此外,修饰有合适药物分子(荧光染料、放射性标记和药物小分子等)的核酸适体已用于肿瘤组织的造影、生物学过程的监测及疾病的早期精准诊断和靶向治疗[10,11].近年来,研究者以不同的角度和重点发表了大量的核酸适体综述评论,如Banerjee等[12,13]介绍了核酸适体在治疗、药物递送和成像方面的进展;Li等[14]对分子诊断和治疗的核酸适体的研究进展和展望进行了评述;Madder等[15]和Yuan等[16]综述了化学修饰核酸适体在提高诊断和检测应用中的现状和展望.
核酸适体又被称为“化学家的抗体”[17],相对抗体而言具备较多优势:(1)产生抗体的有效方法必须依赖于用免疫原性分析物对动物的免疫.而分子量小的分析物通常不具有免疫原性,因此,很难产生合适的抗体[18,19].而核酸适体不受分子量大小的限制,可以针对各种分析物筛选出合适的核酸适体,例如离子、小分子、蛋白质、病毒、细菌、细胞甚至神经组织[20~25].(2)核酸适体具有更高的物理和温度稳定性,可作为更强大的分析工具[26~28].即使在变性后,基于碱基配对的可逆性和可预测性,核酸适体也能够重新折叠,恢复特性,从而延长其保存期限.相反,抗体在偏离生理条件下是不稳定的,并且变性后难以重新折叠[29].(3)多克隆抗体存在较明显的批次间差异.这与核酸适体的生产反差明显,核酸适体可通过固相化学合成得到,因此能提供恒定的质量,更具生产成本效益.(4)核酸适体相对于抗体的主要优点是易进行选择性化学修饰.抗体在实际应用中经常需要修饰,如抗体-药物偶联物、免疫传感器标记抗体等.但是,抗体的位点选择性标记特别困难,并且仅限于少数可能的化学反应.此外,抗体的修饰控制不当会使构象发生变化,导致丧失结合亲和力[30].而核酸适体是化学合成的,选择性地对其进行化学修饰相对容易.因此,在实际应用中,尤其是鉴于抗体的许多缺点,核酸适体被视为最有希望的抗体替代品.
核酸适体也有缺点,比如它与靶标的结合亲和力多不如抗体.原因之一是,天然抗体可由20种不同氨基酸组合而成,而核酸适体的寡核苷酸链是由腺嘌呤(Adenine,A)、鸟嘌呤(Guanine,G)、胞嘧啶(Cytosine,C)、胸腺嘧啶(Thymine,T)或尿嘧啶(Uracil,U)4个不同核苷酸连接而成[31,32],限制了其化学多样性,这可能会影响核酸适体的全部应用潜力.由于此限制,围绕核酸适体的研究大多是用少数的高亲和力适体(“明星适体”)进行检测、诊断或靶向治疗应用.很多耗时耗力筛选出来的核酸适体得不到广泛应用研究,不利于核酸适体的推广发展.因此,许多研究者通过化学修饰核酸适体,扩展核酸适体的结构多样性,以提高核酸适体与靶标的结合亲和力[33~35].原因之二是,核酸适体是单链核酸结构,富含负电荷,其柔性结构会受到环境pH值、金属离子、盐离子浓度、其它生物分子和温度的影响[36~38],导致核酸适体的ssDNA/ssRNA柔性分子骨架结构会发生微调.结构决定功能,核酸适体柔性结构的不稳定性导致核酸适体在复杂环境中的实验可重复性差,甚至失去结合亲和力.这是因为理论上核酸适体在展开状态(Ⅰ)和折叠状态(Ⅱ)之间存在平衡,具有相应的平衡常数(图2).引入靶标后,折叠状态(Ⅱ)会形成核酸适体-靶标结合状态(Ⅲ),两者之间存在平衡解离常数(Dissociation constant,Kd).核酸适体由展开状态到折叠状态的形成实际上是核酸适体从无序的多变构型向有序的固定构型转变的过程,而如前所述,核酸适体的构型以及结合能力会受到多种因素的影响,并非所有的核酸适体构型都能高特异性、高亲和性结合靶标,因此,提高核酸适体与靶标亲和力的另一条思路是引入合适的化学修饰改造,将核酸适体稳定在其折叠状态(Ⅱ),从而提高核酸适体与靶标的亲和力.
Fig.1 Schematic illustration of conventional SELEX process for the selection of aptamers
Fig.2 Equilibrium among the unfounded aptamer(Ⅰ),folded state(Ⅱ)and target bound state(Ⅲ)
本文概述了化学修饰提高核酸适体与靶标亲和力的方法(图3).首先,简要介绍了用于核酸适体筛选的常规SELEX技术;其次,详细讨论了SELEX筛选前(Pre-SELEX)和筛选后(Post-SELEX)对核酸适体进行化学修饰以提高亲和力的各种策略;最后,探讨了核酸适体临床应用所面临的一些挑战,并对核酸适体的未来进行了展望.
Fig.3 Flow diagram illustrating the aptamer modifications discussed in this review
传统的筛选核酸适体文库会受到A-T/U和G-C配对的限制,使得筛选得到的核酸适体形成的空间折叠结构多样性有限.为了提高核酸适体筛选的成功概率和实用性,科研工作者已针对不同目的设计了多种不同的非天然碱基对[39],并且对PCR扩增和测序技术中使用的聚合酶的高保真进行了优化[40].通过非天然碱基定制具有功能性和可塑性的扩展人工碱基文库,可有效提高文库的化学多样性,从而提高核酸适体与靶标之间的亲和力.另一方面,近年来许多科学家致力于通过化学合成方法,对天然核苷酸的核苷酸构件部分(碱基、五碳糖或磷酸)进行化学修饰,丰富筛选文库中的碱基种类,扩展核酸适体与靶标之间的结合作用,也可提高核酸适体与靶标的结合亲和力[41,42].
基于4个天然遗传字母的沃森-克里克(Watson-Crick)碱基配对是世界上所有活生物体中心法则的关键原则,A-T(U)和G-C的独特互补性使得活生物体可以通过聚合酶反应进行DNA复制和RNA转录,并通过核糖体反应中的密码子-反密码子相互作用翻译为蛋白质.传统的SELEX技术始终依赖于基于4个遗传字母的碱基配对原则,从文库的构建到对每一轮筛选得到的次级文库进行PCR扩增,4个遗传字母数目限制了该技术的进一步发展.因此,增加遗传字母的数量可以增加核酸的信息密度和容量,通过创建第三碱基对来遗传扩展字母的数量是科学研究的趋势.早在1962年,Alexander Rich[43]首先提出了扩展遗传字母的最初概念,然而并没有合成出能成功应用于各种生物技术的遗传扩展字母.直到1989年,Benner等[44,45]合成出一种新的Watson-Crick碱基对,其氢键键合配对模式在一定程度上类似于A-T和G-C碱基对,可以通过DNA和RNA聚合酶掺入到DNA或RNA序列中,成功将遗传字母从4个扩展到6个.
然而,直到21世纪,科学界才广泛认识到扩展的遗传字母在核酸适体筛选领域具有扩展核酸适体功能的潜力.最关键的贡献是Hirao课题组[46]于2013年首次开发了一种新的SELEX方法(ExSELEX,genetic alphabet Expansion for SELEX),将高度疏水的7-(2-噻吩基)咪唑并-[4,5-b]-吡啶人工碱基[7-(2-thienyl)imidazo[4,5-b]pyridine,Ds]作为第5个碱基引入ssDNA核酸适体筛选的文库中.如图4所示,作者在随机序列文库中插入3个Ds疏水人工碱基,以加强适体与靶蛋白疏水腔的相互作用.此外,Ds碱基在DNA复制过程中仅与二醇修饰的2-硝基-4-丙炔基吡咯(2-nitro-4-propynylpyrrole,Px)配对,有望增加ssDNA核酸适体分子的化学结构多样性.Ds与Px碱基对之间的配对是通过形状互补性介导的[图4(A)],Ds的噻吩基团可阻止其本身与天然碱基的相互作用,Px的硝基与腺嘌呤的氮原子之间存在静电排斥作用而避免了与天然腺嘌呤发生潜在的相互作用.同时,Px引入的丙炔基增加了该人工碱基的疏水性,提高了在PCR过程中人工碱基对聚合酶的亲和力.在筛选过程中作者没有在文库中加入与Ds配对的Px人工碱基,使得Ds碱基在最终筛选得到的核酸适体序列中保持未配对状态,不会处于核酸适体的茎部区域,增大了核酸适体与目标蛋白的疏水腔发生相互作用的概率,从而提高核酸适体与靶蛋白的结合亲和力.作者针对人类血管内皮细胞生长因子-165(VEGF-165)和干扰素-g(IFN-g)2种靶蛋白筛选得到的ssDNA适体的Kd值分别为0.65 pmol/L和38 pmol/L,经测序得知这些ssDNA核酸适体均含有2个或3个Ds碱基,与仅包含天然碱基的原核酸适体相比,它们与靶标的结合亲和力均提高100倍以上,经验证序列中含有2个Ds碱基对它们亲和力的提高是必不可少的.
上述工作是在筛选文库中添加1个人工扩展碱基,理论上,在文库中添加2个人工扩展碱基会更大程度地扩展筛选系统的“序列空间多样性”.但是,如果添加的人工扩展碱基对与天然规范的Watson-Crick配对几何结构相差太大,标准聚合酶将很难识别并进行扩增,在PCR扩增和深度测序过程中存在丢失真实信息的可能性.如上述Hirao小组[46]提出的ExSELEX技术最大的问题是经过数轮筛选后测序过程中如何确定富集文库每个ssDNA中Ds碱基的位置,因为常规深度测序方法不能直接用于含有Ds碱基的ssDNA测序,作者配套开发出了2种测序方法,导致工作难度和强度都非常大.同时,Ds与Px的配对缺乏碱基间的氢键作用力,仅通过空间互补性配对,偏离了Watson-Crick配对概念,这不利于筛选的ssDNA核酸适体中相邻或附近的人工扩展碱基形成空间折叠结构.
与高度疏水的Ds人工碱基相反,Benner课题组[47,48]合成了新的基于氢键配对的碱基对P(6‐amino‐5‐nitropyridin‐2‐one)和Z(2‐amino‐8H‐imidazo[1,2‐a][1,3,5]triazin‐4‐one),它们的理化性质与天然碱基对部分相似.不同之处如图5所示,Z碱基中有额外的硝基基团以及P碱基中具有芳香结构的电子密度结构,使得含有多个P-Z碱基对的DNA双链具有A型和B型2种双螺旋结构,并且P-Z碱基对表现出比G-C碱基对更高的稳定性[49].基于此,Benner等[50~53]针对类似Watson-Crick配对的P-Z碱基对在扩展DNA功能方面做了大量研究.
Fig.5 Molecular and crystal structures of A,T,G,C,Z[47]
Fig.6 Schematic of the AEGIS Cell⁃SELEX[55]
为筛选出识别细胞膜蛋白的核酸适体,Tan等[54]率先提出了基于完整活细胞的Cell-SELEX技术.Benner和Tan等[47,55~57]通过使用完全随机的的六字母GACTZP-ssDNA文库启动了ssDNA核酸适体的筛选工作,于2014年首次开发出另一种新的基于人工扩展遗传信息系统(Artificially expanded genetic information systems,AEGISs)的Cell-SELEX技术(AEGIS Cell-SELEX)(图6),筛选出靶向人三阴性乳腺癌细胞系MDA-MB-231的ssDNA核酸适体,命名为ZAP-2012.该核酸适体序列中包含Z和P碱基各1个,且Z和P碱基对结合亲和力很重要,核酸适体序列中的Z或P碱基被随机替换,得到的ssDNA核酸适体对MDA-MB-231细胞系的亲和性能下降.通过流式细胞仪测得ZAP-2012核酸适体对MDA-MB-231细胞的亲和力Kd值为30 nmol/L,比传统ssDNA文库筛选得到的靶向MDA-MB-231细胞核酸适体的亲和力提高了10倍,且该工作中筛选轮数为12轮,比传统ssDNA文库针对活细胞筛选获得纳摩尔级别的ssDNA核酸适体轮数(通常为15~20轮)减少,提高了筛选效率.该工作值得进一步探索的是筛选得到的ZAP-2012核酸适体的特异性,因为在筛选过程中作者没有引入尚未永生化的人正常乳腺细胞作为对照.
2015年,Benner课题组[48]发现Z和P碱基对是通过标准的Watson-Crick几何结构进行配对的,且配对形成的结构很“自然”,与天然核苷酸形成的双螺旋结构兼容.在此发现基础上,Benner和Tan等[47]继续在AEGIS Cell-SELEX技术[55]基础上提出了新的通过聚合酶进行实验室体外进化技术(LaboratoryIn VitroEvolution,LIVE),称为AEGIS cell-LIVE(图7),进一步探索由GACTZP-ssDNA文库通过实验室体外进化技术产生更大序列空间的核酸适体.在该工作中,作者针对人肝癌细胞株HepG2进行了ssDNA核酸适体的筛选,同时在筛选过程中引入了负细胞Hu1545V以提高核酸适体的特异性.Hu1545V细胞是通过慢病毒转染人端粒酶逆转录酶hTERT基因的永生化正常人原代肝细胞,不但延长了其寿命,而且该细胞与肝癌HepG2细胞相比仍保持了正常肝细胞的膜蛋白组.经过13轮筛选,成功筛选出靶向肝癌HepG2细胞的含有Z/P人工碱基的核酸适体,其Kd值低至14 nmol/L.作者进一步证实当核酸适体中的Z或P碱基被C或G碱基取代后,核酸适体的亲和性能下降.这些数据为人工扩展的遗传信息系统可在更大空间内扩展核酸序列的功能提供了直接证据.更重要的是,该工作中介绍的LIVE技术不同于经典的SELEX技术,后者通常只能筛选得到初始文库中预先存在的序列.在基于GACTZP系统的AEGIS cell-LIVE中,Z和P碱基存在缓慢增减的可能性,而且损失率略大于增益率[58].与2014年Sefah等[55]报道的筛选步骤相比,该工作中使用的GACTZP文库中含有更多的Z和P碱基,增加了人工碱基的信息密度,而且Z碱基含有的硝基是一种通用的弱黏合剂,增加Z碱基的个数在一定程度上可提高聚合酶对Z和P碱基的保真度.这也表明,虽然Z和P碱基在PCR过程中可能不受欢迎,但Z和P在被选择过程中由于本身的结构优势依然可以保留下来,GACTZP构建的文库是更丰富的结合分子库.
Fig.7 Schematic of the AEGIS cell⁃LIVE with both positive and counter selections[47]
上述Sefah等[55]和Zhang等[47]利用AEGISs系统对ssDNA核酸适体的筛选工作均是针对活的癌细胞进行的,Zhang等[56]应用该系统进一步扩展对细胞表面特定高表达蛋白进行了筛选工作.据报道,磷脂酰肌醇蛋白聚糖(Glypican 3,GPC3)可能是诊断一种高死亡率的原发性肝癌(Hepatocellular carcinoma,HCC)的生物标志物[59],在大多数HCC中表达上调,在原代正常肝细胞、肝硬化细胞和肝良性病变细胞中均不表达[60].因此,AEGIS系统筛选得到的ssDNA核酸适体具有临床诊断功能.作者选择GPC3作为靶标蛋白,通过重组细胞技术,在细胞表面大量表达GPC3蛋白.但是,如果选择天然表达GPC3的细胞可能会产生与该细胞表面其它蛋白(也可能包括GPC3蛋白)结合的核酸适体,同时很难选择反筛细胞.因此,作者选用不表达GPC3的小鼠肝上皮细胞系(BNL 1ME A.7R.1,1MEA)作为反筛细胞,用携带人GPC3(human GPC3,hGPC3)基因的质粒对1MEA细胞进行转染,获得了高表达hGPC3蛋白的1MEA细胞(1MEAhGPC3)作为靶细胞进行AEGIS cell-LIVE筛选.作者构建的AEGIS-ssDNA文库中T∶G∶A∶C∶Z∶P的摩尔比为1∶1∶1∶1∶2∶2,最后筛选得到的包含Z和P碱基的ssDNA核酸适体的Kd值低达6 nmol/L.同样,当将Z或P(或两者)替换为天然核苷酸时,该核酸适体的亲和力会降低或直接丢失.
人工扩展的核酸文库还可以同时引入几种不同的人工碱基.Yuan等[61]开发了同时具有二茂铁碱基、三氟甲基碱基(F碱基)和Z/P碱基对的人工扩展核苷酸文库.如图8所示,其中二茂铁碱基中的三价铁离子可以与蛋白质的金属结合位点协调作用[62,63];F碱基中的氟可以通过形成卤素键或阴离子抑制蛋白质活性[64];引入Z-P人工碱基对,以在互补作用中提供更丰富的空间构象[57];此外,Z碱基中的硝基部分可以充当“通用弱结合剂”,以增强核酸适体和蛋白质之间的相互作用.作者整合3种类型的人工扩展核苷酸文库筛选得到的可靶向识别三阴性乳腺癌细胞MDA-MB-231细胞的核酸适体的Kd值为48.5 nmol/L,识别靶标为细胞膜表面的整合蛋白α3(ITGA3),且该核酸适体可减少ITGA3与配体的结合,从而抑制肿瘤细胞的黏附和迁移.这种化学修饰辅助的体外筛选方法利用“以生物学功能为导向的筛选”为指导原则,能够在寻求具有生物活性核酸适体的过程中,利用进化的力量促进化学生物学研究和药物发现.
Fig.8 Schematic of the molecular design of aptamers as modulators of protein activity[61]
综上所述,构建人工扩展的碱基文库可显著提高核酸适体与靶标的结合亲和力.但是,基于人工碱基的SELEX技术的成功依赖于各种成熟的技术更新.首先是固相化学合成人工碱基文库的能力;其次,具备用于PCR扩增GACTX(X为人工碱基)构成的DNA序列高效聚合酶,要求在扩增过程中人工碱基丢失的可能性极低;最后,深度测序技术,要求能客观准确地测出GACTX碱基构成的核酸适体小文库中的人工碱基.这三者缺一不可,才能使扩展AEGIS-SELEX的功能和实用性迈出下一步.也正是因为这些条件的限制,即使目前研究出来的人工碱基种类丰富,但是真正能应用到筛选核酸适体的屈指可数.
基于上述讨论的在文库中引入人工碱基的限制条件,研究人员开发的另外一种丰富文库化学多样性的策略是通过固相合成方法对现有的核苷酸构件进行化学修饰.根据靶标的结构特征来定制核酸适体的化学修饰,运用成熟的化学方法在天然核苷酸构件中引入各种性能的官能团[65],如疏水性、亲水性或带电性,其中许多结构单元已经商业化.最具代表性的示例为Mayer等[66]建立的一种简单通用的方法——click-SELEX.该方法首次通过炔-叠氮化物点击反应(Click chemistry)在PCR扩增次级文库后原位重新引入化学修饰的天然碱基,构建修饰后的核酸文库用于下一轮筛选.如图9所示,首先用炔基修饰的T碱基单体替代天然T碱基单体构建文库,通过点击反应进一步修饰叠氮化的吲哚化合物,由此获得吲哚修饰的ssDNA文库.经过一轮体外筛选后,对炔基修饰的核酸文库进行PCR扩增,将产物再次修饰叠氮化的吲哚,为下一轮筛选重建起始文库.经过数轮筛选和扩增后,通过click-SELEX策略筛选出针对绿色荧光蛋白(Green fluorescent protein,GFP)具有高亲和力的吲哚修饰的核酸适体,Kd值低至18.4 nmol/L,而且其结合依赖于吲哚的存在,表明该化学修饰方法不仅可提高核酸适体与靶标的结合亲和力,还可以提高筛选针对困难靶标的核酸适体成功性.这种click-SELEX方法在每一轮PCR扩增后通过简便易操作的点击反应,重新在文库中引入新的功能基团,实用性广泛,且不限于单一品种基团的修饰.
另外,直接对天然碱基单体进行化学修饰也可以提高所筛选核酸适体与靶标的结合亲和力[67].Janjic等[68]构建了双修饰碱基单体构成的较短随机序列文库用于核酸适体的筛选.作者通过对文库中的胞嘧啶和胸腺嘧啶双碱基修饰类氨基酸侧链,选用蛋白转化酶枯草杆菌蛋白酶作为目标蛋白质成功筛选出核酸适体.与单一碱基化学修饰的文库或者传统文库相比,双碱基化学修饰构建的文库所筛选出来的核酸适体的亲和力、筛选效率、稳定性和功能性得到显著提高,在诊断和治疗研究中具有广泛的用途[69].
需要注意的是,并不是任意化学修饰后的核苷酸都可以用于SELEX文库的构建,重要的先决条件是修饰后的核苷酸必须与SELEX过程中使用的聚合酶兼容.通过对聚合酶结构的深入研究发现,文库中采用的化学修饰核苷酸必须保留聚合酶活性位点,以便被聚合酶识别和掺入[70].近年来,研究人员已经开发出了不同聚合酶变异体[71,72],这些变异体可以识别并掺入到非天然核苷酸结构中,与天然聚合酶相比,它们能够以更高的效率掺入到修饰后的核苷酸中,但是效率和保真率依然需要进一步探索[73].
Fig.9 CuAAC functionalization of EdU⁃containing DNA molecules with azides(A),schematic representation of the library design(B)and schematic representation of the Click⁃SELEX process(C)[66]
近年来,数据挖掘和机器学习等手段越来越多地被引入到化学领域中,辅助解释“隐藏”在数据背面的内在联系或机制[74~76].单链核酸适体通常是从大型序列文库中筛选得到,但文库中核酸适体候选物的容量及合成它们的化学方法限制了所有筛选方法的实际潜能.因为实际DNA固相合成技术、PCR扩增技术和高通量测序技术的局限性使得文库的库容量通常限制在1015~1018条[77],导致这些核酸文库实际上只限于理论序列空间的小部分,甚至高质量的核酸适体序列在文库中可能很少见[78].因此,研究者开始关注机器学习辅助构建文库,使用计算机强大的搜索功能可以更有效地搜索文库空间,对序列进行前期评估,可以显著提高文库的智能性,减少低质量的序列数量,扩展文库的有效空间,以筛选更高性能的核酸适体[79].如Chushak和Stone等[80]使用计算机对接预测文库中的核酸序列的二级结构,以达到过滤起始文库的目的.
本文重点关注近期Google研究团队[81]报道的机器学习指导核酸适体的发现和改造工作,该团队开发并验证了机器学习(Machine Learning,ML)指导的粒子展示方法(ML-guided Particle Display methodology,MLPD).该方法结合了先进的实验和计算方法来获得高亲和性ssDNA核酸适体,采用传统的合成文库来产生机器学习模型的数据[图10(A)],使用粒子展示基于靶标浓度和库中序列的荧光强度来定量库中每一个序列的相对亲和力[图10(B)].通过改变靶标浓度以控制筛选严格程度,粒子展示技术可以在不同亲和力阈值下,将库中序列划分成核酸适体阳性池和阴性池.每一种序列池通过Illumina公司开发的下一代测序技术(Next Generation Sequencing,NGS)进行测序后作为粒子展示方法的输入信号,全连接和卷积神经网络(Neural Network,NN)模型可以预测亲和力测量结果[图10(C)].随后,作者采用3个高性能模型来创建序列,首先确定机器学习指导突变的起点种子序列,然后对这些种子序列进行5轮迭代突变,选择在模型中每轮表现优异的突变序列[图10(D)],最后通过例子展示输出这些优异序列进行合成和实验验证[图10(E)].理论上,可以重复图10(B)~(D)的过程,直到获得足够的高质量核酸适体候选序列为止.
Fig.10 MLPD overview[81]
在经SELEX技术筛选的核酸适体全长序列中,两端包含有PCR扩增的引物序列.因此,仅有部分序列与靶标存在亲和性,亟需发展有效的方法从中提炼出亲和性更高、特异性更强和序列更短的核酸适体.这就吸引了许多研究者致力于post-SELEX优化,对SELEX获得的核酸适体序列进行改造或化学修饰[82,83].典型的post-SELEX修饰包括核苷酸构件的化学修饰、结构优化和多价组合等方法,可以显著增强核酸适体与靶标的亲和性[84,85].近年来,修饰后的核酸适体在生命科学、生物医学及药学应用中发展迅速,展现了巨大优势[86].
迄今,研究人员已经对SELEX筛选后得到的核酸适体中的核苷酸构件进行了大量的化学修饰以提高核酸适体的亲和力[87~90](图11).目前已报道的化学修饰策略主要包括磷酸盐取代、碱基修饰、核糖修饰、标签修饰和功能基团修饰等.这些修饰方法其实与其它核酸类药物的修饰类似.如Tam等[91]将筛选得到的富含G的18-mer核酸适体进行全硫代核酸修饰后,显著提高了其与靶标的亲和力,且发现修饰后的核酸适体可抑制白细胞表面分化抗原28(CD28)的表达.Lee等[92]将AS1411核酸适体中的碱基修饰上5-(N-苄基羧酰胺)脱氧尿苷,修饰后的核酸适体的亲和力比原适体提高了2.5倍.Mallikaratchy等[93]将淋巴瘤B细胞筛选得到的核酸适体的颈部修饰上锁核酸,能有效提高核酸适体的二级结构的整体稳定性,提升其靶标亲和力.Lin等[94]通过SELEX技术筛选出人中性粒细胞弹性蛋白酶(hNE)的DNA核酸适体,不能有效抑制弹性蛋白酶的活性.当将该核酸适体修饰上四肽后,抑制活性增加了5个数量级,且亲和力提高了近2倍.下文重点对化学修饰构建含有类氨基酸侧链的核苷酸进行介绍.
Fig.11 Functional group aptamer modifications discussed in this review
Fig.12 Overview of nucleobase modifications introduced at the C5 position of dUTP(deoxyuridines triphosphate)or dCTP(deoxycytidine triphosphate)for the synthesis of so⁃called SOMAmers[15]
结合核酸和氨基酸的最佳特性,采用类氨基酸的侧链可有效对核酸适体引入新的官能团.这些类氨基酸侧链可以直接与靶标特异性结合,或者稳定核酸适体结构,都可以提高核酸适体与靶标的亲和力.Gold等[95]通过用苄基(Bn-)、萘基(Nap-)、色胺基(Trp-)或异丁基衍生物(iBu)修饰脱氧尿苷三磷酸(dUTP)的5号碳(C5)位(图12),成功地将核酸的构象灵活性与蛋白质的功能多样性结合起来.这些类氨基酸修饰后的核酸适体被命名为“慢速解离速率修饰的核酸适体”(SOMAmers),它们可以与蛋白质的疏水口袋之间形成额外的疏水相互作用[96],大大增强了核酸适体与蛋白质的结合亲和力[67,95].Gawande等[68]和Veedu等[97]在dUTP和脱氧胞苷三磷酸(dCTP)这2个嘧啶碱基的C5位置进行萘基、络氨酸和苏氨酸等几种官能团的组合修饰,进一步开发了下一代“SOMAmers”.结果表明,对核酸序列进行单修饰或双修饰疏水官能团均能提高核酸适体与靶蛋白的结合性能,Kd值可达到pmol/L级别,使得修饰后的SOMAmers成为生物医学检测诊断应用中的理想分子识别工具,适用性和市场潜力巨大.SOMAmers具有2个关键优点:(1)高效识别蛋白质靶标和与互补核酸链杂交的双重能力;(2)变性后可重新折叠,再次识别靶标.2000年,Gold创立的SomaLogic公司致力于开发突破性蛋白质组学分析技术,并应用于生物标记物的发现、诊断试剂和药物的开发.该公司在创立初期就开始开发SOMAmer技术,基于此技术开发的SOMAscan Assay平台首次实现了蛋白质的大规模检测,检测广度可达5000种蛋白质,检测深度低至微摩尔至飞摩尔的动态范围,涵盖高丰度和低丰度蛋白.该平台也用越来越多的研究案例证明修饰后的核酸适体可替代抗体检测蛋白质生物标志物,是抗体检测的强大替代方案.因此,SOMAscan Assay平台可与基于抗体检测的酶联免疫吸附测定(ELISA)相媲美,非常适合研究与疾病相关的蛋白质组[98].
Fig.13 Terminal fixation restricting the flexibility of the original aptamer(A),schematic presentation of terminal fixation(B),scheme of the ITC(C),scheme of the tetrahedron⁃assisted triple helix⁃aptamer nanostructure(D)and schematic illustration of the developed electrochemical aptasensor(E)[99]
核酸适体的亲和性依赖于其正确的折叠,但核酸适体骨架的过度灵活通常会导致其在复杂环境中的结合能力减弱,因此需要设计更稳定、结构更明确的核酸适体.Wang等[99]提出了“通过锁定核酸适配体末端提高亲和力”的设想(图13),通过巧妙的分子设计,使用DNA三螺旋结构锁定核酸适体的两端,使其固定在图2所示的折叠状态(Ⅱ),从而提高核酸适体与靶标的亲和力.作者在原核酸适体的2个末端均通过化学合成引入2个含CT的嘧啶延长序列A,加入1个含GA的嘌呤序列B后,根据Watson-Crick碱基互补配对,序列A和B杂交形成具有高稳定性和特异性的三螺旋结构,可固定核酸适体的末端和限制其灵活性,而不干扰核酸适体与目标结合时的构象折叠.经计算,三螺旋核酸适体的Kd值为174 nmol/L,比原适体(Kd=1.15μmol/L)的亲和性提高了10倍.作者在此基础上设计了一种核酸四面体辅助三螺旋末端锁定的核酸适体-电化学传感器,该方法灵敏度高、选择性好.该研究构建了一种简便且适用性广的方法来提高核酸适体的亲和力,为核酸适体的实际应用打下了坚实的基础,未来有望在食品、医药、材料、分子诊断等领域中发挥作用.
另外,通过SELEX技术筛选的核酸适体包含引物序列和随机序列,长达70~130个碱基(Nucleo‐tide,nt),其中随机序列多在40~80 nt.许多SELEX筛选后的全长核酸适体序列存在冗余碱基序列,引物区未与随机区产生碱基配对,甚至影响全长核酸适体序列与靶标的亲和力[100,101].这些初级核酸适体不适合直接应用到临床或实验室研究,需对其进行结构剪裁,以得到既保持结合活性,又长度合适的核酸适体[102~107].如Hani等[108]将荧光素和猝灭剂标记的核酸适体互补的寡核苷酸序列与截短的核酸适体杂交以形成双链体结构,构建了截短的孕激素核酸适体用于荧光法检测孕酮.与原核酸适体相比,截短的序列显示出较高的结合亲和力,Kd值(2.1 nmol/L)降低了16倍.Zhang等[109]通过合理截短63-nt的双酚A核酸适体[110],获得了与双酚A特异结合的38-nt和12-nt核酸适体,Kd值分别为13.17 nmol/L和27.05 nmol/L.比原核酸适体38-nt和12-nt核酸适体对双酚A具有更高的结合亲和力.
上述的大多数方法本质是通过优化核酸适体与靶标的分子间相互作用来增加核酸适体的亲和力.也可以着眼于亲和力概念本身,通常用解离常数Kd值来表示亲和力强弱,Kd值越小表示核酸适体与靶标解离的可能性越小,即亲和力越强.当1个分子包含2个或多个相同的结合位点时,即使所有位点的亲和力保持不变,但与仅包含1个结合位点的分子相比,结合力也可以得到提高,这就是多价效应[111].据报道,核酸适体的多价效应是提高单一核酸适体与靶标亲和力的有效途径之一[112~116].如Tan等受到酶的环状结构启发(图14),将3个靶向癌细胞的核酸适体(Sgc8[54],TD05[117]和XQ-2d[118])构建成环状闭合二价核酸适体(cb-sgc8,cb-TDO5和cb-XQ-2d)[119].作者系统研究了此环状二价核酸适体的热稳定性、核酸酶抗性、结合亲和力和体内活性,并与它们的原核酸适体进行了比较.结果表明,cb-sgc8与靶细胞结合的平衡解离常数Kd值为(0.30±0.06)nmol/L,比sgc8原核酸适体的解离常数[Kd=(0.86±0.21)nmol/L]降低2倍.cb-TD05和cb-XQ-2d的稳定性测试结果表明,环状闭合二价核酸适体可明显改善其在核酸酶和血清中的稳定性,具有更好的亲和力以及活体内长循环时间.Tan等[120]进一步将核酸适体组装到DNA树枝状纳米载体的分支上,再共价交联上腺相关病毒(Adeno-Associated Virus type 2,AAV2),实现了增强型靶向AAV2介导的基因转导.由于DNA树枝状的多价效应,可以有效提高核酸适体与靶细胞的结合能力.这种多价核酸适体修饰策略拓宽了AAV2载体在靶向基因转导和基因治疗领域的应用范围.
Fig.14 Schematic presentation of circular bivalent aptamers for in vivo imaging[119]
近年来,基于血液等体液中循环肿瘤细胞(Circulating tumor cell,CTC)的液体活检技术是当前恶性肿瘤诊断领域的前沿研究.基于癌细胞筛选的核酸适体构建多价核酸适体结合纳米技术已被广泛用于细胞捕获,可显著增强核酸适体捕获靶细胞的能力[121~123].Yang等[124]提出了基于流体力学分离与仿生多价识别的微流控芯片技术,获得了多尺度协同捕获富集CTC的新策略.作者构建的仿生微流控芯片由上万个修饰有特异性捕获CTC的核酸适体探针的微柱构成.每个微柱表面布满纳米金颗粒,每个纳米金颗粒表面修饰上百条核酸适体序列.这些多价核酸适体可以像章鱼的触手一样协同作用,捕获效率比单价核酸适体提高了3倍,实现了CTC的高效富集.该工作在肿瘤分期诊断、动态监测、疗效评估、药物开发和预后监测等领域具有广阔的应用前景.
多价核酸适体能增强与靶标的亲和力可从以下3方面进行解释:首先,多价核酸适体很容易获得核酸适体与靶标结合的有效局部浓度,该浓度高于含有等量单价核酸适体的等效溶液浓度;其次,从统计学的角度来看,较高的局部核酸适体浓度增加了核酸适体与靶标解离后重新结合靶标的机会;第三,螯合效应使多价核酸适体与靶标之间能够进行多种结合作用,如果要解离,所有结合作用必须同时被破坏.与独立作用的总和相比,多价核酸适体可实现更强的稳定性和更高的亲和力.
本文详细总结了pre-SELEX和post-SELEX化学修饰提高核酸适体与靶标结合亲和力的方法以及部分应用.尽管基础研究已证明核酸适体可媲美抗体,在疾病诊疗中同样具有巨大价值和潜力,但仍不能满足临床应用的要求.目前对核酸适体的临床研究仍处于起步阶段,具体体现在以下方面:(1)用于丰富筛选文库的人工扩展碱基种类有限,固相合成技术有待提高,复制过程中的聚合酶的保真度和深度测序技术亟需进化;(2)SELEX技术有待进步,应使其更简单、更强大和更可预测;(3)所研究的SELEX后化学修饰的核酸适体的数量非常少,且缺乏大量的临床试验.目前,核酸适体的分析应用大部分停留在方法学研究阶段,实际应用还远不及抗体普及;(4)缺乏商业投资,大多数核酸适体研究仅在基础研究实验室中进行,不利于核酸适体产品转化.相信在不久的将来,随着SELEX技术以及核酸适体修饰方法的进一步发展,借助合适的工程技术和人类的创造力,核酸适体很可能像抗体一样在各个领域发挥重要作用,成为生物科学中最强大的分子识别工具,解决生命医学中棘手的问题,为保障人类健康做出巨大的贡献.