张永红,李岩异 ,张卫婷
华北制药金坦生物技术股份有限公司,石家庄 050035
病毒基因组整合到宿主基因组中形成原病毒,是所有逆转录病毒复制的重要步骤。然而,不同类型的逆转录病毒整合位点的分布不同。例如,包括人类免疫缺陷病毒1 亚型(human immunodeficiency virus type 1,HIV-1)在内的灵长类慢病毒优先整合到基因密集区域处表达基因;嵌合抗原受体T 细胞免疫疗法(chimeric antigen receptor T-cell immunotherapy,CAR-T)作为基因编辑性细胞治疗方法,采用慢病毒整合性载体,将外源基因插入并整合到细胞基因组中[1]。某些位置的插入,可能会诱导原癌基因的激活、抑癌基因的失活、基因融合等,引起成瘤风险。在持续的细胞治疗过程中,这种潜在的成瘤性,往往具有明显的滞后性且很难预测。因此,CAR-T 治疗需要评估潜在的插入突变风险和致癌风险[2]。
载体整合位点检测已成为CAR-T 治疗方法临床试验的安全性评估要求。2020年9月国家药品监督管理局药品审评中心(Center for Drug Evaluation,CDE)发布的《细胞治疗产品申请临床试验药学研究和申报资料的考虑要点》中关于“生产工艺开发的技术要求”及“质量研究和质量控制中的安全性研究”部分要求:提供目的基因在染色体中的整合情况及对细胞恶性转化(成瘤性和致瘤性)进行安全性研究和内容评估。2020 年2 月CDE 发布的《免疫细胞治疗产品临床试验技术指导原则(试行)》中规定:探索性临床试验的安全性和耐受性要考虑“外源基因随机整合到细胞基因组形成插入突变,导致成瘤性和恶性转化等”。对确证性临床试验的疗效和安全性要求“继续监测安全性风险,分析重要的已知和潜在的风险信息,包括迟发性不良事件(如致瘤性)的发生率、严重性和危险因素等,并有必要采取措施使风险最小化”。2021 年2 月CDE 发布的《基因修饰细胞治疗产品非临床研究与评价技术指导原则(试行)》则明确将“插入突变风险评估”作为非临床安全性研究的内容,并详细规定了关键风险因素的评估要点。由此可见,慢病毒载体整合位点检测已经成为细胞治疗产品新药临床试验申请(investigational new drug,IND)及临床试验安全性评估的必检内容。
由于基因重组技术带来的潜在危害,科学家利用现代基因测序技术,对外源基因整合位点进行分析,并用于生物安全性评价。
慢病毒进入易感靶细胞后,逆转录酶将病毒核糖核酸(ribonucleic acid,RNA)基因组的两个正义拷贝复制成线性双链DNA 分子,每个分子都包含病毒长末端重复序列(long terminal repeat,LTR)。病毒整合酶完成病毒DNA(viral DNA,vDNA)整合,包括 HIV-1 在内的慢病毒可以有效地感染非分裂靶细胞,而以γ-逆转录病毒莫洛尼鼠白血病病毒为代表的其他类型的逆转录病毒则不能感染[3]。提取受感染细胞原病毒 DNA 和绘制整合位点等技术,经历近40年的发展,已日趋成熟[4]。
通过使用限制性核酸内切酶消化感染细胞病毒基因组DNA(genomic DNA,gDNA)片段,证实病毒基因插入宿主细胞基因组中[5]。由于杂交显现出多个条带,证明整合可以发生在宿主基因组的多个位点。利用消化和电泳分离宿主gDNA 后,使用病毒DNA 探针进行Southern 杂交印迹时,实验分辨率得到进一步增强。多项研究已证实,逆转录病毒可以整合到gDNA 多个位置,但无法判断这种整合是否为随机整合。通过对宿主gDNA 进行分级分离(例如长度或GC 含量),结果显示整合位点倾向分布于富含GC 的gDNA 区域[6]。
DNA 测序技术的广泛应用,对整合位点的序列分析起到了推动作用。研究中主要通过Maxam Gilbert 化学法[7]或双脱氧测序法[8],对使用限制性核酸内切酶消化后的分级gDNA 片段进行测序,从而确定逆转录病毒整合位点的初始序列。这些研究为不同逆转录病毒靶位点重复(targetsite duplications,TSD)的分类奠定了重要基础,并且已知转座会产生位于这些移动遗传元件两侧的短TSD[9],由此首次发现了整合与 DNA 转座有关。聚合酶链式反应(polymerase chain reaction,PCR)的进一步发展,为逆转录病毒整合位点选择的新兴领域提供了技术支持,且该技术大大简化了对特定vDNA-gDNA 的研究。
反向 PCR[10]是整合位点测序中早期应用的一种技术,用于vDNA-gDNA测序之前使用与已知序列(例如病毒 LTR)互补的外向引物扩增自连接的gDNA 片段。这种方法早期用于细胞与猿猴空泡病毒40(simian vacuolating virus 40,SV40)多瘤病毒共感染细胞来提供具有特征性转座子DNA(transferred DNA,tDNA)底物的鼠白血病病毒(moloney murine leukemia virus,Mo-MLV),SV40 多瘤病毒作为细胞核中的未整合附加体达到高拷贝数[11]。SV40 特异性引物可与 Mo-MLV LTR 引物串联使用,以放大出现在该过量tDNA源中的整合位点。此外,病毒共感染的替代方案涉及设计引物,当整合恰好发生在范围内时,会伪随机启动gDNA 序列[12],这种方法是藤黄节杆菌(Arthrobacter luteus,Alu)分泌型核酸限制性内切酶识别重复序列实时 PCR 检测的基础,用于确定细胞培养物和患者样本中 HIV-1的整合水平。
随着连接介导的 PCR 或配体介导的PCR(ligationr-mediated,LM-PCR)的发展,单个整合位点的回收效率取得了重大突破[13]。在这种方法中,gDNA 被限制酶消化,将包含“粘性”末端的寡核苷酸盒(也称为接头)连接到所有消化片段上,然后使用与病毒 LTR 和接头序列互补的引物完成整合位点的 PCR 扩增。随着人类、小鼠和其他宿主基因组参考序列的完成,这种文库构建和 DNA测序的结合可以用于对不同类型逆转录病毒的整合位点分布的研究。到目前为止,载体-基因组连接的下一代测序(next generation sequencing,NGS)技术允许对体内和体外的整合库进行复杂研究。例如,研究人员探索了使用 Illumina MiSeq个人测序仪平台对线性扩增介导的 PCR(restrictive linear amplification mediated PCR,LAM-PCR)和非限制性线性扩增介导的 PCR(non restrictive linear amplification mediated PCR,nrLAM-PCR)扩增的载体整合位点(integration site,IS)进行测序。其中,基于MiSeq 的高质量 IS 序列检索是通过引入双条形码策略来实现的,与传统使用的单条形码协议相比,该策略大大减少了IS 序列冲突的频率。
LM-PCR 扩增与强大的NGS 平台的结合,例如454 Life Sciences 的焦磷酸测序和 Illumina 基于 DNA 簇的测序,使整合位点的检测数量猛增,由使用NGS 之前的数百个到最终的数十万和数百万[14]。用超声法代替限制性核酸内切酶消化gDNA 片段的方法[15],实现了对独特 gDNA 来源的相同逆转录病毒整合位点的监测。由于在超声处理中被研究群体的不同细胞之间存在完全相同的整合位点,以相对序列独立的方式切割 gDNA,可以识别具有相同整合位点的多个序列读数上的独特接头连接点[16]。
NGS 检测慢病毒整合的方法受短读长和PCR偏差的限制,导致产量低[17]。Van Haasteren等[18]发现了一个使用免扩增技术对IS进行测序的新整合位点测序(amplification-free integration site sequencing,AFIS-Seq)方法。AFIS-Seq 是基于无扩增、Cas9 介导的高分子量染色体 DNA 富集,适用于Nanopore MinION测序。这种易于使用且低成本的方法可生成长读长,从而在短时间内能够确定IS。有研究通过在多种细胞模型中绘制慢病毒载体的IS 来进行概念验证,报告信号富集高达 1 600 倍。该方法还可以进一步扩展到 Cas9 介导的基因整合测序和 IS体内分析。AFIS测序使用长读长测序可以提供更有信心的IS 分析,促使临床前慢病毒载体基因疗法的安全性通过评估[18]。
为了确定宿主基因组中的病毒整合位点,已经开发了几种基于PCR 的方法。然而,基于PCR的方法灵敏度高度依赖于引物序列,因此需要针对单个目标位点进行引物设计优化。为了解决这个问题,Kiml 等[19]开发了一种用于对病毒插入位点进行全基因组定位的方法——增强型病毒整合位点测序(CRISPR-enhanced viral integration site sequencing,CReVIS-seq)。该方法基于以下连续步骤:基因组DNA 片段化,体外环化,以CRISPR指导RNA(single guide RNA,sgRNA)特异性方式切割靶序列,以无差别线性化DNA 片段进行高通量测序以及通过序列分析鉴定病毒插入位点。经过设计,CReVIS-seq 不受富集步骤中通过使用位点特异性引物的PCR 扩增引入的偏差的影响。此外,研究发现使用不同的sgRNA 集合的多重CReVIS-seq,可以同时识别单细胞克隆和异源细胞群体中的多个靶位点和结构变异[19]。
对基因治疗数据中的病毒整合位点进行分析和监测,对于评估基因治疗的安全性和有效性至关重要。基因治疗中病毒载体分布的整合位点分析和克隆性分析是监测细胞动态、评估恶性转化风险和建立载体生物安全的关键因素。Afzal等[20]开发了基因整合位点(genome integration site,GENE-IS,https://github.com/G100DKFZ/gene-is)分析工具用于高效、准确地检测基因治疗数据中基于NGS的病毒载体整合位点。它是第一个具有双重分析模式的工具,可以对基于 PCR 方法,如LAM-PCR 和靶向测序(如agilent sure select)技术生成的数据进行IS分析[3]。GENE-IS是一种可扩展、强大、精确且可靠的工具,用于大规模临床前和临床数据分析,为用户提供灵活性的分析,可配置更多的参数[20]。
Peters 等[21]开发了基于网络的生物信息学工具,可以促进逆转录病毒整合位点(retroviral integration site,RIS)的识别,但不足以以高通量方法快速绘制和表征 RIS。根据细胞群内插入位点的频率以及运行的样本数量,单次测序生成的结果中单个RIS 的覆盖范围可能为 50~5 000 倍。SeqMap 2.0 提供了一种可扩展的序列匹配、聚类和比对的方法(网址为http://seqmap.compbio.iupui.edu/)。
SeqMap 2.0 工作流程分为3 个阶段:①序列处理,包括载体特征的识别和屏蔽以及将序列读数分配到多重标识符(multiple identifiers,MID)/条形码特定组中;②序列聚类和比对;③数据可视化和存储以供进一步分析[21]。
病毒载体的表征和分析是开发安全基因治疗产品、阐明载体潜在的遗传毒性和免疫原性作用,并建立其安全性的重要组成部分。VSeq Toolkit(https://github.com/CompMeth/VSeq-Toolkit)是利用Perl 和Bash 编程语言开发的[22],为病毒基因治疗数据提供了不同的分析模式:第1 种模式确定不期望的已知污染物及其在病毒制剂或其他测序数据中的频率;第2 种模式用于分析载体内融合位点;第3 种模式用于揭示病毒-宿主融合事件分布。工具包的分析模式可以独立执行,也可以一起执行,并允许同时分析多种病毒载体。它被设计和评估用于分析短读高通量测序数据,包括全基因组或靶向测序。
整合病毒载体成为宿主基因组的一部分,使其成为临床基因治疗的关键因素。然而,病毒整合有相关风险,例如致癌基因的无意激活可能导致癌症。因此,分析逆转录病毒载体的整合位点是开发更安全的治疗载体的关键步骤[23]。VIS Mapper 是一个载体整合分析网站[24](http://vismapper.babelomics.org),用于分析逆转录病毒载体整合的NGS测序数据。VIS Mapper使用了新的映射算法,比以前的可用程序明显更快,并且提供了一个有用的图形界面来分析在基因组背景下发现的整合位点[24]。
感染的病毒整合到人类基因组中,是各种人类恶性肿瘤的重要风险因素。Virus Clip(https://github.com/dwhho/Virus-Clip)是一种检测病毒片段的病毒整合位点工具。该工具利用从片段测序读取中提取的信息来识别整合事件中人类和病毒断点的确切位置。通过与病毒参考基因组的初始读取比对及简化程序,Virus Clip 为病毒整合位点检测提供了一个简单、快速和内存高效的解决方案[25]。此外,它还可以自动注释与相应的受影响人类基因的整合事件。通过全转录组测序数据验证病毒片段,并验证其具有非常良好的灵敏度和特异性。与现有的工具相比,检测性能显著提高。此外,它还具有广泛的功能,包括全基因组测序、全转录组测序和靶向测序[25]。
分析细胞基因组中新整合的DNA 位点十分重要,但分析和可视化这些数据的方法目前仍处于开发阶段。Sherman 等[26]开发了用于数据分析和可视化的工具[26]——双端测序,其不仅可以推断转导细胞的数量以及目标基因组中整合位点的分布,还可以将整合位点的分布与基因组特征进行比较。此外,为了总结人类基因治疗样本的整合位点数据,研究者开发了一种可对样本群体结构、纵向动态和癌症相关基因附近的整合频率进行分类的工具[27],该工具可以对治疗严重联合免疫缺陷-X1(severe combined immunodeficiency-X1,SCID-X1)患者进行持续的纵向表征[26]。
CAR-T 细胞疗法在治疗B 细胞恶性肿瘤方面取得了重大进展,但实体瘤治疗方面仍具有重大挑战[28]。CAR-T技术中病毒载体的应用不仅受到监管限制,同时其高昂的成本也阻碍了基因工程概念转化为临床应用的可能。非病毒方法,例如转座子/转座酶和规律成簇的间隔短回文重复序列(clustered regularly interspaced short palindromic repeats,CRISPR)/Cas 系统,提供了CAR-T 细胞的另一种策略,该策略的出现,增加了CAR-T 细胞疗法的可及性和效率[29]。但该策略仍然面临许多挑战,如敲除效率低、转基因表达水平低、整合率低等[30]。mRNA 技术在很大程度上能降低基因重组的风险,随着该技术的发展,未来在基因重组领域,将会受到更广泛的关注和应用[31]。
在CAR-T 细胞治疗中,非病毒递送平台提供了一种有前景的替代方案,以解决病毒递送技术方面的限制。病毒载体具有免疫原性高、有限的插入尺寸和生产成本高等缺点。相比之下,非病毒载体具有更低的细胞毒性和免疫原性[32],同时可以更好地保护外源基因,并提高基因转导效率。非病毒基因递送技术可以分为瞬时基因表达和稳定转基因整合技术。非病毒稳定的基因整合技术可以通过Piggy Bac 或CRISPR/Cas9 系统完成,CRISPR/Cas9 系统通常使用线性化DNA(双链或单链)或环状DNA[31,33]。
慢病毒载体是一种高效递送基因进入靶向细胞的病毒载体。通过慢病毒载体,将遗传物质转导整合到细胞基因组,使宿主细胞获得新功能,修复自身缺陷并刺激某些细胞功能恢复。由于慢病毒载体的潜在风险,加快整合酶缺陷型病毒的开发。整合酶缺陷型慢病毒载体系统(integrase deficient virus vector,IDLV)降低了转基因整合到宿主基因组中的概率。整合酶缺陷病毒载体具有更高的安全特性,利用该特征整合酶缺陷型慢病毒载体更有利于治疗的实施和临床应用的拓宽,特别是在基因治疗、定点基因编辑、细胞治疗重编程等领域。
尽管 IDLV 以某种方式消除了转基因整合到细胞基因组中的现象,但其不良反应仍然困扰着临床应用,例如转导效率低、表达水平低等。经过科学家的努力,IDLV 转导效率较低的问题已在一定程度上得到解决,后续研究将继续克服其他不良现象[34]。鉴于低整合型病毒其致癌整合风险低的特点,IDLV 是现有细胞产品转导过程中病毒载体的最理想替代品。
基因载体整合到宿主的基因组中,表达治疗性转基因药物,在宿主体内实现治疗效果。然而,慢病毒的RNA 基因组首先被逆转录为DNA,然后以看似随机的方式整合到细胞基因组。为了避免慢病毒整合影响细胞功能,当整合发生在癌基因附近或关键基因内时,应在慢病毒感染靶细胞后进行慢病毒整合位点鉴定。所选择的整合位点对转基因的表达和宿主细胞的表型都具有重要的影响。整合位点分析是评估基因治疗载体的生物安全性和转基因细胞在体内克隆追踪命运的关键工具。随着近代生物测序技术的迅猛发展及基因重组技术的广泛应用,基因整合分析将为生物安全提供更多有价值的参考,为降低细胞及基因治疗产品的用药安全保驾护航,慢病毒载体将成为细胞稳定遗传修饰中重要的基因递送载体。