利用二代测序技术对柔嫩艾美耳球虫T-DNA整合位点的分析及鉴定

2023-07-15 06:54郝振凯汤新明张媛媛谢福杰陈君敏索静霞刘贤勇
中国农业大学学报 2023年8期
关键词:艾美耳球虫外源

郝振凯 汤新明 张媛媛 谢福杰 陈君敏 索静霞 索 勋 刘贤勇*

(1.中国农业大学 动物医学院/兽医公共卫生安全全国重点实验室/ 农业农村部动物流行病学重点实验室,北京 100193; 2.中国农业科学院 北京畜牧兽医研究所,北京 100193; 3.中国农业大学 生物学院, 北京 100193)

柔嫩艾美耳球虫T-DNA整合位点即转基因球虫基因组染色体中转染载体基因插入的位置,目前球虫转基因操作主要以限制性内切酶介导的整合(Restriction enzyme-mediated integration, REMI)方法为主,该方法将外源基因片段随机插入到球虫基因组染色体上,可将柔嫩艾美耳球虫转染效率提高100倍以上[1]。但基于REMI方法获得的转基因球虫其外源基因片段在球虫基因上会随机整合,这使得后期深入开展转基因球虫表型相关研究时必须鉴定T-DNA的整合位点,以排除外源基因插入位点导致的转基因球虫表型的差异。目前常用于获取球虫转基因整合位点信息的方法主要是基于转染载体序列的染色体步移技术(Genome-walking)和质粒拯救(Plasmid rescue)等[2-3],虽然这些方法已经广泛用于插入位点的鉴定和侧翼序列的获取,但这些方法除了操作步骤繁琐、耗时较长等缺点外,还存在不确定、成功率低等问题。因此,建立一种适用于转基因球虫的、高效、简单的T-DNA整合位点的方法就尤为重要。

随着高通量测序技术的不断发展,全基因组重测序技术日渐成熟,测序成本的大幅度下降,测序周期的缩短以及测序数据质量的大幅度提高,使得重测序技术的应用越来越广泛。Siddique等[4]利用二代测序成功地鉴定了转基因玉米的T-DNA插入位点信息,徐纪明等[5]采用二代测序的方法成功地鉴定了3个样品的4个外源基因整个位点侧翼序列信息,因此,基于二代测序鉴定T-DNA插入位点的方法已被证明了其高效性和特异性。近期柔嫩艾美耳球虫染色体级别的精细基因组的发表[6],使得利用二代测序技术鉴定转基因柔嫩艾美耳球虫的外源基因整合位点成为可能。为了探讨利用全基因组重测序技术是否能适用于转基因球虫外源基因的整合位点进行鉴定分析,本研究对实验室构建的一个转基因柔嫩艾美耳球虫虫株EtM2e进行了重测序分析,成功地鉴定了EtM2e虫株T-DNA的插入位点信息。基于二代测序鉴定转基因球虫T-DNA出入位点方法的建立,极大地提高了插入位点侧翼序列分析的准确性和鉴定地成功率,为球虫外源基因整合位点的鉴定提供借鉴。

1 材料与方法

1.1 转基因柔嫩艾美耳球虫EtM2e虫株

转基因柔嫩艾美耳球虫EtM2e表达了H5N1亚型禽流感病毒M2蛋白胞外区段结构域(M2e),是利用REMI随机插入基因组构建的稳定表达外源蛋白的虫株[7]。转染载体如下图1所示,转基因球虫后代经单孢子囊分离获得单克隆群体为EtM2e虫株,经过多次传代培养该虫株卵囊发光率为95%以上,保存于本实验室。

Et.His4,柔嫩艾美耳球虫组蛋白4的5′调控区序列;M2e,H5N1亚型禽流感病毒M2蛋白胞外区段结构域;EYFP,增强型黄色荧光蛋白序列;Et.Actin,柔嫩艾美耳球虫肌动蛋白3′调控区序列;T-Vector Skeleton,T载体骨架包括K+抗性序列和T载体复制相关序列;图片标尺为50 μm,嵌套图标尺为5 μm。 Et.His4, sequence of the 5′ regulatory region of E. tenella histone 4; M2e, structural domain of the extracellular segment of the M2 protein of H5N1 subtype avian influenza virus; EYFP, enhanced yellow fluorescent protein sequence; Et.Actin, sequence of the 3′ regulatory region of E. tenella actin; T-Vector Skeleton, T vector backbone including K+ resistance sequences and T vector replication-related sequences; Scale bar, 50 μm and 5 μm (in embedded images)

1.2 EtM2e虫体获得及基因组DNA提取

取4×105EtM2e孢子化卵囊经口接种14日龄的AA无球虫肉鸡。接种后120 h剖检盲肠,利用0.5%牛磺脱氧胆酸盐溶液和0.25%胰酶消化盲肠黏膜刮取物,离心后收取裂殖子。

利用CTAB法提取裂殖子的基因组DNA。取65 ℃预热CTAB提取液和蛋白酶K重悬裂殖子,颠倒混匀,60 ℃孵育2 h;37 ℃加入RNase,孵育30 min;加入等体积的酚:氯仿:异戊醇(25∶24∶1),轻柔混匀,12 000 r/min室温离心10 min,转移上清后加入等体积的氯仿:异戊醇(24∶1),颠倒混匀,12 000 r/min室温离心5 min;取上清,加入1~2倍体积的在-20 ℃预冷的异丙醇,轻柔混匀,-20 ℃静置30 min,12 000 r/min离心15 min;沉淀用75%乙醇和0.2 mol/L 醋酸钠洗涤,12 000 r/min室温离心10 min,重复1次;加入适量的水溶解沉淀,测定浓度,保存于-20 ℃备用。

使用0.8%的琼脂糖凝胶电泳检测DNA的纯度和完整性,并用Qubit4.0测定DNA浓度。根据转基因载体中M2e和EYFP序列设计引物鉴定转染载体,M2e-F: CGCCTACCAGAAACGAATG; EYFP-R: GTTCACCTTGATGCCGTTC,引物由北京瑞博兴科生物技术有限公司合成。

1.3 EtM2e虫体基因组重测序

样品基因组DNA检测合格后,用机械打断的方法(超声波)将DNA片段化,然后对片段化的DNA进行片段纯化、末端修复、3′端加A、连接测序接头,再用琼脂糖凝胶电泳进行片段大小选择,进行PCR扩增形成测序文库。建好的文库先进行文库质检,质检合格的文库用Illumina NovaSeq平台进行双端测序,测序读长150 bp。为保证后续分析的准确,测序深度100×,得到至少6G的下机数据,并保证数据质量标准Q20>90%,全基因组重测序委托上海派森诺生物科技有限公司完成。

1.4 数据分析

利用Fastp过滤下机数据(Raw data)[8]。过滤指标包括:1)去除接头序列,2)设置低质量值为20(Q20),reads序列中低质量碱基含量大于30%则过滤掉,3)去除长度小于50的reads。

利用Bowtie2软件将质控后的测序数据与柔嫩艾美耳球虫参考基因组比对(https:∥www.ncbi.nlm.nih.gov/assembly/GCA_905310635.1)[9],根据覆盖深度和覆盖度评估二代测序的随机性;而后将测序数据与转基因载体序列进行比对分析,去除未比到T-DNA的reads,获得嵌合体reads(reads的一端比对到T-DNA上,另一端比对到柔嫩参考基因组上的reads)。根据嵌合体reads的序列,在ToxoDB上进行序列比对,得到该T-DNA在基因组上的具体位置,即为可能的插入位点。

利用mosdepth软件分析载体序列与球虫同源区段即5′调控区和3′调控区序列[10],以及载体特有序列的测序深度并以此估计载体拷贝数。

1.5 T-DNA整合位点的PCR验证

根据数据分析得到的T-DNA插入位点的基因组序列信息,以及测序的转基因载体序列信息,使用Primer 3 PLUS设计软件,使引物一端在参考基因组上,另一端在T-DNA上。5′端验证引物,F1: ATGCCATTTCTTTTGCTGCT, R1: CATTCGTTTCTGGTAGGCG; 3′端验证引物,F2: ATGTTACCTTTGTCACCGTCAGT,R2: GAGTAGCAGCTCTTCTTTGCAGT。对EtM2e基因组DNA进行PCR扩增验证,确认T-DNA的插入位点。引物由北京瑞博兴科生物技术有限公司合成。

2 结果与分析

2.1 转基因EtM2e虫株的鉴定及基因组提取

琼脂糖凝胶电泳结果显示,CTAB法提取的球虫裂殖子基因组DNA结构较为完整,未发生降解,总体符合重测序要求(图2);以提取的DNA为模板,通过转染载体鉴定引物PCR扩增条带大小为542 bp(图2),经Sanger测序验证扩增序列与转染载体序列一致。

(a)CTAB法提取基因组的凝胶电泳,M,DNA标准DL 15 000;(b)M2e序列的PCR扩增,M,DNA标准DL 2 000 Plus。 (b) DNA integrity test by CTAB. M, DL 15 000 DNA marker; (b) PCR amplification of M2e, M, DL 2 000 Plus DNA marker.

2.2 T-DNA插入位点分析

采用Illumina测序平台双端2×150 bp测序,下机数据共7.5 Gb,Q20为94.7%,Q30为87.6%;经Fastp过滤后,得到数据7.2 Gb,Q20为96.1%,Q30为89.2%,得到比对reads数为23 992 361 ds,平均测序深度为80×,reads全基因覆盖结果如下图3所示,可以看到在整个染色体上分布较为均匀,测序的随机性比较好,因此该数据可以进行后续分析。

HG994961.1~HG994975.1,柔嫩艾美耳球虫细胞核基因组染色体编号;HG994976.1,线粒体基因组编号;HG994977.1,顶质体基因组编号。 HG994961.1-HG994975.1, E. tenella nuclear genome chromosome number; HG994976.1, mitochondrial genome number; HG994977.1, apicoplast genome number.

使用Bowtie2软件对质控后的数据比对至T-DNA载体序列得到比对reads数为3 106和3 036,平均测序深度为140×,通过嵌合体reads序列分析得到1个候选T-DNA插入位点(图4),位于HG994969.1: 2 704 213~2 705 255处。使用mosdepth软件分析载体各个元件的平均测序深度(图5),结果显示,T载体骨架特有序列—卡那抗性基因的平均测序深度为67×,T-DNA特有序列—EYFP基因的平均测序深度为85×,而T-DNA与球虫同源序列His4基因的5′调控区序列的平均测序深度为154×,Actin基因的3′调控区序列的平均测序深度为164×,这表明T-DNA中与载体同源序列的测序深度大约是载体特有序列的2倍,进一步说明了该载体是以单拷贝的形式整合到球虫基因组上。

大写字母为载体序列(绿色),小写字母为插入位点序列(灰色)。 (a) 3′端嵌合体reads序列;(b)5′端嵌合体reads序列。 Upper case letters are vector sequences (green), lower case letters are insertion site sequences (grey). (a) Sequences of 3′ chimeric reads; (b) Sequences of 5′ chimeric reads.

图5 转染载体各元件测序深度

2.3 T-DNA插入位点PCR验证

为确认转基因虫株的T-DNA插入位点,分别设计引物分别对载体两端序列进行验证,凝胶电泳结果显示,以转基因虫株DNA为模板,通过两对引物均能扩增出目标大小的条带,5′端扩增条带1 714 bp;3′端扩增条带975 bp,而野生虫株DNA没有扩增条带(图6),而后利用Sanger测序也验证了PCR扩增序列与目标序列的一致性。

M, DNA标准DL 2 000 Plus;+,M2e虫株DNA;-,野生虫株DNA。 M, DL 2 000 Plus DNA marker; +, DNA of M2e strain; -, DNA of wild type strain.

3 讨 论

本研究利用二代测序技术分析并鉴定了EtM2e虫株的T-DNA插入基因组HG994969.1: 2 704 213~2 705 255,同时通过对T-DNA测序深度分析发现该载体是以单拷贝的形式插入基因组。

T-DNA插入位点的鉴定在球虫转基因研究方面有着非常重要的意义。目前鸡球虫转基因操作主要以基于限制性内切酶介导的整合方法实现将外源载体基因片段插入基因组,这种基因整合方法的局限性首先会导致T-DNA的随机整合,这也将进一步造成转基因虫株群体中个体球虫表达量存在显著差异以及由于整合位点的不稳定导致T-DNA的丢失;其次,由于限制性内切酶对基因组切割活性的限制,导致存在未整合到基因组的游离型T-DNA,这类T-DNA会严重影响后续转基因球虫的筛选。

当前获取球虫T-DNA插入位点的常用方法是Genome-walking[3],该方法是基于热不对称PCR,利用载体的特异性引物在高温时的特异性扩增以及随机引物的低温扩增,经过连续3轮扩增获取载体侧翼未知序列。但球虫转染载体的两端通常是球虫基因的启动子区和polyA尾区,这使得在实际操作中通常会有球虫基因的干扰;同时由于球虫的传代过程中是以群体形式存在,且球虫内生性发育阶段较为复杂,使得载体序列可能存在被虫体修复而导致部分缺失的可能性,因此使用该方法时,大多数转基因虫株并不能得到理想的结果。质粒拯救也是一种可用于获取T-DNA插入位点侧翼序列的方法,该方法利用T-DNA上不存在的限制性内切酶切割基因组,得到DNA片段中包括两端带有基因组DNA的转染载体,再通过自身环化获得环形DNA,转化大肠杆菌得到带有基因组片段的转染质粒[1]。这种方法的局限性在于转染载体中必须含有T载体的骨架部分用于环化后质粒的复制和抗性基因的表达,这势必会增加球虫转染载体的碱基序列长度,也会在一定程度上降低转染载体整合到基因组上的效率;同时,基因组提取的完整性、质粒环化效率等多种因素制该方法的成功率,因此在转基因球虫研究中很少采用质粒拯救的方法获取T-DNA侧翼序列。这些问题在一定程度上制约了基于基因过表达技术的球虫功能基因研究以及球虫活载体疫苗研发。因此,鉴定T-DNA是否整合到基因组以及整合位点信息对开展转基因球虫后续表型研究尤为重要。

近期,马雪萌等[11]建立了一种基于高通量测序和交错式热不对称PCR(TAIL-PCR)相结合的鉴定T-DNA插入位点的方法,该方法是对一轮TAIL-PCR产物进行高通量测序分析,成功鉴定了4个转基因株系的T-DNA整合位点,这种方法也可以尝试应用在转基因球虫外源基因整合位点的鉴定。本研究中以T-DNA序列为模板利用Bowtie2 --local模式进行比对,该模式下对reads进行局部比对使得reads两端不匹配模板的序列信息得以保留,从而便于利用嵌合体reads获取载体的整合位点侧翼序列,分析过程不需要使用全基因组序列信息分析插入位点,减少了分析比对的工作量,缩短了分析流程。本研究以T-DNA与宿主同源序列的测序深度和载体特有序列的测序深度估计T-DNA的拷贝数,理想状态下T-DNA为单拷贝时,载体与球虫同源序列的测序深度为载体特有序列测序深度的2倍,但实际结果表明,这个比例可能存在一定范围的浮动,同时载体ORI区段测序深度异常高,分析发现该区段与球虫宿主存在一定的同源性引起的。因此,使用这种估计拷贝数方法的前提是确保载体特有序列与球虫基因组没有同源区段。

目前基于CRISPR/Cas9的定点整合技术成为主流的实现外源基因表达的转基因方法,与随机整合相比定点整合转染具有整合位点专一以及T-DNA拷贝数明确等优势[12]。Zambrowicz等[13]发现一个被命名为 ROSAβgeo26 的随机转基因小鼠品系在所有组织中均能检测到高水平的β半乳糖苷酶表达,经过鉴定发现外源基因整合在了第6号染色体,Rosa26已被广泛用于基因安全敲入并能保证转入基因的正常稳定表达,基因组安全港(Genomic safe harbor, GSH)的概念也由此普及。此后陆续发现了AAVS1、H11、Col1a1和TIGRE等位点作为定点整合的基因组安全港[14-17]。球虫活载体疫苗具有广阔的应用前景[18],为实现外源优势抗原持续表达,需确保转染载体在球虫基因组上稳定存在,为此筛选球虫基因组的基因安全港成为球虫活载体疫苗研发的先决条件之一。本研究发现插入位点位于ETH2_0942600和ETH2_0942700的3′UTR区域内,没有影响编码的完整性,因此该整合位点可以作为柔嫩艾美耳球虫转基因定向插入的靶点,具有作为球虫基因组安全港的潜力。

4 结 论

本研究提供了一种简单、高效的基于二代测序获取球虫T-DNA整合位点的方法,并鉴定分析了EtM2e虫株T-DNA的插入位点,该位点位于基因间区,可作为一个潜在的柔嫩艾美耳球虫基因安全港为后续转基因研究提供一个定点整合位点利用该方法可以快速鉴定T-DNA整合位点和估计拷贝数,为球虫外源基因整合位点的鉴定提供借鉴。

猜你喜欢
艾美耳球虫外源
渝西地区兔球虫病流行情况调查及虫种鉴定
具有外源输入的船舶横摇运动NARX神经网络预测
肉鸡球虫疾病药物防治效果的分析
球虫感染鸡群有哪三种表现
外源铅胁迫对青稞生长及铅积累的影响
外源钙对干旱胁迫下火棘种子萌发的影响
外源添加皂苷对斑玉蕈生长发育的影响
鸡和缓艾美耳球虫早熟虫株选育及其生物学特性研究
3种消毒药对猪球虫的体外抑杀效果观察
毒害与巨型及毒害与柔嫩艾美耳球虫间在免疫方面的相互影响