庞贞武,刘鑫,孙雪阳,兰俊,陈德文
SLAF-seq技术在鉴别桉树品种中的应用
庞贞武,刘鑫,孙雪阳,兰俊,陈德文
(广西国有东门林场,广西 扶绥 532108)
本文尝试采用一种简化基因组测序技术(SLAF-seq)对2个尾巨桉无性系品种进行分子鉴定。实验共获得32.69 M reads的测序数据,测序质量值分布检查结果Q30为95.28%,碱基分布检查结果GC含量为40.61%;通过生物信息学分析共开发SLAF标签857 589个。样品间SNP多态性比较结果表明,A1与A2、A3的基因型一致SNP比例分别为35.81%、77.27%,达到区分不同无性系品种的实验设计预期。
尾巨桉;无性系;分子鉴定;SLAF-seq技术
桉树是桃金娘科(Myrtaceae) 桉属() 树种,是重要的短周期工业原料林树种,在热带、亚热带和温带地区广为种植[1],桉树人工林给我国带来了巨大的经济效益、社会效益和生态效益[2]。桉树良种无性系在我国广西、广东、海南等华南地区大面积推广种植,种苗市场需求量大,提供相应种苗的苗圃和组培厂数量很多。因主要推广种植的良种无性系如尾巨桉() DH32-29、DH32-26、DH32-28等桉树基因来源于广西国有东门林场,而一些没有获得使用授权的生产单位为谋取种苗市场利益采取鱼目混珠的手段,以非良种桉树无性系进行种苗生产,这些种苗在苗期的外观上与用良种无性系系生产的种苗差异很小,难以分辨,导致企业维权和相关部门执法困难,进而影响了造林户种植效益和我国造林良种率的提高。因而,探讨在植物遗传物质层面采用分子检测手段进行桉树无性系种苗品种鉴定具有现实的意义。目前的文献报道也有这方面的尝试,如周长品等[3]利用SNaPshot技术对桉树SNP 复合分型检测体系的研究、SILVA-JUNIOR等[4]发掘SNP位点并开发SNP 检测芯片、刘海龙[5-6]等利用 ISSR 标记和ITS序列分析技术进行桉树无性系鉴定、刘果等[7]利用SSR 标记进行桉树树种精准鉴定。SLAF-seq(Specific Locus Amplified Fragment Sequencing)技术是一项简化基因组测序技术,该技术可以用较低的花费实现全基因组范围的标记开发和分型,是目前最热门的标记分型技术之一。本文尝试探讨SLAF-seq技术用于桉树无性系种苗品种鉴定的可行性。
无性系品种分别为尾巨桉DH32-28(东门28)、DH32-29(东门29),实验材料为苗期的新鲜嫩叶,取自广西国有东门林场苗木中心苗圃。
1.2.1 实验设计
分别以A1、A2、A3标记采集的样品作为3个处理,A1为尾巨桉东门28,A2为尾巨桉东门29,A3为尾巨桉东门28(作为对照)。在A1、A2、A3每个处理的样品中,各从5株不同组培苗上取相同数量嫩叶,5株苗的叶片混合在一起。取样后用锡箔纸包裹并标注,立即液氮速冻,保存于液氮中。
1.2.2 DNA提取与检测
采用CTAB法提取DNA。DNA检测样量:200 ~ 500 ng; Marker为λDNA/HindIII(或其他有20 Kb以上条带的DNA Ladder);琼脂糖凝胶浓度:0.8% ~ 1.0%;电泳条件:电压3 ~ 4 V·cm-1,时间40 min。获得的基因组DNA样品浓度≥20 ng·ul-1,样品总量≥2μg(不包括样品检测损耗);样品纯度OD260/280为1.7 ~ 2.2。样品送至专业机构(北京百迈客生物科技有限公司)委托采用SLAF-seq技术进行简化基因组测序。
1.2.3 简化基因组测序主要实验流程
根据选定的最适酶切方案,对检测合格的各样品基因组DNA分别进行酶切实验。对得到的酶切片段(SLAF标签)进行3′端加A处理、连接Dual-index测序接头、PCR 扩增、纯化、混样、切胶选取目的片段,文库质检合格后用Illumina HiSeqTM 进行测序。利用 Dual-index 对测序得到的原始数据进行识别,得到各个样品的酶切片段(reads)。对过滤完接头的测序 reads 进行测序质量和数据量的评估。通过reads间聚类的方法,在待测样品中开发SLAF标签(经过SLAF-seq建库产生的特异酶切片段,一个酶切片段就是一个SLAF标签),寻找在样品间存在多态性的SNP(单核苷酸多态)标签。
本实验样品共获得32.69 M reads测序数据。碱基识别(Base Calling)过程中每个碱基都会得到一个测序质量值,用于评估该碱基的准确性。测序质量值是评估高通量单碱基错误率的重要指标,该值越高对应的碱基测序错误率越低。从表1可知,测序平均Q30达95.15%。
碱基类型分布检查用于检测有无AT、GC 分离现象,而这种现象可能是测序或者建库所带来的,并且会影响后续分析。由于SLAF-seq测序reads为基因组DNA的酶切片段,其碱基分布会受到酶切位点和PCR 扩增的影响,碱基分布会呈现不同程度的波动。表1的数据表明,碱基分布检查平均GC含量为40.07%。
表1 各样品测序数据统计表
说明:1.Q30为测序质量值大于或等于30的碱基所占百分比;2.GC为测序结果中G和C两种碱基所占总碱基的百分比。
经过生物信息学分析,本项目共开发 857 589个SLAF 标签,具体统计见表2。
表2 SLAF 标签统计
SNP的检测主要使用GATK 软件工具包实现,以保证检测得到的SNP的准确性并得到最终的SNP位点集。主要检测过程首先使用GATK进行InDel Realignment,即对存在插入缺失比对结果附近的位点进行局部重新比对,校正由于插入缺失引起的比对结果错误;其次使用GATK和Samtools 进行变异检测,主要包括SNP和InDel;第三根据GATK和 samtools分别得到的变异中将位点一致的部分作为最终的变异位点用于后续分析。具体流程参考GATK官方网站的Best Practice。所有样品的SNP 统计信息见表3。
对3个样品间的多态 SNP 进行两两比较,表4为 A1 分别与A2、A3比较的差异结果。A1与A2的基因型一致的SNP比例为35.81%,A1与A3的基因型一致的SNP比例为77.27%。
表3 样品检测的SNP统计
表4 样品间的SNP多态性
本研究结果表明,A1与样品A3 的基因型一致的SNP占两样品间总SNP比例为77.27%,远高于A1与A2的基因型一致SNP 比例,因而它们是同一个品种的可能性最高,这与实验设计A1为尾巨桉东门28、A2为尾巨桉东门29、A3为尾巨桉东门28(作为对照)的品种设置是一致的。由此可初步推测,通过应用SLAF-seq技术获得尾巨桉不同无性系SNP分子标记的多态性差异从而进行桉树无性系品种鉴定具有一定的可行性和可靠性,且应用该简化测序技术测序费用较低,为相关企业和单位通过遗传分子手段维权提供了便捷且成本相对低廉的途径,因而值得进行更深入广泛的应用性研究。
[1] 祁述雄.中国桉树(第2版)[M].北京:中国林业出版社, 2002.
[2] 杨民胜,谢耀坚,刘杰锋.中国桉树研究三十年: 1981—2010[M].北京:中国林业出版社,2011.
[3] 周长品,翁启杰,甘四明,等.应用SNaPshot 技术对桉树SNP的检测[J].南京林业大学学报(自然科学版), 2018,42(4):83-88.
[4] SILVA-JUNIOR O B,FARIA D A,GRATTAPAGLIA D. A flexible multi-species genome-wide 60K SNP chip developed from pooled resequencing of 240tree genomes across 12 species[J].New Phytologist, 2015, 206(4):1527-1540.
[5] 刘海龙,王以红,陈博雯,等.利用ISSR标记方法鉴定5个桉树优良无性系[J].西部林业科学,2011,40(3):66-68.
[6] 刘海龙,陈晓明,覃子海,等.ITS序列在桉树种质资源鉴定中的应用研究[J].西部林业科学,2010,39(4):85-88.
[7] 刘果,谢耀坚,吴志华,等.SSR 标记在桉树树种精准鉴定中的应用分析[J].热带亚热带植物学报, 2018,26(2):116-124.
Application of SLAF-seq Technology in Identification ofVarieties
PANG Zhenwu, LIU Xin, SUN Xueyang, LAN Jun, CHENG Dewen
(,,,)
In this paper, molecular identification of twoclones was performed using a simplified genome sequencing technology: SLAF-seq. In these experiments, the sequencing data of 32.69 M reads was obtained, the sequencing quality value distribution test result Q30 was 95.28%, and the base distribution test result GC content was 40.61%. A total of 857 589 SLAF labels were developed using bioinformatics analysis. The results of the comparison of SNP polymorphisms between samples showed that the proportions of A1, A2 and A3 with the same genotype were 35.81% and 77.27% respectively, which reached the expectation of the experimental design to distinguish different clonal varieties.
; clone; molecular identification; SLAF-seq technology
S722.3+7
A
庞贞武(1981― ),男,硕士,工程师,主要从事林业种苗生产技术研究