日本沼虾EST-SNP的筛选及多态性检测

2016-03-22 01:46李喜莲杨元杰顾志敏郭建林张宇飞贾永义黄鲜明农业部淡水渔业健康养殖重点实验室浙江省淡水水产遗传育种重点实验室浙江省淡水水产研究所浙江湖州313001
东北农业大学学报 2016年2期
关键词:单核苷酸多态性

李喜莲,杨元杰,李 飞,顾志敏,郭建林,张宇飞,贾永义,黄鲜明(农业部淡水渔业健康养殖重点实验室,浙江省淡水水产遗传育种重点实验室,浙江省淡水水产研究所,浙江 湖州 313001)



日本沼虾EST-SNP的筛选及多态性检测

李喜莲,杨元杰,李飞,顾志敏*,郭建林,张宇飞,贾永义,黄鲜明
(农业部淡水渔业健康养殖重点实验室,浙江省淡水水产遗传育种重点实验室,浙江省淡水水产研究所,浙江湖州313001)

摘要:利用EST数据库开发SNP是筛选SNP标记的重要途径。本研究利用日本沼虾现有EST数据开发SNP标记—从NCBI获得8 458条EST序列;Seqclean软件去除序列中的载体、引物和接头等污染序列,得到8 453条EST序列;利用Quality SNP软件对预处理后序列中含有4条以上同源序列重叠群进行分析,在含有4条以上同源序列的1 055个重叠群中,筛选得到可靠SNP(Reliable SNPs)位点705个,较可信SNPs(High confidence SNPs)905个,潜在SNPs(Potential SNPs)1 144个。根据候选SNP位点设计28对引物,通过聚丙烯酰胺凝胶电泳分析,基因分型验证44个太湖个体,13对引物具有二等位基因多态性,观测杂合度和期望杂合度范围分别为0.259~0.745和0.255~ 0.728。结果表明,EST数据库中存在大量SNP位点,筛选的SNP标记可用于日本沼虾遗传学分析。

关键词:日本沼虾;单核苷酸多态性(SNP);表达序列标签(EST)

李喜莲,杨元杰,李飞,等.日本沼虾EST-SNP的筛选及多态性检测[J].东北农业大学学报, 2016, 47(2): 67-73.

Li Xilian, Yang Yuanjie, Li Fei, et al. Development of single nucleotide polymorphism markers for Macrobrachium nipponensis using expressed sequence tags[J]. Journal of Northeast Agricultural University, 2016, 47(2): 67-73. (in Chinese with English abstract)

日本沼虾(Macrobrachium nipponense),俗称青虾、河虾,隶属节肢动物门、甲壳纲、十足目、长臂虾科、沼虾属。淡水虾类分布于日本和中国,但日本沼虾群体存在性早熟情况,当年繁殖虾苗养殖1~2个月后便有个体抱卵繁殖,导致养殖池塘内不同世代混杂,遗传背景复杂,对日本沼虾遗传育种工作及虾苗繁育造成影响,因此日本沼虾发育的遗传背景研究具有重要意义。

郭闯等利用ISSR标记技术分析长江和太湖两地区日本沼虾遗传多样性[1]。冯建彬等对日本沼虾生长性状相关的微卫星标记进行筛选[2]。Ma等开发日本沼虾的24个微卫星引物[3],检测60个洪泽湖个体。冯建彬等采用(CT)15、(CA)15两种生物素标记及磁珠富集法构建太湖日本沼虾基因组微卫星富集文库[4]。赵燕等通过ISSR-PCR法筛选日本沼虾的微卫星标记[5],分离到27个多态性微卫星位点。目前,已报道日本沼虾中有95对微卫星标记。但随着日本沼虾遗传多样性研究的深入,日本沼虾分子标记日益受到关注。相比微卫星,SNP标记具有稳定性高和易于自动化分析等优点。张洪伟采用产物直接测序法[6],分析日本沼虾rDNA基因内转录间隔区ITSI的DNA序列,通过序列比对,筛选青虾SNP位点。

作为第三代的遗传标记,单核苷酸多态性(SNP)具有数量多、密度大、分布广、突变率低等特点[7],广泛应用于动植物遗传多样性分析、遗传育种、遗传连锁图谱构建、基因与性状关联分析、分子辅助育种等方面[8-9]。表达序列标签(EST)数据库发掘是目前SNP筛选重要途径[10]。EST-SNP用于数量性状位点(QTL)研究可直接将目标性状定位到相关基因,有利于性状遗传解析[11-12]。SNP分子标记已在鱼[13-14]、虾[15-16]、蟹[17]、贝[18-19]等水产动物中得到广泛应用,但有关日本沼虾EST-SNP研究未见报道。

前人对日本沼虾遗传标记(如SSR)集中在自行开发,对日本沼虾SNP筛选则仅研究某一特定基因SNP。本试验EST数据来源为NCBI数据库中现有已公布的EST序列,通过生物信息学方法筛选SNP位点,挑选出部分SNP位点,设计引物并在太湖野生群体中验证,估算其主要遗传参数。为SNP在日本沼虾遗传学研究及遗传育种中的应用提供技术支持,也为日本沼虾的遗传图谱构建、基因与性状的关联分析、重要性状QTL定位及分子辅助育种奠定基础。

1 材料与方法

1.1序列下载与预处理

在NCBI的EST核酸数据库(http://www.ncbi.nlm. nih.gov/projects/dbEST)下载8 458条日本沼虾(Macrobrachium nipponensis)序列(截止到2014年12月1日)。下载NCBI univce数据库(http://www.ncbi.nlm. nih.gov/tools/vecscr-een/univec/),Seqclean(https://sourc eforge.net/projects/seqclean/)软件去除序列中的载体、引物和接头等污染序列。

1.2 EST-SNP位点的查找和引物设计

采用软件Cap 3[20]对预处理后日本沼虾EST进行序列拼接,利用软件Quality SNP[21]在含有4条以上EST拼接重叠群(contig)中搜寻SNP位点,取重叠区出现两次以上的SNP作为候选位点设计引物。利用软件Primer Premier 5.0(Premier Bio soft International,Palo Alto,CA)设计引物。引物序列见表1。

1.3 SNP验证

SNP引物筛选用日本沼虾样本采自浙江省湖州市吴兴区太湖水域。采用苯酚/氯仿法提取日本沼虾尾部肌肉组织总基因组DNA,测定OD值,经琼脂糖凝胶电泳检测后确定纯度和浓度,-20℃保存备用。

PCR反应在Bio-Rad DNA Engine Dyad PCR仪上进行。反应体系为:DNA模板10~40 ng,ddH2O 6.60 μL,10×Buffer 1.0 μL,Mg2 +(25 mmol·L-1)0.7 μL,dNTP(10 mmol·L-1)0.2 μL,primers(10 mmol·μL-1)各0.2 μL,Taq酶0.5 U。扩增程序为:94℃预变性3 min,94℃变性30 s,最适退火温度下退火30 s,72℃延伸30 s,共30个循环,最后72℃再延伸10 min,4℃保温。PCR反应产物用8%非变性聚丙烯酰胺凝胶电泳检测。

表1引物序列及PCR反应中退火温度Table 1 Primers and annealing temperatures of PCR

利用软件Popgene3.2进行群体遗传分析,计算观测杂合度(Observed heterozygosity,Ho)和期望杂合度(Expected heterozygosity,He)。

2结果与分析

2.1 EST的拼接

预处理后日本沼虾共有8 453条可用EST序列。Cap3拼接得到1 055条重叠群,4 406条单一序列;2~3条EST组成的重叠群800个;4~5条EST组成的重叠群129个;6~10条EST组成的重叠群84个;11~20条EST组成的重叠群28个;20条以上EST组成的重叠群14个。4条及4条以上EST组成的重叠群共255条,占总数24.17%,未参加拼接的EST序列占75.83%;这255个重叠群共包括114 124个碱基,从中筛选到SNP位点2 754个,SNP平均频率为41.44 bp。

2.2日本沼虾EST数据库SNP数量和特征

分析获得含有SNP的重叠群为114个,其中转换424个(C/T之间的转换207个,A/G之间的转换217个),颠换481个(A/T之间的颠换177个,A/C之间的颠换127个,T/G之间的颠换116个,C/G之间的颠换61个),插入突变239个。

表2日本沼虾EST数据库中SNP数量和特征Table 2 Summary of EST-SNPs from Macrobrachium nipponense

2.3 EST拼接结果及SNP分布

Quality SNP软件对SNP分类包括:可靠SNPs (Reliable SNPs)、较可信SNPs(High confidence SNPs)、潜在SNPs(Potential SNPs)[14]。Quality SNP

从Cap3的拼接结果中筛选SNP,含有SNP重叠群114;705个可靠SNPs,905个较可信SNPs,1 144个潜在SNPs。

8 453条日本沼虾EST拼接结果及各重叠群包含的SNP数量见网址http://www.macrobrachiumnip ponensis.org/。

表3日本沼虾EST-SNP的分布Table 3 Distribution of EST-SNPs from Macrobrachium nipponense

续表

2.4候选SNP位点基因分型及利用

Quality SNP在含有4条以上序列的重叠群中共发现可靠SNP位点705个,较可信SNPs 905个,潜在SNPs 1 144个。根据SNP位点分布频率和侧翼序列质量,利用Primer Premier 5.0设计引物28组,通过聚丙烯酰胺凝胶电泳分析,在44个太湖个体中进行基因分型验证,其中8组引物(29%)无扩增产物,7组引物(25%)无多态性,13组(46%)引物具有二等位基因多态性(见表4)。观测杂合度和期望杂合度范围分别为0.4966~0.7453和0.2547~0.5034。

表4日本沼虾单核苷酸多态性标记Table 4 SNP markers for Macrobrachium nipponense

3讨论与结论

性早熟、规格变小、商品率降低、抗病能力下降等品种退化现象[22]严重影响日本沼虾养殖效益。开发日本沼虾的分子标记是资源保护和遗传选育基础。本研究利用日本沼虾现有EST数据筛选出SNP标记大量的SNP位点,分析SNP位点的数量、特征分布以及基因分型,结果表明,筛选SNP标记可用于日本沼虾遗传学分析。

SNP是在一个物种的个体之间最为常见的信息丰富的遗传改变。公共数据库中,SNP数目已超过160万[23]。在人类DNA 30亿对碱基中,平均每300~ 1 000个碱基对就有1个SNP发生[24];玉米基因组中每104 bp中含有1个SNP[25]。在水产动物中,Wang等对鲶鱼的EST重叠群研究发现每100 bp存在1个SNP[26],海湾扇贝EST重叠群研究发现每118.2 bp存在1个SNP[27],文蛤[28]则为每156 bp存在1个SNP,长牡蛎[29]基因组中约每40 bp存在1个SNP位点,叉尾鮰[30]每76.9个碱基对中存在1个SNP发生。目前对虾类SNP研究相对较少,本研究中含有SNP的118个重叠群共包含119 653个碱基,包含1 144个潜在SNP位点,即每104个碱基对中含有一个SNP发生,说明SNP在日本沼虾EST序列中的分布频率较高,SNP分布频率在不同物种间差异显著。

点突变在DNA序列进化中有重要作用,任何碱基突变不论是插入、缺失还是位点上的突变均非随机产生[31-32],Maier等研究表明基因组中CpG二核苷酸上的胞嘧啶(C)因可自发脱去氨基形成胸腺嘧啶(T)而成为基因中最易发生突变的位点[33],因此C/T碱基转化较A/G转换概率更高。本研究结果表明日本沼虾碱基的转换中以A/G(217)为主,而非C/T,与栉孔扇贝[34]、长牡蛎[35]、紫贻贝[19]等结果存在差异性。在位点突变中,假设转换和颠换的发生频率相同,则转换与颠换的比值(Ts/Tv)应为0.5,但该比值往往高于0.5。本研究筛选SNP中,Ts/Tv为0.88,原因是受到多重替换和饱和效应影响。

本研究对日本沼虾现有EST数据进行SNP筛查和SNP验证分型,开发13个EST-SNP标记。结果表明,基于EST数据库开发SNP技术,可有解决补虾类生物因基因组学滞后影响SNP标记开发问题。日本沼虾遗传标记研究可考虑采用新一代测序技术,测定不同性别或性腺发育状态的转录组,整合已有数据,通过生物信息学方法与试验验证结合,获得与特定性状相关的基因或遗传标记,为研究日本沼虾性早熟现象成因提供理论基础。

[参考文献]

[ 1 ]郭闯,韩晓磊,盖建军,等.江苏省两个日本沼虾群体的遗传多样性ISSR分析[J].金陵科技学院学报, 2010(3): 85-89.

[ 2 ]冯建彬,马克异,李家乐,等.日本沼虾微卫星引物筛选及群体遗传多样性分析[J].水产学报, 2010(5): 688-695.

[ 3 ] Ma K Y, Feng J B, Li J L, et al. Twenty-four novel polymorphic microsatellite markers from oriental river prawn (Macrobrachium nipponense)[J]. Conservation Genetics Resources, 2010, 2(1): 125-128.

[ 4 ]冯建彬,吴春林,丁怀宇,等.洪泽湖日本沼虾9个野生群体遗传多样性微卫星分析[J].中国水产科学, 2010(2): 218-227.

[ 5 ]赵燕.日本沼虾微卫星标记开发、遗传结构分析及性别相关遗传标记筛选研究[D].泰安:山东农业大学, 2014.

[ 6 ]张洪伟,傅洪拓,吴滟,等.日本沼虾ITS1序列分析及SNPs位点的筛选[J].水生生物学报, 2010(1): 72-77.

[ 7 ] Vignal A, Milan D, Sancristobal M, et al. A review on SNP and other types of molecular markers and their use in animal genetics [J]. Genetics Selection Evolution, 2002, 34(3): 275-306.

[ 8 ] Nielsen R, Paul J S, Albrechtsen A, et al. Genotype and SNP calling from next-generation sequencing data[J]. Nature Reviews Genetics, 2011, 12(6): 443-451.

[ 9 ] Jombart T, Ahmed I. Adegenet 1.3-1: new tools for the analysis of genome-wide SNP data[J]. Bioinformatics, 2011, 27(21): 3070-3071.

[10]王绍宗,李莉,亓海刚,等.长牡蛎(Crassostrea gigas)17个EST-SNP标记的开发[J].海洋与湖沼, 2010(2): 274-281.

[11]刘列钊,李加纳.利用甘蓝型油菜高密度SNP遗传图谱定位油酸、亚麻酸及芥酸含量QTL位点[J].中国农业科学, 2014(1): 24-32.

[12] Kifuji Y, Hanzawa H, Terasawa Y, et al. QTL analysis of black rot resistance in cabbage using newly developed EST-SNP markers [J]. Euphytica, 2013, 190(2): 289-295.

[13]邹刚刚,陈永久,吴常文. SNP及其在鱼类养殖中的应用[J].浙江海洋学院学报:自然科学版, 2013, 31(5): 447-453.

[14]张晓峰,杨晶,孙效文.基于EST序列的鲤鱼生长相关SNP发掘[J].水产学杂志, 2009, 22(4): 1-7.

[15] Glenn K L, Grapes L, Suwanasopee T, et al. SNP analysis of AMY2 and CTSL genes in Litopenaeus vannamei and Penaeus monodon shrimp[J]. Animal Genetics, 2005, 36(3): 235-236.

[16] Yu M, Cheng Y, Rothschild M F. SNP analysis of Molting related genes in Penaeus monodon and Litopenaeus vannamei shrimp (Brief report)[J]. Archiv Fur Tierzucht, 2006, 49(4): 411.

[17]马群群.拟穴青蟹SNP和SSR标记开发及系谱认证技术的建立研究[D].上海:上海海洋大学, 2012.

[18]温海洋.马氏珠母贝SNP标记开发与其生长性状的关联分析[D].海口:海南大学, 2014.

[19]李宏俊,梁瑜,邢坤,等.紫贻贝EST-SNP的筛选及多态性检测[J].水产学报, 2011(3): 348-355.

[20] Huang X, Madan A. CAP3: A DNA sequence assembly program [J]. Genome Research, 1999, 9(9): 868-877.

[21] Tang J, Vosman B, Voorrips R E, et al. QualitySNP: a pipeline for detecting single nucleotide polymorphisms and insertions/ deletions in EST data from diploid and polyploid species[J]. BMC Bioinformatics, 2006, 7(1): 438.

[22]傅洪拓,龚永生,吴滟,等.日本沼虾与海南沼虾的人工种间杂交及其同工酶分析[J].水生生物学报, 2004(3): 327-329.

[23] Lagarde A E. DNA Microarrays: A Molecular Cloning Manual.[J]. American Journal of Human Genetics, 2003, 73(1): 218-219.

[24] Brookes A J. The essence of SNPs[J]. Gene, 1999, 234(2): 177-186.

[25] Shi H, Maier S, Nimmrich I, et al. Oligonucleotide-based microarray for DNA methylation analysis: Principles and applications [J]. Journal of Cellular Biochemistry, 2003, 88(1): 138-143.

[26] Wang S, Sha Z, Sonstegard T S, et al. Quality assessment parameters for EST-derived SNPs from catfish[J]. BMC Genomics, 2008, 9(1): 450.

[27] Li R, Li Q, Kong L. Characterization of expressed sequence tag-derived single-nucleotide polymorphisms in the bay scallop Argopecten irradians irradians[J]. Fisheries Science, 2009, 75(6): 1389-1400.

[28] Li H, Zhu D, Gao X, et al. Mining single nucleotide polymorphisms from EST data of hard clam Meretrix meretrix[J]. Conservation Genetics Resources, 2010, 2(1): 69-72.

[29] Curole J P, Hedgecock D. Estimation of preferential pairing rates in second-generation autotetraploid pacific oysters (Crassostrea gigas)[J]. Genetics, 2005, 171(2): 855-859.

[30] He X, Zhang Y, Yu Z. In silico cloning, expression of Rieske-like apoprotein gene and protein subcellular localization in the Pacific oyster, Crassostrea gigas[J]. Molecular Biology Reports, 2010, 37 (7): 3259-3264.

[31] Yamane K, Yano K, Kawahara T. Pattern and rate of indel evolution inferred from whole chloroplast intergenic regions in sugarcane, maize and rice[J]. DNA Research, 2006, 13(5): 197-204.

[32] Morton B R. Neighboring base composition and transversion/ transition bias in a comparison of rice and maize chloroplast noncoding regions[J]. Proceedings of the National Academy of Sciences, 1995, 92(21): 9717-9721.

[33] Shi H, Maier S, Nimmrich I, et al. Oligonucleotide-based microarray for DNA methylation analysis: principles and applications [J]. J Cell Biochem, 2003, 88(1): 138-143.

[34]李纪勤,包振民,李玲,等.栉孔扇贝EST-SNP标记开发及多态性分析[J].中国海洋大学学报:自然科学版, 2013(1): 56-63.

[35] Sauvage C, Bierne N, Lapegue S, et al. Single nucleotide polymorphisms and their relationship to codon usage bias in the Pacific oyster Crassostrea gigas[J]. Gene, 2007, 406(1): 13-22.

[36] Yang Z, Yoder A D. Estimation of the transition/transversion rate bias and species sampling[J]. Journal of Molecular Evolution, 1999, 48(3): 274-283.

[37]吕雪梅,王应祥,张亚平.蜂猴线粒体细胞色素b基因变异特点及系统发育分析[J].动物学研究, 2001(2): 93-98.

Development of single nucleotide polymorphism markers for Macrobrachium nipponensis using expressed sequence tags

LI Xilian, YANG Yuanjie, LI Fei, GU Zhimin, GUO Jianlin, ZHANG Yufei, JIA Yongyi, HUANG Xianming(Agriculture Ministry Key Laboratory of Healthy Freshwater Aquaculture, Key Laboratory of Freshwater Aquatic Animal Genetic and Breeding of Zhejiang province, Zhejiang Institute of Freshwater Fisheries, Huzhou Zhejiang 313001, China)

Abstract:Using the EST database is an important approach to screen SNP markers. In present study, we obtained 8 453 EST sequences of Macrobrachium nipponensis from the GenBank after removed carriers, primers and vector sequences using Seqclean. The pre-treatment sequences contained four or more ESTs were analized by Quality SNP. Those EST sequences were clustered into contigs, of which 1 055 contained 4 or more ESTs. 705 Reliable SNPs,905 High confidence SNPs and 1 144 Potential SNPs were detected from 1 055 contigs.28 of the putative SNPs were chosen for validation by allele specific PCR with SDS-PAGE with 44 individuals from Tai Lake population, and 13 of them were polymorphic with the minor allele frequency. The observed heterozygosity and expectedbook=68,ebook=73heterozygosity were distributed from 0.259 to 0.745 and 0.255 to 0.728.The result showed that there were a large numbers of candidate SNPs from public EST data, and EST-SNPs could be development in an efficient way for molecular genetic analysis of Macrobrachiumnipponensis.

Key words:Macrobrachium nipponensis; single nucleotide polymorphism(SNP); expressed sequence tags(EST)

*通讯作者:顾志敏,研究员,研究方向为水产动物新品种选育。E-mail: guzhimin2006@163. com

作者简介:李喜莲(1981-),女,助理研究员,博士,研究方向为水生生物遗传育种学和生物信息学。E-mail: lixilian@126. com

基金项目:浙江省重大科技专项重大农业项目(2012C12907);浙江省公益技术研究农业项目(2014C32066);浙江省省属科研院所扶持专项计划项目(2014F10037);浙江省条件建设项目(2013F10047);浙江省淡水水产研究所项目(ZJS2014-3)

收稿日期:2015-04-10

中图分类号:S154.1;S567.5+1

文献标志码:A

文章编号:1005-9369(2016)02-0067-07

猜你喜欢
单核苷酸多态性
GSDMB/ORMDL3基因CpG序列多态性与中国汉族人哮喘相关的临床研究
RUNX2基因rs1406846位点多态性与中国汉族女性TMJOA的相关性研究
CD40基因单核苷酸多态性及其基因型与下肢动脉硬化闭塞症的相关性研究
药用植物DNA标记辅助育种(一):三七抗病品种选育研究
肿瘤坏死因子超家族成员15与溃疡性结肠炎相关性的研究
浙江省强直性脊柱炎患者调查和ERAP1与HLA—B27的相互作用研究
EPAS1基因SNPrs13419896多态性与HiHiLo低氧训练适应效果关联性研究
广西人群白细胞介素31基因rs10847385A/C遗传多态性研究
高灌蓝莓CBF基因的单核苷酸多态性分析