李胜杰,白俊杰,赵 荦,朱 冰,朱新平
(1.中国水产科学研究院珠江水产研究所,农业部热带亚热带水产资源利用与养殖重点实验室,广州 510380;2.上海海洋大学水产与生命学院,上海 201306)
大口黑鲈(Micropterus salmoides)俗名加州鲈,原产于北美洲,属广温性鱼种,在分类学上隶属鲈形目太阳鱼科。大口黑鲈具有肉质鲜美、无肌间剌、适合高密度养殖和长途运输等特点,自上世纪70年代被引入我国大陆后进行广泛养殖,现已成为我国重要的淡水养殖品种之一,年产量超35万吨[1]。随着养殖规模不断扩大,集约化程度不断提高,大口黑鲈疾病频发、生长不理想和养殖成本上升等制约了我国大口黑鲈养殖业的可持续健康发展。因此,有必要通过人工选育提高养殖品种的生长性能,为大口黑鲈养殖产业发展提供良种支撑。
分子标记辅助育种技术是通过与目标性状紧密连锁的分子标记对目标性状进行间接选择的现代育种技术,具有选择强度大、不受环境影响和结果可靠等特点[2]。关联分析是用分子标记或者候选基因的遗传变异与经济性状表型联系起来的实现分子标记辅助育种的一种有效方法[3]。单核苷酸多态性(SNP)是最常用的分子标记,由于其全基因组覆盖率和基因分型效率高等优点,被广泛应用于关联分析和分子辅助育种[4-5]。目前大规模SNP标记信息的获得主要是通过基因组测序,但这种方法成本高,对于没有基因组信息的非模式生物,可用转录组测序来开发大量 SNP标记[6]。SALEM等[7]应用 RNASeq技术对虹鳟(Oncorhynchusmykiss)生长快和生长慢群体转录组进行分析,将测序数据与转录组参考序列比对后筛选出两个群体的差异SNP,并与群体生长性状进行关联分析,共鉴定出22个与生长性状相关的 SNP。ULLOA等[8]采用RNA-seq技术分析了斑马鱼(Barchydanio rerio)生长快和生长慢群体的转录组,对获得的164个候选SNP标记与生长性状进行关联分析,筛选出5个生长相关标记。本研究采用RNA-seq技术分析大口黑鲈生长快和生长慢个体肌肉组织转录组,通过SnaPshot分型技术验证候选SNP标记,并进一步分析标记与生长性状相关性,以期为大口黑鲈生长相关分子标记开发和分子标记辅助育种研究提供基础数据。
大口黑鲈“优鲈1号”是经连续多代选育而获得的生长性能优良的养殖新品种[9]。为测试其生长性能,对同为2月龄的大口黑鲈“优鲈1号”和非选育大口黑鲈注射CWT标记后在佛山市南海区九江镇新旭养殖场的同一口池塘中进行养殖,每天用冰鲜鱼投喂,一天喂养两次(8∶30和16∶30)。11月龄时,在大口黑鲈“优鲈1号”群体中采集10 ind最大个体(快长组,平均体质量为782.5±14.1g),在非选育大口黑鲈中采集10 ind最小个体(慢长组,平均体质量为249.0±8.2 g),剪取每尾鱼肌肉组织冻存于液氮中,用于总RNA提取。
用于关联分析的大口黑鲈养殖群体来自新旭养殖场,该养殖群体是9 500 ind大口黑鲈“优鲈1号”亲本于2015年3月1日繁殖的后代。供试鱼在相同条件下培育成鱼种,然后在同一个池塘中进行养殖,全程投喂冰冻野杂鱼,11月龄时从群体中随机取430 ind测量体质量、全长、体高、头长和尾柄长等性状值,同时以抗凝剂(ACD)与血液体积比为6∶1的比例进行尾静脉活体取血,按天根生化科技(北京)有限公司的血液基因组DNA试剂盒中操作说明提取DNA,用琼脂糖(Sigma公司,美国)凝胶电泳和紫外分光光度计(Eppendorf公司,美国)测定DNA质量和浓度,于-20℃保存。DNA分子量标准购自广州艾基生物科技有限公司。
按照TaKaRa公司(大连)Trizol试剂盒说明书提取肌肉组织总RNA,并用1.2%琼脂糖凝胶电泳(Bio-Rad公司,美国)和分光光度计检测其质量和浓度。构建RNA文库之前,每一个RNA样品经DNase I消化之后去除基因组DNA污染。每组中各个体的等量RNA混合一起组成测序样品。采用OligotexmRNA Midi Kit试剂盒(Qiagen公司,美国)纯化富集 Poly(A)mRNA,加入fragmentation缓冲液将mRNA打断成200nt左右的短片段。以片段后的mRNA为模板,使用六碱基随机引物合成cDNA第一链,然后加入缓冲液、dNTP、RNase和DNA聚合酶合成 cDNA第二条链。通过Qiaquick PCR提取试剂盒(Qiagen公司,美国)和EB缓冲液洗脱经末端修复,对cDNA片段进行纯化。对纯化后cDNA片段进行加poly(A)尾及连接测序接头,再经过琼脂糖凝胶电泳回收目的片段,200 bp+25 bp的cDNA片段被纯化并通过PCR扩增目的片段,作为cDNA测序文库。文库构建和测序均委托北京基因组中心完成,采用 Illumina HiSeqTM2000平台(Illumina公司,美国)及single-end和paired-end技术获得原始测序数据。
为筛选SNP标记,以2个转录组文库产生的序列组装而成的 unigene作为参考序列,用SOAPsnp软件[10]比对单个 read。SNP查找限于至少被5个clean reads覆盖的unigene,最小等位基因质量(每等位基因累计序列的质量)不低于20。从关联分析群体中选取30 ind极大和30 ind极小个体作为SNP标记验证群体,选择在大口黑鲈快长组和慢长组中均存在的75个SNP标记进行验证。对于分型成功且可能与生长性状关联的SNP标记进一步在其余个体中进行基因型分型,最后在大群体中做SNP标记与生长性状的关联分析。
委托上海捷瑞生物工程有限公司用SnaPshot方法[11]分型,具体方法如下:根据目标 SNPs侧翼序列设计扩增引物,然后对每个样品的DNA进行多重PCR扩增。PCR扩增后取3μL PCR产物用Exo I和FastAP纯化,主要是用Exo I去除反应产物中的剩余引物,用FastAP去除反应中剩余的DNTP,37℃条件下15 min,80℃高温灭活Exo I和FastAP酶15 min。根据ABI公司(美国)提供的SnaPshot试剂盒,用延伸引物进行延伸反应,使用ABI公司的PRISM 3730测序仪进行基因分型。
表1 EST序列的基因注释信息和SNP位置Tab.1 Gene annotation of EST sequences and positions of each SNP
采用 PopGene 32(Version 1.31)软件(http://www.ualberta.ca/~fyeh/fyeh/)计算哈迪-温伯 格 平 衡 (Hardy-Weinberg equiliberum,HWE)、有效等位基因数(N e)、观测杂合度(H o)和期望杂合度(H e)。采用PIC-Calc0.6软件,依据等位基因频率计算各个SNP标记的多态信息含量(polymorphism information content,PIC)。
用SPSS 19.0软件一般线性模型(general linearmodel)分析各个基因型与大口黑鲈生长性状之间的相关性。统计分析模型为Yij=μ+Bi+eij。其中:Yij为某个性状第i个标记第j个个体上的观测值;μ为实验观测所有个体的平均值(即总体平均值);Bi为第i个标记的效应值;eij为对应于观察值的随机误差效应值[12]。
大口黑鲈快长组和慢长组肌肉组织样品RNA经深度测序分别获得5 406万和5 474万reads,经组装后分别获得 84 602和 88 329 contigs,contig的平均长度分别为400 bp和418 bp。将获得的测序数据上传到 NCBI数据上,登录号为 SRA436296。Q20值大于98.51%,表明测序质量较高。用RNA-seq技术在大口黑鲈快长组和慢长组中分别检测到15 273和17 376个SNP标记,其中转换位点分别为9 720和11 085个,颠换位点分别为5 553和6 291个。A、C、G、T 4种类型碱基发生单核苷酸变异的数目介于1 057和5 573之间(表2)。6种单核苷酸变异中以C/T和A/G发生频率最高,均大于30%,而其它4种单核苷酸变异 A/C、G/T、C/G、A/T发生频率均在10%以下(表2)。
为验证转录组数据库中EST-SNP标记的有效性,挑选出75个SNP标记在60个极端样本中进行SnaPshot分型,结果显示:37个SNP标记可成功分型,准确率为49.3%。部分SNP标记的碱基突变类型和遗传参数的统计结果见表3。各标记的遗传多态信息含量(PIC)介于0.287和0.375之间,根据PIC值介于0.25~0.50之间为中度多态,可知所有标记都属于中度多态位点。所有标记的平均有效等位基因数(Ne)、平均观测杂合度(Ho)和平均期望杂合度(He)分别为1.891、0.459和0.467,表明大口黑鲈“优鲈 1号”群体的遗传多样性较丰富。Chi-square检验分析表明,4个位点(CL1328.Contig1_All-3028、CL1115.Contig2_All-1357、Unigene14288_All-228、CL1339.Contig2_All-844)的基因型频率分布偏离Hardy-Weinberg定律(P<0.05),而其余位点均符合Hardy-Weinberg定律。
表2 大口黑鲈快长组和慢长组中的SNPs分布Tab.2 Distribution of SNPs in fast-grow ing and slow-grow ing group
表3 10个SNPs在大口黑鲈“优鲈1号”群体中的遗传多态性Tab.3 Genetic variability of 10 SNPs in Youlu No.1 largemouth bass population
37个SNP标记中有10个标记在极端群体与大口黑鲈生长性状中存在潜在相关性,进一步在大群体中验证这些SNP标记与生长性状之间相关性(表4),结果发现,10个SNP标记在群体中均存在3种基因型,以所处碱基对表示基因型类型(表4),如 CL1452.Contig9_All-847标记属于C/T突变,存在CC和TT纯合基因型,以及CT杂合基因型。CL1452.Contig9_All-847标记CC基因型个体在体质量、全长和尾柄长3个性状的均值都显著高于TT基因型个体(P<0.05),CC型个体在体高、头长上的均值都比TT型的均值高,但差异未达到显著水平(P>0.05)。其它位点不同基因型个体间的生长性状均不存在显著差异(P>0.05)。
将CL1452.Contig9_All对应的序列在NCBI在线数据库中进行BLASTn分析,结果发现该序列与Rab-interacting lysosomal protein(RILP)相似度最高,且该基因序列中的 SNP标记位于3′UTR,不编码蛋白质。其它unigene序列所注释的基因名称见表1。
大口黑鲈是我国重要的经济淡水养殖品种之一,就目前研究来看,其分子标记以微卫星、AFLP和RAPD标记为主,只有少数SNP标记被报道[13]。SNP是基因组中冗余度低而覆盖度最高的变异,具有便于高通量开发、快速分型等优点,广泛用于构建高密度遗传连锁图谱和发掘QTL和经济性状相关基因[14]。目前利用基因组测序可以大规模开发SNP标记,但是这种方式成本很高,而采用高通量转录组测序既可快速获得大量准确序列信息,又可获得大量SNP标记,大大降低了成本[15]。本研究中利用转录组测序得到近2×104个大口黑鲈SNP标记,EST序列中平均约2 kb出现1个SNP,明显低于其它水产动物EST中的 SNP标记平均间距[如大黄鱼(Larimichthys crocea)506 bp[16]、栉 孔 扇 贝(Chlamys farreri)426.5 bp[17]、半 滑 舌 鳎(Cynoglossu semilaevis)491 bp[18]]。这种显著差异可能与本研究采用了较为严格的筛选条件(SNP查找限于至少被5个clean reads覆盖的unigene,最小等位基因质量即每等位基因累计序列的质量不低于20)有关,此外还受测序深度和精确度影响[15]。SNP统计显示,6种变异类型中以C/T变异频率最高(32%),这可能是由于CpG二核苷酸上甲基化的胞嘧啶残基易自发地脱去氨基而形成胸腺嘧啶引起[19]。本研究选择75个SNP标记进行验证,发现37个标记具有多态性,SNP标记的准确性为49.3%,这与在大菱鲆[15](Scophthalmus maximus,46.7%)、大西洋鳕[20](Gadusmorhua,74.6%)和鲤[6](Cyprinus carpio,48%)中标记准确性相近,这也反映了利用RNA-seq技术开发SNP标记是一种有效的技术方法。
杂合度反映了遗传一致程度,而多态信息含量是衡量多态性的指标。当PIC>0.5时,该基因座为高度多态位点,0.25<PIC<0.5时,为中度多态位点,PIC<0.25时为低度多态位点[21]。多态信息含量越大,说明该位点的杂合子比例越大,提供的遗传信息越丰富[22-23]。在本研究中,10个SNP标记都处于中度多态,能够为评价大口黑鲈遗传多样性提供较充分的信息,这些标记都没有表现出高度多态性,原因在于SNP标记是一种典型的两等位基因标记[21]。SNP标记虽然不像微卫星标记具有较高的多态性,但它在基因组中的广泛分布,弥补了其多态性较低的不足[24]。本实验所获得的10个SNP标记的平均多态信息含量为0.36,反映了大口黑鲈“优鲈1号”群体具有较丰富的遗传多样性,可进一步利用选育手段来提高其生长性能。李镕等[25]采用微卫星标记技术分析得出大口黑鲈第4代选育群体(F4)的平均多态信息含量为0.39。本研究中所用的大口黑鲈“优鲈1号”是第10代选育群体(F10),与F4相比,F10的平均多态信息含量减少了7.6%,这与大黄鱼“官井洋优快01”选育品系选育世代的遗传多样性指标值随着选育的进行呈现下降的研究结果相一致[26]。通过人工选育手段对群体基因库进行高强度选择会造成群体基因水平上的多样性在一定程度上降低。F10的遗传多样性降低幅度很小,这与本实验选育过程中每代保持较多数量的繁育亲本有关,可以尽可能避免近交引起负面影响。
表4 10个SNP标记不同基因型与生长性状的相关性分析Tab.4 Correlation analysis between different genotypes for 10 SNP lociand grow th traits
经BLAST比对分析,发现CL1452.Contig9_All-847标记所处的基因序列与RILP-like protein 1相似度最高。RILP是Rab7的一个重要的效应蛋白。RILP和 Rab7相互作用,并通过促进Epidermal growth factor receptor(EGFR)降解负调控EGF激活的Akt信号通路,从而调节细胞的生存、增殖分化和凋亡[27]。目前关于RILP在水产动物中的研究鲜见报道。本研究首次在鱼类RILP基因上筛选得到一个与生长性状相关的SNP标记,该标记的CC基因型个体在体质量、全长上显著优于TT基因型个体,我们推测RILP基因是与大口黑鲈生长相关的功能基因,对生长性状发挥调控作用,但在其他品种中该基因对生长的调控作用还有待研究。CL1452.Contig9_All-847标记处于3’非编码区,不会引起其翻译的氨基酸发生变化,但非编码区中的碱基突变可影响mRNA的剪切从而导致蛋白质的功能改变[29],或与基因组区域中相邻的重要突变位点连锁。因此,本研究获得的与大口黑鲈生长性状相关的CL1452.Contig9_All-847标记,可作为大口黑鲈分子标记辅助育种研究中的候选标记。
[1] 刘海涌,李胜杰,白俊杰.大口黑鲈养殖群体和引进群体生长性能的比较分析[J].水产养殖,2015,36(9):1-5.LIU H Y,LI S J,BAI J J.Comparison of growth performance between the farmed and introduced population of largemouth bass[J]. Journal of Aquaculture,2015,36(9):1-5.
[2] GOMEZ-RAYA L,KLEMETSDALG.Two-stage selection strategies utilizing marker-quantitative trait locus information and individual performance[J].Journal of Animal Science,1999,77(8):2008-2018.
[3] 董 玉,李 琪.刺参SNP标记与生长性状的关联分析[J].海洋湖沼通报,2016(2):49-58.DONG Y,LIQ.Correlation analysis between snps and growth traits of Apostichopus japonicus[J].Transactions of Oceanology and Limnology,2016(2):49-58.
[4] WANG D G,FAN J B,SIAO C J,et al.Largescale identification,mapping,and genotyping of single-nucleotide polymorphisms in the human genome[J].Science,1998,280(5366):1077-1082.
[5] EMAHAZION T,JOBSM,HOWELLW M,et al.Identification of167 polymorphisms in 88 genes from candidate neurodegeneration pathways[J].Gene,1999,238(2):315-324.
[6] XU J,JI P,ZHAO Z,et al.Genome-wide SNP discovery from transcriptome of four common carp strains[J].PloSOne,2012,7(10):e48140.
[7] SALEM M,VALLEJO R L,LEEDS T D,et al.RNA-Seq identifies SNPmarkers for growth traits in rainbow trout[J].PloSOne,2012,7(5):e36264.
[8] ULLOA P E,RINCÓN G,ISLAS-TREJO A,et al.RNA sequencing to study gene expression and SNP variations associated with growth in zebrafish fed a plant protein-based diet[J].Marine Biotechnology,2015,17(3):353-363.
[9] 樊佳佳,白俊杰,李胜杰,等.大口黑鲈“优鲈1号”选育群体肌肉营养成分和品质评价[J].中国水产科学,2012,19(3):423-429.FAN J J, BAI J J, LI S J, et al. Nutrient composition and nutritive quality of the muscle of Micropterus salmoides,"Youlu No.1"[J].Journal of Fishery Sciences of China,2012,19(3):423-429.
[10] LI R,YU C,LI Y,et al.SOAP2:an improved ultrafast tool for short read alignment[J].Bioinformatics,2009,25(15):1966-1967.
[11] NIE K,ZHANG Y H,GAN R,et al.Polymorphisms in immune/inflammatory cytokine genes are related to Parkinson’s disease with cognitive impairment in the Han Chinese population[J].Neuroscience Letters,2013,541(29):111-115.
[12] LIX,BAI J,HU Y,et al.Genotypes,haplotypes and diplotypes of IGF-II SNPs and their association with growth traits in largemouth bass(Micropterus salmoides)[J].Molecular Biology Reports,2012,39(4):4359-4365.
[13] 刘 浩,白俊杰,李胜杰,等.大口黑鲈ghrelin基因SNPs的筛选及与生长性状关联性分析[J].水产学报,2016,40(4):521-527.LIU H,BAI J J,LI S J,et al.SNPs detection of ghrelin gene and its association with growth traits in largemouth bass(Micropterus salmoides) [J].Journal of Fisheries of China,2016,40(4):521-527.
[14] FERNÁNDEZM E,GOSZCZYNSKID E,LIRÓN J P, et al. Comparison of the effectiveness of microsatellites and SNP panels for genetic identification,traceability and assessment of parentage in an inbred Angus herd[J].Genetics and Molecular Biology,2013,36(2):185-191.
[15] 王 婷,黄智慧,马爱军,等.基于转录组数据的大菱鲆(Scophthalmusmaximus)SNP标记开发及多态性分析[J].海洋与湖沼,2014,45(6):1300-1307.WANG T, HUANG Z H, MA A J, et al.Development and polymorphic analysis of SNP markers in Scophthalmus maximus based on transcriptome database[J]. Oceanologia et Limnologia Sinica,2014,45(6):1300-1307.
[16] WANG P,XIAO S,HAN Z,etal.SNP discovery in large yellow croaker(Larimichthys crocea)using Roche 454 pyrosequencing sequencing platform[J].Conservation Genetics Resources,2015,7(4):777-779.
[17] 李纪勤,包振民,李 玲,等.栉孔扇贝EST-SNP标记开发及多态性分析[J].中国海洋大学学报,2013,43(1):56-63.LIJQ,BAO Z M,LI L,et al.Development and characterization of EST-SNP in Chlamys farreri[J].Periodical of Ocean University of China,2013,43(1):56-63.
[18] WANG W,YI Q,MA L,et al.Sequencing and characterization of the transcriptome of half-smooth tongue sole(Cynoglossus semilaevis)[J].BMC Genomics,2014,15(1):470.
[19] 杜玮南,方福德.单核苷酸多态性的研究进展[J].中国医学科学院学报,2000,22(4):392-394.DUW N,FANG F D.The research development of single nucleotide polymorphism[J].Acta Academiae Medicinae Sinicae,2000,22(4):392-394.
[20] SOPHIE H,BRENT H,TUDOR B,et al.Development of a SNP resource and a genetic linkage map for Atlantic cod(Gadusmorhua)[J].BMC Genomics,2010,11(1):191-205.
[21] BOTSTEIN D,WHITE R L,SKOLNICK M,et al.Construction of a genetic linkage map in man using restriction fragment length polymorphisms.[J].American Journal of Human Genetics,1980,32(3):314-331.
[22] 李 莉,孙振兴,杨树德,等.用微卫星标记分析皱纹盘鲍群体的遗传变异[J].遗传,2006,28(12):1549-1554.LI L,SUN Z X,YANG S D,et al.Analysis of genetic variation of abalone(Haliotis discus hannai)populations with microsatellite markers[J].Hereditas,2006,28(12):1549-1554.
[23] 全迎春,马冬梅,白俊杰,等.大口黑鲈转录组SNPs筛选及其与生长的关联分析[J].水生生物学报,2016,40(6):1128-1134.QUAN Y C,MA D M,BAI J J,et al.SNPs identification in RNA-seq data of largemouth bass(Micropterus salmoides)fed on formulated feed and association analysis with growth trait[J].Acta Hydrobiologica Sinica,2016,40(6):1128-1134.
[24] LIU Z J,CORDES J F.DNA marker technologies and their applications in aquaculture genetics[J].Aquaculture,2004,238(1):1-37.
[25] 李 镕,白俊杰,李胜杰,等.大口黑鲈选育群体遗传结构的微卫星分析[J].广东海洋大学学报,2010,30(3):11-15.LIR,BAI J J,LI S J,et al.Analysis on genetic structure of selected population of largemouth bass by microsatellite DNA markers[J].Journal of Guangdong Ocean University,2010,30(3):11-15.
[26] 赵广泰,刘贤德,王志勇,等.大黄鱼连续4代选育群体遗传多样性与遗传结构的微卫星分析[J].水产学报,2010,34(4):500-507.ZHAO G T,LIU X D,WANG Z Y,et al.Genetic structure and genetic diversity analysis of four consecutive breeding generations of large yellow croaker(Pseudosciaena crocea)using microsatellite markers[J].Journal of Fisheries of China,2010,34(4):500-508.
[27] WANG T,ZHANG M,MA Z,et al.A role of Rab7 in stabilizing EGFR-Her2 and in sustaining Akt survival signal[J].Journal of Cellular Physiology,2012,227(6):2788-2797.