岳华梅,翟 晴,宋明月,叶 欢,杨晓鸽,李创举
(农业部淡水多样性保护重点实验室,中国水产科学研究院长江水产研究所,武汉 430223)
基于转录组测序的兴国红鲤微卫星标记筛选
岳华梅,翟晴,宋明月,叶欢,杨晓鸽,李创举
(农业部淡水多样性保护重点实验室,中国水产科学研究院长江水产研究所,武汉430223)
摘要:采用Illumina高通量测序技术,对兴国红鲤(Cyprinuscarpiovar.singuonensis)垂体和性腺等组织进行转录组测序分析,筛选微卫星标记并分析其组成及特征。结果显示:共获得13 652个微卫星标记,对所得位点进行分类,单核苷酸重复类型占47.86%,二、三、四、五、六核苷酸重复类型所占比例分别为34.43%、16.32%、1.25%、0.12%以及0.02%。随机选取30个SSR位点进行PCR验证,有20对可以扩增出清晰稳定的条带。在24个兴国红鲤个体中对上述位点进行多态性分析,结果表明,具有多态性的微卫星引物为9对。不同位点得到的等位基因范围为2~4,平均等位基因数为3.111 1±0.993 8,观测杂合度(Ho)、期望杂合度(He)以及多态信息含量(PIC)平均值分别为0.597 2±0.233 2、0.539 7±0.178 0和0.467 2±0.172 1。9个微卫星位点中,有4个显著偏离哈代-温伯格平衡(Hardy-Weinberg equilibrium,HWE)(P<0.05)。Illumina高通量测序提供了一种直观、高效开发微卫星标记的方法,所选兴国红鲤群体遗传多样性维持较好。
关键词:兴国红鲤(Cyprinuscarpiovar.singuonensis);高通量测序;微卫星标记
微卫星DNA 侧翼序列相对保守,而核心序列具有高突变性,因此可以根据侧翼序列的保守性设计引物,通过PCR 方法检测微卫星序列的多态性。目前,开发微卫星标记的方法虽然很多,但大都存在步骤繁琐、效率低、耗时长等问题。高通量测序技术的快速发展,使得一次对几十万到几百万条DNA分子进行序列测定成为可能,进一步采用相关软件从这些DNA序列中可以开发出成千上万的SSR标记。Xu等[1]通过对鲤进行全基因组鸟枪法测序,从中挖掘得到3 470个高质量的SNP标记和773个微卫星标记,并将其聚类到50个连锁群中。采用Illumina高通量测序技术,Li et al.对泥鳅进行了转录组测序,并通过msatcommander 软件挖掘出15,106个SSR标记;随后的PCR扩增验证表明87.8%的备选位点具有多态性[2]。因此,高通量测序由于其高效性迅速成为开发DNA分子标记的首选。
兴国红鲤(Cyprinuscarpiovar.singuonensis) 主要分布在江西省兴国县,它是在自然环境的影响下逐渐形成的一个鲤鱼地方品种,已有超过1300年的养殖历史[3]。兴国红鲤是重要的杂交亲本,在我国鱼类杂交育种中具有重要作用。从1972—1984 年,相关单位已对其进行了6代定向选育,培育出性状稳定的品种[4],目前已选育至20代。在多代选育的过程中,养殖群体的遗传多样性是否会由于近期繁殖等影响逐渐降低,目前尚无相关报道。本研究采用IIlumina高通量测序技术,从兴国红鲤生殖相关组织的转录组序列中,筛选出一批SSR序列并开发微卫星引物,为进一步分析兴国红鲤的遗传结构和遗传标记辅助育种提供一定的理论基础。
1材料与方法
1.1样品采集与RNA提取
兴国红鲤取自江西省兴国红鲤良种场。取六尾健康的兴国红鲤垂体、性腺组织(雌雄各3尾)保存于RNA laterTM (Ambion,Austin,TX,USA) 中,4 ℃存放16 h后转入-80 ℃冰箱保存。采用Trizol(Invitrogen)法分别提取垂体、精巢、卵巢组织的总RNA,加入DNase(Qiagen) 消化30 min以去除基因组DNA。所提取总RNA 的质量和数量采用安捷伦生物分析仪2100 (Agilent) 和Nanodrop-2000 紫外分光光度仪(Thermo) 进行检测。
1.2cDNA文库构建及Illumina测序
分别取等量的垂体、精巢、卵巢RNA进行混合(总量100 ng),利用mRNA-Seq 试剂盒(Illumina)合成cDNA,通过末端修复、连接接头和纯化,获得兴国红鲤混合样品的cDNA 文库。采用Illumina HiSeq 2000测序仪进行高通量测序,所得数据转化为fastq格式用于后续序列拼接,测序读长为90 bp。
1.3转录组拼接
测序所得原始序列(raw reads)通过filter_fq软件(华大基因)过滤去除接头引物序列以及低质量序列(Q-value=20)。所得干净序列(clean reads)运用Trinity软件[5]进行转录组从头组装。
1.4微卫星标记(SSRs)挖掘
采用MISA软件(MIcroSAtellite;http://pgrc.ipk-gatersleben.de/misa,version 1.0) 挖掘兴国红鲤转录组序列(>1 000 bp)中的微卫星标记[6]。为了鉴定一、二、三、四、五、六核苷酸的重复,阈值分别被设为10、6、5、5、5、5。根据碱基互补配对原则,将所有互补的简单重复序列视为一类,因此二核苷酸重复单元分为AT、AG、AC和CG四种,以此类推,三核苷酸重复单元可分为10类,四核苷酸重复单元可分为33类,五核苷酸重复单元可分为102类,六核苷酸重复单元可分为350类。
1.5微卫星引物设计与多态性验证
挑选两侧翼区均足够长的微卫星序列,用Primer5.0软件设计引物进行PCR扩增。PCR反应程序:94 ℃预变性5 min,94 ℃变性30 s,退火30 s,退火温度依引物而异,72 ℃延伸1 min,34个循环;72 ℃延伸10 min,扩增产物经琼脂糖凝胶法检验后,4 ℃保存。多态性验证采用8%的非变性聚丙烯酰胺凝胶电泳进行。选取兴国红鲤个体24个,非变性聚丙烯酰胺凝胶电泳后采用银染法显色定影,并拍照保存。
1.6数据统计与分析
群体扩增结果统计时,将每个位点所有条带按照片段从大到小依次命名为A,B,C,D,即为等位基因,并按照每个个体的带型统计出基因型。利用PopGene32软件统计每个微卫星位点的等位基因数(Allele number,Na)、观测杂合度(observed heterozygosity,Ho)、期望杂合度(expected heterozygosity,He)[7]、哈代-温伯格平衡(Hardy-Weinberg equilibrium,HWE)以及位点间连锁不平衡检验(LD)。采用PIC_CALC软件计算各个位点的多态信息含量(polymorphism information content,PIC)。采用MicroChecker 2.2.3 (http://www.microchecker.hull.ac.uk/) 计算无效等位基因概率[8]。
2结果与分析
2.1测序结果和特性分析
采用Illumina Hiseq 2000对兴国红鲤垂体、精巢、卵巢混合cDNA文库进行测序,共得到53472104条clean reads,GC含量为49.20%。通过Trinity软件拼接,总共得到89 511条unigene序列。
2.2SSRs的组成类型分布
为了寻找SSR位点,将拼接所得序列提交到MISA软件进行分析,总共得到13 652个SSR位点,其中1 760条序列包含一个以上的SSR。根据重复单元的类型和重复次数,将不同的SSR位点进行分类(表1),其中数量最多的SSR基序为单核苷酸重复,比例占全部重复序列的47.86%,其次是二核苷酸和三核苷酸重复,比例分别为34.43%和16.32%,四、五、六核苷酸重复的SSR类型较少,所占比例分别为1.25%、0.12%以及0.02%。
表1 兴国红鲤转录组中SSRs类型统计
2.3SSR引物筛选结果及兴国红鲤群体遗传多样性分析
选取其中的30个SSR位点设计引物,进行PCR扩增,其中有20对可以扩增出清晰稳定的条带。对这20对引物在24个兴国红鲤个体中进行PCR扩增,并通过8%聚丙烯酰胺凝胶电泳检测(图1),筛选出具有多态性的微卫星引物共9对,包括6对复合SSR位点单元,3对二核苷酸重复单元,具体引物信息见表2。
图1 部分微卫星引物扩增带谱
位点引物序列重复片段退火温度/℃GenBank注册号C1F:ATTGAAGTTCTGAGATCAACATGCCATCTTAR:GACCAGATGAGTGCGAGAGATGAAG(CA)655KT384362C6F:GACTTTTTGTTGTTGTAAATACCACCTR:AATCCTCAGTCCTGTTCTCCCAT(GT)655KT384363C7F:CATCTTTGAAGCACAGGTGAGGAGR:TTCACAGCATCTAACATCCTCCATT(CA)655KT384364C8F:CACAAGAGGCAATGTATTACGCAGR:CTTGTTTTGTTGTGGTACAGGACTTC(TG)1255KT384365C10F:CGTAGGAGAGTGTGAGAAGCAGTGAR:ATCGTGGTCTTTATTGGTCAGGC(AG)655KT384366C12F:AAAAACGAGGCAGACAGAAGATGAGR:GCGTGTGTTTTGTTGATTTGATTGT(CT)655KT384367C18F:TGAATGATGCCCAAAAGTCTATGTCR:TGTGAGGACATTTTATGCTCCAGAT(AC)7(TA)854KT384368C21F:TGTTTGAAACTGAATCACTCCGTGTR:TCACAGTCTCACATGCGCGC(GT)8(TG)954KT384369C23F:ACAAAAGTGAGAGGCAGTTTAGAGGR:ACAAGAGAAAATGATTGAGTTTAGGGT(TG)653KT384370
根据9对SSR 引物在24个个体中扩增片段的分布情况进行统计,得出等位基因数(Na)在2~4之间,平均等位基因数为3.111 1±0.993 8,Ho和He分别在0.250 0~1.000 0和0.283 7~0.730 5之间,平均值分别为0.597 2±0.233 2和0.539 7±0.178 0(表3)。多态信息含量(PIC)在0.239 2~0.663 3范围内,平均值为0.4672±0.1721。其中5个SSR 位点的PIC值均大于0.5,3个位点的PIC值在0.25~0.5之间,2 个位点的PIC值小于0.25(表3)。此外,我们还对每个位点进行了Hardy-Weinberg平衡χ2检验和位点间的连锁不平衡检验(LD)。结果发现有四个位点(C1、C8、C18、C21)显著偏离HWE,而位点间的连锁不平衡检验(LD)没有显著性(P<0.05)。MicroChecker 2.2.3软件分析发现,所选取的9个位点中不存在无效等位基因。
表3 24个兴国红鲤个体中的9个微卫星位点的特征描述
3讨论
转录组平台的构建,在很大程度上推动了DNA分子标记的开发。近年来利用转录组数据获得含有微卫星的序列,并对其进行遗传多样性的研究在国际上已有很多成功报道[9-10]。采用转录组高通量测序,研究者从鲢鱼转录组拼接所得序列中筛选得到13 327个SSR标记[11]。 Ji等[12]采用Roche 454测序法从鲤转录组数据中筛选得到2 064个微卫星标记。同样的,Liao等[13](2013) 从鲫鱼转录组数据中挖掘得到11 295个微卫星标记。可见该方法已成功应用于大规模筛选鱼类微卫星标记位点。本试验采用Illumina高通量测序平台对兴国红鲤生殖相关组织进行转录组测序,并从中批量筛选出大量SSR位点。选取具有清晰扩增条带的20个微卫星位点,其中有9个呈现出不同程度的多态性。相比传统的SSR筛选方法,该方法筛选效率高,工作量相对较小,适合大规模开发微卫星标记位点。这些开发的位点可能与功能基因相关,从而可为后续遗传图谱构建、QTL定位等提供有力支持。
群体的遗传多样性主要表现在等位基因数、杂合度和多态信息含量三个方面[14]。本研究所获得兴国红鲤9个多态位点的等位基因数平均为3.111 1±0.993 8,Ho和He平均值分别为0.597 2±0.233 2和0.539 7±0.178 0(表2)。作为衡量多态信息含量的指标,PIC>0.5为高度多态性位点, 0.25 参考文献: [1]Xu P,Zhang X F,Wang X M,et al.Genome sequence and genetic diversity of the common carp,Cyprinuscarpio[J].Nat Genet,2014,46:1212-1219. [2]Li C J,Ling Q F,Ge C,et al.Transcriptome characterization and SSR discovery in large-scale loach Paramisgurnus dabryanus (Cobitidae,Cypriniformes)[J].Gene,2015,557(2):201-208. [3]王成辉,李思发,邹曙明.中国红鲤遗传多样性的PAPD分析[J].水生生物学报,2003,27(3):329-331. [4]楼允东,孙景春.江西三种红鲤起源与遗传多样性研究进展[J].水产学报,2001,25(6):570-575. [5]Grabherr M G,Haas B J,Yassour M,et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nat Biotechnol,2011,29:644-650. [6]Yue H M,Li,C J,Du H,et al.Sequencing andDeNovoassembly of the gonadal transcriptome of the endangered Chinese Sturgeon (Acipensersinensis)[J].Plos One,2015,10(6):e0127332, [7]潘婷,张岩,张辉,等.基于Roche 454 GS FLX 的钝吻黄盖鲽(Pleuronectesyokohamae)微卫星标记的开发[J].渔业科学进展,2015,36(1):26-32. [8]Cock V O,William F H,Derek P M W,et al.Microchecker:software for identifying and correcting genotyping errors in microsatellite data[J].Mol Ecol Notes,2004,4:535-538. [9]Xiao T Q,Lu C Y,Xu Y L,et al.Screening of SSR markers associated with scale cover pattern and mapped to a genetic linkage map of common carp (CyprinuscarpioL.)[J].J Appl Genet,2015,56(2):261-269. [10]Tian C X,Liang X F,Yang M,et al.New microsatellite loci for the mandarin fishSinipercachuatsiand their application in population genetic analysis[J].Genet Mol Res,2014,13(1):546-558. [11]Fu B D,He S P.Transcriptome analysis of silver carp (Hypophthalmichthysmolitrix) by paired-end RNA sequencing[J].DNA Res,2012,19(2):131-142. [12]Ji P F,Liu G M,Xu J,et al.Characterization of common Carp transcriptome:sequencing,DeNovoassembly,annotation and comparative genomics[J].PLoS One,2012,7(4):e35152. [13]Liao X L,Cheng L,Xu P,et al.Transcriptome analysis of crucian carp (Carassiusauratus),an important aquaculture and hypoxia-tolerant species[J].PLoS One.2013,8(4):e62308. [14]Senanan W,Kapuscinski A R,Na-Nakorn U,et al.Genetic impacts of hybrid catfish farming (Clariasmacrocephalus×C.gariepinus) on native catfish populations in central Thailand[J].Aquaculture,2004,235(1-4):167-184. [15]Botstein D,White R L,Skolnick M,et al.Construction of a genetic linkage map in man using restriction fragment length polymorphisms[J].Am J Hum Genet,1980,32:314-324. [16]Nagy S.PICcalc:An online program to calculate polymorphic information content for molecular genetic studies[J].Biochem Genet,2012,50:670-672. [17]Shete S,Tiwari H,Elston R C.On estimating the heterozygosity and polymorphic information content value[J].Theor Popul Biol,2000,57(3):265-271. (责任编辑:张红林) Development of microsatellite markers in Cyprinus carpio var.singuonensis using next-generation sequencing YUE Hua-mei,ZHAI Qing,SONG Ming-yue,YE Huan,YANG Xiao-ge,LI Chuang-ju (KeyLaboratoryofFreshwaterBiodiversityConservation,MinistryofAgriculture, YangtzeRiverFisheriesResearchInstitute,ChineseAcademyofFisheryScience,Wuhan430223,China) Abstract:The simple sequence repeats (SSRs) were detected from the transcriptome of pituitary and gonad in culturedCyprinuscarpiovar.singuonensisby high-throughput Illumina sequencing,whose classifications and characterization were analyzed as well.It was shown that a total of 13,652 SSRs were found,which were composed of six repeat units types:mononucleotide repeat units (47.86%),dinucleotide repeat units (34.43%),trinucleotide repeat units (16.32%),tetranucleotide repeat units (1.25%),pentanucleotide repeat units (0.12%) and hexanucleotide repeats (0.02%).Twenty out of thirty PCR primers,designed from random SSR sequences,were able to amplify steady and clear sequence bands by PCR.By further PCR amplifications in 24C.carpiovar.singuonensisindividuals,nine of the twenty SSRs were proved to be polymorphic.In addition,the number of alleles,heterozygosity scores,and polymorphism information content (PIC) of the nine SSRs were analyzed.The number of alleles per locus ranged from 2 to 4,with an average of 3.111 1±0.993 8.The average values of observed heterozygosity (Ho),expected heterozygosity (He) and polymorphism information content (PIC) were 0.597 2±0.233 2、0.539 7±0.178 0 and 0.467 2±0.172 1,respectively.The χ2test of Hardy-Weinberg equilibrium revealed that genetic disequilibrium was observed in four SSR loci from the nine loci analyzed.These results indicate that Illumina sequencing provides a direct and high-efficient method to develop microsatellite sites,and the Xingguo red carp population analyzed in this study retained fine genetic diversity. Key words:Cyprinuscarpiovar.singuonensis;high-throughput sequencing;microsatellite markers 中图分类号:S917.4 文献标识码:A 文章编号:1000-6907-(2016)01-0024-05 作者简介:第一岳华梅(1984-),女,博士,助理研究员,专业方向为生殖发育调控。 E-mail:yhuam@yfi.ac.cn通讯作者:李创举。 E-mail:lcj@yfi.ac.cn 收稿日期:2015-02-06; 修订日期:2015-06-23 资助项目:国家高技术研究发展计划项目课题一(2011AA100401)