基于沙棘转录组序列开发EST-SSR分子标记

2017-02-23 07:36李珊珊曾艳飞何彩云张建国
林业科学研究 2017年1期
关键词:沙棘核苷酸多态性

李珊珊,曾艳飞,何彩云,张建国,2*

(1.国家林业局林木培育重点实验室,中国林业科学研究院林业研究所,北京 100091;2.南京林业大学南方现代林业协调创新中心,江苏 南京 210037)

基于沙棘转录组序列开发EST-SSR分子标记

李珊珊1,曾艳飞1,何彩云1,张建国1,2*

(1.国家林业局林木培育重点实验室,中国林业科学研究院林业研究所,北京 100091;2.南京林业大学南方现代林业协调创新中心,江苏 南京 210037)

沙棘;转录组;EST-SSR;引物

沙棘属(Hippophae)属于胡颓子科(Elaeagnaceae),是多年生落叶灌木、小乔木或乔木,风媒传粉,雌雄异株,具有固氮作用,适应性极强,主要分布于中欧和中亚地区[7]。依据Sun等[7]和Bartish等[8]学者的系统分类,分为7个种和8个亚种。沙棘是集生态效益、经济效益和社会效益为一体的多用途树种,因其果实富含Vc和沙棘油,枝叶含高蛋白,根系有根瘤等特点备受瞩目[9]。近些年,随着DNA 分子标记技术的不断发展与完善,针对沙棘遗传多样性、亲缘关系和品种鉴定等的研究得到进展[10],如利用RFLP、ITS、cpDNA等分子标记对沙棘进行了研究[7-8, 11],但利用SSR分子标记对沙棘的研究较少, 同时目前开发可用的沙棘SSR引物较少,仅有孙燕琳等[12]利用葡萄SSR引物筛选适用于沙棘的SSR引物,Wang等[13]利用磁珠富集法开发的9对SSR引物和Jain等[14]利用EST开发的11对EST-SSR引物。为了丰富沙棘的SSR分子标记,本研究通过对向阳沙棘转录组序列进行分析,开发出大量EST-SSR标记,为沙棘亲本分析、遗传多样性、遗传育种等研究提供支持。

1 材料与方法

1.1 植物材料及DNA提取

本研究中涉及转录组测序的沙棘品种“向阳”(H.rhamnoidessubsp. mongolica al Xiangyang)是俄罗斯专家通过天然蒙古沙棘选育所得。随机选取采自新疆青河县莫齐克村的天然种群蒙古沙棘中的16个个体,采用植物全基因组DNA提取试剂盒(北京天根生物公司)从其叶片中提取总DNA,用于引物筛选和多样性检测。

1.2 EST序列来源、SSR检测及SSR引物设计

1.2.1 EST序列来源 沙棘EST序列来源于本实验室对“向阳”品种的转录组测序所得。收集向阳沙棘新鲜根、茎、叶提取RNA,构建cDNA文库,再利用Illumina Hiseq2000测序平台 (IlluminaInc)进行高通量测序,最后用 Trinity[15]软件将测序序列拼接成无冗余的独立基因集,即由EST序列组成的一个转录组。该实验由北京诺禾致源生物信息科技有限公司完成。所得转录组序列已提交到NCBI数据库,序列号为SRP067785。

1.2.2 EST-SSR位点统计和引物设计 利用软件MISA(http://pgrc.ipk-gatersleben.de/misa/misa.html)检测转录组序列中简单重复序列,确定SSR位点。SSR的搜索标准为:单、二、三、四、五和六核苷酸的最少重复次数分别为10、6、5、5、5、5,同时搜索复合SSR。对不同SSR类型在转录组中的密度分布进行统计。

1.3 EST-SSR位点PCR扩增和筛选

1.4 沙棘EST-SSR多态性分析

从筛选出具有多态性(等位基因数≥2)的引物中,进一步筛选在蒙古沙棘个体中扩增成功率高、且上机检测峰图明晰的EST-SSR位点。利用GENALEX 6软件计算每个位点在这16个沙棘个体中的等位基因数量、观测杂合度(Ho)和期望杂合度(HE)。

2 结果与分析

2.1 沙棘ESR-SSR重复类型及频率

对沙棘转录组中的EST序列去冗余后共收集17 383条具有SSR位点的序列,其中包括复合SSR类型序列828条,因其特殊性不计入SSR类型分析。在非复合的SSR类型中,单核苷酸重复类型数量最多,所占比例达到62.77%(10 392);其次是二核苷酸和三核苷酸重复类型,所占比例分别为21.82%(3 613)和13.77%(2 279)。四核苷酸、五核苷酸、六核苷酸重复类型较少,分别仅占1.45%(240)、0.09%(15)、0.10%(16)。

在所检测到的3 613个二核苷酸重复EST-SSR中,AT和AG两种类型的重复基元出现的次数较多,分别为1 814个(50.21%)和1 521(42.10%)(图1a)。在检测到的2 279个三核苷酸重复中,AAG为优势类型,共783个(34.36%),ATC和ATA两种类型次之,分别为400个(17.55%)和395个(17.33%)(图1b)。

图1 沙棘ESR-SSR二核苷酸(a)和三核苷酸(b)重复基元类型及其数量Fig.1 Observed counts of identified microsatellite loci for different repeat sequence motifs of(a) di-nucleotide and (b) tri-nucleotide repeats from the transcriptome sequences of Hippophae

2.2 ESR-SSR的引物设计与筛选

利用Primer 3.0为9 291条EST序列设计了适宜的SSR扩增引物,剩余的8 092条序列没能得到合适的引物。从设计的引物中随机挑选179对二核苷酸、三核苷酸重复的EST-SSR引物进行PCR扩增检测,发现142个位点能够在预期片段大小的位置扩增出清晰的条带,扩增效率为79.33%。

表1 沙棘17个多态EST-SSR位点的引物信息Table 1 Information of 17 Hippophae EST-SSR loci in transcriptome sequences and tested with 16 sample

3 讨论

3.1 沙棘EST-SSR特性分析

本研究通过对具有SSR位点的17 383条EST序列的分析发现,在沙棘转录组序列中,单核苷酸重复类型的SSR最多,其次是二核苷酸重复类型和三核苷酸重复;四核苷酸,五核苷酸和六核苷酸重复类型的总和不到1.7%。由于单核苷酸的特殊性,大多数研究不将其作为SSR的研究对象[18]。因此,忽略单核苷酸重复不计,沙棘的EST-SSR位点以二核苷酸和三核苷酸重复类型为主,这与目前大多数植物的研究一致[19]。先前研究表明,二核苷酸重复在许多种的基因组中是常见类型,但是在编码区出现的频率低于非编码区,编码区常见的重复类型为三核苷酸。这可能是因为编码区的序列为密码子序列,随着三核苷酸的增加或减少会改变阅读框架[6],但是不会引起移码突变[20],而本研究中,二核苷酸重复类型所占比例高于三核苷酸重复类型,不同于胡杨EST-SSR的研究[20]。这可能是由于不同研究搜索SSR的标准(SSR重复类型、次数、长度等)不同造成的差异[19]。

在沙棘二核苷酸重复基元的EST-SSR位点中,AT 和AG是出现次数最多的两种类型,分别占50.21%和42.10%;在三核苷酸重复基元中,AAG为优势重复类型,占34.36%,ATC与ATA基元所占比例之和将近35%。沙棘的重复基元的主要类型与白桦、银杏、杨树、北美鹅掌楸、火炬树、蒙古栎等木本植物基本相同[2],与水稻、高粱、玉米等作物存在差异,不同物种之间重复基元存在的差异可能与各研究所用EST来源及数目不同,也可能与物种转录组的特异性等有关[21]。

3.2 沙棘EST-SSR引物扩增效果及多态性

本研究设计的EST-SSR引物在天然蒙古沙棘种群中扩增效率较高,达到79.33%。剩余引物无法扩增的原因可能是:基因组DNA存在许多内含子片段,SSR位点所设计的一端或两端引物的位置刚好位于内含子或者外显子剪切点,致使引物在基因组中找不到结合位点[19]。另外,在引物的初筛过程中统一采用55 ℃退火进行PCR,这也可能造成最适退火温度低的引物无法成功扩增。

判断SSR分子标记可用性的主要依据是其多态性,本研究通过对天然蒙古沙棘种群的16个个体分析,发现40对具有多态性的引物,多态比率为43.48%,低于胡杨(P.euphraticaOliv.,52.5%)[20]和中华猕猴桃(ActinidiachinensisPlanch.,81.25%)[22],高于银杏(GinkgobilobaLinn.,31.9%)[23]。对17个扩增稳定且上机峰图明细的位点进一步分析,得到来自新疆的天然蒙古沙棘种群遗传多样性处于中等水平(HO=0.488,HE=0.514)。由于沙棘为雌雄异株,所以沙棘种群的遗传多样性相对较高,不同位点多样性水平差别较大,但是这些位点的平均多样性水平仍高于Wang等[13]利用磁珠法开发的基因组SSR所估算的中国沙棘亚种的多样性。这说明利用编码区的SSR位点估计的遗传多样性水平不一定低于基因组SSR位点。

4 结论

本研究利用EST序列成功开发了40对具有多态性的沙棘引物。利用蒙古沙棘的16个样品对2种开发的引物进行多态性水平的检验和多态性相关分析,发现利用序列数据开发的引物多样性高且多态性信息含量相对比较丰富,可为沙棘属植物进行遗传多样性分析、遗传图谱构建系统发育分析和分子育种等多个方面的研究提供有力的支持

[1] Tautz D.Hypervariabflity of simple sequences as a general source for polymorphic DNA markers[J]. Nucleic acids research, 1989,17(16): 6463-6471.

[2] 许玉兰, 蔡年辉, 康向阳, 等. EST-SSR 标记的开发及其在木本植物中的分布特点[J]. 中国农学通报, 2012, 28(4): 1-7.

[3] Kalia R K, Rai M K, Kalia S,etal. Microsatellite markers: an overview of the recent progress in plants[J]. Euphytica, 2011, 177(3): 309-334.

[4] 程小毛, 黄晓霞. SSR 标记开发及其在植物中的应用[J]. 中国农学通报,2011, 27(5): 304-307.

[5] 赵 罕, 朱高浦, 刘梦培, 等.微卫星分子标记及其在林业中的应用[J]. 世界林业研究, 2013,26(6): 21-26.

[6] Ueno S, Moriguchi Y, Uchiyama K,etal. A second generation framework for the analysis of microsatellites in expressed sequence tags and the development of EST-SSR markers for a conifer[J].Cryptomeriajaponica. BMC Genomics, 2012, 13: 136.

[7] Sun K, Chen X, Ma R,etal. Molecular phylogenetics ofHippophaeL. (Elaeagnaceae) based on the internal transcribed spacer (ITS) sequences of nrDNA[J]. Plant Systematics and Evolution, 2002, 235(1): 121-134.

[8] Bartish I V, Jeppsson N, Nybom H,etal. Phylogeny ofHippophae(Elaeagnaceae) inferred from parsimony analysis of chloroplast DNA and morphology[J]. Systematic Botany, 2002,27(1): 41-54.

[9] 齐虹凌, 于泽源, 李兴国. 沙棘研究概述[J]. 沙棘, 2005, 18(2): 37-41.

[10] 李 蓉, 于永涛. DNA 分子标记及在沙棘遗传育种中的应用展望[J]. 国际沙棘研究与开发, 2008, 6(2): 19-25.

[11] Wang A, Schluetz F, Liu J. Molecular evidence for double maternal origins of the diploid hybridHippophaegoniocarpa(Elaeagnaceae)[J]. Botanical Journal of the Linnean Society, 2008, 156(1): 111-118.

[12] 孙燕琳, 阮成江, 金 华. 沙棘 SSR 分子标记的开发[J]. 安徽农业科学, 2007, 35(1): 45-46.

[13] Wang A, Zhang Q, Wan D,etal. Nine microsatellite DNA primers forHippophaerhamnoidesssp.sinensis(Elaeagnaceae)[J]. Conservation Genetics, 2008, 9(4): 969-971.

[14] Jain A, Ghangal R, Grover A,etal. Development of EST-based new SSR markers in seabuckthorn[J]. Physiology and Molecular Biology of Plants, 2010, 16(4): 375-378.

[15] Grabherr M G, Haas B J, Yassour M,etal. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature biotechnology, 2011, 29(7): 644-652.

[16] Grabherr M G, Haas B J, Yassour M,etal. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature biotechnology, 2011, 29(7): 644-652.

[17] Schuelke M. An economic method for the fluorescent labeling of PCR fragments[J]. Nature biotechnology, 2000, 18(2): 233-234.

[18] 贯春雨, 张含国, 张 磊, 等. 基于松科树种 EST 序列的落叶松 SSR 引物开发[J]. 东北林业大学学报, 2011, 39(1): 20-23.

[19] 高丽霞. 桑树 EST—SSR 引物开发[J]. 南方农业学报, 2013, 44(8): 1254-1257.

[20] Du F K, Xu F, Qu H,etal. Exploiting the transcriptome of Euphrates Poplar,Populuseuphratica(Salicaceae) to develop and characterize new EST-SSR markers and construct an EST-SSR database[J]. PloS one, 2013, 8(4): e61337.

[21] 李文娟, 马 宏, 李正红, 等. 基于芭蕉属 EST 序列的地涌金莲 SSR 引物开发[J]. 林业科学研究, 2012, 25(2): 111-116.

[22] 孟 蒙, 唐 维, 刘 嘉, 等. 基于中华猕猴桃 “红阳” 转录组序列开发 EST-SSR 分子标记[J]. 应用与环境生物学报, 2014, 20(4): 564-570.

[23] 李广平, 曹福亮. 银杏 EST-SSR 引物开发[J]. 西北农业学报, 2012, 21(12): 149-152.

(责任编辑:詹春梅)

Development of EST-SSR Markers Based on Seabuckthorn Transcriptomic Sequences

LIShan-shan1,ZENGYan-fei1,HECai-yun1,ZHANGJian-guo1,2

(1.Key Laboratory of Tree Breeding and Cultivation, State Forestry Administration, Research Institute of Forestry, Chinese Academy of Forestry,Beijing 100091, China; 2.Collaborative Innovation Center of Sustainable Forestry in Southern China, Nanjing Forestry University,Nanjing 210037, Jiangsu, China)

[Objective]The transcriptomes ofHippophaerhamnoidessubsp.mongolicacv‘Xiangyang’ were analyzed to design primers and develop EST-SSR (Expressed Sequence Tags-Simple Sequence Repeat) markers.[Method]The primers were designedand the SSR was developed based on the Expressed Sequence. 179 pairs of primers were validated randomly. [Result]17 383 SSR-ESTs (SSR-containing EST) were identified. Of the total EST-SSRs, the mononucleotiderepeat was the most dominant type, accounting for 62.77%, followed by dinucleotiderepeats and trinucleotiderepeats, accounting for 21.82% and 13.77%, respectively. AT and AG were the most abundant dinucleotide motifs; AAG, ATC and ATA were repeated dominant motifs in trinucleotide. Based on these SSR-ESTs, 9 291 pairs of EST-SSR primers were designed; 179 pairs of primers were randomly selected and compounded for PCR amplification, among which 142 loci were amplified successfully. Amplificationproductions of 92 loci were genotyped using the DNA analyzer, of which 40 loci (43.48%) were identified as polymorphism. At last, 17 loci that amplified highly successfully and genotyped easily were recommend and analyzed for naturalH.rhamnoidessubsp.mongolicaindividuals, with observedheterozygosity (HO) ranged from 0.083 to 0.875 and expected heterozygosity (HE) ranged from 0.180 to 0.750. [Conclusion]These EST-SSR markers would be valuable for further research on genetic diversity analysis, linkage mapping construction and molecular breeding of the genusHippophae.

Hippophaerhamnoides; transcriptome; EST-SSR; primer

10.13275/j.cnki.lykxyj.2017.01.0010

2016-01-04

林业公益性行业科研专项(201504103)

李珊珊(1989—),女,河北邢台人,硕士,主要从事分子生态学研究.
* 通讯作者.E-mail: zhangjg@caf.ac.cn

S718.46

A

1001-1498(2017)01-0069-06

猜你喜欢
沙棘核苷酸多态性
沙棘种植让日子甜滋滋
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
沙棘颂
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
Acknowledgment to reviewers—November 2018 to September 2019
沙棘在西藏的发展前景探讨
日粮核苷酸对动物肠道健康和免疫功能的影响及其在养猪生产中的应用
沙棘产业的直销之路
蒙古斑在维吾尔族新生儿中分布的多态性