黑桃转录组微卫星特征分析

2018-07-04 01:37刘丽丽李建辉郑雪良陈骏杨海英刘春荣
浙江柑橘 2018年2期
关键词:黑桃基元微卫星

刘丽丽 李建辉 郑雪良 陈骏 杨海英 刘春荣

(浙江省衢州市农业科学研究院衢州324000)

黑桃是原产于我国浙西山区的一个稀有地方特色桃品种,又名乌桃,属南方品种群硬肉桃亚群[1,2]。黑桃果实皮紫肉红,汁液丰富,酸甜适中,口感爽脆独特,具有浓郁的蜂蜜风味及较高的药用和保健价值,是目前非常稀少的集食用和保健于一体的珍贵水果。因此,随着人们营养和保健意识的增强,黑桃必将日益受到消费者的亲睐,发展前景十分广阔。

近年来,随着分子生物学研究的不断深入和实践应用的快速发展,DNA分子标记技术在桃研究中的应用越趋广泛[3,4]。微卫星(Microsatellite)又称简单序列重复(simple sequence repeat,SSR),是一类由几个核苷酸( 1~6bp)组成的串联重复DNA序列,广泛分布于各类真核生物和部分原核生物基因组中,由于重复基元和次数不同从而形成了等位基因之间的多态性[5~7]。相比较其他分子标记而言,微卫星标记具有较高的多态性和较好的重复性,同时还具有进化所受选择压力小、共显性遗传、易于分析等特点[8,9],现已广泛应用于分子生物学、遗传学、育种学等领域[10~12]。

为此,本文利用IlluminaHiseqTM2500/MiSeqTM高通量测序平台对黑桃转录组进行双向测序,并对其微卫星序列特征进行分析,以期为后续开展黑桃种质资源创新和利用提供依据。

1 材料与方法

1.1 实验材料

2016年 9月在衢州市农业科学研究院果树研究所试验基地采集黑桃健康幼嫩叶片,擦拭干净后用液氮迅速冷冻,再装入放有足量干冰的低温贮藏箱中送至上海翰宇生物科技有限公司利用IlluminaHiseqTM2500/MiSeqTM高通量测序平台进行转录组双向测序。

1.2 分析方法

从黑桃叶片中提取总RNA,使用2100Bioanalyzer对总RNA进行质检,并对合格RNA样本利用DNaseI(Takara,日本)在37℃消化30min。DNase消化后的RNA利用Dynabeads®Oligo(dT)25(Life,美国)进行mRNA纯化。将得到的RNA补足至100μl的体积,加100μl Binding Buffer,65℃加热2min,立即置冰上冷却,加入100μl预洗涤过的磁珠,室温下充分混匀5min,置磁力架(Life,美国)上1~2 m i n,将上清吸取干净,加200μl Washing Buffer B洗涤两次后,加15μl预冷的10 mM Tris-HCl重悬磁珠,75℃~80℃加热2min,立即置磁力架上1~2min,小心吸取上清,即为纯化得到的mRNA。取100ng 纯化的mRNA,用NEBNext®UltraTMRNA Library Prep Kit for Illumina(NEB,美国)构建文库。文库构建完成后,经Qubit 定量、2%琼脂糖凝胶电泳检测、High-sensitivity DNA chip检测,确保文库质量。取10ng 的文库,用TruSeq PE Cluster Kit(illumina,美国)在cBot中进行cluster generation,然后在IlluminaHiseqTM2500/MiSeqTM中进行双向测序。高通量测序得到的原始图像数据文件经CASAVA碱基识别(Base Calling)分析转化为原始测序序列(Sequenced Reads),结果以FASTQ文件格式存储。同时,为了保证信息分析质量,再对原始数据过滤,得到Clean数据,后续分析都基于Clean数据,使用Trimmomaticv0.32[13]进行数据处理。随后,使用Fastqc v0.10.0[[14]对样品的测序数据质量进行可视化评估。最后对黑桃转录组测序结果采用MIcroSAt,使用Trinityv2.06[15]将clean数据denovo组装成转录本。

对黑桃转录组测序结果采用MIcroSAt -ellite(MISA)软件(http://pgrc.ipkgatersleben.de/misa/)搜索SSR重复序列,设定单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重复分别为12、6、4、4、3和3次。复合SSR 两个位点间最大间隔碱基数为100。

2 结果与分析

2.1 转录组测序组装结果及统计

对黑桃转录组测序共得到30536554个cleanreads,总数据量9.16 G。将clean数据denovo组装成转录本,再对转录本去冗余,取每个转录本聚类中最长的作为Unigene,以此作为后续分析的参考序列。转录本及Unigene统计结果如表1所示,从中可以看出,黑桃转录组测序结果共组装得到79161个转录本,去冗余后得到39120个Unigene,长度介于224~16849,平均长度为1019.17。

2.2 不同重复基元微卫星的类型

表1 黑桃转录组测序组装结果统计

采用MISA软件共搜索到11182个SSR,可分为7种类型:复杂重复、单碱基重复、二碱基重复、三碱基重复、四碱基重复、五碱基重复、六碱基重复,数量分别为978个、4492个、3927个、1597个、127个、33个、28个,表明黑桃转录组中SSR重复基元类型的数量主要以单碱基重复、二碱基重复以及三碱基重复为主,其他类型的数量相对较少。

2.3 不同重复基元微卫星的频率

从黑桃转录组序列中单碱基基元重复次数总体分布情况来看(表2),单碱基微卫星重复以(A)n和(T)n为主,数量分别为2179个、2287个,其中(T)n微卫星重复的数量略多于(A)n。此外,单碱基重复次数主要集中在10个至14个,碱基重复数在15个以上的相对较少。黑桃转录组序列中二碱基重复有(AC)n、(AG)n、(AT)n、(CA)n、(CT)n、(GA)n、(GT)n、(TA)n、(TC)n、(TG)n,数量分别为 73、862、384、62、664、782、44、272、684、100,其中以(TC)n最多,(AG)n次之,(GT)n最少。黑桃转录组序列中三碱基重复以(GAA)n、(TTC)n、(AAG)n数量相对较多。

表2 黑桃转录组序列中SSR单碱基基元重复次数的分布

2.4 微卫星的长度分布

黑桃转录组序列中所发现的微卫星长度存在较大的差异,从10~213个碱基不等,平均长度为22.5个碱基。总体而言,黑桃转录组序列中的微卫星以重复长度小于或等于20bp的短重复序列最多,占微卫星总数的65.65%,而长度大于20bp的长序列重复仅占微卫星总数的34.35%。

3 讨论

微卫星标记具有较强的物种保守性和专一性,不同物种微卫星侧翼序列有所不同,从而限制了微卫星引物的通用性,因此要对一个物种进行微卫星分析,通常需要预先开发这个物种的微卫星标记[16]。目前,开发微卫星标记的方法较多,但普遍存在步骤繁琐、效率低、耗时长等问题。近年来,对转录组进行高通量测序已成为一种高效、快捷的获得基因序列的研究手段,基于该技术进行微卫星标记开发具有信息量大和通用性好的特点,现已广泛应用于不同物种的微卫星引物开发[17,18]。

另一方面,微卫星序列对基因的功能会产生重要影响,其序列特征是了解不同物种基因组差异的重要指标[19]。从本研究结果来看,黑桃转录组共有11182个SSR,可分为7种类型:复杂重复、单碱基重复、二碱基重复、三碱基重复、四碱基重复、五碱基重复、六碱基重复,其中单碱基重复、二碱基重复以及三碱基重复占多数,其他类型的数量相对较少。黑桃转录组序列中单碱基微卫星重复以(A)n和(T)n为主,二碱基重复以(TC)n、(AG)n数量较多,三碱基重复以(GAA)n、(TTC)n、(AAG)n数量较多。黑桃转录组微卫星呈现出单碱基重复较多且单碱基重复主要以(A)n和(T)n为主的分布特征,表明单碱基在整个黑桃转录组中变异最为活跃,这在其他植物中也有类似的报道[20,21]。此外,黑桃转录组序列中微卫星长度介于10~213个碱基,其中以重复长度小于或等于20 bp的短重复序列最多,这与碧桃(Prunus persicacv.duplex)的研究结果基本一致[19]。

对黑桃进行微卫星标记开发,不仅可用于其种质资源创新和利用,而且可为桃属其他植物提供重要分子工具,因而具有广泛的应用前景。本研究对黑桃转录组微卫星特征的分析可为后续开发微卫星标记提供重要参考。从研究结果来看,在开发黑桃微卫星标记过程中,推荐开发(A)n和(T)n为主的单碱基微卫星、(TC)n或(AG)n为主的二碱基微卫星以及(GAA)n或(TTC)n或(AAG)n为主的三碱基微卫星,这些微卫星在黑桃基因组中出现的频率较高,有助于提高引物开发效率。

[1]詹慧杰.乌桃及其生物学特性介绍[J].浙江农业科学,1994, 1:47

[2]张和喜,金有明.乌桃生物学特性及其丰产栽培技术[J].浙江农业科学,1995, 6:309~310

[3]刘丽丽,李建辉,郑雪良等.DNA分子标记技术在桃研究中的应用[J].农业科技通讯,2017, 1:25~28

[4]李建辉,陈骏,刘丽丽等.基于ISSR标记的12份桃种质资源遗传多样性分析[J].上海农业学报,2017,33( 5):8~12

[5]Gur-Arie R,Cohen CJ,Eitan Y,et al.Simple sequence repeats in Escherichia coli:abundance,distribution,composition,andpolymorphism[J].Genome Research,2000,10:62~71

[6]Oppen MJV,Rico C,Turner GF,et al.Extensive homoplasy,nonstepwise mutations,and shared ancestral polymorphism at a complex microsatellite locus in Lake Malawi cichlids[J].Molecular Biology and Evolution,2000,17:489~498

[7]Tóth G,Gáspári Z,Jurka J.Microsatellites in different eukaryotic genomes:survey and analysis[J].Genome Research,2000,10:967~981

[8]Powell W,Morgante M,Andre C,et al.The comparison of RFLP,RAPD,AFLP and SSR(microsatellite)markers for germplasm analysis[J].Molecular Breeding,1996, 2:225~238

[9]ZaneL,BargelloniL,Patarnello T.Strategies for microsatellite isolation:areview[J].Molecular Ecology,2002,11:1~16

[10]Cosimo S M,Papini A,Vessella F,et al.Multiple genome relationships and a complex biogeographic history in the eastern range of Quercus suber L.(Fagaceae)implied by nuclear and chloroplast DNA variation[J].Caryologia,2009,62:236~252

[11]BeheregarayLB,CiofiC,GeistD,et al.Genes record a prehistoric volcano eruption in the Galapagos[J].Science,2003,302(5642):75

[12]Selkoe KA,Toonen RJ.Microsatellites for ecologists:a practical guide to using and evaluating microsatellite markers[J].Ecology Letters,2006, 9( 5):615~629

[13]Bolger AM,Lohse M,Usadel B.Trimmomatic:A flexible trimmer for Illumina Sequence Data[J].Bioinformatics,2014,30(15):2114-2120

[14]Andrews S.FastQC:A quality control tool for high throughput sequence data.Available:http://www.bioinformatics.babraham.ac.uk?/projects/fastqc/.2010

[15]Grabherr MG,Haas BJ,Yassour M,et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nature Biotechnology,2011,29( 7):644~652

[16]李明芳,郑学勤.开发SSR引物方法之研究动态[J].遗传,2004,26( 5):769~776

[17]文亚峰,韩文军,周宏等.杉木转录组SSR挖掘及EST-SSR标记规模化开发[J].林业科学,2015,51(11):40~49

[18]林开勤,李岩,赵德刚.杜仲转录组SSR发掘及标记开发[J].分子植物育种,2016,14( 6):1548~1558

[19]马秋月,廖卓毅,张得芳等.碧桃花瓣转录组微卫星特征分析[J].南京林业大学学报:自然科学版,2015,39( 3):34~38

[20]魏琦琦,林青,贾宝光等.枣转录组序列的微卫星特征分析[J].中南林业科技大学学报,2015,35( 6):93~97

[21]敖妍,马履一,韩树文等.基于高通量测序的文冠果转录组分析[J].中国生物工程杂志,2015,35( 7):22~29

猜你喜欢
黑桃基元微卫星
酰胺质子转移成像和扩散峰度成像评估子宫内膜癌微卫星不稳定状态
绿鳍马面鲀全基因组微卫星分布特征
面向异构履带车辆的统一运动规划方法
基于转录组西施舌微卫星标记开发及隐种鉴定
花斑无须鲶(Ageneiosus marmoratus)全基因组微卫星分布特征研究
基于多重示范的智能车辆运动基元表征与序列生成
牌友黑桃
牌友黑桃
有级转向履带车辆的驾驶员操控行为模型
人体细胞内存在全新DNA结构