金钗石斛转录组SSR位点信息分析

2017-03-06 21:20李清李标郭顺星
中国中药杂志 2017年1期

李清+李标++郭顺星

[摘要]SSR是应用于金钗石斛鉴定和遗传多样性研究的重要分子标记之一。为开发新的SSR标记,寻求快速鉴别金钗石斛的方法,该文通过生物信息学手段对金钗石斛转录组序列进行SSR位点搜索、分析,并设计出SSR特异性引物。结果显示,从金钗石斛转录组中搜索到32 709个SSR,分布与26 742条unigenes中,SSR位点发生频率为1290%,平均每 3 748 bp含1个SSR 位点。其中,单核苷酸是最主要重复类型,占SSR总数的7218%,其次是二核苷酸和三核苷酸,分别占SSR总数的1597%,1119%。而在所有重复基元中,A/T出现频率最高,AG/CT次之。通过设计、筛选,该研究共获得 62 157对SSR位点特异性引物。从中随机挑选20对引物进行PCR扩增,17对扩增出清晰、可重复的条带,扩增率为850%。选择3种石斛检测引物多态性,共获得多态性引物13条。以上结果表明,金钗石斛转录组测序产生的unigenes信息可作为开发SSR标记的有效来源,其中的SSR位点出现密度大、类型丰富、多态性潜能高,在金钗石斛及其近缘种的分子鉴定、遗传多样性与分子育种等方面具有较好的应用前景。

[关键词]金钗石斛; 转录组; SSR; 位点信息

又名金钗石、扁金钗、扁黄草、扁草等,为兰科Orchidaceae石斛属Dendrobium Sw多年生附生草本植物,也是历史上记载最早的石斛习用种类[1]。其新鲜或干燥茎入药具有益胃生津、滋阴清热等功效,在《神农本草经》中列为上品,并作为药用石斛最重要的基原药材被收录于历代《中国药典》。金钗石斛是传统中成药石斛夜光丸、石斛明目丸、石斛清胃散以及现代中成药脉络宁注射液、复方“清咽宁”等的重要配伍成分,具有巨大的市场需求和经济价值。而现代药理学研究发现金钗石斛还具有改善记忆、抗氧化、抗肿瘤等重要功效,药用开发前景不可估量[24]。

然而,由于长期的过度开采和生境破坏,金钗石斛野生资源遭到严重的破坏,几近枯竭。日渐突出的供需矛盾,使市面上金钗石斛混淆品的泛滥现象不断加剧。据报道,市场上常有将兰科石豆兰属、金石斛属和石仙桃属等数十种植物作为药用石斛混入商品流通的现象[5]。以非适产地的劣质石斛充当优质金钗石斛的现象屡见不鲜。而对于大部分人工栽培的金钗石斛,其确切的种源地无法考证、遗传背景认识不清等问题更是久存不解。如此种种,严重影响了金钗石斛的药效质量和开发利用,寻找高效、便捷的鉴别方法迫在眉睫。

近年来,随着分子生物技术的發展,分子标记逐步应用于金钗石斛药材鉴别和种质资源研究中,其中SSR(simple sequence repeats,简单重复序列)标记凭借其多态性高、可重复性强、共显性等优点,成为金钗石斛重要的分子标记之一[6]。然而,由于传统的SSR标记开发过程繁琐、工作量大,费用高,现阶段针对金钗石斛的SSR系统研究还比较少,已开发的金钗石斛SSR 标记也仅198对,难以满足研究的需求。所幸的是,随着新一代测序技术的发展,从转录组数据中大规模开发SSR标记成为可能。目前,该技术已成功应用于地黄[7]、荚膜黄芪[8]等药用植物的SSR标记开发过程中。基于此,本文将首次对金钗石斛转录组数据中的SSR位点进行检测,分析其分布、组成特征,并初步评价其可用性,设计SSR引物,旨在丰富金钗石斛的分子标记库,为金钗石斛的分子鉴定、遗传多样性研究及分子育种提供有效的工具。

1材料与方法

11金钗石斛转录组数据来源本实验转录组测序样本来源于贵州赤水的金钗石斛组培苗,提取茎RNA后送北京诺禾致源生物信息科技有限公司,利用Illumina HiSeq 4000高通量测序平台对其进行转录组测序,最终获得207 283条unigenes。

12金钗石斛转录组SSR的筛选使用MISA (http://pgrc ipkgatersleben de/misa/Misa html) 对金钗石斛转录组中的SSR位点进行搜索和定位。搜索的标准为单核苷酸重复至少10次,二核苷酸至少重复6次,三至六核苷酸至少重复5次;同时筛选被间隔小于或等于100 bp碱基打断的复合型 SSR。

13金钗石斛SSR引物设计调用 Primer 30引物批量设计程序对含有 SSR位点的两端序列设计引物,每条SSR序列产生3条引物。主要的引物参数设置为:退火温度(Tm)在57~63 ℃,上、下游引物的Tm相差不大于5 ℃;扩增产物大小在100~280 bp;引物长度 在18~27 bp;GC量在40%~65%。将设计出的引物通过以下方式筛选:引物不能存在SSR;将获得的引物比对到unigene序列,引物的5′端允许有3个碱基的错配,3′端允许有1个碱基的错配;去掉比对到不同unigenes上的引物,筛选唯一匹配的引物;使用SSRFinder校验SSR,使用产物序列来寻找SSR,检验结果是否与MISA 结果相同,并筛选出相同的SSR产物。

14金钗石斛SSR引物PCR扩增随机选择合成20对引物(苏州金唯智生物科技有限公司),并提取金钗石斛、铁皮石斛、霍山石斛叶片DNA(北京艾德莱生物科技有限公司,CTAB植物基因组DNA快速提取试剂盒)。PCR扩增反应在Eppendof Mastercycle 梯度PCR仪上进行。

25 μL的PCR反应扩增体系:Taq PCR Master Mix (2×)125 μL,10 μmol·L-1上下引物各1 μL,DNA模板2 μL,ddH2O补足至25 μL。PCR扩增程序为94 ℃ 预变性5 min,95 ℃ 变性1 min,最佳Tm退火30 s,72 ℃延伸1 min,35个循环,72 ℃延伸5 min。扩增产物用3%琼脂糖凝胶电泳检测。

2结果与分析

21金钗石斛SSR数量与分布对金钗石斛转录组测序获得的207 283条unigenes进行检索,共在26 742条unigenes中找到符合条件的32 709个SSR。SSR发生频率(含有SSR的unigenes数目与总unigenes数目之比)为1290%,出现频率(检出SSR个数与总unigenes数目之比)为1578%。其中28 061条unigenes含单个SSR 位点,4 648条unigenes含2个及2个以上SSR 位点。复合型SSR数目为1 572个。

金钗石斛转录组中,SSR 的主要重复类型是单核苷酸,占SSR总数的7218%,二核苷酸和三核苷酸次之,分别为1597%,1119%,四、五、六核苷酸重复的数量极少,总计067%。从分布情况看,金钗石斛转录组中平均每3 748 bp 就含有1个SSR位点。但不同重复基序长度SSR分布的平均距离差距很大,其中单核苷酸重复最多,分布平均距离519 kb/SSR,五核苷酸重复最少,每条SSR分布平均距离7 66306 kb (表1)。

李清等:金钗石斛转录组SSR位点信息分析表1金钗石斛转录组SSR不同重复基元分布情况

金钗石斛转录组中共搜索到189种不同基序序列类型的SSR,单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复分别有4,12,60,77,16,20种类型。从出现频率来看(图2),占绝对优势的重复基元类型是单核苷酸A/T,为总SSR 数目的7068%,其次是AG/CT和AT/AT,分别占总SSR数目的1104%,343%。在三核苷酸重复基元中以AAG/CTT数目最多,占总SSR 数目252%。其他四核苷酸、五核苷酸、六核苷酸重复基元类型分布较少,出现频率较低。

金钗石斛转录组被分为3个区域,分别是5′非编码区、3′非编码区和蛋白编码区(表2)。其中非编码区域的SSR数目最多,为编码区SSR位点数目的1689倍。这一结果与之前的研究,认为编码区对移码突变的选择性会限制SSR的扩张的结论相一致[9]。从理论上分析,来自非编码区域的SSR面临的选择压力较与来自编码区域的要小,具有比较高的多态潜能。在本研究中,5′和3′非编码区的SSR位点数目都显著高于编码区序列,预示着金钗石斛转录组中的SSR位点具有较高的多态性潜能。

对金钗石斛转录SSR位点在非编码区和编码区的分布情况进一步研究发现,三核苷酸的整倍体,例如三核苷酸SSR和六核苷酸SSR,其出现在编码区域的概率更大,分别占已确定分布位置的该类型SSR数目的3690%,50%,远高于单核苷酸的327%及五、六核苷酸的0%。产生这一现象的原因可能是三核苷酸重复产生的是非编码突变,其导致的危害相对较小。但在编码区域内,增加或减少非整倍体三核苷酸往往会导致编码框移码和面临较大的选择压力[10]。同时,本研究还发现AT富含基元比较容易出现在3′非编码区,例如6463%的已知A,7222%的已知AT和7407%的AAT落入3′非编码区。这很可能與AT富含基元在3′非编码区作为一些顺式元件出现相关,例如多聚腺苷酸(polyA)结尾信号的AAUAAA,其关系到mRNA的稳定[11]。

22金钗石斛SSR的可用性评价SSR分子标记多态性是评判其可用性的重要依据。SSR长度是影响其多态性高低的重要因素,当SSR长度大于或等于20 bp 时多态性较高,长度在12 ~ 20 bp 的SSR 多态性中等,而长度在12 bp以下时多态性极低[12]。本研究中,具中等多样性(长度在12 ~ 20 bp)的SSR有14 718条,占SSR总数的4500%;具较高多样性(长度大于或等于20 bp)的SSR有2 842条,占SSR总数的869%。换言之,超50% 的SSR位点具有中等水平以上的多样性。此外,低级基序SSR往往比高级基序SSR更容易滑动而产生多态性[13]。而本研究中20 bp 以上的低级重复基元(单核苷酸、二核苷酸、三核苷酸)较多,共1 181条,占20 bp以上SSR总数的4156%。由此可预见金钗石斛转录组来源的SSR 具有较高的多态性潜能,在分子标记研究方面具有较高的利用价值。

23金钗石斛SSR引物设计为更好的应用金钗石斛SSR位点,本研究应用Primer 30软件对上下游序列均不小于150 bp的SSR 设计引物,每条序列产生3对引物。经SSRFinder校验和除去不符合条件的引物后,共为20 719条SSR序列设计出62 157对SSR位点特异引物,占到金钗石斛SSR总数的6334%。其中针对20 bp以上且包含低级基序(单核苷酸、二核苷酸、三核苷酸重复)的SSR序列共设计出552对引物。

24金钗石斛SSR引物评价分析为检测新发掘的金钗石斛SSR位点特异引物的可靠性,随机挑选20对不同重复单元(一、二、三、四、五、六核苷酸)的引物对金钗石斛DNA进行PCR扩增(表3),结果显示,17对引物在金钗石斛中成功扩增,引物扩增率为850%。其中12对PCR扩增产物与预期大小吻合,5对引物扩增产物长度超过预期(图3A),说明本研究所设计的大部分引物真实可靠。

与此同时,利用该20对引物对金钗石斛近缘种铁皮石斛和霍山石斛的DNA进行扩增,结果证明金钗石斛SSR引物在石斛种间的通用性良好,17对在金钗石斛中成功扩增的引物在铁皮石斛和霍山石斛表3金钗石斛SSR引物序列

而通过比较3种石斛DNA的扩增结果发现(图3A,B,C),20对引物中,13对引物呈现多态性,多态性位点比率达650%。13对多态性引物共得到39个扩增片段,其中多态性片段32个,每对引物平均产生246个多态性片段,可见SSR引物具有较高的多态性,具有足够的潜力在石斛鉴定、居群间多样性评价和系统发育关系的研究上得到应用。

3讨论

本研究大规模地从金钗石斛转录组中检测出32 709个SSR位点,分布于26 742条unigenes中。由于目前对SSR的定义没有一个统一的标准,采用的分析方法和最小长度定义的不同,使获得的整个转录组中SSR的数量也存在较大的差异。选择分析方法相近的转录组SSR进行对比发现,金钗石斛转录组SSR出现频率为1578%,显著高于云南松(307%)[14]、茯苓(532%)[15]、灯盏花(699%)[16],而与金线莲(1222%)[17],建兰(1754%)[18]相差不大。这说明金钗石斛转录组具有丰富的SSR位点,可为SSR的开发提供重要的资源库。同时也可以看出亲缘关系近的物种间SSR丰度更为相近。而对金钗石斛转录组SSR位点类型分析发现,短重复单元(单核苷酸至三核苷酸)的数量要比长的重复单元数量要多,与大多数物种中的分布情况一致,支持了长的重复单元的SSR具有较高可变性的观点。

SSR的多样性与不同基序序列类型存在一定关系,如由于打破AT键所需的能量低于GC碱,AT的波动较GC容易,SSR的基序类型中存在A/T优势[19]。在本研究中,从不同核苷酸类型的碱基组成分析可知,金钗石斛转录SSR中A/T,AAAT/ATTT分别是单核苷酸、四核苷酸的优势重复基元,AT/AT及AAT/ATT的数目分别在二核苷酸和三核苷酸中排名第二和第三,表现出了明显的A/T优势。相反G/C在基序中的出现频率很低,C/G和CG/CG在单核苷酸和二核苷酸中所占的比例均小于220%。这很好的验证了上述观点。但也有观点认为A/T优势的出现是由于甲基化的C残基转化为T及位于3′末端的polyA序列插入基因组后形成富含A的原始SSR序列所致[2021],具体原因有待进一步考究。

Weber等[22]将SSR分为3类,分别是完全由单一的核苷酸重复组成的完美型,由单一重复基元组

M50 bp Maker ZM201(从上至下依次为400,350,300,250,200,150,100,50 bp);A金钗石斛;B铁皮石斛;C霍山石斛。

成,但中间被少量非重复基元核苷酸隔开的非完美型,以及由2种或2种以上重复基元组成的复合型。分型研究发现,金钗石斛转录组中SSR位点以完美型为主,占总SSR位点数目的9519%。由于非完善型和复合型SSR常常代表着序列之间存在较多的插入、缺失、碱基置换等基因突变,可以推测金钗石斛转录组SSR位点具有较高的可靠性,在遗传分析方面具有较大的潜力。

SSR位点的可靠性还体现在其较高的有效扩增率和多态性。在本研究中,除少量可能是由于所设计的引物序列位于2个外显子上,或者基因组对应的序列含有内含子而不具备SSR序列特征等原因[23]造成的扩增失败外,所有候选引物均获得有效扩增,扩增率为850%,属于较高的扩增水平。而通过比较引物在金钗石斛、铁皮石斛和霍山石斛3种不同石斛中扩增情况,可发现13对引物呈现多态性,多态性位点比率为650%。值得注意的是,本研究仅采用琼脂糖凝胶电泳对SSR的多态性进行初步的分析,如采用高分辨率的非变性聚丙烯酰胺凝胶电泳,呈现多态性引物的比例将会更高,由此可见SSR的多态性相当丰富,对石斛具有良好的鉴别能力,可作为品种资源鉴定的一个辅助工具。

SSR除了作为一种分子标记外,还具有功能上的意義,包括它在染色体组织上的影响,对基因活性、DNA复制、细胞周期和纠错修复系统的调节等等[2425]。通常,可以根据SSR所在位置初步判断它的功能,分布在5′非编码区的SSR可以调节基因的表达,分布在3′非编码区的SSR可以导致转录滑移[26]。在金钗石斛转录组中,分布在5′和3′非编码区的SSR数量丰富,分别是2 131,3 357个。它们其中的部分可能对调节基因的表达活性起到一定的作用,对其进一步的深入研究,使无功能分子标记向可揭示基因转录功能的分子标记转化,将有利于金钗石斛功能基因资源的定位和开发利用。

总体而言,金钗石斛转录组SSR不但出现频率高,且类型丰富,具有较高的多态性潜能和可用性。基于转录组的SSR分子标记开发充分利用了转录组测序的结果,不仅保留了基因内部SSR的特异性和高保守性的优点,大大降低了开发成本,还避免了基因组SSR周期长、操作繁琐,以及ESTSSR的数据量少的缺点,为进一步丰富的金钗石斛SSR标记奠定了坚实的基础,为金钗石斛的遗传资源评价、种质资源改良、物种鉴定等提供了重要的参考依据。

[参考文献]

[1]包雪声,顺庆生,陈立钻 中国药用石斛[M] 上海:复旦大学出版社, 2001:1

[2]Li Y F, Li F, Gong Q H, et al Inhibitory effects of Dendrobium alkaloids on memory impairment induced by lipopolysaccharide in rats[J] Planta Med,2011,77(2):117

[3]Luo A X, He X J, Zhou S D, et al Purification, composition analysis and antioxidant activity of the polysaccharides from Dendrobium nobile Lindl[J] Carbohyd Polym,2010,79(4):1014

[4]Lu T, Han C, Chang Y, et al Denbinobin, a phenanthrene from Dendrobium nobile, impairs prostate cancer migration by inhibiting rac1 activity[J] Am J Chinese Med,2014,42(6):1

[5]魏鑫鑫,孙志蓉,刘文兰,等 安国药材市场中石斛质量现状的调查研究[J] 中医药导报,2015, 21(9):46

[6]Lu J J, Kang J Y, Feng S G, et al Transferability of SSR markers derived from Dendrobium nobile expressed sequence tags (ESTs) and their utilization in Dendrobium phylogeny analysis[J] Sci HorticAmsterdam,2013,158(4):8

[7]Li M J, Yang Y H, Feng F J, et al SSR development and utilization with Rehmannia glutinosa transcriptome[J] Int J Agric Biol,2016, 18(3):589

[8]常越,闫嵩,刘振鹏,等 膜荚黄芪的转录组测序质量评估及其SSR位点信息分析的研究[J] 中国中药杂志,2016, 41(8):1430

[9]Toth G, Gaspari Z J Microsatellites in different eukaryotic genomes:survey and analysis[J] Sociologia Ruralis,2002,46(1):40

[10]Ueno S, Moriguchi Y, Uchiyama K, et al A second generation framework for the analysis of microsatellites in expressed sequence tags and the development of ESTSSR markers for a conifer, Cryptomeria japonica[J] Bmc Genomics,2011,13(4):1

[11]Pesole G, Mignone F, Gissi C, et al Structural and functional features of eukaryotic mRNA untranslated regions[J] Gene,2001,276(1/2):73

[12]Kanto T, Takehara T, Katayama K, et al Computational and experimental analysis of microsatellites in rice (Oryza sativa L ):frequency, length variation, transposon associations, and genetic marker potential[J] Genome Res,2010,11(8):1441

[13]Dreisigacker S, Zhang P, Warburton M L, et al SSR and pedigree analyses of genetic diversity among CIMMYT wheat lines targeted to different megaenvironments[J] Crop Science,2004,44(2):381

[14]蔡年輝,许玉兰,徐杨,等 云南松转录组SSR的分布及其序列特征[J] 云南大学学报:自然科学版,2015,37(5):770

[15]何海,郭继云,马毅平,等 茯苓转录组SSR序列特征及其基因功能分析[J] 中草药,2015, 46(23):3558

[16]陈茵,李翠婷,姜倪皓,等 灯盏花转录组中SSR位点信息分析及其多态性研究[J] 中国中药杂志,2014,39(7):1220

[17]姜福星,魏丕伟,寇亚平,等 台湾金线莲转录组特性研究[J] 分子植物育种,2015, 13(12):2743

[18]李小白,向林,罗洁,等 建兰转录本的微卫星序列和单核苷酸多态性信息分析[J] 浙江大学学报:农业与生命科学版,2014,40(4):463

[19]童治军,肖炳光 3种烟草基因组SSR位点信息分析和标记开发[J] 西北植物学报,2014,34(8):1549

[20]Schorderet D F, Gartler S M Analysis of CpG suppression in methylated and nonmethylated species[J] Proc Natl Acad Sci,1992,89(3):957

[21]柳莹,唐永政,高丽 微卫星DNA进化特征研究进展[J] 基因组学与应用生物学,2014(6):1391

[22]Weber J L Informativeness of human (dCdA)n·(dGdT)n polymorphism[J] Genomics,1990,7(4):524

[23]Varshney R K, Graner A, Sorrells M E Genic microsatellite markers in plants:features and applications[J] Trends Biotechnol, 2005, 23(1):48

[24]You C L, Korol A B, Fahima T, et al Microsatellites:genomic distribution, putative functions and mutational mechanisms:a review[J] Mol Ecol,2002,11(12):2453

[25]Subramanian S, Mishra R K, Singh L Genomewide analysis of microsatellite repeats in humans:their abundance and density in specific genomic regions[J] Genome Biol,2003,4(2):54

[26]Riley D E, Krieger J N UTR dinucleotide simple sequence repeat evolution exhibits recurring patterns including regulatory sequence motif replacements[J] Gene,2009,429(429):80[责任编辑吕冬梅]