郭莺 孟红岩 林文珍 林志楷 刘黎卿
摘 要 本研究通过测序牛樟叶片cDNA获得17 046条Uni-EST,从中检测出1 316个SSR位点,平均每 25.7 kb EST含1个SSR位点。功能注释发现1 242条SSR-EST中有690条可被划分为3大功能类、18个功能亚类。牛樟EST-SSR二核苷酸重复类型出现频率最高,三核苷酸次之。184类重复基序中AG/CT出现频率最高(32.4%),其次为AAG/CTT(9.3%)。从1 242条SSR-EST设计SSR引物537对,随机选取150对检测牛樟的多态性及在香樟、大叶樟和沉水樟中的可转移性。结果表明,有44对引物在牛樟中得到特异性扩增,其中17对具有多态性,检测出的等位基因数2~7个,平均3.02个。牛樟SSR标记在香樟、沉水樟和大叶樟的可转移率分别为97.7%、97.7%和95.3%。聚类分析表明,在遗传相似系数为0.76处,14个樟属植物能被划分为5类,聚类结果与植物学分类结果基本吻合。
关键词 牛樟;EST-SSR;标记开发;遗传多态性
中图分类号 Q949.747.5 文献标识码 A
Abstract 17 046 Uni-ESTs were generated by sequencing cDNA of Cinnamomum kanehirae, of which 1 316 SSR loci were identified with 1 SSR on every 25.7 kb EST. Analysis of GO (gene ontology) showed that 690 SSR-ESTs could be divided into three major functional categories and 18 functional sub-categories. Di-nucleotide repeat was the most abundant repeat type followed by tri-nucleotide repeat in EST of C. kanehirae. In 184 motif types, AG/CT (32.4%) was the most abundant followed by AAG/CTT (9.3%). Based on the 1 242 SSR-EST, a total of 537 primer pairs were successfully designed. 150 primer pairs were randomly selected to detect the polymorphism in C. kanehirae and test transferability in C. camphora, C. micranthum and C. parthenoxylon. The results showed that 44 primer pairs were specifically amplified in C. kanehirae, of which 17 pairs were polymorphic and the number of alleles detected was 2–7, with an average of 3.02. The transfer rates of C. kanehirae SSR marker in C. camphora, C. micranthum and C. parthenoxylon were 97.7%, 97.7% and 95.3%, respectively. Cluster analysis showed that at the genetic similarity coefficient 0.76, 14 Cinnamomum plant samples could be divided into five groups. The clustering result was in good agreement with the result of botany classification.
Keywords Cinnamomum kanehirae; EST-SSR; marker development; genetic polymorphism
DOI 10.3969/j.issn.1000-2561.2018.08.014
牛樟(Cinnamomum kanehirae Hay),又名黑樟,隸属于樟目(Laurales)樟科(Lauraceae)樟属(Cinnamomum),是台湾原生特有树种,被列为国家三级重点保护植物。牛樟既是木雕、家具和建筑的上等原料,同时也是一种具有很高观赏价值的景观树种。牛樟整个植株含有芳香油,其主要成分黄樟油素是香料洋茉莉醛的原料,在工业上具有广泛的用途。此外,牛樟是牛樟芝(Antrodia camphorata)的寄生树种。牛樟芝在医学上被称为“药芝之王”,具有强化免疫、抗癌、抗过敏、降血脂、解毒保肝等药用和保健功效[1]。近年来,重要林木的遗传多样性及遗传育种研究取得长足进展[2-3]。然而,由于缺乏有效的DNA标记,目前有关牛樟的资源收集分类、遗传多样性及遗传育种研究进展仍相当缓慢。因此,开发高效的DNA标记成为牛樟遗传资源开发利用的当务之急。
近年来,通过第二代DNA测序技术快速获得的EST(expressed sequence tag)数据成为SSR(simple sequence repeat)的重要来源[4]。与genomic-SSR相比,EST-SSR具有其特殊优势:(1)信息量大,EST-SSR属于表达基因的一部分,当此基因控制某一性状,则该标记与此性状相关[5];(2)可转移性高,与非转录区相比,来自转录区的EST-SSR序列保守性更强,故在近缘物种中具有更高的可转移性,可作为比较基因组学研究中的公共标记[6];(3)开发简便、快捷、成本低,EST-SSR标记的开发通常是转录组数据分析的“副产品”,几乎不用成本。目前经济林木如橡胶树、胡杨、云杉、牡丹、茶树等已开发大量的EST-SSR[7-11],并应用于遗传多样性分析、遗传图谱构建、基因定位及QTL分析等研究上[12-14],但在牛樟上至今尚未开发出EST-SSR标记。
本研究在测序获得牛樟叶片EST序列数据的基础上,通过分析牛樟EST-SSR的分布频率及特征,开发牛樟EST-SSR标记,并对其在牛樟中的多态性和其他樟属植物上的可转移性进行评价,为后续牛樟遗传资源的開发利用打下基础。
1 材料与方法
1.1 材料
1.1.1 实验材料 牛樟叶片cDNA文库测序获得的2.4 Gb EST序列数据。用于EST-SSRs检测的牛樟样本8个,香樟(Cinnamomum camphora)4个,沉水樟(Cinnamomum micranthum)和大叶樟(Cinnamomum parthenoxylon)各1个,由福建省亚热带植物研究所提供(表1)。
1.1.2 试剂与仪器 磁珠法植物DNA提取试剂盒(货号:AU3111,百泰克,中国),Hiseq 2500测序系统(Illumina,美国),超微量分光光度计(型号:Nanodrop 2000,Thermo Scientific,德国),Fragment AnalyzerTM自动化毛细管电泳系统(型号:FSV2-CE,生产商:美国AATI)。
1.2 方法
1.2.1 牛樟叶片RNA提取及EST测序 从牛樟样本C. kanehirae-1选取嫩叶作为测序材料,液氮速冻,置于80 ℃冰箱中,冻存备用。随后提取牛樟叶片总RNA,用带有Oligo(dT)的磁珠富集真核生物的mRNA,加入fragmentation buffer将mRNA打断成短片段,以mRNA为模版,用random hexamers(六碱基随机引物)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H和DNA polymerase I合成第二条cDNA链,cDNA质量检测合格后经过末端修复、3加polyA和连接测序接头,建好的文库在Hiseq 2500测序系统进行100 bp双末端(paired-end)测序。RNA提取、反转录、建库、测序和序列拼接等过程由北京诺禾致源生物信息科技有限公司完成。
1.2.2 樟属植物DNA提取 采用磁珠法植物DNA提取试剂盒提取樟属植物叶片基因组DNA,并用1%的琼脂糖凝胶电泳检测DNA质量,用超微量分光光度计测定DNA浓度。所有DNA样本用超纯水统一稀释至50 ng/μL,并保存于20 ℃备用。
1.2.3 SSR位点搜索 原始牛樟EST序列拼接为Uni-EST,采用MISA(MIcroSAtellite identification tool)软件(http://pgrc.ipk-gatersleben.de/misa/)从中搜索SSR位点。搜索标准为二、三、四、五、六核苷酸基序(motif)重复次数分别≥10、7、5、4、4。由于难以区分EST-SSR中的单核苷酸重复序列A/T与cDNA中的PolyA/T,故本研究未将单核苷酸重复序列列入搜索范围。根据搜索标准,MISA配置文件(misa.ini)中参数设置为2-10、3-7、4-5、5-4、6-4,其中数据对第一个数字代表SSR基序长度,第2个数字代表基序重复的最少次数。
1.2.4 SSR引物设计 采用Primer Premier 5软件(http://www.premierbiosoft.com/primerdesign/)从SSR位点侧翼序列设计引物。引物设计标准:(1)引物长度18~24 bp;(2)引物GC含量40%~ 60%;(3)预期扩增产物大小100~500 bp;(4)引物最适溶解温度(Tm)72 ℃,最适复性温度55 ℃。
1.2.5 PCR扩增及检测 PCR扩增体系为20 μL:基因组DNA 50 ng,0.15 μmol/L正反向引物, 0.2 mmol/L dNTPs,1 U Taq DNA聚合酶,1×PCR缓冲液(50 mmol/L KCl,1.5 mmol/L MgCl2,0.1%明胶,10 mmol/L Tris-HCl,pH 8.3)。PCR程序:94 ℃ 5 min;94 ℃ 30 s,55 ℃ 30 s,72 ℃ 30 s,35个循环;72 ℃ 5 min。扩增产物经Fragment AnalyzerTM自动化毛细管电泳系统进行电泳检测。
1.2.6 SSR-EST的功能注释 为了研究牛樟SSR-EST的基因功能,本研究应用Blastx工具
(http://www.ncbi.nlm.nih.gov/BLAST/),将1 242条牛樟SSR-EST在Uniprot数据库(http://www. uniprot.org/)中进行同源比对(E-value Le-5)。根据Uniprot数据库的GOA(Gene Ontology Annotation)系统进行功能分类。通过基因的相似性进行功能注释,序列比对匹配标准:(1)分值(score)>80;(2)序列一致性(identity)>35%。
1.2.7 SSR-ESTs ORF预测 利用Open Reading Frame Finder(https://www.ncbi.nlm.nih.gov/orffinder/)寻找SSR-EST中的开放阅读框架(open reading frame, ORF),预测SSR位点坐落于5-UTR(5untranslated region)、CDS(Coding sequence)或者3-UTR(3untranslated region)。
1.2.8 聚类分析 统计EST-SSR引物在实验材料中检测的等位基因数,同一电泳迁移位置上,有电泳峰的记为1,无峰的记为0,聚类分析采用NTSYSpc软件(http://www.exetersoftware.com/cat/ ntsyspc/ntsyspc.html),聚类方法为非加权配对算术平均法(unweighted pair group method using arithmetic average,UPGMA)。
2 结果与分析
2.1 牛樟EST-SSR分布特点
将牛樟叶片cDNA文库测序获得的原始序列拼接后获得17 046条Uni-EST。通过MISA软件共搜索到1 316个SSR位点,分布于1 242条EST中,出现频率为1 SSR/25.7 kb,其中70条EST含有一个以上的SSR。二、三、四、五、六核苷酸重复在牛樟EST-SSR中均存在,且出现频率存在明显差异。出现频率最高为二核苷酸重复,占44.1%(581个);其次为三核苷酸重复,占23.6%(310个);四、五、六核苷酸重复分别只占9.1%、13.5%和9.6%(表2)。本研究中牛樟EST-SSR平均长度为21 bp,二、三、四、五、六核苷酸重复长度分别为20.4、21.5、20.6、20.6和25.7 bp(表3)。牛樟EST-SSR二至六核苷酸基序的出现频率随着重复次数的增加而急剧下降,如重复10次的二核苷酸基序有469个,重复11次的只有105个,而重复12次的仅有7个。
本研究中牛樟EST-SSR种类较为丰富,包含184种基序类型,二至六核苷酸重复分别含有3、10、21、56和94种基序类型。由图1可知,出现频率最高的基序类型为AG/CT(32.4%),其次是AAG/CTT(9.3%),第3是AT/AT(8.9%)。
2.2 SSR-EST的功能注释
由于SSR-EST属于表达基因的一部分,EST- SSR与genomic-SSR相比最大的优点是具有某些生物学功能。本研究检测到了牛樟1 242条SSR- EST,其中690条SSR-EST被注释到3大功能类、18项功能亚类中,剩余552条SSR-EST因数据库中缺乏与之相似的基因序列而无法进行功能注释(表4)。在与功能大类“生物过程”相关的232条SSR-EST所涉及的11项功能亚类中,34.5%与细胞过程相关,17.8%与代谢过程相关,11.6%与细胞发育相关。与分子功能相关的258条SSR- EST所涉及的11项功能中,与结合因子相关的EST数量最多(31.8%),其次是与催化反应相关的(27.5%)。与细胞组分相关的200条SSR-EST所涉及的6项功能中,与细胞相关的占54.5%,与细胞质部分相关的占20.5%,其余占25%。
2.3 EST-SSR多态性分析
对1 242条牛樟SSR-EST进行引物设计,其中705条因SSR侧翼序列长度不够无法设计,最终只成功设计出537对SSR引物。为检测引物的扩增效果,随机挑选150对引物扩增8份来自不同地区的牛樟样本DNA(表1)。结果表明,在牛樟中能扩增出特异条带的引物有44对,另有43对只扩增出非特异性条带,剩余63对无任何扩增产物。特异性扩增引物中,有38对扩增长度与预期完全一致,另有1对大于预期,5对小于预期。43对牛樟特异性扩增引物在香樟、沉水樟和大叶樟上同样能产生有效扩增,可扩增率分别为97.7%、97.7%和95.3%,平均可扩增率为96.9%,表明牛樟EST-SSR在其他3种樟属植物中具有很高的可转移性。
44对特异性扩增引物中有43对在8个牛樟样本中能检测出多态性。每对引物检测出2~6个等位基因(图2),平均3.02个(表5),总共检测到134个等位基因。44对牛樟特异性EST-SSR引物在14个樟属植物样本间均能检测出多态性。每对引物检测出等位基因数2~8个,平均4.3个,累计检测出等位基因数189个。
SSR位于5-UTR、CDS和3-UTR的特异性扩增引物在牛樟中平均检测出的等位基因数分别为3.57、2.56和2.67个(表5)。显然,在牛樟EST中,位于5-UTR和3-UTR的SSR比位于CDS的拥有更高的多态性。
2.4 樟属植物的聚类分析
聚类分析表明,樟属植物样本间的遗传距离为0.89~0.74(图3)。在相似系数为0.76处,14个樟树植物样本可聚为5类,第1类包含8个牛樟样本,样本间的遗传距离为0.89~0.765;第2类包含1个香樟样本(C. camphora-2)和1个大叶樟样本(C. parthenoxylon);第3类只包含沉水樟样本(C. micranthum);第4类只包含1个香樟样本(C. camphora-1);第5类包含2个香樟样本(C. camphora-3和C. camphora-4)。
3 讨论
本研究通过转录组测序获得17 046条Uni- EST,搜索出1 316个SSR位点,共有1 242条EST(7.2%)含SSR,表明牛樟EST中SSR較为丰富,但与其他木本植物如洋槐(13.9%)[15]、橡胶树(23.9%)[16]、花楸(7.7%)[4]等相比,其EST-SSR含量仍偏低,其原因在于不同木本植物上EST-SSR搜索的标准不同。本研究中采用的搜索标准较为严格,首先是不包含单核苷酸重复,其次是二、三、四、五、六核苷酸重复的次数分别至少为10、7、5、4、4,远高于其他研究的标准。
植物EST-SSR以三核苷酸和二核苷酸重复类型为主[17],其中三核苷酸重复多见于被子植物,但也有部分木本植物以二核苷酸重复为主,如杨树、茶树、山胡椒等[18-20]。本研究中牛樟EST-SSR的二核苷酸重复占44.1%,明显高于三核苷酸重复(23.6%),这与杨树、茶树等其他木本植物的研究结果相似。牛樟EST-SSR的重复基序类型以AG/CT(32.4%)、AT/AT(8.9%)和AAG/CTT为主(9.3%),与橡胶树[16]和柠条[21]等相似,这也是被子植物中最丰富的重复类型。
本研究用的150对EST-SSR引物有63对无扩增产物,另外43对产生非特异扩增,扩增失败的比例较高,其原因可能是:(1)由于牛樟基因组的复杂性,导致部分Uni-EST序列无法正确拼接;(2)上下游引物位点间有一个或多个长片段内含子;(3)扩增区段存在比较复杂的高级结构。在可扩增的44对引物中有1对扩增产物长度大于预期,这可能与扩增产物含有内含子,或者发生小片段DNA插入有关。
理論上,由于EST受选择压力的影响,序列的保守性比基因组其他区域更高,因此与genomic- SSR相比,EST-SSR在近缘物种间具有更高的可转移性。目前有关植物EST-SSR的可转移性研究均支持上述观点[6]。本研究表明牛樟EST-SSR在其他樟属植物中均具有较高的可转移性。
聚类分析表明EST-SSR聚类结果与植物学分类结果基本吻合,如8个牛樟样本单独聚为一类,能够完全与其他樟属植物区分开来。但由于形态性状和DNA标记间通常缺乏显著的相关性,导致基于形态性状的植物学分类和EST-SSR聚类结果并不完全一致。此外,由于牛樟EST-SSR在其他樟树植物上的扩增特异性降低,也可能造成聚类结果出现偏差。如牛樟EST-SSR将不属于同一个种(species)的香樟样本C. camphora-2和大叶樟样本C. parthenoxylon聚为一类。
EST-SSR具备信息量大、通用性好、开发简捷成本低等多个优点,但同时也存在明显的缺点,即多态性低。研究表明,SSR位点的多态性与其核苷酸重复次数呈正相关,重复次数越多,多态性越高[22]。EST-SSR核苷酸重复次数明显低于genomic-SSR,因此对应的多态性也偏低[23]。此外,基因编码区序列的保守性可能也是导致其多态性偏低的原因,特别是编码区内的核苷酸重复次数的变动容易产生致死性的移码突变,长期的自然选择压力严重抑制了编码区内的核苷酸重复次数的变动。由于本研究在进行EST-SSR开发时设置的搜索标准较高,SSR核苷酸重复次数较其他研究高,且多数SSR位点落在非编码区,因此在牛樟和樟属植物中均检测到较高的多态性。说明在开发EST-SSR引物时应选择基序重复次数高的SSR-EST序列,同时避免SSR位点落在编码区,以提高EST-SSR的多态性。
参考文献
[1] Lin Y W, Pan J H, Liu R H, et al. The 4-acetylantroquinonol B isolated from mycelium of Antrodia cinnamomea indibits proliferation of hepatoma cells[J]. Journal of the Science of Food & Agriculture, 2010, 90(10): 1 739-1 744.
[2] de Souza L M, Le Guen V, Cerqueira-Silva C B, et al. Genetic diversity strategy for the management and use of rubber genetic resources: more than 1,000 wild and cultivated accessions in a 100-genotype core collection[J]. PLoS ONE, 2015, 10(7): e0134607.
[3] Stolze A, Wanke A, van Deenen N, et al. Development of rubber-enriched dandelion varieties by metabolic engineering of the inulin pathway[J]. Plant Biotechnology Journal, 2017, 15(6): 740-753.
[4] Liu C, Dou Y, Guan X, et al. De novo transcriptomic analysis and development of EST-SSRs for Sorbus pohuashanensis (Hance) Hedl[J]. PLoS ONE, 2017, 12(6): e0179219.
[5] Emebiri L C. An EST-SSR marker tightly linked to the barley male sterility gene (msg6) located on chromosome 6H[J]. Journal of Heredity, 2010, 101(6): 769-774.
[6] Mathi Thumilan B, Sajeevan R S, Biradar J, et al. Development and characterization of genic ssr markers from indian mulberry transcriptome and their transferability to related species of Moraceae[J]. PLoS ONE, 2016, 11(9): e0162909.
[7] An Z W, Li Y C, Zhai Q L, et al. Development and characterization of novel expressed sequence tag-derived simple sequence repeat markers in Hevea brasiliensis (rubber tree)[J]. Genetics & Molecular Research Gmr, 2013, 12(4): 5 905-5 910.
[8] Du F K, Xu F, Qu H, et al. Exploiting the transcriptome of Euphrates Poplar, Populus euphratica (Salicaceae) to develop and characterize new EST-SSR markers and construct an EST-SSR database[J]. PLoS ONE, 2013, 8(4): e61337.
[9] Fluch S, Burg A, Kopecky D, et al. Characterization of variable EST SSR markers for Norway spruce (Picea abies L.)[J]. BMC Research Notes, 2011, 4: 401.
[10] Zhang J J, Shu Q Y, Liu Z N, et al. Two EST-derived markers systems for cultivar identification in tree peonyl[J]. Plant Cell Reports, 2012, 31(2): 299-310.
[11] Taniguchi F, Fukuoka H, Tanaka J. Expressed sequence tags from organ-specific cDNA libraries of tea (Camellia
sinensis) and polymorphisms and transferability of EST-SSRs across Camellia species[J]. Breeding Science, 2012, 62(2): 186-195.
[12] Vásquez-Mayorga M, Fuchs E J, Hernández E J, et al. Molecular characterization and genetic diversity of Jatropha curcas L. in Costa Rica[J]. Peer Journal, 2017, 5: e2931.
[13] Durand J, Bodénès C, Chancerel E, et al. A fast and cost- effective approach to develop and map EST-SSR markers: oak as a case study[J]. BMC Genomics, 2010, 11: 570.
[14] Souza L M, Gazaffi R, Mantello C C, et al. QTL mapping of growth-related traits in a full-sib family of rubber tree (Hevea brasiliensis) evaluated in a sub-tropical climate[J]. PLoS ONE, 2013, 8(4): e61238.
[15] Guo Q, Wang J X, Su L Z, et al. Development and evaluation of a novel set of EST-SSR markers based on transcriptome sequences of Black Locust (Robinia pseudoacacia L.)[J]. Genes, 2017, 8(7): 177.
[16] Hou B, Feng S, Wu Y. Systemic identification of Hevea brasiliensis EST-SSR markers and primer screening[J]. Journal of Nucleic Acids, 2017, 2017: 6590902.
[17] Russell J R, Hedley P E, Cardle L, et al. tropiTree: an NGS- ?based EST-SSR resource for 24 tropical tree species[J]. PLoS ONE, 2014, 9(7): e102502.
[18] Ranade S S, Lin Y C, Zuccolo A, et al. Comparative in silico analysis of EST-SSRs in angiosperm and gymnosperm tree genera[J]. BMC Plant Biology, 2014, 14: 220.
[19] Sharma R K, Bhardwaj P, Negi R, et al. Identification, char-acterization and utilization of unigene derived microsatellite markers in tea (Camellia sinensis L.)[J]. BMC Plant Biology, 2009, 9: 53.
[20] Zhu S, Ding Y, Yap Z, et al. De novo assembly and characterization of the floral transcriptome of an economically important tree species, Lindera glauca (Lauraceae), including the development of EST-SSR markers for population genetics[J]. Molecular Biology Reports, 2016, 43(11): 1 243-1 250.
[21] Long Y, Wang Y, Wu S, et al. De novo assembly of transcriptome sequencing in Caragana korshinskii Kom. and characterization of EST-SSR markers[J]. PLoS ONE, 2015, 10(1): e0115805.
[22] Nicot N, Chiquet V, Gandon B, et al. Study of simple sequence repeat (SSR) markers from wheat expressed sequences tags (ESTs)[J]. Theoretical & Applied Genetics, 2004, 109(4): 800-805.
[23] Khimoun A, Ollivier A, Faivre B, et al. Level of genetic differentiation affects relative performances of expressed sequence tag and genomic SSRs[J]. Molecular Ecology Resources, 2017, 17(5): 893-903.