罗祥宗,胡云飞,吴淋慧,赵雅琦,郑伟铭,黎巷汝,李力*
1. 武夷学院茶与食品学院,福建 南平 354300;2. 安徽农业大学茶与食品科技学院,安徽 合肥 230036;3. 福建农林大学园艺学院,福建 福州 350002
茶作为世界上最受欢迎的饮品之一,在医药、健康、文化、贸易等领域都具有重要意义,在生活中也发挥着重要的作用[1]。茶树在我国许多地区都有栽种,形成各地区独特的茶叶品类。一些在植物学特征特性上十分相似的茶树品种在基因的遗传组成上很可能存在着较大差异,这给茶树样品的确定带来一定困难[2],不仅会对茶树品种的选育、种植及经营等方面造成损失,也给茶叶市场的监管带来困扰。传统农艺性状的鉴别易受外界因素和鉴别时间影响,且费时费力,DNA分子标记有助于辅助茶树品种鉴别与杂交育种的亲本选择[3]。
DNA分子标记具有多态性强,数量多,且不受环境限制等优点,在茶树的驯化起源、遗传育种和资源鉴定方面已被广泛应用[4]。早期的第一代分子标记技术,例如相关序列扩增多态性(Sequence-related amplified polymorphism,SRAP)、限制片段长度多态性(Restriction fragment length polymorphism,RELP)、随机扩增的多态性 DNA(Random amplified polymorphic DNA,RAPD)等[5-6],虽各具优点,但由于分型不稳定、基因型过多无法辨认、非共显性等缺陷没有被纳入植物品种鉴定标准。目前,简单重复序列(Simple sequence repeat,SSR)、单核苷酸多态性(Single nucleotide polymorphism,SNP)技术在国际植物新品种保护联盟(International Union for the Protection of New Varieties of Plants,UPOV)的生化和分子标记技术(Biochemical and molecular labeling techniques,BMT)测试指南草案中被确定为构建DNA指纹数据库的标记方法[7]。第二代SSR标记法虽具有多态性高和共显性的优点,但SSR是多等位基因系统,内部存在复杂变异如Indel/SNP,而且忽视了一代测序金标准的验证,容易导致鉴定结果存在不真实现象。相对于SSR标记存在的问题,第三代SNP标记为二等位基因系统,主要反映单个碱基的遗传变异情况,并且易实现平台之间数据的整合比较,在许多作物的品种鉴别中得以广泛应用[8]。在茶树研究方面,樊晓静等[9]从茶树的表达序列标签数据库中筛选出多态性高的核基因 SNP位点24个,构建的DNA指纹图谱可对103个茶树品种资源进行区分。尽管如此,茶树SNP分子数据库的研究仍处于起步阶段,需要进一步补充完善。
相比核基因,母系遗传的叶绿体基因在追踪茶树的母系亲本、重建系统发育等方面能更好地提供有价值的信息。核基因组结构复杂且庞大,容易产生高突变,而叶绿体基因组小,进化速度缓慢,保守性强。此外,叶绿体基因非双亲遗传的特性也可有效地避免分子内重组对遗传进化研究所造成的干扰[10-11]。尽管进化速度相对缓慢,叶绿体基因组中基因的变异却始终伴随着物种的进化而发生,非重组和单亲本遗传使叶绿体DNA标记成为母系遗传的良好指标,在缺乏亲本信息的假定杂种后代中,无论过去几代,都可以识别出其母系遗传亲本[12-13],这为探索植物的进化关系提供了宝贵的分子信息[14-16]。因此,一些传统的叶绿体基因片段标记,如rpl16、psbA-trnH和rpl32-trnL基因间隔区等在植物遗传多样性分析中得到了广泛应用[17]。然而,传统的叶绿体基因分子标记在山茶属植物种内较低阶单元分类研究中的应用价值相对有限。已有研究显示,在用叶绿体基因片段进行物种低阶单元划分时,应首先在叶绿体全基因组中筛选出适用的高度可变区[18]。
随着作物品种资源数目的增加,传统的作物形态标记鉴定方法已经难以对现有品种进行准确鉴定[19]。利用分子标记鉴定技术来构建作物种质资源的身份证已成为作物品种鉴定的趋势。目前,叶绿体基因组 SNP标记在茶树种质资源的鉴定方面鲜有报道,本研究筛选出多态性高的叶绿体SNP位点组成DNA指纹图谱对茶树品种进行区分及母系溯源,并结合品种资源基本信息构建品种条形码身份证,旨在为茶树品种保护和母本溯源等方面研究提供新的思路与方法。
茶树样品采自武夷学院茶树种质资源圃(118°0'14.40"E,27°43'42.46"N),所采摘 169份茶树种质样品见表1。
表1 169份供试茶树种质资源Table 1 169 tea germplasm resources used in this study
1.2.1 茶树田间取样与茶树DNA的提取
采摘新鲜的茶树嫩叶,采摘标准为一芽二叶。取0.2 g嫩叶用70%乙醇消毒后,用蒸馏水冲洗,加入液氮迅速研磨成粉末,利用植物基因组DNA提取试剂盒(康为世纪生物科技股份有限公司CW0553s)提取茶树DNA。
1.2.2 茶树DNA质量检测方法
用1.0%琼脂糖凝胶和Nano Drop分光光度计分别检测 DNA的质量与纯度。以 DNA凝胶电泳结果呈单条带,OD260/280值在1.60~1.80,OD260/230值大于2.00为合格标准。
1.2.3 多变区筛选及通用引物设计
NCBI数据库下载已报道的 18个茶组植物叶绿体全基因组序列(表2),使用MAFFT 7.0软件进行序列同源比对。使用DnaSP软件分析基因组多变区及多样性(Pi),在多变区两侧保守区域开发茶树 PCR通用引物用于基因组序列扩增,引物由生工生物工程(上海)股份有限公司合成。
表2 NCBI下载的18个茶组植物叶绿体全基因组Table 2 The information of 18 complete chloroplast genomes of tea plants downloaded from NCBI
1.2.4 PCR扩增
30 μL反应体系:DNA模板50 ng,正、反向引物(10 μmol·L-1)各 1 μL,5×FastPfu Buffer 6 μL,2.5 mmol·L-1dNTPs 2 μL,补充ddH2O至30 μL。PCR扩增反应程序:95℃预变性 5 min;94℃变性 30 s,55℃退火 30 s,72℃延伸30 s,共30个循环;72℃延伸7 min,4℃保存。PCR产物以 1%琼脂糖凝胶电泳为清晰单条带为合格标准,合格产物委托生工生物工程(上海)股份有限公司进行正、反向一代测序。
选择测序峰图SNP位点清晰的分子标记,利用PowerMaker 3.25软件计算分子标记多态性信息含量(PIC)值,选择PIC>0.05的分子标记用于DNA指纹图谱构建。利用MEGA 5.1软件使用最大似然法(Maximum likelihood)对茶树样品的基因序列进行聚类分析,利用条码在线生成器(http://barcode.tec-it.com/ barcodegenerator.aspx)对茶树品种身份证进行条码转换。
使用DnaSP软件对18个已知茶组植物叶绿体全基因组序列进行多变区分析(表2),选择多样性指数(Pi)值大于 0.01的区域进行下一步分析(图1-A)。在多变区两侧的保守区域设计17对通用引物在169个茶树品种中进行PCR扩增,扩增产物大小在300~800 bp。其中琼脂糖凝胶电泳为清晰单一条带(图1-B)且测序峰型清晰(图1-C)的引物被考虑作为分子标记。经测序,有16对引物(表3)扩增出多态性,PIC 值分布范围为0.057~0.670,平均值为0.321。16对分子标记中含测序峰图清晰的SNP位点25个。
图1 茶树叶绿体基因组序列多变区SNP分子标记筛选Fig. 1 Screening of SNP molecular markers in the variable regions of tea plant chloroplast genome sequence
表3 16对叶绿体基因组SNP分子标记表Table 3 The information of 16 SNP molecular markers in chloroplast genome
使用25个SNP可将169份茶树种质形成118个单倍型(图1和图2),基于这套分子标记构建系统聚类树,并根据已知的物种选育信息进行母系溯源分析,结果表明这套分子标记可应用于茶树母系溯源初步鉴定。例如,丹桂是以肉桂为母本杂交而来;福云6号和福云10号是以福鼎大白茶为母本杂交而来。这些同一母系来源的品种在进化树上的亲缘关系非常接近,有的甚至共享单倍型。因此,运用这套分子标记对目前尚有疑问的 4个大红袍品种的母系来源进行初步判断,结果显示,4株大红袍的母系来源不同,大红袍2与大红袍4的母本亲缘关系较近,但是它们与大红袍1和大红袍3之间的关系较远(图3)。
图2 25个SNP位点串联单倍型可视化图Fig. 2 Visualization of 25 SNP tandem haplotypes
图3 基于SNP集的聚类分析Fig. 3 Cluster analysis based on SNP set
将 25个SNP位点进行数字编码用于品种的DNA指纹图谱信息:分别将碱基A、T、C、G转换成数字1、2、3、4。除SNP指纹编码外,也对品种的基本信息编码,参考陈亮等[20]方法,将基本信息分为4个部分:(1)茶组植物物种,茶(Camellia sinensis)为1,大厂茶(Camellia tachangensis)为2,厚轴茶(Camellia crassicolumna)为 3,大理茶(Camellia taliensis)为4,秃房茶(Camellia gymnogyna)为5;(2)区域代码,由2位数字组成,以各省、自治区、直辖市、特别行政区的行政区划代码组成,如福建为35,国外记为00等;(3)资源类型,野生茶树为1,地方品种、地方种质为2,优良品种(含育成品种)为3,新选品系、株系为4,国外品种为5;(4)共享单倍型区分,相同母系的不同品种中若出现共享单倍型的分别暂以1,2,3……不同数字区分,其余特有单倍型的品种均标注为0。将品种基本信息和DNA指纹图谱共同组成由30位数字编码的分子身份证(表4)。例如,福鼎大白茶的品种资源基本信息为:茶(C.sinensis),产于福建,优良品种,存在共享单倍型,转换成数字码分别为13531。25个SNP分子标记分别为GCCTGGGGGTAAT CGATGGTTAAAA,转换成 25位数字码为4332444442112341244221111,则福鼎大白茶的分子身份证为1353143324444421123412442211 11。福云6号、福云10号以福鼎大白茶为母本杂交而来,三者共享SNP单倍型。分子身份证分别为 135324332444442112341244221111和135334332444442112341244221111(图4)。
表4 169份茶树品种资源的叶绿体分子身份证Table 4 Chloroplast molecular ID of 169 tea plant species resources
续表4
图4 条形码与二维码示意图Fig. 4 Diagram of bar code and two-dimensional code
SNP单核苷酸多态性标记由于其正确性与高重复性已广泛应用于作物的遗传背景选择和分子辅助育种[21-22]。叶绿体基因组结构保守,其单系遗传以及非重组的特性使叶绿体基因SNP标记具有更好的群体分辨率[23],在植物不同种类的种质鉴别、物种分化及母系溯源等研究方面已得到了广泛的应用[24-26],然而茶树的叶绿体 SNP标记鲜见报道。本研究通过对茶树叶绿体基因组进行 SNP分析,筛选出适用于茶树种质鉴别与母系追溯的25个SNP位点,在169个样本中共形成118个单倍型,结合已知的物种选育信息,发现同一母系来源的茶树品种共享单倍型,或者亲缘关系较近,这表明本研究中所使用的分子标记可应用于母系溯源初步鉴定。基于此,利用这套分子标记对武夷山 4株大红袍茶树关系进行分析判断。据历史资料记载与先前的研究结果,原本武夷山九龙窠上种植的大红袍为三株,第二株(大红袍2)为正本大红袍,第一株(大红袍1)和第三株(大红袍3)为副本,目前的第四株(大红袍4)来源尚存疑问[27]。本研究结果显示,4株大红袍的母系来源不同,大红袍2与大红袍4的母本亲缘关系较近,而与大红袍 1、大红袍 3的关系较远,这表明大红袍 2与大红袍4虽然直接的母系来源不同,但有更近的共同母系祖先。但是,仅以叶绿体基因组部分信息并不能完全代表物种亲缘关系的情况,有性杂交繁殖过程中还会出现细胞器基因与核基因水平转移、渐渗等情况,呈现复杂的网状进化[28-29]。因此,这套 SNP标记只能作为母系溯源的初步判断,阐明4株大红袍具体的关系还需进一步结合更多的叶绿体基因组位点、线粒体基因组与核基因组信息。此外,在品种鉴别方面,由于叶绿体基因组的保守性,这套SNP标记在一些母系相同的品种中,因其存在共享单倍型,仍未能得以有效区分,需要进一步补充完善更多的有效SNP位点。尽管如此,这套叶绿体SNP标记可在169个茶树种内实现118个单倍型的区分(70%),体现出较高的区分能力,有一定的应用价值。与基于DNA大小片段分离的 SSR分析相比,SNP分析可通过高通量的形式自动化检测。因此,这些茶树叶绿体 SNP分子标记有望结合竞争性等位基因特异性 PCR(Kompetitive allele specific PCR,KASP)、DNA芯片法等实现高通量自动化检测茶树种质。同时,该数据在基因组水平上拓展了茶树可用分子标记的范围,也为茶树品种的种质资源鉴定、亲缘关系评价、细胞质遗传特性等研究提供了新的思路和方法。