许雯雯,龙松华,邱财生,郭 媛,王 慧,郝冬梅,王玉富
(中国农业科学院麻类研究所,湖南 长沙 410205)
【研究意义】甘蔗(Saccharumofficenarum)是世界上主要的糖料及生物能源[1],我国食糖总量的90 %以上为蔗糖[2],甘蔗燃料乙醇产量约占世界生物燃料乙醇总产量的40 %[3]。如今种植的甘蔗多为异源多倍体或非整倍体,染色体数在100~150条之间且相差较大[4-6],一个基因座上有多个等位基因,遗传背景十分复杂[7-8]。杂交是培育甘蔗新品种及品种改良最重要的方式,在大多数的甘蔗生产国的糖业发展中起着重要的作用。育种亲本和种质资源的好坏影响着产量相关的各项指标,因此了解品种的遗传多样性群体结构在育种中起着不可忽视的作用。【前人研究进展】针对甘蔗的遗传多样性,前人已经做了不少研究,Sanghera[9]通过路径分析方法对13份材料的产量、质量性状进行分析,为亚热带地区提供适宜种植、高糖、高产的优良品种。ZAN[10]等人通过AFLP分子标记对来源于不同国家的118份甘蔗种质进行检测,研究表明,各国间的甘蔗种质资源具有较高的遗传相似性,同时证明了来自于美国的种质资源具有更高的遗传相似性。Ahmah[11]等人的研究表明,利用SSR分子标记结合毛细管电泳(CE)或聚丙烯凝胶电泳(PAGE)检测系统可以高效的对甘蔗种质资源进行分子鉴定、遗传多样性评价、亲本材料筛选。Liu[12]等人利用30对SSR分子标记对不同倍性的崖城割手密进行分析,证明了十倍体及八倍体甘蔗群体比九倍体及十二倍体甘蔗群体具有更高的多样性。Esayas[13]等人利用22对SSR分子标记对埃塞俄比亚当地的100个甘蔗品种遗传多样性以及群体结构分析,认为本地甘蔗种质资源具有较高的遗传多样性,可为开展育种研究提供丰富的材料。Mariana[14]等人利用107对SSR分子标记及136对AFLP分子标记对63个甘蔗材料进行遗传分析,证明了SSR标记比AFLP标记进行遗传多样性及群体结构分析更可靠,同时表明基于贝叶斯法的群体结构分析比主成分分析法和系统聚类法更有效。【本研究切入点】综合特性优良的SSR核心引物,对于甘蔗种质资源鉴定、群体划分、遗传多样性分析、品种纯度及真实性检测等研究具有重要的价值,然而不是所有的SSR引物都具有相等的应用价值,因此必须根据所进行的研究需要对引物进行全面的评价,确定其利用价值,更高效的应用于甘蔗材料遗传多样性及群体结构的研究。另一方面由于通过产量、质量性状、同工酶标记等传统技术对甘蔗品种特性以及遗传多样性的鉴定可靠性相对较低,近年来,分子标记技术以广泛应用于甘蔗品种遗传多样性的研究上,如AFLP[10]、PFLP[15]、RAPD[16]等,与其他分子技术相比,简单重复序列(simple sequence repeats,SSR)具有高分辨率、高稳定性、重复性好、共显性遗传和操作简单等特点[17-18],更广泛的应用于分子生物学研究中。但目前依然缺乏对中国南方甘蔗主产区资源遗传背景的了解,采用SSR分子标记进行南方甘蔗主产区的栽培品种遗传多样性分析及群体结构分析的报道还比较少。【拟解决的关键问题】中国具有丰富的甘蔗种质资源及育种亲本。本研究通过对已公布的68对SSR引物,筛选对所研究材料具有多态性高、稳定性好的核心SSR分子标记引物,为后续开展甘蔗材料遗传多样性分析等研究提供理论依据。运用SSR分子标记技术,对95份我国主要栽培材料,进行遗传多样性和群体结构分析,旨在揭示我国甘蔗主要育种材料的遗传多样性和群体结构特征,为甘蔗生产、种质资源管理、分子标记辅助选择、育种实践以及关联图谱的构建等提供理论依据和实践参考。
1.1.1 供试甘蔗 在贵州、广西等南方地区收集具有代表性的19个甘蔗品种,同一品种在主栽区不同地理位置分别取5株样品,所有材料于2016年4-11月和2017年4-11月连续2个生长季种植于中国农业科学院麻类研究所长沙创新试验基地,每个品种种2行,行长6 m,行间距1.5 m。于分蘖期采嫩叶片,共95份材料于-70 ℃保存备用。材料编号、品种名称、育种单位如表1所示。
1.1.2 SSR引物 所有的68对甘蔗SSR引物均根据已有的研究基础,引自相关文献[19-22]。SSR引物由上海生工生物科技有限公司合成。
表1 95份供试材料的名称及地理来源
1.2.1 DNA提取 采用DNA提取试剂盒[天根生化科技(北京)有限公司]提取甘蔗幼嫩叶片基因组DNA,稀释至50 ng/μl工作液,采用1.0 %琼脂糖凝胶电泳检测,100 V电压,电泳30 min,结果用紫外线凝胶成像仪检测。
1.2.2 PCR扩增及其产物检测 PCR扩增试验采用北京天根公司生产的2×TaqPCR MasterMix(KT201)产品,包括TaqDNA聚合酶0.1 U/μl、dNTPS(dATP、dCTP、dGTP、dTTP)500 μM、Tris-HCl(pH 8.3) 20 mM、KCl 100 mM、MgCl23 mM、2×PCR反应的增强剂和优化剂以及稳定剂。快速简便、灵敏度高、特异性强、稳定性好等优点,可最大限度的减少人为误差。
PCR反应体系(20 μl):2×TaqPCR MasterMix 10 μl,模板DNA 1 μg,前引物1 μl,后引物1μl,ddH2O补至7 μl。
PCR扩增程序:94 ℃预变性 3 min;94 ℃ 变性 30 s,退火30 s,72 ℃延伸1 min,共 30个循环,72 ℃延伸 5 min,在 Biometre 公司 T-Gradient Thermoblock 型号 PCR 扩增仪上扩增,PCR产物 4 ℃保存或进行聚丙烯酰胺凝胶电泳分析,EB替代物染色,紫外凝胶成像仪检测结果。
PCR扩增产物经94 ℃变性后在8.0 %的变性聚丙烯酰胺凝胶上电泳分离,电泳仪北京君意公司产品,缓冲液为1×TBE。电压为180 W,电泳时间为2.5 h。卸胶后,采用10 %乙醇,1 %冰乙酸固定10 min,去离子水漂洗1 min;0.1 %的硝酸银轻摇染色10 min,去离子水漂洗2次;最后用提前预冷的1.5 %NaOH和1 %甲醛的显色液显影,在紫外凝胶成像仪观察检测结果。
1.3.1 聚类分析 SSR扩增谱带在同一位点上具有相同迁移率的条带记为1,无带记为0,将甘蔗基因组特定位点的多态性数字化,进行二维数据统计[23-25],并统计每对引物扩增出的总条带数和多态性条带数。
1.3.2 群体结构分析 依据Hubize等[26]的方法,利用STRUCTURE 2.3.4数据处理软件,进行基于数学模型的类群划分,设置分析群体数K(the true number of clusters)为1~10,每个参数运行10 次,每次运行的不作数迭代(Length of burn-in time)设置为10 000,重复次数为10 000。计算结果用Structure Harvester网页工具(http://taylor0.biology.ucla.edu/structureHarvester)分析[27],根据lnP(D)或者ΔK的值确定群体的亚群数,根据似然值最大的运行结果划分亚群并绘制出模型的群体遗传结构图。
取部分已提取好的甘蔗DNA,各1 μl,与1 μl的6-Loading Buffer 混匀,用1 %的琼脂糖凝胶,100V电压,电泳30 min,结果用紫外凝胶成像仪检测。
图1 部分样品DNA电泳图Fig.1 Some samples of DNA electrophoresis figure
从图1可以看出,所提取的甘蔗DNA,质量完好,主带唯一,无拖尾和弥散,能够满足SSR标记要求。
由表2显示,利用68对SSR引物对19份不同品种的甘蔗材料提取的DNA进行扩增,综合比较各引物的多态性信息量(PIC)、带型清晰度、稳定性和重复性高低等,最终筛选出21对表现良好的SSR引物。由表3显示,筛选出的21对引物在19个甘蔗品种中共检测出440条谱带,多态性谱带数为422个,多态率达95.90 %,条带大小分布在100~500 bp之间。其中引物ZP22、ZP30扩增出的条带数最多,各扩增出29条,引物ZP25扩增条带数最少为12条。21对引物的SSR多态性信息量(PIC)变化为0.7855~0.9279,平均值为0.8664。从总体来看,19个甘蔗品种在21对SSR位点上表现出丰富的遗传多样性。
表2 68对SSR引物名称和序列信息
表3 21对甘蔗引物的SSR检测
2.3.1 基于SSR分子标记的遗传距离 通过Powermarker v3.25软件计算19个群体于SSR分子标记的Nei’72遗传距离为0.2024~0.7262,平均Nei’72遗传距离为0.5779,同一品种的不同个体间有一定的遗传差异,但是遗传距离较群体间的遗传距离小。
2.3.2 基于SSR分子标记的聚类分析 从图2可以看到,不同地理位置的同一品种基本聚在一起,说明群体内个体间遗传相似性比较低。如图3所示,罗汉蔗群体最先与其他材料形成的大类群分开,表明罗汉蔗与其他材料表现出较远的亲缘关系,其次是桂热2号与广东黄皮。查找相关资料显示黔蔗08-526与黔蔗08-536均是由ROC10与崖城84/125杂交获得,而从图中可以看到黔蔗08-526与黔蔗08-536聚在一起,说明在选中的19份甘蔗材料中其亲缘关系较近。在遗传距离0.3处,19个群体可以分成4个类群。其中,类群Ⅰ包括罗汉蔗一个群体;类群Ⅱ包括福农38、黔蔗08-536、新台糖22、内江97-113、台糖、黔蔗06-156、黔蔗06-126、黔糖4号、黔蔗08-558、黔蔗06-212、黔蔗08-526,共11个群体;类群Ⅲ只含有桂热2号一个群体,类群Ⅳ包括黔蔗08-688、桂果糖1号、黔糖3号、黔糖5号、湖南本地品种、广东黄皮,共7个群体。在遗传距离为0.26处,类群Ⅱ、Ⅲ又可以分别划分为3、4个亚类群。其中,部分黔蔗品种分别聚集分布在同一类群,如黔蔗06-156、黔蔗06-126、黔糖4号分布在同一个小亚群,黔蔗08-558、黔蔗08-536、黔蔗08-526分布在同一个小亚群,但是也有个别的黔蔗系列品种分布在其他的类群。
图2 95个甘蔗个体基于Nei’1973遗传距离构建的UPGMA聚类图Fig.2 UPMGA dendrogram based on Nei’1973 genetic distance for sugarcane
图3 19个甘蔗群体基于Nei’1973遗传距离构建的UPGMA聚类图Fig.3 MGA dendrogram based on Nei’1973 genetic distance for sugarcane
对19个甘蔗群体,共95个个体,进行依据SSR分子标记的遗传结构分析。参照Evanno等[28]的方法,ΔK取得最大值各群体内甘蔗材料的相似性最大。由图4显示,当K= 6时,ΔK出现明显的峰值,个群体内甘蔗相似性最大,所以确定群体的数目为6。如图5(见封三)所示,190份甘蔗个体可被分成6个亚群,这6个亚群分别包含了20、10、15、20、25、5份材料。黄色所占比例较多的群体为1个亚群即亚群Ⅰ,含有4个群体分别为TZ01、GZ01、TZ02、TZ10,绿色所代表的亚群Ⅱ含有2个群体为TZ07、TZ08,粉色亚群Ⅲ含有3个群体为TZ11、GZ06、GZ08,橙色亚群Ⅳ含有4个亚群分别为GZ07、GZ03、GZ04、GZ05,红色亚群Ⅴ含有5个亚群分别为TZ04、TZ06、TZ05、TZ03、TZ09,蓝紫色的亚群Ⅵ只含有1个群体为GZ02。
PIC值是核心引物筛选的重要指标。本试验从已公布的68对SSR引物中筛选出多态性高、稳定性好的21对核心引物,平均PIC值为0.8664,高于前人Amaresh[29]公布的PIC值0.66、0.77,以及Hu[30]等公布的0.64,但是低于前人Liu[31]等人报道的平均PIC值0.9724,主要因为对引物多态性高低的评估受所利用材料类型及材料范围的影响较大[32-33]。此外引物ZP22、ZP30扩增出的条带数最多,各为29条,PIC值分别为0.8531、0.9052,引物ZP25扩增出的条带数最少为12条,但其PIC值为0.8680高于ZP22,同时引物ZP40扩增的条带数为15,少于引物ZP22、ZP30扩增的条带数,但是其PIC值较高为0.9126,这些SSR分子标记具有较高的多态性及较多的等位基因数,表明在甘蔗品种间亲缘关系分析及指纹识别方面具有重要作用,但是SSR分子标记扩增等位基因的数目不能直接反映其鉴别甘蔗品种的能力,这与Hameed[34]报道的一致。筛选获得的21对引物对本试验所分析的材料表现出较高的多态性,但是对于其他材料或随着品种增加以及品种来源地的丰富,这些引物是否同样具有较好的鉴别能力还需要进一步的研究。
图4 K值曲线图Fig.4 Curve diagram of K value
遗传距离及遗传相似通常是对遗传多样性进行评价的2种指标。材料遗传多样性高低一定程度上决定了新种质开发与品种培育的成效,对于指导资源的利用和提高品种选育效率具有重要意义。本研究结果中19个群体的遗传距离为0.2024~0.7262,平均遗传距离是0.5779,高于前人Esayas[13]、Sharma[35]等人报道的遗传距离,本试验所选取的研究材料遗传多样性较丰富,可能是由于所选择的材料包含丰富的亲本类型,同时所选材料地理分布差异较大,能够较好的反映我国目前主要甘蔗栽培品种的遗传多样性。基于SSR分子标记的聚类分析表明,亚群的划分与品种地理来源地存在一定的联系,如黔蔗08-558与黔蔗08-536遗传距离较近、黔糖3号与黔糖5号遗传距离较近,但是两组间的遗传距离相差较大,分在不同的组里,这可能与杂交亲本的亲缘关系远近有一定的关系,与Giovanni[36]、Yves[37]等报道的一致。
通过聚类分析可以初步对群体进行亚群的划分,但是要想获得亚群更合理的划分则需要群体结构分析完成,为了进一步对19个群体研究,采用群体结构进行分析。本研究中,主要栽培地区甘蔗品种的群体结构分析与聚类分析结果有一定的相似性,但是具体的亚群划分存在差异,与Ren等[38]在花生群体结构与遗传多样性的报道一致。不同地区同一品种的个体间存在较少的差异,可能与甘蔗生产上多采取无性繁殖保育的方式有关[39],也可能与样品采集的地理位置相差不大有一定的关系,使得个体间的基因型保持相对一致,但是不同品种的群体间遗传差异较大,本试验将19个群体划分为6个亚群,且混合亚群所占的比例较多,表明19个群体间的亲缘关系较远,本研究结果与Yong wen等[40]关于甘蔗品种的遗传多样性及群体结构分析的报道和 Yves等[37]关于玉米遗传多样性及群体结构分析的报道一致。
本研究通过对已公布的68对SSR引物进行筛选,获得的21对SSR引物能够很好的区分本研究的各个材料,同时供试材料基因组水平的遗传多样性较丰富,可为上述亲本资源的利用奠定良好的基础,并为今后研究中的亲本选择和组合等方面提供重要参考。