冯源恒 杨章旗 谭健晖 李火根 陈新华
(广西壮族自治区林业科学研究院,南宁,530002) (南京林业大学) (南宁市林业科学研究所)
随着林木育种理论的不断发展,育种群体的结构化已成为制定育种策略的重要部分。将规模较大的育种群体结构细化,有利于育种材料的管理,降低杂交育种成本,充分发挥优异亲本的价值。目前已有多种育种群体的结构设计应用在林木上。如“核心群体”策略[1-2]、“亚系”策略[3-4]、“多重群体”策略[5]等。
马尾松(PinusmassonianaLamb.)是我国南方最重要的造林树种之一,也是我国林业科研领域长期重点研究的树种[6]。我国马尾松种质资源丰富,南方各主要马尾松分布省区都建立规模较大育种群体,以有效地保存遗传多样性,从而在长期育种中获得更高的遗传增益[7]。但育种群体规模越大,对育种材料的管理难度也随之增加。为了在早期改良中获得较大的遗传增益,保证长期育种计划得以持续,应充分利用优良育种材料的优势,有效控制近交发生。因此,科学设计育种群体结构,建立核心育种群体尤为重要。
广西马尾松第1代育种群体构建于上世纪80年代,由464个无性系组成。1987—1994年间,陆续开展了种子园自由授粉子代的测定,共建立子代测定林11片共29 hm2[8]。育种群体规模较大既为高世代遗传改良研究提供了较丰富的遗传多样性基础,也给育种群体的遗传管理带来难度。同时,选择精英育种群体和1.5代生产性种子园的材料时如何避免近交也是第一代改良中急需解决的问题。而对育种群体进行科学的亚系划分,将较大育种群体细化为较小育种单元,可以使遗传改良研究更为精细,在追求改良增益的同时实现对近交的有效控制。此为,本研究跟据马尾松第1代育种群体半同胞子代测定试验数据,估算各亲本的育种值,并结合SSR分子标记技术根据遗传距离对育种群体进行亚系结构划分,将遗传距离较近的亲本划入同一亚系。以选择高育种值无性系,并以控制群体近交水平为原则,构建马尾松第1代核心育种群体,从而为马尾松育种材料的科学管理提供技术支持,并为高世代杂交育种试验提供骨干亲本。
研究材料为南宁市林科所马尾松国家级良种基地的马尾松第一代育种群体464个无性系。广西马尾松第一代育种群体构建于上世纪80年代,以生长量为主要改良性状。材料源自1976年、1977年及1984年对广西全境的马尾松人工林和优良种源的天然优良林分进行优树选择所得的速生性状优良单株[7-8]。其中有153个选自广西桐棉、古蓬、容县3大优良种源区的马尾松天然林,有311个选自广西境内30个国有林场的人工林。所有育种群体材料均以无性系形式(每个无性系8株)保存于2010年新建的马尾松基因库中[9]。2012年6月采集每个无性系的新鲜针叶并冷冻保存。
以1988年、1992年和1994年分别在南宁市林科所营造的马尾松第一代育种群体半同胞子代测定试验为材料计算亲本育种值。8个子代测定试验共测定来自440个无性系(另有24个无性系未进行测定)的901个半同胞家系,所有家系均来自南宁林科所马尾松初级种子园。子代测定林具体情况见表1。
表1 各子代测定试验概况
松树针叶DNA提取采用CTAB裂解—硅珠吸附法[10]。DNA纯化后,经分光光度计检测纯度,并置于冰箱4 ℃保存备用。
使用16对SSR引物用于育种群体遗传结构分析。该批引物基于马尾松基因组测序开发得到[11]。引物由上海捷瑞基因技术有限公司合成。PCR反应体系为10 μL:Tris-HCl 10 mmol/L pH8.0,KCl 50 mmol/L,Mg2+2.5 mmol/L,dNTP(dATP、dCTP、dGTP、dTTP各0.2 mmol/L)。引物2.5 pmol,Taq聚合酶0.8 U,DNA 10~20 ng。扩增反应程序采用Touch-down PCR:94 ℃ 15 s,60 ℃ 15 s(Δ℃=-0.5),72 ℃ 30 s,16个循环;在进入94 ℃ 15 s,52 ℃ 15 s,72 ℃ 30 s,10个循环;最后72 ℃延伸15 min[11]。SSR-PCR产物在8%的聚丙烯酰胺凝胶上电泳,并照相记录[12]。其显带的记录方法为:电泳图上目的片段范围内,清晰、重复的条带,根据分子质量大小,从大到小依次记作A、B、C、D、…、1条为纯合,2条为杂合,分别记录为aa,ab,bb,ac,ad,cd等,按照等位基因的位置不同而不同,从而获得原始的数据。
采用POPGEN32软件[13]计算遗传距离(Genetic Distance,GD)[14],据此采用软件NTSYS软件按非加权类平均法(unweighted pair group method with arithmetic averaging,UPGMA)进行聚类分析。采用Coancestry Version 1.0软件[15]计算群体内的近交系数Θ[16-19]。
根据子代测定试验的树高、胸径测定结果,采用公式1.1计算材积[20]。
V=0.714 265 437×10-4D1.867 008H0.901 463 2。
最佳线性无偏估计公式育种值,利用混合模型方程组求解。上述线性模型的矩阵表达式为:
Y=Xβ+Zu+e。
式中,β=(μ,B1,…,Bb)′为区组固定效应向量;u=(F1,F2,…,Ff)′为家系的随机效应向量;e是随机误差效应向量;X、Z分别是相应项的设计矩阵。计算育种值的混合模型方程为
采用ASReml软件依据上述模型计算家系的亲本无性系育种值[22]。
根据3个原则对育种群体进行亚系划分:(1)控制近交水平;(2)降低单元内育种亲本的数量;(3)优良无性系均匀分布在各个亚系。首先根据SSR分析结果,计算亲本间遗传距离[14],并进行遗传聚类。然后采用ASReml软件根据子代测定数据估算得到440个无性系材积性状的育种值。采用SAS软件以xij=u+βi+εij为线性模型分别对不同层次聚类分支间的育种值进行方差分析,式中:xij表示来自第i个分支、第j个亲本的育种值;u表示总体平均值;βi表示分支效应;εij为随机误差。如不存在显著差异说明该层聚类分支间优良无性系分布均匀,可作为划分亚系的依据。
根据3个原则选择核心群体材料:(1)入选无性系具有较高育种值;(2)控制无性系间亲缘关系;(3)最大限度继承第1代育种群体的遗传多样性。拟采用3种方案进行选择。A方案:根据育种值对第1代育种群体进行整体选择,选择育种值最高的20%无性系作为核心群体。B方案:跟据亚系划分结果,在亚系内根据育种值选择优良无性系。C方案:在B方案基础上,进行遗传多样性分析,对损失的等位基因进行补充。
根据16对SSR引物的扩增结果[9],采用POPGEN32软件计算得到464个无性系间的Nei’s标准遗传距离(DG)[14],共得到107 800对无性系间遗传距离,平均值为0.25。其中桂GC647A与桂GC710A间DG值最大,为1.33;最小的DG值出现在桂GC630A与桂GC483A间,为0.01。采用软件NTSYS根据Nei氏遗传距离[14],按非加权类平均法(UPGMA)对464个无性系进行聚类分析。经分析发现,马尾松1代育种群体的聚类结构存在2个特征,一是无大规模的亚群结构,二是聚类结构与优树来源地无明显的重合性。在已报道的许多植物种质资源遗传结构研究中都发现大多数无性系集中分在几个主要的大类群上并与原始选择地点或分布区相对应,如美国大麦及美国陆地棉都分为5个亚群,意大利苹果则分为2个亚群[23-25]。而广西马尾松1代育种群体则未见集中分布亚群结构,遗传距离在0.29~0.31范围内,437个无性系较为均匀分布在16个聚类分支上,其余27个无性系零散分布在8个分支上。据此将464个无性系分为17个大类群,每个类群无性系数目为20~36。17个大类群下又可细分为34个小聚类群,每个小类群无性系数目5~24。大小聚类群与原始选择地点均无明显的对应关系。
因为广西马尾松1代育种群体均为速生用材型无性系,所以使用材积指标估算育种值。采用ASReml软件根据子代测定数据估算得到440个无性系材积性状的育种值。其中无性系桂GC415A育种值最高(0.094),最低为桂GC1610A(-0.090),见表2。
根据遗传聚类分析结果,采用SAS8.1软件分别对17个大类群及34个小类群的无性系育种值进行方差分析,发现无性系材积性状育种值在大类群间无显著差异,在小类群差异显著(p<0.05)。因此将广西马尾松第一代育种群体划分17个亚系。为避免亲本选配时出现近交情况并降低育种单元的无性系数量,在17个亚系下细化为34个组。将育种值排名前20%的无性系视为优良无性系[26],亚系桂GC1-J中优良无性系数目最多,亚系桂GC1-K中优良无性系数目比例最高。
表2 各亚系育种值信息
采用POPGENE32软件对各亚系的遗传多样性进行分析。观察等位基因数(Na)变化范围在2.13~2.81。Shannon多样性指数(I)变化范围在0.43~0.74;观测杂合度(Ho)变化范围在0.34~0.48,近交系数变化范围在0.007~0.119。
根据育种值进行整体选择(A方案)所选出的无性系数量为88个,平均育种值0.054。16对SSR引物在这88个无性系中共扩增出46个等位基因,近交系数为0.094高于第1代育种群体。由表2可知,各亚系中优良无性系的数量存在一定差异,仅根据育种值选择核心群体材料则会选入许多亲缘关系较近的无性系。且由于仅根据育种值进行选择,该方案也造成了一定的低频等位基因损失。
因此需平衡各亚系的入选数量,进一步精选。通过分析发现,各亚系中育种值在前10%无性系均为优良无性系,这与季孔庶等[27]在对马尾松无性系种子园进行家系选择时的入选率相同。将此设定为核心群体材料的亚系内选择标准,并限定每个亚系入选无性系数量不能超过3个(B方案)。按此标准共选出47个无性系,平均育种值0.064。但研究发现16对SSR引物在这47个无性系中共扩增出44个等位基因,而第一代育种群体在这16个位点上共有51个等位基因。这表明在选择中等位基因损失率为13.73%,见表3。
表3 各亚系遗传多样性
为了弥补等位基因的损失,研究从含有这些基因的无性系中选择育种值最高的补充入核心群体(C方案)。经补充的核心群体共有53个无性系,平均育种值为0.060,平均等位基因数(Na)3.19、平均有效等位基因数(Ne)1.77、遗传多样性指数(I)0.65、观测杂合度(Ho)0.41。遗传多样性水平与第一代育种群体总体水平相当[9]。核心群体近交系数为0.079,与第一代育种群体总体水平相同,见表4。
表4 3种选择方案的遗传多样性
注:A方案:根据育种值对第1代育种群体进行整体选择,选择育种值最高的20%无性系作为核心群体。B方案:跟据亚系划分结果,在亚系内根据育种值选择优良无性系。C方案:在B方案基础上,进行遗传多样性分析,对损失的等位基因进行补充。*该数据来自参考文献[9]。
杂交亲本选配是科学管理利用育种材料的核心环节。目前几乎所有的育种群体结构设计方法都是围绕这一问题展开的,其设计思路的出发点有2个:一是实现对育种材料的分类管理,二是缩小基础育种单元的规模。例如“多重群体”策略是按照不同的育种目标性状对材料进行分类管理[5],而“核心群体”策略是按照育种材料的品质进行分类管理[1],“亚系”策略则更为重视缩小育种单元的规模[4]。就广西的马尾松而言,第一代育种群体具有规模大、育种目标性状一致、存在一定的近交情况(近交系数0.079)等特点。因此,对其进行结构细化应该重点考虑缩小基本育种单元规模和控制近交2个方面。研究跟据遗传距离聚类结果对育种材料进行划分管理,将亚系的规模控制在36个无性系以内,与美国湿地松的亚系规模接近[28-29]。并采用“亚系间杂交、亚系内慎交”的杂交亲本选配策略,有助于降低杂交试验的近交水平。而且为了避免划分单元过小造成优良无性系分布不平衡状况,本研究对不同划分层次的单元间育种值差异进行了方差分析与检验。基于此,在建立核心育种群体和1.5代生产性种子园时,可以依据无性系育种值的排名情况,从各亚系中较均匀的选取优良无性系,以实现兼顾亲本品质与控制近交。
核心育种策略最早是在绵羊育种中提出的[1]。以后经过Cotterill的修改、发展与实践,应用于树木改良[2]。其核心思想是以精选出的核心群体在早期改良时更快的获得遗传增益,以主群体保持遗传多样性为长期育种服务。但以往的核心育种策略更为重视入选材料在目标性状上的表现,而对材料间的亲缘关系及核心群体自身的遗传多样性考虑较少,完全依靠主群体对核心群体少量补充。因此也限制了该策略作为一种长期的林木育种策略的应用。因此,本次对广西马尾松核心群体的选择,在借鉴美国湿地松的群体结构划分策略[28-29]的基础上有所创新。根据遗传聚类将育种群体划分为17个亚系,再从亚系中选择优良无性系组建核心群体。可使核心群体规模大为精简,不但降低了育种成本,提高了改良工作的效率,还有效控制了近交程度。
但本研究发现单纯的依据育种值选择将造成一定比例稀有等位基因丧失。考虑到马尾松在广西不但是用材、造纸、松脂产业的原料,而且也是荒山绿化、水土保持等方面重要的生态造林树种。这就要求马尾松良种子代具有丰富的遗传多样性,在改良初期损失过多的等位基因显然是不利的。因此本研究在选择核心群体时借鉴了“核心种质”的部分理念,即选择出一个小规模的群体既能获得较高的改良增益又能最大程度的保持遗传多样性,使基因频率较低的等位基因有较大机会在精选群体的改良过程中传递下去。研究结果表明,采用这种方法选出的核心群体遗传多样性几乎没有损失,而且平均育种值也没有明显下降。本次选出的核心群体为今后高世代育种提供了骨干亲本。
综上所述,依据遗传距离及育种值对马尾松第1代育种群体进行亚系结构设计,不但可以有效控制杂交试验的近交水平,还可以兼顾优良无性系在亚系间分布均匀度。该方法可为马尾松育种材料的科学管理提供技术支持。以此为基础选择出53个无性系组成广西马尾松第一代核心育种群体,为高世代杂交育种试验提供了骨干亲本。新组建的核心群体遗传多样性和近交水平与第1代育种群体总体水平相当,但群体规模大为精简,更便于采用全同胞交配设计。不但降低了育种成本,提高了改良工作的效率,还有效控制了近交程度。