陈 存 丁昌俊 张 静 李 波 褚延广 苏晓华 黄秦军
(林木遗传育种国家重点实验室 国家林业局林木培育重点实验室 中国林业科学研究院林业研究所 北京 100091)
美洲黑杨(Populusdeltoides)原产于北美洲密西西比河沿岸,是当今世界中纬度地区最适合的短轮伐期工业用材集约经营树种之一,其基因资源已成为世界主栽杨树品种的重要基因供体(Fahrenkrogetal., 2017)。生产实践表明黑杨派(Sect.Aigeiros)杨树在我国杨树人工林中具有主导地位,美洲黑杨及其与欧洲黑杨(P.nigra)的杂交后代欧美杨(P. ×euramericana)成为我国商业化杨树的主体(苏晓华等, 2010)。但由于美洲黑杨个体大,生长周期长,且资源丰富,因此,为了更好地保存和利用美洲黑杨种质资源,需要具有良好的保存策略。
种质资源管理是一项复杂的任务,应该充分了解种质资源的遗传信息、形态多样性和适应性,同时需要有效识别种质资源个体,防止资源之间的冗余(Belajetal., 2018; Jarkkoetal., 2014)。种质库在植物种质资源的保护、管理和利用中发挥着重要作用,对植物育种的发展至关重要。在构建核心种质库前需要充分了解种质资源的遗传结构,这是对种质资源进行保护、利用的前提,有利于在对种质资源有效保存的前提下进行高效、合理的开发和利用(Wuyunetal., 2015)。在充分了解种质资源遗传结构的前提下,筛选有代表性的个体构建核心种质库进行保护和利用,能够缩短育种进程,加快遗传改良(Frankeletal., 1984)。
分子标记技术可以应用于种质资源群体结构研究和核心种质库构建,其中SSR分子标记技术因其稳定性和多态性而得到广泛应用。李洪果等(2018a)利用SSR分子标记数据,采用等位基因数目最大化法构建了杜仲(Eucommiaulmoides)的核心种质库; 张捷等(2018)利用SRAP数据,采用聚类不分组的优化LDSS法构建了新疆野核桃(Juglansregia)的核心种质库; Santiago等(2018)利用SSR分子标记技术对苹果(Malus×domestica)的遗传多样性进行研究,同时构建苹果核心种质库。
有关美洲黑杨种质库的研究也有所开展,倪茂磊(2011)利用24对SSR引物对124个美洲黑杨种质进行遗传多样性分析,采用逐步聚类随机取样的策略构建了不同取样比例的美洲黑杨初级核心种质库; 彭婵等(2019)利用20对SSR引物数据,对363份南方型美洲黑杨无性系的遗传多样性进行研究,采用逐步聚类随机取样法构建核心种质库,最终筛选出54份核心种质,取样比例为15%。然而,我国引进美洲黑杨种质资源主要包括北方型和南方型(李文文等, 2010),以上研究中的研究材料主要是南方型美洲黑杨,不能完整反映美洲黑杨群体的遗传结构。本研究选用的6个种源23个采样点的338个美洲黑杨个体选自于研究组美洲黑杨基因库,能够较完整地反映美洲黑杨群体的遗传信息。构建美洲黑杨核心种质库的研究主要基于群体结构的分析结果对原始种质进行分组,然后采用逐步聚类的方法,结合位点等位基因数目最大化法和位点稀有等位基因优先取样策略对无性系进行筛选。同时为了防止遗传信息的丢失,在构建的核心种质库中补充包含检测位点丢失的等位变异基因的种质个体形成优化核心种质库,使等位基因的保留比例达到100.00%,能够更加全面地保留原始种质库的遗传信息。本研究的结果有利于对美洲黑杨基因资源进行保护、管理和利用,促进杨树育种工作的发展。
本研究中的试验材料最初来自于美洲黑杨主要分布区,包括北美洲圣劳伦斯河流域(加拿大魁北克省,Que)、哥伦比亚河流域(美国华盛顿州,Was)和密西西比河流域(美国密苏里州,Mis; 艾奥瓦州,Iow; 田纳西州,Ten; 路易斯安那州,Lou)。从6个种源的23个采样点共选取338个美洲黑杨个体(表1)用于遗传多样性和群体结构的分析,材料来源信息与前期研究(Chenetal., 2020)中的一致。
表1 美洲黑杨种质资源信息Tab.1 Information of P. deltoides germplasm resources
1.2.1 基因组DNA提取、SSR引物筛选和PCR扩增 采用高效的改良CTAB法(丁浩等, 2015)提取叶片基因组DNA。利用琼脂糖凝胶电泳和8%的非变性聚丙烯酰胺凝胶电泳对SSR引物进行初步筛选,参与筛选的引物包括75对杨树功能基因开发的引物(杜庆章等, 2010; 王保垒等, 2011; Duetal., 2012; 2013; Wangetal., 2012; 卫尊征等, 2010)和70对杨树普通引物(倪茂磊, 2011; 黄烈健等, 2004; 张香华等, 2006; Weietal., 2014; Politovetal., 2015)。
PCR扩增反应体系为25 μL混合体系: 2.5 μL 10×buffer,1.8 μL dNTPs(2.5 mmol·L-1),正向引物(10 μmol·L-1)和反向引物(10 μmol·L-1)各1 μL,rTaq酶(5 U·μL-1)0.25 μL,DNA模板(50 ng·μL-1)1 μL和17.45 μL的去离子水(ddH2O)。PCR扩增程序为: 94 ℃预变性3 min; 94 ℃变性30 s,Tm℃(引物退火温度)退火30 s,72 ℃延伸45 s,35个循环; 72 ℃延伸10 min。扩增产物经由ABI 3730xl DNA analyzer(Applies Biosystems, USA)进行检测,获取位点扩增片段峰值图,利用Gene-Marker 2.2.0软件(SoftGenetics LLC, USA)对每个位点扩增片段峰值图进行读取并统计。
1.2.2 群体结构分析 通过Cervus3.0.7软件(Kalinowskietal., 2007)和MicroChecker 2.2.3软件(Van Oosterhoutetal., 2004)分别检测各个位点的无效等位变异频率,其中Cervus3.0.7软件可以计算得出位点的无效等位变异频率,当频率大于0.2时会对后续的分析结果产生重要影响(文亚峰等, 2013),MicroChecker 2.2.3软件直接检测位点是否存在明显的无效等位变异,分析结果选取2种软件的共同计算结果。同时利用Cervus3.0.7软件计算位点的多态信息含量(PIC)。借助GeneAlEx 6.503软件(Peakalletal., 2012)计算等位基因数(Na)、有效等位基因数(Ne)、Shannon’s信息多样性指数(I)、观测杂合度(Ho)、Nei’s遗传多样性指数(H)、个体间和群体间Nei’s遗传距离(GD)等遗传多样性参数。同时,对个体和种源群体进行主坐标(PCoA)分析; 利用NTSYSpc 2.10e软件(Rohlf, 2000)进行UPGMA聚类分析; 使用PHYLIP 3.6软件(Felsenstein, 2005)绘制种源间的无根树。
1.2.3 核心种质库构建策略 根据群体结构分析结果对个体进行分组,利用NTSYSpc 2.10e软件对每组个体进行聚类分析,采用逐步UPGMA聚类取样法筛选核心种质,在每次聚类的最低分组水平的2个或多个个体材料中采用位点等位基因数目最大化法和位点稀有等位基因优先取样相结合的策略筛选个体,即优先选择等位基因数目多的个体进入下一轮聚类,当等位基因数目相同时优先选择等位基因频率低的个体,每一轮聚类筛选出一个种质库(张春雨, 2008)。
1.2.4 核心种质库代表性检验方法 计算每一轮聚类形成的种质库的遗传参数(Na、Ne、I、Ho、H、PIC)及与原始种质库的相关遗传参数的保留比例,使用t检验分析每个种质库与原始种质库之间的遗传参数是否存在显著差异,当出现显著差异时终止逐步聚类,将上一步形成的种质库确认为核心种质库。同时利用主坐标分析法(PCoA)绘制核心种质库和原始种质库的分布图,进一步确认核心种质的代表性。
1.2.5 优化核心种质库构建策略 基于位点等位基因数目最大化的思想(等位基因保留比例达到100.00%),在核心种质库的基础上构建优化核心种质库。即分析核心种质库与原始种质库之间检测位点等位变异基因分布情况,统计核心种质库中丢失的等位基因,在原始种质库中挑选最少数量的个体包含丢失的等位基因,补充到核心种质库中,形成优化核心种质库,并对优化核心种质库的代表性进行评价。如果2个或多个个体都存在缺失的等位基因,优先选择等位基因数多的个体,这些补充的个体称为补充种质。
综合分析MicroChecker软件和Cervus软件对无效等位变异的检测结果,发现5个位点存在的无效等位变异会对后续的分析结果产生重要影响,最终筛选出15对具有特异性和多态性的SSR引物(表2)。
为了解美洲黑杨个体间的亲缘关系和群体结构,对338个美洲黑杨个体进行了PCoA分析,结果(图1a)表明,338份美洲黑杨个体可分为3大类: 第1类主要包括Ten、Lou和Mis种源的大部分个体; 第2类主要包括Que和Was种源的大部分个体; 第3类主要是Iow种源的个体。以种源群体为研究对象,进行PCoA分析(图1b),并基于遗传距离绘制无根树(图1c)。与个体水平分析结果不同的是,Que种源群体与Mis种源群体的遗传距离比与Was种源的更近,进一步分析个体水平的PCoA分析结果(图1a)可以看出,Que种源的个体分布范围广,但其主要的分布区域与Was种源个体的主要分布区域类似,而Mis种源的个体的主要分布区域与Lou和Ten种源个体的主要分布区域基本重合。群体水平的差异可能是因为Was种源个体在远离Que种源个体主要分布区的方向有少量分布,Mis种源个体在Que种源个体主要分布区附近有少量分布,而Was和Mis种源包含的个体较少,整体水平的遗传信息容易受到特殊个体遗传信息的影响。综合个体水平和种源群体水平的分析结果将美洲黑杨群体分为3大类型: 北方型(Que和Was种源)、中间型(Iow种源)和南方型(Ten、Lou和Mis种源)。
表2 SSR引物信息Tab.2 The information of SSR primers
图1 美洲黑杨群体遗传结构Fig.1 Genetic structure of P. deltoides populationa: 个体水平主坐标(PCoA)分析; b: 种源水平主坐标(PCoA)分析; c: 基于遗传距离的无根树。a: PCoA analysis based on individual level; b: PCoA analysis based on provenance group level; c: The unrooted tree based on Nei’s genetic distance.
基于对美洲黑杨群体结构的分析结果,将338个个体进行分组,采用逐步聚类构建种质库,共构建了9个种质库(表3),其中种质库9的Nei’s遗传多样性指数(H)与原始种质库存在显著差异,将种质库8确定为核心种质库。
构建的核心种质库包括19个美洲黑杨个体,其中北方型6个、中间型2个、南方型11个,筛选比例为5.62%。通过对比核心种质库与原始种质库的遗传多样性参数可以看出15对SSR引物在原始种质库中共检测到119个等位基因(N),在核心种质库中检测到95个等位基因,保留比例为79.83%。核心种质的平均有效等位基因数(Ne)、平均Shannon’s信息多样性指数(I)、平均观测杂合度(Ho)、平均Nei’s遗传多样性指数(H)和位点平均多态信息含量(PIC)分别为3.927、1.355、0.681、0.648和0.604,保留比例分别为102.75%、103.39%、125.31%、104.72%和105.27%(表4),均高于原始种质库的遗传多样性参数,符合核心种质库的要求(Brown, 1989)。
通过对核心种质库与原始种质库相关遗传参数(Na、Ne、I、Ho、H、PIC)的t检验表明二者之间不存在显著的差异(表5),构建的核心种质库能够代表原始种质库的遗传多样性水平。为了进一步对核心种质库进行确认,对比核心种质在原始种质中的分布情况(图2),可以看出核心种质均匀分布在原始种质范围内,说明核心种质具有良好的代表性。
通过对比核心种质与原始种质检测位点的等位变异情况,发现核心种质在15个检测位点丢失了24个等位变异基因,在保留种质中挑选了15个美洲黑杨个体为补充种质,补充到核心种质中,形成优化核心种质库。优化核心种质库共包括34个美洲黑杨个体,筛选比例为10.06%(表3)。通过对比遗传参数可以看出优化核心种质库的等位基因保留比例达到100.00%,其他遗传参数(Ne、I、Ho、H、PIC)均高于原始种质库。与核心种质相比,Ne、I、H和PIC均增大,说明补充种质的加入提高了核心种质库的遗传多样性水平(表4)。通过t检验结果表明优化核心种质库与原始种质库之间的遗传多样性不存在显著差异,可以代表原始种质库的遗传多样性水平(表5)。通过对补充种质的PCoA分析,可以看出补充种质进一步扩大了核心种质的分布范围,使优化核心种质具有更好的代表性(图2)。
表3 种质库构成信息Tab.3 The information of germplasm bank composition
表4 原始种质库、核心种质库与优化核心种质库遗传多样性参数比较①Tab.4 Comparison of genetic diversity parameters among original, core and optimized core collection
表5 原始种质库、核心种质库和优化核心种质库的遗传多样性参数t检验Tab.5 t-test of genetic diversity parameters among original, core and optimized core collection
图2 保留种质、核心种质和补充种质的PCoA分析Fig.2 PCoA analysis of reserved, core and supplementary collection
分子标记技术已经广泛应用于群体遗传多样性和群体结构的研究中,但无效等位变异的存在会对研究结果产生显著影响(Hoffmanetal., 2005; 文亚峰等, 2013),本研究中排除了无效等位变异对研究结果的影响,最终筛选出15对SSR引物应用于群体结构的研究中。
群体结构的研究结果与种源分布存在一定的关联,分布于圣劳伦斯河流域的Que种源和哥伦比亚河流域Was种源的遗传多样性和结构差异不大,这2个种源所处的纬度及气候条件大体一致,外界环境对种源内个体的选择压力相似,被划分为北方型美洲黑杨; 分布于密西西比河中下游流域的Lou、Ten、Mis种源的遗传结构相似,被划分为南方型美洲黑杨; 分布于2大类型群体中间的密西西比河上游的Iow种源与中下游的3个种源的遗传距离较大,可能上游的降水、温度、土壤、海拔等条件与中下游存在较大差异造成的,与Que、Was种源相比,Iow种源位于内陆地区,在外界环境的选择作用下,遗传物质发生了定向的变异,推测是一种过渡群体,被划分为中间型美洲黑杨。美洲黑杨的群体结构说明地理隔离限制了种群间的基因交流,产生了遗传分化。
构建核心种质库选择的数据将直接影响核心种质库的有效性。前期有部分研究主要基于形态指标数据或产量等经济性状数据构建核心种质库(李秀兰等, 2013; 李洪果等, 2018b)。这类性状指标容易受环境条件及管理措施的影响,同一基因型在不同的条件下将会有不同表现型,通过这种方法构建的核心种质库具有一定的局限性。分子标记技术可以直接检测遗传物质的多样性,稳定性高,适用范围广,因此利用分子标记技术构建核心种质库具有更好的代表性。当前利用分子标记技术已经构建了很多核心种质库(李洪果等, 2018a; Santiagoetal., 2018; Xuetal., 2017),并得到了很好的应用。核心种质库的构建策略也会影响到核心种质库的代表性,在已有的研究中基于遗传距离的逐步聚类取样法得到了很好的应用,能够有效地去除遗传冗余。同时,筛选个体时,位点稀有等位基因优先取样的策略可以较完整地保存原始种质库检测位点的遗传信息,保存较多的等位基因变异。另一方面,对原始种质进行恰当的分组可以保证取样的代表性。因此本研究基于SSR分子标记数据,对美洲黑杨的群体结构进行研究,为种质分组提供依据,同时利用逐步聚类取样方法,采用位点等位基因数目最大化法和位点稀有等位基因优先取样相结合的策略筛选核心种质,最终构建了包含19个个体的核心种质库,筛选比例为5.62%,经过遗传参数的t检验和PCoA分析确认构建的核心种质库具有良好的代表性。
等位基因保留比例是检测核心种质库的重要指标,能够直接反映构建的核心种质库是否保留了原始种质库的遗传信息,因此等位基因数最大化法在构建核心种质库中得到应用(李洪果等, 2018a; 顾晓振, 2016)。本研究基于逐步聚类取样法,采用位点等位基因数目最大化法和位点稀有等位基因优先相结合的取样策略构建的核心种质库的等位基因数的保留比例为79.83%,丢失了24个等位变异基因,为了补充丢失的等位变异基因,在保留种质中筛选最少的个体数包含这24个等位变异基因,补充到核心种质库中,形成优化核心种质库,使等位基因的保留比例达到100.00%,保留了15对SSR引物的所有位点信息,最终构建了包括34个美洲黑杨个体的优化核心种质库,占原始种质库个体的10.06%。通过对比分析原始种质库、核心种质库和优化核心种质库的遗传参数信息,发现核心种质库和优化核心种质库的遗传多样性水平均具有代表性,与原始种质库之间没有显著差异,等位基因保留比例均在70%以上。优化核心种质库的遗传信息要优于核心种质库,在保证等位基因保留比例100.00%的前提下,除观测杂合度外其他遗传参数均高于核心种质库,因为在构建核心种质库的策略中会优先选择杂合的个体以保证含有更多的遗传信息,在筛选补充种质的过程中更多地关注丢失的等位变异基因,因此补充种质的加入降低了种质库的杂合度情况,但丰富了种质库的遗传信息。通过PCoA分析确认了核心种质与补充种质组成的优化核心种质库具有更好的代表性,能够在减少遗传冗余的前提下有效保存原始种质的遗传信息。
美洲黑杨6个种源群体23个采样点的338个个体的群体遗传结构与种源分布有一定的相关性,将美洲黑杨6个种源分为3大类型,即北方型美洲黑杨(Que、Was)、中间型美洲黑杨(Iow)和南方型美洲黑杨(Lou、Ten、Mis)。以此为依据对338个个体进行分组,采用逐步聚类取样方法、位点等位基因数目最大化法和位点稀有等位基因优先取样相结合的策略构建了包含19个美洲黑杨个体的核心种质库,取样比例为5.62%。同时结合等位基因数目最大化法筛选了15个补充种质添加到核心种质库中,形成包含34个个体的优化核心种质库,占原始种质库的10.06%,保留了原始种质库100.00%的等位基因。经过t检验和PCoA分析,核心种质库和优化核心种质库的遗传信息与原始种质库之间没有显著差异,具有良好的代表性和有效性。核心种质库和优化核心种质库的建立可以为育种群体的建立提供参考,为杨树种质资源保存和育种工作奠定科学基础。