马云婷,史文君,2,张得芳,2,3
(1.青海大学农林科学院,青海 西宁 810016;2.青海高原种质资源研究与利用实验室,青海 西宁 810016;3.国家林草局青海高原林木遗传育种重点实验室,青海 西宁 810016)
我国是世界公认的物种多样性中心之一,拥有着丰富的生物资源和林木种质资源。具有重要经济价值的树种约1 000种。但是随着人口的快速增长,对林木过度的开发和不合理利用等因素的影响,使得林木种质资源流失非常严重,这不仅是对自然生态系统的巨大破坏,也会减少人工林树种的遗传多样性。这些种质资源一旦丢失,其中的基因将很难被再造出来。因此对我国现有的林木种质资源的收集、保护、保存和研究工作是非常有意义的。林木种质资源是林业可持续发展的基础和保障。随着人们对木材和森林资源需求的不断增加,对林木种质资源的研究和利用变得越来越重要。通过收集和研究各种林木种质资源,可以发现和利用不同品种的遗传特性,提高林木的产量、品质和抗性,为我国的粮油安全和能源安全提供重要的支撑。此外,林木种质资源的研究还对生态系统的平衡和稳定具有重要作用。林木种质资源的保护和维护可以促进森林生态系统的多样性和稳定性,提高生态系统的抗逆性和适应性。这对于维护国家生态安全和经济社会持续发展具有重要意义。
随着种质资源的广泛收集和不断积累,种质库的规模也相应扩大,这极大地提高了种质库的管理费用,提高了特异种质材料筛选的难度。同时,面对大量的遗传材料,育种工作者无法对其进行详细、深入、高效的评价鉴定及管理工作,久而久之,这种情况可能会造成种质的大量流失,无法有效地利用优质资源,从而对生物多样性造成潜在的威胁。在此背景下,核心种质的概念被提出,所谓核心种质就是用最少的种质数量和最低的遗传冗余最大程度地代表一个物种最丰富的遗传多样性、结构及地理分布[1]。核心种质是一个通过特定方法从整个种质资源中挑选出来的关键部分,其目的是以最小的资源数量和遗传重复,尽可能地展现整个遗传资源的多样性。核心种质可以帮助研究者快速找到具有目标性状的种质,从而高效地评估、研究和利用种质资源[2-3]。另外,未包含在核心种质中的材料并不会被遗弃,而是作为保留种质进行保存。这意味着核心种质并不是一个固定的集合,而是一个持续更新和发展的动态过程。在发现新的稀有或具有特定有用性的种质材料时,这些材料会被及时添加到核心种质中,以确保核心种质能够始终代表原始群体的最大遗传多样性[4],核心种质一般应具备代表性、异质性、动态性和实用性等特征[5]。
核心种质的构建对于保护和利用林木种质资源具有重要意义。首先,核心种质可以有效地保护林木种质的遗传多样性,避免资源的流失。其次,核心种质可以作为育种的基础材料,为新品种的选育提供重要的遗传资源。最后,核心种质的构建也有助于深入研究林木的遗传性状和生态适应能力。总的来说,构建林木核心种质是保护和利用林木种质资源的重要手段,对于了解林木遗传性状、深入挖掘优异种质资源、提高林木种质资源的高效评价、保护和合理利用价值具有重要的实践意义。
核心种质的构建主要包括数据收集整理、数据分组、样品选择以及核心种质的管理四个部分[6]。数据收集整理是核心种质构建的基础,通常需要收集和整理大量的表型性状数据、遗传信息数据以及环境数据等,以确保数据的全面性和准确性;数据分组是根据物种的遗传背景、生态适应性、地理分布等因素,将收集的数据进行分组,这些分组应该能够代表该物种的不同遗传和表型多样性;样品选择是在数据分组的基础上,选择具有代表性的样品作为核心种质,这些样品应该能够代表不同分组中的遗传和表型多样性;核心种质的管理是确保其质量和可持续性的关键环节,需要制定科学的管理计划,包括定期评估和更新核心种质、确保其遗传和表型多样性的维持以及定期进行繁殖和更新等。
核心种质构建过程中的数据包括基本数据、特征数据和评价鉴定数据三个部分[7]。基本数据是指有种质的表型形态、生化标记特征和分子标记特征等表征种质特征的数据,即与种质来源相关材料。包括收集地基本信息、生态地理状况或育种体系、种质来源的分类体系等有关信息[8]。特征数据是指包括形态(质量性状和数量性状)、生化标记(同工酶等)、分子标记(ISSR、SSR、AFLP)等在内的能反映种质基本特征的数据。评价鉴定数据主要是指对核心种质进行评价和鉴定的数据,包括遗传分析、表型性状的评估、生态适应性试验等。基本数据的利用已是最普遍的方法。特征数据在收集的种质较齐全的物种中利用较多。
构建林木核心种质的方法包括:首先,根据该物种的表型性状和遗传背景,选择一组具有代表性的个体;其次,对这些个体进行表型性状和遗传分析的测量;最后,根据表型性状和遗传分析的测量结果,将这些个体组合成一个核心种质。
由于大部分表型数据为数量性状,存在很大的环境相关性,容易受到生长环境的影响而产生分化,同时又存在很大的试验误差,因此不能正确反映种质资源遗传结构,通过对作物表型性状差异进行评价,可以深入理解种质的遗传多样性分析。核心种质方法虽然有其优点,但也存在一些局限性。表型数据通常受到基因型与环境之间相互作用的影响,这可能会影响到数据的一致性和可解释性。此外,表型数据通常只能反映物种在某一特定发育阶段的特征,而无法捕捉到其在其他生命阶段或不同环境条件下的表现。因此,有时很难获取具有多态性的表型数据。而分子标记技术提供了一种在DNA水平上直接反映种质资源基因型和遗传结构数据的方法。与表型数据相比,分子标记技术所得到的数据受环境影响较小,具有更高的多态性和更快的检验速度。这使得我们能够更准确地评估种质的遗传多样性和进化关系。在作物种质资源研究中,分子标记的应用具有显著的价值。
核心种质构建中常用的系统聚类方法有:最短距离法、最长距离法、中间距离法等,它们的聚类步骤完全一样,仅类与类之间的距离定义方法不同,采用不同的方法对同一组数据聚类时,分类结果往往不尽相同。
基于表型数据的核心种质主要是通过对植物的外部和内部结构特征进行观察、度量和鉴别分析得出的多样性参数。这些参数可以反映植物种质在形态学、解剖学和结构特征方面的变异和多样性[9]。运用表型多样性参数来检测遗传变异是一种最直接的方法。性状的表型多样性参数指标,是控制各性状表现的遗传型在一定的内外部理化环境作用下遗传型与环境互作的结果,是生物遗传多样性的间接的表型反映[10]。在表型多样性参数的测定中,采取科学样本策略和量化并评测环境差异是非常重要的。这样可以更真实地揭示遗传差异,从而更准确地反映基因型上的差异[11]。
通常利用的性状分为两类,一类是质量性状,包括符合孟德尔遗传规律的单基因性状和稀有突变等。这些性状通常受单个基因的控制且表现相对稳定,容易进行遗传分析。另一类是数量性状,这些性状通常受到多个基因的影响。性状表型测定是在资料收集的基础上,进行野外调查、单株数量性状观测等手段,结合统计软件分析估算种群遗传变异程度和遗传结构。在许多场合利用表型多样性参数测定遗传变异是最现实的方法,尤其当要求在短期内对变异有所了解或在其它生化方法无法进行时,世纪的经典遗传学就采用了最直接的性状表型作为了解遗传差异的标记。
张欢等基于水青树叶的表型性状构建了其核心种质,并发现在欧氏距离结合瓦尔德法聚类条件下,位点优先取样策略是构建水青树种质资源核心库的最佳方法[12]。
钟永达等利用种子大小、千粒质量、苗高和地径4个表型性状数据,对217份中国樟树种质资源进行了核心种质构建和代表性检验。这种方法可以了解不同种质间的相似性和差异性,并确定哪些种质可以作为核心种质。最终成功构建了中国樟树核心种质,并对其进行了评价。这一核心种质的建立将有助于更好地保护和利用中国樟树这一重要的生物资源[13]。
虽然以表型为主的筛选方法简便,易于观察,但是也存在着受环境影响较大,容易产生不同的生态型,并且受到不同生长和发育阶段等的影响,从而使数据产生偏差等缺点。
随着科技的发展,很多分子标记技术被迅速地应用到核心种质筛选中,分子标记技术能在DNA水平上检测到所有种质的特性和种质之间的差异,同时还不受环境和发育阶段的影响,具有很高的稳定性。
林木核心种质构建过程中常用的分子标记包括SSR、SNP、AFLP等。SSR(Simple Sequence Repeat)是一种以串联重复序列为特征的DNA分子标记技术。它具有多态性高、重复性好、共显性等优点,被广泛应用于基因组遗传分析和品种鉴定等领域。SNP(Single Nucleotide Polymorphism)是一种以单碱基突变位点为特征的DNA分子标记技术。它具有密度高、覆盖全基因组、易于自动化等优点,是近年来发展最快的分子标记技术之一。AFLP(Amplified Fragment Length Polymorphism)是一种基于PCR的DNA分子标记技术,它通过选择性扩增基因组DNA片段来产生多态性标记。AFLP具有高分辨率、高灵敏度、高重复性等优点,被广泛应用于品种鉴定、遗传育种、进化分析等领域。
这些分子标记被广泛应用于基因组的遗传分析、品种鉴定、遗传育种等方面。为构建核心种质提供了重要的工具和手段,可以用于鉴定不同种质资源的遗传背景、亲缘关系和遗传多样性等方面,从而为选择和收集最具代表性的个体组成核心种质提供科学依据。
Mouhaddab J等利用ISSR标记构建了240个表型的摩洛哥坚果树的核心种质,利用14个集合代表了100%的遗传多样性。基于算法、主坐标分析和贝叶斯分析的非加权对群方法清楚地显示了种源的高度遗传结构,同时尊重平原和高海拔地区之间的地理邻近性。遗传距离与地理距离的Mantel检验呈极显著[14]。Balas F C等用简单序列重复(SSR)标记建立了无花果的核心种质。采用随机抽样、最大化、模拟退火和逐步聚类四种方法确定了开发该木本植物核心种质的最佳方法。将各亚群的遗传多样性与全集的遗传多样性进行比较[15]。Mouhaddab J基于ISSRs和SSRs的基因分型数据,构建了13个和96个基因型的核心标本,分别占银叶银杏总标本的2.7%和20%。整个收集中出现的等位基因100%出现在核心组中[16]。
Belaj A等利用SSR、SNP和DArT标记,基于M(即最大)策略对361份橄榄材料进行核心种质构建,根据所有数据集和标记获得的信息,选择了18、27、36、45和68份橄榄材料的子集,分别占整个种质资源的5%、7.5%、10%、12.5%和19%。根据最后的研究结果,代表总收藏规模10%至19%的核心种质收藏可以被认为是保留该收藏中发现的大部分遗传多样性的最佳选择[17]。
利用SLAF-seq(Specific-locus Amplified Fragment Sequencing)高通量测序技术,通过逐步筛选,获得了杉木(Cunninghamialanceolata)一个核心集合(核心0.650),其中包含143种基因型,这些基因型包含了整个种群的所有等位基因、多样性和特定遗传结构[18]。
Uchiyama K等利用SNP标记,对日本柳杉510个体的群体结构和全基因组连锁不平衡(Linkage Disequilibrium,LD)进行了研究,全面覆盖了该物种的自然分布范围,并结合生长指标与地理分布构建日本柳杉核心种质[19]。
核心种质构建后,需要用一些能反映物种特征的参数来评价和验证所构建的核心种质能多大程度的代表该原始群体的遗传多样性。检验方法主要分为表型水平的代表性检验和分子水平的代表性检验。表型水平的遗传多样性检验,主要评价参数有方差、标准差、极差、平均数和变异系数等[20-22]。通常认为表型性状易受环境等因素影响,不能准确的反映表型及基因型上的差异。分子水平上核心种质的遗传多样性检验,主要评价参数有:Nei’s 多样性指数、Shannon-Weaver指数、Simpson指数、等位基因数、多态性位点数等参数[23-25]。
在林木核心种质构建实际应用中一般都以表型数据或分子标记数据,或者是二者结合进行筛选和构建[26-28]。目前,已经在葡萄[29]、新疆野杏[30]、新疆野苹果[31]、核桃[32]、板栗[33]、柚类[34]、桂花[35]、猕猴桃[36]和橡胶[37]等多种林木中进行了核心种质构建和评价研究与应用。
林木核心种质的构建可以有效地保护林木种质的遗传多样性,避免资源的流失,也可以作为育种的基础材料,为新品种的选育提供重要的遗传资源,有助于深入研究林木的遗传性状和生态适应能力。林木核心种质的构建未来发展趋势可能会涉及以下几个方面:
(1)扩大物种范围:随着生物技术的不断发展,未来林木核心种质的构建将会更加注重物种多样性的保护和利用。除了常见的森林树种,还会将更多的珍贵、濒危和特色树种纳入核心种质构建行列,以全面保护和利用森林生物多样性;
(2)精准育种:通过基因编辑、基因测序等先进技术,未来林木核心种质的育种将会更加精准和高效。育种过程中将会更加注重目标性状的选择和优化,以及适应不同环境和市场的需求,提高林木的品质、抗性和生产力;
(3)联合全球资源:随着全球气候变化和森林破坏的加剧,未来林木核心种质的构建将会更加注重全球合作和资源共享。各国将会共同制定和实施核心种质构建计划,联合全球的林木种质资源,共同应对气候变化和生态保护的挑战;
(4)智能化管理:未来林木核心种质的构建将会更加注重智能化管理。通过物联网、大数据、人工智能等技术手段,实现核心种质的自动化采集、分析、评估和管理,提高核心种质的利用效率和维护水平;
(5)跨界融合创新:未来林木核心种质的构建将会更加注重跨界融合创新,林木科学与其他学科领域的交叉融合将会促进核心种质研究的创新和发展,产生新的思想和成果,为森林可持续经营和生态文明建设提供科学支撑。
总之,未来林木核心种质的构建将会涉及更多的技术、学科和领域的交叉合作,同时也需要全球共同努力来实现其可持续性和生态友好发展。