玉米核心种质及构建方法研究进展

2010-05-01 05:14:38李健英李正莉曹宇宾郭俊宏
山西农业科学 2010年9期
关键词:种质分组性状

李健英,解 睿,李正莉,曹宇宾,郭俊宏

(山西省农业科学院,山西太原030031)

玉米栽培历史悠久,经过长期的自然选择和人工选择,形成了极其丰富的种质资源,蕴含丰富的遗传多样性。大范围的玉米地方品种资源的收集整理始于1943年,当时洛克菲勒基金会和墨西哥农业部启动了一个针对玉米品种资源的合作项目。从20世纪70年代开始,更多的国家开始玉米种质资源的收集工作。随着种质资源收集工作的启动与发展,种质资源数目的急剧增加,给资源的管理、评价、鉴定等工作造成了很大的障碍。针对这一问题,Frankel和Brown于1984年提出了基于遗传多样性构建核心种质的解决方案,为遗传资源的研究和利用提供了崭新的解决途径。

1 玉米种质资源的收集与各国核心种质的构建研究

在世界主要的基因库大约保存有65 000份玉米材料,90%是栽培玉米(Zmays)[1]。玉米的多样性中心在中南美洲。CIMMYT有着世界上最大的玉米基因库,保存有25 609份玉米材料,来自64个国家,其中21 767份来自中南美洲。据美国国家种质系统显示,截止2009年11月底,美国保存有26 647份玉米种质材料,来自100多个国家。玉米15世纪传入欧洲和亚洲,1996年欧洲农作物遗传资源网合作计划在罗马召开会议,建立玉米中心数据库的提议得到16个参会国家18位代表的支持,会后在塞尔维亚Zemun Polje玉米研究所建立欧洲玉米数据库,保存有13个国家11 865份玉米种质材料的信息。我国也具有丰富的玉米种质资源,截止到20世纪90年代末,我国所收集到的玉米地方品种已经达到了玉米总资源的76.65%,在我国玉米种质库中保存有17 000多份材料[2]。

构建核心种质受到了世界各国的广泛重视。在对所保存种质资源试验、鉴定、评价的基础上,世界各国都开展了构建玉米核心种质的研究(表1)。拉丁美洲玉米计划(LAMP)是第1个合作鉴定玉米种质资源的国际项目,共有巴西、玻利维亚、哥伦比亚、智利、危地马拉、墨西哥、其有巴拉圭、秘鲁、乌拉圭、委内瑞拉、美国、阿根廷12个国家参加,项目第1期按玉米种族分组进行50多次试验,鉴定7 312份材料,构建31个初级核心子集或育种核心子集[3]。欧洲启动RESGEN CT96-088项目,对意大利、德国、法国、希腊、葡萄牙、西班牙以及荷兰的玉米地方品种进行了表型多样性评价,构建了各国核心种质,并在此基础上进行分子多样性评价,构建了欧洲玉米核心种质。CosmosMagorokosho[1]对津巴布韦、赞比亚、马拉维收集的地方品种进行了表型和DNA水平上的多样性鉴定,构建了核心种质。日本基于AFLP多态性,从保存在国家农业科学研究所(NIAS)基因库的300份和1 000份的玉米材料中分别选出17个北海道和69个其他材料构成日本玉米地方品种核心库。中国农科院依据所收集种质的基础信息以及表型特性评价了中国国家种质库中所收录的13 521份地方品种和3 258份自交系,分别构建了核心种质库[2]。在此基础上,刘志斋[4]采用SSR标记构建了中国地方品种的微型核心库。Yu等[5]分析了288个自交系(其中242个来自中国国家种质库自交系核心库)49个SSR位点的多态多样性,构建了中国自交系微型核心子集。

表1 世界各国构建玉米核心种质研究及取样策略

2 构建玉米核心种质的取样策略研究

种质资源的多样性不是随机的,而是有一定的组织和结构。归纳核心种质的构建,实质上是将其结构进行分层,也就是分组、分类,深层地揭示其结构,并在此基础上取样。玉米核心种质构建偏重于取样策略研究,即各种标准和方法在分类取样中的应用。

2.1 构建数据的采用

核心种质构建通过基本信息数据和农艺、形态性状等数据的参与分析,利用各性状的差异来剔除亲缘关系相近的样品并抽取核心样品。各研究采用的性状及其数目有所不同,巴西核心种质构建采用18个性状数据[6],CIMMYT育种核心子集的构建采用了15个性状数据[7]。

各性状对变异有不同的贡献[8],因此研究中还涉及到性状的取舍。主成分分析是筛选用于构建核心种质性状的一种方法,剔除对变异贡献极小的性状,去除冗余性状对分析的影响,提高分析效率。MarcosMalosetti等[9]在构建核心种质时,对852份玉米种质的17个性状的数据进行主成分分析,去掉6个与主成分不相关的变量,然后取11个性状作为构建数据。一些研究也先后在核心种质的研究中证实了主成分分析去除冗余数据的有效性。

随着分子生物学的发展,分子标记技术已被广泛应用于种质资源的多样性研究,从DNA水平上反映种质材料的遗传差异。玉米核心种质构建也越来越趋向于利用分子标记数据,常用的分子标记技术有RFLP和SSR。

2.2 玉米核心种质第一层次分组标准

构建玉米核心种质库,一般进行2个层次的分组(类),地理来源和粒型是第一层次分组的重要标准,其他有玉米种族、育种体系。

地理来源和粒型与遗传多样性密切相关。地理来源与多样性分布的相关性已普遍得到认同。Malosetti指出,粒型与玉米驯化的不同阶段有关,各粒型与玉米驯化不同阶段的时间顺序是爆裂—硬质—粉质—马齿,马齿是最现代的类型。从研究的空间分布也观察到,爆裂玉米是离马齿玉米最远的小组,而其他粒型介于他们之间。而且研究也表明,遗传特性的分布往往与生态地理区域是一致的。基于地理来源和粒型分组有其合理性,地理来源表示的是不同的进化方向,粒型表示的是不同的进化起源。

Malosetti在对构建乌拉圭地方种核心种质的取样策略研究中,比较了玉米种族、地理来源、地理来源+粒型的分组标准,认为地理来源+粒型分组标准好于种族分组标准,并且所进行的判别分析也证实,地理来源+粒型表现出很高的正确分组[9]。

2.3 聚类方法研究

在第一层分类基础上,采用什么样的取样策略一直是玉米核心种质研究中的一个热点与重点。成功的取样策略取决于聚类方法、遗传距离算法、组(类)内取样量计算方法、组内取样方法。聚类方法的目的是寻找数据中潜在的自然分组结构,不加权类平均法(UPGMA)和离差平方和法(Ward)是构建玉米核心种质采用的2种主要方法。

聚类方法对构建结果的影响是构建玉米核心种质的重要研究内容。Rincon等[10]用墨西哥2个地点2年的玉米田间试验数据比较了4种聚类方法——UPGMA、最短距离法、重心法和Ward方法。评价时使用2组数据,不同类型和数目的性状,平均的平方欧氏距离作为相异性量度,在性状类型和数目不同的情况下,UPGMA对类的划分是一致的,而且,同最短距离法和Ward方法比较,UPGMA表现出较高的同表象相关系数。Franco的比较研究也表明,对于距离算法,UPGMA总是优于Ward,所构建的核心子集有显著的多样性[11]。

单一的方法并不是最好的解决方案,玉米核心种质构建中的一个趋势是各种方法的结合应用,如聚类分析与主成分分析或判别分析结合应用,用主成分分析证实聚类结果并且研究分组的空间关系。再如基于距离和基于模型的聚类方法结合应用,吸纳二者的特点,进行互补,最终使聚类方法具有统计性质,从而形成更好的解决方案。基于距离和基于模型聚类方法的结合经历了一步步地发展与改进,从Ward-Gaussian混合模型到Ward-LM模型再到Ward-MLM模型,解决了Gaussian模型只能利用连续变量、LM模型没有考虑到大数据集经常会出现空单元的问题。

Ward-MLM方法是Franco等[12]在玉米核心种质构建中提出的,又叫两步Ward-MLM分类策略。第1步使用系统聚类方法Ward方法分组,第2步通过MLM模型改进、优化第1步划分的小组,其中采用了2种规则,upper-tail方法(也叫Mojena指数)和最大似然比检验。MLM模型在形状、方向和体积上优化在多维空间中所分布的点群(Ward方法获得)。

Ward-MLM分类策略用Gower距离度量样品间的相似性,把分类变量结合在一个多项式变量中,实现了连续变量和有序变量同时参与分析。这一策略的特点是:(1)优化目标函数,如第1步中的组内平方和,第2步中的似然函数;(2)进行统计检验确定最佳的小组数目;(3)可以度量所分组的质量和确定组内成员身份的概率;(4)同时考虑到连续变量和分类变量的重要性,包括所有可以利用的信息,没有变量被排除在分析之外[13]。Ward-MLM策略可以同时使用表型数据和遗传标记数据,如果只使用分子标记和DNA片段数据,可采用各种聚类方法和各种距离度量。

Franco等[14]还把Ward-MLM法扩展到了基因型×环境×性状的三向数据分类分析中,并比较了两步Ward-Gaussian方法和两步Ward-MLM方法,研究证实,连续变量和分类变量在最后的分组中都有其重要性;比较研究表明,基于连续变量构成的小组没有清楚地表现出分类变量的反应模式,而基于连续变量和分类变量构成的小组则明显地表现出2种变量的反应模式。两步Ward-MLM方法能够很好地恢复模拟数据的结构,所划分的加勒比玉米材料组与地理来源有很明显的关联。Franco等[15]2002年对2组玉米数据和1组小麦数据的研究表明,三向Ward-MLM聚类所划分的组在各环境下有相似的性状反应,获得了交叉互作小的同质组。

2.4 组(类)内取样量计算方法研究

在取样策略中,组(类)内取样量计算方法决定从类内抽取样品的数目。研究中提出多种组(类)内取样量计算方法,有R方法、C方法、L方法、P方法,随着分子标记数据的采用,后来又提出H方法和M方法。L方法和P方法是构建玉米核心种质常用的方法。

研究表明,P方法偏重于容量大的组(类),L方法偏重于容量小的组(类),L方法高度取决于分组方法。Schoen和Brown使用估计位点和目标位点数据比较了6种组(类)内取样量计算方法,结果表明,按从高到低的排列,期望的等位基因保持率为M>H>P>L>C>R[16]。

组(类)内取样量计算方法可以分为2类:基于组(类)容量,基于多样性。Franco提出的D方法则属于后者,每类的取样量与类内样品间Gower距离的平均值成比例,也就是取样量与平均Gower距离度量的组内多样性成比例,其原则是多样性大的组其平均Gower距离也大,因此,所取样品量也应较多。D方法可以使用任何聚类方法和任何距离量度。

Franco采用的4组数据集(危地马拉玉米种质、巴西玉米种质、墨西哥玉米种质、Pool25(S2品系与一测交种杂交))样品量大小不一,多样性值不同,而且类的数目也不同,采用Ward-MLM策略,进行了D方法与其他方法的比较。根据样品的多样性、样品变量极值的恢复、样品的方差3个标准,D方法所构建核心种质样品间的平均Gower距离大,恢复的变量极值多,核心种质方差也大,而且都显著。D方法是一种有效的方法,保存了原群体的多样性,适合成为构建核心种质的一个标准[17]。

2.5 多因素综合比较

为了研究各因素对取样策略的影响,Franco等[18]进行了综合研究,比较了2种聚类方法UPGMA和Ward,2种遗传距离算法修正的Roger(MR)及Cavalli-Sforza和Edwards(CE),6种组(类)内取样量计算方法P,L,D-修正的Rogers或 D-Cavalli-Sforza(D-MR 或 D-CE)、D-Shannon index(D-SH,与Shannon多样性指标成比例)、D-Heterozygous(D-HE,与每一个体杂合位点的期望比成比例)、D-Effective alleles(D-NE,与有效等位基因数目成比例)共24个组合,采用分子标记数据,3组数据集,即混合数据集来自美国和欧洲的玉米地方品种,种质数据集来自墨西哥的地方品种,群体数据集把墨西哥的地方品种每一群体的个体分组,计算每一群体的等位基因频率。

研究的评价标准是核心子集样品间平均遗传距离最大(MRs或CEs),等位基因丰度最大(SHs,HEs和 NEs),无信息等位基因(none-informative allele)比例最小(PNs)。对于混合数据集,核心子集样品间平均遗传距离(MRs和CEs)主要受组内取样量计算方法和聚类方法影响,受聚类方法×组内取样量计算方法互作和聚类方法×距离互作影响较小。对于多样性指数(SHs,HEs和NEs)聚类方法×距离是变异性的重要来源。对于种质数据集,聚类方法的主效应是所有反应变量变异性的重要来源,其次是聚类方法×组内取样量计算方法互作和组内取样量计算方法主效应。多样性指数SHs和NEs主要受聚类方法×距离互作影响,MRs,CEs和HEs受其影响较小。PNs仅受聚类方法影响。

3 组数据集的研究结果表明,对于评价标准MRs和CEs,UPGMA总是优于Ward;CE距离优于MR距离;最好的组内取样量计算方法是D-MR,D-CE或D-NE。

研究还与M方法进行了比较,结果表明,M方法能够有效地构建等位基因丰度高、无信息等位基因比例低的核心种质。按遗传距离最大化的评价标准(育种家的角度),D方法总是优于M方法;按遗传多样性的评价标准(分类学家角度),D方法相似或次于M方法。

2.6 针对特殊目的的核心种质构建

依据形态性状构建的核心库并不能很好地捕捉与玉米籽粒特性有特殊关联的变异。Campbell等[19]尝试了另外的方法,对306份智利低地亚热带和温带玉米群体利用近红外透射光谱法构建以玉米籽粒品质为目的的核心种质,样品的平均频谱转换为对数,然后再用多元散射校正转换,最后进行主成分分析。

用第一主成分和第二主成分作图,将图人为地分割为5×5格,共有25个单元,在同一单元内的样品具有相似的频谱,因而认为其具有相似的品质特性,有冗余,从每一单元的中央取一样品构成有16个样品的核心种质,具有多样性。

3 深层次研究各方法的优点、局限性及有效性

合理有效的取样策略是构建核心种质的关键,虽然玉米核心种质的研究有很大进展,但对于不同遗传距离、不同的系统聚类方法及不同抽样方法构建核心种质的优点与局限性及有效性还需深入研究。例如,参与分析的性状及其数目对分析结果的影响;距离算法对分类的影响;各种层次或水平上的数据,如生态、生物化学、分子标记等数据的结合应用,以使核心种质的构建结果更加可靠。

[1] Cosmos Magorolosho.Genetic Diveristy and Performance of Maize Varieties from Zimbabwe,Zambia and Malawi[EB/OL].[2009-09-16]http://txspace.tamu.edu/bitstream/1969.1/4669/1/etd-tamu-2006C-PLBR-Magorok.pdf.

[2] LiY,ShiY S,Cao Y S,etal.Establishmentofa core collection formaize germplasm preserved in Chinese National Genebank usinggeographic distribution and characterization data[J].Genetic Resourceand Crop Evolution,2004,51:845-852.

[3] Taba S,JDíaz,JFranco,etal.A Core subsetof LAMP,from the Latin American Maize Project[EB/OL].[2009-10-07]http://apps.cimmyt.org/enslish/wps/publs/Catalogdb/index.cfm.

[4] 刘志斋.中国玉米地方品种的多样性研究与种族划分[EB/OL].[2009-10-07]http://ln.wanfangdata.com.cn/D/Thesis_Y1264298.aspx.

[5] Yu Y,Wang R,ShiY,etal.Genetic Diversity and Structure of the Core Collection forMaize Inbred Lines in China[J].Maydica,2007,52(2):181-194.

[6] Ronaldo R.Developmentofa Brazilianmaize core collection[J].Geneticsand Molecular Biology,2009,32(3):538-545.

[7] Suketoshi Taba.The CIMMYTMaize Collection:Evaluation of the Accessions and Preliminary Breeder Core Subset[EB/OL].[2009-10-07]http://www.cimmyt.org/Research/Maize/symposium/posters/taba_cimmyt.pdf.

[8] 乔治军,张效梅,畅建武.山西玉米种质资源遗传多样性分析和利用研究[J].山西农业科学,2006,34(3):28-30.

[9] Marcos Malosetti,Tabare Abadie.Sampling strategy to develop a core collection of Uruguayanmaize landraces based on morphological traits[J].Genetic Resources and Crop Evolution,2001,48:381-390.

[10] Rincon F,Johnson B,Crossa J,etal.Cluster analysis,an approach to sampling variability inmaizeaccessions[J].Maydica,1996,41(4):307-316.

[11] Franco J,Crossa J,Villasenor J,et al.Classifying Mexican maizeaccessionsusinghierarchicaland density searchmethods[J].Crop Sci,1997,37:972-980.

[12] Franco J,Crossa J,Villasenor J,etal.Classifying Genetic Resourcesby Categoricaland Continuous Variables[J].Crop Sci,1998,38:1688-1696.

[13] MohammadiSA,Prasanna BM.Analysisof Genetic Diversity in Crop Plants-SalientStatistical Tools and Considerations[J].Crop Science,2003,43:1235-1248.

[14] Franco J,Crossa J,Villasenor J,etal.A two-stage,three-way method for classifying genetic resources in multiple environments[J].Crop Sci,1999,39:259-267.

[15] Franco J,Crossa J,Suketoshi Taba,et al.A Multivariate Method for Classifying Cultivars and Studying Group×Environment×Trait Interaction[J].Crop Science,2003,43:1249-1258.

[16] Elanmon S,Hodgkin T,DussertS,etal.Core Collection:Theoretical and Applied Aspects[EB/OL].[2009-10-09]http://horizon.documentation.ird.fr/exl-doc/pleins_textes/pleins_textes_6/b_fdi_35-36/41234.pdf.

[17] Franco J,Crossa J,Taba S,etal.A Sampling Strategy for ConservingGenetic Diversitywhen Forming Core Subsets[J].Crop Sci,2005,45(3):1035-1044.

[18] Franco J,Crossa J,Warburton M L,etal.Sampling Strategies for Conserving Maize Diversity When Forming Core Subsets UsingGenetic Markers[J].Crop Sci,2006,46(2):854-864.

[19] Campbell M R,Anih E,Conatser C,et al.Development of a core subset of Chilean lowland subtropical and temperate maize(Zeamays L)populationsusingnear infrared transmittance spectroscopy[J].Plant Genetic Resources Newsletter,2006,148:1-9.

猜你喜欢
种质分组性状
华南地区最大农作物种质资源保护库建成
今日农业(2022年13期)2022-09-15 01:18:00
宝铎草的性状及显微鉴定研究
分组搭配
怎么分组
亚麻抗白粉病种质资源的鉴定与筛选
分组
9种常用中药材的性状真伪鉴别
贵州玉米种质资源遗传多样性及核心种质库构建
红锥种质早期生长表现
对“性状分离比模拟”实验的改进
中学生物学(2016年8期)2016-01-18 09:08:21