基于PCA方法的夏玉米穗部性状综合评价

2015-04-29 05:06赵玉坤高根来田玮玮王向东甄胜虎
农学学报 2015年3期
关键词:主成分分析

赵玉坤 高根来 田玮玮 王向东 甄胜虎

摘要:为了探究不同年际间夏玉米穗部多性状统计数据的内在关联规律,以晋南地区品比圃鉴定2个玉米对照品种和7个杂交组合为研究对象,调查2011-2013年3年间11个玉米穗部性状因子的数据,通过主成分分析,提取3—4个主成分,评价各杂交组合在穗部性状上的数量差异。结果表明,不同年际间提取的各主成分侧重反应的穗部性状分量各有不同,但在分别构建主成分评价函数后,主成分评价得分表现相似的变化趋势;与对照品种(‘郑单958、‘先玉335)相比,杂交组合PB6和PB7综合主成分得分较高,表现出优异的综合穗部性状信息,存在一定的增产潜力。因此,可将主成分分析作为玉米常规育种的辅助数据分析手段,提高育种效率。

关键词:主成分分析;穗部性状;评价函数

中图分类号:S513.01

文献标志码:A

论文编号:2014-0818

0 引言

玉米穗部性状与产量密切相关,通过玉米穗部性状间接筛选优良品种的效率要远高于对产量的直接筛选,针对具体穗部性状目的明确地遗传改良,能够有效提高玉米田间产量,如何借助于有效的数据统计分析手段,评价玉米穗部多性状的综合优劣程度,是玉米育种工作的重要环节。本研究宗旨在通过对晋南地区3年间夏玉米穗部性状数据的丰成分提取及函数评价分析,揭示穗部多性状数据在不同主成分载荷上的内在关联规律,以丰成分函数模型评价不同玉米品种穗部性状的综合表现,为玉米高效育种提供理论参考。基于多元统计分析的丰成分分析法(PrincipalComponent Analysis,PCA),通过少数几个彼此不相关的丰成分来解释多变量的方差一协方差结构,将多变量从高维空间映射到低维空间,简化多变量数据分析,已在模型建立、指标评价中有较多应用。

玉米穗部性状大多是由微效多基因控制的数量性状,受外界复杂环境因子的支配影响较大,因此,在穗部性状研究中多采用一些生物数理统计方法,来完成对玉米穗部性状的综合评价,常用的方法有相关分析、通径分析、灰色关联度分析等。崔震海等研究了在玉米苗期不同供水条件下穗部性状与产量的相关关系,结果表明在苗期正常供水条件下,百粒重对产量的影响较大,在苗期轻度干旱胁迫条件下,粒长和出籽率与产量关系最密切,在苗期中度干旱胁迫条件下,行粒数对产量的影响较大。王久光等利用通径分析方法研究了阴雨寡照条件下玉米穗部性状与产量的相关规律,表明穗行数、干粒重、行粒数对产量的直接作用较大,秃尖长虽然直接作用比较小,但它要通过行粒数、千粒重来对产量造成影响,在实际育种中要注意协调选择。岳尧海等应用灰色理论关联度分析法,对夏玉米7个数量性状与子粒产量进行分析,表明各性状与产量的灰关联度依次顺序为,叶数>行粒数>株高>穗长>百粒重>穗行数,在玉米常规育种中要兼顾各性状对产量的促进作用,协调一致,充分发挥杂交种白身增产的最大潜力。丰成分分析方法作为一种有效的数据统计分析手段,在玉米穗部性状研究中应用较少,且未形成成熟的系统理论,因此,笔者选取品比圃试验的2个玉米对照品种和7个玉米杂交组合为试验材料,通过调查记录2011-2013年3年问11个玉米穗部性状因子的数据,利用主成分分析法进行丰成分提取和构建函数评价,比较、分析杂交组合与对照品种间的差异,从而为玉米新品种的选育提供统计依据和理论借鉴。

1 材料与方法

1.1 试验材料

试验于2011-2013年在山西省农科院小麦研究所玉米试验田品比圃进行,试验地前茬为休闲用地,土壤为石灰性褐土,播种前养分含量为:有机质14.30 g/kg,碱解氮37.80 mg/kg,速效磷11.52 mg/kg,速效钾125.00 mg/kg,pH 7.48。

材料选取7个玉米杂交组合和2个对照品种,具体种类如表l所示,分别于2011年5月22日、2012年5月25日和2013年5月24日播种,播种密度为49500榭hm2,宽窄行种植,宽行行距0.70 m,窄行行距0.50 m,株距0.33 m。采用随机区组设计,3次重复,共27个小区,每小区4行,行长10 m,面积为24m2芹右。玉米牛育期内追肥、除草等田间管理统一进行。

1.2 调查项目及方法

在玉米成熟期时,每小区随机选取10株,调查株高(m)和穗位高(m),计算穗位系数(穗位高/株高)。待玉米收获后,从小区取样12穗中调查穗长(cm)、穗粗(cm)、秃尖长(cm)、穗行数、行粒数、百粒重(g)、单穗重(kg)、单穗粒重(kg)、出籽率(%)各指标,调查参照国家玉米区域试验记载标准进行。选择上述11个穗部性状(株高除外)作统计分析。

1.3 数据分析

数据采用Excel 2003和SPSS 16.0进行统计分析。

玉米穗部性状的不同参数有不同的量纲,因此有较大的数量级差别,为了排除由此对结果分析造成的干扰,需要对原始数据进行标准化处理。采用标准差标准化,用标准化后的数据进行丰成分分析。

其中丰成分评价函数Fp和综合丰成分F的构建采用以下公式:

2 结果及分析

2.1 不同穗部性状的主成分方差分解和特征值

在SPSS软件中进行Factor分析,可得到提取丰成分的原始特征值(表2)、丰成分载荷矩阵(表3)。从表2中可以看到,在2011年,第1丰成分(4.097)的方差贡献率为37.249%,第2丰成分(3.153)的方差贡献率为28.662%,第3丰成分(1.931)的方差贡献率为17.558%,第4丰成分(1.009)的方差贡献率为9.17%,提取的前4个主成分累积贡献率为92.639%,能较好地反映原先11个穗部性状数据指标的大部分信息及变化趋势,符合累积贡献率≥85%的条件,因此共提取4个丰成分,完成后续数据分析。同理,对2012、2013年的11个穗部指标分别提取4个、3个丰成分完成接下来的分析。

2.2 不同穗部性状主成分载荷值

表3中,2011年在第1主成分上有较大载荷值的性状分量分别为穗长(0.933)、单穗粒重(0.885)、单穗重(0.818)、穗位高(0.738);在第2丰成分上有较大载荷值的性状分量分别为出籽率(-0.784)、秃尖长(0.707)、穗粗(0.7061;在第3主成分上有较大载荷值的性状分量分别为穗行数(0.777)、穗位系数(0.647);在第4丰成分上有较大载荷值的性状分量分别为行粒数(0.477)、百粒重(-0.452);4个主成分中每个丰成分均能综合反映11个穗部性状因子的数据信息,具体到每个丰成分其优先反映的穗部性状指标各不相同,而这4个主成分能代表原始11个玉米穗部性状因子数据的综合信息,从而简化了数据分析的工作量和避免了变量重叠的误差。

在2012年第1主成分载荷值高的性状分量为穗位系数(0.866)、百粒重(0.854)、单穗粒重(0.79)、穗长(-0.747)、穗行数(0.726);在第2主成分载荷值高的性状分量为穗位高(-0.615)、出籽率(-0.585)、单穗重(0.584)、秃尖长(0.5781;在第3主成分载荷值高的性状分量为穗粗(0.8171;在第4主成分载荷值高的性状分量为行粒数(0.652)。在2013年,穗行数(0.835)、穗位高(0.854)、单穗重(0.78)、单穗粒重(0.716)4个指标在第1主成分有较高载荷;在第2主成分有较高载荷量的指标分别是:秃尖长(0.865)、百粒重(0.833);第3主成分更多反映地是穗位系数(0.752)、穗粗(0.732)2个穗部性状的综合信息。在2011-2013不同年际间,提取的丰成分侧重反应的穗部性状分量各有不同,说明丰成分分析易受外界环境影响较大,且随着调查数据的不同而存在一定差异。

2.3 主成分评价函数构建及各主成分综合得分排序

按前述公式,利用穗部性状在各丰成分载荷值、丰成分特征值、标准化数据,即可构建主成分(F1、F2、F3、F4)及综合丰成分F的函数表达式(表4)。将各穗部性状数据代入函数,即可求得各丰成分和综合丰成分的得分值,用所得数值大小对玉米品种及杂交组合作综合评价(表5),帮助筛选与对照品种相比评价较高的玉米杂交组合。

由表5可知,2011年各玉米品种及杂交组合在第1主成分F1上得分较大的有PB1、PB2、PB7、‘郑单958、‘先玉335;在第2主成分F2上得分较大的有PB1、PB4、PB6、‘郑单958、‘先玉335;在第3主成分F3上得分较大的有PB1、PB3、PB6、PB7;在第4主成分F4上得分较大的有PB1、PB2、PB6、‘先玉335;在综合丰成分F上得分较大的有PB4、PB6、PB7、‘郑单958、‘先玉335;结合各主成分及综合主成分分析的结果,可以认为,与对照(‘郑单958和‘先玉335)相比,杂交组合PB4、PB6、PB7在综合穗部性状上存在一定优势。同理类推,在2012年和2013年中,在主成分得分上与对照相比存在优势的杂交组合分别为PB2、PB6、PB7和PB6、PB7。通过分析不同品种及杂交组合3年穗部性状主成分得分评价结果,杂交组合PB6和PB7在2011-2013年间均表现出优于对照的综合穗部信息,而穗部性状与产量密切相关,因此,杂交组合PB6(昌7-2改良系x478改良系)和杂交组合PB7(‘先玉335变异株选系x18599改良系)相比对照(‘郑单958和‘先玉335)有一定的增产潜力,可作为新品种的候选组合,申请参加省玉米品种预备试验。

3 结论与讨论

玉米杂交组合的筛选以产量为丰要依据,而产量与玉米穗部性状密切相关。在常规育种实践中,若穗部性状的表观特征只存在微量的差异,则不容易决定组合的取舍。主成分分析法(PCA)可将多变量作降维处理,且原始变量的信息能最大程度地保存,从而为玉米杂交组合穗部性状的筛选提供了一种较为简便、准确度高的数据分析方法。宋江峰采用丰成分分析法对不同甜糯玉米品种软罐头的主要挥发性物质进行表征和区分,确定了不同品种甜糯玉米软罐头各自特有的挥发性风味物质组合。傅同良通过对33个糯玉米自交系进行主成分分析和遗传距离分析,初步提出了评选糯玉米自交系优劣的遗传丰成分标准。Kroonenberg研究了三维聚类法和主成分分析法在玉米数量性状分析中的应用,结果表明,这2种方法能把变量范围降维为几个易于区分和计算的变量组,从而有助于对玉米新的变量特征的研究。

在本研究中,通过对2011-2013年间11个玉米穗部性状数据的主成分分析,主成分提取个数、各丰成分在穗部性状上的载荷值在3年间存在一定差异,说明主成分数据分析随着数据采集地点、年份的不同而不同。3年间在不同玉米品种及杂交组合穗部性状的各主成分及综合主成分函数评价上,主成分得分表现出相似的变化趋势,杂交组合PB6和PB7与2个对照品种相比,在主成分得分上表现优良,可作为选育新品种的候选组合。数据经过PCA方法处理后,11个穗部性状指标最终可以用3—4个主成分来综合表征,简化了原始多元数据的统计分析,具有一定的实践应用价值。因此,作为一种玉米常规育种的辅助数据分析手段,主成分分析(PCA)方法能有效指导育种实际,缩短育种进程,为玉米数量化育种研究提供了新的方向。

猜你喜欢
主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
关于AI上市公司发展水平评价
大学生创业自我效能感结构研究
塔里木河流域水资源承载力变化及其驱动力分析
我国上市商业银行信贷资产证券化效应实证研究
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
农村劳动力转移影响因素与转移数量的动态关系研究