朱明哲,杨蕊,段红
(河南科技学院,河南新乡453003)
因子分析法是用较少个数公因子的线性函数与特殊因子之和来表达原观察向量的每个分量,以便合理地解释原变量的相关性.因子分析在水稻[1-2]、小麦[3-4]、玉米[5]、大豆[6]、棉花[7-8]等主要农作物育种研究中应用较多,有助于育种工作者在各世代把握少数几个公因子进行选择和性状改良,提高了选择效率和鉴定的准确性.但将因子分析和聚类分析相结合对小麦新品种综合评价的报道较少,至于进一步利用多元方差分析探索各品种改良目标的研究报道更为罕见.本文对小麦区试品种的产量因素和籽粒品质多项数量性状进行了因子分析,并以各品种相应的公因子得分值进行聚类分析,进而对各类品种的产量和主要纤维品质性状进行多元方差分析,旨在为对小麦新品种进行综合评价及确定改良目标提供参考依据.
分析资料来源于2006-2007河南省小麦区试高肥水组连续参试两年的品种试验结果,参试品种包括:泰麦 2016、中作七号、321-2-3、中麦 12、金豫麦 2 号、平麦 998、济麦 4 号、温 9912、许科 99087、豫保1号、泛麦8号、轮选01-11、新89019、郑农20、金豫麦6号、郑豫麦9987、漯9908、天丰18、03中35,共 19个品种.考察的性状包括:(1)品质性状:容重(x1,g/L)、蛋白质(x2,%)、湿面筋(x3,%)、降落数值(x4,s)、吸水量(x5,mg/100 g)、形成时间(x6,min)、稳定时间(x7,min)和沉淀值(x8,mL);(2)产量性状:公顷穗数(x9,万)、穗粒数(x10,粒)、千粒重(x11,g)和公顷产量(x12,kg),共 12个性状,各性状的平均值及标准差列于表1.
表1 参试品种各性状的平均值及标准差
采用因子分析、聚类分析和多元方差等分析方法,以期找出具有生物学和专业意义的统计参数,为品种综合评价和确定性状改良决策提供有益的信息.数据的统计处理在SAS9.0[9]和Matlab7.0[10]环境下完成.
经计算小麦产量性状及籽粒品质性状共12个数量性状的相关系数(表略),结果表明:容重(x1)与蛋白质(x2)、湿面筋(x3)呈极显著正相关,与吸水量(x5)、千粒重(x11)和公顷产量(x12)呈显著正相关;蛋白质(x2)与湿面筋(x3)和公顷产量(x12)呈显著正相关,与公顷产量(x12)呈极显著负相关,与稳定时间(x7)和沉淀值(x8)显著正相关;湿面筋(x3)与降落数值(x4)显著正相关,与公顷产量(x12)显著负相关;吸水量(x5)与沉淀值(x8)极显著负相关;形成时间(x6)与稳定时间(x7)及沉淀值(x8)极显著正相关;稳定时间(x7)与沉淀值(x8)极显著正相关;沉淀值(x8)与公顷穗数(x9)显著正相关,公顷穗数(x9)与穗粒数(x10)及千粒重(x11)极显著负相关,与公顷产量(x12)显著负相关;穗粒数(x10)与公顷产量(x12)显著正相关;其余各性状之间的相关系数不显著.鉴于以上性状间存在着错综复杂的相关关系,需要作综合性的因子分析,以找出影响各个性状的主要因子.
2.2.1 初始因子载荷矩阵 利用已得到的相关系数矩阵进行因子分析,结果提取5个公因子,其累积方差贡献率达86.96%,代表了所有性状绝大部分相关信息.由这5个特征值及相应的特征向量计算所得的初始因子载荷矩阵列于表2.
从表2各性状的共同度可以看出:除降落数值67.4%和产量性状77.5%以外,其余各性状的共同度都在84.8%~94.5%之间,表明所选的5个公因子已较好地反映这些性状所包含的信息.
表2 初始因子载荷阵、解释比例及其对各变量解释的比例
2.2.2 初始因子载荷矩阵方差极大化旋转 应用因子分析方法,不仅是要找出公因子,更重要的是要明确每个因子的生物学意义.从表2可以看出.有的公因子上有3个或更多个性状都有较高的载荷值,同时具有中等载荷值的性状也不少,使得公因子的作用和意义含糊不清,不便于解释.为合理地解释公因子,需要进一步采用方差最大法对公因子进行正交旋转,得到方差最大正交因子载荷阵(见表3).
表3 方差极大旋转后的因子载荷阵
从表3可以看出,经旋转后的载荷阵各公因子中的载荷值已趋于两极分化,各公因子与有关性状的相关程度比较明确,其生物学意义更加鲜明.在第1公因子(F1)中载荷值较大的性状是稳定时间(0.952)、形成时间(0.947),它们与沉淀值(0.675)呈正相关,说明稳定时间长的性状形成时间较长,沉淀值较高,故称为稳定性因子.第2公因子(F2)中载荷值最大的性状是湿面筋(0.931),故称为湿面筋因子,它与蛋白质含量(0.729)呈正相关,与产量(-0.539)呈负相关.第 3 公因子(F3)中以穗粒数(-0.991)的绝对值最大,故称为穗粒数因子,它与公顷穗数(0.794)及容重(0.426)均呈负相关,说明穗粒数越多公顷穗数越少,容重越低.第4公因子(F4)中以千粒重(-0.894)的绝对值为最大,显然应称为千粒重因子,它与降落值(0.728)、容重(0.558)呈负相关,说明千粒重越高,则降落数值与容重越低.第5公因子(F5)中载荷值以吸水量(0.94)为最大,毫无疑义应称为吸水量因子,它与沉淀值(-0.553)呈负相关,与容重(0.337)呈正相关,说明吸水量越大,沉淀值越小,容重越高.
为了揭示出性状间深层次的关系,给小麦新品种的优选提供信息,对参试品种产量性状和籽粒品质性状多项数量性状进行聚类分析.基于以上求得的旋转后因子载荷矩阵(见表3)及各性状的相关矩阵,按式计算每一品种在各公因子上的得分,按式B=ATR-1计算各公因子的得分系数(式中,为各品种的因子得分矩阵,B为得分系数矩阵,Z为各性状的标准化值,A为旋转后的因子载荷矩阵,T为矩阵的转置运算,R为性状间的相关系数矩阵),然后将各性状标准化值与得分系数矩阵相乘求得各品种在各公因子上的得分值(见表4).
表4 参试品种各性状的主因子得分
在此基础上,取品种间相似度量为欧氏距离,采用离差平方和方法,将参试品种聚类(见图1).
图1 参试品种聚类关系
由图1可见,第Ⅰ类有温9912、金豫麦6号2个品种;第Ⅱ类有泰麦2016、321-2-3、中麦12、金豫麦2号、天丰18共5个品种;第Ⅲ类有中作七号、轮选01-11、新89019、郑农20共4个品种;第Ⅳ类有许科99087、豫保1号、漯9908共3个品种;第Ⅴ类有郑豫麦9987、03中35共2个品种;第Ⅵ类有平麦998、济麦4号、泛麦8号3个品种.
对以上6大类小麦品种的产量和主要籽粒品质性状进行多元方差分析(表略),多元方差采用Wilk's Lambda方法进行检验(F=4.04**),结果达极显著水平.产量和主要品质性状的方差分析结果见表5.
表5 小麦产量和主要品质性状的方差分析
由表5可见,除吸水率在类间差异不显著和品质性状中蛋白质和稳定时间在类间差异极显著外,其他性状在类间差异在0.05水平上显著.因此,对除吸水率外的其余各性状进行多重比较,结果见表6.
表6 不同组各产量和主要品质性状的平均值和标准差及多重比较
根据《国家农作物新品种审定规范》(小麦)中关于强筋、中筋和弱筋小麦的品质划分标准,对表6各类品种的产量及品质进行分析,第Ⅰ类2个品种的平均产量7 073.25 kg/hm2列6类品种之末,显著低于其他5类品种,主要品质性状的容重(795.50 g/L)、蛋白质(15.48%)、湿面筋(36.40%),达到强筋小麦的品质指标,但稳定时间(3.05 min)较短,对这类品种的改良,除加强选育提高产量外,应着重提高其稳定时间.第Ⅱ类5个品种的平均产量为7 587.60 kg/hm2显著低于第Ⅳ、Ⅴ、Ⅵ类的平均产量,属中产品种,其容重(810.40g/L)、蛋白质(14.78%)、湿面筋(34.26%)均已达到强筋小麦的要求标准,但其稳定时间(2.58 min)较短,对这类品种与第Ⅰ类品种改良目标相类似.第Ⅲ类4个品种的平均产量为7 532.25 kg/hm2,属中产品种,容重(791.00 g/L)、湿面筋(31.05%)达强筋小麦指标,蛋白质仅13.85%,属中筋指标,而稳定时间为2.1 min,只符合弱筋小麦指标,对这类品种除继续大力提高产量外,着重加强蛋白质含量和面团稳定时间的选育提高.第Ⅳ类4个品种平均产量8 090.50 kg/hm2,居6类之冠,容重771.33 g/L,湿面筋32.33%,达到强筋小麦指标,蛋白质为13.48%、稳定时间3.56 min,均属中筋指标,对此类品种除保持产量稳中有升外,着重提高蛋白质含量及稳定时间的选育.第Ⅴ类2个品种平均产量7 837.5 kg/hm2,居6类品种的第2位,属高产品种,4项主要品质指标除容重784.00 g/L达强筋小麦指标外,蛋白质13.96%、湿面筋29.9%属中筋指标,稳定时间2.1 min为弱筋指标,对这类品种除继续保持产量略有提高外,应着重加强对蛋白质、湿面筋及稳定时间的选育提高.第Ⅵ类3个品种平均产量7 729 kg/hm2居第3位,但与Ⅳ、Ⅴ两类高产品种的产量无显著差异,属中高产类型品种,4项主要品质指标中的容重793.00 g/L、蛋白质15.27%、湿面筋32.2%、稳定时间8.87 min均属强筋指标,对这类高产优质的强筋小麦力求保持产量和各项主要品质指标的稳中有升即可.
小麦产量性状和品质性状较多,且指标间存在错综复杂的相关关系,导致它们提供的信息出现重叠,不易得出简明的规律.本文对区试小麦新品种的产量因素和籽粒品质共12个数量性状进行因子分析,将它们归属于5个公因子,而且每个公因子都有明确的生物学意义,从专业上得到较为合理的解释,从而将多个性状间错综复杂的网络关系降为综合相关性很小的公因子,有利于针对目标性状进行选择,提高选择效率.
通过聚类分析将19个小麦品种聚为6大类.第Ⅰ类含温9912、金豫麦6号2个品种,平均产量最低,面团稳定时间较短,对这类品种除大力提高产量外,应着重选育提高其面团稳定时间.第Ⅱ类有泰麦2016、321-2-3、中麦12、金豫麦2号、天丰18共5个品种,平均产量7 587.6 kg/hm2属中高产水平,面团稳定时间较短,对这类品种的改良目标与第Ⅰ类品种相类似.第Ⅲ类有中作7号、轮选01-11、新89019、郑农20共4个品种,平均产量为7 532.25 kg/hm2属中高产品种,品质指标中的蛋白质含量偏低,稳定时间最短,对这类品种除注重进一步提高产量外,应着重提高蛋白质含量及面团稳定时间.第Ⅳ类有许科99087、豫保1号、漯9908共3个品种,平均产量为8 090.5 kg/hm2产量最高,蛋白质含量及面团稳定时间偏低,对这类品种除保持产量稳中有升外,亦须加强对蛋白质及面团稳定时间的选育提高.第Ⅴ类有郑豫麦9987、03中35共2个品种,平均产量为8 090 kg/hm2居6类品种之冠,主要品质指标属中筋标准,除保持产量稳而不降外应加强对蛋白质、湿面筋、稳定时间等品质指标的选育,第Ⅵ类含平麦998、济麦4号、泛麦8号3个品种,平均产量为7 729kg/hm2属中高产品种,品质指标均已达强筋小麦标准,为中高产优质强筋小麦,对这类品种应力求保持产量和各项品质指标稳中有升适当再上一个新台阶.
从本试验各品种的产量来看,90%的参试品种的产量达到7 500 kg/hm2,表明我省目前在小麦高产选育上有较大的进步,品质性状总体表现为:各品种的容重和湿面筋都较高,基本达到强筋小麦标准要求,蛋白质含量有待适当提高,面团稳定时间离强筋小麦标准7 min的差距太大.这一信息启示我们今后应当改善育种方法,革新育种手段,在关注选育高产品种的同时,应加强对品质性状稳定时间和蛋白质含量的选育力度.在实际育种工作中除利用杂交育种基因外渗效应外,还可采用其他生物技术,通过外缘基因的导入为小麦品质的改良提供新的机遇.
[1]谢戎,金良,李永洪,等.黑紫稻资源农艺性状的因子分析[J].绵阳经济技术高等专科学校学报,2001,18(4):1-3.
[2]殷延勃,马洪文,荣韫琛,等.宁夏水稻主要农艺和品质性状的因子分析[J].西北农业大学学报,1998,27(2):37-41.
[3]康立宁,魏益民,欧阳韶辉,等.小麦品质性状的基因型因子分析[J].西北植物学报,2004,24(1):120-124.
[4]萧红,裴鑫德.冬小麦数量性状因子分析和聚类分析[J].北京农业大学学报,1991,17(4):17-24.
[5]杨国虎,冯前,罗湘宁,等.玉米杂交种耐旱性状的因子分析[J].干旱地农业研究,2005,23(1):138-143.
[6]周以飞.不同生境下菜用大豆产量与品质性状的因子分析[J].福建农林大学学报:自然科学版,2005,34(3):281-285.
[7]陈荣江,朱明哲,孙长法.棉花新品种产量品质性状的综合评价及聚类分析[J].西北农业学报,2007,16(4):264-268.
[8]韩路,曹新川,胡守林,等.海岛棉数量性状的因子分析[J].江西棉花,2005,27(3):26-29.
[9]东大钧.SAS统计分析应用[M].北京:电子工业出版社,2008.
[10]陈桂明,戚红雨,潘伟.MATLAB数理统计(6.X)[M].北京:科学出版社,2002:189-198.