基于聚类和逐步回归分析的玉米品种间关系研究

2016-07-07 08:34韩文革董爱书于晓秋黑龙江八一农垦大学农学院大庆69黑龙江九三科研所植保站嫩江6黑龙江八一农垦大学信息学院大庆69黑龙江八一农垦大学理学院大庆69
作物研究 2016年3期
关键词:回归分析聚类分析性状

韩文革,董爱书,高 军,于晓秋(黑龙江八一农垦大学农学院,大庆69;黑龙江九三科研所植保站,嫩江6;黑龙江八一农垦大学信息学院,大庆69;黑龙江八一农垦大学理学院,大庆69)



基于聚类和逐步回归分析的玉米品种间关系研究

韩文革1,董爱书2,高 军3,于晓秋4
(1黑龙江八一农垦大学农学院,大庆163319;2黑龙江九三科研所植保站,嫩江161441;3黑龙江八一农垦大学信息学院,大庆163319;4黑龙江八一农垦大学理学院,大庆163319)

摘 要:通过对41个玉米品种的比较试验确定15个性状特征,利用聚类分析和逐步回归分析方法研究性状特征间的关系。结果表明,41个玉米品种可聚分为5类;各类品种的性状均值分析可知,第Ⅲ和第Ⅳ类玉米品种产量高,第Ⅰ、Ⅱ和Ⅳ类玉米品种抗倒伏能力强,第V类玉米品种抗病害能力强。通过建立产量与其他性状的“最优”回归方程,表明穗粗、百粒重、空秆率和株高4个性状对产量影响显著且作用递减。

关键词:玉米;品种;性状;聚类分析;回归分析

玉米是重要的粮食作物和重要的饲料来源,也是全世界总产量最高的粮食作物。随着农业结构的调整,玉米面积不断扩大,选育出抗倒伏、抗病和优质高产的玉米品种是玉米育种和生产的关键。在玉米育种中,将玉米品种性状进行聚类,并且了解玉米的各产量因子对玉米产量的影响程度,对于指导玉米育种是十分必要的。

Sanchez等给出了9个玉米形态特征的变量[1]。Li等分析了中国玉米种质资源核心种质库的地理分布和特性[2]。李得孝等对玉米抗倒伏性指标进行了研究[3]。Yan等基于颜色特征研究玉米种子纯度鉴定[4]。孙峰成等对玉米群体的主要农艺性状与产量、品质进行了灰色关联度分析[5]。蔡成雄等对国家西南区鲜食糯玉米区试的农艺性状与鲜穗产量进行了综合分析与评价研究[6]。张焕欣等对玉米穗行数进行了全基因组关联分析[7]。王国宏等研究了玉米出籽率、千粒重和单穗粒重的改良效果和杂种优势等[8]。王世艳对玉米超高产育种理论及优化栽培技术进行了探究[9]。龚顺良等应用多因素综合评判法综合分析玉米杂交种的性状[10]。贺晨邦等对青海优异玉米品种的农艺性状进行了变异及产量研究[11]。Wang等对一个单片段代换系与受体亲本间玉米穗行数相关进行了miRNA转录组分析[12],等等。综上可知,有关玉米的农艺性状与产量性状的关联分析和评价等研究已经取得一定成果,而利用玉米品种与农艺、穗产量、抗倒伏等性状进行分类与产量及性状间的回归分析的研究较少。笔者选取多个玉米品种进行小区对比试验,采集农艺、穗产量、抗倒伏等性状数据进行品种分类与产量与性状间的回归分析研究。

1 材料与方法

1.1试验地概况

试验在黑龙江九三管理局尖山农场科技园区进行。土壤为黑钙土,有机质含量35 g/ kg,pH值6.68。前茬甜菜,地势平坦、无药害,秋深松一遍,耙三遍。秋施肥起垄,垄距1.1 m,每公顷密度9万株,施磷酸二铵200 kg,尿素200 kg,钾肥50 kg,苗期机械深松一遍,中耕两遍,追施尿素100 kg/ hm2。

1.2试验材料

选取克单9号、佳禾158、海玉12号、冀承单3号、德美亚3号、登海21号、青单1号、海玉7号、哲单37号、利合16号、宾玉4号、克单10号、长种玉2号、南北7号、登海21号、禾玉24号、九玉4号、先锋38p05、内早303、肯玉10号、德美亚2号、长城1142、W901 -37、W901 -38、W102、W901 - 3、克4、克5、克23、克42、丰垦496、泽玉620、顺玉3、富单9、富尔10、富粮1、克单14号、肯单24、鑫科玉1号、兴垦9号、德美亚1号共41个品种为研究对象。

1.3试验方法

采用小区对比法,每个品种面积为0.1 hm2,垄长150 m,6行垄,精量播种,生育期叶面追肥3次,中耕3次,采取航化病虫害防治方法及促早熟。施肥采用立体分层分期施肥。对上述每个试验品种采集株高、穗位、倒折等级、倒伏面积、空秆率、大斑病等级、丝黑穗病、瘤黑粉病、穗长、穗粗、百粒重、行数、行粒数、穗粒数和产量性状数据为后期分析的基础。

2 研究方法

2.1聚类分析

根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据,将一些相似程度较大的样品聚为一类。常用度量样品方法有最短距离法、最长距离法、中间距离法、类平均法、可变类平均法和离差平方和法等,主要是类间距离方法不同采用不同计算公式[13]。

2.2逐步回归分析

所有自变量分别与因变量建立一元线性回归方程,将偏回归平方和最大及通过显著性检验的变量引入方程。将剩余自变量再分别与因变量、及已引入方程的变量建立二元回归方程,并检验方程,剔除不显著变量,类似地将通过了偏统计量检验的变量逐个引进,同时,每引入一个新变量后,对已入选的原变量进行检验,将经检验认为不显著的变量剔除。多次重复此过程,直到既不能引入新变量,又不能剔除原变量为止,则选择过程结束,最后一个模型即为所求的“最优”回归模型[14]。

3 结果与分析

3.1试验结果

将试验采集的41个玉米品种的抗病性、抗倒伏能力等农艺性状数据整理汇总于表1。

3.2品种间的聚类分析

将表1中的41个玉米品种看作样本,每个品种的15个性状看作样本具有的指标,利用SPSS18.0软件进行多种方法聚类,结合实际分析选取离差平方和法的聚类结果[15],见图1。

表1 41个试验玉米品种的农艺性状数据汇总表Table 1 Summary table of the agronomic characters of the 41 maize varieties

图1 使用离差平方和法连接的品种聚类结果Fig.1 The result of clustering analysis by Ward’method

由图1可知,41个品种可以分为五类:第Ⅰ类为海玉7号、鑫科玉1号、登海20号、宾玉4号、佳禾158、内早303、垦单24、海玉12号、W102、德美亚2号、克单10号、长种玉2号、冀承单3号、青单1号、W901 -3;第Ⅱ类为哲单37、禾玉24号、克单9号、利合16号;第Ⅲ类为泽玉620、顺玉3、W901 -37、富单9;第Ⅳ类为垦玉10号、克4、W901 -38、克42、克单14号、德美亚1号、先锋38p05、富尔10、南北7号、兴垦9号;第Ⅴ类为九玉4号、富粮1号、登海21号、克5、德美亚3号、丰垦496、长城1142、克23。计算各类所含品种中的性状平均数据可知,这五类中第Ⅲ类玉米品种平均产量最高,但抗倒伏和病害能力极差;第Ⅳ类玉米平均产量较高,抗倒伏能力强,抗病害能力低;第Ⅴ类玉米产量低,抗倒伏能力中等,抗病害能力强;第Ⅰ类玉米产量低,抗倒伏能力强,抗病害能力低;第Ⅱ类玉米产量最差,抗倒伏能力强,抗病害能力低。

3.3“最优”回归方程的建立

以表1中玉米产量为因变量,其他性状为自变量进行逐步回归分析,逐步引进最显著并剔除不显著效应的自变量,得到“最优”回归方程。采用SPSS18.0软件建立的“最优”回归方程为:

该方程的显著性检验和系数检验都显著,说明建立的“最优”回归方程有意义。

4 小结与讨论

通过聚类分析结果可知,本试验的41个玉米品种共分为5类,各类在产量、抗倒伏和抗病害能力方面各有特点,说明要培育具有高产、抗倒伏和抗病害的玉米新品种时,可以根据各类的性状特点,选取具有代表性状品种作为育种的种质资源。其中,第Ⅲ、Ⅳ类中玉米品种产量高,第Ⅰ、Ⅱ、Ⅳ类玉米品种抗倒伏能力强,第Ⅴ类玉米品种抗病害能力强。育种时可依各类的特点选择亲本,选育出既抗病又高产的新品种。

通过逐步回归分析结果可知,影响玉米产量的主要性状是株高、穗粗、空秆率和百粒重,这4个性状对产量的总影响顺序为:穗粗>百粒重>空秆率>株高。说明提高玉米产量特别要注重穗粗、百粒重、空秆率和株高等性状,其中穗粗最重要。

参考文献:

[1] Sanchez JJ,Goodman GM,Rawlgs JO.Appropriate characters for racial classification in maize[J].Economic Botany,1993,47(1):44 -59.

[2] Li Y,Shi YS,Cao YS,et al.Establishment of a core collection for maize germplasm preserved in Chinese National Genebank using geographic distribution and characterization data[J].Genetic Resources and Crop Evolution,2004,51:845 -852.

[3] 李得孝,员海燕,周联东.玉米抗倒伏性指标及其模拟研究[J].西北农林科技大学学报,2004,32(5):53 -56.

[4] Yan XM,Wang JX,Liu SX,et al.Purity identification of maize seed based on color characteristics[J].Computer and Computing Technologies in Agriculture,2011,346:620 -628.

[5] 孙峰成,冯 勇,于 卓,等.12个玉米群体的主要农艺性状与产量、品质的灰色关联度分析[J].华北农学报,2012,27(1):102 -105.

[6] 蔡成雄,陈荣丽,周彦民,等.糯玉米鲜穗产量与农艺性状灰色关联度分析[J].中国农学通报,2014,30 (3):214 -218.

[7] 张焕欣,翁建峰,张晓聪,等.玉米穗行数全基因组关联分析[J].作物学报,2014,40(1):1 -6.

[8] 王国宏,石清琢,王延波,等.美国优异种质在玉米育种中的利用研究[J].玉米科学,2014,22(6):1 -5.

[9] 王世艳.玉米超高产育种理论及优化栽培技术探究[J].北京农业,2015(12):27 -28.

[10]龚顺良,周玉萍.玉米育种中多因素综合评判法的应用[J].南方农业,2015,9(36):247 -248.

[11]贺晨邦,马进福,王 敏,等.青海优异玉米品种的农艺性状变异及产量研究[J].农业科技通讯,2015 (2):49 -52.

[12]Wang B,Xue YD,Zhang ZX,et al.Transcriptomic analysis of maize kernel row number - associated miRNAs between a single segment substitution line and its receptor parent[J].Plant Growth Regulation,2016,78(2):145 -154.

[13]何晓群.多元统计分析[M].北京:中国人民大学出版社,2008.

[14]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[15]韩文革,于晓春.聚类分析在鹰嘴豆农艺性状分类上的应用[J].内蒙古农业科技,2006(6):40 -41.

Study on the Relationship of Maize Varieties Based on Clustering and Stepwise Regression Analysis

HAN Wenge1,DONG Aishu2,GAO Jun3,YU Xiaoqiu4
(1 College of Agriculture,Heilongjiang Bayi Agricultural University,Daqing,Heilongjiang 163319,China;2 Plant Protection Unit,Heilongjiang Jiusan Scientific Research Institute,Nenjiang,Heilongjiang 161441,China;3 College of Information,Heilongjiang Bayi Agricultural University,Daqing,Heilongjiang 163319,China;4 College of Science,Heilongjiang Bayi Agricultural University,Daqing,Heilongjiang 163319,China)

Abstract:The 15 characters of 41 maize varieties are earned in comparison experiment.The relationship of maize varieties was studied based on clustering and stepwise regression analysis.The results showed that maize varieties were clustered into five types.ClassⅢandⅣshowed high yield,classⅠ,II andⅣshowed strong resistance to lodging,class V shows strong resistant to disease."Optimal" regression equation was established between yield and other characters.The effect of the Characters of ear diameter,hundred grain weight,empty stem rate and plant height on maize yield are significant,and their effects reduced progressively.

Keywords:maize;varieties;characters;clustering analysis;regression analysis

中图分类号:S513.023

文献标识码:A

文章编号:1001-5280(2016)03-0250-04

DOI:10.16848/ j.cnki.issn.1001-5280.2016.03.04

收稿日期:2016- 02- 28

作者简介:韩文革(1966 -),副教授,主要从事农业基础与应用研究。

基金项目:农业部公益性项目(201303007);学校学成引进人才科研启动基金(XDB2014 -15)。

猜你喜欢
回归分析聚类分析性状
“7532B”母种不同系统性状比较
宝铎草的性状及显微鉴定研究
不同保育单位“781”“7532”母种性状比较分析
农村居民家庭人均生活消费支出分析
基于变形监测的金安桥水电站坝体稳定性分析
森林碳汇影响因素的计量模型研究
基于省会城市经济发展程度的实证分析
河北省城镇居民人均可支配收入与消费统计分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究