棉花新品种数量性状的因子分析与聚类分析

2013-06-07 07:15:31陈荣江孙长法
关键词:克隆棉花性状

陈荣江,孙长法

(1.河南科技学院,河南新乡453003;2.新乡市锦科棉花研究所,河南新乡453731)

棉花新品种数量性状的因子分析与聚类分析

陈荣江1,孙长法2

(1.河南科技学院,河南新乡453003;2.新乡市锦科棉花研究所,河南新乡453731)

探讨棉花数量性状间的相互促进与制约的关系,明确影响产量与品质的主要因素,依早熟、高产与优质对棉花新品种进行综合评价与分类,为挖掘和利用棉花种质资源信息提供依据.对参加新疆自治区2008年棉花品种区试(早中熟2组)的11个品种包括早熟性、产量因素和纤维品质共17个数量性状进行因子分析和聚类分析.结果表明:前6个公因子对所考察性状总变异的累计方差贡献率达93.42%,反映了所考察性状绝大部分变异信息.根据各品种的综合得分排序,列前3名的依次为40428,THK-331,锦科255.聚类分析结果将11个供试品种聚为4大类:第Ⅰ类的4个品种,属较高产、中上质类品种;第Ⅱ类有3个品种,为中产、中下质类品种;第Ⅲ类含2个品种,为中低产、中下质类品种;第Ⅳ包含2个品种,属高产、较优质类品种,并分别指出各类品种改良目标的针对性.

棉花新品种;数量性状;因子分析;聚类分析

因子分析法是用较少个数公因子的线性函数与特殊因子之和来表达原观察向量的各分量,以便合理解释原变量的相关性.因子分析方法在水稻、小麦、玉米、棉花等农作物育种研究中应用较多[1-5].聚类分析是按“物以类聚”研究事物分类的一种多元统计分析方法,它将性状相似的品种聚为一类,前人在性状分析及品种聚类方面亦有不少的研究报道[6-8].近年来运用因子分析与聚类分析相结合进行综合研究的方法逐渐进入人们的视野,如张鹏等[9]、张桂英等[10]分别对小麦和芝麻数量性状进行了因子分析与聚类分析.本文旨在对棉花区试品种植株生育、产量因素及纤维品质等多项数量性状进行因子分析与品种的聚类分析,以期为棉花育种进行性状选择、品种综合评价及确定改良目标提供参考依据.

1 材料与方法

1.1 供试材料

分析材料来源于参加2008年新疆自治区棉花品种区试(早中熟2组)的资料,参试品种有99-6、THK-331、M2、40428、康地3052、X11006、9816、99-9、K-263、锦科255、中49(CK),共11个品种,考察的早熟性状主要有生育期(x1,d)、果枝始节(x2,节)、霜前花率(x3,%);产量因素性状包括:株高(x4,cm)、单株铃数(x5,个)、单铃重(x6,g)、衣分(x7,%)、籽指(x8,g/100粒)、皮棉产量(x9,kg/hm2);纤维品质因素性状有:上半部长度(x10,mm,简称绒长)、整齐度指数(x11,%)、马克隆值(x12)、比强度(x13,cN/tex)、伸长率(x14,%)、反射率(x15,%)、黄度(x16)、纺纱均匀指数(x17,简称纺纱指数),共17个性状.各性状的平均值、标准差列于表1.

表1 所考察性状的平均值和变异性Tab.1 Mean and variability of investigated traits

1.2 分析方法

采用因子分析、聚类分析方法,以期找出具有生物学和专业意义的统计参数,为品种综合评价和确定性状改良目标提供有益信息.数据的统计计算在SAS 9.0[11]和Matlab7.0[12]环境下完成.

2 结果与分析

2.1 因子分析

2.1.1 初始因子载荷矩阵利用所考察性状的相关系数矩阵(表略),通过SAS统计分析软件编程进行因子分析计算,结果提取6个公因子,其累积方差贡献率达93.42%,已代表所考察的全部性状的绝大部分相关信息.从表3各性状的共同度可以看出,除上半部长度x7为83%外,其余各性状的共同度接近或超过90%,表明所选6个公因子已较好地反映这些性状所包含的信息,根据这6个特征值及相应的特征向量计算所得的初始因子载荷列于表2.

表2 初始主因子的载荷矩阵Tab.2 Loadingmatrix of initial factors

2.1.2 初始因子载荷矩阵的方差极大旋转因子分析的目的不仅是要找到公因子,更重要的是要明确每个因子的生物学意义.从表2可知,有的性状在几个公因子上都有较高的载荷值,同时具有中等载荷值的性状也不少,使得公因子的作用和意义不明确,不便于解释.为了合理地对公因子进行解释,需要进一步采用方差最大法对公因子轴进行正交旋转,求得方差最大正交旋转后的因子载荷阵(见表3).

由表3可知,经旋转后,各公因子中在诸性状上的载荷已趋于两极分化,各公因子与有关性状的相关程度突出,其生物学意义更加鲜明.从表3可以看出,在第一公因子中,以整齐度(x11=0.913)、单株铃数(x5=0.820)、霜前花率(x3=0.819)、皮棉产量(x9=0.741)的载荷值较高,故称产量与早熟因子,说明选择株铃多的性状有利于提高皮棉产量、霜前花率及纤维整齐度,而株铃多的性状又与生育期呈负相关,意味着生育期偏短的性状(x1=-0.604)对增加株铃有利.第二公因子中以比强度(x13=0.964)、纺纱均匀指数(x17=0.951)、籽指(x8=0.884)及上半部绒长(x10=0.717)的载荷值较高,显然应称为纤维品质因子,它们之间彼此呈正相关,说明棉铃发育好、籽指高的性状对纤维长度、纤维强度及纺纱指数有积极的促进效应.第三公因子以果枝始节(x2=0.932)、生育期(x1=0.678)的载荷值较高,故称生育性状因子,它们与霜前花率(x3=-0.448)呈负相关,说明果枝始节低,生育期偏短的性状有利于棉花早熟、增收霜前花.第四公因子中以单铃重(x6=0.974)的载荷为最高,显然称为铃重因子,它与衣分(x7=0.691)和伸长率(x14=0.749)呈显著正相关,说明铃重高的性状棉铃发育好,衣分及纤维伸长率高.第五公因子中反射率(x15=0.963)的载荷最高,其次是纤维黄度(x16=0.499)及马克隆值(x12=-0.464),故称为纤维色泽因子,意味着选择反射率高的性状有利于降低马克隆值,提高纤维细度,但应防止增加纤维黄度.在第六公因子中以株高(x4=0.953)最高,故称为植株形态因子,它与马克隆值(x12=-0.379)呈负相关,与纤维黄度(x16=0.493)呈正相关,意味着植株高度偏低的植株有利于降低纤维黄度,但会提高马克隆值,影响纤维细度.

表3 初始主因子方差旋转后的载荷矩阵及共同度Tab.3 After rotated factors loadingmatrix and communalities

2.2 根据主因子综合得分对品种进行排序

根据Thomson估计法,利用各参试品种所考察性状的标准化值,代入上述6个主因子中,求得每个品种相应6个因子的得分.将每个主因子得分进行规一化处理,以所选诸主因子对应的特征值占6个入选特征值总和的比例作为该主因子在品种综合评价中的权重,得权重向量W=(0.336,0.223,0.185,0.099,0.090,0.067),将它与每个品种的得分向量作内积,求得各品种的产量和品质综合得分,据此对各参试品种进行综合排名(见表4).

表4 各参试品种的主因子得分及综合得分Tab.4 Scoresofeach variety on common factorsand synthetic scores

由表4中各参试品种的主因子得分及综合得分可知,列前3位的是40428、THK-331、锦科255,居中间的有9816、X11006、99-6、K263和中49,排在后3位的品种依次为康地3052、99-9、M2.评价结果与各品种在区试中的实际表现基本吻合,客观地反映了该组参试品种的产量和品质特征.

2.3 聚类分析

为了揭示出性状间深层次的关系,明确各参试品种在早熟性、产量因素和品质因素性状方面的相似与差异性,基于以上求得的各品种在各主因子上的得分值,取品种间相似度量为Cosine,采用平均距离(average)聚类方法,将参试的11个品种聚为4大类(见图1).

对各类品种主要性状指标进行统计处理,结果见表5.

图1 参试品种聚类图Tab.1 Clusteranalysisof tested cultivars

表5 各类品种的主要产量及品质指标的平均值与标准差Tab.5 Average and standard deviation ofmajor indexesof lintyield and fiberquality ofevery classofvarieties

由表5可知,第Ⅰ类含THK-331、40428、K-263、锦科255,共4个品种,平均皮棉产量较高为2 547.79kg/hm2,但变异系数较大,霜前花率领先,马克隆值最低,其他各品质指标均居中上水平,属较高产、中上质类品种,对此类品种的改良,除继续提高皮棉产量外,应着重对棉纤维长度和比强度的提高.特别指出,该类中锦科255的皮棉产量居所有参试品种之首,达2 916.30 kg/hm2.第Ⅱ类含99-6、M2和中49(CK)3个品种,此类品种的平均产量2 440.85 kg/hm2居中等水平,纤维长度(30.34mm)、比强度(30.84 cN/tex)及纺纱均匀性指数(156.42)均最低,马克隆值(4.06)最高,其余品质指标居中等水平,为中产量、中下质类品种,其改良目标除尽力提高产量外,还应着重提高纤维的长、细、强度,以实现品质的综合提升.第Ⅲ类有康地3052、99-9两品种,该类品种的产量1 986.53 kg/hm2、霜前花率90.82%均最低,品质指标中纤维长度较长,整齐度最低,其余各品质指标均处中等水平,为中低产、中下质类品种,对这类品种,应着重提高其衣分、霜前花率及棉纤维整齐度.第Ⅳ类含X11006、9816两品种,其平均皮棉产量2 572.88 kg/hm2居4类之冠,其纤维整齐度(85.22%)最高,马克隆值(4.02)较高,比强度(33.39 cN/tex)及纺纱均匀性指数(167.50)最高,其余品质指标处中上等水平,为高产量、较优质类品种,对此类品种除保持产量稳中有升外,应关注马克隆值的降低,提高纤维细度.

3 结论与讨论

棉花的数量性状较多,且指标间存在错综复杂的相关关系,导致它们提供的信息出现重叠,简单相关分析难以得出简明的规律.本文对棉花新品种17个数量性状进行了因子分析,将它们归属于6个公因子,而且每个公因子都有明确的生物学意义,从专业上得到较为合理的解释,从而将多个性状间错综复杂的网络关系降为互不相关的公因子,增强了对目标性状进行选择的预见性,提高选育效果.

对11个参试品种从早熟性、产量因素和纤维品质性状进行聚类分析,将11个品种聚为4大类.第Ⅰ类含THK-331,40428,K-263,锦科255,属较高产、中上质类品种;第Ⅱ类有99-6、M2和中49(CK),为中产、中下质类品种;第Ⅲ类含康地3052,99-9,为中低产、中下质类品种;第Ⅳ类含X11006和9816两品种,属高产、较优质类品种,并对各类品种改良目标的针对性进行探讨.

从本试验各品种的皮棉产量来,平均为2 389.32 kg/hm2,表明目前棉花育种在高产选育上有较大的进展.从4类品种主要纤维品质性状的表现可以看出:平均纤维长度为31.32 mm,属中长绒纤维(31.0~33.9mm),符合纺中支纱的要求;比强度为31.80 cN/tex,属较高比强度等级(30~33),离纺高支纱(34~36 cN/tex)的要求尚存较大的差距;麦克隆值为3.92,属细绒棉A级范围;纺纱均匀性指数为162.11,属适纺60支高强力优质棉(纺纱均匀性指数≥155).这一信息启示我们,今后棉花育种实践中,应当改善育种方法,革新育种手段,在关注选育高产品种的同时,应加强纤维品质的选育力度,提高棉花品种的抗病虫能力,降低由此对品质产生的不利影响.在实际育种工作中,除利用杂交育种基因外渗效应外,还可采用现代生物技术,通过外缘基因的导入、物理或化学诱变,为棉花品质的改良提供新的机遇,以期在纤维的长、细、强度上有所突破,提高棉纤维的综合品质.

[1]张振文,李开绵,许瑞丽,等.两种统计方法在玉米种质综合评价中的应用[J].亚热带植物科学,2006,35(4):6-11.

[2]李松强,李向东,王石华,等.外引黑米种质资源农艺性状的主成分及聚类分析[J].西南农业学报,2010,23(1):11-15.

[3]康立宁,魏益民,欧阳韶辉,等.小麦品质性状的基因型因子分析[J].西北植物学报,2004,24(1):120-124.

[4]韩路,曹新川,胡守林,等.海岛棉数量性状的因子分析[J].江西棉花,2005,27(3):26-29.

[5]周以飞.不同生境下菜用大豆产量与品质性状的因子分析[J].福建农林大学学报:自然科学版,2005,34(3):281-285.

[6]李红琴,刘宝龙,刘登才,等.青海省审定小麦品种的农艺性状多样性分析[J].麦类作物学报,2003,31(6):1040-1045.

[7]孙长法,赵晖,陈荣江.棉花新品种产量品质性状的聚类分析与综合评价[J].西北农业学报,2010,19(4):77-81.

[8]赵光磊,朱红菊,刘春惊,等.环塔里木盆地果棉间作棉花品种遗传多样性分析[J].西北农林科技大学学报:自然科学版, 2010,38(3):113-118.

[9]张鹏,张海洋,郑永战,等.芝麻种质资源因子分析及聚类分析[J].中国油料作物学报,2008,30(1):71-78.

[10]张桂英,张国权,罗勤贵,等.陕西关中小麦品质性状的因子及聚类分析[J].麦类作物学报,2010,30(3):548-554.

[11]高惠璇.SAS系统SAS/STAT软件使用手册[M].北京:中国统计出版社,1997:508-530.

[12]Duane H,Bruce L.精通Matlab 7[M].朱仁峰,译.北京:清华大学出版社,2006:227-242.

(责任编辑:邓天福)

Factor and cluster analysis of quantitative characters for cotton new varieties

Chen Rongjiang1,Sun Changfa2
(1.Henan InstituteofScienceand Technology,Xinxiang453003,China;2.Xinxiang Jinke Cotton Research Institute,Xinxiang453731,China)

To investigate the mutual promotion and restriction relationship between the cotton quantitative characters,clarify the main factors of affecting the yield and quality,the comprehensive evaluation and classification for the new cotton varieties were carried out according to early maturing,high yield and high quality in order to provide basis for analysis and utilization of cotton cultivation resources information.Factor analysis and cluster analysiswere applied to study 17 quantitative characters of 11cotton varieties including earlymaturing,yield variation and fiber quality during cotton varieties region test(early-medium maturity Group 2)in the Xinjiang Uygur Autonomous Region in 2008.The results showed that the cumulative variance contribution of the previous 6 common factors to the tested characteristic variation amounted to 93.42%,which reflected themost variation information of the tested characteristics.According to the comprehensive score of each variety,the top 3 are 40428,THK-331,Jinke 255.The results of cluster analysis clustered the 11 tested varieties into 4 types.4 varieties of type I are high yield and middle-high quality varieties;type II has 3 varieties,which are middle yield,middle-lower quality varieties;type III has 2 varieties ofmiddle-low yield and middle-low quality;type IV contains 2 varieties of high yield,higher quality.The results of cluster analysis also pointed out the pertinence of improvement goals for all kinds of varieties.

new cotton variety;quantitative characters;factor analysis;cluster analysis

S562

A

1008-7516(2013)03-0006-06

10.3969/j.issn.1008-7516.2013.03.002

2013-03-18

河南省重点科技攻关项目(112102110089)

陈荣江(1962-),男,河南辉县人,教授.主要从事应用统计的教学和科研工作.

猜你喜欢
克隆棉花性状
克隆狼
环球时报(2022-09-20)2022-09-20 15:18:57
棉花是花吗?
浙江:诞生首批体细胞克隆猪
今日农业(2020年24期)2020-12-15 16:16:00
宝铎草的性状及显微鉴定研究
棉花
小读者(2020年4期)2020-06-16 03:33:54
9种常用中药材的性状真伪鉴别
抗BP5-KLH多克隆抗体的制备及鉴定
兽医导刊(2016年12期)2016-05-17 03:51:50
对“性状分离比模拟”实验的改进
中学生物学(2016年8期)2016-01-18 09:08:21
Galectin-7多克隆抗体的制备与鉴定
心中的“棉花糖”