史卫东 罗海玲 康红卫 农贵雄 韦爱培
摘要 為了评价29份菜心品种的表型多样性,对株高、开展度、叶片数、叶重、侧分枝数、主薹茎长、主薹直径、主薹重量、单株重和生物产量等10个表型性状进行了变异分析、回归分析、主成分分析和聚类分析。结果表明,10个性状的平均变异系数为68.02%,从大到小依次为叶重、单株重,主薹重量、开展度、生物产量、侧分枝数、叶片数、主薹茎长、株高和主薹直径。开展度、叶重、主薹直径、侧分枝数和单株重与生物产量相关性未达到显著水平,其余性状间均达到极显著相关水平。经主成分分析提取第1个主成分,累计方差贡献率为 80.997%,特征向量包括全部指标。依据第1个主成分贡献率的大小综合评判,选择植株高大、单株质量大、主薹直径大和质量大、叶片数较多且质量大、侧分枝数较多的菜心作为优异品种。聚类分析分为3个类群,第1类除了生物产量最高外,其余9个指标较低;第2类除了生物产量最低外,其余9个指标较高;第3类生物产量高于第2类,低于第1类,其余9个指标最低。该研究可为菜心品种评价及应用提供基本信息。
关键词 菜心品种;主成分;聚类分析
中图分类号 S634.5文献标识码 A
文章编号 0517-6611(2020)24-0046-04
doi:10.3969/j.issn.0517-6611.2020.24.014
开放科学(资源服务)标识码(OSID):
Evaluation of Chinese Flowering Cabbage Variety by Principal Component Analysis and Cluster Analysis
SHI Weidong,LUO Hailing,KANG Hongwei et al (Institute of Vegetable,Guangxi Academy of Agricultural Sciences,Nanning,Guangxi 530007)
Abstract In order to evaluate the phenotypic diversity of 29 Chinese flowering cabbages varieties,the variation analysis,stepwise regression analysis,principal component analysis and cluster analysis were used to analyze 10 phenotypic traits. The results showed the coefficient of variation of 10 traits was 68.02%,with the order from high to low being leaf weight,plant weight,main stalk weight,range,biomass,branch,leaf number,main stalk height,height and main stalk diameter.No significant correlations existed between range,leaf weight,main stalk diameter,branch,plant weight and biomass. There were significant correlations among other traits.The results of principal component analysis showed that 10 characteristic indexes could be classified into the first principal component which cumulative contribution rate was 80.997%.According to the comprehensive evaluation of the contribution rate of the first principal component, the cabbage with higher and larger, more plant weight, more main stalk diameter and weight, more leaf number and weight and more branches was selected as excellent variety.Morphologically 29 cabbages were clustered into three groups. The first group had maximum biomass and lower value of other nine characteristics.The second group had minimum biomass and higher value of other nine characteristics.The third group had middle biomass and the lowest value of other nine characteristics. These results were useful to provide the basic information for research and application of Chinese flowering cabbages variety.
Key words Chinese flowering cabbages variety;Principal component;Cluster analysis
菜心(Brassica Campestris L.ssp.chinensis Var.utilis Tsen et Le)是华南地区种植面积大的叶菜,表型多样性丰富,品种繁多,更新速度快,品种评价和选择对种植者很重要。菜心食用部位是菜薹与叶片,性状变异相对简单,常用的鉴定指标是熟期和株色等,这种简单的分类虽然合理,但种质鉴评的有效性和准确性会有所下降。主成分分析是将多指标线性组合为较少的综合指标,这些综合指标彼此间既不相关,又能反映原来多指标的信息[1]已广泛应用于蔬菜研究[2-8]。前期利用27份菜心种质资源进行主成分分析的结果表明,绝大部分遗传多样性可用主薹因子和叶片因子来表示,这为优异种质资源鉴定提供了基本信息[7],但还未能据此获得资源的准确评价结果。鉴于此,笔者对29份菜心品种进行了主成分分析、聚类分析和综合评价,旨在为新品种的评价及应用提供理论依据和可行方法。
1 材料与方法
1.1 试验材料 29份菜心品种来源于南宁地区,材料名称编号如下:1号(28K油青菜心王)、2号(聚缘特靓粗苔油青甜菜心)、3号(澳洲50天油青甜脆菜心)、4号(翠绿尖叶80天油青甜菜心)、5号(澳洲碧绿80天油青甜菜心888)、6号(新西兰尖叶50天油青甜菜心)、7号(台湾快大四九-19甜菜心)、8号(澳洲60天油青甜脆菜心)、9号(澳洲80天粗条迟花甜菜心)、10号(全能50天尖叶油青甜菜心)、11号(广东一枝花菜心)、12号(抗热四九菜心)、13号(香港石排全年菜心)、14号(优选31号甜菜心)、15号(澳洲100天多芽迟花甜菜心)、16号(特纯45天油青甜菜心皇)、17号(全年四九油青甜菜心)、18号(珍美45天尖叶油青甜菜心)、19号(绿宝70天菜心)、20号(80天大种迟花油青甜菜心)、21号(菜场68号油青甜菜心)、22号(正宗东莞50天油青甜菜心)、23号(绿美美尖叶油青甜菜心)、24号(MOO8尖叶油绿甜菜心)、25号(黄叶四九月菜心)、26号(特靓王45天尖叶油青甜菜心)、27号(508油青甜菜心)、28号(粗条80天大花油青甜菜心)和29号(桂甜菜心2号)。
1.2 试验方法
1.2.1 试验设计。
2018年12月份在广西青芸景农业投资有限公司直播种植,每份资源5 m2,共3次重复,水肥管理和病虫害防治措施按照公司的田间管理进行。
1.2.2 性状观察。采收期从每个品种每个重复随机抽取5株植株,调查株高、开展度、叶片数、叶重、主薹茎长、主薹直径、主薹重量、单株重、侧分枝数共9个性状。各重复在齐口期割取1 m2称量生物产量。
1.3 数据处理方法
采用Excel 2010和SPSS 16进行数据分析。首先将数量性状数值记入Excel分析平均值、标准差及变异系数。再利用SPSS 16进行主成分分析,提取特征值大于1.00的因子作为主成分,得到原始数据相关矩阵的特征值、方差贡献率、累计方差贡献率、成分矩阵、成分得分系数矩阵等,根据所得信息对29份品种进行综合评价。利用生物产量为依性状,9个性状为自性状进行多元回归分析。以欧氏距离为聚类统计量,采用最近距离法进行聚类分析并形成树状图。
2 结果与分析
2.1 29个参试品种10个表型性状的变异分析 由表1可知,10个性状的平均变异系数为68.02%,从大到小依次为叶重、单株重,主薹重量、开展度、生物产量、侧分枝数、叶片数、主薹茎长、株高和主薹直径,说明菜心表型多样性丰富,性状变异来源不同,叶重和主薹重量等质量性状变异极大,是主要的变异性状,主薹茎长、株高和主薹直径等体积性状变异较小。
2.2 10个性状间的相关分析及碎石图检验
在进行PCA之前,需要进行适应性检验,该研究使用相关系数和碎石图检验进行适用性评价。相关分析结果如表2所示。由表2可知,除了开展度、叶重、主薹直径、侧分枝数和单株重与生物产量相关性未达到显著水平之外,其余性状间均达到极显著相关水平,因此可继续利用 PCA 进行综合分析。
根据主成分分析的一般性原则,提取主成分因子时需考虑特征值是否大于1,通过Cattell碎石检验转折点等来判断保留的主成分个数,碎石图检验结果显示第1个主成分包含了大部分信息(图1)。
2.3 主成分分析
利用SPSS 16对29份菜心的10个性状进行主成分分析(表3),按照特征值均大于1的原则,提取的第1个主成分累计方差贡献率为 80.997%,基本反映了所有性状的初始信息。
各指标的主成分初始因子载荷值见表4,其大小反映原始指标与各主成分之间的相关性,其绝对值越大,对该主成分影响越大,一般认为大于0.3 的载荷值是显著的。因此,该试验提取的第1个主成分包括主薹重量、叶片数、株高、主薹直徑、单株重、主薹茎长、开展度、叶重和侧分枝数等指标,均具有较高的载荷系数,能够很好地解释原始性状。
2.4 不同品种的综合评价 用各指标变量的主成分载荷除以主成分相对应的特征值开平方根,得到第1个主成分中每个指标所对应的系数,即特征向量,以特征向量为权重构建第1个主成分与10项指标的函数表达式:
F1=0.121ZX1+0.118ZX2+0.119ZX3+0.113ZX4+0.119ZX5+0.118ZX6+0.086ZX7+0.120ZX8+0.120ZX9-0.059ZX10
根据主成分计算公式,计算29份品种的综合得分,按照得分大小排列品种顺序见表5,据此可以选择植株高大、单株质量大、主薹直径大和质量大,叶片数较多且质量大,侧分枝数较多的菜心作为优异品种。
2.5 不同品种的生物产量回归分析 以生物产量为依变量,其余性状X1~X9为自变量进行回归分析,得到以下产量回归方程:
y=497.405-18.540X1-0.349X2-53.811X3+6.517X4+10.962X5+394.445X6+4.749X7-10.280X8+3.443X9
回归分析表明,叶重、主薹茎长、主薹直径、侧分枝数、主薹重量和单株重与生物产量正相关性较大,能够显著提高生物产量。
安徽农业科学 2020年
2.6 聚类分析
聚类分析结果如图2所示,欧式距离为5时,29 份材料可分为3个类群。第1类包括7号(台湾快大四九-19甜菜心)、8号(澳洲60天油青甜脆菜心)、10号(全能50天尖叶油青甜菜心)、11号(广东一枝花菜心)、12号(抗热四九菜心)、18号(珍美45天尖叶油青甜菜心)、19号(绿宝70天菜心)、24号(MOO8尖叶油绿甜菜心)、25号(黄叶四九月菜心)和26号(特靓王45天尖叶油青甜菜心)共10个品种,属于株高低、开展度和叶片数适中、主薹长度和直径偏小、侧分枝数适中、叶重、主薹重量和单株重偏低,但
生物产量最高的类型。第2类包括1号(28K油青菜心王)、2号(聚缘特靓粗苔油青甜菜心)、3号(澳洲50天油青甜脆菜心)、4号(翠绿尖叶80天油青甜菜心)、5号(澳洲碧绿80天油青甜菜心888)、9号(澳洲80天粗条迟花甜菜心)、13号(香港石排全年菜心)、14号(优选31号甜菜心)、15号(澳洲100天多芽迟花甜菜心)、20号(80天大种迟花油青甜菜心)、21号(菜场68号油青甜菜心)、23号(绿美美尖叶油青甜菜心)、27号(508油青甜菜心)、28号(粗条80天大花油青甜菜心)和29号(桂甜菜心2号)共15个品种,属于植株高大茂盛、株幅最大、叶片数最多、主薹长度和直径最大、侧分枝数最多、叶重、主薹重量和单株重最大,但是生物产量最低的类型。第3类包括6号(新西兰尖叶50天油青甜菜心)、16号(特纯45天油青甜菜心皇)、17号(全年四九油青甜菜心)和21号(菜场68号油青甜菜心)共4个品种,属于株高最低、开展度最小、叶片数最少、主薹长度和直径最小、侧分枝数最少、叶重、主薹重量和单株重最低,生物产量高于第2类,但低于第1类。
3 结论与讨论
变异系数是反映性状变异范围的重要指标,前期选用27份菜心的8个性状,其中主薹粗度、主薹重量和叶重及两者决定的单株重具有较大的变异系数,粗度和重量相关的性状变异可能更丰富[7]。该研究选用29个品种10个性状得到的平均变异系数更大,叶重、主薹重量和单株重等质量性状变异大,表明质量性状变异幅度大、遗传多样性丰富,可能是表型多样性变异的主要来源。株高、主薹茎长和主薹直径等体积性状变异较小,与前期研究主薹粗度变异系数最大不同,这可能与该研究全部选用菜心品种有关,说明这些品种表型性状变异可能比较大,表型多样性也比较丰富。
主成分分析将原来的多个性状转换为个数较少而且不相关的综合指标,简化表型性状的分类工作[2]。运用主成分分析和聚类分析判定菜心营养品质差异[6]和种质资源型多样性变异[7]。该研究利用主成分分析第 1 主成分9个均具有较高的载荷系数且数值较大的指标,碎石图检验结果显示第1个主成分就包含数据集的大部分信息,相关分析也表明多个其余性状间均达到极显著相关水平,与前期研究8个性状间的部分相关性达到显著水平较一致[9],说明这些指标对第 1 主成分的影响都较大,不可精简掉。
菜心通常可以按照熟性、颜色、株高、茎粗和产量等表型特征分类[10]。菜心品种多、更新快,因此准确地鉴定和评价对种植者尤为重要,其中产量是重要指标之一。生物产量回归分析表明,叶重、主薹茎长、主薹直径、侧分枝数、主薹重量和单株重对生物产量影响较大。聚类分析基本按照生物产量和其余9个性状指标变化,将29份菜心分为3类,结果清晰且简便可靠,说明该研究所选性状基本适合品种评价要求,便于大量菜心品种资源的综合评价。根据综合评价得分值高低,可以选择植株高大、单株质量大、主薹直径和质量大、叶片数较多且质量大、侧分枝数较多的品种作为推广的优异品种。
参考文献
[1]袁志发,周静芋.多元统计分析[M].北京:科学出版社,2002:234-258.
[2] 赵德新,孙治强,任子君,等.茄子形态学性状主成分分析及聚类分析[J].河南农业大学学报,2009,43(4):393-397.
[3] 苗锦山,刘彩霞,戴振建,等.葱种质资源数量性状的聚类分析、相关性和主成分分析[J].中国农业大学学报,2010,15(3):41-49.
[4] 朱宗河,郑文寅,张学昆.甘蓝型油菜耐旱相关性状的主成分分析及综合评价[J].中国农业科学,2011,44(9):1775-1787.
[5]朱长志,张志仙,劉君,等.青花菜主要农艺性状相关性、主成分与聚类分析[J].中国农学通报,2015,31(4):73-79.
[6] 原远,李光光,郑岩松,等.基于主成分分析的菜心营养品质判定[J].南方农业学报,2018,49(8):1568-1574.
[7] 史卫东,陈振东,农贵雄,等.菜心种质资源的主成分与聚类分析[J].江西农业学报,2019,31(9):46-49.
[8] 何虎翼,谭冠宁,何新民,等.63份马铃薯品种(系)资源农艺性状的主成分与聚类分析[J].江苏农业学报,2017,33(1):27-33.
[9] 宋世威,伊灵燕,刘厚诚,等.不同菜心品种产量及品质性状聚类分析[J].广东农业科学,2011,38(11):56-58.
[10] 卢纹岱.SPSS for Windows 统计分析[M].北京:电子工业出版社,2000:401-419.