许乃银 王 扬 王丹涛 宁贺佳 杨晓妮 乔银桃
棉花纤维质量指数的构建与WGT双标图分析
许乃银1王 扬2王丹涛2宁贺佳2杨晓妮1乔银桃1
1江苏省农业科学院经济作物研究所, 江苏南京 210014;2中国纤维质量监测中心, 北京 100007
棉花纤维质量受到多项纤维性状的共同作用和影响, 科学构建纤维综合评价指数有利于客观评价棉花纤维的总体质量水平。本研究采用2019—2021年期间中国纤维质量监测中心在新疆主产棉区的棉纤维质量抽检数据构建了棉纤维质量指数模型, 并采用WGT双标图方法对质量指数进行可视化分析和品种分类评价。结果表明, (1) 棉纤维综合评价指数的构成因子及权重分别为纤维长度(权重为0.451)、整齐度(0.173)、比强度(0.285)、马克隆值(–0.117)和颜色级(–0.526)。(2) 基于纤维品质综合评价指数(CEI)和性状协调指数(TCI)构建了纤维质量指数(FQI), 并筛选出新陆中64、新陆早78和中棉113等综合纤维质量表现最好的品种, 以及新陆早67、新陆早54、酒棉18号和新陆中78等综合纤维质量表现较差的品种。(3) 用WGT双标图实现对纤维品质综合评价指数、性状协调指数和纤维质量指数的可视化分析。(4) 采用WGT双标图分析方法将纤维质量监测抽检的52个棉花品种划分为4个特征明显的品种类型, 其中, I型品种的纤维综合表现最好; II型品种综合表现较差; III型品种性状协调指数表现最好, 其余性状表现差; IV型品种颜色级表现差, 其余性状表现较好。本研究在对主产棉区棉花纤维品质指标广泛抽样的基础上采用逐步回归分析的方法构建了纤维综合评价指数, 并结合性状协调指数建立了纤维质量指数, 同时采用WGT双标图方法实现了可视化分析, 可为科学制定中国棉花纤维质量指数提供理论支持, 也为其他类似的品种多性状数据分析提供了应用范例。
棉花(L.); 纤维质量指数; GT双标图; WGT双标图; 逐步回归分析; 聚类分析
我国棉花综合纤维品质已经达到或接近国际中等质量水平, 但仍存在主要物理性能指标不协调和纤维综合评价指标实用性差等问题[1]。棉纤维的成纱质量受到棉纤维长度、整齐度、比强度和马克隆值等纤维品质指标的综合影响, 由于多个目标性状间存在着错综复杂的遗传相关关系, 对个别性状的改良和选择可能会弱化其他性状[2], 因此, 基于多性状的品种选择是作物育种领域长期面临的重要挑战之一[2-3]。单性状淘汰和多性状指数选择是解决这个问题的主要办法[4-6]。单性状淘汰就是为每个目标性状设定淘汰阈值, 保证选择的品种没有明显缺陷[2]。多性状指数选择就是为每个性状设定权重系数, 以加权平均值为综合选择的标准, 使选择的品种具有较高的综合性状水平[4]。在棉纤维品质育种和质量检验实践中同样需要对品质性状赋予不同的权重系数, 建立综合选择指数[7-8], 但由于选择指数中目标性状的取舍和权重赋值常具有很强的主观性和经验性, 基于不同选择指数的综合评价结果缺少可比性和通用性, 难以在实践中普遍推广应用[9]。棉纤维的商品价值是联系纤维质量与成纱质量的纽带, 也是联系棉花种植业和棉纺业的桥梁。基于棉纤维性状对皮棉商品价值的实际贡献率建立纤维品质综合评价指数, 必然具有更好的普适性和科学性。另一方面, 双标图方法近年来被广泛地用于分析多性状数据, 以更加直观地分析和展示性状间的互作模式[9-10]。其中, 品种×性状(genotype by trait, GT)双标图主要用于直观展示目标性状间的相关关系[6,11], 但并不适用于棉花纤维品质的多性状综合评价[4,12]。品种×产量-性状组合(genotype by yield×trait, GYT)双标图主要用于分析产量与性状的组合水平, 适用于包含产量在内的品种多性状综合选择和评价[4,12], 但也不适合进行纤维品质性状的综合评价。性状加权的GT (weighted genotype by trait, WGT)双标图方法可用于多性状综合评价和选择。本研究采用2019—2021年期间中国纤维质量监测中心在主产棉区新疆的棉纤维质量抽检数据基于性状对价格指数的贡献率构建和验证棉花纤维质量指数模型, 并采用WGT双标图方法对质量指数进行可视化分析和展示, 从而为棉花质量的科学评价和棉花产业高质量发展提供理论支持和应用范例。
2019—2021年期间中国纤维质量监测中心开展了新疆棉花质量监测专项行动, 对棉花生产、收购和加工环节进行全过程质量监测, 在新疆阿克苏、阿拉尔、巴州、博州、哈密、石河子、塔城、图木舒克和五家渠等9个主产棉区的27家棉花加工企业棉花加工的大垛、籽清后轧花前、轧花后气流皮清前和气流皮清后锯齿皮清前等4个主要环节对棉花进行取样检验, 并结合棉纤维质量公检数据对棉花质量进行适时监测。2019—2021年共抽检有效纤维样品105,974个, 数据涉及52个棉花主栽品种在各棉花加工企业各抽样环节的纤维长度、整齐度、比强度、马克隆值、颜色级值、反射率和黄度等品质指标。其中, 2019、2020和2021年的抽样数量分别为13,668个、58,447个和33,859个。
依据逐步回归模型确定的性状指标和权重系数构建纤维综合评价指数(comprehensive evaluation index, CEI), 体现各纤维性状的综合水平, 数值越大, 则综合纤维品质越好; 以标准化数据加权性状间的标准差为纤维性状协调指数(trait consistency index, TCI), 表达各性状的协调水平, 数值越小, 则品质性状间的协调性越好; 以CEI与CEI最大值的差异及协调指数加权平方根为离优度指数(distance to the ideal genotype, DTI), 数值越小, 则品质越理想; 将离优度指数[0, 1]化, 并转化为数据越大质量越好, 就形成了纤维质量指数(fiber quality index, FQI), 以同时表达纤维品质的综合水平和纤维性状间的协调水平。计算公式如下:
纤维综合评价指数,
纤维性状协调指数,
离优度指数,
纤维质量指数,
式中, CEI是品种的综合评价指数, T是品种性状的观察值,w是性状的权重,是性状数量, TCI是品种的纤维协调指数, DTI是品种的离优度指数, CEImax和DTImax分别为纤维综合评价指数和离优度指数的最大值,w和w分别为纤维综合评价指数和性状协调指数在构成纤维质量指数的权重系数(公式(3)中设w=w=1, 但在具体应用中可依据需求调节)。
依据2019—2021年纤维质量监测中抽检的52个棉花主栽品种纤维长度、整齐度、比强度、马克隆值、颜色级和价格指数等主要性状表现(表1), 构建品种×性状(GT)双标图[10,14], 分析纤维品质性状的相关模式。GT双标图中各纤维性状向量间的夹角大小表示性状间相关性, 夹角越小, 则相关性越强[10,14]。加权的GT (weighted genotype by trait, WGT)双标图是在GT双标图的基础上对性状加权后得到的双标图。在WGT双标图的“均值-稳定性”功能图[3]中, 平均性状轴(average trait axis, ATA)指向纤维综合评价指数大的方向; 通过原点垂直于ATA轴的纵轴(average trait coordinate, ATC)指向纤维协调性差的方向, 越接近于ATA轴, 则协调性越好。各品种ATC轴坐标的绝对值与协调指数成比例, ATC轴坐标的符号表达品种与性状的互作关系, 品种在性状向量上的投影大小表达了其正向互作的大小。因此, ATC轴不仅表达了品种的协调性, 还表达了各品种与性状的互作模式。在WGT双标图的“理想品种”功能图[3]中, 各品种图标到“理想品种”的距离代表了离优度指数, 距离越小, 则纤维质量指数越好。采用统计软件GGE biplot (http://www. ggebiplot.com/)的WGT双标图功能进行加权的GT双标图分析。
基于WGT双标图的前2个主成分(PC1和PC2)得分计算品种图标间的欧氏距离, 采用类平均法(UPGMA)进行品种相似性聚类分析[15], 并在WGT双标图中展示各品种分类与纤维品质性状的互作模式, 以直观分析和展示各品种类型的纤维特征。同时, 对各品种纤维类型的标准化数据进行方差分析和多重比较(LSD法), 以分析各品种类型的具体纤维性状特征及其差异显著性。
由棉花品种与纤维品质性状二维表构建的GT双标图前2个主成分解释了总变异的70.2%, 较好地表达了纤维品质性状的相关性, 以及品种与性状的互作关系。由图1可知, (1) 纤维长度、整齐度和比强度形成一个向量群, 马克隆值与颜色级值形成另一个向量群, 2个向量群的性状间相关性较弱, 向量群内的性状表现为显著正相关。(2) 棉花价格指数与“纤维长度、整齐度和比强度”向量群之间呈正相关, 与“马克隆值与颜色级值”向量群之间呈负相关。(3) 图1也展示了品种的主要纤维特性。例如, 新陆中64 (代码G35)的价格指数、纤维长度、比强度和整齐度表现优秀, 而马克隆值和颜色级表现较差; 中棉113 (G51)的纤维长度、比强度和整齐度表现优秀, 而价格指数、马克隆值和颜色级表现一般; 神牛17 (G12)、神牛18 (G13)、新陆早80 (G27)和新陆中58 (G33)等品种的纤维长度、比强度和整齐度表现较差。由表2可知, 价格指数与纤维长度、整齐度、比强度呈极显著正相关, 与颜色级和马克隆值呈极显著或显著负相关; 纤维长度、整齐度和比强度之间的相关性均达极显著水平; 颜色级和马克隆值均与价格指数显著负相关, 而与其余性状相关不显著。可见, 棉纤维性状之间存在着复杂的有利或不利相关关系, 各性状对综合评价的作用也不同, GT双标图可以大致表达纤维性状间的关系和品种的品质特性, 却很难对品种纤维品质进行综合评价和选择。
表1 2019–2021年新疆棉花质量监测抽检棉花品种纤维性状表
(续表1)
LEN: 纤维长度; UNI: 整齐度; STR: 比强度; MIC: 马克隆值; COL: 颜色级; CPI: 价格指数; CEI: 纤维综合评价指数; TCI: 性状协调指数; FQI: 纤维质量指数; TYPE: 品种纤维品质聚类。
LEN: fiber length; UNI: fiber uniformity; STR: strength; MIC: micronaire value; COL: fiber color garade; CPI: cotton price index; CEI: the comprehensive evaluation index; TCI: trait consistency index; FQI: fiber quality index; TYPE: cultivar cluster type of fiber quality.
为确定棉纤维质量综合评价的重要性状和权重,在2019—2020年抽检的72,115个纤维样品中随机抽取10个样本(样本容量7211个或7212个), 各样本数据标准化后采用逐步回归方法分别建立纤维品质性状与价格指数的回归模型, 并以2021年抽取的33,859个样品数据的价格指数为观测值对回归模型的预测精确度进行验证。结果表明, (1) 纤维长度、整齐度、比强度、马克隆值和颜色级为逐步回归分析的入选因子, 回归系数均达到极显著水平, 而其余品质性状均未达到显著水平, 各模型入选性状的标准回归系数及模型验证结果列于表3。(2) 10个回归模型的精确度都很高, 决定系数都在0.93**以上, 均方差根和观察值均值的百分比接近10%。(3) 各模型入选性状的标准回归系数十分接近, 纤维长度、整齐度、比强度、马克隆值和颜色级的平均标准回归系数分别为0.451、0.173、0.285、-0.117和-0.526。10个回归模型的入选因子相同, 标准回归系数接近, 重复性好, 故以模型入选因子为纤维综合评价的主要性状, 以平均标准回归系数为各性状在综合评价指数中的权重系数。
图1 2019–2021年新疆棉花质量抽检棉花品种纤维性状的GT双标图
LEN: 纤维长度; UNI: 整齐度; STR: 比强度; MIC: 马克隆值; COL: 颜色级; CPI: 价格指数。大写字母G后面的数字为品种编号, 品种名称同表1。
LEN: fiber length; UNI: fiber length uniformity; STR: fiber strength; MIC: micronaire value; COL: fiber color grade; CPI: cotton price index. The uppercase G followed by the numbers represents variety codes. Abbreviation of variety names are the same as those given in Table 1.
表2 2019–2021年新疆棉花质量抽检棉花品种纤维性状相关性分析
*和**分别表示在0.05和0.01概率水平显著相关,ns表示相关不显著。
*and**indicate significant correlation at the 0.05 and 0.01 probability levels, respectively.ns: not significant.
表3 纤维品质性状与价格指数逐步回归模型构建与验证
LEN: 纤维长度; UNI: 整齐度; STR: 比强度; MIC: 马克隆值; COL: 颜色级。**表示决定系数在0.01概率水平差异显著。
LEN: fiber length; UNI: fiber length uniformity; STR: fiber strength; MIC: micronaire value; COL: fiber color grade.**indicates significant determination coefficient at the 0.01 probability level.
依据逐步回归模型确定的性状指标和权重系数构建的纤维综合评价指数模型、纤维性状协调指数模型和纤维质量指数模型, 52个抽检品种纤维品质的综合评价指数列于表1。结果表明, (1) 由各品种的纤维综合评价指数(CEI)可知, 抽检品种的新陆中64综合纤维品质表现突出, 中棉113、新陆早78、新陆中40、新陆中75、兆丰28、巴43541、鲁泰19-1和新陆中66等品种综合表现优良, 而新陆早67、新陆早54、酒棉18号、新陆中78、新陆中68、新陆中70和天丰67等品种综合纤维品质表现较差。(2)由各品种的纤维性状协调指数(TCI)可见, 新陆中81、新陆中73、新陆中87、金垦108、瑞杂818、天丰67、瑞杂820、新陆中70、新陆早84、中棉96A和17-68等品种的纤维性状协调性较好, 而神牛18、神牛17、兆丰28、新陆中58、新陆中40、中棉113和新陆早42等品种的纤维性状协调性较差, 其余品种表现一般。(3) 由各品种的纤维质量指数(FQI)可见, 新陆中64、新陆早78和中棉113的综合纤维质量表现最好, 新陆中75、新陆中40、巴43541、兆丰28、新陆中66、鲁泰19-1、新陆中71和新陆中85的综合纤维质量表现较好, 而新陆早67、新陆早54、酒棉18号和新陆中78的综合纤维质量表现最差, 新陆中68、新陆中70、天丰67、神牛18、J8031、神牛17和金垦108的综合纤维质量表现较差。
由于GT双标图可以表达纤维性状间的关系, 却不能对品种纤维品质进行综合评价, 而基于纤维质量指数可以对品种的纤维质量进行综合评分, 但不直观展示性状间的互作模式。WGT双标图可直观地对品种纤维品质进行综合评价。由图2-a可知, (1) 基于新疆棉花质量抽检的品种与纤维性状两向表及权重系数构建的WGT双标图前2个主成分解释了总变异的86.6%, WGT双标图的拟合度比GT双标图提高了16.4%, 更加精确地表达了数据中的模式。(2) 新陆中64 (G35)、中棉113 (G51)、新陆早78 (G26)、新陆中40 (G31)、新陆中75 (G42)和兆丰28 (G50)等品种的综合评价指数较高, 新陆早67 (G23)、新陆早54 (G18)、酒棉18号(G7)、新陆中78 (G43)和新陆中68 (G38)等品种的综合评价指数较差。(3)神牛18 (G13)、神牛17 (G12)、兆丰28 (G50)、新陆中58 (G33)、新陆中40 (G31)、中棉113 (G51)、新陆早42 (G16)和新陆中64 (G35) 等品种的性状协调性较差, 新陆中81 (G45)、新陆中73 (G41)、新陆中87 (G49)、金垦108 (G6)、瑞杂818 (G10)、天丰67 (G15)、瑞杂820 (G11)、新陆中70 (G39)、新陆早84 (G28)、中棉96A (G52)、17-68 (G1)和新陆中78(G43)等品种的性状协调性较好。由图2-b可知, (1) 新陆中64 (G35)与理想品种的距离最近, 其纤维质量指数最好; 新陆中64 (G35)、新陆早78 (G26)、新陆中66 (G36)、新陆中85 (G48)、巴43541 (G4)、新陆中75 (G42)、新陆中40 (G31)、兆丰28 (G50)和中棉113 (G51)等品种的纤维质量指数较好; 神牛18 (G13)、新陆早67 (G23)、新陆早54 (G18)、神牛17 (G12)、新陆中78 (G43)、酒棉18号(G7)、新陆中68 (G38)和新陆中70 (G39)等品种的纤维质量指数较差。(2) WGT双标图也表达了品种与性状的关系, 品种在性状向量上的投影大小表达了其正向互作的大小。例如, 中棉113 (G51)的纤维长度、比强度和整齐度表现好, 而颜色级性状表现较差; 神牛18 (G13)的纤维长度、比强度和整齐度表现差, 而颜色级性状表现较好。可见, WGT双标图与GT双标图相比解释的变异比例更大, 双标图模型拟合度更高, 结果也更加可靠。WGT双标图“均值-稳定性”功能图和“理想品种”功能图很好地直观表达了棉花品质综合指数、性状协调性指数和质量指数, 同时也表达了品种与性状的互作关系, 更适用于品种纤维品质的多性状直观表达和综合评价。
图2 棉花品种纤维性状WGT双标图的“均值-稳定性”功能图(a)和“理想品种”功能图(b)
LEN: 纤维长度; UNI: 整齐度; STR: 比强度; MIC: 马克隆值; COL: 颜色级。大写字母G后面的数字为品种编号, 品种名称同表1。性状图标括号中的数据为权重, 如LEN (0.451)表示纤维长度的权重为0.451。PC1相当于综合评价指数(CEI), PC2的绝对值相当于性状协调指数(TCI)。图2-b中的同心圆圆心为理想品种坐标, 品种图标到圆心的欧氏距离表示离优度指数DTI, 距离越小则纤维质量指数越好。
LEN: fiber length; UNI: fiber length uniformity; STR: fiber strength; MIC: micronaire value; COL: fiber color grade. The capital G followed by numbers represents variety codes. Variety names are the same as those given in Table 1. The weight assigned to each trait is indicated in the parentheses. For example, LEN (0.451) indicates that the weight for fiber length is 0.451. The axes were rotated such that PC1 corresponds to the comprehensive evaluation index (CEI) and the absolute value of PC2 corresponds to the trait consistency index (TCI). The origin of concentric circles in Fig. 2-b is the ideal variety mark, and the Euclidean distance from the variety mark to the origin represents the distance to the ideal variety (DTI). The smaller the distance, the better the fiber quality index.
采用WGT双标图分析了棉花质量抽检品种主要性状的空间关系, 并基于WGT双标图中品种间欧氏距离采用类平均法进行品种聚类分析, 各品种的分类结果列于表1, 同时在WGT双标图中用椭圆形区域标识(图3)各品种的类型(I型、II型、III型和IV型), 以直观展示品种的品质类型。由图3可知, 52个棉花质量抽检品种可划分为4个差异显著的品种类型, 其中I型品种包括17-68 (G1)、新陆早78 (G26)、新陆中40 (G31)、新陆中64 (G35)、新陆中66 (G36)、巴43541 (G4)、新陆中75 (G42)、兆丰28 (G50)、鲁泰19-1 (G8)和鲁泰19-2 (G9)等10个品种; II型品种包括瑞杂820 (G11)、神牛17 (G12)、神牛18 (G13)、新陆早80 (G27)、新陆中58 (G33)、新陆中62 (G34)、新陆中67 (G37)、新陆中87 (G49)和冀杂708 (G5)等9个品种; IV型品种包括塔河2号(G14)、新陆早42 (G16)、新陆早49 (G17)、J206-5 (G2)、新陆早71 (G24)、新陆中71 (G40)、新陆中84 (G47)、新陆中85 (G48)和中棉113 (G51)等9个品种; 其余24个品种为III型(表1)。
各品种类型的性状间差异显著性检测结果列于表4。I型品种综合纤维品质性状表现最好, 其纤维长度、整齐度和比强度略差于IV型品种, 但差异不显著; 颜色级、价格指数、综合评价指数和纤维质量指数显著好于其余品种类型; 马克隆值表现中等, 与其余品种类型差异均不显著; 性状协调指数表现中等, 显著差于III型品种, 与其余品种类型差异不显著。II型品种的纤维长度、整齐度、比强度和纤维质量指数显著差于其他品种类型; 马克隆值、颜色级、价格指数、综合评价指数和性状协调指数表现中等。III型品种的性状协调指数表现最好, 显著优于其他类型品种; 纤维长度、整齐度和比强度表现中等; 马克隆值、颜色级、价格指数、综合评价指数、性状协调指数和纤维质量指数表现最差。IV型品种的纤维长度、整齐度、比强度和马克隆值表现最好, 价格指数、综合评价指数、性状协调指数和纤维质量指数表现中等, 而颜色级表现最差。总之, I型品种的纤维综合表现最好; II型品种综合表现较差; III型品种性状协调指数表现最好, 其余性状表现差; IV型品种颜色级表现差, 其余性状表现较好。
图3 棉花品种纤维性状WGT双标图的“品种聚类”功能图
椭圆形虚线所包围的品种为同一品种类型。I、II、III和IV表示品种类型。大写字母G后面的数字为品种编号, 品种名称同表1。性状缩写同图1。
The varieties surrounded by the oval dotted line are of the same breed type I, II, III, and IV stand for the four variety types, respectively. The uppercase G followed by the numbers represents variety code. Abbreviation of variety names are the same as those given in Table 1. Abbreviations of traits are the same as given in Fig. 1.
表4 基于WGT双标图分析的棉花质量抽检品种的纤维性状分类特征
同一行中标有相同小写字母的数据在0.05水平差异不显著。Mean±SE为相应品种类型的平均值和标准误。
Different lowercase letters in the same row indicate significantly different at the 0.05 probability level. The mean±SE stands for the mean and standard error.
随着我国棉花生产形势的变化和现代纺织工业对棉纤维适纺性能不断提高的需求, 在对主产棉区棉花纤维品质指标广泛抽样分析的基础上, 对主要纤维指标及其协调性科学赋权, 建立通用的纤维综合评价指数, 将有利于全面、客观和适时地评价我国棉花纤维的总体质量水平, 有利于科学引导棉花纤维品质遗传育种方向, 从而促进国内棉花产业高质量发展和国际市场竞争力的提升[16]。基于多性状的品种选择指数由于目标性状的选择和权重赋值通常具有很强的主观性, 很难在实践中推广应用[7-8]。Blanche和Myers[8]提出的棉花品种选择指数分别赋予棉花产量和纤维长度60%和40%的权重, 但未包括比强度和马克隆值等其他重要的纤维品质性状。Baxevanos等[7]构建的棉花品种选择指数仅赋予比强度和纤维长度10%的权重, 赋予整齐度和伸长率5%的权重, 其性状选择与权重分配不尽合理。许乃银和李健[9]依据我国棉花品种审定标准建立的纤维品质性状选择指数分别赋予纤维长度、比强度和马克隆值28.5%、43%和28.5%的权重, 该选择指数的性状和权重依据国家级棉花审定标准确定, 在棉花品质育种上适用性较好, 但与棉花的品级及商品价格无关, 不能体现各纤维品质性状对棉花商品价值的贡献。作为大宗农业经济作物, 棉花纤维质量的综合水平必然体现在其最终纤维产品的商品价值上, 综合评价指数构建的性状选择和权重分配应当以纤维品质性状对终端产品商品价值的实际贡献率为基础。本研究基于中国纤维质量监测中心于2019— 2021年在棉纤维质量监测行动中抽检的105,974个纤维样品监测数据, 采用逐步回归分析方法, 建立了10个纤维品质性状与价格指数的回归模型, 确定了对棉纤维商品价值具有显著作用的纤维品质性状分别为纤维长度、比强度、整齐度、马克隆值和颜色级, 相应的其标准回归系数(即通径系数)分别为0.451、0.285、0.173、–0.117和–0.526。以逐步回归模型的入选性状及其通径系数作为构成因素和权重赋值建立的综合评价指数对科学评价纤维质量必然更加科学、客观和合理。本研究提出的纤维品质综合评价指数(CEI)就是上述入选性状和权重的加权平均值, 体现了各纤维性状的综合水平, 数值越大, 则综合纤维品质越好。另一方面, 棉纤维的适纺性能除了受纤维性状综合指数影响外, 还受到纤维指标的协调性制约[1]。纤维指标的协调性也就是各项纤维性状水平的相对一致性, 适纺性能受“木桶效应”的影响, 由个别指标突出引起的高综合指数与成纱质量并不成比例。本研究以标准化数据加权性状间的标准差为纤维性状协调指数(TCI), 表达各性状的协调水平,数值越小, 则品质性状间的协调性越好; 将综合评价指数最高, 性状协调指数最低的品种称为“理想品种”, 其余品种与“理想品种”的欧氏距离称为离优度指数(DTI), 数值越小, 则品质越理想; 将离优度指数[0, 1]化, 并转化为数据越大质量越好, 就形成了纤维质量指数(FQI)。本研究提出的纤维质量指数同步考虑了纤维的多性状加权综合评价指数和性状间的协调指数, 并可对纤维综合指标及其协调性赋权, 可以全面、客观和适时地评价我国棉花纤维的总体质量水平, 有利于引导国内棉花质量的发展方向。
由于棉花纤维质量受到多个纤维品质性状的共同影响, 性状间存在着复杂的相互制约的相关关系[4], 纤维质量指数可以表达纤维的综合质量水平, 但难以体现纤维性状间的关系, 以及品种与性状的互作模式。基于品种´性状二维表构建的GT双标图[10,14], 可用于直观表达纤维性状间的相关模式。GT双标图是在对品种´性状数据表奇异值分解的基础上[17], 将品种和性状的前2个主成分(PC1和PC2)得分进行奇异值分配和定标处理后作为坐标做出的散点图。GT双标图中各性状向量的夹角表示性状相关性大小, 夹角越大, 则相关性越弱[10,14]。由于GT双标图中性状向量的方向可能指向有利的方向, 也可能指向相反的方向, 同时不能对性状进行加权赋值, 因此GT双标图无法对品种纤维品质进行综合评价, 也不能表达纤维质量指数。GYT双标图方法是对GT双标图的改良, 可以同步反映产量与性状的组合水平, 适用于包含产量在内的品种多性状综合选择和综合评价[2,4,12], 但不适合进行纤维品质性状的综合评价。为了实现纤维质量指数的可视化分析, 本研究采用WGT双标图方法, 通过数据转换和性状加权的方法, 使数据转换为越大越好的方向, 并用加权平均值表达纤维性状综合水平。在WGT双标图的“均值-稳定性”功能图[3]中, 平均性状轴(ATA)指向纤维综合评价指数大的方向; 通过原点垂直于ATA轴的纵轴(ATC)指向纤维协调性差的方向, 越接近于ATA轴, 则协调性越好, 各品种ATC轴坐标的绝对值与协调指数成比例, ATC轴坐标的符号表达与性状的互作关系, 品种在性状向量上的投影大小表达了其正向互作的大小。在WGT双标图的“理想品种”功能图[3]中, 各品种图标到“理想品种”的距离代表了离优度指数, 距离越小, 则纤维质量指数越好。WGT双标图可以全面表达了纤维品质综合评价指数、性状协调指数和纤维质量指数, 从而实现对纤维质量指数的可视化分析, 可以直观地对品种进行选择和聚类分析。在WGT双标图分析的基础上, 本研究将2019—2021年纤维质量监测抽检涉及的52个棉花主栽品种依据其纤维特性划分为4个差异显著的品种类型, 从而为棉花纤维质量抽检品种的综合评价和合理利用提供理论依据和决策支持。
采用逐步回归分析的方法, 确定了纤维综合评价指数的构成因子及权重赋值, 构建了纤维品质综合评价指数、性状协调指数和纤维质量指数, 依据质量指数对抽检的52个品种质量进行了综合评价。用WGT双标图实现对纤维品质综合评价指数、性状协调指数和纤维质量指数的可视化分析, 并将纤维质量监测抽检涉及的棉花品种划分为特征明显的4个品种类型。
[1] 唐淑荣, 杨伟华. 我国主产棉省纤维品质现状分析与建议. 棉花学报, 2006, 18: 386–390.
Tang S R, Yang W H. Status and analysis of cotton fiber quality distribution in China and suggestions., 2006, 18: 386–390 (in Chinese with English abstract).
[2] 严威凯. 品种选育与评价的原理和方法评述. 作物学报, 2022, 48: 2137–2154.
Yan W K. A critical review on the principles and procedures for cultivar development and evaluation., 2022, 48: 2137–2154 (in Chinese with English abstract).
[3] Yan W K. A systematic narration of some key concepts and procedures in plant breeding., 2021, 12: 724517.
[4] Yan W K, Frégeau-Reid J. Genotype by yield × trait (GYT) biplot: a novel approach for genotype selection based on multiple traits.(UK), 2018, 8: 8242.
[5] Yan W K, Frégeau-Reid J. Breeding line selection based on multiple traits., 2008, 48: 417–423.
[6] Xu N Y, Fok M, Li J, Yang X N, Yan W K. Optimization of cotton variety registration criteria aided with a genotype-by-trait biplot analysis.(UK), 2017, 7: 17237.
[7] Baxevanos D, Goulas C, Rossi J, Braojos E. Separation of cotton cultivar testing sites based on representativeness and discriminating ability using GGE biplots., 2008, 100: 1230–1236.
[8] Blanche S B, Myers G O. Identifying discriminating locations for cultivar selection in Louisiana., 2006, 46: 946–949.
[9] 许乃银, 李健. 棉花区试中品种多性状选择的理想试验环境鉴别. 作物学报, 2014, 40: 1936–1945.
Xu N Y, Li J. Identification of ideal test environments for multiple traits selection in cotton regional trials., 2014, 40: 1936–1945 (in Chinese with English abstract).
[10] 严威凯. 双标图分析在农作物品种多点试验中的应用. 作物学报, 2010, 36: 1805–1819.
Yan W K. Optimal use of biplots in analysis of multi-location variety test data., 2010, 36: 1805–1819 (in Chinese with English abstract).
[11] Yan W K. Crop Variety Trials: Data Management and Analysis. New York: John Wiley & Sons, 2014. pp 163–186.
[12] 许乃银, 赵素琴, 张芳, 付小琼, 杨晓妮, 乔银桃, 孙世贤. 基于GYT双标图对西北内陆棉区国审棉花品种的分类评价. 作物学报, 2021, 47: 660–671.
Xu N Y, Zhao S Q, Zhang F, Fu X Q, Yang X N, Qiao Y T, Sun S X. Retrospective evaluation of cotton varieties nationally registered for the Northwest Inland cotton growing regions based on GYT biplot analysis., 2021, 47: 660–671 (in Chinese with English abstract).
[13] Michele R, Nicola L, Zina F. Evaluation and application of the OILCROP-SUN model for sunflower in southern Italy., 2003, 78: 17–30.
[14] Yan W K, Kang M S, Ma B, Woods S, Cornelius P L. GGE biplot vs. AMMI analysis of genotype-by-environment data., 2007, 47: 643–655.
[15] Adugna W, Labuschagne M T. Cluster and canonical variate analyses in multilocation trials of linseed.(Cambridge), 2003, 140: 297–304.
[16] Robert L L, Michael P B, Stuart G G, Marinus H J, Geoffrey R S N, Greg A C. Fiber quality and textile performance of some Australian cotton genotypes., 2010, 50: 1509–1518.
[17] Yan W K. Singular-value partioning in biplot analysis of multienvironment trial data., 2002, 94: 990–996.
Construction of cotton fiber quality index and weighted genotype by trait (WGT) biplot analysis
XU Nai-Yin1, WANG Yang2, WANG Dan-Tao2, NING He-Jia2, YANG Xiao-Ni1, and QIAO Yin-Tao1
1Institute of Industrial Crops, Jiangsu Academy of Agricultural Sciences, Nanjing 210014, Jiangsu, China;2China Fiber Quality Monitoring Center, Beijing 100007, China
Cotton fiber quality is determined by multiple fiber traits. Construction of a cotton fiber evaluation index is important for comprehensive and objective evaluation of cotton cultivars for their fiber quality. A cotton fiber quality index model was constructed based on the cotton fiber quality monitoring data collected by the China Fiber Quality Monitoring Center in the main cotton producing regions in Xinjiang during 2019–2021, and a weighted genotype by trait (WGT) biplot method was developed for visual evaluation of cotton cultivars for their fiber quality index (FQI) and trait profile. The results showed that (1) The key traits and assigned weights were fiber length (weight = 0.451, the same below), uniformity (0.173), strength (0.285), micronaire value (–0.117) and color grade ordination (–0.526), respectively. (2) The FQI was constructed based on fiber comprehensive evaluation index (CEI) and fiber trait consistency index (TCI), and the cotton cultivars classified as having superior FQI included Xinluzhong 64, Xinluzao 78, and Zhongmian 113, while Xinluzao 67, Xinluzao 54, Jiumian 18, and Xinluzhong were identified as poor in FQI. (3) WGT biplot was developed and used to graphically display the fiber quality comprehensive evaluation index, trait consistency index, and fiber quality index. (4) 52 cotton varieties sampled in the fiber quality monitoring action were clustered into four variety type groups. Cluster I was the best in almost all fiber traits, while cluster II was the worst in most traits. Cluster III showed best performance in fiber trait consistency index, but poor in other traits or indexes. Cluster IV was high in fiber color grade but low in other aspects. The methods and results reported in this research will provide a theoretical support for the construction of nationwide cotton fiber quality index model and serve as a model for other crops kinds.
cotton (L.); fiber quality index (FQI); genotype by trait (GT) biplot; weighted genotype by trait (WGT) biplot; stepwise regression analysis; clustering analysis
10.3724/SP.J.1006.2023.24118
本研究由中国纤维质量监测中心项目(ZQJ4-2021-040)资助。
This study was supported by the Project from China Fiber Quality Monitoring Center (ZQJ4-2021-040).
E-mail: naiyin@126.com
2022-05-13;
2022-09-05;
2022-09-13.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20220909.1831.002.html
This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).