许乃银 赵素琴 张 芳 付小琼 杨晓妮 乔银桃,5 孙世贤
基于GYT双标图对西北内陆棉区国审棉花品种的分类评价
许乃银1赵素琴2张 芳3付小琼4杨晓妮1乔银桃1,5孙世贤3
1江苏省农业科学院经济作物研究所 / 农业农村部长江下游棉花与油菜重点实验室, 江苏南京 210014;2新疆维吾尔自治区种业发展中心, 新疆乌鲁木齐 830006;3全国农业技术推广服务中心, 北京 100125;4中国农业科学院棉花研究所, 河南安阳 455000;5江苏大学农业工程学院, 江苏镇江 212013
西北内陆棉区是我国最重要的主产棉区, 对该棉区历年国审棉花品种进行科学分类和综合评价有利于国审品种资源的合理利用和棉花生产效率的提升。本研究采用GYT双标图分析对2003—2019年期间西北内陆棉区37个国审棉花品种的产量与霜前花率、纤维长度、比强度、马克隆值、枯萎病指数和黄萎病指数等性状的组合水平进行了综合分析和品种分类评价。结果表明, 西北内陆棉区37个国审棉花品种可划分为3个特征明显的品种类型。其中, I型品种包括新陆早13号、中棉所49、新陆早21号、巴13222、新46、天云0769、Z1112、新石K18、J206-5、新石K21、禾棉A9-9、创棉508、H33-1-4、金科20、新K28、创棉512和J8031等17个品种, 是产量与其余性状组合协调最好的品种类型, 在生产上推广应用价值最高。II型品种产量和纤维品质表现一般, 抗病性差, 在当前生产上应用价值有限。III型品种的抗枯萎病性表现最好, 但在其余性状上表现略差, 综合生产应用价值有限, 也许可作为抗病亲本应用。同时, 根据各品种的理想指数筛选出创棉512、J8031、新K28、H33-1-4、金科20、新陆早13号和创棉508等综合表现优良的品种, 也鉴别出新陆棉1号、新陆早33号、创棉501号和新陆早51号等综合表现相对略差的品种。本研究采用的GYT双标图分析方法是基于“产量-性状”组合水平对品种进行综合评价和分类研究, 产量-性状组合之间的相关关系更加简单, 多数组合间表现显著正相关, 更适用于品种的多性状直观选择和综合评价, 通常比先前的GT双标图解释的变异比率高, 双标图模型拟合度更好, 结果更可靠。本研究采用GYT双标图分析方法对西北内陆棉区国审品种的分类研究揭示了该棉区国审棉花品种的分类特征和应用价值, 为本区的国家棉花品种试验审定提供了借鉴, 也为其他作物品种的类似研究提供了范例。
棉花(L.); 品种审定; 品种分类; 多性状; GT双标图; GYT双标图; 西北内陆棉区
基于多性状的农作物品种选择和评价是育种领域长期面临的主要挑战之一[1], 原因是目标性状之间存在着复杂的相互制约的遗传相关关系[2], 对一个性状的改良可能会导致其他一个或几个性状的变化甚至弱化, 从而增加了品种选育的难度。棉花育种尽管在理论上可以针对产量、纤维品质和抗病性状, 开展专门的产量育种、品质育种或抗病育种等工作, 但在棉花育种和品种审定的实践中必须同步对产量、品质、早熟性和抗病性等多个目标性状进行综合选择和评价[3-4]。自新中国成立以来西北内陆棉区共有39个棉花品种通过国家审定, 为国家棉花生产水平的提升做出了重要贡献。对西北内陆棉区历年国家审定品种进行科学评价和分类研究, 有助于全面评估西北内陆棉区国审品种的分类特征和应用价值, 为与时俱进地制定更具针对性和实用性的棉花品种评价和审定策略提供理论依据, 并对科学利用国审品种资源提升西北内陆及全国棉花生产力水平起到促进作用。近年来, 品种-性状(genotype by trait, GT)双标图被广泛地用于基于多性状的品种分类评价[5]、直观展示目标性状间的相关关系[5-6]、揭示品种与性状的互作特点[7-8], 但并不适用于品种的多性状综合评价。另一方面, 作物丰产性是品种多性状选择和评价的前提和基础, 品种选育和审定工作中对主要目标性状的改良和评价都应当建立在丰产性的基础上[9-10], 离开丰产性对其他性状的选择只能是舍本求末, 所选择的材料或许可作为育种亲本, 但不适合作为品种审定和推广应用。最近, Yan和Frégeau-Reid[2]研发的品种×产量-性状组合(genotype by yield×trait,GYT)双标图方法是对GT双标图的改良, 可以基于产量与性状组合对产量和重要目标性状进行同步选择和综合评价, 更适用于品种的多性状综合选择、品种分类和综合评价, 具有更强的实用性和科学性。目前, 基于GYT双标图对棉花品种的分类研究和多性状评价尚未见报道。本研究首先采用GT双标图方法[11]对2003—2019年期间西北内陆棉区37个国审棉花品种的产量性状、早熟性状、纤维品质性状和抗病性状间的相关关系及品种与性状的互作特征进行分析, 然后基于GYT双标图对品种进行多性状综合评价和分类研究, 以西北内陆棉区国审棉花品种为例示范GYT双标图分析方法在品种多性状评价中的作用, 从而揭示西北内陆棉区国审棉花品种的分类特征和应用价值, 以期为科学制定棉花品种审定指标和品种生产应用决策提供理论支持。
我国自1956年开始在黄河流域、长江流域和西北内陆等大棉区统一规划国家棉花品种区域试验, 并于1990年开始国家级棉花品种审定工作[5]。西北内陆棉区于1990年首批通过国审的棉花品种新海3号和新陆早1号, 在生产上得到了大面积的推广应用, 其后于2003—2019年期间通过国审的棉花品种共37个。由于早期审定的品种新海3号和新陆早1号缺少纤维品质和抗病性数据记录, 故本研究依据国家品种审定公告内容, 采用了2003—2019年期间西北内陆棉区37个国审棉花品种的主要目标性状数据, 包括皮棉产量增产率(简称皮棉产量)、霜前花率、纤维长度、比强度、马克隆值、枯萎病指数和黄萎病指数, 各品种的主要目标性状列于表1, 其中皮棉产量、霜前花率、纤维长度、比强度和马克隆值为连续2年10~18个单点试验的平均值, 枯萎病指数和黄萎病指数为2年病圃鉴定的最大值。
依据2003—2019年期间西北内陆棉区37个国审棉花品种的皮棉产量增产率、霜前花率、纤维长度、比强度、马克隆值、枯萎病指数和黄萎病指数等主要性状表现(表1), 构建品种×性状(genotype by trait, GT)双标图[12-13], 分析性状间的相关性及其与品种的互作模式。GT双标图的制作首先对标准化的品种×性状数据表进行奇异值分解[14](“Scaling = 1, Centering = 2”), 将品种和性状的前2个主成分(PC1和PC2)得分进行聚焦于性状的奇异值分配(“SVP = 2”)和定标处理后作为横坐标和纵坐标作出二维散点图, 即形成GT双标图。连接原点到性状图标的向量, 即形成GT双标图的性状间关系功能图(图1-a), 各性状向量间的夹角大小表示性状间的相关性, 夹角越小相关性越强[12-13], 品种到某性状向量的投影距离表示品种在该性状上的相对数值大小。GT双标图和GYT双标图分析均在GGEbiplot 软件平台上完成。
品种×产量-性状组合(genotype by yield×trait, GYT)双标图是基于品种和产量与性状乘积标准化数据版本的“GT双标图”[2]。西北内陆棉区国审棉花品种GYT双标图分析具体包括如下几个简单的步骤: (1)将品种×性状表(GT表)转化为GYT表, 在GYT表中列出产量-性状组合的乘积, 并对性状数据进行必要的转化, 使每个产量-性状组合的数据都是越大越好。对于霜前花率、纤维长度和比强度等数值越大越好的性状, 其产量-性状组合可用产量×性状(Y×Trait)表示, 如Y×LEN表示产量与纤维长度乘积。对于枯萎病指数和黄萎病指数等数值越小越好的性状, 数据转化方式为“转化后的数据=最大值+最小值–原数据”, 并用产量×性状加后缀(-1)表示, 如Y×FWI (-1)表示产量与枯萎病指数乘积, 经数据转化后数据越大越好。马克隆值与其他性状不同, 其数据在3.7~4.2之间为最好(中心值为3.95)[15], 离此区间越远的数据越差, 适合的数据转化方式为“转化后的数据=最大值-|原数据-3.95|”, 并用Y×MIC (~1)表示产量与马克隆值组合经数据转化后向量指向理想值方向。(2)对GYT表进行数据标准化。对各产量-性状组合数据进行标准化, 并将各产量-性状组合标准化数据的平均值定义为品种理想指数(superiority index, SI), 用以评价品种的综合表现[2]。(3)基于标准化GYT数据表构建GYT双标图的原理与GT双标图基本相同, 只是用“产量-性状组合”或“产量×性状”替换了GT双标图中的“性状”, 同时经数据转换后所有产量-性状组合向量都指向数据越大越好的方向, 从而可直观地分析产量-性状组合的相关性、对品种进行综合评价和品种与产量-性状组合的互作模式。
表1 2003-2019年我国西北内陆棉区37个国审棉花品种主要性状表
(续表1)
表中的枯萎病指数和黄萎病指数为2年病圃鉴定的最大值, 其余性状值为10~18个单点试验的平均值。RY: 审定年份; YLD/CK: 皮棉增产率; PFR: 霜前花率; LEN: 纤维长度; STR: 比强度; MIC: 马克隆值; FWI: 枯萎病指数; VWI: 黄萎病指数; SI: 品种理想指数; TYPE: 品种基于GYT双标图前2个主成得分聚类的品种类型。
Each value is the mean across 10–18 location-years for all traits except fusarirum wilt index (FWI), verticillium wilt index (VWI), for which each value is the maximum value collected from inoculated nurseries in successive two years. RY: registration year; YLD/CK: lint cotton yield relative to check; PFR: pre-frost yielding rate; LEN: fiber length; STR: fiber strength; MIC: micronaire; FWI: Fusarirum wilt index; VWI: verticillium wilt index; SI: cultivar superiority index; TYPE: cultivar type in clustering analysis based on PC1 and PC2 of GYT biplot.
GYT双标图中产量-性状组合之间受共同的产量要素影响总体上趋向于正相关, 负相关的产量-性状组合很少(图1-b)[9]。GYT双标图中产量-性状组合之间普遍正相关的特点, 可建立品种综合评价指数, 并进行直观的品种选择和评价[9-10]。GYT双标图中产量-性状组合就相当于GT双标图中的性状。GYT双标图的平均性状功能图(图2-a)中有2条垂直交叉于双标图原点的轴线, 单箭头为平均产量-性状轴(average trait axis, ATA), 代表各产量-性状组合的平均值, 指向品种理想指数方向, 也就是品种综合表现优秀的方向, 各品种图标在ATA轴上的垂足越趋向于ATA轴的正方向则其综合表现越好, 可据此对品种进行排序[2]; 双箭头线为ATA轴的纵轴(average trait coordinate, ATC), 将品种按综合表现划分为两部分, ATA正方向(右侧)的品种好于所有品种的平均表现, 左侧的品种差于所有品种的平均表现[9]。ATC轴还可以用于衡量品种的性状特征, 在ATC轴上投影短的品种, 其各性状表现都比较好, 各性状表现相对全面和均衡; 而在ATC轴上投影长的品种往往存在某些相对强和/或相对弱的性状。
基于GYT双标图的前2个主成分(PC1和PC2)得分计算品种图标间的欧氏距离, 采用最小平方和法进行品种相似性聚类分析[16], 并在GYT双标图中展示各品种及品种类型与产量-性状组合的互作模式(图2-b), 有助于直观展示和分析各品种类型的特征特性。同时, 对各品种类型的产量-性状组合标准化数据进行方差分析和多重比较(LSD法), 以分析各品种类型的具体特征及其差异显著性。
我国西北内陆棉区国审棉花品种的GT双标图的前2个主成分解释了品种性状总变异的48.8%, 近似表达了国审棉花品种主要性状的相关性和品种与性状的互作关系。图1-a表明, (1) 各目标性状向量间的夹角和分布可将性状划分为几个主要的相关向量群,向量群内的性状为高度正相关, 不同向量群的性状间呈负相关或相关性较弱。主要向量群包括, 皮棉增产率和马克隆值向量群、纤维长度和比强度向量群、枯萎病指数和黄萎病指数向量群。(2) 3个向量群之间呈“三足鼎立”的关系, 互相之间均为负相关或弱相关关系, 其中皮棉增产率和马克隆值向量群与纤维长度和比强度向量群之间呈明显负相关, 枯萎病指数和黄萎病指数向量群与皮棉增产率和马克隆值向量群及纤维长度和比强度向量群之间呈弱负相关关系。(3) 霜前花率向量几乎表现为性状间关系的第4极, 与枯萎病指数和黄萎病指数向量群呈显著负相关关系, 与皮棉增产率和马克隆值向量群及纤维长度和比强度向量群之间呈微弱正相关关系。(4) 图1-a也展示了品种的主要特征特性, 其表达精确度决定于GT双标图的拟合度。例如, 万氏472 (代码为G16, 下同)的纤维长度、比强度和马克隆值表现优秀, 而产量水平较差, 早熟性和抗病性一般, 属于优质品种; 新46 (G17)和新陆早48号(G10)与万氏472 (G16)的特性相反, 属于高产品种; 新陆棉1号(G5)、新陆早49号(G8)和新陆早33号(G6)等品种的枯黄萎病指数较高; 创棉512 (G36)的早熟性和抗病性好。可见, 棉花育种选择和审定评价的主要目标性状之间存在着复杂的有利或不利相关关系, 对一个性状的改良可能会导致其他性状的弱化, 而一个优良品种必须在多数性状上表现优秀, 又不能在重要性状上存在明显缺陷。GT双标图可以表达性状间的关系和展示品种的特性, 却无法对品种进行综合评价和选择, 无法确定哪些品种是可以推广应用的, 哪些品种是应当淘汰的。
缩写同表1和表2。Abbreviations are the same as those given in Table 1 and Table 2.
图2-b中椭圆形虚线包围的品种与基于GYT双标图前两主成分聚类分析的前3个分类相同(聚类图略)。I、II和III分别表示I型品种、II型品种和III型品种。缩写同表1和表2。
The dotted ellipses in Fig. 2-b delineate the varieties which are members of the same cluster at the first three levels in the cluster analysis based on the first two PCs of GYT biplot (the cluster dendrogram was omitted here). I, II, and III stand for the three variety types respectively. Abbreviations are the same as those given in Table 1 and Table 2.
我国西北内陆棉区国审棉花品种的品种×产量-性状组合(genotype by yield×trait, GYT)双标图的前2个主成分解释了品种×产量-性状组合总变异的70.9%。图1-b和表2表明, (1)在各产量-性状组合中只有产量与枯萎病指数组合[Y×FWI (−1)]和产量与马克隆值组合[Y×MIC (~1)]之间表现为不显著负相关(= −0.043), 其余组合的向量间都为锐角, 均表现为正相关。(2) 产量与枯萎病指数组合[Y× FWI (−1)]与其余产量-性状组合的相关性均未达到显著水平, Y×MIC (~1)与产量与比强度组合(Y×STR)、产量与黄萎病组合[Y×VWI (−1)]和Y×FWI (−1)之间相关不显著, 其余组合之间均表现为显著或极显著正相关。(3)各产量-性状组合与品种理想指数(SI)之间均呈显著或极显著正相关关系。(4)品种与产量-性状组合间的互作关系表现为, 创棉512 (G36)、J8031 (G37)、H33-14 (G31)、金科20 (G32)、新K28 (G34)等品种在理想指数、产量与比强度组合和产量与霜前花率组合上表现最好, F015-5 (G30)在Y×FWI (−1)上表现最好, 新陆棉1号(G5)、新陆早33号(G6)、新陆中34号(G7)和新陆早51号(G9)等品种在理想指数和Y×VWI (−1)等方面表现较差。可见, GYT双标图与GT双标图相比解释的变异比例更大, 拟合度更高, 结果更可靠。产量与性状组合之间的相关关系更加简单, 多数组合间表现显著正相关, 更适用于品种的多性状直观选择和综合评价。
表中的产量指皮棉产量增产率。*和**分别表示在0.05和0.01水平上显著相关,ns表示相关不显著。
Yield represents lint cotton yield relative to check cultivar.*and**indicate signifcant correlation at the 0.05 and 0.01 probability levels, respectively;nsindicates not significant correlation.
图2-a表明, (1) 根据各品种在GYT双标图ATA轴上的垂足位置, 创棉512(G36)是综合表现最好的品种, 其余表现优良的品种依次为J8031 (G37)>新K28 (G34)>H33-1-4 (G31)>金科20 (G32)>新陆早13号(G1)>创棉508 (G28)。在ATA轴上排列在最左侧综合性状表现最差的品种依次为新陆棉1号(G5)<新陆早33号(G6)<创棉501号(G24)<新陆早51号(G9)<万氏472 (G16)<新陆中34号(G7)<新陆中60号(G13)<新陆早49号(G8)<创棉50号(G20)等。各品种的理想指数是各品种产量与性状组合标准化数据的平均值(表1), 理想指数的排序与各品种在GYT双标图ATA轴上的坐标位置一致性很好。(2) 在ATA轴下方新陆中51号(G11)在ATC轴上的投影在所有品种中最长, 其次是新桑塔6号(G12)、新陆早48号(G10)和新陆早49号(G8)等品种。这些品种在其投影方向上的Y×MIC (~1)、Y×LEN、Y×PFR和Y×STR等产量-性状组合上表现较好, 而在其投影反方向的Y×FWI (−1)和Y×VWI (−1)等产量-抗病性状组合上表现较差。(3) 在ATA轴上方创棉50号(G20)、F015-5 (G30)、惠远1401 (G33)、新陆中60号(G13)、创棉501号(G24)和庄稼汉902 (G29)等品种在ATC轴上投影较长, 说明这些品种抗病性较好, 而在产量、早熟性和纤维品质性状上表现较差。(4) 在ATC轴上投影短, 且位于ATA轴正方向的品种是在各个性状上表现都较好的品种, 而在ATA轴反方向的品种则在各个性状上表现都略差。例如, 创棉512 (G36)、J8031 (G37)、新K28 (G34)、H33-1-4 (G31)、金科20 (G32)和创棉508 (G28)等品种在各产量-性状组合中表现都较好, 而新陆棉1号(G5)、新陆早33号(G6)、新陆中34号(G7)和新陆早51号(G9)等品种在各产量-性状组合中表现都略差。上述品种的这些特征也可在表1中得到证实, 但显然图2-a更加直观明确。
在GYT双标图的品种聚类功能图中, 品种在某个产量-性状组合向量上的垂直投影越长表示品种在该产量-性状组合上的表型值越好, 双标图中品种图标的坐标关系表达了品种在各产量-性状组合上的表现差异。采用GYT双标图分析了西北内陆棉区37个国审品种主要产量-性状组合的空间关系, 并基于GYT双标图中品种间欧氏距离采用最小平方和法进行聚类分析(聚类图略)。品种的聚类分析结果列于表1, 同时在GYT双标图中用椭圆形区域标识(图2-b)各品种的类型(I型、II型和III型), 从而直观展示了品种的类型划分及品种类型与产量-性状组合的互作模式(图2-b)。
图2-b表明, 西北内陆棉区37个国审品种可划分为3个差异显著的品种类型, 其中I型品种包括新陆早13号(品种代码为G1, 下同)、中棉所49 (G3)、新陆早21号(G4)、巴13222 (G15)、新46 (G17)、天云0769 (G18)、Z1112 (G21)、新石K18 (G22)、J206-5 (G23)、新石K21 (G26)、禾棉A9-9 (G27)、创棉508 (G28)、H33-1-4 (G31)、金科20 (G32)、新K28 (G34)、创棉512 (G36)和J8031 (G37)共17个品种; II型品种包括新陆棉1号(G5)、新陆中34号(G7)、新陆早49号(G8)、新陆早51号(G9)、新陆早48号(G10)、新陆中51号(G11)和新桑塔6号(G12)共7个品种; 而III型品种包括新陆中20号(G2)、新陆早33号(G6)、新陆中60号(G13)、K07-12 (G14)、万氏472 (G16)、DJ09520 (G19)、创棉50号(G20)、创棉501号(G24)、惠远720 (G25)、庄稼汉902 (G29)、F015-5 (G30)、惠远1401 (G33)和中棉201 (G35)共13个品种(表1)。I型品种在产量-霜前花率组合、产量-纤维长度组合、产量-比强度组合、产量-马克隆值组合和产量-黄萎病指数组合上表现明显优势, III型品种在产量-枯萎病指数组合上有优势, 而II型品种在各产量-性状组合中均无明显优势。
为明确各品种类型的具体特征特性, 各品种类型产量-性状组合标准化GYT数据间的差异显著性检测结果列于表3。I型品种各产量-性状组合标准化GYT数据平均值都为正值, 表明其所有产量-性状组合均好于总体平均值, 其产量-霜前花率组合、产量-纤维长度组合、产量-马克隆值组合和产量-黄萎病指数组合的标准化GYT数据平均值和品种理想指数均显著高于II型和III型品种; 产量-比强度组合的标准化GYT数据平均值显著高于III型品种, 与II型品种差异不显著; 产量-枯萎病指数组合的标准化GYT数据平均值略低于III型品种, 显著高于II型品种。II型品种在产量-马克隆值组合上显著好于III型品种, 而在产量-枯萎病指数组合上显著差于III型品种, II型和III型品种在其余各产量-性状组合上差异均不显著。总之, I型品种的综合表现最好, 在产量-枯萎病指数组合上的表现与III型品种相当, 在其余产量-性状组合上均有显著优势, 品种理想指数显著高于II型和III型品种, 是产量与其余性状组合协调最好的品种类型。II型品种在各产量-性状组合上的平均值都为负值, 表明其在各产量-性状组合上的表现均差于平均水平, 在产量-霜前花率组合和产量与纤维品质性状(纤维长度、马克隆值和比强度)组合上好于III型品种, 而在产量和抗病性状组合上差于III型品种, 产量和纤维品质表现一般, 抗病性差, 品种理想指数在3个品种类型中列于末位, 综合表现最差。III型品种仅有产量-枯萎病指数组合的平均值为正值, 且略好于I型品种, 在其余产量-性状组合上的平均值也都为负值, 在产量与纤维品质性状组合上表现最差, 在产量与抗病性组合上表现较好, 品种理想指数略高于II型品种但差异不显著, 综合表现略差。
表3 基于GYT双标图分析的西北内陆棉区国审棉花品种分类特征比较
同一行中标有相同小写字母的数据在5%水平上差异不显著。Mean ± SE为相应品种类型的性状平均值和标准误。
Values followed by the same letter in the same row are not significantly different at the 5% probability level. The mean ± SE stands for the mean plus standard error.
新中国成立以来西北内陆棉区国审棉花品种在提高棉花产量、改进纤维品质和促进棉花生产发展等方面发挥了重要作用。随着我国经济迅速发展和农业产业结构调整, 黄河流域和长江流域等传统主产棉区受劳动力成本急剧上升、植棉机械化程度低、农资成本与棉花售价不对称及国家政策调整等因素的影响植棉面积都出现了“断崖式”滑波, 而西北内陆棉区因具备水土光热资源丰富、机械化程度高、节水灌溉比例高和机械化规模化程度高等因素的影响植棉面积占比呈逐年上升趋势, 植棉面积和总产量都处于主导地位, 是我国现阶段最重要的主产棉区。全国棉花主产区已经由黄河流域、长江流域和西北内陆棉区的“三足鼎立”转变为“西北内陆为主, 其余棉区为辅”的格局。西北内陆棉区在1990—2019年期间共有39个棉花新品种通过国家审定并在生产上推广应用。西北内陆棉区历年通过国审的棉花品种都在一定的历史时期为棉花生产做出过重要贡献, 对历年国审品种的特征特性进行分类评价有利于了解我国西北内陆棉区国审棉花品种遗传改良的成就和不足, 可为国审棉花品种资源的合理利用和国家品种审定指标的进一步完善提高提供参考依据。目前, GGE双标图方法已经广泛地用于品种多性状评价与分析, 但基于多性状对棉花品种进行分类评价的报道较少。许乃银等[5,15]采用GT双标图方法[11]对长江流域棉区国审棉花品种的产量性状、纤维品质性状、抗病性状、早熟性和农艺性状进行综合评价与分类研究, 揭示了长江流域棉花品种的分类特征。GT双标图可以用于表达性状间的关系、展示品种的特性和进行品种分类研究[15], 但是由于品种目标性状之间存在着复杂的相关关系, GT双标图尚无法对品种进行综合评价和选择, 无法直接图示应当推荐审定和生产应用的品种或应当淘汰的品种。为了解决品种多性状同步选择的问题, Yan和Frégeau-Reid[2]提出了用GYT双标图基于产量-性状组合对产量和主要目标性状进行同步选择和综合评价的新方法。GYT双标图方法倡导依据产量与其他性状组合的水平而不是仅依据单性状的表现对品种进行选择。同时, 强调了丰产性在品种多性状选择中的优先地位, 其他性状只有在与较高产量相结合的情况下才有生产应用价值。例如, 枯萎病指数在5以下的棉花品种抗病性很好, 但如果产量很低就没有生产应用价值, 只能作为抗病育种的亲本利用。同样, 即使一个品种的纤维品质指标(纤维长度、比强度和马克隆值)都很好, 如果产量太低也同样没有生产应用价值。因此, 在品种选择和评价中对产量和性状组合的同步选择比单性状选择更有价值。作物品种的产量和其他性状的关系可比作“皮”和“毛”的关系[2], 皮之不存, 毛将焉附?只有在产量得到保证的前提下, 其他性状的价值才能得到体现。因此, GYT双标图方法更适用于品种的多性状综合选择、品种分类和综合评价, 具有更强的实用性和科学性。本研究采用GYT双标图方法基于2003—2019年期间西北内陆棉区国审棉花品种的丰产性(皮棉产量增产率)、早熟性(霜前花率)、纤维品质(纤维长度、比强度和马克隆值)和抗病性(枯萎病指数和黄萎病指数)等最主要的棉花育种和品种审定的目标性状对历年国审品种进行分类评价和综合分析, 将西北内陆棉区37个国审棉花品种划分为差异显著的3个品种类型, 各品种类型的特征明显。I型品种包括新陆早13号、中棉所49、新陆早21号、巴13222、新46、天云0769、Z1112、新石K18、J206-5、新石K21、禾棉A9-9、创棉508、H33-1-4、金科20、新K28、创棉512和J8031共17个品种, 其综合表现最好, 是产量与其余性状组合协调最好的品种类型, 在生产上推广应用价值最高。II型品种都是2006—2011年期间审定的老品种, 其产量和纤维品质表现一般, 抗病性差, 存在抗病性生产安全风险, 在当前生产上应用价值低。当然, 这类历史品种虽然与近期审定的品种相比综合性状较差, 存在明显缺陷, 但也是当年综合表现较好的品种, 在历史上为棉花生产做出过一定的贡献。III型品种的产量-枯萎病指数组合最好, 但在产量与纤维品质性状组合上表现差, 综合生产应用价值低, 但可能适合作为抗枯萎病育种的亲本材料应用。
我国棉花品种审定标准中对棉花品种的评价和审定主要依据品种在皮棉增产率、霜前花率、纤维长度、比强度、马克隆值和抗病性等方面的表现进行综合评判, 评判的原则是在满足特定增产率要求的前提下各性状都符合标准设定的指标要求。棉花品种审定标准中的评价指标和原则在本质上是与作物品种多性状选择的思路相同的, 即都是在保证丰产性的前提下采用单性状淘汰和多性状指数选择[1]的方法处理基于多性状的品种选择问题[1,15]。单性状淘汰是指只要有一个性状未达到标准要求, 无论其余性状表现如何, 都会将品种淘汰, 即所谓的“一票否决”原则。例如, 某棉花品种的纤维长度低于27 mm (或马克隆值高于5.6, 或枯萎病指数高于20,等), 无论其他性状表现如何都不会通过品种审定。当然, 品种审定标准或制度也会与时俱进地进行修改完善, 以符合当时棉花生产对品种的需求, 这也是不同历史时期审定的棉花品种特征特性差异悬殊的原因之一。指数选择就是基于特定的选择指数对品种进行排序和优选, 选择指数需要根据育种目标和/或审定标准确定适当的目标性状, 并赋予各性状适当的权重系数, 建立各目标性状的线性组合。选择指数中目标性状的取舍和权重赋值常常具有很强的主观性和经验性, 基于不同选择指数对品种的评价结果差异较大, 很难构建通用性和可比性强的棉花品种的多性状综合评价指数。GT双标图因为性状间相关性复杂, 性状间有正相关也有负相关, 不利于建立综合评价指数。GYT双标图中产量-性状组合中都包含了产量性状的贡献, 各产量-性状组合的向量基本上都呈正相关关系, 因此可以建立综合评价指数以便对品种的综合表现进行排序和择优利用。GYT双标图中的品种理想指数(superiority index, SI)是GYT数据表中各产量-性状组合标准化数据的平均值, 体现了品种产量与其他性状同步选择的综合表现[2]。本研究根据各品种的理想指数(表1)和各品种在GYT双标图ATC功能图(图2-a)上垂足位置次序, 筛选出创棉512、J8031、新K28、H33-1-4、金科20、新陆早13号和创棉508等综合表现优良的品种, 同时也鉴别出新陆棉1号、新陆早33号、创棉501号和新陆早51号等综合表现较差的品种。
尽管棉花育种和品种审定的基本目标是选择丰产性好、纤维品质优、早熟性和抗逆性好的品种, 但随着棉花生产的发展不同历史时期品种选择和审定指标的侧重点也会与时俱进地进行调整, 以择优推荐符合当时生产需要的棉花新品种, 因而不同历史时期育成的棉花品种类型丰富, 特征特性差异较大。采用GYT双标图方法可以对西北内陆棉区的国审棉花品种进行科学分类和评价, 对历史上审定品种的评价和合理利用提供理论依据和决策支持, 也为GYT双标图方法在其他作物品种的类似分类研究上提供了一个范例。
GYT双标图的产量与性状组合之间以正相关关系为主, 注重以丰产性为主对目标性状进行同步选择, 更适用于品种多性状选择和综合评价。采用GYT双标图分析方法将西北内陆棉区37个国审棉花品种划分为特征明显的3个品种类型, 其中I型品种综合表现最好, 是产量与其余性状组合协调最好的品种类型, 在生产上推广应用价值最高; II型品种产量和纤维品质表现一般, 抗病性差, 在当前生产上应用价值略低; III型品种的产量-枯萎病指数组合最好, 但在其余性状上表现差, 综合生产应用价值有限, 可作为抗病亲本应用。
[1] Yan W K, Frégeau-Reid J. Breeding line selection based on multiple traits., 2008, 48: 417–423.
[2] Yan W K, Frégeau-Reid J. Genotype by yield*trait (GYT) biplot: a novel approach for genotype selection based on multiple traits., 2018, 8: 8242.
[3] Cooper M, Woodruff D R, Eisemann R L, Brennan P S, Delacy I H. A selection strategy to accommodate genotype-by-environment interaction for grain yield of wheat: managed-environments for selection among genotypes., 1995, 90: 492–502.
[4] 许乃银, 李健. 棉花区试中品种多性状选择的理想试验环境鉴别. 作物学报, 2014, 40: 1936–1945. Xu N Y, Li J. Identification of ideal test environments for multiple traits selection in cotton regional trials., 2014, 40: 1936–1945 (in Chinese with English abstract).
[5] 许乃银, 李健. 基于GGE双标图的长江流域国审棉花品种分类特征评价. 中国农业科学, 2014, 47: 4780–4789. Xu N Y, Li J. Evaluation on the classification characteristics of national registered cotton varieties in the Yangtze River Valley based on GGE biplot., 2014, 47: 4780–4789 (in Chinese with English abstract).
[6] Yan W K. Crop Variety Trials: Data Management and Analysis. Oxford: Wiley-Blackwell, 2014. pp 163–186.
[7] 许乃银, 李健. 我国主产棉区棉花纤维品质性状的区域分布特征. 中国生态农业学报, 2016, 24: 1547–1554. Xu N Y, Li J. Regional distribution characteristics of cotton fiber quality in main cotton production areas in China., 2016, 24: 1547–1554 (in Chinese with English abstract).
[8] Xu N Y, Fok M, Zhang G W, Li J, Zhou Z G. The application of GGE biplot analysis for evaluating test locations and mega- environment investigation of cotton regional trials., 2014, 13: 1921–1933.
[9] Merrick L F, Glover K D, Yabwalo D, Byamukama E. Use of genotype by yield*trait (GYT) analysis to select hard red spring wheat with elevated performance for agronomic and disease resistance traits., 2020, 2: e200009.
[10] Yan W K, Frégeau-Reid J, Mountain N, Kobler J. Genotype and management evaluation based on genotype by yield*trait (GYT) analysis., 2019, 1: e190002.
[11] Yan W K, Holland J B. A heritability-adjusted GGE biplot for test environment evaluation., 2010, 171: 355–369.
[12] 严威凯. 双标图分析在农作物品种多点试验中的应用. 作物学报, 2010, 36: 1805–1819. Yan W K. Optimal use of biplots in analysis of multi-location variety test data., 2010, 36: 1805–1819 (in Chinese with English abstract).
[13] Yan W K, Kang M S, Ma B L, Woods S, Cornelius P L. GGE biplot vs. AMMI analysis of genotype-by-environment data., 2007, 47: 643–655.
[14] Yan W K. Singular-value partioning in biplot analysis of multienvironment trial data., 2002, 94: 990–996.
[15] Xu N Y, Fok M, Li J, Yang X N, Yan W K. Optimization of cotton variety registration criteria aided with a genotype-by-trait biplot analysis., 2017, 7: 17237.
[16] Adugna W, Labuschagne M T. Cluster and canonical variate analyses in multilocation trials of linseed., 2003, 140: 297–304.
Retrospective evaluation of cotton varieties nationally registered for the Northwest Inland cotton growing regions based on GYT biplot analysis
XU Nai-Yin1, ZHAO Su-Qin2, ZHANG Fang3, FU Xiao-Qiong4, YANG Xiao-Ni1, QIAO Yin-Tao1,5, and SUN Shi-Xian3
1Institute of Industrial Crops, Jiangsu Academy of Agricultural Sciences / Key Laboratory of Cotton and Rapeseed, Ministry of Agriculture and Rural Affairs, Nanjing 210014, Jiangsu, China;2Xinjiang Uygur Autonomous Region Seed Industry Development Center, Urumqi 830006, Xinjiang, China;3National Extension and Service Center of Agricultural Technology, Beijing 100125, China;4Institute of Cotton Research, Chinese Academy of Agricultural Sciences, Anyang 455000, Henan, China;5School of Agricultural Engineering, Jiangsu University, Zhenjiang 212013, Jiangsu, China
The Northwest inland cotton growing regions (NICR) is currently the most important cotton producing area in China. The scientific classification and comprehensive evaluation of national cotton varieties over the years in this cotton area is beneficial to the rational utilization of national cotton varieties resources and the improvement of cotton production efficiency. According to the national registration bulletins of cotton cultivars, up to 37 cotton cultivars in this region were registered in the national level from 2003 to 2019. These cultivars were evaluated and classified using genotype by yield-trait (GYT) biplot analysis based on their levels in combine with lint cotton yield and other important characteristics including pre-frost yielding rate (PFR), fiber length, fiber strength, micronaire, fusarirum wilt index (FWI), and verticillium wilt index (VWI). Results showed that the 37 cotton cultivars can be clustered into three types with distinct trait profiles. Type I consisted of 17 cotton cultivars, namely Xinluzao 13, Zhongmiansuo 49, Xinluzao 21, Ba 13222, Xin 46, Tianyun 0769, Z1112, Xinshi K18, J206-5, Xinshi K21, Hemian A9-9, Chuangmian 508, H33-1-4, Jinke 20, Xin K28, Chuangmian 512, and J8031, showing high levels of combinations between yield and other target traits, and was the most suitable for cotton production in the region. Type II was characterized by poor performance in FWI, and moderate yielding ability and fiber quality traits, and was of limited application in this area. Type III was characterized by an excellent performance in FWI but poor performance on the other traits, and cultivars of this type may be useful for sources of disease resistance. Cultivars Chuangmian 512, J8031, Xin K28, H33-1-4, Jinke 20, Xinluzao 13, and Chuangmian 508 were selected for their high superiority index, such as high levels of combination between yield and other traits, while Xinlumian 1, Xinluzao 33, Chuangmian 501, and Xinluz 51 were inferior in this context. The GYT biplot analysis in this study differed from traditional index selection in that it was based on the combinatoin level of yield and other traits rather than on the levels of individual traits. In GYT biplot the various yield-trait combinaitons tended to be positievly correlated, allowing for easy visualizationand objective selection of cultivars based on multiple traits. Compared with the more traditional genotype by trait (GT) biplot, GYT biplot normally explained more of the total variation and achieve higher goodness of fit. In addition, the method used in this study could be applied to other regions and crops in this reasearch topic.
cotton (L.); cultivar registration; cultivar classification; multiple traits; genotype by trait (GT) biplot; genotype by yield-trait (GYT) biplot; northwest inland cotton growing region (NICR)
10.3724/SP.J.1006.2021.04135
本研究由国家农业技术试验示范与服务支持(品种试验)项目(012022911108)资助。
This study was supported by the National Agricultural Technology Field Experiment, Demonstration and Service Support (Variety Test) Project (012022911108).
E-mail: naiyin@126.com
2020-06-22;
2020-10-14;
2020-11-02.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20201030.1713.014.html