多主成分玉米区域试验数据的GGE 双标图分析

2021-03-11 07:02王大为王延波常程张书萍孙甲
关键词:铁岭阜新营口

王大为,王延波,常程,张书萍,孙甲

(辽宁省农业科学院 玉米研究所,辽宁 沈阳110161)

育种者和农户从不同角度关心同一个问题“某地种植什么品种更合适”,这实际上是一个关于品种一般适应性和特殊适应性的典型问题。GGE 双标图采用“内积原理”解释主成分分析两向数据表的结果,在一组图中展示品种的一般适应性和特殊适应性,给出品种相似性、环境相关性和品种环境互作效应等3 方面建议[1]。前人利用Windows 平台的GGEbiplot 软件或R 版本的GGEBiplotGUI 包 分 析 玉 米[2]、水 稻[3]、小 麦[4]、棉 花[5]、马铃薯[6]、小豆[7]、烤烟[8]等产量或品质相关数据,但是多数研究只采用了2 个主成分。由于区域试验数据影响因素复杂,往往出现多个主成分或只有1 个主成分,仅仅采用2 个主成分分析会出现拟合不足或过度拟合的情况。当2 个主成分不能充分体现数据规律的时候,直接制作双标图可能产生部分信息误导,需要把数据进行预处理再研究[9]。本研究通过采用以GGEBiplotGUI 为主的R语言软件包对2018 年和2019 年辽宁玉米中晚熟区试产量数据进行分析,探讨多于2 个主成分的区试数据适宜的GGE 双标图分析方法,旨在为建立包含多个主成分试验数据的可靠分析方法提供理论依据。

1 材料和方法

1.1 试验材料

试验于2018 年和2019 年在辽宁玉米区域试验中晚熟组区域进行,每年参试14 个品种,设置在11 个试验地点,包括阜新、昌图、铁岭、于洪、朝阳、丹东、法库、凤城、锦州、东陵、营口。2018 年只有8个试验地点统计数据。为了在双标图中显示清晰,品种名采用代号表示(表1)。

1.2 试验方法

试验均采用随机区组排列,3 次重复,5 行区,小区面积20 m2,种植密度是67 500 株·hm-2。对照品种是郑单958。施肥水平、田间管理与大田生产水平一致,每次重复实收中间3 行风干脱粒,产量按14%含水量计算。

1.3 统计分析

数据处理和统计分析使用R 语言及其程序包实现。其中:方差分析、主成分分析、提取及信息比计算、误差同质性检测、相关性检测、热图、GGE双标图分析分别使用了R 语言3.6.3 版及程序包agricolae、psych、reshape2、PerformanceAnalytics、GGEBiplotGUI。

2 结果与分析

2.1 中晚熟品种在不同环境下产量表现

由表2 可 见,2018 年14 个参 试品种在8 个 试验点的平均产量变幅为8.69~13.01 t·hm-2。平均产量最高的品种是g2,最低的是g14,而g14 是中晚熟组对照品种。在不同试验点之间比较,铁岭试验点的品种平均产量最高,为11.95 t·hm-2,朝阳试验点的品种平均产量最低,为9.56 t·hm-2。用LSD 法进行多重比较,品种之间或环境之间差异均达到极显著水平。

表1 辽宁玉米区域试验中晚熟组品种与代号Table 1 Codes of varieties of mid-late group in 2018 and 2019 Liaoning maize MET

表2 2018 年参试品种与环境平均产量与位次Table 2 Yield and rank of varieties and environments in 2018 单位:t·hm-2

由表3 可见,2019 年14 个参试品种在11 个试验点的平均产量变幅为8.02~14.17 t·hm-2。平均产量最高的品种是g22,最低的是中晚熟组对照品种g14。在不同试验点之间比较,昌图试验点的品种平均产量最高,为13.28 t·hm-2,锦州试验点的品种平均产量最低,为8.73 t·hm-2。品种之间或环境之间差异均达到极显著水平。

表3 2019 年参试品种与环境平均产量与位次Table 3 Yield and rank of varieties and environments in 2019

2.2 主成分个数分析、提取及信息比

采用碎石图获取主成分个数信息(图1)。2018年和2019 年都有3 个特征值大于1,即需要3 个主成分才能保留样本中的大部分信息。

拟合度较低的时候,需要利用信息比(Information Ratio,IR 值)对特征值排序,其中IR>1 的特征值含有规律性信息。2 年试验均是前3 个特征值IR>1,需要3 个主成分来最大拟合原始数据,2018年拟合度为81.13%,2019 年为73.85%(表4)。

表4 2018 年和2019 年中晚熟区试样本特征值与IR 值Table 4 Eigenvalue and Information Ratio of 2018 and 2019 mid-late MET Samples

2.3 环境的误差同质性和相关性检测

2.3.1 环境的误差同质性检测

在做双标图之前,一般需要先检测各环境误差同质性,用来衡量环境区分能力。用Bartlett 检验方法对各环境误差进行同质性检测。结果表明,2018年,P=0.249 9>0.05,方差具有齐性,无需定标即可分析。2019 年,P=0.013 9<0.05,初步认为方差不具有齐性。又经Levene、Fligner-Killeen 检验,判断2019 年区试数据呈偏态分布,需要定标后再进行分析。

2.3.2 环境相关性检测

在特征值计算过程中,同时得到成分载荷,即观测变量与主成分的相关系数。成分载荷可帮助解释主成分的含义。2018 年第一主成分与昌图、朝阳、营口、阜新弱相关(R≥0.70),第二主成分与铁岭、丹东、东陵强相关(R>0.80),第三主成分与于洪强相关(R>0.95),与阜新存 在弱相关(R>0.55)。2019 年第一主成分与阜新、昌图、朝阳、法库、锦州、营口弱相关(R>0.60),第二主成分与丹东、凤城、东陵强相关(R>0.80),第三主成分与铁岭、于洪弱相关(R>0.70)。

2.3.3 环境聚类分析热图可视化

经过聚类分析并制作heatmap 热图(图2),2018年,于洪、铁岭、丹东、东陵聚为一类,朝阳、阜新、营口、昌图聚为另一类。2019 年,东陵、丹东、凤城聚为一类,铁岭、于洪、朝阳、阜新、昌图、法库、锦州、营口聚为另一类。

图1 利用碎石图判断主成分个数Fig.1 Judging principal component numbers using scree plot

图2 环境聚类分析热图Fig.2 Clustering analysis heatmap of environments

2.4 2 种分析方法的双标图比较

2.4.1 分组分析双标图

利用前2 个主成分先做出初始双标图,参照各区垂线划分显示的主要模式,结合前述聚类分析热图和环境相关系数,把试验点分组进行研究。

由图3A、图3B 可见,2018 年环境分为2 组:于洪、铁岭、丹东、东陵为一组,简称:2018 辽东组;朝阳、阜新、营口、昌图为一组,简称:2018 辽西组。由图3C、图3D 可见,2019 年环境 也分为2 组:东陵、丹东、凤城为一组,简称2019 辽东组;铁岭、于洪、朝阳、阜新、昌图、法库、锦州、营口为一组,简称2019 辽西组。分组后2018 年2 组双标图拟合度是87.39%和83.07%,2019 年2 组双标图拟合度是91.02%和68.62%。

图3 GGE 双标图的“哪个赢在哪里”功能形态Fig.3 Which-won-where view of the GGE biplot

在2018 辽东组中,丹东、铁岭被划为一小组,最高产品种为g1;东陵为一小组,最高产品种为g8;于洪为一小组,最高产品种为g13。在2018 辽西组中,昌图、朝阳、阜新、营口被划为同一小组内,最高产品种g2。

在2019 辽东组中,环境因素几乎掩盖了品种因素,丹东和凤城小组最高产品种是g15,东陵最高产品种是g22。在2019 辽西组中,昌图、锦州、法库、营口、铁岭被划为一小组,g12 是最高产品种。g21 是阜新和朝阳小组最高产品种,g18 是于洪最高产品种。

由图4A、图4B 可见,在2018 辽东组中,东陵的代表性较好,于洪与其它地点相关性较小,丹东的区分能力和代表性均低。在2018 辽西组中,昌图、阜新的区分力好,阜新与其它地点相关性较小,昌图代表性高。由图4C、图4D 可见,在2019辽东组中,凤城与丹东相关性强,东陵与凤城、丹东相关性弱,凤城的代表性较强。在2019 辽西组中,法库、锦州、营口的代表性和区分力均较强,阜新与朝阳相关性强,于洪与铁岭相关性强,阜新、朝阳与于洪、铁岭之间出现负相关。

由图5A、图5B 可见,在2018 辽东组中,g9 产量表现最好,最不稳定品种是g1,比较稳定的是g8。在2018 辽西组中,g2 平均产量最高,后面依次是g12、g3,最不稳定的是g13;g3 是比较高产稳产的品种。由图5C、图5D 可见,在2019 辽东组中,最高产品种是g15,后面依次是g22、g24;各品种均匀分布在环境平均值附近,稳定性相似度较高。在2019 辽西组中,g12 平均产量最高且稳定,后面依次是g11、g22;最不稳定品种是g24。

图4 GGE 双标图的“区分力与代表性”功能形态Fig.4 Discrimination and representativeness view of the GGE biplot

2.4.2 部分高产品种分析双标图

由图6A 可见,2018 年 删 除5 个低产 品 种g6、g7、g8、g13、g14,拟合度下降为68.78%。8 个地点被分为2 小组,昌图、阜新、于洪、朝阳分为一个小组,营口、东陵、铁岭、丹东分为一个小组。各组名义上高产品种分别为g2、g12 和g1。

由图6B 可见,2019 年删除5 个低产品种g16、g19、g23、g13、g14,拟合度下降为66.56%。11 个地点被分为3 组,营口、锦州、阜新、昌图、法库、朝阳、铁岭分为一个小组,东陵、凤城、丹东分为一个小组,于洪单独为一个小组。各组名义上最高产品种分别为g12、g22、g15。

2.4.3 同时参加两年区试的4 个品种双标图

采用同时参加了两年区试的g11、g12、g13、g14 等4 个品种和8 个重复性环境进行了年际间重复GGE 双标图分析。由图7 可见,g12 和g11 在两年区试大部分地点表现高产。8 个试验环境中,营口、阜新、铁岭等3 个地点年际间向量夹角较小,重复性较强。

图5 GGE 双标图的“高产性与稳定性”功能形态Fig.5 Mean vs.stability view of the GGE biplot

图6 只包含较高产品种的“哪个赢在哪里”功能形态Fig.6 Which-won-where view of GGE biplot excluding some low yielding genotypes

图7 4 个品种2 年区试GGE 双标图功能形态Fig.7 GGE biplot for 4 genotypes in 2 years MET

3 讨论与结论

3.1 品种适宜区域推荐

GGE 双标图中“哪个赢在哪里”图按照品种-环境的相互关系以发自环境中心点的矢量垂线来对区试点分组,位于各组内多边形顶点即为该组最高产品种。“高产性与稳定性”图中,平均环境轴所指的方向是品种在所有环境下的近似平均产量走向,品种与平均环境轴之间的垂线表示品种的稳定性。综合产量和稳定性指标,2018 年既高产又稳产的品种是辽东组的g9、g8,辽西组的g2、g12。连续2 年在辽西组表现较高产且稳定的是g12。去除数据中的低产品种之后,可以对相对高产品种的适宜环境给出建议。g12 在部分高产品种的分析中表现突出,尤其在阜新、朝阳、昌图试验点表现出较高的G+GE 效应。g12(东1775)于2020 年初通过了省级品种审定,适宜在阜新、朝阳、昌图等类似生态区种植

3.2 试验点综合评价

GGE 双标图“区分力与代表性”图中,区试点线段和平均环境轴的夹角度数是其对目标环境代表性的度量,矢量长度则是环境区分力的度量。2018 年,阜新、于洪区分力强但代表性弱,可以发挥淘汰品种的功能;昌图是既有区分力又有代表性的区试点。2019 年,东陵区分力较强但代表性弱,可以发挥淘汰品种的功能;法库、锦州、营口是既有区分力又有代表性的区试点。

3.3 分组分析的优点与注意事项

在区试数据存在多个主成分的情况下,如果不分组,使用只有2 个主成分的初始GGE 双标图分析,所展示的主要模式会被随机误差所掩盖或扭曲。就本试验数据而言,会出现3 种弊端:第一,在可信度方面,拟合度较低。2018 年为62.94%,2019 年为62.89%。第二,在品种推荐方面,只能显示出g2 和g9 等并不突出的品种。第三,在环境评价方面,2018 年于洪与东陵矢量线几乎重叠,会得出可以去掉其中一个试验点的错误结论。分组后拟合度提高,图中所显示的规律更接近真实情况。分组分析可以更多地保留数据原始信息,是解决数据较大、关系较复杂的有效途径,是针对多主成分数据的适宜分析方法。但是由于区域试验点往往数量有限,也不宜过度细分组别,否则得到的GGE 双标图内容含义不清。建议参照聚类分析和热图结果,选取尽量少的组别进行分组分析。

3.4 多年重复试验分析的意义

鉴于区域试验的参试规则特殊性,难以获得多个品种连续多年的重复试验数据。能够对少数重复参加2 年区试的品种进行年际间GGE 双标图分析很有意义。在本试验中,g12 和g11 表现年际间稳定高产,营口、阜新、铁岭这3 个地点在2 年区试中表现出较大的环境稳定性。品种与环境间的GE 互作在年际间具有一定的重复性,这为辽宁玉米划分生态区、进而针对性地选择区域特殊适应性品种提供了参考。

3.5 数据聚集的特殊情况

2019 年辽东组各品种靠近环境中心位置集中分布,难以区分。究其原因,双标图是一种降维分析方法,要么该组数据变异接近于环境平均值,要么该组数据变异位于其它维度。从本试验现状分析,可能是前者,即辽东组各试验点环境与参试品种的GE 互作效应较小。

GGE 双标图在主效可加互作可乘模型(Additive main multiplicative interaction,AMMI)考 察G×E 效应的基础上又更多考虑了基因G 的作用[10,11]。GGE 双标图主要用于直观分析基因在不同环境下表达的相对水平而不是绝对水平,原则上应当把其当作一个建立假说的工具而不是做出最终结论的工具[1,12]。本试验是对2018 年和2019年辽宁玉米中晚熟组区试产量性状的分析,仅代表1 种熟期类型品种产量对2 年光温反应的差异。品种与区试点推荐结果只具有限意义,不宜扩展到其它熟期或者多年应用。今后需要继续深入对不同熟期类型品种产量、品质、抗性等多种性状和多年区试结果进行分析,从中挖掘出更多具有规律性的信息,供育种者和品种推广者参考。

猜你喜欢
铁岭阜新营口
浅谈辽宁省高速公路(阜新段)不动产确权登记
阜新元代大玄真宫祖碑碑文新录
铁岭雷锋纪念馆
铁岭关
铁岭关
“河风海韵·醉美辽河”全国诗歌大赛获奖名单
醉美辽河,流进我梦想的城(组诗)
营口成为世界海蜇产业链核心
加强原创意识加大对地方文化的发掘