俞华先,经艳芬,安汝东,郎荣斌,董立华,桃联安,孙有芳,杨李和,边 芯,周清明,田春艳
(云南省农业科学院甘蔗研究所瑞丽育种站,云南 瑞丽 678600)
【研究意义】开发利用野生种是拓宽甘蔗品种遗传基础的有效途径,甘蔗种质材料的创新是甘蔗优良创新种质培育与新品种选育的种质基础[1-3]。 大茎野生种(Saccharumrobustum)别名伊里安野生种,体细胞染色体数(2n=60~120),是甘蔗属中的一个重要野生种,具有植株高大、生势旺、抗螟虫、耐旱强、抗风力强和宿根性好的特点[4-5]。部分育种机构利用它与热带种或甘蔗品种杂交、回交育成了一些优良品种(育种材料),如夏威夷育成的大茎野生种F3材料H37-1933;昆士兰育成32MQ;佛罗里达运河点育成的品种CP36等;云南省农业科学院甘蔗研究所1998-2002年利用大茎野生种57NG208与甘蔗(热带种或品种)杂交和回交选育出云蔗2000-505、云蔗2000-506等优良BC1代创新种质材料;对大茎野生种利用最成功的是台湾糖业公司甘蔗研究所利用大茎野生种F2材料PT43-52及其后代为创新种质育成的一系列重要的台糖新品种,如F146、F152、F160、F172、ROC1、ROC5、ROC10、ROC22[4],目前ROC22随着推广面积的增加及蔗农对其的高度认可成为大陆的当家品种,由此可见大茎野生种对拓宽甘蔗遗传基础及品种改良具有重要意义。【前人研究进展】大茎野生种血缘创新种质的分析和评价,是甘蔗野生种质资源育种的重要环节。目前,有关大茎野生种质资源的收集、鉴定、评价利用的研究不是很多。张纯[6]对几个大茎野生种后代作创新种质的育种效果进行分析;张允演[7]分析了大茎野生种后代在甘蔗育种中的利用情况,陆鑫等[8]对大茎野生种 57NG208 的17个杂种后代进行评价;朱建荣等[9]对大茎野生种57NG208与南涧果蔗正反交后代进行了遗传变异分析,但对含大茎野生种血缘创新种质材料的评价却鲜有报道。【本研究切入点】寻找科学实用的评价方法,深入研究创新种质、创新种质材料的性状表现,是利用云南甘蔗野生种质资源育种的基本思路,亦是实现创新种质材料高效利用的有效措施[10],主成分分析法把原来相互关联的各个性状转化为几个互相独立的综合指标,用较少的新指标代替原来较多的原始变量,使变量达到简化降维,根据综合指标的方差贡献率评价其在育种中的重要性。主成分分析和聚类分析综合运用对作物种质资源的数量性状进行评价分析在大豆、水稻、玉米、小米辣、烟草等多种作物上研究取得了较好的效果[11-15],但目前结合主成分综合得分排序和聚类分析对甘蔗大茎野生种57NG208血缘F2代创新种质的评价与分类鲜见报道。【拟解决的关键问题】在2017/2018榨季,对新创制的大茎野生种57NG208血缘F2代,采用主成分综合得分法进行综合评价,并且基于主成分分析结果对参试材料进行系统聚类分析,筛选出可以重点利用的创新种质材料,以提高创新种质的利用效率。
20份云瑞15系列大茎野生种57NG208血缘F2代创新种质(含双对照粤糖93-159、新台糖22号)来自云南省农业科学院甘蔗研究所瑞丽育种站内亲本圃,其创制方式除云瑞15-111为改良创新外,其余材料皆为原始创新,18份创新种质祖代创新种质都以大茎野生种57NG208为核心种质进行杂交,以粤糖93-159和新台糖22号为对照,创新种质信息详见表1。
表1 参试大茎野生种血缘F2代材料
试验安排在云南省农业科学院甘蔗研究所瑞丽育种站内,该基地地势平坦、土壤肥力均匀,阳光充足,灌溉方便,其海拔为825.4 m,北纬 24°1′33″,东经 97°51′44″,前季作物为甘蔗。试验材料于2017年3月中旬种植,单行,小区行长1.50 m,行距1.10 m,3 次重复。四周设保护行,田间管理同常规大田管理一致。
2017年11月下旬,在大田调查株高、茎径、有效茎数和锤度等农艺性状,其中株高和茎径每个小区调查10株,锤度每个小区调查5 株。参照经艳芬的方法[16]利用以下公式计算单产和11月理论蔗糖分:
单产(t/hm2)=茎径2(cm)×[株高(cm)-50]×0.785×丛有效茎数(条/hm2)
11月理论蔗糖分(%)=蔗汁平均锤度(%)×1.01-5.6
调查和计算记载的性状:株高(X1)、茎径(X2)、有效茎数(X3)、单茎重(X4)、蔗茎产量(X5)、11月蔗糖分(X6) (表 2) 。
利用Microsoft Excel 2007整理基础性状数据,采用 SPSS 21.00 软件进行主成分分析[17],利用DPS数据分析系统对20份参试材料主要的数量性状进行主成分分析。参照唐启义[18]等和洪楠等[19]方法选取λ≥1的3个特征根作为20份参试材料的主成分。
从表2可见,株高与有效茎数、单茎重、蔗茎产量呈正相关,且与蔗茎产量的相关性呈显著水平,与其它性状呈负相关;茎径与单茎重、蔗茎产量呈正相关,且与单茎重的相关性呈极显著水平,与其它性状呈负相关,且与有效径数呈显著负相关;有效茎数与蔗茎产量呈极显著正相关,与11月蔗糖分呈显著正相关,与单茎重呈负相关;单茎重与蔗茎产量呈正相关,与11月蔗糖分呈负相关;蔗茎产量与各性状均呈正相关。若用这6个性状对20份参试材料进行综合评价,会因为性状间存在多重共线性而导致评价结果不准确。
从表3可见,入选的3个主成分累计贡献率为92.417 %,特征值总和为5.546,能代表样本大部分信息。其中第一主成分的特征根为2.660,方差贡献率为44.325 %,其特征向量主要是有效径数(X3)、蔗茎产量(X5)、株高(X1),特征向量分别为0.566、0.344、0.335,主要反映的参试材料的产量因子;第二主成分的特征根为1.831,方差贡献率为30.520 %,其特征向量主要是单茎重(X4)、蔗茎产量(X5)、茎径(X2)、株高(X1)、有效径数(X3)、11月蔗糖分(X6),特征向量分别为0.590、0.587、0.446、0.252、0.167、0.127,主要反映的是参试材料的单茎重产量情况;第三主成分的特征根为1.055,方差贡献率为17.574 %,其特征向量中,11月蔗糖分(X6)最大,其次是茎径(X2),特征向量分别为0.715和0.205,主要反映的是参试材料的糖分情况,第三主成分中的11月糖分特征向量值较大,说明11月糖分与其他因子联系较少,其受到相对较为独立的遗传因素控制。
参照陆鑫等[8]的方法用主成分特征向量除以相应的特征根得到主成分得分系数矩阵详见表4。据主成分得分系数矩阵,可得到主成分得分函数表达式如下:
表2 各性状间的相关矩阵
注:*和**分别表示0.05水平和0.01水平上显著相关。
Note: * and ** meant significantly correlated at the 0.05 level and 0.01 level, respectively.
表3 相关系数矩阵的特征根及其贡献率
表4 主成分及其得分系数矩阵
Y1=0.126x1-0.177x2+0.213x3-0.135x4+0.129x5+0.119x6
Y2=0.137x1+0.244x2+0.091x3+0.322x4+0.321x5+0.069x6
Y3=-0.623x1+0.194x2+0.085x3-0.078x4+0.027x5+0.678x6
式中,Y表示主成分得分,x1、x2、x3、x4、x5、x6分别表示经标准化处理后的株高、茎径、有效茎数、单茎重、蔗茎产量、11月蔗糖分数值。将数据分别代入上述公式可得3个主成分的得分值[20-23]详见表5。参照陆鑫等[8]和张军科等[23]的方法,按照公式(1)计算综合得分:
S=b1Y1+b2Y2+… +bnYn
(1)
式中,S表示综合得分值;bn为第n个主成分对应的方差贡献率;Yn为第n个主成分的得分。以综合得分值大小对20份参试材料进行排序,其排序结果见表5 。
参试材料的综合得分越高,表明其综合性状越理想。从表5的分析结果看,云瑞15-80、云瑞15-78、云瑞15-152、云瑞15-44、云瑞15-85、云瑞15-12、云瑞15-45、云瑞15-111、云瑞15-79、云瑞15-84和云瑞15-5511份材料的综合得分高于粤糖93-159(CK1)和新台糖22号(CK2),云瑞15-10和云瑞15-123的综合得分介于粤糖93-159(CK1)和新台糖22号(CK2)之间,其余5份材料的综合得分低于粤糖93-159(CK1)和新台糖22号(CK2)。其中云瑞15-80的综合得分最高为0.972,居于第1位,株高、有效茎数、蔗茎产量和11月蔗糖分均超过粤糖93-159(CK1)和新台糖22号(CK2),且为参试材料中的最大值,其产量与糖分得到较好的兼顾;云瑞15-78除茎径和单茎重低于粤糖93-159(CK1)和新台糖22号(CK2)、11月蔗糖分低于新台糖22号(CK2)外,其余性状皆优于粤糖93-159(CK1)和新台糖22号(CK2),其中有效茎数为参试材料中的最大值;云瑞15-152的蔗茎产量、11月蔗糖分和有效茎数均超过粤糖93-159(CK1)和新台糖22号(CK2);云瑞15-44和云瑞15-85的株高、有效茎数和蔗茎产量均超过粤糖93-159(CK1)和新台糖22号(CK2),其中云瑞15-85的单茎重的单茎重优于粤糖93-159(CK1)和新台糖22号(CK2)且为参试材料中的最大值;云瑞15-12、云瑞15-45、云瑞15-55、云瑞15-79、云瑞15-84和云瑞15-111等6份材料的株高、有效茎数和蔗茎产量均优于粤糖93-159(CK1)和新台糖22号(CK2),其中云瑞15-45、云瑞15-55、云瑞15-79和云瑞15-111的11月蔗糖分介于粤糖93-159(CK1)和新台糖22号(CK2)之间;云瑞15-10和云瑞15-123的综合得分介于粤糖93-159(CK1)和新台糖22号(CK2)之间;云瑞15-77、云瑞15-11、云瑞15-17、云瑞15-9和云瑞15-20等5份综合得分值均小于粤糖93-159(CK1)和新台糖22号(CK2),可以考虑不用或者淘汰。
表5 主成分得分及其综合得分
基于20份参试材料的3个主成分得分,采用欧式距离、离差平方和法进行系统聚类分析。在欧式距离D=5.00处,20份参试材料被分成3大类。由图1和表6可见,第Ⅰ类有7份,占参试材料的35.00 %,具有植株高大、中小茎、有效茎数适中,单产高、糖分适中等特点,可在高产或高糖创新种质中加以利用;第Ⅱ类有3份,占参试材料的15.00 %,其特点为中大茎、单产高,糖分比第Ⅰ类更理想,11月平均蔗糖分16.383 %,田间表现为高产高糖,重点加强利用;第Ⅲ类有10份,占参试材料的50.00 %,具有植株高大、中茎,蔗茎产量适中等特点,但糖分不很理想,可以考虑选择性利用或者淘汰。
Pearson相关分析表明,株高与单茎重、蔗茎产量呈正相关,且与蔗茎产量达到显著水平;茎径与单茎重、蔗茎产量呈正相关,且与单茎重达到极显著水平,与其它性状呈负相关,且与有效径数呈显著负相关;有效茎数与蔗茎产量呈极显著正相关等结论与陆鑫等[8]、吴建涛等[24]、刘福业等[25-26]和赵俊等[27]的研究结论一致。
图1 大茎野生种57NG208血缘F2代创新种质材料主要数量性状的系统聚类图Fig.1 Clustering diagram of main quantitative characters in Yunnan's innovative S.robustum 57NG208 F2 generation
表6 3个聚类群及其性状特征
由相关分析可知,对于有效径数与产量和糖分性状呈显著或极显著相关的重要性状,几乎对甘蔗所有农艺性状都有影响,因此在选育品种或创新种质时,对于有效径数相对较多的单株可优先选择。同时考虑到有效径数与单茎重呈负相关,与茎径呈显著负相关,在甘蔗选育中淘汰有效径数比较少的材料,选择有效径数适中、株型好的材料。茎径与11月蔗糖分呈负相关,与有效径数呈显著负相关,在选育种质过程中,就需要对产量糖分性状有关性状给与适当的控制。
大茎野生种(S.robustum)在利用过程中,需经过3~4次与生产性创新种质或品种轮回杂交,才能逐步克服低糖、易感根腐病、斐济病和露菌病等不利野生特性,保留其强生势、强耐旱性、抗倒伏、宿根性好和纤维分含量多等优良性状,最终筛选出符合生产要求的高产、高糖、多抗性和适应性广的甘蔗新品种。在对大茎野生种57NG208进行系列种质创新过程中,对各世代材料的评价、分类和筛选,是进一步杂交利用的关键。甘蔗创新种质的综合评价是育种工作的重要环节,甘蔗创新种质的优劣是多个性状共同作用的结果。陆鑫等[8]、吴建涛等[24]和赵俊等[27]对决定甘蔗的多个性状作了相关研究得出,这些性状间存在多重共线性,若直接用这些性状进行分析评价,结果会存在较大误差,若采用主成分综合得分法对原始数据进行降维处理,可以达到科学客观评价参试材料的目的。
主成分分析法由于各主成分之间是一个独立的系统,彼此间不存在相关性,并且数值直观容易分析,常被应用于种质资源的评价研究[28]。采用此法对20份参试材料进行分析,确定了产量因子、单茎重因子和糖分因子等3个主成分因子,其累计方差贡献率达92.417 %,表明3个主成分因子能代表原始材料绝大部分的信息。采用主成分构造的综合性状与前人的研究有区别,如陆鑫等[8](2008)研究17份大茎野生种杂交后代的8个性状,共选出产量因子、茎数因子和糖分因子;周会等[29](2012)对111份桂糖系列甘蔗种质资源的9个数量性状进行主成分分析,选出糖分因子、茎径-叶因子、茎数-叶因子和株高因子等4个主成分因子;张革民等[30]对 94份割手密为材料的7个数量性状进行分析,选出3个主成分, 即植株因子、茎数因子和糖分因子,究其原因与所选择群体的血缘和研究的性状不同有关。
在主成分分析过程中,从株高、茎径和有效茎数的特征向量值来看,在育种应用中优先顺序是有效茎数>茎径>株高,这与周会等[29]的研究结果不一致,究其原因可能是研究的甘蔗种质数量、血缘及性状指标的不同有关。这与赵俊等[27]在引进甘蔗种质工艺与农艺性状的相关性及聚类分析一文中的“开展甘蔗种质资源的主成分分析与聚类分析时,由于所选的群体和研究性状的不同,其分析与聚类结果也有所差异”是相符的。
在主成分分析的结果基础上进行聚类,可有效地剔除一些无关大局的因子,用少数的主成分因子代替解释生物学的大部分信息既能简化统计又能使结果更精确[31]。通过聚类分析, 可表达各类间遗传距离的远近和差异大小, 是近年来研究品种资源和创新种质选配的较为有效的方法[32]。参考李林林等[28]的对94份苎麻种质的7个主要农艺性状基于4个主成分进行系统聚类的遗传距离阈值,对20份材料基于3个主成分进行系统聚类,遗传距离阈值与其相比更小,说明各类大茎野生种57NG208血缘F2代创新种质间的亲缘关系较近,恰好吻合表1祖代创新种质信息中的创新种质情况,除云瑞15-11、云瑞15-20、云瑞15-55、云瑞15-77、云瑞15-84、云瑞15-85等6份材料外其余材料祖代均是大茎野生种57NG208与南涧果蔗的正反交后代。
利用主成分分析对20份大茎野生种57NG208血缘F2代的6个主要数量性状综合成3个主因子,即产量因子、单茎重产量因子和糖分因子,3个主成分累计贡献率为92.417 %,特征值总和为5.546,代表了样本大部分信息。基于主成分综合得分对参试材料进行评价,显示综合性状较好的材料有云瑞15-80、云瑞15-78、云瑞15-152、云瑞15-44、云瑞15-85、云瑞15-12、云瑞15-45、云瑞15-111、云瑞15-79、云瑞15-84和云瑞15-55 11份材料,这些材料的主成分综合得分皆超过粤糖93-159(CK1)和新台糖22号(CK2),且蔗茎产量和糖分比较理想,推荐优先利用,其次基于3个主成分,采用欧氏距离、离差平方和法对参试材料进行系统聚类,20份参试材料可分成3类,各个类群有其不同特点,在组合选配时可加以利用。
主成分分析和系统聚类分析,能较好地对甘蔗野生种质大茎野生种创新种质资源进行科学分析和评价,为其有效利用提供依据。但在甘蔗育种创新种质全面评价过程中,还应重视田间抗性、适应性等特性的鉴定。