魏伟平,高小菊,吴亮
(河南科技学院数学科学学院,河南新乡453003)
2020 年突如其来的“新冠”肺炎疫情让我们真切的认识到,一个国家的粮食生产能力,在一定程度上决定了国家应对灾害的实力.提高粮食生产的质量与数量,应该是我们一直追求和探索的目标.近十年来,受科学技术水平提高以及托市收购政策推动,我国粳稻播种面积和单产均有明显提高[1-2].影响水稻产量的因素很多,如外界因素(温湿度)、人为因素(灌溉、施肥)和自身遗传因素(不排除有变异的影响)等,然而不同因素之间可能存在一定的相关性.为求水稻高产必须从主要因素着手,对其进行有针对性的改良从而达到高产的目的[3-4].刁立平等[5]认为超高产品种必须有较高的穗重和适宜的穗数基础.杨惠杰等[6]认为超高产水稻的产量构成特征是在适应当地生态条件的足穗基础上培育更大的穗子.邹江石等[7]认为超高产育种的主要途径应是利用杂种优势与良好株型及强生理功能相结合.然而,上述研究多是对影响水稻的因子进行分析, 对于如何筛选影响水稻产量的目标性状以及协调各性状之间的相互关系涉足较少.该研究以2016-2017 年河南省粳稻区域实验共24 个新品种的资料作为数据支撑,对包括公顷产量在内的19 个指标进行分析,主要分析18 个指标与公顷产量之间的相关性,进而得出影响产量的主要指标,以期为育种工作者选育水稻新品种提供科学的依据与参考.
材料选自2016—2017 年河南省粳稻区域实验共24 个新品种的资料,其中米质分析结果汇总中的稻1333、徐32646、垦育808、赛粳16、苑丰136、W023、宏稻59、隆粳99、皖垦粳2181、中作1401、泗稻14-260、淮268、SH1427、中作13264 为两年试验的平均值,其余均为2017 年的资料.24 个新品种依次为稻1333、垦育808、宏稻59、皖垦粳2181、徐32646、苑丰136、泗稻14-260、赛粳16、赛粳988、中作1401、W023、隆粳99、津粳优2186、科粳稻1 号*、SH1427、信粳1787、淮268、稻15198、W037、圣012、中作13264、焦粳6010、播乐1 号*、扬粳508.
调查项目主要有出糙率(%)、精米率(%)、整精米率(%)、粒长(mm)、粒型(长/ 宽)、垩白粒率(%)、垩白度(%)、直链淀粉(%)、胶稠度(mm)、碱消值(级)、公顷产量(kg/hm2)、全生育期(d)、日产量(kg/d)、有效穗(万/hm2)、株高(cm)、穗长(cm)、每穗总粒数(粒)、结实率(%)、千粒质量(g)共19 个指标.
使用统计软件IBM SPSS Statistics 22.0 版本[8]、SAS9.4 版本[9]和R 语言对试验数据进行差异性分析,分析不同品种间的差异性,然后对19 个指标进行相关性分析,得出各指标间相关性的大小.根据各指标间的相关性结果进行逐步回归,筛选出影响产量的主要指标,并建立回归模型,更直观看出主要指标对产量影响的好坏.然后对除公顷产量之外的18 个指标进行KMO 检验和Bartlett 球形度检验,从而对适合的指标进行因子分析.最后,根据因子分析的结果进行聚类分析,将24 个品种归类,对需要改良的品种提出改良方法.
对24 种粳稻样品的19 项指标的均值、标准差及变异系数进行差异性分析,结果见表1.由表1 可知,19 项指标在品种间存在不同程度的差异,其中垩白度的变异系数为69.77%、垩白粒率的变异系数为47.31%、直链淀粉的变异系数为10.27%、胶稠度的变异系数为11.01%、每穗总粒数的变异系数为11.76%,五项均为变异系数超过10%的指标,以垩白度的差异性最高,其他指标变异系数均在10%以下.说明不同品种在外观品质(垩白度、垩白粒率)间的差异极为明显,在理化品质(直链淀粉、胶稠度)间的差异比较明显.而在产量及产量主要影响因素中公顷产量(3.43%)、日产量(3.39%)、结实率(3.22%)、千粒质量(5.45%)这四项变异系数比较小,表明这4 个性状比较稳定,受外界因素较小,可能受品种的遗传基因控制,而其余4 个指标变异系数相对来说较高,说明不仅容易受到遗产因素的影响,还易受环境因素的影响.
表1 差异性结果Tab. 1 Differential results
各指标间的相关性分析见表2.
表2 各指标间的相关性Tab. 2 Correlation results among indicators
(续表2)
表2 相关分析结果显示:其中有23 个在0.01 水平下极显著,有18 个在0.05 水平下显著,其他均不相关.这19 个指标之间存在独立的线性相关性.其中日产量与公顷产量(相关系数0.579)、株高与公顷产量(0.608)、整精米率与公顷产量(0.562)、株高与日产量(0.573)、穗长与日产量(0.677)、每穗总粒数与穗长(0.612)、粒长与穗长(0.587)、整精米率与精米率(0.721)、穗长与株高(0.713)、粒型与株高(0.591)、精米率与出糙率(0.657)、粒型与粒长(0.779)、垩白度与垩白粒率(0.937)均呈极显著正相关;日产量与全生育期(-0.547)、垩白粒率与全生育期(-0.736)、垩白度与全生育期(-0.729)、每穗总粒数与有效穗(-0.803)、粒型与出糙率(-0.642)均呈极显著正相关;垩白粒率与整精米率(-0.587)、垩白度与整精米率(-0.628)、垩白粒率与粒长(-0.605)、垩白粒率与粒型(-0.547)、直链淀粉与垩白粒率(-0.538)、胶稠度与直链淀粉(-0.768)均呈极显著负相关.以上各相关指标都反映了某一特性的同一方面,可用一个代表性指标代替,从而简化样品指标.
由相关分析结果可知不同指标之间存在不同程度的相关性,为了筛选出18 个指标中对公顷产量影响较大的因素[11-12],同时减少各指标间的相关信息,采用逐步回归方法选择对公顷产量(y)的主要影响指标,并建立回归模型.引入自变量的显著性水平α进=0.05,剔除自变量的显著性水平α出=0.1,经6 步运算后,所得回归系数及显著性和回归模型的方差分析结果分别如表3 和表4 所示.
表3 逐步回归系数及显著性Tab. 3 Stepwise regression coefficient and significance
表4 回归模型的方差分析Tab. 4 Variance analysis of regression model
由表4 可以看出,回归模型的F=143.13,显著性P 值为0.000,表明回归方程极显著,模型拟合效果较好,可以用该模型作进一步分析.由表3 各回归系数的显著性可知,除了x6(出糙率%)显著性为0.033 外,其他系数显著性均小于0.1,显著性水平较高,公顷产量关于这些性状的回归方程为:
从回归方程可以看出,6 个指标中除了出糙率参数估计(-1.801)表明对公顷产量有抑制作用外,其余5 个指标均对公顷产量有促进作用.当其他因素固定时,日产量每增减1 kg,公顷产量增减162.663 kg/hm2;全生育期每增减1 d,公顷产量增减4.372 kg/hm2;整精米率每增减1 个百分点,公顷产量增减1.212 kg/hm2;胶稠度每增减1 mm,公顷产量增减0.433 kg/hm2;千粒质量每增减1 g,公顷产量增减1.732 kg/hm2;出糙率每增减1 个百分点,公顷产量减增1.801 kg/hm2.由此可见,在合理种植粳稻的前提下,优化田间管理,提高日产量和全生育期同时降低出糙率、提高整精米率从而达到育出高产高品质粳稻的目的.表3 还可得出标准回归方程为:
依据表1,在其他因素固定的情况下,日产量每增减1 个标准单位(0.14 kg),公顷产量增减1.019 kg/hm2;全生育期每增减1 个标准单位(3.97 d),公顷产量增减0.799 kg/hm2;整精米率每增减1 个标准单位(2.9%),公顷产量增减0.161 kg/hm2;胶稠度每增减1 个标准单位(7.41mm);公顷产量增减0.148 kg/hm2;千粒质每增减1 个标准单位(1.41 g),公顷产量增减0.112 kg/hm2;出糙率每增减1 个标准单位(1.09%),公顷产量减增0.091 kg/hm2.
使用IBM SPSS statistics 19 软件对24 个品种的19 项指标进行KMO 检验和Bartlett 球形度检验,结果显示KMO 检验系数为0.24,小于0.5,不适合进行降维分析.接着对前9 个指标即农艺性状(公顷产量、全生育期、日产量、有效穗、株高、穗长、每穗总粒数、结实率、千粒质量)进行KMO 检验和Bartlett 球形度检验结果显示KMO 检验系数为0.492,小于0.5,不适合进行降维分析.最后对后10 个指标即米质因子(出糙率、精米率、整精米率、粒长、粒型、垩白粒率、垩白度、直链淀粉、胶稠度、碱消值)进行KMO检验和Bartlett 球形度检验结果显示KMO 检验系数为0.612,大于0.5,Bartlett 球形度检验Sig.=0,小于0.05,说明数据呈球形分布可以进行因子分析.
根据KMO 检验和Bartlett 球形度检验结果对24 个参试品种的10 个指标进行因子分析[13],由表5可以看出,试验涉及的10 个指标都能被很好的提取,提取量较低的是直链淀粉含量指标.
表5 主成分分析的公因子方差Tab. 5 Principal component analysis of common factor variance
主成分及方差贡献率如表6 所示.由表6 可知前3 个主成分的特征值均大于或接近1.0,累计方差贡献率达81.63%,表明此3 个主成分能解释所考察10 个指标的81.63%,较好地代表了这些指标.从而可以替代这10 个指标进行分析.
表6 因子载荷矩阵及方差贡献率Tab. 6 Factor load matrix and variance contribution rate
第一个主成分的贡献率为40.47%,该主成分中以垩白粒率(-0.919)和垩白度(-0.923)的载荷比较大,故称为垩白因子,与粒长(0.764)、粒型(0.650)均呈负相关,而垩白度和垩白粒率越大说明水稻品质越差,第一主成分大的品种垩白度和垩白粒率有偏高的趋势;第二主成分的贡献率为26.12%,该主成分中以精米率(0.923)和整精米率(0.754)的载荷比较大,故称为精米因子,与出糙率(0.781)均呈正相关,籽粒成熟、饱满、壳薄的稻谷出糙率高,第二主成分大的品种稻米品质优良;第三主成分的贡献率为15.03%,该主成分中以碱消值(-0.674)和胶稠度(0.642)的载荷比较大,表现为稻米蒸煮食味品质,碱消值与胶稠度没有显著的相关性,胶稠度是评价稻米食用品质和储藏品质的一项重要指标,碱消值越大,则糊化温度越低,其食用品质越好,第三主成分大的品种蒸煮品质优良.不难看出,若将主成分信息用于育种实践,应选择第二、三主成分占比大的品种,这样可以大大降低水稻的垩白率,提高水稻的精米率即外观品质和水稻的碱消值、胶稠度即蒸煮品质,从而培育出高品质水稻.
根据因子分析得出各品种主成分得分如表7 所示,在因子分析的基础上运用系统聚类(离差平方和法,平方欧氏距离)的方法对24 个参试品种进行聚类分析[14-15],聚类结果见图1.
由图1 可知,取定阈值为10 时,可将24 个品种分为4 类.第一类有赛粳16、稻15198、W037、圣012、宏稻59、SH1427、稻1333、中作13264、垦育808、淮268、苑丰136 共11 个品种;第二类有W023、信粳1787、科粳稻1 号* 共3 个品种;第三类有赛粳988、隆粳99、皖垦粳2181、播乐1 号*、泗稻14-260、中作1401、徐32646 共7 个品种;第四类有津粳优2186、焦粳6010、扬粳508 共3 个品种.由此可见,参试品种的品质呈现多样性.
表7 参试品种主成分得分Tab. 7 Principal component scores of participating varieties
图1 参试品种聚类图Fig. 1 Cluster diagram of tested varieties
由表8 可知,第一类出糙率、精米率、整精米率较高,垩白粒率、垩白度较低,直链淀粉、胶稠度、碱消值较高,可得第一类粳稻应是米质较好的一类;第二类出糙率、精米率、整精米率偏中等,垩白粒率、垩白度偏高,直链淀粉、碱消值偏高,胶稠度较低,属于米质一般的一类,可通过施肥来降低垩白率提高精米率从而提高米质;第三类出糙率较低,精米率、整精米率中等,垩白粒率、垩白度偏低,直链淀粉、胶稠度、碱消值偏低,米质一般,同样采取第二类应对措施提高米质;第四类出糙率、精米率、整精米率较高,垩白粒率、垩白度较高,直链淀粉、碱消值较低,胶稠度较高,应对措施同第二类.
表8 不同类品种的主要米质指标Tab. 8 Main rice quality indexes of different varieties
在探讨19 个指标变异系数中发现垩白度、垩白粒率、直链淀粉、胶稠度、每穗总粒数最易受外界因素影响.在相关分析中发现19 个指标之间存在不同程度的相关性,为降低指标之间的相关性,筛选出影响公顷产量的主要因素,故进行逐步回归分析.结果表明,影响公顷产量的主要因素有日产量、全生育期、出糙率、整精米率、胶稠度、千粒质量6 个影响因素,其中出糙率对产量具有抑制作用,其余均为促进作用,说明全生育期长、整精米率高、胶稠度高、千粒质量大的品种产量较高,应在合理密植的基础上,施化优肥与化控管理才能达到高产的目的.
对19 个指标进行KMO 检验和Bartlett 球形度检验发现不适合进行降维分析, 说明这19 个指标之间没有太多的相关性. 对后10 个米质指标进行KMO 检验和Bartlett 球形度检验, 发现KMO 系数大于0.5 适合进行降维分析.进而对24 个品种的米质指标进行因子分析,得出3 个主成分,即垩白因子、精米因子、蒸煮因子,它们解释所考察10 个指标总变异的81.63%.在各品种主成分得分的基础上,将24 个参试品种划为4 类,其中第一类(赛粳16、稻15198、W037、圣012、宏稻59、SH1427、稻1333、中作13264、垦育808、淮268、苑丰136)米质较好,二、三、四类次之,针对二、三、四类米质的情况,通常调节合适的氮肥水平来降低垩白度;另外,水稻垩白度还与灌浆时的温度、土壤水分、胚乳细胞的分裂能力、酶活性等有密切关系.