李 硕,王馨彤,杨吉斌,张有江
(1.陕西师范大学数学与统计学院,陕西 西安 710062;2.昌吉学院数学与数据科学学院,新疆 昌吉 831100)
棉花是新疆最具经济规模和种植优势的经济作物,棉花产业是新疆的重要综合支柱型经济产业,发展棉花产业是保障新疆国民经济稳定健康发展和推动农牧民收入稳定增加的一个重要途径,在新疆整个市场经济和国民社会持续发展中一直占有举足轻重的地位.受到国家经济结构不断调整的影响,我国棉花产量呈现波动收窄的趋势,其中影响因素有种植面积、降水量、土壤、气候、水源、化肥的搭配使用方法及用量等.这些因素引起了社会各界的高度重视[1-9].为探明昌吉州棉花产量影响因素的相关问题,本研究选取棉花种植面积和降雨量2个变量,建立多元线性回归模型,对棉花产量影响因素进行分析,以期为昌吉州棉花生产提供参考.
对昌吉州1998年至2017年棉花产量、种植面积以及降水量进行分析,数据来源于新疆统计年鉴.
表1 昌吉州历年棉花产量、种植面积及降水量
多元线性回归分析主要用于分析多个解释变量对同一个被解释变量的影响.本研究中,笔者首先根据拟合函数对收集到的数据进行拟合并绘制散点图,通过观察2个变量之间的散点图趋势,进行相关关系的显著性检验,选择合适的模型拟合事物的变化趋势.根据收集到的时间序列样本数据建立回归模型;其次,运用最小二乘法估计出模型中的各个回归参数,得到回归拟合值,最终获得相应的线性回归方程.最后,用t检验和F检验对回归系数进行检验,运用F检验判断自变量之间的关系以及回归模型是否合适.
通过SPSS 20.0软件绘制棉花产量与种植面积、降水量的散点图(见图1,2),观察可得棉花产量与种植面积、降水量大致呈现线性回归趋势.
图1 棉花产量与种植面积的散点图
根据图1和图2可知,棉花产量随种植面积的增加而增加,昌吉州降水量集中分布在200~400 mm范围内,解释变量种植面积、降水量与被解释变量棉花产量成正相关关系,因此,用二元线性回归模型尝试建模:
图2 降水量与棉花产量的散点图
y=β0+β1x1+β2x2.
其中:y表示棉花产量;x1表示种植面积;x2表示降水量;β0表示回归常数;β1,β2表示回归系数.
通过最小二乘法解出回归系数:
运用软件SPSS 20.0对种植面积、降水量解释变量进行相关性分析,据表2所示,种植面积、降水量二者之间的相关系数为-0.101,可以看出种植面积和降水量之间不具有较强的相关性,另外Durbin-Watson统计量的值为1.492,因此无需考虑多重共线性的问题,种植面积和降水量对棉花产量的影响可以直接进行多元线性回归分析.
表2 种植面积与降水量相关性分析
多元回归分析建模结果见表3.
表3 回归系数的确定(因变量:棉花产量)
模型各系数的估计值β0=-89 754,β1=1 797,β2=298,从各个系数的显著性水平来看,对于种植面积,P=0.002<0.05,说明种植面积显著影响棉花产量;对于降水量,P=0.153>0.05,说明降水量对棉花产量的影响不显著,但从相关系数可以看出,二者之间仍然存在一定的线性趋势,并且由下一节内容可知,模型整体可通过F检验,于是确定线性回归方程为:
y=-89 755+1 797x1+298x2.
从回归方程可知,在降水量不变的情况下,种植面积增大1个单位,棉花产量平均增加1 883.922 t;而如果固定种植面积,降水量每增加1个单位,棉花产量平均增加341.296 t.
(1)原假设和备择假设.
原假设:H0:β1=β2=0(F检验原假设:模型中参数均为0).
备择假设:H1:β1,β2不全为0(F检验备择假设:模型中参数不全为0).
若原假设成立则自变量x对因变量y影响不显著,反之,自变量x对因变量y影响显著,变量之间有显著线性的关系.
(2)检验结果见表4.
表4 F检验
根据F检验的结果,P=0.004<0.05,可知回归方程整体显著.说明棉花产量与种植面积及降雨量具有线性趋势.
表5 变量的残差分析
图3 残差PP图
图4 残差直方图
由图3可以看出,残差观测值基本在预期值周围波动,两者呈现明显的线性关系;由图4可以看出,残差的分布基本具有正态性.
通过F检验证实模型整体有效,因此采用公式y=-112 499.606+1 883.922x1+341.296x2计算棉花产量预测值,并由此画出棉花产量预测值和真实值的拟合图(图5),从图5可以看出,模型整体拟合效果较好.
图5 回归方程预测结果
根据棉花种植面积、降水量与棉花产量的散点图以及线性回归模型的数据分析结果可知,棉花种植面积、降水量对全年棉花顺利出苗生长至关重要,其中全年棉花种植面积大小是全年棉花产量的重要影响因素之一,同时日照量、降雨季的天数、降水量及土壤湿度等也会影响全年棉花产量,日照量和土壤湿度的增加均有利于棉花出苗,昌吉州的日照一般在棉花出苗期就已经能充分满足全年棉苗生长所需的日照量,昌吉州的降水量处在200~400 mm之间且变化稳定,因此降水量对全年棉花产量影响不显著.故本研究认为棉花种植面积是昌吉州棉花产量的关键影响因素.