李传伟
[摘要] 直线回归研究的是一个因变量与一个自变量之间的回归问题,但是,在社会经济领域的许多实际问题中,影响因变量的自变量往往不止一个,而是多个,比如血压受年龄、性别、体重、性格、职业(体力劳动或脑力劳动)、饮食、吸烟、血脂水平等因素的影响,因此需要进行一个因变量与多个自变量间的回归分析,即多元回归分析。其中最为简单、常用并且具有基础性质的是多元线性回归分析,许多非线性回归和多项式回归都可以化为多元线性回归来解决,因而多元线性回归分析有着广泛的应用。目前,在体育统计学中大多采用SPSS统计软件进行回归分析。本文利用Excel的数据分析工具,通过建立“最优”回归方程对因变量进行预测或控制。
[关键词] Excel; 向前增选法; 多元回归; 体育
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 05. 049
[中图分类号]G642;TP317.3[文献标识码]A[文章编号]1673 - 0194(2012)05- 0089- 02
1引言
很多时候,我们研究的问题是受多个因素影响的,需要建立多元回归方程,进行多元回归分析。在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。
多元线性回归模型的一般形式:
Y = a + b1X1 + b2X2 + … + bkXk
多元线性回归预测的步骤:
第一步,获得候选自变量和因变量的观测值;
第二步,采用向前增选法从候选自变量中选择合适的自变量;
第三步,确定回归系数,判断回归方程的拟合优度;
第四步,根据回归方程进行预测。
2应用实例
采用随机抽样的方式从40个学生中抽取22个样本,记录其肺活量、体重、速度灵巧项目成绩、柔韧力量项目成绩、脉搏跳动次数等。将这些数据汇总显示在工作表A25:F47单元格区域,如图1所示。试根据这些数据找到肺活量与体重、速度灵巧项目成绩、柔韧力量项目成绩、脉搏跳动次数4个自变量之间的关系,以便进行肺活量预测。试根据这些数据建立回归模型。如果某学生体重、速度灵巧项目成绩、柔韧力量项目成绩、脉搏跳动次数分别为:70千克、14秒、18厘米,70次/分,试预测其肺活量。
3建立模型
3.1采用图表法判断各变量与肺活量的线性相关关系
分別选中体重与肺活量、速度灵巧项目与肺活量、柔韧力量项目与肺活量,脉搏跳动次数与肺活量,利用图表向导建立x、y散点图,观察是否是线性相关。在此基础上右击散点图添加趋势线,在打开的“添加趋势线”对话框中作如图2的设置。其中在“类型”选项卡中选择“线性图”, “选项”选项卡中选中“显示公式”和“显示R平方值”。结果如图3所示。其他同理。
其中,R2 为拟合系数(相关系数),分别为:0.836 9 、0.601、0.937 4、0.506 6,从中可以看出体重、速度灵巧项目、柔韧力量项目、脉搏跳动次数都与肺活量高度相关,即它们都对肺活量产生影响。
3.2利用向前增选法进行自变量筛选
筛选结果如图4所示,其分析过程如下。
第一轮比较:X1、X2、X3、X4分别代表体重、速度灵巧项目、柔韧力量项目、脉搏跳动次数,利用数据分析工具—回归分析报告或添加趋势线的方法得到相关系数R2。
数据分析工具—回归分析报告的操作步骤如下:
首先选择“工具”菜单 “加载宏”命令,在打开的“加载宏”对话框中选中“分析工具库”;单击“工具”菜单 “数据分析”命令,在打开的“数据分析”对话框中选中“回归”,作如图5的设置。得到的体重回归分析报告如图6所示。
其中R为0.836 864,截距为864.753 844 3,斜率为17.229 347 96,与图表法相吻合。按照同样的方法分别建立速度灵巧项目回归分析报告、柔韧力量项目回归分析报告、脉搏跳动回归分析报告,经比较结果X3为最优。如表1所示。
第二轮比较:自变量分别为X3,X1;X3,X2;X3;X3,X4
其结果如表2所示。
第三轮比较:自变量分别为X3,X1,X2;X3,X1,X4
其结果如表3所示。
3.3建立“最优”回归方程
经过3轮比较,找出最优的自变量分别为:X3,X1,X2,建立回归分析报告,如图7所示。
以此建立回归方程:Y= 220.712 392 2 + 3.479 453 796X1 + 10.443 020 73X2 + 114.664 102X3
从回归方程也可以看出,肺活量与体重、速度灵巧项目成绩、柔韧力量项目成绩均有线性正相关关系。
3.4进行预测
根据体重—速度灵巧项目—柔韧力量项目回归分析报告,已知:回归方程截距为220.712 392 2,斜率1(对应体重)为3.479 453 796,斜率2(对应速度灵巧项目)为10.443 020 73,斜率3(对应项目柔韧力量项目)为114.664 102,根据前述已知条件,预测的肺活量为2674.43毫升。