山西省居民体育参与影响因素的二项逻辑回归分析

2015-01-29 10:29
体育研究与教育 2015年1期
关键词:城市居民回归系数几率

褚 婷

自《全民健身计划纲要》颁布以来,我国学者对于居民体育参与的研究比较多,在中国知网中以“居民体育参与”“居民体育锻炼”“居民体育行为”为关键词检索发现,有关“影响因素”的研究中,多是以描述性统计和相关性研究为主,两者都无法表明影响作用的大小,因果关系也无法得到证实[1];而采用Logistic回归分析,可用于因素的筛选,预测应变量发生的概率。因此,笔者以山西省城市居民为研究对象,采用二项logistic回归分析对影响居民参与体育的因素进行分析与探讨,以期为体育参与分析提供借鉴。

1 研究对象与方法

1.1 研究对象

以山西省城市社区18岁以上居民为调查对象,了解其体育参与影响因素。

1.2 研究方法

1.2.1问卷调查法本调查问卷包括两大部分,第一部分为居民基本情况调查,包括年龄、性别、受教育情况、职业、月收入、婚姻情况;第二部分为居民体育活动情况,包含参与项目、动机、场所、参与情况、体育消费、体育指导等多个问题。对山西省太原市、大同市、晋中市、长治市、运城市、朔州市、临汾市、忻州市、晋城市、吕梁市、阳泉市11个市级地区城市社区居民随机分层发放问卷共1 800份[2],收回1 478份;对问卷的信度和效度检验分别采用内部一致性检验(P<0.05)和专家判断法,认为该问卷符合社会调查。

1.2.2数理统计法本研究对收回的问卷用Excel进行录入,然后导入进SPSS21.0软件。采用二项logistic回归分析,对影响居民体育参与的影响因素进行分析。二项logistic回归分析,是在因变量只可以取二值的情形下,如“是与否”“有效与无效”,先将取值在实数范围内的值通过logistic变换转化为目标概率值,然后进行的回归分析[3]。

2 研究结果与分析

2.1 居民体育参与影响因素回归模型变量的描述

在参考“居民体育参与影响因素”的研究中[4,5],结合本问卷的设计内容的需要,将年龄、性别、婚姻、文化程度、职业、收入、体育消费、区域、体育指导九个因素作为自变量;将体育参与作为因变量(Y)。通过回归模型来分析哪些自变量会对因变量(Y)产生影响。鉴于自变量取值本身是用文字描述的,要把他们代入回归模型中,就必须先将文字用代码来表示,形成哑变量[6]。借鉴刘大雄[4]、何国民[5]对“月收入和体育消费”分类方法,将问卷中的数值分类自变量分别进行编码,由低到高分为五档:即低、中低、中等、中高、高。在表1中,性别(X3)、婚姻(X6)、体育指导(X9)只有两个水平,在回归模型中只引入一个哑变量;其余的自变量有k个水平,需要在回归模型中引进k-1个哑变量,分类变量见表1。

表1 影响居民体育参与各变量及分类变量的编码

2.2 居民体育参与回归模型检验

为了检验表1中九个自变量对因变量运动参与(Y)的影响,笔者进行了二项logistic回归分析。对于居民体育参与回归模型的显著性检验采用X2检验和Hosmer-Lemeshow检验,通过两种方法对模型拟合度作出综合判断更为科学[7]。居民体育参与回归模型系数显著性检验结果见表2。从表2中得知,回归模型整体拟合度检验的卡方值是149.690,P值为0.000且小于0.05,达到显著性水平。在Hosmer-Lemeshow检验中,当P值没有达到显著性水平时,才能表示回归模型拟合度较好。P值为0.155,大于0.05(见表3),未达到显著性水平,说明回归模型整体拟合度良好。通过两种检验方法,说明回归模型具有统计学意义,自变量可以有效预测因变量体育参与的情况。

表2 回归模型系数的综合检验

表3 Hosmer-Lemeshow检验

2.3 二项logistic回归结果分析

2.3.1性别、职业、婚姻情况、体育指导在回归分析结果中,性别、职业、婚姻情况、体育指导对于山西省城市居民体育参与不具有显著性意义,没有进入回归方程。从性别、婚姻、体育指导统计结果来看,回归系数β分别为0.009、-0.259、0.238,P值为0.945、0.142、0.132。性别、婚姻这两项调查结果与其他学者以区域或全国为调查样本的结论一致。说明这两个自变量不能对城市居民参与体育运动进行预测。由职业(X5)对应的10个哑变量(见表1),在其他条件不变的情况下,以党政、事业机关干部为参照,其余九个哑变量与它都没有显著性差异。职业是城市居民社会地位的标尺。本次调查,说明职业对城市居民参加体育运动的预测意义不大,职业的不同不影响城市居民的体育参与。

“体育指导”在问卷中的问题是“体育活动中有专人进行指导吗?”,得到的统计结果是76.5%的城市居民在体育运动中没有专人进行指导。可以看出,从数据的描述性统计与回归系数检验来看,说明有无专人指导对于山西省城市居民参与体育运动影响不大。在前期研究成果中也体现出城市居民参与体育动机排在首位的是“强身健体(59%)”;参与项目为跑步散步(41.9%);活动场所为公园广场(24.7%)、社区场所(21.8%)[2]。这些调查结果也说明目前山西省居民参与体育的低成本性、活动项目简单化以及对“体育服务”没有过多的需求;也反映出山西省城市居民选择体育锻炼场所为社区,但社区体育活动开展缺少组织性,社会体育公共服务有待进一步提高。

2.3.2年龄由表4可知,年龄对应的五个哑变量差异性非常显著。通过回归系数和胜算比(EXP)可以看出,在其他条件不发生变化的前提下,年龄在26—35岁、36—45岁、46—55岁、56—65岁、66岁以上的居民参与体育运动的几率分别是年龄在18—25岁的1.756、1.657、2.601、2.375、2.866倍。年龄在26—35岁、36—45岁居民体育参与几率要明显低于其他三个年龄段。这与国家体育总局公布《2013年20—69岁人群体育健身活动和体质状况抽测工作调查结果》[8]基本一致。36—45岁(P=0.04)年龄段的城市居民在社会工作、经济压力、家庭因素等方面的影响下,会造成体育参与中断,而再往上年龄越大的人,随着闲暇时间的增多,发生体育运动的机会也逐渐增加。这与回归模型得出的结果一致,66岁以上居民参与体育的发生比是最高的。

2.3.3文化水平由表4中数据可以看出,文化水平对于城市居民体育参与具有重要影响,进入回归方程。本研究以高中(中专)以下学历为参照,大专、本科、硕士、博士及以上的回归系数分别是0.529、0.520、0.837、2.037,四个哑变量差异性非常显著;从胜算比来看,在其他条件不变的情况下,大专、本科、硕士、博士及以上学历的城市居民参与体育运动的几率分别是高中以下文化水平的1.697、1.681、2.308、7.671倍,说明文化水平的越高的人参与体育运动的几率越高。这一结论与国内众多研究结果一致。可以理解为文化水平高的人,受教育程度相对就高,对于体育的需求以及认识要高于低层次的人群,参与体育运动的概率也就相对较高。

表4 居民体育参与logistic回归分析结果

2.3.4月收入由表4可以看出,月收入对应的四个哑变量,以低收入为参照,中低收入、中等收入、中高收入、高收入的回归系数分别是-0.225、-0.213、-0.381、-1.250。回归系数为负值,说明伴随着收入的增加,城市居民体育参与的几率将会下降。除了高收入以外,其他回归系数都不显著。中低收入、中等收入、中高收入P值分别为0.907、0.410、0.144,说明在其他条件不变的情况下,这三个变量不能有效预测因变量的概率值。从统计结果来看,高收入与城市居民体育参与之间显著关联,城市居民体育参与发生在高收入水平的可能性要低于低收入居民,通常可以解释为高收入城市居民主要缘于工作繁忙,没有时间参与体育运动。《2014中国劳动力市场报告》指出不同就业身份人员的工作时间差异较大,其中雇主的周工作时间最长,超过47时∕周[9]。雇主必然是高收入群体,工作时间的加长,除去生活必要时间(睡眠、家务劳动等),自己可以支配的时间将会减少,那么参与体育运动的几率将会降低。这与本研究得出的结论基本一致;另一方面,在年龄分析中提到城市居民在26—35、36—45岁发生体育参与的几率将会降低。通过对年龄和月收入进行交叉列表分析,发现有33.9%和28.1%的高收入城市居民在这两个年龄段中,占到高收入居民总数的62%。这个结论从一定程度上也可以对高收入城市居民参与体育概率低作出解释。

何国民[5](2006年)、马江涛[10](2014年)在其研究中都认为个人收入对体育锻炼和体育人口影响不显著;本研究中月收入也只有高收入对城市居民体育参与具有预测意义,且呈负相关。马江涛在研究中指出居民经济状况影响运动项目的选择,但是对于是否参加体育锻炼影响不大。因此,在问卷中也将参与体育项目与月收入进行相关分析,得到结果相关系数是0.215,P=0.014,小于0.05,达到显著。这说明本研究与马江涛研究结论基本一致,月收入同样影响体育项目的选择。

2.3.5体育消费在表4中,体育消费与城市居民体育运动参与呈正相关。其对应的四个哑变量,中低消费、中等消费,中高消费、高消费回归系数分别是0.955、0.986、1.224、1.288。以低消费哑变量为参照,差异性达到非常显著;在其他条件不变的情况下,高消费、中高消费、中等消费、中低消费居民参与体育的几率分别是低消费居民的3.627、3.401、2.680、2.600倍。体育消费水平在调查中以年为单位进行统计,在回归模型中,消费水平可以进入到方程中,说明体育消费水平高低对于预测城市居民参与体育运动具有重要影响。该研究结果与何国民[5]得出的结论一致,说明体育消费水平越高,参与体育运动的几率会越大。

2.3.6区域在调查中,将山西省11个市级地区按照城镇体系规划、地理位置划分为四个区域,分别是晋中、晋北、晋东南、晋南。从表4中可以看出,区域(X1)与城市居民参与体育也有显著影响。以晋南区域为参照组,晋东南、晋北、晋中所赋予的哑变量的回归系数分别是-0.111、0.385、0.614,其中只有晋东南回归系数检验值不显著,P>0.05,而且是负相关;以晋南地区为参照,晋东南地区发生体育运动的几率要下降。其他回归结果可以说明,与晋南地区城市居民参与体育运动情况相比,晋中和晋北地区居民参与体育运动的几率分别要比晋南地区高1.848和1.469倍。在其他条件不变的情况下,晋中地区居民参与体育的发生比是最高的。将区域作为变量放入回归分析中,主要是了解区域分层是否对体育参与具有预测意义,结论是肯定的。

3 结论

(1)以山西省城市居民(N=1 478)为调查样本量,将体育参与与否列为因变量,对年龄、文化水平、区域、月收入、性别、婚姻、职业、体育指导、体育消费9个因素进行分类变量后采用逻辑回归分析,通过X2检验和Hosmer-Lemeshow检验,证明城市居民体育参与回归模型整体拟合度良好,具有统计学意义。

(2)在回归方程中,进入方程模型的变量有年龄、文化水平、月收入、体育消费、区域,这些回归系数检验值达到显著性,说明这些变量对于预测山西省城市居民参与体育运动具有意义,但性别、婚姻、职业、体育指导对山西省城市居民参与体育运动影响不大。

(3)山西省居民文化水平、年龄、体育消费与参加体育运动呈正相关,也就是说随着文化水平和体育消费水平提高,参与体育运动发生的几率也会增加;体育运动参与几率伴随着年龄的增大也会加大,但在26—35岁、36—45岁发生体育参与的几率要明显低于其他年龄段。

(4)山西省城市居民月收入与参加体育运动呈负相关,说明城市居民体育参与几率随着收入的增加而降低。在哑变量中只有高收入回归系数检验达到显著;晋中、晋北城市居民参与体育运动的几率分别是晋南地区的1.848和1.469倍,而哑变量中晋东南回归系数检验不显著。

[1] 石岩.体育研究中“影响因素”研究方法刍议[J].体育学刊,2014,21(4):2~5.

[2] 褚婷.社区居民体育锻炼特征分析及对策研究——以山西省社区居民为例[J].中国学校体育(高等教育),2014,1(6):11~14.

[3] 陈胜可.SPSS统计分析从入门到精通[M].北京:清华大学出版社,2010.

[4] 刘大雄,陆明涛.中国居民体育运动参与的二项逻辑回归分析[J].武汉体育学院学报,2014,46(2):49~53.

[5] 何国民.体育人口形成因素的二项logistic回归分析[J].武汉体育学院学报,2006,40(12):63~67.

[6] 贾俊平.统计学[M]. 北京:中国人民大学出版社,2011.

[7] 吴明隆,涂金堂.SPSS与统计应用分析[M].辽宁:东北财经大学出版社,2012.

[8] 国家体育总局. 2013年20—69岁人群体育健身活动和体质状况抽测工作调查结果[EB/OL].www.sport.gov.cn/n16/n1107/n1788/4428310.html,2013-08-06.

[9] 北京师范大学劳动力市场研究中心.2014中国劳动力市场报告[EB/OL].zqb.cyol.com/html/2014-11/29/nbs. D110000zgqnb_03.htm,2014-11-30.

[10] 马江涛,于显洋,李树旺,等.中国居民参与体育锻炼影响因素的序次逻辑回归分析[J].成都体育学院学报,2014,40(9):16.

猜你喜欢
城市居民回归系数几率
基于轨迹数据的城市居民出行活动规律提取
基于混合研究方法的我国城市居民体育经历中断行为探因
健康教育与健康促进对城市居民行为影响的效果
啁啾激光场对电离及解离的影响
Finding the Extraterrestrial
多元线性回归的估值漂移及其判定方法
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
晒后修复SOS
晒后修复SOS