翟水保,牛文英
随着社会经济的发展,体育产业已成为社会的重要经济组成部分,群众对体育锻炼的需求和体育消费支出方面也随之提高。因此,体育锻炼所具有的经济重要性显得非常突出[1]。目前,体育消费主要集中在门票、会费等一些直观消费上,以此作为全部的体育锻炼花费,具有一定的局限性[2-3]。虽然国外关于群众体育锻炼的研究已获得很多成果,但国内的相关研究却寥寥无几。本文从调查问卷的数据切入,对该地区不同人群的性别、年龄、职业等变量进行研究,分析不同人群在参与体育锻炼、体育消费上的共性,探寻人口学变量、经济变量对体育锻炼参与程度的影响规律,得出群众体育锻炼参与程度、体育消费数量的决定性因素。
以中部地区不同人群的性别、年龄、教育程度、收入、职业、家庭人口、家庭类型等分类变量作为研究对象。
1.2.1 问卷调查法 研究选取了中部地区6个省份(安徽、江苏等)的居民作为被调查者,年龄在16~65岁之间。本次研究采取多批次调查方式,研究小组按照年龄、性别、职业分发调查问卷,共发放问卷700份,回收606份,回收率为86.6%,其中能准确反映调查信息的为567份,有效回收率为93.6%。问卷的描述性统计见表1。
本研究的调查范围较大,调查问卷的题项不足25项,故采用复本问卷信度。调查者让调查对象一次填写两份问卷复本,经计算,问卷题项的相关系数为0.86,符合问卷复本信度值[4]。对问卷效度的测量采用内容和结构效度,并采用“内容效度比”进行衡量[5]。经检验发现指标体系内容和结构效度较好。
1.2.2 数理统计法 采用logit模型(ordered logit models,简称OLM)对各类影响因素进行分析。目前关于定序因变量的处理,默认一个假设:相邻两项之间的间距是相等的。而采用线性回归模型对定序连梁因变量拟合时,会导致估计跑偏[6]。因此,采用logit模型或定序probit模型处理定序变量是较为稳妥的办法。logit模型的基本方程如下:
表1 变量的描述性统计
其中a是截距项(常数),即模型简化为:
Logit模型亦可称为比例优势模型(Proportional odds model),模型计算出的是累积发生率,并不是某一个特定取值的发生率[7]。因此,累积发生比也可简化为:
对特定的yi的预测就是:
注:以上公式中,p为自变量xjc存在的条件概率;α为截距项;x1,x2,x3,…xi为自变量;b 是在 i个自变量条件下,i个因变量的每个自变量的回归系数;间距值tj是一组常数项,共有j-1个取值,是基准累积发生率,即除了参照组之外的j-1个虚拟变量,与参照组对比得出的累积发生率[7-8]。
本研究使用stata10.0进行模型拟合,模型运算用最大似然方法来评估参数。
依据logit模型,对样本中所呈现出的对因变量有影响的自变量做出以下假设:(1)性别、年龄、户口等人口学变量对参与体育锻炼产生影响;(2)职业类别、个人收入变量对参与体育锻炼产生影响;(3)学历、受教育程度对参与体育锻炼产生影响;(4)性别、年龄变量对体育消费产生影响;(5)职业类别、个人收入对体育锻炼消费产生影响;(6)体育锻炼频率越高,相应的体育消费更多;(7)学历、受教育程度对体育锻炼消费产生影响。
本次研究选择了以下自变量:性别、年龄、家庭规模、社区人口规模;职业类别;家庭年总收入;学历(见表1)。通过将自变量的数值纳入模型而得到不同的概率,并将自变量得到的概率进行横向比较,进而分析定序变量与虚拟变量[9]。
检验自变量间的多元共线性,需要检验自变量之间的相关。首先自变量间不能存在高相关的自变量,其次采用方差膨胀因子(VIF)进行测试,进一步检验模型的多重共线性[10]。统计规则要求VIF超过10就可能存在多重共线性,样本经过计算得出自变量的VIF的均值变化范围分别在1.20到4.12之间,说明变量间不存在多重共线性的问题[11-12],数据适合logit模型。
本研究检验自变量的相关关系采用列联表的卡方检验。首先将全样本中的性别、教育程度作为列变量,其他作为行变量,检验发现某些职业类别以及收入水平与体育锻炼消费支出卡方检验不显著[13]。其次,教育程度、收入水平以及职业类别与体育锻炼消费支出卡方检验不显著(Pearson Chi-Square P>0.05);在定期参加运动的人群中下岗人员与领取福利津贴者卡方检验不显著(P>0.05);性别、年龄与参加体育锻炼频次的卡方检验不显著(P>0.05);教育程度、收入水平、某些职业群体与参加体育锻炼的频率的卡方检验不显著(P>0.05);在经常参加体育锻炼的人群中,性别和年龄与参加体育锻炼的频率卡方检验不显著(P>0.05);教育程度、收入水平与职业类别同参加体育锻炼的频率呈卡方检验不显著(P>0.05)。由此说明上述变量间相互独立,不存在相关。
本小节中首先对以体育锻炼参与频率为因变量构建有序logit模型,对因变量进行预测分析;其次,以体育消费为因变量构建有序logit模型,对因变量进行预测分析。
模型的输出结果表明(见表2):模型中3对数据的拟合程度较好(log likelihood=-1 456.741 7,P=0.000),模型 1、模型 2 与模型3的最大区别在于当删去不显著的自变量后对模型进行再次拟合时,模型3删去不显著的变量后,模型的似然指数最低,因此选择模型3。自变量“年龄”、“性别”等具有显著统计学意义(P<0.05),即在控制其他自变量情况下,城市居民因“年龄”、“性别”变量的差异导致体育锻炼行为的显著统计学差异,这说明上述变量会影响人们参与体育锻炼。在以男性为参照组、控制其他变量的条件下,女性参与体育锻炼的可能性比男性少15.79%(1-e-0.1718=0.157 9)。控制其他变量的条件下,年龄每增加一岁引起体育锻炼行为的可能性是(e0.2341=1.027)。以极少参加为参照组,随年龄的增长对体育锻炼参与频率的影响呈如下变化:年龄每增加一岁选择每周参加次数少于1~2次的可能性是年龄减少一岁的0.030 1倍(=e0.2341-6.040);年龄每增加一岁选择每周参加1~2次的可能性是年龄减少一岁的0.490 1倍(=e0.2341-5.550);年龄每增加一岁选择每周参加3~5次的可能性是比不参加或极少参加多0.0143倍(=e0.2341-4.481)、每天都参加比不参加或极少参加多0.018 1倍(=e0.2341-4.248)。上述表明:随着年龄的增长体育锻炼发生的可能性在逐渐提高。控制其他变量的条件下,个人收入的增长引起体育锻炼行为的可能性是1.21(=e0.1905)。收入变化对体育锻炼参与频率的影响呈如下变化:收入增加一个单位选择每周参加次数少于1~2次的可能性是收入不增加的0.002 9倍(=e0.1905-6.040);收入增加一个单位选择每周参加1~2次的可能性是收入不增加的0.004 7倍(=e0.1905-5.550);收入增加一个单位选择每周参加3~5次的可能性是收入不增加的0.013 6倍(=e0.1905-4.481);收入增加一个单位选择每天都参加的可能性是收入不增加的0.017 3倍(=e0.1905-4.248)。上述表明:随着个人收入的增长体育锻炼发生的可能性在逐渐提高。学历程度对城市居民的体育锻炼行为也有影响:以小学为参照组,控制其他变量的条件下,具有中学学历的人群每周参加体育锻炼的次数少于1~2次、每周参加1~2次、每周参加3~5次,每天都参加体育锻炼行为的可能性分别是 0.35%(=e0.41311-6.040)、0.58%(=e0.4130-5.550)、1.71%(=e0.4131-4.481)、2.16%(=e0.4131-4.248);从参与人群的学历来看具有中学学历的群众参与体育锻炼的可能在逐渐升高;具有大学学历的人也呈现出相似的可能性:0.040%(=e0.5281-6.040)、0.066%(=e0.5281-5.550)、1.95%(=e0.5481-4.481)、2.47%(e0.5481-4.248)。上述显示出随着学历的增高,城市居民体育锻炼行为的发生风险也逐渐升高,学历有提高体育锻炼参与的可能性。在职业类别中,以自由职业为参照组,控制其他变量的条件下,机关、事业单位工作人员参与体育锻炼的可能性比自由职业者高26.06%(=e0.2316-1);企业、公司职工参与体育锻炼的可能性比自由职业者少18.81%(=1-e-0.2083);离退休人员参与体育锻炼的可能性比自由职业者高50.77%(=e0.4106-1);农民参与体育锻炼的可能性比自由职业者低10.39%(=1-e-0.1098),学生体育锻炼参与频率呈现出不显著。
表2 体育锻炼参与频率的有序logit回归模型变量的分析表
从表3体育消费的有序logit回归模型变量的分析表可以得出,所选择的自变量来预测因变量(年体育消费)的模型整体显著(likehood=1 967.452 1,P=0.000)),代表样本可以向总体推断,自变量全部显著。以男性为参照组,在控制其他变量不变的情况下,女性增加体育消费的可能性低于男性36.63%(1-e-0.1718=0.366 3)。在控制其他变量不变的情况下,年龄的增长也引起了体育消费增高的可能性是1.045倍(=e0.2341),以0~45元/年为参照组,年龄的增长对体育消费金额的影响呈现如下变化:年龄每增加一岁,人们选择体育消费46~180元/年的可能性是年龄减少一岁的0.030 6倍(=e0.0446-3.531);年龄每增加一岁,体育消费181~360元/年的可能性是年龄减少一岁的0.052 2倍(=e0.0446-2.037);年龄每增加一岁,体育消费751元以上/年可能性是年龄减少一岁的0.136 3倍(=e0.0446-2.037)。上述表明随着年龄的增长,体育消费金额提高的可能性在逐渐提高。个人收入的增长引起了体育消费的增高,可能性是1.189 9倍(=e0.1731),以0~45元/年为参照组,个人收入的增长对体育消费金额的影响呈现如下变化:收入每增长一元钱选择体育消费46~180元/年的可能性是收入少一元钱的0.034 8倍(=e0.1731-3.531);收入每增长一元钱选择体育消费181~360元/年的可能性是收入少一元钱的0.119 6倍(=e0.1731-2.297);收入每增长一元钱选择体育消费361~751元/年的可能性是收入少一元钱的0.155 1倍(=e0.1731-2.037);收入每增长一元钱选择体育消费751元以上/年的可能性是收入少一元钱的0.248 1倍(=e0.1731-1.565)。上述表明随着个人收入的增长,体育消费金额增加的可能性在逐渐提高。个人参与体育锻炼的频率可能会引起体育消费的改变,以极少参加为参照组,个人参加体育锻炼的频率引起体育消费金额的变化如下:每周参加次数少于1~2次选择体育消费为46~180元/年可能性是极少参加的0.030 4倍(=e0.0404-3.531);每周参加1~2次可能选择体育消费181~360 元/年可能性是极少参加的 0.114 7 倍(=e0.1322-2.297);每周参加3~5次可能选择体育消费361~751元/年可能性是极少参加的0.173 9倍(=e0.2873-2.037);以及每天都参加选择体育消费751元以上/年的可能性是极少参加的0.317 1倍(=e0.4166-1.565)。上述表明,随着个人参与体育锻炼频率的增加,体育消费金额也在逐渐提高。学历程度对城市居民的体育消费也有影响,从参与人群的学历来看学历有可能会改变人们在体育锻炼过程中的体育消费。以小学为参照组,控制其他变量不变的情况下,具有中学学历比小学学历在提高体育消费方面高12.76%(=e0.1201-1);具有大学学历比小学学历在提高体育消费方面高26.79%(=e0.2374-1)。上述显示出随着学历的增高,城市居民体育消费行为逐渐升高。在职业类别中,以自由职业为参照组,控制其他变量的条件下,机关、事业单位工作人员在增加体育消费方面比自由职业者高35.02%(=e0.3003-1);企业、公司职工在增加体育消费方面比自由职业者少16.24%(=1-e-0.1773);离退休人员在增加体育消费方面比自由职业者高65.98%(=e0.5067-1);农民参与体育消费的可能性比自由职业者低20.82%(=1-e-0.2335),可见职业类别会造成人们体育消费的差别。
表3 体育消费的有序logit回归模型变量分析表
通过有序logit回归分析,本研究得出以下结论:男性参与体育锻炼频次高于女性,体育消费金额比女性高;随着年龄增加,参加体育锻炼的可能性会提高,但随着年龄增加,体育消费的数量则呈下降趋势;学历越高、经济水平越高的人群参与体育锻炼频次更高,体育消费数量更多,但受教育程度对参与体育锻炼没有影响;机关、事业单位工作人员、离退休人员参与体育锻炼、体育消费的可能性比自由职业者高,企业、公司职工和农民参与体育锻炼、体育消费的可能性比自由职业者低;但经常参与体育锻炼并不代表体育消费的增高,变量对参与体育锻炼有影响,并不意味着同时会带来体育消费的增加。
[1]陈锟,朱敏,王晓红.Logit模型在个体选择行为中的研究演进[J].统计与决策,2006(20):32-35.
[2]杨勇攀,史仕新,陈锟.基于混合Logit模型的消费者偏好测量研究[J].生产力研究,2009(2):22-23.
[3]王立君,马建军.基于秩序Logit模型的学生选教师问题的效用分析[J].山西财经大学学报,2009(2):15-16.
[4]张贵敏.我国城市居民体育消费环境需求探析 [J].天津体育学院学报,2004,19(1):12-14.
[5]郑芳,丛湖平.我国东部城市居民体育服务需求的因素分析[J].体育科学,2005,25(6):121-126.
[6]闫振龙,王云冰,陈善平,等.陕西省知识分子的体育消费需求及影响因素研究[J].西安体育学院学报,2009,26(4):86-90.
[7]马渝,欧阳柳青.我国居民体育消费水平的现状调查与分析[J].武汉体育学院学报,2002,36(3):45-49.
[8]EBER N.Sports practice,health and macroeconomic performances:An endogenous growth model[J].Journal of Sport Economics,2003,4(2):126-144.
[9]GABLE A,OHL F.Sport culture and material culture:The example of student's consumption[J].Paper presented at the 10th EASM Congress,2010,8:24-26.
[10]KUTNER,NACHTSHEIM.Neter:Applied Linear Regression Models[M].4th Edition,2009:124-127.
[11]GRATTONC,TAYLORP.From economic theory to leisure practice via empirics:the case of demand and price[J].Leisure Studies,2008,14(4):245-261.
[12]LAMB A,ASTUARIASP.Sports participation-how much does it cost?[J].Leisure Studies,1992,11(1):19-29.
[13]MCKELVEY R D,ZAVNINA W.A statistical model for the analysis of ordinal-level dependent variables[J].Journal of Mathematical Sociology,1975,4:103-120.