基于分位数回归的城市居民体育消费研究
——以北京市第3次群众体育调查数据为例

2017-06-05 14:52李骁天向祖兵郭世豪王凯珍唐莞怡
上海体育学院学报 2017年3期
关键词:位数学历北京市

李骁天, 向祖兵, 郭世豪, 王凯珍, 唐莞怡

(1.首都体育学院 休闲与社会体育学院,北京 100191; 2.福建师范大学 体育科学学院,福建 福州 350108; 3.首都体育学院 研究生部,北京 100191; 4.首都体育学院 学院办公室,北京 100191; 5.中央财经大学 外国语学院,北京 102206)



基于分位数回归的城市居民体育消费研究
——以北京市第3次群众体育调查数据为例

李骁天1, 向祖兵2, 郭世豪3, 王凯珍4, 唐莞怡5

(1.首都体育学院 休闲与社会体育学院,北京 100191; 2.福建师范大学 体育科学学院,福建 福州 350108; 3.首都体育学院 研究生部,北京 100191; 4.首都体育学院 学院办公室,北京 100191; 5.中央财经大学 外国语学院,北京 102206)

采用问卷调查法、数理统计法等,对北京市3 304名户籍居民进行整群分层随机入户调查。调查内容包括体育培训、体育信息、体育赛事、体育健身、体育器材设备、运动服装鞋帽等费用;使用一般线性回归模型(OLS)、分位数回归模型(QR)分析不同特征居民的体育消费水平现状及差异。结果显示:性别、婚姻、年龄、收入、地域、工作类型对体育消费有影响,在体育消费30%、40%、50%、60%、70%、80%、90%分位数有显著性差异。提示,相比一般线性回归,分位数回归能更精准地反映不同自变量的不同分布对因变量的影响。

城市居民; 体育消费; 一般线性回归; 分位数回归; 北京市

Author’s address 1.School of Leisure and Social Sports, Capital University of Physical Education, Beijing 100191, China; 2.School of Sports Science, Fujian Normal University, Fuzhou 350108, Fujian,China; 3.Graduate Department, Capital University of Physical Education, Beijing 100191, China; 4.College Office, Capital University of Physical Education, Beijing 100191, China; 5.School of Foreign Language, Central University of Finance and Economics, Beijing 102206, China

体育消费是消费构成中用于改善社会健康状况、优化个人生活方式、提高生活质量的重要手段,是实现劳动力内涵扩大再生产的要素之一[1],是现代生活消费的一个重要组成部分,对整个体育经济具有指向作用。扩大居民体育消费可以促进居民积极参加体育锻炼活动,从宏观经济而言可以拉动内需,促进体育产业升级,有助于推动我国供给侧改革[2]和落实国务院46号文件精神。体育消费还对国民身体素质的增强及群众体育的发展具有十分重要的意义。研究城市不同性别、学历、收入居民体育消费的差异,并找出产生这些差异的原因,对促进我国体育产业稳步发展具有重要的意义。

关于体育消费的文献,主要集中研究消费经济学、传统社会学和消费文化学3个方面[3]。定量研究方法是考察体育消费的主要方法,其中以采用描述性统计方法的文献为主,推断性统计方法的文献为辅,质性研究方法总量不多。推断性统计方法中,线性回归(OLS)是主要研究方法。OLS往往只能得到一组系数估计值,仅能解释为平均而言,却无法更深入分析不同的人口学变量情况下体育消费可能存在不同的相关关系。OLS只着重于整个分布的集中趋势,对于整个分布的描述略显不足,不但易使回归结果受到极端值的支配,也忽略了位于体育消费额尾端的观察值与被解释变量之间的关系。

Koenker等[4-6]提出分位数回归(quantile regression,QR)方法,该方法较之最小二乘法,在处理有异常值数据时更为稳健,反映数据信息更为全面, 更能精确地描述自变量X对于因变量Y的变化范围以及条件分布形状的影响。QR方法在国外得到了迅猛的发展及应用,其研究领域包括经济、医学、环境科学、生存分析以及动植物学等方面。在体育运动领域使用QR方法的研究较鲜见[7-8]。本文采用QR方法分析体育消费的影响因素,并对比OLS与QR在研究体育消费自变量影响程度的异同。选择QR与OLS共同探讨市民体育消费,识别不同学历、性别、城乡、收入和婚姻居民的体育消费水平的特征,考察居民不同分位数自变量对体育消费影响的程度[9],对研究我国城镇居民体育消费规律具有重要的启发意义。

1 研究方法

1.1 问卷调查法 设计北京市居民体育活动参与的调查问卷。问卷涉及居民的个人基本信息、体育活动参与、体育需求、活动类型、活动时间和疾病健康及其满意度6个方面(表1)。本问卷由零点研究咨询集团进行发放、回收和数据录入,向北京市16个区县、2个经济开发区发放问卷,回收有效问卷3 304份,根据统计分析的要求进行数据清理。调查详细情况可以参阅北京市体育局与首都体育学院发布的北京市第3次群众体育现状调查报告。

1.2 数理统计法 (1) 分位数回归。QR是考察体育消费分布上差异效应的有效方法。自Koenker[5]在1978年提出QR以来,由于其能够考察解释变量对被解释变量在扰动项的不同分位点上的异质性影响,在收入分配等方面得到了广泛的应用。与OLS估计相比较,QR的优点在于:① 回归参数能够随着因变量的不同分布点变动,更有利于对现象之间的回归关系进行更为细致、全面的分析;② 估计结果更加稳健,因为对误差项分布不具体假定,对非正态分布或者异常值拥有耐抗性[10-12]。不同于OLS 用来估计自变量对因变量条件平均数的效果,OLS回归的意义在于,设因变量的期望是自变量的线性函数。QR分析目的在于观察分布中不同分位点上自变量的不同作用程度。分位回归的思想在于,因变量的条件分位数是自变量的函数(这也正是“条件分位数”的意义)——无论是高分位数还是低分位数,它们都是自变量的函数。

表1 调查对象基本情况

分位数的定义:设随机变量Y的分布函数为F(y)=P(Y≤y),则Y的第τ分位数为

其中,中位数可以表示为Q(1/2)。对于Y的一组随机样本{y1,y2,…,yn},样本均值是min∑ni(yi-ξ)2的最优解,而样本中位数是最小化残差绝对值和的解,即

对于第τ分位数,可以求解下式:

等价表示为:

其中,

其中,I(0)为示性函数。对于一般线性条件均值函数E(Y|X=x)=x′β,通过求解

得到参数估计值。而一般线性条件分位数函数为

通过求解

得到参数估计值。对于任意的τ∈(0,1),参数β(τ)称为第τ回归分位数[7]。

本文将OLS、QR模型一起考察并进行对比,参照现有文献对体育消费的OLS模型的研究,设定以下计量模型:Y=β0+β1x+ε(1)。其中:Y为年体育消费;x为性别、学历、城镇、年龄、职业、收入、婚姻和体育参与;ε为误差项。

将年体育消费作为被解释变量,将影响年体育消费的因素作为解释变量,建立如下QR模型:

gender×γτ+urban×φτ+edu×ϑτ+

marri×ωτ+income×τ+old×φτ

(2)

其中:y表示年体育消费金额;x表示影响y的各个因素,包括年龄、收入;occupation表示职业,设置了国有企事业单位、专业技术人员、办事有关人员、商业服务人员、体力工作人员、其他人员、退休人员8个类别变量;gender表示性别,设置了男、女2个类别变量;edu表示学历,设置了小学、中学、大学3个类别变量;urban表示城乡,设置了城市、郊区2个类别变量;marri表示婚姻,设置了未婚、已婚、离异与丧偶4个类别变量;tiyucanyu表示体育活动参与,设置了经常体育参与、体育参与、从不参与体育3个类别变量;income表示个人年收入,设置了1 000元以下、1 000~3 000元、3 001~5 000元、5 001~8 000元、8 000元以上、无固定收入6个类别变量;old表示年龄,设置了20岁以下、20~29岁、30~39岁、40~49岁、50~59岁、60~69岁、70岁及以上7个类别变量;ατ、βτ、δτ、γτ、φτ、ϑτ、τ分别表示对各个变量进行参数估计的第τ个分位数的回归参数。

在计算时分别对10%、20%、30%、40%、50%、60%、70%、80%、90%分位数进行回归分析。统计软件使用stata13.0,QR的程序采用qreg程序包,执行QR时采用了稳健标准误,整理统计结果,剔除不显著的分位点回归结果。具体计算,估计值通过bootstrap方法迭代20次得到。

(2) 变量设计。对北京市不同性别、年龄、教育程度、职业类型、收入、婚姻状况、城郊区类型的居民体育消费分别进行分析。对比不同类别居民间体育消费差异程度,采用OLS模型与RQ模型考察北京市居民体育消费的主要影响因素。在OLS模型中已对因变量体育消费进行双边缩尾处理,并进行正态转化,符合OLS模型方程对因变量、自变量的要求。

因变量:体育消费是连续性变量。体育消费调查内容涉及购买体育器材、运动服装鞋帽、体育知识信息(如订阅体育报刊、购买体育图书),观看各类体育赛事(如购买门票、观赛期间购买餐饮、纪念品等),付费参加体育健身活动(如购买健身俱乐部的会员卡、活动的指导费、场地费、参赛报名费等),参加体育培训班 (如支付暑期游泳班的费用),其他(请注明内容和金额)。测量单位为元/a。

自变量:将年龄划分为20岁以下、20~29岁、30~39岁、40~49岁、50~59岁、60~69岁、70岁及以上几个年龄段,分别赋予编号“1、2、3、4、5、6、7”。性别:将男性定义为1,将女性定义为2。区域:将北京市城六区定义为城区,其余地区定义为郊区,“0”代表城区,“1”代表郊区。学历:将学历划分为小学、中学、大学,分别赋予编号“1、2、3”。婚姻:将婚姻划分为未婚、已婚、离异、丧偶,分别赋予编号“1、2、3、4”。职业:将职业划分为国有企事业单位人员、专业技术人员、办事有关人员、商业服务人员、农林牧副渔业人员、操作有关人员、失无业人员、其他人员、退休人员,分别赋予编号“1、2、3、4、5、6、7、8、9”。个人收入:指个人每月的收入,将其划分为1 000元以下、1 000~3 000元、3 001~5 000元、5 001~8 000元、8 000元以上、无固定收入,分别赋予编号“1、2、3、4、5、6”。体育活动参与类型:经常参加体育活动、偶尔参加体育活动、不参加体育活动,分别赋予编号“1、2、3”。

本文根据文献将每周身体活动频度3次以上(含3次),每次身体活动时间30 min以上,每次身体活动强度中等程度以上定义为“经常参加体育活动的”,将符合上述条件中任意一条的定义为“参加体育活动的”;剩余界定为“不参加体育活动的”[13-14]。

以上自变量为分类变量。在模型分析部分中按照每个分位数显著性进行解释,在讨论部分按照自变量,从低分位数到高分位数进行梳理[15]。对模型进行了自变量和控制变量的膨胀因子(VIF)检验,得到的方差膨胀因子都在1~3,说明不存在多重共线性[15]。

在本文中将30%、40%定义为中低分位数,50%为中位数,60%、70%为中高分位数,80%、90%为高分位数。

2 结果与分析

2.1 北京市居民体育消费基本特征 北京市居民的平均体育消费为640元/a。对不同性别的居民体育消费进行单因素方差分析,发现不同性别的居民体育消费无差异。

对不同年龄段北京市居民的体育消费进行单因素方差分析,发现不同年龄阶段居民的体育消费具有显著性差异(F(6.3169)=28.63,Prob =0.0000<0.05),表明样本可以向总体推断;20~29岁1 088.2元/a、30~39岁1 037.1元/a、40~49岁580.9元/a、50~59岁463.9元/a、20岁以下318.2元/a、60~69岁262元/a、70岁及以上79.4元/a。

对不同学历居民的体育消费进行单因素方差分析,发现不同学历的北京市居民体育消费具有显著性差异(F(2,3173)=88.41,Prob >F=0.0000<0.05),表明样本可以向总体推断;大学学历1 044.0元/a、中学学历399.2元/a、小学56.8元/a。

对不同职业类型的北京市居民体育消费进行单因素方差分析,发现不同职业类型的北京市居民体育消费具有显著性差异(F(8.3167)=18.64,Prob =0.000 <0.001),表明样本可以向总体推断。国有企事业单位人员为1 153.2元/a、操作有关人员为1 039.3元/a、专业技术人员为946.7元/a、办事有关人员为862.3元/a、商业服务类人员为613.2元/a、其他人员为388.7元/a、失无业人员为299元/a、退休人员为289元/a、农林牧副渔业人员为236.2元/a。

对不同婚姻类型的北京市居民体育消费进行单因素方差分析,发现不同婚姻状况的北京市居民体育消费具有显著性差异(F(3,3172)=13.60,Prob =0.000 <0.05),表明样本可以向总体推断;未婚的为1 000元/a,已婚的为596.4元/a,离异的为485.4元/a,丧偶的为158.5元/a。

对不同地域的居民体育消费进行单因素方差分析,发现不同地域的北京市居民体育消费具有显著性差异(F(1,3174)=20.98,Prob =0.000 <0.05),表明样本可以向总体推断;不同地域居民的平均体育消费分别为741.6元/a和501.8元/a,郊区比城区低139.8元/a。

对不同收入的居民体育消费进行单因素方差分析,发现不同收入的居民体育消费具有显著性差异(F(5,3170)=42.08,Prob =0.000 <0.05),表明样本可以向总体推断;年收入8 000元以上的为1 602.2元/a、5 000~8 000元的为1 010.2元/a、3 000~5 000元的为638.3元/a、无固定收入的为537.2元/a、1 000~3 000元的为357.5元/a、1 000元/a以下的为80.1元/a。

对不同体育活动参与类型的居民体育消费进行单因素方差分析,发现不同体育活动参与类型的居民体育消费具有显著性差异(F(3.3172)=19.21,Prob =0.000 <0.05),表明样本可以向总体推断;有参与体育活动的为737.2元/a,经常参加体育活动的701.8元/a,近1年未参加体育活动的为323.3元/a。

从表2可以看出,北京市居民的体育消费表现出城六区高于远郊区县,高学历高于低学历,低年龄段高于高年龄。从城区中学教育程度的男、女体育消费看,男性随着年龄的增长,体育消费总体呈现下降趋势,女性呈现先下降再升高,最后降低的趋势,总体是下降的趋势,男性高于女性。从城区大学教育程度的男、女体育消费看,男、女呈现出降低、升高、降低、升高、降低的趋势,男性高于女性。从郊区小学教育程度的男、女体育消费看,男性呈现下降趋势,女性呈现下降再上升的趋势,女性高于男性。从郊区中学教育程度的男、女体育消费看,随着年龄的升高,男性呈现上升后再下降的趋势,女性呈现一直下降的趋势。在60岁以前,男性高于女性。从郊区大学的男、女体育消费看,随着年龄的增长,男性体育消费呈现增高、降低、升高、再降低的趋势,女性呈现升高、降低的趋势,男性高于女性。

表2 北京市不同年龄段、学历、性别居民体育消费水平 元/a

表3为不同分位数上的分位值,可见随着分位数的提高体育消费的分位值也逐渐提高。

表3 北京市居民不同分位数的体育消费 元/a

Table 3 Sport consumption of residents with different quantiles in Beijing

变量观测值分位数分位值 95%的置信区间体育消费328210-1268.899-1338.638-1199.16020-604.432-664.566-544.29830-125.305-180.418-70.19240284.092231.595336.58850666.745615.071718.419601049.398996.9021101.895701458.7951403.6821513.907801937.9221877.7881998.056902602.3892535.6502672.128

2.2 北京市居民体育消费的回归分析 北京市居民体育消费回归采用2种方法进行分析,一种是OLS方法,另外一种是QR方法。QR中分位数的选取采用10%、20%、30%、40%、50%、60%、70%、80%、90%分位数点进行。

2.2.1 北京市居民体育消费的OLS分析结果 OLS模型各项数值为:R-squared= 0.1227,Prob>F=0.000,(F(28, 3147)= 20.15)。模型通过检验,说明抽样可以向总体推断。年龄变量中40~49岁、50~59岁、60~69岁、70岁及以上,婚姻变量,城乡变量,性别变量,职业类型变量中办事有关人员、操作有关人员,体育参与类型中参加体育锻炼等变量在模型中不显著,不显著的变量略去。

自变量:① 以小学学历为参照,中学学历、大学学历呈现显著性差异,说明样本可以向总体推动,其每变动1个标准差,中学学历、大学学历的居民体育消费将分别增加2.45个单位、5.49个单位。② 以20岁以下的年龄段为参照,20~29岁、30~39岁变动1个标准差,居民呈现显著性差异,说明样本可以向总体推动,其体育消费将增加12.06、11.15个单位,其余年龄段差异不显著。③ 以国有企事业单位人员为参照,专业技术人员、商业服务人员、农林牧副渔业人员、其他人员、退休人员变动1个标准差,居民呈现显著性差异,说明样本可以向总体推动,其体育消费将减少3.4、3.8、7.25、3.37、5.97个单位。其余职业不显著。④ 以经常参加体育锻炼为参照,不参加呈现显著性差异,说明样本可以向总体推动,其每变动1个标准差,不参加的居民体育消费将减少2.28、12.91个单位。⑤ 以每年1 000元/a以下为参照,1 000~3 000、3 001~5 000、5 001~8 000、8 000元/a以上及无固定收入变动1个标准差,居民呈现显著性差异,说明样本可以向总体推动,其体育消费将增加2.38、5.56、9.27、15.47、4.16个单位。

2.2.2 北京市居民体育消费的QR分析结果 分位数回归在10%、20%的百分位数模型整体不显著,本文只报告显著的变量,从30%(PseudoR2=0.0100)、40%(PseudoR2=0.1109)、50%(PseudoR2=0.1838)、60%(PseudoR2=0.1859)、70%(PseudoR2=0.1874)、80%(PseudoR2= 0.1867),90%(PseudoR2= 0.2038)分位数进行汇报。

30%分位数:自变量—年龄,在体育消费30%分位数,30~39岁的居民体育消费比20岁以下居民高150元[4-6,12,16];其余年龄段不显著。自变量—体育活动参与类型,在体育消费30%分位数,不参加体育锻炼居民的体育消费比经常参加体育锻炼居民低50元。自变量—个人月收入,在体育消费30%分位数,5 001~8 000、8 000元/a以上的居民的体育消费比1 000元/a以下居民分别多50元、200元。

40%分位数:自变量—年龄,在体育消费40%分位数,20~29、30~39、40~49、60~69、70岁及以上的居民体育消费比20岁以下居民高287.5、 350.0、125.0、62.5、62.5元。自变量—婚姻状况,在体育消费40%分位数,已婚、丧偶居民的体育消费比未婚居民低50元。自变量—职业,在体育消费40%分位数,办事有关人员、商业服务人员、失无业人员、其他人员、退休居民的体育消费比国有企事业单位居民低87.5、125.0、137.5、137.5、137.5元。自变量—体育参与,在体育消费40%分位数,不参加体育锻炼居民的体育消费比经常参加体育锻炼居民低112.5元。自变量—收入,在体育消费40%分位数,3 001~5 000、5 001~8 000、8 000元/a以上居民的体育消费比1 000元/a以下收入的居民多37.5、112.5、300.0元。

50%分位数:自变量—学历,在体育消费50%分位数,大学学历居民的体育消费比小学学历居民高78.27元。自变量—性别,女性居民的体育消费比男性居民低30.34元。自变量—职业,在体育消费50%分位数,办事有关人员、商业服务人员、农林牧副渔业人员、失无业人员、其他人员、退休人员体育消费比国有企事业单位人员低143.44、165.17、219.31、182.41、219.31、188.96元。自变量—体育参与,在体育消费50%分位数,参加体育锻炼、不参加体育锻炼居民的体育消费比经常参加体育锻炼居民低43.79、176.2元。自变量—收入,在体育消费50%分位数,1 000~3 000、3 001~5 000、5 001~8 000、8 000元/a以上收入居民的体育消费比1 000元/a以下收入居民高30.34、102.06、230.34、554.48元。

60%分位数:自变量—学历,在体育消费60%分位数,大学学历居民的体育消费比小学学历居民高203.4元。自变量—职业,在体育消费60%分位数,专业技术人员、办事有关人员、商业服务人员、农林牧副渔业人员、失无业人员、其他人员、退休的居民体育消费比国有企事业单位人员低154.0、200.9、200.0、291.4、206.8、281.4、217.0元。自变量—收入,在体育消费60%分位数,1 000~3 000、3 001~5 000、5 001~8 000、8 000元/a以上收入居民的体育消费比1 000元/a以下收入居民高64.4、144.9、332.2、763.5元。

70%分位数:自变量—学历,在体育消费70%分位数,大学学历居民的体育消费以小学学历居民的体育消费高265.16元。自变量—年龄,在体育消费70%分位数,20~29、30~39、70岁及以上的居民体育消费比20岁以下居民高459.35、385.80,低155.48元。自变量—城乡,在体育消费70%分位数,城市居民的体育消费比郊区居民高65.16元。自变量—职业,在体育消费70%分位数,办事有关人员、农林牧副渔业人员、失无业人员、其他人员、退休人员体育消费比国有企事业单位人员低239.35、368.68、214.83、346.45、251.61元。自变量—体育参与,在体育消费70%分位数,参加体育锻炼、不参加体育锻炼居民的体育消费比经常参加体育锻炼居民低109.03、338.06元。自变量—收入,在体育消费70%分位数,3 001~5 000、5 001~8 000、8 000元/a以上收入居民的体育消费比1 000元/a以下收入居民高92.25、309.03、898.06元。

80%分位数:自变量—学历,在体育消费80%分位数,大学学历居民的体育消费比小学学历居民高393.84元。自变量—城乡,在体育消费80%分位数,城市居民比郊区居民的体育消费高64.61元。自变量—职业,在体育消费80%分位数,商业服务人员、农林牧副渔业人员、其他人员、退休人员的体育消费比国有企事业单位人员低300.00、335.38、403.07、300.00元。自变量—体育参与,在体育消费80%分位数,参加体育锻炼、不参加体育锻炼居民的体育消费比经常参加体育锻炼居民低129.23、429.23元。自变量—收入,在体育消费80%分位数,3 001~5 000、5 001~8 000、8 000元/a以上收入居民的体育消费比1 000元/a以下收入居民高103.07、506.15、1 400.00元。

90%分位数:自变量—学历,在体育消费90%分位数,大学学历居民的体育消费比小学学历居民高600元。自变量—年龄,在体育消费90%分位数,20~29、40~49、50~59、60~69、70岁及以上的居民体育消费比20岁以下居民多900元,少200、400、400、500元。自变量—城乡,在体育消费90%分位数,城市居民的体育消费比郊区居民高100元。自变量—婚姻状况,在体育消费90%分位数,离异居民的体育消费比未婚居民高400元。自变量—职业,在体育消费90%分位数,办事有关人员、商业服务人员、农林牧副渔业人员、失无业人员、其他人员、退休人员体育消费比国有企事业单位人员低900、800、900、800、800、800元。自变量—体育参与,在体育消费90%分位数,不参加体育锻炼居民的体育消费比经常参加体育锻炼居民低800元。自变量—收入,在体育消费90%分位数,3 001~5 000、5 001~8 000、8 000元/a以上收入居民的体育消费比1 000元/a以下收入居民高100、900、1 900元。

3 讨论

3.1 北京市不同性别、婚姻状况居民体育消费水平 在控制其他自变量不变情况下的OLS中,女性居民体育消费比男性居民体育消费平均低1.44个单位;但通过QR发现,在体育消费50%分位数表现为女性低于男性(图1)。性别差异表现在中等体育消费水平的居民中[18]。

注:纵轴表示QR模型中解释自变量的系数估计;横轴表示体育消费的不同分位点;黑色直虚线表示解释变量的OLS回归估计值,2条浅黑色虚线之间区域表示OLS回归估计值的置信区间(置信度为0.95);黑色实线是各个解释变量的QR估计结果(基于20次再抽样自举法),2条黑色曲线中间部分是QR估计值的置信区间(置信度为0.95),图2~图8同此

图1 北京市女性居民体育消费QR的系数变化情况

Figure 1. The change of QR coefficient of female residents’sport consumption in Beijing

图2 北京市不同婚姻状况居民体育消费QR的系数变化情况

在OLS中,不同婚姻类别间体育消费水平无显著差异;但通过QR发现,在体育消费40%分位数表现为已婚、丧偶低于未婚,离异在体育消费条件下90%分位数为高于未婚(图2)。已婚、丧偶类的婚姻变化,将引起中低体育消费水平人群的体育消费支出降低。离异类的婚姻变化,将引起高体育消费水平人群的体育消费支出提高。离异属于家庭解体,其消费相对于未婚居民高[17],相对未婚、已婚、丧偶,离异对高体育消费增长(90%,高分位数)有正作用,这符合婚姻的社会学功能[18]。

3.2 北京市不同年龄居民体育消费水平 在控制其他自变量不变的情况下,OLS中,20~29、30~39岁年龄段居民体育消费比20岁以下居民的体育消费仅多12.06、11.15个单位,而其他年龄段与20岁以下无显著性差异。可见进行OLS时,未呈现因年龄因素产生的消费差异。

通过QR发现,20~29岁的体育消费在40%、70%、90%分位数高于20岁以下居民;30~39岁的体育消费在30%、40%、70%分位数高于20岁以下居民;40~49岁的体育消费在40%分位数高于20岁以下居民,在90%分位数低于20岁以下居民;50~59岁的体育消费在90%分位数低于20岁以下居民;60~69岁的体育消费在40%分位数高于20岁以下居民,90%分位数低于20岁以下居民;70岁及以上的体育消费在40%分位数高于20岁以下居民,70%、90%分位数低于20岁以下居民。

总体而言,40岁是高低体育消费增长变化的年龄拐点。在40岁前,30~39岁的居民相对20~29岁的居民,其对体育消费增长的正作用由40%分位数提前到30%分位数,即对体育消费增长降低了10%个分位数,增长由中低体育消费向低体育消费前探。相对于20~29岁居民,30~39岁居民的家庭类型主要是以夫妇家庭、核心家庭为主,以家庭消费为主,个人消费减少,且家庭消费占据收入很大一部分。因此,呈现出由该年龄段高体育消费增长向30~39岁年龄段的低体育消费增长过渡。

在40岁后,相对20岁以下人群的体育消费,在40%分位数体育消费增长显著。其余分位数呈现出体育消费负增长,这些分位数的共同特点都是高分位数高体育消费(图3)。综上,随着年龄的增长,居民体育消费增长呈现下降趋势,这与莫迪利亚尼的生命周期消费理论一致,居民的消费支出是根据一生所能得到的全部收入、财产按一定比例分配到一生各个时期。体育消费的下降是收入和年龄增长的综合效应所致[19]。一方面,未来收入、财产会继续降低;另外一方面,年龄增长会理性让居民减低体育消费。

图3 北京市不同年龄居民体育消费QR的系数变化情况

3.3 北京市不同学历居民体育消费水平 在控制其他自变量不变的情况下,OLS中,中学学历、大学学历的居民体育消费比小学学历的居民体育消费多2.45、5.49个单位;学历越高体育消费越高[20]。

通过QR发现,相对于小学学历,中学学历居民体育消费不显著;大学学历的体育消费在50%、60%、70%、80%、90%分位数高于小学学历的居民(图4)。说明学历对体育消费增长的低分位数无作用,对体育消费增长的中高分位数以上有正向作用。

图4 北京市不同学历居民体育消费QR的系数变化情况

3.4 北京市不同职业居民体育消费水平 在控制其他自变量不变的情况下,OLS中,专业技术人员、商业服务人员、农林牧副渔业人员、失无业人员、其他人员、退休人员的居民体育消费比国有企事业单位人员体育消费数额少3.40、3.80、7.25、3.37、5.97、3.47个单位。

通过QR发现,以国有企业单位人员的体育消费为参照,随着分位数的增加(40%、50%、60%、70%、80%、90%),专业技术人员(60%)、办事有关人员(40%、50%、60%、70%、90%)、商业服务人员(40%、50%、60%、80%、90%)、农林牧副渔业人员(50%、60%、70%、80%、90%)、失无业人员(40%、50%、60%、70%、90%)、其他人员(40%、50%、60%、70%、90%)体育消费与参照对象在上述分位数有显著性差异,且差异逐渐加大,分位数越大体育消费水平越低(图5)。以上说明这几类职业类型对中低以上体育消费有制约作用。相反,国有企业单位工作类型有利于提高体育消费。

图5 北京市不同职业居民体育消费QR的系数变化情况

3.5 北京市不同地域居民体育消费水平 在控制其他自变量不变的情况下,OLS中,不同地域居民无显著性差异。通过QR发现,城区居民的体育消费在70%、80%、90%分位数高于郊区居民(图6)。说明生活在城区的居民体育消费较高。

3.6 北京市不同收入居民体育消费水平 在控制其他自变量不变的情况下,OLS中,居民体育消费额呈现随收入增长而增长的特点[21]。

通过QR发现,在30%分位数,居民收入对体育消费水平无显著影响。在40%分位数以后,各分位点均呈现出随居民收入水平增长,体育消费水平显著增高的特点(图7)。

图6 北京市城区居民体育消费QR的系数变化情况

Figure 6. The change of QR coefficient of sport consumption of city residents in Beijing

图7 北京市不同收入居民体育消费QR的系数变化情况

3.7 北京市不同体育参与状况居民体育消费水平 在控制其他自变量不变的情况下,OLS中,居民体育消费比参照对象少2.28、12.91个单位;参加体育的频率越低体育消费越少。

通过QR发现,参加体育锻炼居民的体育消费在50%、60%、70%、80%分位数低于经常参加体育锻炼的居民。不参加体育锻炼居民的体育消费在30%、40%、50%、60%、80%、90%分位数低于经常参加体育锻炼的居民(图8)。

图8 北京市不同体育参与频率居民体育消费QR的系数变化情况

Figure 8. The change of QR coefficient of sport consumption of residents with different sports participation in Beijing

4 结束语

相对于OLS模型,QR模型可以厘清显著性自变量对因变量差异的具体分布及变化。在QR模型中,不同性别、学历、城乡、收入、年龄、婚姻、地域和职业的居民体育消费仅在部分分位数上存在差异。

性别差异仅表现在中等体育消费水平的居民中。已婚、丧偶类的婚姻变化,将引起中低体育消费水平人群的体育消费支出降低。离异类的婚姻变化,将引起高体育消费水平人群的体育消费支出增加。学历对高体育消费增长有促进作用。

40岁是体育消费增长变化的年龄拐点,40岁前高体育消费增长明显,40岁后中低体育消费增长明显,高体育消费增长不显著。

国有企业单位人员更易投入体育消费。在低体育消费水平中,居民收入对体育消费无显著性影响。在中低体育消费以上,均呈现出随居民收入水平增长、体育消费水平显著增高的趋势。经常参加体育锻炼的居民中低及以上体育消费多于参加体育锻炼和不参加体育锻炼的居民。

[1] 奚红妹,魏农建,左鹏,等.中国城市消费者个体差异对体育消费观念和消费行为的影响[J].体育科学,2010(3):30-35

[2] 任波,夏成前.中国体育产业竞争力与经济发展关系的理论与实证研究[J].上海体育学院学报,2016,40(3):23-29

[3] 代刚,仇军.体育消费的研究范式、内容分析及特征启示[J].天津体育学院学报,2009(6):494-498

[4] Koenker R,Gilbert Bassett Jr.Regression quantiles[J].Econometric,1978,46(1):19

[5] Koenker R.Quantile regression[M].New York:Cambridge University Press,2005:78-88

[6] Koenker R,Hallock K F.Quantile regression an introduction[J].The Journal of Economic Perspectives,2001,15(4):22-26

[7] 陈建宝,丁军军.分位数回归技术综述[J].统计与信息论坛,2008(3):89-96

[8] 朱平芳,张征宇.无条件分位数回归:文献综述与应用实例[J].统计研究,2012(3):88-96

[9] 李法伟,蔡军,杨涛,等.陕西省居民体育消费统计指标体系及相关指标体系研究[J].体育科学,2009(2):46-53

[10] 刘士杰.人力资本、职业搜寻渠道、职业流动对农民工工资的影响——基于分位数回归和OLS回归的实证分析[J].人口学刊,2011(5):16-24

[11] 胡宝娣,汪磊.基于分位数回归的我国居民消费研究[J].商业研究,2011(1):107-112

[12] 王韬,毛建新.流动人口家庭与城镇家庭的消费差异——基于分位数回归的分析[J].人口与经济,2015(4):60-68

[13] 国家体育总局.2014年全民健身活动状况调查公报(下)[N].中国体育报,2015-11-18(4)

[14] 国家体育总局.2014年全民健身活动状况调查公报(上)[N].中国体育报,2015-11-17(4)

[15] 陈强.高级计量经济学及Stata应用 [M].2版.北京:高等教育出版社,2015:222-301

[16] 吴鑑洪,赵卫亚,谢祺.面板向量分位数回归及其在居民消费行为研究中的应用[J].统计研究,2014(6):91-97

[17] 麦休尼斯.社会学[M].14版.北京:中国人民大学出版社,2015:158-211

[18] 黄静,王周伟,杜永康.收入差距分化、城市化发展与教育收益率——基于分位数回归的实证分析[J].教育与经济,2015(6):18-24

[19] 王文举.诺贝尔经济学奖获得者学术思想举要1969—2010[M].北京:首都经济贸易大学出版社,2011:111-135

[20] 段鹏,肖德,赵汉华.大学生体育消费行为决定因素的定量分析——以湖北为例[J].体育科学,2007(5):36-40

[21] 刘志强,张庚淼,韩省亮,等.21世纪我国现代体育消费行为及对策研究[J].西安体育学院学报,2004(3):1-4

A Research on Urban Residents’Sport Consumption Based on Quantile Regression—Based on the Third Beijing Mass Sports Survey Data

LI Xiaotian1, XIANG Zubing2, GUO Shihao3, WANG Kaizhen4, TANG Guanyi5

Using the methods of questionnaires and mathematical statistics, the research conducted a stratified random household survey of 3 304 residents in Beijing, to investigate the costs of physical training, sport information, sports events, physical fitness, sports facilities, as well as sports shoes and clothing among the respondents. Then the general linear regression model (OLS) and quantile regression (QR) are used to analyze the status quo and the differences of sport consumption among residents with different characteristics. The results show that the gender, marriage, age, income, regions and types of work have influences on their sport consumption, with the significant differences in 30%, 40%, 50%, 60%, 70%, 80% and 90% quantiles, respectively. The results indicate that quantile regression is more accurate than general linear regression in reflecting the influence of different distribution of independent variables on dependent variables.

urban resident; sport consumption; general linear regression; quantile regression; Beijing

2016-09-19;

2016-11-25

北京市高校科技创新服务能力建设提升项目(PXM2016-014206-000021);北京市体育局重点委托项目

李骁天(1979-),男,陕西汉中人,首都体育学院副教授,博士;Tel.:(010)82099368,E-mail:lixiaotian@cupes.edu.cn

王凯珍(1957-),女,江苏泰县人,首都体育学院教授,博士;Tel.:(010)82099007,E-mail:wkz@sina.com

G80-05

A

1000-5498(2017)03-0054-10

DOI 10.16099/j.sus.2017.03.008

猜你喜欢
位数学历北京市
北京市:发布《北京市2022年能源工作要点》
学历造假引发法律纠纷
北京市丰台区少年宫
北京市勘察设计研究院
北京市营养源研究所
五次完全幂的少位数三进制展开
学历军备竞赛,可以休矣
知识无力感
遥感卫星CCD相机量化位数的选择
“判断整数的位数”的算法分析