我国社会消费品零售额影响因素分析
——基于岭回归

2019-04-25 01:21舒服华
关键词:共线性因变量城镇化率

舒服华

(武汉理工大学 继续教育学院, 湖北 武汉 430070)

改革开放以来,我国经济的高速发展在很长一段时间内主要依靠投资和出口维系,长期的高投资在刺激我国经济高增长的同时,也积累了许多深层次的问题:一是导致自然资源严重透支,难以支撑经济的持久发展;二是盲目的重复建设导致许多行业产能过剩,相关产品滞销,企业之间恶性竞争,产品价格长期低迷,使得不少行业陷入全面亏损的窘境;三是大量上马一些高污染、高排放的项目,对生态环境造成很大的破坏,吞食了老百姓的获得感、幸福感。随着经济发展进入新阶段,投资对经济的拉动效应逐渐减弱。对外出口的确在过去很长一段时间内对我国经济的崛起作出了重要贡献,我国凭借人力资源丰富、劳动力成本低的优势,一跃成为制造大国和“世界工厂”,物美价廉的中国产品深受海外消费者的青睐,“中国制造”遍布全球各地,为我国换来了可观的贸易顺差,增强了国力,促进了国内就业,推动了一大批产业的发展,但随着我国人口红利的逐步减退,劳动力成本的上升,这种比较优势正在缩小。加之当前国际经济形势不确定因素增多,贸易保护主义、单边主义日益猖獗,给我国的出口贸易带来严峻的挑战,出口对我国经济的拉动作用明显减弱。面对国内国际经济形势的变化,党和国家及时调整经济发展的战略,确立以消费为本驱动我国经济持续发展的根本方针,坚定推动实施“供给侧结构改革”“积极扩大内需”的经济转型发展的策略,实现新旧动能转换,促进我国经济高质量、绿色、可持续发展。这种经济发展方式的转化,不仅是顺应经济发展形势、遵循经济发展规律的需要,也是满足人民群众对美好生活追求的需要。

社会消费品零售额是国民经济中的重要指标,它综合反映了劳动者就业、居民收入、物价、利率、产业结构、社会保障体系、居民消费、生活水平等经济社会发展多方面情况,[1]也是考察经济运行状况的重要参考指标之一。研究社会消费品零售额影响因素,对制定经济产业发展政策、优化社会资源配置、加强有效供给、更好地满足人民群众物质生活需要、促进消费、保持经济健康发展等具有重要的意义。影响社会消费品零售额的因素较多,包括政治方面、经济方面、社会方面等,有些因素可以量化,有些因素不可以量化,运用数学模型分析影响社会消费品零售额的因素,指标选择必须遵循可操作、可量化的原则。国内学者王志坚、王斌会[1],丁宏术[2],舒服华[3][4],韩彦林[5],郑晓云[6]等对社会消费品零售额影响因素进行了一些研究,虽然有些研究取得了一定的成果,但大多是区域性研究,或者选择的指标欠妥当,难以准确把握事物的真谛。本研究从全局的角度,选取较为贴切的指标,研究它们对社会消费品零售额的影响,由于这些指标数据一般存在同向变化,也就是共线性,如果运用最小二乘法(OLS)估计模型的参数,有时得不到所有自变量的参数,即使得到了,它们也丧失了对因变量的解释作用,不能客观反映现实情况,而岭回归可以较好地解决这一问题,回归的参数可以客观反映解释变量与被解释变量的关系,符合客观真实情况,在实际生活中得到了刘红勇、胡健、王鹏[7],董力、刘艳玲[8],孔朝莉、李国徽、黄美婷[9],朱述知[10],杨秀丽、权晓超[11],何仁伟、李立娜、刘运伟[12]等学者的广泛应用。因此,本文采用岭回归分析农村居民消费支出、城镇居民消费支出、人口数量、城镇化率对我国社会消费品零售额的影响。

一、岭回归基本原理

岭回归是最小二乘法的改良与深化,是专门用于解决数据共线性这种病态现象的有效方法,对共线性数据分析具有独到的效果。它通过放弃OLS的无偏性优势,以损失部分信息、降低拟合精度为代价,换来回归系数的稳定性和可靠性[1],回归的系数能客观解释自变量变量与因变量的关系,能够更好地解决和应用于实际问题。

多元回归线性回归模型可表示为[1]:

Y=Xβ+ε

(1)

式中,Y为因变量,X为自变量(为多变量矩阵形式),β为回归系数,ε为误差。

如果回归系数β按照最小二乘法的估计,则[1]:

β=(XTX)-1XTY

(2)

但如果自变量X数据之间存在共线性,则行列式|XTX|的值接近于0,XTX接近于奇异矩阵,矩阵XTX接近不可逆,估计得到的系数不稳定性和可靠性,更缺乏解释性与无物理上的意义。

岭回归是对OLS的一种补充,基本思想就是给矩阵XTX加上一个对角阵,尽量将奇异矩阵转化为非奇异矩阵,以使矩阵XTX尽可能可逆,以便能够求出回归系数和提高参数估计的稳定性和可靠性,得到的参数更能真实反映客观实际,但同时对回归系数β的估计不再是无偏估计,从而降低拟合精度。岭回归求解回归系数β方法为[1]:

β=(XTX+kI)-1XTY

(3)

二、我国社会消费品零售额影响因素分析

居民个人消费支出与社会消费品零售额关系最为密切,有比较大的交集,但它们并不存在完全的包含关系,因为居民的消费是多样性的,既有物质的消费,也有非物质消费,如信息、文化、娱乐、健康等;即使是物质消费,有些也不属于社会消费品零售额的范畴,如水、电、气等基本生活必需品,还有餐饮、食品类消费大部分也不在社会消费品零售额之列。居民个人消费支出又可分为城镇居民个人消费支出和农村居民个人消费支出,由于现阶段我国城乡差别仍然较大,城镇居民收入比农村居民收入高,比农村居民消费能力强,因此,二者之间的消费支出是不同的,对社会消费品零售额的影响也就不同。人口数量对社会消费品零售额的影响也不可小觑,假设其他条件不变,人口数量越多,所需要消费的物品也就越多,自然会使社会消费品零售额相应增加。城镇化率反映了城镇人口在总人口中的比重,这一比例越大,在人口总数一定的情况下,城镇居民越多,消费总量就越多,也就必然带动社会消费品零售额增多。因此,本研究以城镇居民消费支出、农村居民消费支出、人口数量、城镇化率为影响因子,借助岭回归方法,分析它们对我国社会消费品零售额的影响。

图1 2000—2018年我国社会消费品零售额统计数据

表1 2000—2018年我国社会消费品零售额及相关指标统计数据

图1为2000—2018年我国社会消费品零售额统计数据(数据来源于2000—2018年中华人民共和国国民经济和社会发展统计公报),在这19年间,我国社会消费品零售额增长了1477.3900%,这反映出我国经济发展成果为人民所共享,人民收入稳定增加,消费能力不断增强,物质生活水平日益提高,为推动我国经济持续、高速发展注入了强劲的动力。

表1为2000—2018年我国社会消费品零售额、农村居民消费支出、城镇居民消费支出、人口数量、城镇化率统计数据(数据来源于2000—2018年中华人民共和国国民经济和社会发展统计公报),这4项指标也随社会消费品零售额而增长,表明它们存在共线性,需要运用岭回归模型研究自变量和因变量的关系。

设我国农村居民消费支出、城镇居民消费支出、人口数量、城镇化率分别为X1、X2、X3、X4,社会消费品零售额为Y,令X=[X1,X2,X3,X4],对Y和X进行线性回归,即[1]:

Y=βX+ε

(4)

(一)最小二乘法回归

以表1中的数据为样本,运用最小二乘法估计回归系数β,借助SPSS软件工具,求得回归系数,结果如表2所示。

表2 最小二乘法回归系数

共线性诊断。判断自变量是否存在共线性,首先可以从最小二乘法回归系数中的共线性统计资料中初步掌握,它有二个指标:容忍度和膨胀系数(VIF),其实它们二者可以合为一个指标,因为膨胀系数是容忍度的倒数,所以最直观的指标就是膨胀系数。如果其中有一个自变量的VIF大于10,就可以表明存在共线性。其次可以从共线性诊断进一步核实,它有三个指标:一是考察特征值,如果某一维度的特征值大于10或等于0,就证实存在共线性;二是考察条件指数,若某一维度的条件指数大于30时,就可以证明存在共线性;三是考察方差比例,如果在任一维度任一自变量的方差比例大于0.5,就表明存在共线性。

表3 共线性诊断

从表2的共线性统计资料可见,4个自变量的膨胀系数VIF分别为136.083、412.189、59.283、154.840,均大于10,说明存在多重共线性。再观察表3中的共线性诊断结果,4维度特征值为0,5维度特征值为1.04E-5,非常接近于0,证实存在共线性;3维度、4维度、5维度的条件指数分别为38.138、204.736、674.614,大于30,也证明存在共线性;X1在5维度的方差比例为0.97,大于0.5,X2在4维度的方差比例为0.66,大于0.5,X3在4维度的方差比例为0.93,大于0.5,X4在4维度的方差比例为0.76,大于0.5,同样证明存在共线性。综上所述,自变量满足共线性的所有条件,说明4个自变量数据之间存在严重的共线性,无怪乎回归的参数不能客观反映自变量与因变量的关系,而解决的最好办法就是采用岭回归方法估计回归系数。

根据回归参数(非标准参数)得到的回归方程为:

Y=47.393+0.001X1+0.002X2-3.937X3-0.112X4

(5)

(二)岭回归

按照岭回归方法估计回归系数,运用SPSS软件工具实现,设定迭代步长取0.01,以确定最佳岭回归参数k,运行程序得到岭轨图,如图2所示,其中纵坐标为回归系数,横坐标为最佳岭回归参数。

图2 岭回归岭轨图

从图2可见,当k逐渐增大时,各自变量系数逐步趋于稳定,当k=0.60以后,自变量系数基本不变,故最佳岭回归参数取k=0.60。

将k=0.60加入程序再运行,得到回归参数,结果如图3所示:

图3 岭回归结果

图4 相关系数R2与岭回归参数k的关系

岭回归估计的标准化系数值可以客观反映自变量对因变量的影响程度[2]。在4个标准岭回归回归系数中,由于β1>β2>β4>β3,因此,据此可以判断4个自变量对因变量的影响程度,即影响我国社会消费品零售额的因素,按其影响程度从大到小依次是:农村居民消费支出、城镇居民消费支出、城镇化率、人口数量,这与实际情况基本吻合。

在2000—2018年这19年间,农村居民消费支出增长了1045.4%,大大高于城镇居民的425%,加之农村居民消费支出主要以物质消费为主,而城镇居民消费支出多样化,物质消费逐步降温,非物质消费不断升温,因此,农村居民消费支出对社会消费品零售额影响最大,城镇居民消费支出处于次席,这也说明农村消费市场潜力巨大,有待进一步开发。在这19年间,城镇化率提高了64.5%,而人口数量仅增长了11.7%,城镇化率提高,意味着城镇人口增加和高消费群体的增加,意味着城镇化也推动了社会消费品零售额的增加,所以,城镇化率排名第三,人口数量位列最后。

值得注意的是,我们所说的对社会消费品零售额的影响,是指自变量的变化对因变量的变化的影响程度,而不是自变量对因变量的绝对贡献。如果以城镇居民消费支出和农村居民消费支出对社会消费品零售额贡献的绝对数计算,那应该还是城镇居民的占比大。

根据回归的非标准化系和常数,我们可以得到最终岭回归方程,即:

Y=-81.9229034+0.00082983X1

+0.00038865X2+5.46597559X3

+0.32855933X4

(6)

三、结语

消费是社会再生产的最后一环,也是生产的最终目的,消费更是检验生产有效性的砝码。生产的产品只有顺利、有效地消费掉,生产才有存在的意义,否则,不仅再生产无法延续,而且造成社会资源浪费,这样的生产毫无价值。消费是生产的动力,消费越旺,产品流通的周期越短,库存越少,迫使生产者扩大再生产,满足市场需求,从而促进了生产的发展。当前,我国经济发展进入新常态,经济发展速度从高速步入中高速;经济发展的重点从速度转向速度和质量并重,尤其注重加强经济发展的质量和效益;经济发展的动力从投资、出口为主转向消费、投资、出口并行,特别强调消费对经济发展的作用,在外部经济环境发生深刻变化的情况下,消费在我国经济中的地位得到了前所未有的提升,逐步成为支撑我国经济持久发展的坚强和主导动力。近两年,消费对我国GDP的贡献率超过60%,并且这一数值还在逐年上升。在新的形势下,我们必须进一步贯彻实施“供给侧结构性改革”措施,以市场为导向,开展投资生产活动,优化配置社会资源,补齐国民经济发展的短板,不断提高有效供给,为消费者提供更加丰富和质量更优的产品。同时,要引导消费者合理消费,积极挖掘消费潜能,努力培植消费新的增长点,不断发展消费新业态、新模式。此外,要健全和完善社会保障体系,让老百姓无后顾之忧,敢于花钱、大胆花钱,要建立职工工资与经济发展相适应增长的长效机制,促进劳动者收入稳步增长,让老百姓有钱花、有底气消费。我国有4亿多人口的中等收入群体,有广大的消费尚且不足的农民,只要我们认真把脉市场,施之以策,就能撬动这块巨大的消费蛋糕,助推我国经济继续腾飞。社会消费品零售额是衡量一个国家或地区消费能力和消费水平的重要指标,分析其影响因素,对指导生产、提升消费、促进经济平稳有效运行具有重要的意义。在多元线性回归中,一般回归系数采用最小二乘法进行估计,如果自变量数据之间不存在相关性,这种估计方法得到的方程拟合精度较高;但如果自变量数据之间存在相关性,且我们又要掌握自变量和因变量的关系,运用最小二乘法估计的参数就难以进行解释。岭回归可以克服这一缺点,能有效解决变量数据存在相关性问题[1],回归的参数能客观描述自变量与因变量的关系。

本文运用岭回归方法分析了农村居民消费支出、城镇居民消费支出、人口数量、城镇化率对我国社会消费品零售额的影响,结果表明,其影响程度从大到小依次是:农村居民消费支出、城镇居民消费支出、城镇化率、人口数量。农村居民消费支出影响最大,人口数量影响最小。

猜你喜欢
共线性因变量城镇化率
新一轮新型城镇化顶层设计来了
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
河南省县域城镇化率影响因素分析以及空间分异性研究
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则
精心设计课堂 走进学生胸膛