基于岭回归的我国石材消费影响因素分析

2022-06-27 15:41舒服华
石材 2022年5期
关键词:共线性销售收入城镇化率

舒服华

(武汉理工大学继续教育学院,湖北 武汉 430070)

1 引言

石材行业是国民经济的组成部分之一,在吸纳劳动者就业,为国家创造税收,支撑经济稳定发展等方面具有不可小视的作用。同时,石材行业也是建筑业和房地产业不可缺少的伴侣,在美化建筑物,提升城市颜值,改善居民居住环境方面也有举足轻重的作用。如今,在几乎所有商场、酒店、宾馆、写字楼等我们都能见到石材幕墙、石材墙面、石材地面等影子,甚至在城市的每个角落都能寻觅到石材的踪影。大街上随处可见的石材装饰建筑,五颜六色、光怪陆离,彰显了城市的繁华和璀璨,展现了城市魅力和活力。过去,石材主要用于装饰大型公共建筑,随着人们生活水平的提高,对居住条件有了更高的要求,高高在上的石材,今天渐渐走进了私人住宅装修的行列,导致社会对石材的消费逐年增加。近些年,我国规模以上石材企业的产值保持在4000亿元以上,照此测算,整个社会上石材产值在万亿元之上,石材消费也保持快速增长,成为经济新的增长点。研究我国石材消费影响因素,对指导企业采取针对性措施,有的放矢、因势利导,改善生产经营策略,增强有效供给,更好满足社会和个人对石材产品的需求,提高企业的经济效益,促进整个石材行业有力、有效发展具有积极的意义。在多元线性回归中,回归系数的估计方法主要有最小二乘法(OLS)、极大似然法,其中,最小二乘法运用最广泛,但当自变量数据之间存在高度相关性时,如果采用OLS估计回归参数,可能会失真或不准确。由于考察影响我国石材消费的因素大多具有同向性,即它们都随时间的增长而增长。因而,它们的数据序列之间具有相关性,也就是自变量存在多重共线性。这时,如果采用最小二乘法估计模型的参数,估计出的参数的有效性就会打折扣,难以客观反映实际情况。岭回归是专用于解决数据序列共线性的有偏估计方法,是对最小二乘法的一种改进,对于相关性较高数据序列,估计的参数不仅稳定可靠,而且能真实反映客观实际。文献[1][2][3][4][5][6][7][8]成功利用岭回归解决了多元回归中的自变量数据共线问题。因此,本研究运用岭回归方法分析房屋竣工面积、城镇居民人均住房面积、城镇居民收入、城镇化率,4个因素这样能够更好的反映客观实际。

2 我国石材消费影响因素分析

随着经济社会的发展,城市高楼大厦林立,面貌焕然一新,居民住宅鳞次栉比、高耸入云。同时,居民收入的不断增加,对生活水平的品质要求一步步提高,不少家庭采用石材装修住宅,住所富丽堂皇、雍容华贵,促进了石材生产和消费。图1为2008~2019年我国规模以上石材企业销售收入统计数据。在这12年期间,我国规模以上石材企业销售收入8年的快速增长后,增速放缓,近5年窄幅振荡,销售值维持在4300亿左右,最大增长了179.4246%,成为我国消费新的增长点,对促进我国经济的持续发展作出了无可替代的贡献。

图1 我国规模以上石材企业销售收入统计数据

石材在结构上有石板、石柱、石栏等,不同的结构统计方法有所差异。在材料上有花岗岩、大理石等,还有人造石材,这些价格各不同相同,以面积质量笼统衡量不妥。为了便于操作,本研究以石材的总价值进行概括。石材消费有大型机构、也有私人、有批发、有散购,这让统计也存在一定的难度。我国石材厂家数量众多,产值统计难以精确,而以规模以上石材企业销售收入作为测度比较容易操作。当然,有一部分石材可能用于出口,但我国也进口部分石材,二者基本相抵。虽然,规模以上石材企业销售收入与石材消费有所出入,但可以肯定的是它们为正相关关系。故为了操作方便,以规模以上石材企业销售收入来替代社会对石材的消费。众所周知,房屋建筑是石材消费的大户,房屋竣工面积越多,石材消费越大。目前,私人家庭装修使用石材主要为城镇居民,城镇居民收入越多,选择运以石材作为房屋装修材料的几率越大。城镇居民人均住房面积越大,如果它们选择石材进行家庭住宅装修,那么,所消费的石材数量越大。城镇化率反映了城镇人口的比例大小,城镇化率越高,城市人口越多,需要的住房越多,如果使用石材装饰住宅,则需要的石材量越大。因此,以房屋竣工面积、城镇居民人均住房面积、城镇居民收入、城镇化率4个因素作为影响石材消费的考察对象。表1为2008~2019年我国房屋竣工面积、城镇居民人均住房面积、城镇居民收入、城镇化率统计数据(数据来源于中国统计年鉴,2020、2021年两年由于受新冠肺炎疫情影响,一些数据不具研究价值,故未予采用),从表1可见,在这12年时间里,我国房屋竣工面积、城镇居民人均住房面积、城镇居民收入、城镇化率均基本呈增长态势。房屋竣工面积最大增长了59.4831%,城镇居民人均住房面积增长了30.0654%,城镇居民收入增长了168.4177%,城镇化率增长了28.9362%。

表1 我国石材消费主要影响因素统计数据

分析几个因素对一个因素的影响,一般采用数学模型,将被影响的因素设为因变量,影响因素设为自变量。最简单的方法就是运用最小二乘法对因变量和自变量进行线性回归,通过对回归系数的分析,可以找到自变量对因变量的影响程度。如果回归系数为正,则自变量与因变量为正相关;系数为负,则为负相关。系数的绝对值越大,表明自变量对因变量的影响的程度越大。

设我国规模以上石材企业销售收入为因变量Y,房屋竣工面积、城镇居民人均住房面积、城镇居民收入、城镇化率分别设为自变量x1、x2、x3、x4。

令X=[ x1,x2,x3,x4],对Y、X进行线性回归,回归模型可表示为:

式中,Y为因变量,X为自变量,β=[β1,β2,β3,β4]T为回归系数,ε为回归误差。

2.1 最小二乘法回归

最小二乘法回归原则就是让参数的取值使因变量的拟合值与实际值的误差平方和最小。

最小二乘法的估计回归系数β的数学模型为[3][4]:

根据式(2)求解得到的自变量回归系数如图2所示。

图2 最小二乘法线性回归系数

模型回归的相关系数R2=0.948 (R2最大值为1),调整相关系数R2Adj=0.918 ,二者都比较大,表明模型的拟合精度较高,统计量F=31.879,显著性概率sigF=0.000,小于0.05显著性水平,表明OSL回归方程显著成立。从图2知,x1、x2、x3、x4的标准化回归系数(Beta)分别为:β1=0.312,β2=0.445,β3=-0.360,β4=0.646。4个自变量回归系数相差比较大,存在数量级上的差别,并且, x3的系数为负值,照此推断,城镇居民收入与石材消费量成负相关。这就令人费解,城镇居民收入越多,对生活的质量与品质要求越高,尤其对居住条件的要求提高,无论是在对已有住房的改造中,还是在购买的新商品房装修中,选择使用石材的机会增加,按理来说,城镇居民收入与石材消费量成正相关才对。回归的这一系数这显然不符合实际。之所以出现这样的情况,主要是因为自变量数据之间存在共线性,所谓共线性是指自变量数据同时呈现相同或相反的单调变化态势。也就是式(2)中的矩阵XTX近乎不可逆,使按照式(2)求得的系数解释性失真。

我国人口数量、城镇化率、城镇居民收入、农村居民收入、社会商品零售额,数据之间就属于这种情况。它们都呈同步增长的趋势。判断自变量是否存在共线性可以考察膨胀系数(VIF)(或者允差),如果VIF大于10(允差小于0.1),则说明存在共线性。从图2可知,x2的VIF为34.049,x3的VIF为305.181,x4的VIF为304.464,4个回归的自变量系数中有3个的膨胀系数大于10,说明自变量确实存在共线。最小二乘法回归的参数只有统计学上的意义,失去了解释意义。

有回归的非标准化系数(B)得到OLS的回归方程为:

2.2 岭回归

对于这种情况,可以采用岭回归方法解决。岭回归是专门用于解决多元线性回归中,自变量数据存在共线性,回归的参数缺乏解释性问题的改良回归方法[1][2]。回归的参数不仅具有解释意义,也有一定的统计学意义[3][4]。

运用岭回归求解回归系数可表示为[5][6]:

式中,k为岭回归参数。

岭回归求回归系数,实质上就是在矩阵XTX加一个很小的对角矩阵kI,使XTX+kI可逆,这样求得的系数稳定可靠,且具有解释性。k∈[0,1],当k=0,则变为最小二乘法估计。k越大,消除共线性影响效果越好,但会导致拟合精度降低越大(可通过相关系数R2反映)。R2-k图如图3所示。因此,必须选择一个合适的值,即k取各回归系数基本稳定时的最小值,k-β图(岭脊图)如图4所示。

图3 相关系数随岭回归系数变化图

从图4可见,随着k值的增大,各自变量的回归线系数迅速减小,当k=0.7时,继续增加,各自变量回归系数基本稳定,而R2却减小。故得出最佳岭回归参数k=0.7,岭回归结果如图5所示。

图4 岭脊图

图5 岭回归系数

从图5知,模型回归的相关系数R2=0.9174381,调整相关系数R2Adj=0.8702599 ,二者都比OSL回归都有所减小,表明岭回归为了换取回归系数的稳定性和解释性,放弃了无偏估计,使拟合精度有所下降,但也属于比较高的水平,统计量F=19.44622688,显著性概率sigF=0.0068095,表明岭回归方程亦显著成立。x1、x2、x3、x4的标准化回归系数分别为:

β1=0.230849,β2=0.208225,β3=0.207771,β4=0.219075。4个自变量的回归系数全部为正,说明它们与我国石材消费成正相关,这是完全符合事实的。并且,4个自变量系数的值很接近,在数量级上没有本质差别,这也比较符合客观实际。再考察4个自变量系数值的大小,其值越大,则对石材消费的影响程度越大。由于β1>β4>β2>β3。所以,对我国石材消费影响程度由大到小的考察因素分别为:房屋竣工面积、城镇化率、城镇居民人均住房面积、城镇居民收入。这基本符合当前我国经济社会发展的实际情况。在考察的12年中,虽然房屋竣工面积增长幅度在4个因素中排名第二,但它与规模以上石材企业销售收入变化的同步度较高,它增长快,模以上石材企业销售收入也快,它增长慢,规模以上石材企业销售收入增长也慢,所以影响程度最大。虽然城镇居民收入增长幅度在4个因素中排名第一,但他与规模以上石材企业销售收入变换同步性不一致,它的增长快慢,并没有带动规模以上石材企业销售收入增长同样的快慢,甚至有些年份,它增长,规模以上石材企业销售收入反而下降,所以影响程度排在最后。其它道理类似,这里就不一一列举了。值得注意的是,影响程度大小并非绝对数值的大小,而是一个量的变化,对另一个量的拉动强弱。

有回归的非标准化系数)得到岭回归方程为:

由方程(5)和(7)得到二者的回归值,结果如表2。

表2 回归结果及对比

从表2知,OLS回归的平均误差为6.87390%,岭回归的平均误差为9.26404%,再一次证明,岭回归为了换取回归系数的稳定性和客观性,放弃了无偏差估计方式,使得回归误差有所增大。二种模型的回归曲线如图6所示。

图6 回归曲线及比较

3 结语

石材作为一种古老而又摩登的建筑装饰材料,在所有装饰材料中具有别具一格气韵,它高端大气、高贵典雅、富丽堂皇,深受人们的喜爱,正逐步成为建筑装修的时尚和新宠,应用范围越来越广泛。以致社会对石材的需求持续增长,不仅带动了石材行业自身的发展,而且拉动了上下相关产业的联动发展,如上游的石材生产加工设备,下游的石材施工、施工和维护材料及用品等行业的发展。虽然我国石材资源丰富,是世界上最大的石材生产国和主要的石材出口国。但石材属于不可再生资源,并且石材开采会对生态环境带来一定的破坏。因此,我国必须科学和合理开发利用石材,高效节约使用石材资源,积极践行绿色发展理念,珍惜和爱护自然资源,精心呵护和保护生态环境,走可持续发展之路,使之长期为人类服务,为经济社会的发展发挥更大的作用。运用岭回归分析了房屋竣工面积、 城镇居民人均住房面积、城镇居民收入、城镇化率4个因素对我国石材消费的影响,结果显示:对我国石材消费影响程度由大到小的因素分别为:房屋竣工面积、城镇化率、城镇居民人均住房面积、城镇居民收入。房屋竣工面积影响最大,城镇居民收入影响最小。4个因素的影响差距不大,在伯仲之间,都是影响我国石材消费不可忽视的因素。这一分析结果基本符合实际情况。

猜你喜欢
共线性销售收入城镇化率
新一轮新型城镇化顶层设计来了
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
2019年1—7月中国酒业经济指标
2016年全国户籍人口城镇化率达41.2%
义务教育城镇化率5年升至72.55%
陕西法士特年销售收入超百亿2014
2014中国印刷企业销售收入超过2亿元企业名录(100强后)