山西省现代物流发展影响因素的实证分析

2013-11-21 10:37彭大力
关键词:共线性物流业货物

彭大力

(山西青年职业学院,山西 太原030001)

1 问题背景与研究现状

物流业已经对整个社会商品的流通和企业的运营成本、经营效率产生了巨大的影响,也逐渐成为衡量一个国家和地区现代化程度和经济实力的重要标志之一.目前在我国已形成一股热潮,从流通领域向生产领域、消费领域和传统的服务领域不断扩展,尤其在北京、上海、广州、深圳、天津等经济较发达地区,物流业的发展更是迅猛.同时,随着计算机科学的不断发展,基于互联网技术的新型物流方式——电子商务的出现,更加创造性地推动着物流行业的飞速发展.这种配送营销方式被越来越多的大众所接受.在学术界里,很多学者也纷纷从定性和定量的角度分析了物流业对区域经济发展的促进作用.

随着信息时代来临,大量的信息将以数据的形式被存储,这些数据为研究社会经济等方面的发展提供了历史依据.正因为如此,现代统计方法已经广泛地应用于人们生活、工作和学习等各个方面,各类统计模型也随着现实问题的背景应运而生,部分线性可加模型就是其中极为流行的一种.这类模型既保留了线性模型的易解释性,又允许多个变量具有非参数函数的形式,使模型具有很强的灵活性,并且也避免了所谓的“维数祸灾”问题,其理论结果已有相当的发展.

2 变量描述和选择

物流业的发展和区域经济增长有长期的均衡关系,二者关系密切,相互促进.由于山西省并没有物流行业数据或者电子商务等统计数据,所以结合本省具体省情,主要从以下变量作为衡量物流发展的主要技术指标.把货物运输量(万t)看作是物流总量,影响它的因素主要分为人力、资源、社会环境3个方面,人力主要包含全社会从业人员(万人),高等学校在校学生数(万人),全部职工平均工资(元),居民消费价格总指数,社会消费品零售总额(亿元);资源主要包括货物周转量(亿t/km),邮电业务总量(千万元),海关进出口总额(千万美元),能源消费总量(万t),商品零售价格指数;社会环境包括地方财政支出(亿元),报纸出版数量(万份).首先从图1中发现从1980年到2011年期间,上述各项指标都随着山西省经济的发展而稳步上升,尤其随着保障制度的完善,本省从业人员出现大幅增长.

图1 1980年-2011年的山西省从业人员数量

因为本文所考虑的时间序列数据可能存在多重共线性,所以在建立模型之前需要对此进行检验,通过表1不难发现,部分变量之间的相关系数过高(0~0.2:不相关;0.2~0.4:弱相关;0.4~0.6:中度相关;0.6~0.8:高度相关;0.8~1.0:极度相关),所以很可能存在多重共线性,这样会导致解释变量的信息重叠,从而参数估计的方差变大,致使统计推断的结论稳定性下降,所以需要进一步进行多重共线性的诊断.

表1 相关系数矩阵表

一般地,主要通过变量的方差膨胀因子(VIF)来衡量变量间共线性的程度,在VIF<10时认为并不存在多重共线性,10<VIF<100时认为自变量存在严重的共线性,VIF>100时认为具有极其严重的共线性.从表2可以看到确实存在严重的共线性问题,需要通过选择具有显著作用的变量来消除多重共线性问题,这样也简化了模型,提高了模型的可解释性.

表2 方差膨胀因子表

变量选择现已成为统计学甚至很多学科的研究焦点,主要原因在于随着社会信息化进程的加速,将有越来越多的数据被储存起来用于科学研究,从而对社会生产、生活提供有效的预测.但对大量的数据进行直接分析将是一项浩大的工程,其中一个高效的办法就是在众多变量中选择具有显著作用的,这样不仅能够很大程度上减少数据处理的工作量,而且在很多实际问题中能节省大量的资金和能源.这在现实的生产生活中具有重要的经济意义.现代统计方法中很多通过惩罚函数对不重要的参数进行压缩来达到这个目的,但主要针对高维的数据对象,所研究的数据非常有限,传统的方法就完全可以解决,所以本文主要通过主成分分析来选择显著的变量.根据表3发现,Kilometers和POST_TEL两个变量就可以解释约84%的方差,但为了得到更好地方差解释,本文取前面6个变量作为解释变量进行分析,这样可以达到90%的解释度.

表3 Total Variance Explained

3 模型建立

基于以上的分析过程,主要把货物运输量(Traffic)作为响应变量,即物流总量的衡量指标,考虑以下6个解释变量:货物周转量(Kilometers)、邮电业务总量(Post_Tel)、社会消费品零售总额(Tot_Retai)、社会从业人数(Employees)、地方财政支出(Loc_Fin)和海关进出口总额(Exp_Imp).从散点图中不难看出,前面4个变量与运货物运输量具有线性关系,而后两者具有非线性作用,所以考虑使用如下部分线性可加模型:

其中Y=(Y1,…,Yn)T表示响应变量(即货物运输量)反应我省物流业发展状况的主要衡量指标,线性部分的解释变量(也称协变量)表示Xi=(Xi,1,…,Xi,4)T,写成矩阵形式为X=(X1,…,Xn),其他可以类似写出;f1(Z1),f2(Z2)表示未知的非参数函数;“ηi”表示在实际问题中无法直接观测或者无法准确获取的诸多影响因素,即随机扰动项,并假设ηi~N(0,1).n代表观测到的样本数.在收集到的山西省现有的数据中,1980年、1985年、1990年、1995以及从2000年到2011年的所有数据作为观测样本,即有n=16,从理论角度来讲,样本量稍显不足,“T”表示矩阵或者向量的转置.为此,需要通过模型(1)分别建立参数向量β和未知函数f1(·),f2(·)的相合估计

4 参数估计

样条函数近似是现代统计中一种常见的非参数估计方法,具体来说,在若干正则假设条件下,光滑的未知函数f1(·),f2(·)可以用多项式样条基函数的线性组合近似.所谓样条函数是指某集合T上一族内点序列t0<t1<…<tM+1上保持光滑性的逐段多项式函数,满足性质:1)在区间[ti,ti+1],i=1,…,M-1和[tM,tM+1]上是m阶连续可导;2)在整个区间上m-1阶连续可导.具体可参见de Boor(1978)and Schumaker(1981).那么,函数f1(Zi),f2(Zi)可以近似写成

其中B1(Zi)=(B11(Zi),…,B1kn(Zi))T和B2(Zi)=(B21(Zi),…,B2ln(Zi))T.所以模型可转化为

则(βT,θT)T的相合估计可以通过最小化下面的目标函数得到,即

写成矩阵形式为Y≈Xβ+Bθ+η,进一步有

从而根据(2)得到

5 模型解释

根据第4部分的估计过程,将我省的物流数据代入模型(1)得:

可知参数估计值为=(-0.357 2,-0.000 6,0.187 5,0.222 0)T,其对应的标准差为(0.139 9,0.004 7,0.071 9,0.059 1)T,非参数函数的估计见图2、图3.

图2 非参数的部分估计

图3 非参数的部分估计

根据参数部分的估计可以看出,货物周转量、地方财政支出和全社会从业人员总数的线性作用相对显著,其中货物周转量与货物的运输量成负相关关系,邮电业务总量对物流业没有明显的作用,而后两者对物流业的发展具有正线性相关作用.随着社会消费品零售总额的和社会从业人员的增加,将会有效促进物流行业的发展,这也是拉动内需的一种体现.此外,图2、图3显示初个别较为奇异的观测点外,地方财政的支出增长将会有利促进物流业的发展,除了对产业发展进行直接投资以外,政府可以通过加大教育投资力度,从而为本省培养更多的高素质人才;提高科研、科技经费,推动本省物流的迅速发展.最后,随着山西省进出口产品的增加,将会对物流行业具有潜在的巨大推动作用.

6 结论

电子商务作为一种更加快捷的物流形式已被很多人接受,无论从长期均衡的发展还是现行的市场需求,电子物流都会在很大程度上促进山西的经济发展.相信在规范制度和积极政策的导引下,加强高校和企业的长期合作,通过在学校开办物流课程或专业方向,共同培养符合市场需要的物流人才,才能从根本上促进山西的物流业快速发展,促进山西经济发展再上新的台阶.

[1]杨秀艳,房德东.浅谈现代物流管理中统计的应用[J].经济问题,2009(2):52-54

[2]龚树生,高和鸿.建立我国物流统计学的初步设想[J].中国流通经济,2001(4):4-7

[3]薛 薇.基于SPSS的数据分析[M].北京:中国人民大学出版社,2006

[4]郭志刚.社会统计分析方法:SPSS软件应用[M].北京:中国人民大学出版社,2006

猜你喜欢
共线性物流业货物
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
逛超市
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
物 流 业
我国物流业的供给侧改革的突破口
西安市物流业发展问题研究
营改增对物流业税负的影响与对策