基于多元线性回归模型的贵州省物流需求预测

2023-07-10 05:07缪辉罗露璐
物流科技 2023年8期
关键词:多元线性回归

缪辉 罗露璐

摘 要:物流需求在物流业中起着至关重要的作用。根据贵州省近年的物流发展情况,文章选取2005 —2021年的货运量、三次产业增加值等统计数据,运用R软件建立多元线性回归模型,并利用已有数据进行检验,该模型的预测精度较高。

关键词:物流需求;多元线性回归;预测分析

中图分类号:F252;F224文献标志码:ADOI:10.13714/j.cnki.1002-3100.2023.08.021

Abstract: Logistics demand plays a vital role in the logistics industry. According to the development of logistics in Guizhou Province in recent years, this paper selects the statistical data of freight volume and tertiary industrial added value from 2005 to 2021, uses R software to establish a multiple linear regression model, and uses the existing data to test. The model has a good prediction accuracy.

Key words: logistics demand; multiple linear regression; predictive analysis

0    引    言

经济的高效发展离不开现代物流业。贵州省地处我国西南地区,东靠湖南长株潭一体化、南邻广西北部湾经济开发区、西毗云南及中国-东盟自由贸易区、北接川渝经济区,得天独厚的地理位置使贵州省物流业的发展十分迅猛。近些年,物流需求被许多学者广泛研究。例如,梁艳明[1]利用回归分析法建立了安徽省物流数据模型,并认为该模型可以应用于区域物流需求的预测。刘炯[2]对安徽省物流需求相关数据构建了多元线性回归模型并提出了相关建议。王迪[3]对上海市物流需求的影响因素进行研究,结合上海市的物流发展现状提出相关建议。综上所述,本文运用多元线性回归模型对贵州省的物流需求进行预测分析,同时根据分析结果提出针对性建议,促进了贵州省现代物流业的高速发展。

1    多元线性回归模型

一般来说,在实际应用中,因变量会受到若干相关因素的影响,多元线性回归表示它们之间的关系呈线性相关。一般形式表示为

其中β0为常数项,而β1,β2,...βn为回归系数,ε为随机干扰项。

2    指标选取及数据收集

2.1    指标选取

当前,行业内还没有统一规范的统计指标来度量物流需求。故本文参考大量有关物流需求方面的文献,在考虑数据来源科学性、可靠性和全面性的前提下,将因变量Y选取为货运量这一指标。影响物流需求的因素多种多样,结合贵州省物流需求的研究现状和实际情况,选取以下影响物流需求的指标作为解释变量,见表1。

2.2    相关指标说明

2.2.1    经济发展水平

国内生产总值常用来衡量一个国家或地区的经济状况,它由第一、二、三产业增加值组成。物流基础设施的固定投资部分也是影响物流发展的必要因素之一,同时物流需求对零售业的发展具有重要的支持作用。

2.2.2    对外经济贸易

一个国家或地区的外贸规模和发展水平可以用进出口总額衡量,而进口或出口贸易都需要借助物流来实现。因此物流会影响国家或地区的对外经济贸易水平。

2.2.3    人民生活水平

居民的人均可支配收入随着经济水平的提高不断增加,这样居民的购买力也增强了;为了适应多样化和个性化的居民购买需求,相应的物流需求也日渐提高。

2.2.4    人口发展水平

人口发展水平反映了地区的人口规模,人口聚集地区相对经济较为繁荣,而且物流行业在这些地区发展得也极好。故选用年末常住人口这一指标来衡量物流需求。

2.3    数据收集

本文收集了贵州省2005—2021年与物流相关的数据,数据来源于中国统计局官网、贵州省统计年鉴和统计公报。统计指标为货运量(万吨)、三次产业增加值(亿元)等。

3    实证分析

3.1    模型构建

本文选取了贵州省2005—2021年的物流相关统计指标,因变量为货运量,记为Y,其余指标为自变量,分别是全社会固定资产投资额(X1)、第一产业增加值(X2)、第二产业增加值(X3)、第三产业增加值(X4)、社会消费品零售总额(X5)、进出口额(X6)、居民人均可支配收入(X7)、年末常住人口(X8),建立多元线性回归模型如下:

为了分析出哪些因素影响贵州省物流量,在建立多元线性回归模型时,需要首先检查各变量之间的相关性。通常,相关系数的绝对值大于0.8时,两变量之间的线性关系很强。计算结果显示,选取的变量之间有严重的多重共线性(见表2)。接下来,需要进一步对回归模型进行研究,需要做假设检验,否则回归模型会不稳定,会影响模型分析预测的精确度。

3.2    假设检验

3.2.1    正态性检验

正态分布检验可以检验总体数据是否呈正态分布,由图1可见,点均在直线附近且在置信区间内,通过正态性检验可知本文所采用的指标数据均符合正态分布。

3.2.2    自相关检验

为了判断线性回归模型是否满足要求,还需要做残差的独立性检验(自相关检验),对建立的模型进行DW自相关检验。结果可得,DW=2.124 881、P=0.072>0.05,说明因变量之间无自相关关系,残差是相互独立的。

3.2.3    线性关系检验

由图2可知本文所选的数据适合使用线性模型。

3.2.4    同方差性检验

同方差性就是要求回归残差是随机的,否则可能存在回归设置或者变量选取等问题,需要修正。由图3可得,超过95%的样本点无趋势地落在[-2,2]之间,并通过同方差性检验。

3.2.5    多重共线性检验

多重共线性通常在线性回归分析时出现,易使回归系数符号与实际情况完全相反,导致分析结果不稳定,所以需要消除多重共线性的影响。本文将采取全子集回归选择最终预测变量。

由图4可知,模型含有截距项X3、X4、X6和X7时,调整R2为0.97,模型拟合最优。但是由于X6未通过t检验,因此将其删除。对两个模型的拟合优度进行比较,由于检验不显著(P=0.101 7>0.05),变量X6可删除。因此模型含有X3、X4、X7这三个变量即可。基于此,本文确定最优的贵州省物流需求模型为

3.3    预测分析

非标准化数据构建的非标准化回归方程(3)是否有效,还需要进一步验证,将表2中变量X3、X4、X7的原始数据直接代入回归方程(3),同时预测2005—2021年贵州省的物流量,表3为贵州省物流需求预测值与实际值的对比结果。

一般普遍认为回归模型的预测精度可以通过误差率判断,误差率是预测值与实际值之差和实际值的比值,误差率在10%以下,说明预测精度较高。从近17年的数据看,实际值与预测值相差不多,除了2005年、2008年和2010年,误差率均在10%以下,最小的是2016年的0.88%。通过表3的分析结果可以看出,本文所选用的指标数据用来预测贵州省物流量是合适的,并且有较高的预测精度,为了使结果更加直观,本文给出预测图(图5),从图5可看出贵州省物流量稳步增加,2010年后增速加大。因此,只要预先获取要预测年份贵州省第二产业、第三产业的增加值及居民人均可支配收入,就能预测该年度贵州省的物流需求。

4    结论与建议

本文运用多元线性回归模型对贵州省2005—2021年的物流量及其相关数据进行预测分析,模型通过了有效的检验和预测,相对误差极小、准确度较高,模型合理可用。其中,贵州省第二产业增加值对物流量的正向影响最大,而第三产业增加值和居民人均可支配收入对物流量有轻微的负向影响。贵州省应当积极建设新型物流基础设施并构建集约、高效的现代物流服务体系,同时加强物流业与其他产业的融合,实现城市居民消费体系和物流需求的互惠双赢。

参考文献:

[1] 梁艳明.基于回归分析方法的物流需求预测——以安徽省为例[J].广西民族师范学院学报,2015,32(4):65-69.

[2] 刘炯.基于多元线性回归的物流需求预测分析——以安徽省为例[J].四川文理学院学报,2022,32(2):51-58.

[3] 王迪.基于多元線性回归模型的物流需求影响因素实证分析——以上海市为例[J].投资与创业,2022,33(14):58-60.

猜你喜欢
多元线性回归
我国银行业股票收益影响因素实证研究
国内旅游收入主要影响因素的实证分析
基于灰色关联和线性规划的粮食种植面积影响因素分析
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究
全国主要市辖区的房价收入比影响因素研究
宏观经济变量对上证指数影响的实证研究
利用计量工具比较东西部的经济状况