部分线性模型在贵州省公路货运周转量预测研究中的应用

2015-05-30 20:29王琳琳
2015年12期
关键词:主成分分析预测

王琳琳

摘 要: 该文结合贵州省的情况,选取出影响公路货运周转 量的6个主要影响因素:地区生产总值、社会消费品零售总额、全部工业增加值、公路营运里程、铁路货运周转量、农副产品产值;然后运用主成分分析法,将影响因素进行降维处理,得到两个主成分;之后再将降维后的数据拟合部分线性模型,运用该模型对贵州省2013年的公路货运周转量进行预测,预测相对误差为5.45%,达到了良好的预测效果 。

关键词: 部分线性模型;主成分分析;公路货运周转量;预测

引言

货运周转量不仅包含运输对象的数量,同时还包含运输距离的因素,能够全面地反映一定时期内的运输成果。公路运输作为贵州省的重要交通运输方式,研究公路货运周转量对于贵州交通运输业的发展和规划具有较强的影响作用。

部分线性模型由Engle[1]等人在1986年研究天气对电力需求的影响时提出的。由于该模型既包含参数部分,又包含非参数部分,因而表现出较强的灵活性,不仅可以避免一般线性模型的弊端,而且避免了非参数模型的维数祸根问题,更能符合现实数据的特征,因而该文选取该方法对贵州省公路货运周转量进行预测研究。

1.部分线性模型

部分线性模型的表达形式为:Y=XTβ+g(T)+ε (1)

其中Y为标量响应变量,X为p维协变量,β为x6维未知参数向量,T为标量协变量,g(·)为未知函数,ε为随机误差,并且满足E(ε)=0,Var(ε)=σ2。

部分线性模型的向量表示形式为:

该文采用权函数方法对部分线性模型进行求解:

这样就表示成了一般的线性模型,从而可以利用最小二乘法求解β的估计值,之后再求出非参数函数g(·)的估计。

2.贵州省公路货运量预测模型的估计

(1)指标的选取与数据处理

该文参考之前的专家学者对公路货运周转量的研究[2-4],并结合贵州省情况,选取影响贵州省公路货运周转量的6个影响因素:地区生产总值、社会消费品零售总额、全部工业增加值、公路营运里程、铁路货运周转量、农副产品产值,并从各年份的《贵州省统计年鉴》及《新中国60年统计资料汇编》中收集到1978—2013年的指标数据,采用Z-score标准化方法对数据进行处理。

将影响贵州省公路货运周转量的主要影响因子地区生产总值x1(亿元)、社会消费品零售总额x2(亿元)、全部工业增加值x3(亿元)、公路营运里程x4(公里)、铁路货运周转量x5(亿吨公里)、农副产品产值x6(亿元)导入spss18.0中进行主成分分析,根据分析结果,选取前两个主成分,主成分的累积贡献率达到98.98%;对因子载荷矩阵进行数据处理,得到两个主成分的系数矩阵。

做出贵州省公路货运量与两个主成分的散点图,如图1-2所示:

图1 公路货运周转量与第一主成分散点图 图2 公路货运周转量与第二主成分散点图

从上面的散点图我们可以知道,公路货运周转量与第一主成分存在显著的线性关系,与第二主成分的线性关系并不显著,因此,我们将第一主成分列为部分线性模型中线性部分的协变量,第二主成分定为该模型的非参数部分的协变量。

(2)部分线性模型的构建

在模型Y=XTβ+g(T)+ε中,Y表示贵州省公路货运周转量,X表示第一主成分,T表示第二主成分。在求解该模型时用到的权函数为:

其中,h表示窗宽,窗宽采用最佳窗宽的选择方法,hn=cn-1/5,c为某个常数,经测试,当c取2.46时,预测效果及密度曲线光滑性较好;核函数K(·)选取Epanechnikov核:K(x)= 3 4 (1-x2), x <1

将标准化后的数据导入到matlab中,计算得到回归系数为

3.模型评价

(1)模型的拟合效果

该文通过计算模型的拟合优度以及画出模型的拟合曲线来反映部分线性模型的拟合效果。

度量拟合优度的统计量为可决系数与修正可决系数,两者的计算公式如下:

运用上面的计算公式,算得R2=0.9513, 2=0.9364,可决系数与修正的可决系数都接近1,可见,部分线性模型对样本观测值的拟合效果很好。

(2)贵州省公路货运周转量预测

将2013年的变量数据代入表达式,预测贵州省公路货运周转量为577.39亿吨公里,并计算出预测相对误差,预测相对误差为5.45%,当预测误差处于5%—10%之间时,预测效果好。

4.结语

该文运用部分线性模型拟合贵州省公路货运周转量,修正的可决系数达到0.9364,模型拟合效果很好;运用该模型预测2013年的贵州省公路货运周转量,计算得预测的相对误差为5.45%,达到了良好的预测效果。

将部分线性模型应用到公路货运周转量的预测中来,为公路货运周转量的预测研究增添了新的研究方法。 (作者单位:贵州财经大学数学与统计学院)

基金项目:贵州财经大学2014年度在校学生科研资助项目

参考文献:

[1] Engk R F,Granger C W J,and R ice J. et al. Semiparametric estimates between Weather and electricity sales[J]. Journal of American Statistical Association,1986.80:310-319.

[2] 朱方海,凌建明等.西部地区公路货运周转量可拓聚类预测[J].西部交通科技,2006(6)

[3] 刘文华.城市公路货运量预测及物流园区适站量确定研究[D].北京交通大学,2009:39

[4] 赵建友.基于模糊线性回归模型的公路货运量预测方法.交通运输工程学报[J].2012,12(3):83

猜你喜欢
主成分分析预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
不可预测
不必预测未来,只需把握现在
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用