基于PCA-Logistic回归的汽车保有量预测研究

2017-05-19 00:50张兰怡胡喜生陈清耀邱荣祖
关键词:保有量汽车产业福建省

张兰怡,胡喜生,陈清耀,邱荣祖

(福建农林大学 交通与土木工程学院,福建 福州350002)

基于PCA-Logistic回归的汽车保有量预测研究

张兰怡,胡喜生,陈清耀,邱荣祖

(福建农林大学 交通与土木工程学院,福建 福州350002)

汽车保有量是一个相对复杂、非线性变化的数据总量,需要一种预测方法对汽车保有量进行快速、准确、合理的预测,预测结果可以作为城市经济可持续发展的重要依据。以福建省为例,选取2000—2014年间福建省总人口、人均GDP、第一产业生产总值比重、第二产业生产总值比重、第三产业生产总值比重、城镇居民人均可支配收入、农村居民人均纯收入、城市化水平等8个指标作为汽车保有量的主要影响因素进行分析。对8个指标进行主成分分析得到综合经济发展值的预测方程,采用Logistic回归模型进行预测并验证。结果显示:该方法预测精度高,能够为对汽车保有量进行较准确的估计,并为城市发展规划提供参考依据。

交通工程;汽车保有量;主成分分析;Logistic回归模型;预测

0 引 言

人们经济生活水平的提高和汽车工业的不断发展,使得全社会的运输需求不断扩大。汽车作为满足人或物的空间位移变化载体[1],已成为人们日常生活不可或缺的交通工具。2014年中国汽车保有量达到1.4亿,比上一年增长12.4%;其中福建省汽车保有量达388.49万辆,比上一年增长16.0%。汽车保有量的迅速增长直接影响能源利用、环境质量、交通安全与设施等诸多方面。对汽车保有量进行预测可以为我国汽车市场实现产销平衡目标提供基础性数据,避免汽车产业产能过度扩张,引导汽车产业良性发展,提高汽车产业经济效益与全球竞争力。其次,汽车产业是经济发展的5大传统支柱产业之一,汽车产业的发展需要大量消耗化石燃料,尾气污染物排放量的激增导致了一系列环境问题,汽车成为空气污染的主要贡献者。然而中国汽车现状表现为排放控制水平差,交通管理和控制措施不利,交通的供需矛盾使机动车运行工况恶化,加剧了排放污染。因此,汽车保有量预测可以为减少汽车尾气污染物排放提供决策支持,还可以为政府制定路网污染物排放清单提供数据支持。

国际预测汽车保有量的方法以需求模型为主,而需求模型又分为集计模型和非集计模型两类[2]。集计模型主要是以人口、城市经济、道路及停车设施供给等因素为基础预测汽车保有量。如L.T.MEI等将城市路网容量和停车设施作为约束条件,利用双层规划理论建立最大汽车保有量理论[3]。非集计模型以微观经济学和效用选择理论为基础,把个人属性和和社会经济属性进行综合建立效用函数,再利用效用函数预测人们购买汽车的可能性。

我国在汽车保有量方面的研究主要分为两类:一类是在方法上进行改进,如采用因果关系预测法、时间序列预测法、情景分析法、BP神经网络、灰色模型等方法提高汽车保有量预测精度;另一类则是通过分析影响汽车保有量的因素(如人均GDP、城市化率、人均粗钢量、汽车价格、公路总量等),探究经济增长和汽车保有量的相互关系,进而采用回归模型预测汽车的发展趋势[4-5]。

前人对汽车保有量预测时考虑的影响因素较少,实际上,汽车保有量与社会经济数据中的GDP、人口、收入、城市化水平、产业生产总值比重等数据有关,考虑因素过少可能会导致汽车保有量预测结果不精确,影响对汽车工业发展趋势的分析。

因此,在总结前人研究成果的基础上,笔者考虑引入总人口、第一产业生产总值比重、第二产业生产总值比重、第三产业生产总值比重、城镇居民人均可支配收入、农村居民人均纯收入、城市化水平和人均GDP等8个影响因素对汽车保有量进行研究。利用主成分分析法和Logistic回归模型对福建省近15年的汽车保有量进行分析并预测,以期获得较准确的预测结果。

1 福建省汽车产业发展现状

福建省汽车产业拥有巨大生产能力、年产值及销售收入过万亿元的产业,汽车产业能集各种新技术、新材料、新工艺、新装备于一体,形成巨大的生产和市场规模,创造更多的产值、税收和就业岗位,对改善人民生活质量至关重要。福建省汽车产业的发展促进钢铁、石油、4S店等相关行业的发展,带动福建省国民经济整体水平的提高。对福建省汽车保有量的研究有助于剖析汽车产业和经济发展的相关关系,为继续繁荣福建省经济提供新思路。

福建省汽车保有量样本容量选取自2000—2014年这15年的数据,数据来源于福建统计年鉴(表1)。

表1 福建省汽车保有量及影响因素数据(2000—2014年)

2 汽车保有量的影响因素分析

2.1 总人口

福建人口基数大,人口增长逐年递增,交通需求的人口规模效应也不断“自我放大”。人口对汽车保有量始终保持强大的推动作用及长期的规模效应。图1(a)可知人口在15年内持续稳定增长,呈线性增长趋势[6],而汽车保有量呈现指数上升趋势。

2.2 社会经济因素

2.2.1 宏观经济

汽车产业的发展促进了国民经济的发展,国民经济的高速健康发展又刺激汽车消费,带动了汽车产业的发展进程,两者相互影响,相互促进。根据图1(b)可知:人均GDP与汽车保有量之间有着很强的相关关系,随着人民生活水平的不断提高,汽车保有量的增长速率同人均GDP增长速率基本保持一致[7]。

2.2.2 消费者收入水平

人均收入水平对汽车保有量的增长有积极的推动作用。由图1(c)可知:城镇居民人均可支配收入远高于农村居民,随着年份增长收入差距逐渐扩大。但城镇居民人均收入增长率在2011年起有所下降,农村居民人均收入在2000—2010年增长比较缓慢,到2010年后逐步增长。同时,城市道路基础设施发展水平比农村高,根据经济发展一般规律可知城市汽车需求高于农村。城市和农村的收入水平不断提高促进了居民的购买力,也带动了汽车产业的消费[8]。

2.3 城市化水平

然而,提高城市化水平并不能直接、快速提高人们收入水平,而且并不是所有的居民都能拥有汽车,因此城市化水平对汽车保有量的影响相对比较稳定。图1(d)为福建省城市化水平与汽车保有量之间的关系。

图1 各因素与汽车保有量关系Fig.1 Relationship between car ownership and each factor

3 研究方法

3.1 主成分分析法

主成分分析法(principal component analysis,PCA)可以将原始数据进行降维,归一化处理得到n个主成分,且每个主成分都不会存在交集[9],是将多个变量划为几个主要综合指标的一种统计分析方法。

PCA分析基本步骤如下:

1)原始数据标准化

对原始数据进行归一化处理,把数值限定于[0,1]之间,x表示指标变量,如式(1):

(1)

2)计算协方差矩阵

(2)

3)求相关系数矩阵的特征值和相应的特征向量

4)确定主成分

当主成分的累积贡献率达85%以上时,具有较强的代表性。根据贡献率大小选取P个比重较大指标作为主成分,既可以完整的保留基础数据,还可以增强网络泛化性能[10]。

3.2 Logistic回归模型

Logistic模型是描述因变量随时间变动趋势的模型。它有3个显著的特征:单调递增性、增长有限性及呈S形曲线增长性[11]。此方法计算简单,经济意义明显,被广泛应用于产品市场分析方面。

传统Logistic模型微分方程如式(3):

(3)

式中:F为某一时刻y(t)与m的比;y(t)为t时刻新产品的数量,即汽车保有量;m为最大保有量;b为常数。

由分离变量法求解式(3),得:

(4)

式中:a为常数;

则t时刻的保有量:

y(t)=mF(t)

(5)

增长量最大的时刻:

T*=ln(a)/b

(6)

3.3 基于PCA-Logistic回归分析模型

笔者对总人口数、人均GDP、第一、二、三产业生产总值比重、城镇居民人均可支配收入、农村居民人均纯收入以及城市化水平8个汽车保有量的影响因素与汽车保有量之间的非线性回归关系进行研究分析,利用降维模块和回归-曲线估计模块,实现PCA-Logistic回归分析。

Logistic函数的具体模型如式(7):

(7)

将数据用SPSS的降维因子分析模块进行压缩降维处理,之后选取第一主成分FAC1_1作为回归分析的自变量,汽车保有量为因变量,得到汽车保有量和综合经济发展值的模型。预测时则先用该模型预测未来综合经济发展值,然后将该预测值带入Logistic函数,实现对汽车保有量的预测。

4 汽车保有量预测模型的建立

4.1 主成分分析

从表1中选取8个因素进行主成分分析,综合评价每年度的社会经济发展水平,解释的总方差如表2;成分得分系数矩阵如表3。

表2 解释的总方差

表3 成分得分系数矩阵

由表2可得第一主成分的特征值λ=6.727>1,且远大于其他特征值,累积方差贡献率为84.092%,即可以解释总体数据的84.092%。由表3可知:第一主成分中除了第三产业生产总值得分偏低,其他因素的得分系数都较高,其中第一产业生产总值与第一主成分呈显著负相关。

第一主成分的计算如式(8):

F1=0.998P1+0.978P2-0.964P3+0.958P4+

0.141P5+0.991P6+0.964P7+0.998P8

(8)

利用式(5)计算得第一主成分数据。由图2可知:第一主成分值与年份呈显著的线性正相关,故利用线性回归模型得出第一主成分与年份的关系,如式(9):

F1=-1.786 7+0.223 3n

(9)

计算可得综合经济发展变量在2020年的取值为2.826。

第一主成分与各类汽车保有量存在明显的非线性关系,故考虑以第一主成分值为自变量,汽车保有量为因变量,进行Logistic曲线回归分析,从而预测汽车保有量。

图2 2000—2014年度第一主成分值折线Fig. 2 Value of the first principal component line chart from 2000 to 2014

4.2 回归分析

利用主成分分析法得到不同年份的成分矩阵,并对汽车保有量进行预测,探究综合经济发展值与保有量之间的相关关系。根据表1知两个变量之间存在非线性回归关系,选择Logistic函数进行回归分析和曲线估计。

对曲线拟合结果初步描述统计,包括自变量、因变量、估计方程类型、上限设定值等。总保有量的上限值为2 000,私人汽车保有量的上限值为1 500,公路营运汽车保有量的上限值为100。

对样本数据进行Logistic回归的检验统计量和相应方程中的参数估计值如表4。总保有量模型的整体拟合优度值0.998,统计量8 461.3,概率值远小于显著性0.05,说明该模型有统计学意义,故可得出估计方程如式(10):

(10)

由表4得私人汽车保有量模型的整体拟合优度值为0.997,统计量为4 399.4,概率值远小于显著性0.05,说明该模型有统计学意义,故可得出估计方程如式(11):

(11)

公路营运汽车保有量模型的整体拟合优度值为0.978,统计量为638.9,概率值P远小于显著性0.05,说明该模型有统计学意义,故可得出估计方程如式(12):

(12)

综上,基于PCA-Logistic回归组合法的数据拟合优度值接近1,概率值P小显著性高,显示其预测精度较高,效果较好。

表4 模型汇总和参数估计值

4.3 同其他预测模型比较

分别用一元线性回归模型、幂函数模型、指数函数模型对福建省汽车保有量进行模拟,同PCA-Logistic回归模型结果对比(表5)。结果显示几种模型模拟精度均符合要求,其中PCA-Logistic相关系数最接近于1,回归模型效果最好,说明利用PCA-Logistic回归模型精度较其他方法更优。

表5 福建省汽车保有量预测模型

(续表 5)

参数模型方程相关系数私人汽车保有量一元线性回归模型y=21.554x-59.1190.883幂函数模型y=7.3273x1.23340.878指数函数模型y=11.555e0.2298x0.997PCA-Logistic回归模型y=111500+0.013×0.333x0.998公路营运汽车保有量一元线性回归模型y=1.1541x+10.5310.959幂函数模型y=10.894x0.30270.806指数函数模型y=12e0.0583x0.977PCA-Logistic回归模型y=11100+0.042×0.721x0.99

4.4 汽车保有量预测

将计算所得综合经济发展变量值分别带入总保有量、私人汽车保有量、民用汽车保有量、公路营运汽车保有量的Logistic回归模型当中,得到2020年的预测值(表6)。

表6 2020年汽车保有量的预测

5 结 语

笔者通过分析汽车保有量的影响因素,采用主成分分析法评价社会经济发展水平,利用PCA-Logistic回归分析模型实现对福建省2020年汽车保有量的预测。

通过基于影响因素的非线性关系的汽车保有量预测,较全面考虑了影响汽车保有量的复杂性与随机性因素,采用PCA-Logistic回归分析模型结果显示预测误差较小,显著性明显,该方法在汽车保有量预测方面具有一定的适用性。PCA-Logistic回归分析法除应用于汽车保有量预测外,也适用于对人口、医药和环境等领域的预测,其范围可进一步拓宽,不同行业的模型建立也需进一步研究和改进。

[1] 胡军红,李晶.各种运输方式协调发展模式探讨[J].重庆交通大学学报(自然科学版),2009,28(2):294-297. HU Junhong, LI Jing. Discussion on patterns of transport modes’ coordinated development[J].JournalofChongqingJiaotongUniversity(NaturalScience), 2009, 28(2): 294-297.

[2] DISSANAYAKE D, MORIKAWA T.Investigating household vehicle ownership, mode choice and trip sharing decisions using a combined revealed preference/stated preference Nested Logit model: case study in Bangkok Metropolitan Region[J].JournalofTransportGeography, 2010, 18(3): 402-410.

[3] MEI L T, LAM W H K.Balance of car ownership under user demand and road network supply conditions: case study in Hongkong[J].JournalofUrbanPlanning&Development, 2004, 130(1): 24-36.[4] 马超群,赵海龙.汽车市场需求预测建模及其应用研究[J].湖南大学学报(社会科学版),2009,23(4):38-44. MA Chaoqun, ZHAO Hailong. Research on the modeling of automobile demand forecasting and empirical analysis[J].JournalofHunanUniversity(SocialSciences), 2009, 23(4): 38-44.

[5] 彭浪,宁宣熙.中国未来汽车市场的研究[J].管理世界,2009(1):180-181. PENG Lang, NING Xuanxi. Research on the future automobile market in China[J].ManagementWorld, 2009(1): 180-181.

[6] 张苏北.福建省人口流动地域类型及其形成机制研究[D].福州:福建师范大学,2014. ZHANG Subei.AStudyonRegionalPatternsofPopulationMobilityandTheirFormingMechanisminFujianProvince[D]. Fuzhou: Fujian Normal University, 2014.

[7] 高鋆,虞晓芬.中国私人汽车保有量影响因素及其变化路径分析[J].工业技术经济,2013(9):41-47. GAO Yun, YU Xiaofen. The dynamic analysis of influencing factors on personal vehicle number of China and its sociological implication[J].JournalofIndustrialTechnologicalEconomics, 2013(9): 41-47.

[8] 关子明,常文兵.基于PCA-RBF神经网络模型的航空备件预测方法[J].北京工商大学学报(自然科学版),2009,27(3):60-64. GUAN Ziming, CHANG Wenbing. Estimating approach for aviation spare parts based on principal component analysis and RBF artificial neural network[J].JournalofBeijingTechnologyandBusinessUniversity(NaturalScienceEdition), 2009, 27(3): 60-64.

[9] 潘怀兵.基于主成分分析法的沥青路面使用性能评价[J].重庆交通大学学报(自然科学版),2010,29(6):888-890. PAN Huaibing. Evaluation of asphalt pavement performance based on principal component analysis method[J].JournalofChongqingJiaotongUniversity(NaturalScience), 2010, 29(6): 888-890.

[10] 张雪伍,常晋义.PCA-BP在城市汽车保有量预测中的应用研究[J].计算机仿真,2012,29(12):376-379. ZHANG Xuewu, CHANG Jinyi. Research on urban car ownership prediction based on PCA-BP neural network[J].ComputerSimulation, 2012, 29(12): 376-379.

[11] 胡喜生,范海兰,宋萍,等.改进Logistic模型在城市人口预测中的应用[J].北华大学学报(自然科学版),2008,9(4):370-373. HU Xisheng, FAN Hailan, SONG Ping, et al. Application of urban population prediction based on modified Logistic model[J].JournalofBeihuaUniversity(NaturalScience), 2008, 9(4): 370-373.

(责任编辑:刘 韬)

Prediction of Car Ownership Based on Principal Component Analysis and Logistic Regression

ZHANG Lanyi, HU Xisheng, CHEN Qingyao, QIU Rongzu

(College of Transportation and Civil Engineering, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, P. R. China)

Car ownership is the amount of data with relatively complex and nonlinear changes. There is a need for a rapid and accurate prediction method for fast, accurate and reasonable prediction of car ownership, whose prediction results can be used as an important basis for the sustainable development of the city economy. A case study of Fujian province was carried out. 8 indicators were selected as main influence factors of car ownership in Fujian province from 2000 to 2014, such as total population, per capita GDP, primary industry proportion of GDP, the second industry proportion of GDP, the third industry proportion of GDP, urban per capita disposable income, rural per capita net income and urbanization level. Through principal component analysis on 8 indicators, the prediction equation of comprehensive economic development value was obtained, which was predicted and verified by Logistic regression model. It is indicated that the prediction accuracy of the proposed method is high, which can predict the car ownership exactly and provide reference basis for urban development planning.

traffic engineering; car ownership; principal component analysis; Logistic regression model; prediction

10.3969/j.issn.1674-0696.2017.05.18

2016-03-28;

2016-06-06

福建省社会科学规划项目青年基金项目(FJ2015C148);福建省教育厅科技项目(JB14005);福建农林大学高水平大学建设基金项目(113-612014018);福建农林大学青年基金项目(2013xjj25)

张兰怡(1987—),女,福建福清人,讲师,博士研究生,主要从事交通运输规划方面的研究。E-mail:61963323@qq.com。

邱荣祖(1961—),男,福建莆田人,教授,博士,主要从事交通运输规划与管理方面的研究。E-mail:qrz1010@yahoo.com.cn。

U491.1+4

A

1674-0696(2017)05-104-06

猜你喜欢
保有量汽车产业福建省
全国机动车保有量突破4亿辆,新能源汽车占比2.90%
装配式支吊架在汽车产业集聚区的应用
解读《新能源汽车产业发展规划(2021-2035)》
福建省“两会”上的“她”声音
第四届福建省启明儿童文学双年榜揭榜
全国机动车保有量达3.4亿辆
对我国私家车保有量影响因素的统计分析
对我国私家车保有量影响因素的统计分析
培育世界级汽车产业集群
第三届福建省启明儿童文学双年榜揭榜