摘 要:文章首先对ReliefF特征选择算法相关理论做了解析,分析了影响城市出租车保有量的相关因素;然后利用ReliefF算法对重庆、广东相关数据进行了处理,提取其中特征权重较大的特征;最后,基于降维后的特征进行多元回归分析,得到表征重庆、广东出租车保有量的多元回归方程。
关键词:出租车保有量;特征选择;ReliefF算法;多元回归分析
引言
出租车保有量问题已经成为出租车市场管理的重要依据,对城市出租车保有量的预测也成为了城市交通中的重要研究课题。文献[1]针对深圳市特区外的出租车保有量问题进行了研究,建立了类比分析模型。文献[2]通过对北京市出租车保有量问题的研究,提出了基于出行广义成本预测模型。文献[3]利用Bruce Schaller需求估计模型,对北京市出租车保有量进行合理预测。
本文提出基于ReliefF特征选择算法[4]的多元回归分析方法对出租车保有量问题进行研究。首先,利用ReliefF算法对众多影响因素进行权重排序,然后,利用多元回归分析方法对具体城市数据进行预分析。
1 ReliefF特征选择算法
ReliefF特征选择算法主要用于解决样本的多分类问题。算法基本思想:从训练集中随机选取一个样本R,然后从与样本R同类和不同类的样本集中均选出k个最近邻样本,最后,更新每个特征的权重。
2 出租车保有量问题实例
选取广东、重庆相关数据进行研究,数据来源于中国统计年鉴[5]。
考查影响出租车保有量的影响因素:X1:地区生产总值(亿元);X2:地区总人口(万人);X3:城镇居民家庭人均交通、通信消费支出(元);X4:公共交通车辆运营数(辆);X5:公共交通运营线路总长度(公里);X6:公共交通客运总量(万人次);X7:城镇居民家庭平均每百户家用汽车拥有量(辆);Y:现有出租车保有量(辆)。标准化处理后的数据见表1。
3 结束语
文章基于ReliefF算法对影响出租车保有量的因素进行了降维处理,对重庆、广东2008-2012年相关数据进行多元回归分析,分别得到二者的多元回归方程,对后续的研究工作有一定的指导作用。
参考文献
[1]孙喜梅,李猛,韩彪.基于类比分析的深圳市特区外出租车需求量预测[J].交通信息与安全,2009(5):19-23.
[2]柳丽娜,陈艳艳,张文阁.北京市出租车乘客需求预测模型研究[J].交通标准化, 2010(13):89-92.
[3]范合君,杜博.特大城市出租车合理数量估计及实现路径-以北京市为例[J].经济与管理研究,2015,36(8):91-95.
[4]Kononenko I. Estimating Attributes: Analysis and Extentions of RELIEF [C] // Machine Learning: ECML-94.Springer Berlin Heidelberg,1994:171-182.
[5]http://www.stats.gov.cn/tjsj/ndsj/中国统计年鉴.
作者简介:王岩(1979-),男,吉林省吉林市人,工作单位:吉林化工学院,职务:教师,研究方向:模式识别、机器视觉。