赵长虹 陈玉皓
摘 要:出租车是城市交通体系中不可或缺的部分,合理配置出租车资源对优化城市交通,解决人车矛盾有重要意义。随着移动设备与定位技术的普及成熟,大量出租车配备了移动定位系统,由此获得大量轨迹数据。基于出租车轨迹数据分析城市交通状态对改善城市交通状况与充分发挥出租车作用有重要意义。目前已有的出租车推荐系统多基于出租车的历史轨迹,未考虑出租车营运的其他因素。本文基于出租车轨迹数据,结合城市交通路况指标与出租车优质客源模型,研究城市出租车与乘客双向推荐方法,以此为基础实现出租车与乘客双向推荐原型系统,向出租车和乘客推荐合适路段。设计实现出租车轨迹数据预处理子系统,实现轨迹数据的预处理与出租车基本营运指标的提取计算。出租车双向推荐系统实现历史轨迹查询模块与双向推荐模块。历史查询模块提供历史轨迹、乘客历史上下车点查询功能。双向推荐模块基于双向推荐系数为出租车与乘客推荐最优路段。
关键词:出租车;乘客;轨迹数据
一、系统研究背景和意义
随着经济技术的快速发展,互联网已经对商业、工业、银行,及人们的工作、生活产生了深远的影响。许多传统的信息和数据库系统正在被移植到互联网上,人们获得信息的来源已经不再只是报纸、电视、广播等传统媒体。一个新的信息传送媒体逐渐被人们所青睐。随着计算机技术的发展,网络正在迅速的改变着人们的生活、学习、工作方式,更多的人开始通过网络查询资料,为解决已有系统推荐位置不全面、未考虑乘客偏好需求等问题,重新提出了一套候车位置推荐方法,研究并实现了自己的候车位置推荐系统“易出行”。为实现更加人性化的推荐,在主界面为乘客提供了三个选项:“少走路”、“少等待”,“综合最优”,根据乘客输入的实际需求结合本文的推荐算法为乘客推荐最佳的候车位置,并将每个候车位置的候车时间和距离信息同时推荐给乘客。
二、系统概述
本项目研究并设计的候车位置推荐系统,为乘客推荐候车位置的同时预出在该位置需要等待的时间。该推荐系统不仅可以减少乘客的候车时间,提高乘客的出行效率,候车时间的预测也为乘客合理的出行安排提供了依据。本项目系统采用三层 C/S 软件架构模式,C/S 是客户端/服务器模式,它可以充分利用两端硬件环境的优势,将任务合理分配到 Client 和 Server 端来实现和 Android 客户端与服务的通信机制来实现。
三、系统需求分析
首先是对于上车点的成本的选择,我们要从乘客,司机以及企业三个角度来分析,前两者已经考虑,但是企业角度方面提高用户的接驾体驗,获得用户粘性以及好评率有待加强,比如在乘车上车之后,司机可以进一步的向乘客做一些目的地的信息推荐,以便达到最佳的下车地点。其次就是在乘客赶往乘车点所需要行走的时间方面级需要乘客有一定的经验和估算能力,如果乘客不能正确的估算行走时间,即便是最近的乘车点有可能不如远一点的乘车点花费的时间少。然后就是在一些车辆较少而且偏僻的地方,我们可以考虑先乘坐公交车到达最近的乘车点然后再预约乘车,这样可以实现灵活的乘车,扩大乘车范围。
四、系统总体设计
(一)上车点的推荐项目中的特征可以分为三类:上车点基础特征,上车点用户隐式的反馈特征和用户画像特征。距离时间热度特征可以从日志解析整合模块的输出结果中提取,上车点的用户隐式反馈特征是根据历史订单通过 HQL对多张Hive表进行操作得到的自建特征,用户的画像特征从多个纬度来刻画这一用户例如基础信息纬度,时间维度,地址信息纬度等,这些特征需要调用API接口获取。
(二)对于数据的收集,我们采用最近邻算法进行道路数据的收集,这是一种高效的移动路径推荐系统,当服务器端得到数据如何利用较优的方法对数据进行处理,特别是面对大数据级别时的操作,最佳算法的位置就显得举足轻重。但在本项目的应用中存在一种n:n的关系,此时递归的优势就完全展现。
(三)在现有的研究成果中主要在离线部分处理耗时的操作,在线部分负责快速响应推荐请求根据离线部分是否采用确定的模型匹配技术可以把离线在线结合分为离线建模类和无模型类离线建模类最大的特征是在离线部分采用历史数据建立模型,然后对模型进行训练,并依据新到的数据对模型进行更新在线部分负责轻量级的操作如响应用户的请求和推荐结果显示。
五、总结
深入研究用户以及用户的社交网络体现出来的隐式联系,用户所谓‘异 常活动,实际上是推荐系统无力解决用户特定情况下正常活动的一种不足。通过对于用户更为细致的归类、对于用户隐式特征的深入研究和提取、通过对于用户社交网络的深入发掘和预测,笔者相信能够得出更加全面和优秀的算法,并且为未来基于定位服务的推荐系统提出更好的算法。对未来的展望也是对本文研究的反思。
参考文献:
[1]韩韬.软件测试策略和测试方法的应用[J].信息记录,2018,19(11):97-98.
[2]豆雪珊.应急车辆交叉口优先通行辅助方法及协调控制策略研究[D].长春:吉林大学,2018.
[3]吴忠勤.大中型客车行业的发展状况与展望[J].商用汽车,2006(7):23-26.
[4]赵苗苗. 基于出租车轨迹数据挖掘的推荐模型研究[D].首都经济贸易大学,2015.
[5]李飞,吴春旺,王敏.信息安全理论与技术[M].西安:西安电子科技大学出版社, 2016.
[6]兰旭辉,熊家军,邓刚.基于MySQL的应用程序设计[J].计算机工程与设计,2017(03):442-443+468
[7]许阳. 城市轨道交通车站站台候车乘客分布规律研究[D].北京交通大学,2015.
[8]王沙沙. 基于AFC数据的城市轨道交通路网乘客时空轨迹估计[D].北京交通大学,2018.
作者简介:
赵长虹(1990-),女,山东枣庄,助教,学士,计算机应用。
基金项目:山东省高等学校国家级大学生创新创业训练计划项目,项目编号:S201913324052