基于Apriori算法的打车软件用户关联规则分析

2015-11-25 23:50谭明亮溥德阳李晓梅
企业导报 2015年21期
关键词:关联分析数据挖掘

谭明亮 溥德阳 李晓梅

摘 要:打车软件在移动端和移动互联网快速发展的背景下应运而生,在一定程度上解决了中国出租车市场普遍存在的“打车难”问题;本文从打车软件用户的视角出发,针对常州市区市民的问卷调查结果,对不同年龄和性别的用户群体,采用了Apriori模型对数据进行了关联分析,并为运营打车软件企业提出了针对性的打车软件推广策略。

关键词:打车软件;数据挖掘;移动商务;关联分析

引言:“打车难”是一二线城市普遍存在的问题,尽管现有的出租车企业虽然多拥有电调系统,但由于电调系统本质上是“多对一”加“一对多”模式,其所发挥的效力大大受制于该系统对供需信息的处理和反应能力,仍然不能有效地缓解打车难问题[1]。移动端和互联网的快速发展为基于智能手机的应用软件平台的打车软件的发展带来了契机,在一定程度上解决了中国出租车市场普遍存在的“打车难”问题[2]。通过对期刊库里面的关键词进行检索发现国内目前对于打车软件的研究主要集中于打车软件对于整个出租车行业的影响、政府对于打车软件的规范、打车软件企业的战略博弈和使用打车软件存在的问题,而从打车用户的角度进行分析与研究的则相对较少。

本文从打车软件用户的视角出发,针对常州市区市民的问卷调查结果,对不同年龄和性别的用户群体,采用了Apriori模型对数据进行了关联分析,并为运营打车软件企业提出了针对性的打车软件推广策略。

一、关联分析与Apriori算法

数据挖掘又称为数据采掘,是采用具体的数据采掘算法从数据中自动高效地提取有用模式的过程;近年来,数据挖掘技术被广泛应用于各个领域,如商品零售业、保险业、金融投资业和电信业。关联分析是数据挖掘领域中常用的一种方法,用于分析对象之间的相关性和关联性。在关联分析中,最著名的挖掘关联规则算法就是Agrawal 和Srikant于 1993 年提出的Apriori算法。Apriori算法中有两个重要的概念:

概念1:关联规则XY的支持度:同时包含X 和Y 的事务集与所有事务集之间的比例,记作support(XY) 。概念2:关联规则XY的置信度:同时包含X 和Y 的事务集与仅包含X 的事务集之间的比例,记作confidence(XY) 。关联规则的发现就是在数据库中发现具有用户给定的最小支持度minsup 和最小确信度minconf 的数据集合的过程。

二、打车软件用户关联分析

针对从用户的角度出发采集到的信息,给定一个最小支持度minsup和一个最小置信度minconf,采用Apriori算法对户群体特征(年龄和性别)与影响他们使用打车软件的因素之间的关联规则进行挖掘,得出用户群体特征(年龄和性别)与影响他们使用打车软件的因素之间的相关性和关联性。

从常州市区调研收集到的300份问卷,剔除未完整填写的问卷和明显乱填的问卷得到259份有效问卷,完成数据准备清洗后,对已建立好的打车软件用户关联规则进行挖掘。在IBM SPSS Modeler软件中设置最低条件支持度为20%,最小规则置信度为65%,收集的数据经过Apriori算法对关联规则进行分析。

(1)省钱、提高打车成功率、支付安全和个人隐私问题是影响不同年龄和性别人群使用打车软件的共同因素。随着打车软件“补贴大战”热度的减退,必然会有部分客户放弃使用打车软件而回归到原来的公交等交通工具中;随着移动智能机和互联网的推广与普及,尽管支付方式变得越来越便利,使用打车软件的乘客可以直接在线支付免于花时间去换取零钱,但支付安全问题却是用户共同关注的问题;同时,打车软件低于打车成功率的提高也是影响客户使用打车软件的重要因素;尽管打车软件带来了诸多方便,可个人隐私的暴露无疑也成为了一个大的问题。(2)女性比男性更加注重使用使用打车软件的带来的经济效应(如免单带来的实惠),而男性相比女性更加注重使用打车软件带来的打车成功率的提高和随时随地的打车方便。在使用打车软件过程中个人隐私的暴露都消极地影响了男性和女性群体使用打车软件,但相比男性,对女性用户的影响更为剧烈。(3)对中老年人(即表中45岁以上部分)而言,支付便利不是影响他们使用打车软件的重要因素;而对于18-30岁年龄的人群而言,却很注重打车软件的支付便利。(4)对于17岁以下的用户和中老年用户而言,打车软件带来的随时随地打车的方便对他们影响较大,可能是由于在这两个人群中的学生和老年人更加在乎能够随时打车帶来的方便。

三、打车软件推广策略

基于关联规则分析后的结果,可以客观和针对性地制定打车软件的推广策略:

(1)提高使用打车软件带来的经济性,提高支付安全性和打车成功率是保持目前客户和吸引新客户的必要条件。对于提高使用打车软件带来的经济性,打车软件运营公司可以继续采取适度免单的策略吸引客户扩大规模经济带来的效应,同时免单也会给用户带来经济实惠;打车软件的采用安全的支付系统不仅能够使公司免于损失同时也能让客户更加放心地使用打车软件;采取更加精准的定位系统和更加优化的打车算法能够有效地提高打车成功率。(2)可以针对不同群体的打车软件用户群体,采取不同程度的优惠策略,如对于女性用户群体采取更多的免单。(3)对于不同人群提供不同的支付系统,对于青年用户群体可以采用更加先进的技术来改善支付系统以达到支付的便利性,如可以采取指纹支付;而对于中老年用户群体则可以改善和简化支付界面,使中老年用户能够更加容易地完成支付。(4)目前打车软件会公开用户的电话号码、打车地点、路途轨迹和目的地等个人隐私信息,对于用户的个人隐私也带来了不小的威胁;解决因使用打车软件带来的个人隐私问题可以吸引更多用户,特别是更多的女性用户。

四、结语

本文针对从常州调研收集到的问卷,对不同年龄和性别的用户群体,采用了APriori模型对数据进行了挖掘,针对模型输出的结果进行了分析,并提出了针对性的打车软件的推广策略,对于打车软件的设计、开发和推广有一定程度上的参考价值。在今后的研究中针对更加细分用户群体,如引入月支出、每周打车频率,还可以增加更多的影响人们使用打车的因素,设置模型中不同因素的权重来进一步完善,提高数据挖掘的准确性。

参考文献:

[1] 孙伟杰,张艺娜,王超.信息不对称角度下的出租车空载率成因分析[J].高等函授学报:自然科学版,2013(2):15-17.

[2] 刘馨蔚.移动打车新风乍起.中国对外贸易,2013(4):72-73.

[3] 王光宏,蒋平.数据挖掘综述. 同济大学学报(自然科学版), 2004,32(2)

[4] 颜雪松,蔡之华.一种基于Apriori的高效关联规则挖掘算法的研究. 计算机工程与应用, 2002,38(10).

[5] 李旭超. 论打车软件对乘客打车行为的SWOT分析——以“嘀嘀打车”和“快的打车”为例. 现代工业经济和信息化,2014,4(9).

[6] 黄常海, 高德毅, 胡甚平, 耿鹤军, 彭宇. 基于Apriori算法的船舶交通事故关联规则分析. 上海海事大学学报, 2014,35(3).

猜你喜欢
关联分析数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
基于随机函数Petri网的系统动力学关联分析模型
关联分析技术在学生成绩分析中的应用
数据挖掘技术在中医诊疗数据分析中的应用
基于关联分析的学生活动参与度与高校社团管理实证研究
不同的数据挖掘方法分类对比研究
一种基于Hadoop的大数据挖掘云服务及应用