基于Kohonen网络的客户行为研究

2018-09-21 10:54赵琨杨潇潇
现代商贸工业 2018年24期
关键词:数据挖掘

赵琨 杨潇潇

摘 要:近年来快递业陷入价格战,在电子商务蓬勃发展的背景下,快递业作为一个汇聚着海量数据的行业,对数据的合理挖掘利用更可能带来下一个利润增长方向。以某快递公司一年的消费者行为数据,运用kohonen网络进行客户画像。通过对同类的商品市场进行比较、分析与预测,便于商家了解自家产品销售与市场反馈情况,比较竞争对手的产品,从而对产品进行优化。

关键词:数据挖掘;客户画像;kohonen网络

中图分类号:F27 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.24.022

1 引言

近年来,随着互联网的普及和移动智能终端的发展,电子商务以惊人的速度崛起,由此带来的快递需求也使得我国快递行业快速成长,快递行业积累及掌握的客户信息更是过去无法比拟的,而这些数据所携带的信息价值更是难以估量的。在我国快递行业竞争日趋白热化的过程中,以四通一达为代表的民营快递企业业务量蒸蒸日上,但服务产品同质化现象甚为突出,缺乏个性与核心竞争力,导致客户黏性不高,企业发展后劲不足。本文尝试探索快递公司业务的另一种可能性,将快递公司手握的海量数据加以挖掘分析,增进对下游最终客户的了解,以期提高快递公司在链条中的地位并增加其业务板块的多样性,助力快递行业产生新的价值增长方向。

姚风起(2015)提出快递企业应及时转变思路,提供差异化服务,并加快企业的转型升级,由人员密集型产业向技术密集型转变,从价格竞争升级为服务竞争。Kent Gourdin (2001)构建了关于网购的消费者快递服务体验模型中得出快递服务水平会通过影响终端客户进而直接影响电商服务水平的结论。Jana Sporran (2013)分析了电商背景下的快递业的基础上,比较国有快递企业和民营快递企业的优、劣势及新环境下的竞争力,并对其发展方向提出思考。Ying Xu;Xuemei Zhang等(2016)提出供应链环境下的电子商务和快递业两者的盈利与协作模式。Michael Beasley(2013)从度量和维度两个角度先对数据进行过滤,再专注于用户群表现出的特征行为,或比较不同用户群间不同的设置,从而细分客户。Deepa Ittimani Tholath与Fr.Casimirraj S.J.(2016)利用人口统计学相关理论,将客户细分为不同类,并为之描述出不同分类客户的典型模式,在客户消费的过程中,客户在消费旅程地图每一步的决策行为都会影响最后的决策点。侯洪涛、黄有方(2012)利用Apriori算法,通过对消费者性别、年龄、收入、居住地、婚姻状况等有关属性的关联度分析,寻找属性间的关联,以期能对其他未知的客户属性进行预测。刘海、卢慧等(2015)先运用4C理论构建用户画像的数据库,再对其挖掘进行客户细分,最后以三枪集团的身高因素为例进行实证分析。李冰,王悦,刘永祥(2016)基于K均值算法对卷烟客户画像,使末端零售商针对客户进行个性化服务与推荐。崔琳(2016)基于SQL Server DQS的数据质量控制,以香港某饼家的营销数据为对象,构建客户画像的数据库与指标体系,并为其设计了更新维护方案,再利用Apriori算法实现购物篮分析,利用 k-means 算法实现客户分层分类,最终基于挖掘结果进行智能推荐与针对营销。赵飞鸿(2016)引入美国学者Pang-NingTan提出的二分聚类算法,基本思路是将所有点集合先分裂成两个簇,再从两个簇中根据条件选取一个继续分裂,如此反复,最后生成K个簇。

2 客户行为分析与画像

此次对客户画像的数据来自于某公司2016年每天的订单信息,共有三十几万条记录,原始数据表的可用字段如下:复核时间、发货人、站点、配送区域、行政区域、产品名称、总件数、配送日期、配送日、客户订单号、收货人、温带要求、发货人类型、备注、妥投日期、妥投日、经度、纬度、服务要点、重要客户否、标准地址。由于原始数据存在缺失值、错误值、错别字、描述不统一等情况,故在数据分析前需进行数据筛选和规范。由于快递公司并不直接掌握产品目录,故需要有大量的关于产品的数据预处理,使之形成一个标准的产品目录。

客户画像就是通过贴标签,得到客户的立体印象,一个客户身上有多重標签,这些标签可以有包含关系,并列关系等。根据产品目录,了解到该快递公司服务的所有商家的经营范围,并建立一个商品标签库,当然还可以建立人物的身份标签,如家庭主妇,上班族,学生等,但S快递公司目前的主要商户主营生鲜食品,其主要客户一般都是家庭主妇,故此处就不详细建立身份标签库。此标签表还能继续下分,每样商品的标签可以交错,比如水晶灯既属于灯具也属于家居饰品,正如每个人都有多重属性多样身份,再利用Apriori算法结合历史消费记录中与该商品关联度高的商品标签,给各商品分配各标签比重,便于最后根据各类消费群的消费热点与消费偏好描述各类消费群特点。从客户消费数据中筛选出年消费次数较高前100名客户的数据,再将每个客户的所有订单都整合成单独一条记录,将各产品的消费数量进行各自汇总,最后新数据源表:154个字段,100条记录,性别0代表男性,1代表女性,行政区1-16分别表示东城、西城、海淀、朝阳、丰台、门头沟、石景山、房山、通州、顺义、昌平、大兴、怀柔、平谷、延庆、密云16个市辖区,其余的是商品字段,这些商品消费信息可以是各种渠道的,不局限于某一家店铺或者某一线上平台,这也是快递公司的优势:聚集各方资源。若还能和商家合作,数据维度越广,越能形象地刻画描述客户,其结果的可靠性也会更强。根据此次客户消费数据的结果特性,可总结出本次判断各类消费倾向方法。

最后根据横纵向比较各类消费品的价格、消费品类型、消费次数等,结合商品标签,将各类消费群进行描述,一共有9个消费群。可以发现女性消费者是该快递公司承接商户的消费主力,这与商户的主营范围有关,该快递公司的几个主要商户都是主营生鲜食品,故本次数据中大多是有关生鲜消费的数据。由于客户的消费兴趣、习惯等也会发生改变,故客户画像的标签也要定期进行维护更新,依据消费时间的由远到近,将消费记录的权重由小到大进行分配,再进行消费结果的更替。Kohonen网络作为一种神经网络算法适用范围较广,结果相较更合理。

3 结论

本文以某快递公司的数据进行客户画像,通过聚类算法提取客户特征,将客户标签化,便于商家针对营销与挖掘潜在相关客户。本文的方法具有良好的迁移效果,由于快递公司手握许多商家的客户数据信息,故可通过上述方法,快递公司还能通过大数据对上游商家的产品进行画像,该产品的消费人群特点,竞品的特点及竞品消费人群特点,替代品或互补品的消费情况等,通过对同类的商品市场进行比较、分析与预测,便于商家了解自家产品销售与市场反馈情况,比较竞争对手的产品,从而对产品进行优化。

参考文献

[1]姚风起,当前快递业价格战问题探究[J].知识经济,2015,(24):69-69.

[2]Kent N Gourdin.Global logistics management:a competitive advantage for the new millennium[M].Blackwell PublishersLtd,2001,218-230.

[3]Jana Sporran.Electronic Commerce Internet Strategies and Business Models–A Survey [J].Information Systems Frontiers,2013,(14):96-110.

[4]Ying Xu;Xuemei Zhang;Jian Cao;Ya Chen;Xuhong Ye;Paolo Renna,Collaboration and Evolution of E-Commerce and Express Delivery Industry Supply Chain[J].Hindawi Publishing Corporation,2016.

[5]Michael Beasley,Segmentation[M].ElsevierInc,2013:135-155.

[6]DeepaIttimani Tholath、Fr.Casimirraj S.J.,Customer Journey Maps for Demographic Online Customer Profiles[J].International Journal of Virtual Communities and Social Networking (IJVCSN),2016:1-18.

[7]侯洪濤,黄有方.基于Apriori算法的银行客户行为分析[J].硅谷,2012,(03):20-21.

[8]刘海、卢慧、阮金花、田丙强、胡守忠,基于“用户画像”挖掘的精准营销细分模型研究[J].Journal of Silk,2015,(12).

[9]李冰,王悦,刘永祥.大数据环境下基于K—means的用户画像与智能推荐的应用[J].现代计算机,2016,(08):11-14.

[10]崔琳,基于客户画像的数据挖掘技术在CRM中的应用[D].上海:东华大学,2016.

[11]赵飞鸿,基于金融类客户画像的二分K值算法分析研究与应用[D].北京:中国科学院大学,2016.

猜你喜欢
数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议