基于关联规则的购物篮分析—以向日葵农场的购物篮为例

2018-04-27 12:27张维纬
无线互联科技 2018年8期
关键词:四季豆项集向日葵

黄 焯,张维纬

(1.华侨大学 工学院,福建 泉州 362021;2.工业智能化技术与系统福建省高校工程研究中心,福建 泉州 362021)

1 关联规则的发展及现状

关联规则最早是由Agrawal等[1]于1993年首次针对购物篮分析提出的,以发现交易数据库中不同商品之间的联系规则为目的,用规则来刻画顾客的购买模式行为,用来指导商家科学的货架设计和进行商品组合。

挖掘关联规则针对的问题,最早出现于超市的数据,交易可以由顾客购买的项目组成,我们将数据看成是二制的(交易中出现为1,否则为0),当然是不考虑交易中项目的数量。针对交易数据库中的频繁项集,所有大于或等于客户指定的Smin都需要找出。可以利用频繁项集来生成挖掘所需要的关联规则,并且根据用户设定的Cmin来筛选出强关联规则。

本文主要说明寻找Smin,找出频繁集是比较困难的,而有了频繁集再生成强关联规则就相对容易了,Apriori算法是找出频繁集比较经典的算法。

在笔者看来,算法的效率才是关键,现阶段关联规则挖掘面临的主要挑战是如何有效发现大项目集,针对此问题,Agrawal提出了Apriori[1-4]算法,Apriori算法是一种可以挖掘关联规则的频繁项集算法,核心思想是重复扫描数据库,这样就可以通过候选集生成和剪枝的向下封闭检测两个阶段来挖掘频繁项集。

2 向日葵农场购物篮分析的现状

向日葵农场的原身是宜园农场,是由几个80后的大学老师一起创立的,发展到2014年与另外一家农场合并,改名为向日葵农场,笔者于2014年7月份进入农场,购物篮分析则是笔者进入该农场实习的主要任务。

向日葵农场原有的流程为客服与生产者沟通产生菜单,然后客服发布到群里,由客户进行个人的点菜,客服进行记录,完毕之后进行蔬菜的分装,然后再是运输到客户的家里,最后客服进行售后反馈。

向日葵购物篮分析太过被动和粗放,没有具体根据于哪方面的原理来进行分析,只是简单的客服售后发现有哪些产品多了或者少了,然后与生产者沟通后相应地减少或增加,但是每次都是发现多的产品没有客户需求,少的产品需求量过大,造成客户的满意度下降甚至流失,对销售数据当中的产品进行多支持度挖掘[5],可以提高主动效益,进行更好的沟通生产。

3 基于关联规则的购物篮分析

不知不觉,在这一年里面在农场里面有过消费记录的社员已经累计了快1 000人,但是活跃的人数却一直只有30人左右,有时候会偶尔上升到50人,但是马上就会下降,很多老顾客都沉寂了,新客户虽然一直也有增加,但是由于忠诚度不高,变为老客户的转化率也不是很高,因为这些问题,农场一直都是处于亏损的状态,根据这些方面的原因,我们提出了基于关联规则的购物篮分析这一个概念,目的是通过对客户菜篮子的数据进行挖掘,找出其中存在关系的菜品的搭配,进行全新的套餐配送,提升客户满意度和忠诚度[6]。

因为一直以来都是与客户打交道,比较了解客户的需求,后期菜篮子数据的录入也是由自己完成的。根据笔者的分析,认为客户点菜必然是有着一系列的原因,家庭和喜好这部分原因没有办法探究,菜品之间本身存在的某种联系才是要探求出来的,紫背天葵&四季豆&秋葵&空心菜这4种菜总是会一起购买的,而且在购买了其中3种的情况下购买另外一种的概率几乎是100%。于是笔者提出本文的论点,菜与菜之间必然存在着某种必然的联系,并且提出一个猜想,紫背天葵&四季豆&秋葵&空心菜存在着某种联系,并且在买下其中3种的情况下,购买第4种菜的概率很大,并对此展开论证。

4 结果展示和论证

如图1所示,我们可以发现,菜与菜之间是存在的联系的,这几条规则也是验证了这种联系的必然存在,紫背天葵、空心菜、四季豆、秋葵这4种菜及玉米、红苋菜、黄瓜这3种菜,其中四季豆和空心菜验证了本文前面所提到的关于这两样菜会一起购买的猜想,也论证了论点,所以证明了基于关联规则的购物篮分析是可以得出结果的,并且具有一定的可行性,可以运用到实际的生产当中,可以将这2种得出来的组合运用到实际的产品推广当中,相信可以提高客户的满意度。

图1 结果论证

5 结语

因为数据量的关系,存在着误差与偶然性,所以结果在没有经过实践之前是具有不确定性的,在以后的生活当中,将会收集更多的数据,利用数据挖掘来进行分析,作为判断的参考。

[参考文献]

[1]AGRAWAL R,IMIELINSKE T,SWAMI A.Mining association rules between sets of items in large databases[C].Washington:Proceedings of ACM SIGMOD on Management of Date,1993:207-216.

[2]范明,孟小峰.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.

[3]蔡伟杰,张晓辉,朱建秋,等.关联规则综述[J].计算机工程,2001(5):31-33.

[4]AGRAWAL R.Srikant fast algorithms for mining association rules in large databases[J].On Very Large Databases,1994(2):487-499.

[5]PARK J S.CHEN M,YU P S.Using a Hash-based memory with transaction trimming for mining association rule[J].IEEE Transactions on Knowledge and Data Engineering,1997(5):813-825.

[6]LIZHENGNANHUA.Apriori算法详解之一:相关概念和核心步骤 [EB/OL].(2013-06-09)[2018-03-20].http://blog.csdn.net/lizhengnanhua/article/details/9061755,2013-06-09.

猜你喜欢
四季豆项集向日葵
向日葵
四季豆
春季甜玉米和反季节四季豆轮作栽培技术
矮生四季豆台湾2号抢茬种植高产栽培技术
一种频繁核心项集的快速挖掘算法
一种新的改进Apriori算法*
分布式数据库的精简频繁模式集及其挖掘算法*