关联规则挖掘在软件企业客户关系管理中的研究与应用

2012-04-29 00:44:03杨盛苑张向娟
电脑知识与技术 2012年30期
关键词:Apriori算法关联规则客户关系管理

杨盛苑 张向娟

摘要:关联规则挖掘是在数据挖掘研究中最为活跃的一种挖掘方法之一。该文利用关联规则的Apriori算法对软件企业的客户与商品之间的关系进行挖掘,发现商品间的潜在关系,指导决策者对不同的客户实施不同的营销策略,从而达到高质量的客户关系管理。

关键词:关联规则;Apriori算法;客户关系管理

中图分类号:TP311 文献标识码:A文章编号:1009-3044(2012)30-7169-03

自上世纪80年代以来,伴随着我国市场经济的逐渐成熟,客户对产品的需求平稳增长,市场竞争愈加激烈,这使得企业认识到识别、挑选、获得、发展和维护客户的重要性,进而在经营理念层面上越来越关注客户价值、客户满意和客户忠诚,力图通过在正确的时间使用正确的方式为正确的客户提供正确的服务,来创造和传递客户价值,提升客户满意水平,从而实现客户忠诚进而维持正确客户,获得这些客户的生涯价值(LTV)。本文设计了一个关联规则数据挖掘模型,结合实例使用Apriori挖掘技术分析并检验了该方法的有效性。

1 关联规则挖掘

数据挖掘(Data mining)是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的过程。简单地说,数据挖掘就是从大量数据中提取或“挖掘”知识,又被称为数据库中的知识发现(knowledge discovery in database,KDD)。[1]

关联规则挖掘是数据挖掘中最为常见的一种挖掘方法之一,最初由R.Agrawal等人提出,主要目的在于通过超市购物篮发现超市交易中不同商品之间存在的潜在关系。

关联规则可以用一个蕴含式R:X[?]Y来表示,其中:X[?]I,Y[?]I,I为关联规则挖掘涉及到的项目的集合,称为项集,并且X[?]Y=[φ]。它表示如果项集X在某一项目中出现,则会导致项集Y按照某一概率也会出现在同一项目中。X为规则的条件,Y为规则的结果。

一个经典的关联规则的例子是“啤酒与尿布”的故事,全球最大的连锁零售商沃尔玛超市研究发现:美国的妇女们经常让丈夫下班后给孩子买尿布,而30%~40%的丈夫会在买尿布的同时给自己购买啤酒。因此把尿布和啤酒的货架摆在一起销售,会大大增加超市的销售额。

用来衡量什么的关联规则才是用户感兴趣的关联规则主要有两个标准:关联规则的支持度和可信度。

对于关联规则R:X[?]Y,其中:X[?]I,Y[?]I,X[?]Y=[φ],规则R的支持度表示同时包含X和Y的项目数与所有项目数的比。记为Sup(X[?]Y),Sup(X[?]Y)=[count(X?Y)D]。支持度反映了X和Y中所包含的项目在项目集中同时出现的频率,支持度越大,关联规则越重要。

对于关联规则R:X[?]Y,其中:X[?]I,Y[?]I,X[?]Y=[φ],规则R的可信度表示包含X和Y的项目数与包含X的项目数的比。记为Conf(X[?]Y),Conf(X[?]Y)=[Sup(X?Y)Sup(X)]。可信度反映了如果项目中包含X,则项目中同时出现Y的概率,是对关联规则的准确程度的衡量标准。

满足最小支持度的关联规则称为频繁关联规则;同时满足最小支持度和最小可信度的关联规则称为强关联规则,在关联规则挖掘的过程中,需要先挖掘出所有的频繁规则,再从中挖掘出强关联规则,只有强关联规则才能指导用户的决策。

2 客户关系管理

客户关系管理(Customer Relationship Management, CRM)是一种旨在改善企业与客户之间关系的新型管理机制。通过实施客户关系管理可以使企业能够方便地搜集、追踪、分析每一个客户的信息,增强企业与客户之间的沟通,更好地满足客户的个性化需求,从而达到以更快速、更优质的服务保留现有客户并挖掘潜在客户的目的。

有效的客户关系管理还能够观察和分析客户行为以及其对企业的利润影响,使企业与客户的关系以及企业的利润都得到最优化,从而达到双赢的目的。所以客户关系管理的思想与潜在价值对企业具有极大的吸引力,绝大多数企业对于实施客户关系管理的规范化都存在着强烈的欲望。因此,加强对客户关系管理理论的研究并通过对客户关系的管理和分类挖掘对企业的决策提供有效依据已经成为当下需要解决的重要课题。

3 关联规则挖掘在软件企业客户关系管理中的应用

本文以客户关系管理的产品销售模块作为分析对象进行研究,利用关联规则挖掘的Apriori算法对样本进行分析、挖掘,进而找到不同产品销售之间的潜在关系。

Apriori算法的核心思想是:通过对样本数据进行多次扫描,产生长度不同的频繁集。通过设定最小支持度和最小可信度,最终挖掘出对决策有用的强关联规则。算法的简要描述如下:

在对客户的信息和资料进行管理的过程中,有的客户会同时购买某两种或多种产品,某类的客户可能会对某种产品类型特别感兴趣。如果挖掘出在产品和客户内部潜在的这种规律,便可以对客户实施有重点的营销策略,进而提高客户的服务水平。在进行数据挖掘之前,我们先将客户和客户购买的产品进行分类和标识,用不同的代码和序号代表不同的客户和产品,如表1所示。然后再利用Apriori算法对数据进行分析挖掘,找到数据之间存在的潜在联系。

在此关联规则挖掘中,设定最小支持度为0.,最小置信度为0.7,对事务数据库进行扫描,可以得到候选集C1,计算每项候选集的支持度,选取满足最小支持度的候选集,得到1项频繁集L1。继续扫描,以此类推,直到Lk为空,算法结束。在循环的过程中,必须要保证频繁集的子集一定是频繁的。

最终的实验得到的结果如表2所示:

针对上述挖掘结果可以分析得出以下结论:购买物流管理软件的客户通常会同时购买财务管理软件;购买电子商务平台和进销存软件的客户大多数都会选择购买企业即时通讯软件;而选择绩效考评系统的客户大多数都会选择智能化报表系列软件。根据分析结论,在进行商品营销的过程中,把相关产品在一起向客户推销,将会大大增加商品的销量,同时,客户的满意度也会得到相应的提升。

以上的挖掘结果和结论,在软件企业的客户关系管理中进行了实践,证明挖掘结果具有一定的可信度,可以有效支持决策。

4 结论

使用关联规则挖掘方法从软件企业大量客户服务相关数据中发现潜在的数据规律,并进行分析和预测,可以增强客户服务的客观性和合理性。同时,这些规律也为决策者做出正确的决策提供了理论依据,可以较好的改善软件企业的客户服务水平,提高客户满意度。

参考文献:

[1] 陈志泊.数据仓库与数据挖掘[M].北京:清华大学出版社,2009.

[2] 杨路明,巫宁.客户关系管理理论与实务[M].北京:电子工业出版社,2009.

[3] 王广宇.客户关系管理方法论[M].北京:清华大学出版社,2004.

[4] 张华雨.Intranet环境下基于数据仓库技术的新型DSS[J].计算机应用,2004,22(2):2728.

猜你喜欢
Apriori算法关联规则客户关系管理
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于云平台MapReduce的Apriori算法研究
关联规则,数据分析的一把利器
数据挖掘在高校课堂教学质量评价体系中的应用
中小企业客户关系管理实施策略探讨
时代金融(2016年27期)2016-11-25 17:03:10
数据挖掘技术在CRM中的应用
关联规则挖掘Apriori算法的一种改进
中国市场(2016年36期)2016-10-19 04:10:44
客户关系管理课程实践教学模式初探
中国市场(2016年35期)2016-10-19 02:58:48
基于关联规则的计算机入侵检测方法