肖艳群
摘要:数据仓库和数据挖掘技术是存储、分析和提取海量数据的重要工具。针对企业客户关系的特点,将数据仓库和数据挖掘技术运用到企业客户关系管理中,具体介绍了在预防和减少客户流失中的应用。
关键词:数据仓库;数据挖掘;客户关系管理;客户流失
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)26-6200-03
Application of Customer Relationship Management Based on Data Warehouse and Data Mining
XIAO Yan-qun
(Yangzhou polytechnic college,Yangzhou 225009,China)
Abstract: Data Warehouse and Data Mining are important tools in storage, analysis and extracting data. According to Customer Relationships characteristics, Data Warehouse and Data Mining are added to its management,which mainly focuses on introduc? ing the application in the prevention and reduction of customer loss.
Key words: data warehouse; data mining; customer relationship management; customer loss
随着市场经济的发展,产品种类日益丰富,企业之间的竞争越来越激烈,卖方市场已过渡到了买方市场,对现代企业而言,当下最主要提升的不仅仅是产品本身,更为重要的是客户的争夺。因此,企业要想立于不败之地,必须能够对市场上发生的变化做出迅速的反应,而导致市场变化的根源就是客户行为的变化。企业已经逐渐认识到保有客户的重要性,只有不断提升服务意识,有针对性地满足客户的需求,企业才能长期发展。因此,企业当下的重要课题就是要加强客户关系管理,提高核心竞争能力。
客户数据的收集与存储是实施客户关系管理的根基。随着办公自动化的推广,数据库和网络技术的应用,各企业拥有的客户信息越来越多,增长迅速。在这海量的、异构的信息资源中,蕴含着具有巨大潜在价值的信息资源,比如客户的基本资料、产品交易信息及客户反馈信息等[1]。企业要想不陷入信息的沼泽中,必须拥有强有力的数据分析工具,用以实现客户关系管理的目标。而数据仓库和数据挖掘技术的发展可以很好地解决这个问题。
1数据仓库与数据挖掘技术
1.1数据仓库
数据仓库是一个在企业管理和决策中面向主题的(Subject- Oriented)、集成的(Integrated)、反映历史变化的(TimeVariant)、相对稳定(Non-Volatile)的数据集合[2]。
数据仓库要求数据量大,数据正确全面,所以数据在进入数据仓库前必须经过提取、转换与集成,把数据按主题分类,形成多维数据模型。它以多维数据模型为基础,实现数据的分析处理,主要用于支持管理决策。数据进入数据仓库后,一般会被长期保存,基本不会进行修改和删除操作,主要实现数据的查询。
数据仓库与传统关系型数据库不同,主要区别在于数据仓库打破了关系数据库中数据的规范性,实现了数据的重组,增加了数据冗余度;其次传统关系型数据库为了实现数据处理的及时性,要求数据尽量少,而数据仓库为了更有效的实现数据查询,要求存储的数据尽量多,实现海量存储。
1.2数据挖掘技术
数据挖掘技术,是近几年国内外迅速发展起来的一门交叉学科,涉及到数据库、统计学、人工智能与机器学习等多个领域,并在金融、商业零售、电信以及生物医学和基因分析等领域得到广泛应用。
1.2.1数据挖掘的概念
数据挖掘(Data Ming),是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识一般可表示为概念(ConcePts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式[3]。
数据挖掘是知识发现的过程,是将未加工的数据转换为有用信息的整个过程。该过程包含一系列的步骤:确定业务对象、数据准备、数据挖掘、模式评估和知识表示[4]。
1.2.2数据挖掘的技术与方法
数据挖掘方法是以数据库为对象,基于机器学习、科学计算、统计分析等技术,形成了数据挖掘方法和技术。一般,数据挖掘常用的技术与方法可以分为以下几个方面:
1)决策树方法
决策树方法是利用信息论的原理建立决策树,主要用于分类和预测。决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。由于分类规则比较直观,易于理解,实用效果好,影响较大,因而得到广泛应用。决策树最早的算法是Quinlan提出的ID3算法,最流行的是其改进版的C4.5算法。
2)聚类方法
聚类分析是直接分析样本,按照各样本数据间的距离远近将样本数据分成若干个不同的类。一般,同一类中的对象相似度很高,不同类中的对象相似度很差。聚类分析属于无监督的分类方法。
3)统计分析方法
统计分析方法是通过统计学中的技术方法实现数据库的数据分析,发现数据间的关系和规律。常用的方法有:回归分析、相关分析、主成分分析等。
4)关联规则
关联规则通过对给定数据集中的数据进行关联分析,描述一个事物中某些属性频繁同时出现的条件,发现隐藏在其中的有趣的联系或规律。一旦建立起数据项间的关联规则,则其中某一项的属性值就可以依据其他属性值进行预测。
5)可视化技术
可视化数据分析技术在传统图表功能基础上进行了拓展,为用户提供交互式的数据浏览,帮助用户更清楚地剖析数据。当所要识别的不规则事物是一系列图形而不是数字表格时,人的识别速度是最快的。
2数据仓库与数据挖掘技术在客户关系管理中的应用
2.1客户关系管理
客户关系管理(CRM)关注的是企业与客户之间实时、方便的信息交互,通过与客户多渠道的接触、交流和沟通,实现从“接触管理”到“客户关怀”的角色转变,企业的经营中心也从产品或市场转变为客户。客户关系管理最核心的任务是对企业运营过程中所得到的各种数据进行分析,进而为企业经营决策提供支持和依据。
从功能上来看,CRM系统可分为三种类型[5]:
1)操作型CRM
操作型CRM也称为流程型CRM,主要用于客户信息的自动集成过程,实现企业各部门对客户信息的协同合作。
2)分析型CRM
分析型CRM用于分析操作型CRM中产生的各种数据,使用数据仓库和数据挖掘技术产生商务智能,为企业决策提供支持。3)合作型CRM
合作型CRM用于企业与客户的合作服务系统,包括电话、呼叫系统、电子邮件等,它能实现客户信息的全面收集。
2.2数据仓库的形成
数据仓库是CRM的中央存储系统。在这个信息爆炸的时代,各个企业经过长期经营,收集了大量的客户数据。而这些海量、异构的数据被分散在不同部门,没有得到充分合理的利用。因此,首先要做的是对这些海量分散的数据进行清洗、集成和转换,建立一个整合的、标准化、结构化的数据模型,形成全面、一致和面向决策的数据,即数据仓库。对已形成的数据仓库,按照不同的主题,产生多个对应的数据处理模块,如普通客户数据模块,Vip客户数据模块,团体客户数据模块等,这种多数据模块的建设有利于分析不同客户的行为特点。
2.3数据挖掘技术的应用
使用数据挖掘技术对企业客户信息进行分析,从而挖掘出对企业发展有价值的信息,如:新客户开发、交叉销售及预测、客户信用分析、客户细分、客户类别分析等客户关系管理功能,为企业决策者提供更有效的的决策支持,最大程度地发挥企业CRM的作用。
近年来,随着市场竞争的加剧,企业要想获得一个新客户,所花费的开销往往是争取留住老客户的几倍。有统计数据表明:1)公司一般每年平均流失10%的老客户;
2)企业留住5%的老客户,利润提升100%;
3)开发新客户的成本是留住老客户成本的5-8倍;
4)一个公司如果将其客户流失率降低5%,其利润就可能增加25-85%。
因此保持老客户就显得更有价值。那么,如何才能预防、减少客户的流失呢?一个非常重要的工作就是要找出顾客流失的原因。我们可以通过数据挖掘技术实现这一目标。
现以电信公司判断用户离网的可能性来做分析,首先进行数据准备,抽取一定量的用户信息,提取的信息主要包括:用户号码、用户类型、用户状态、话费性质(长话/市话)、欠费情况、投诉次数等,利用这些数据,我们来建立判断用户离网可能性的模型。
在数据准备和适当的预处理之后,我们采用决策树中的C4.5算法建立决策树模型。这里,我们引入了信息论中的信息增益率的概念并以此作为属性选择的标准,其核心是在决策树的各级节点上选择属性时用信息增益率作为属性选择标准。通过计算这些属性的信息增益率,找出“投诉次数”属性作为决策树的根节点。扩展决策树节点,进行分枝,其他中间节点也是选择各节点检测属性增益最大的属性,同级的预选属性的增益相同时,规定选择属性值个数较少的属性作为当前节点的分枝,最后,我们可以生成一棵决策树。
生成的决策树还需要进行进一步验证,才能最终得到可用的分类模型。选择一些具有共同特征的已离网用户作为测试数据,输入属性值进行离网判断,检验模型的正确性,生成最终的决策树模型。
使用生成的决策树模型,对比用户的信息是否贴近离网用户的特征属性值,能大致预测出该用户的离网可能性,对离网可能性高的用户,根据其特征属性进行挽留工作,从而预防、减少客户的流失。
3结束语
在当前的技术形式下,将数据仓库和数据挖掘技术有效运用在CRM中,对企业收集的大量客户数据信息进行分析,挖掘出对企业发展有价值的客户信息,从而更有效地提升企业的竞争能力,树立企业的品牌形象,帮助企业实现有效的市场营销和客户服务,达到成功挽留客户的目的。相信未来会有更多的行业加入使用客户关系管理的行列中,通过数据仓库和数据挖掘技术挖掘出对自身发展有用的信息,也必使CRM的目标得到更好的实现。
参考文献:
[1]白雪.数据挖掘技术在客户关系管理中的应用研究[J] .大众科技,2012 (2).
[2] Han Jianwei,Micheline Kamber.Data Mining Concepts and Techniques[M].Morgan Kanfmann Publishing,2000.
[3]陈安.数据挖掘技术及应用[M].北京:科学出版社,2006.
[4]董宁.数据挖掘技术在CRM中的应用[J].计算机工程与设计,2007(6).
[5] Alex Berson,Stephen Smith,Kurt Thearling.Building DataMining Applications for CRM [M].北京:人民邮电出版社,2001.