基于客户价值分析的铁路客户分类方法探讨

2014-01-03 01:04郑平标朱克非代明睿
铁道运输与经济 2014年3期
关键词:现值决策树铁路

郑平标,朱克非,代明睿

(中国铁道科学研究院 运输及经济研究所,北京 100081)

1 概述

客户细分是客户关系管理的核心概念之一,是指企业在明确的战略、业务模式和特定的市场中,根据客户的属性、行为、需求、偏好及价值等因素对客户进行分类,并提供针对性的产品、服务和营销模式的过程[1]。由于客户分类问题涉及因素众多,许多因素带有模糊性,并且分类的标准随分类目的不同而有所不同,因而没有一种通用的方法适合各种客户分类问题。为此,在相关研究成果基础之上,提出一种基于客户当前价值、潜在价值及忠诚度的铁路客户细分方法,利用决策树分类算法评价客户价值,根据评价结果对客户进行分类,针对不同类型的客户实行不同的营销策略,为实现企业资源的合理配置及客户营销提供理论方法。

目前,针对客户分类方法和铁路客户关系管理系统已经进行了广泛的研究。郭玉华等[2]结合经典客户生命周期理论,采用数据挖掘技术,对铁路大客户进行细分,并构造潜在型、竞争型大客户发展及大客户保持等系列模型。方晓平等[3]重点研究设计了基于货票数据库的铁路客户关系管理系统,并在有关部门得到应用。钟雁等[4]采用聚类和贝叶斯分类算法研究了不同类别的货主对铁路贡献的大小,进而研究提出采取不同的优惠措施。石英等[5]设计了铁路货运分析系统,对客户进行 ABC 分类。黄贵群等[6]通过阐述 3 种客户细分的标准,提出在客户分类过程中客户价值是重要的参考指标。张国政等[7]研究了基于客户生命周期价值及客户满意度的客户细分方法。杨兰等[8]根据客户当前价值与潜在价值对客户进行分类。罗亮生等[9]将客户价值分析理论应用在航空公司客户管理领域。翁建英等[10]构建了客户价值评价体系,并在商业银行信息化中应用。但是,总体来看,专门针对铁路客户分类方法的研究较少,而客户价值评价指标体系又是客户分析的重要基础。为此,从客户价值评价指标体系出发对铁路客户分类方法进行探讨。

2 铁路客户价值评价指标体系

目前应用较多的客户价值评价模型是利用当前价值与潜在价值来计算客户生命周期价值[2]。对于当前价值的衡量,多采用客户过去利润贡献的净现值作为评价指标;对于潜在价值衡量指标的选取却各有不同,较多使用的是 2 个方面的衡量变量,一方面为未来预期利润的现值,另一方面是由客户忠诚带来的波及效应,如口碑宣传、重复购买次数、支出比例等。考虑到运输市场变化迅速、竞争激烈,以及客户运输方式选择余地大等特点,利用当前价值、潜在价值和客户忠诚度三维变量建立铁路客户价值评价指标体系。铁路客户价值评价指标体系如图 1 所示。

2.1 客户当前价值指标

图1 铁路客户价值评价指标体系

客户当前价值是指在铁路已经产生运输业务的实际效益。当前价值可以选取单位运输量收入率、运输量等指标进行分析,其中单位运输量收入率是指评价阶段客户单位运输量的平均收入,运输量指评价阶段客户累计发送量。

2.2 客户潜在价值指标

客户未来的发展潜力是评价客户价值的一个重要因素,准确地评估客户的潜在价值对制定有效的客户发展和保持战略至关重要。潜在价值是指客户在未来与企业进行交易的过程中可能带给企业的收入,主要包括 2 个方面:一是建立在原有交易数据库的基础上对客户未来收入的预期,即预期保守价值;二是对未来客户可能带给企业更大收入贡献的预期,即预期增加价值。由于充分考虑到运输企业向物流多元化发展的特点,通过对客户进行交叉销售和增值销售是增加客户价值的有效途径。因此,选择交叉销售及增值销售的可能性及由此带来的收入的增加,作为对未来服务期客户可能带给企业更大的收入贡献的预期。其中交叉销售是指在开展运输服务时,提供仓储、包装、流通加工、配送等物流服务,增值销售是提供装卸、接取送达等增值服务。

2.3 客户忠诚度指标

运输行业的高竞争性使得客户选择余地较大,客户忠诚度具有十分重要的意义。因此,将客户忠诚度单独列出,作为衡量客户价值的三大指标之一,并通过行为忠诚和情感忠诚进行综合评价,以最近交易时间、交易频率、承运份额、淡季支持度、投诉建议次数衡量行为忠诚,以口碑宣传衡量情感忠诚。其中,最近交易时间是指客户与铁路最近交易的时间;交易频率是指客户与铁路交易的频度;承运份额是指客户通过铁路运量占总运量的比重,反映客户对铁路的依赖程度;淡季支持度是指客户在铁路运输淡季的运量情况,反映客户对铁路的支持力度;投诉建议次数是指客户向铁路部门投诉、建议的总次数,反映客户对铁路企业的监督与期望。

3 客户价值评价方法

3.1 评价流程

根据铁路客户价值评价体系,收集客户价值分析的相关数据,对数据进行处理,运用数据挖掘算法对客户进行分类,需要建立客户关系管理系统,实现客户价值分析和客户信息挖掘[3]。

(1)客户数据准备。铁路大多数业务系统均实现了电子化,客户原始数据较为完整、准确,基本上可以满足客户数据仓库对源数据的要求。但是,由于各业务系统数据规则、业务参数不同,各类客户数据源之间存在重复和差异,无法形成有效链接。因此,需要对不同数据源的客户数据进行清洗、整合、规范,形成客户管理数据库,为建立客户价值模型和信息挖掘奠定基础。

(2)指标数据处理。在实现客户价值评价的数据挖掘算法中,要求将客户当前价值、潜在价值、忠诚度等指标经过一定的计算处理,转变为适于算法处理的数据形式。

(3)建立数据挖掘模型。根据铁路客户价值评价体系建立并测试数据挖掘模型,利用数据挖掘模型对客户的当前价值、潜在价值和忠诚度 3 个维度进行分类。

3.2 基于决策树的 ID3 算法

针对客户分类的数据挖掘算法,目前运用较多的包括基于关联规则的 Apriori 算法,基于智能计算的分类算法 ( 如进化计算、神经网络等 ),以及贝叶斯分类、决策树分类算法等[4]。在大数据量的情况下,Apriori 算法需要多趟扫描数据库,运行过程中生成大规模的候选集和频繁集,计算量相当大;而智能计算的分类方法具有较高的计算复杂性,计算搜索时间过长,挖掘结果往往也不可靠。基于决策树的 ID3 算法可以快速对数据集进行划分而得出分类规则,数据量大的时候也具有很好的实时性。根据数据特点和数据挖掘目的,从实用的角度出发,采用 ID3 算法对铁路客户价值进行评价。

3.2.1 基本概念

ID3 算法采用信息论中的概念,用信息增益作为属性分类能力的度量,进行属性节点的选择,熵表示样本集的纯度。设S是n个数据样本的集合,将样本划分为c个不同的类,每个类含样本数ni,S划分为c个类的信息熵按公式⑴计算。

假设以属性X作为决策树的根节点,属性X具有m个不同取值,将S划分为m个子集{S1,S2,…,Sm},根据属性X划分成的子集熵按公式⑵计算。

式中:|S|和|Si|分别为S和Si中的样本数量;E(Si)由公式⑴递归计算。其他属性计算过程同理。

熵值越小,子集划分的纯度越高,根据属性X划分的信息增益按公式⑶计算。

其他属性信息增益计算过程同理。

3.2.2 算法步骤

ID3 算法的核心是构造精度高、规模小的决策树,分为 2 个步骤:决策树的生成,即由训练样本集生成一棵决策树;决策树的剪枝,即对上一过程生成的决策树进行检验和校正,剪除影响预测准确性的分支。具体过程描述如下。

(1)对于训练样本集S,根据决策属性取值,按公式⑴计算E(S)。

(2)对各条件属性X,根据其属性取值,按公式⑵计算E(S,X)。

(3)对各条件属性X,按公式⑶计算按各条件属性取值划分的信息增益Gain(S,X),选择信息增益最大的属性Xmax作为节点。

(4)按属性Xmax取值将样本集划分为子集{S1,S2,… ,Sm},对每个子集Si按公式⑴计算E(Si),如果E(Si) = 0,则此属性取值分支为叶节点,否则递归调用建树算法,继续生成决策树分支。

(5)当所有子集划分完时生成了一棵决策树,按一定规则剪枝后,沿着树路径读取分类规则。

3.3 实证分析

以客户忠诚度计算为例,对某铁路局某车务段 2013 年 1—6 月的客户忠诚度相关数据进行搜集分析,包括最近发货时间、发货频率、承运份额、淡季发货量、投诉建议次数等。在此期间,该车务段活跃客户数量为 302 个,共发送货物 1 239 万 t。通过决策树分类算法进行计算,该车务段的忠诚度较高的客户为 115 个,占客户总量的 38.1%,共发送货物 1 104 万 t,占总发送量的 89.1%;忠诚度较低的客户为 187 个,占客户总量的 61.9%,共发送货物 135 万 t,占总发送量的 10.9%。由此可以看出,忠诚度较高的客户货物发送量占总发送量比重较大,主要发送煤炭、铁矿石等大宗货物;忠诚度较低的客户数量占客户总量比重较大,表明需要加强市场营销与客户关怀。

4 客户分类与市场策略

根据当前价值、潜在价值和忠诚度 3 个维度,可以将客户分为 8 种类型:高现值-高潜值-高忠诚度 ( Ⅰ类 ),低现值-高潜值-高忠诚度(Ⅱ类 ),低现值-高潜值-低忠诚度 ( Ⅲ 类 ),高现值-高潜值-低忠诚度 ( Ⅳ 类 ),高现值-低潜值-高忠诚度 ( Ⅴ类 ),低现值-低潜值-高忠诚度 ( Ⅵ 类),低现值-低潜值-低忠诚度 ( Ⅶ 类 ),高现值-低潜值-低忠诚度( Ⅷ 类 )。基于客户生命周期价值的客户分类模型如图 2 所示。通过决策树分类算法实现对潜在价值、忠诚度的评价,同时结合历史数据得出当前价值,对客户进行细分,针对不同的细分客户群体,制定相应的市场策略[5]。

图2 基于客户生命周期价值的客户分类模型

(1)高现值-高潜值-高忠诚度 (Ⅰ类 ) 客户。这类客户具有很高的客户价值,是企业最重要的客户,应将主要运输资源投入到保持与该类客户的关系上,充分了解客户需求,为客户提供“一对一”的优质服务[6]。

(2)低现值-高潜值-高忠诚度 (Ⅱ类 ) 客户。这类客户虽然当前价值较低,但具有较高的潜在价值和忠诚度,是企业的重要发展和培育对象。应对其实行有效的营销策略,给予较多的关注,可以对其实行交叉销售,如提供新的产品和增值服务等。

(3)低现值-高潜值-低忠诚度 (Ⅲ类 ) 客户。这类客户当前价值及忠诚度都较低,但潜在价值较高,具有很大的开发价值。企业应分析未能充分挖掘其潜在价值的原因,以及客户流失原因。如果是企业自身的原因,则应尽快改善运输产品质量与服务水平,提升该类客户对企业的满意度和忠诚度,进而充分挖掘其利润贡献的潜力。

(4)高现值-高潜值-低忠诚度 ( Ⅳ 类 ) 客户。这类客户当前价值和潜在价值均高,但忠诚度较差,企业应认真查找分析忠诚度低的原因,并采取相应的客户保留策略,努力提高客户的忠诚度,使其转化为企业的高价值客户。

(5)高现值-低潜值-高忠诚度 (Ⅴ类 ) 客户。这类客户具有较高的当前价值和忠诚度,但潜在价值不高。这类客户与企业的当前交易量较大,对企业提供的服务也较为满意,忠诚度较高,但由于客户本身实力所限,企业从该类客户身上获取更大利润的可能性不大。因此,企业应尽量维持与该类客户的良好关系,防止该类客户流失,但是无需对其投入过多资源。

(6)低现值-低潜值-高忠诚度 ( Ⅵ 类 ) 客户。这类客户具有较低的当前价值及潜在价值,但对企业为其提供的服务还较为满意。对该类客户不必再进行资源的投入,应树立企业良好的口碑。

(7)低现值-低潜值-低忠诚度 ( Ⅶ 类 ) 客户。这类客户现在和未来能为企业带来的收入很少,但却占用了企业大量的开发和维护费用,属于企业的“淘汰客户”,可以不分配运输资源。

(8)高现值-低潜值-低忠诚度 ( Ⅷ 类 ) 客户。这类客户具有较高的当前价值,但潜在价值和忠诚度都较低,属于不稳定客户,随时可能转向其他运输方式。应对其实行相应的短期策略,力争在当期获取最大利润。

5 结束语

通过构建铁路客户价值评价指标体系,提出客户价值评价方法,根据客户当前价值、潜在价值和忠诚度 3 个维度,对铁路客户进行分类,针对不同类型的客户,提出有效的营销模式与市场策略,以加强客户关系管理的针对性,实现市场营销的个性化,提升客户关系管理与市场营销的水平与质量。

[1] 杨金花,李明博,季 令. 客户关系管理理论在铁路货运营销中的应用[J]. 铁道运输与经济,2008,30(2):87-90.

[2] 郭玉华,陈治亚. 基于客户生命周期的铁路大客户细分与发展模型[J]. 铁道科学与工程学报,2011(4):86-91.

[3] 方晓平,陈治亚. 铁路货运客户关系管理系统的研究与应用[J]. 铁道运输与经济,2003,25(9):49-50.

[4] 钟 雁,郭雨松. 数据挖掘技术在铁路货运客户细分中的应用[J]. 北京交通大学学报,2008(6):25-29.

[5] 石 英,陈治亚,雷定猷. 铁路货运分析系统的设计与应用[J]. 铁道运输与经济,2007,29(1):41-42.

[6] 黄贵群,胡异杰. 基于客户关系管理的铁路货运市场营销研究[J]. 铁道经济研究,2003(5):7-8.

[7] 张国政,王 芳. 基于CLV及客户满意度的客户细分[J]. 科技与管理,2009(4):62-64.

[8] 杨 兰,卢润德. 基于客户价值的客户分类方法研究[J]. 现代管理科学,2007(11):95-96.

[9] 罗亮生,张文欣. 基于客户价值的航空公司客户关系管理策略[J]. 企业经济,2008(12):20-22.

[10] 翁建英,程 勇. 客户价值评价体系在商业银行信息化中的应用分析[J]. 情报探索,2007(9):60-61.

猜你喜欢
现值决策树铁路
沿着中老铁路一路向南
一路欢声一路歌 中老铁路看点多
经济评价方法中净现值法的优缺点及实际应用
净现值的现实意义与理论不足
决策树和随机森林方法在管理决策中的应用
铁路通信线路维护体制改革探索与实践
基于决策树的出租车乘客出行目的识别
基于模糊关联规则和决策树的图像自动标注
资金时间价值基础运算解读
净现值法对比煤层气与常规天然气经济效益