基于关联规则挖掘的商业银行信贷产品交叉营销研究

2017-03-20 16:43许荻迪
商业经济 2017年3期
关键词:商业银行

许荻迪

[摘 要] 交叉营销是商业银行开展营销活动、进行客户关系管理,降低成本、增加利润的关键。关联规则挖掘能够分析银行海量交易数据获得潜在规则,为商业银行交叉營销提供强有力的支持。采用关联规则分析中的Apriori和Carma算法,从信贷产品类别和具体产品两个层面,对商业银行信贷产品的年度交易记录进行数据挖掘。研究结果显示,关联规则挖掘应用于商业银行信贷产品交叉营销研究是可行的和有效的,对于已购买不同种类、不同具体产品的客户,需要综合考虑关联规则的具体形式、支持度、置信度等各方面,制定批量营销、精准营销、套餐营销等不同的交叉营销策略。

[关键词] 关联规则挖掘;商业银行;信贷产品;交叉营销

[中图分类号] F830.33 [文献标识码] A

[文章编号] 1009-6043(2017)03-0103-04

Abstract: Cross marketing is the key to holding marketing activities, customer relationship management, decrease of cost and increase of revenue for commercial banks. Association rule mining could help analyze the large amount of transaction data on banks for obtaining potential rules and offering strong support to the cross marketing of commercial banks. With Apriori and Carma, two analysis algorithms of association rules, the annual transaction record of the credit products of commercial banks are analyzed from the perspectives of credit product category and specific product. The result shows that it is feasible and effective to apply association rules mining into the study of cross marketing of credit products of commercial banks. As to customers who buy specific products of different category, the specific form, support degree, and degree of confidence should be considered comprehensively for creating different cross marketing such as bulk marketing, precision marketing and package marketing.

Key words: association rule mining, commercial banks, credit product, cross marketing

一、引言

交叉营销(Cross Selling)是一种发现顾客的多种需求,并通过满足其需求而销售多种相关服务或产品的一种新兴营销方式。由于银行业市场竞争的日益激烈,银行想要依靠获得新客户的方式来开展经营活动越来越困难。交叉销售作为一种向现有客户销售更多产品的一种营销方式,正好适应了市场竞争环境的变化。有关研究表明[1],开发一个新客户的费用是保留一个老客户费用的5倍,成功保留老客户可大幅节约企业成本、增加企业利润,交叉销售正是银行保留老客户的一种非常重要的方法。同时,交叉营销还有助于商业银行更有针对性地开展营销活动,扩大销售量,提高客户满意度。

作为数据挖掘(Data Mining)中最活跃的研究方法之一,关联规则挖掘(Association rule mining)能够“在大量的数据中挖掘知识”[2],从庞大的企业历史资料中,找出隐藏的规律并建立模型预测未来[3]。关联规则分析在个性化推荐、医疗数据分析、语义分析等领域都有广泛的作用[4]-[6],同时也适用于银行业研究:通过挖掘银行海量的交易数据,获得信贷产品被同一客户购买的潜在规则,为商业银行交叉营销提供强有力的支持。

为了充分发挥关联规则挖掘对商业银行信贷产品交叉营销的决策支持作用,本文针对商业银行的实际情况和交叉营销需求,采用Apriori和Carma算法,以某银行的实际业务数据为例,对其信贷产品的中小企业年度购买记录进行数据挖掘。经过对信贷产品分类和具体产品两个层面的挖掘分析,改善了商业银行进行信贷产品交叉营销过程中针对性不足的问题,给出了交叉营销思路和相关建议。

二、关联规则挖掘的适用性分析

关联规则分析的目的是找出数据库中隐藏的关系网,挖掘出隐藏在数据库中的关联规则,利用这些关联规则可以根据已知情况对未知问题进行推测判断[7]。关联规则分析的基本思想是,若数据集中两个或多个数据项同时出现在同一笔或同一个客户交易中的概率很高,则认为这些数据项之间存在某种关联,从而可建立起关联规则。[1]

商业银行常规的产品设计和营销,尤其是交叉营销,采取的是自上而下的思路。首先,商业银行锚定一组设想的需求设计产品;其次,在要通过交叉营销推广该产品时,根据之前确定的需求设想一组规则,在已有客户库中筛选出可能具有这些需求的客户;最后,试图用该产品的特点匹配筛选出的客户的需求进行营销。然而,在这个过程中,产品所针对的需求、客户的筛选规则、筛选出的客户所具有的需求特征都是商业银行根据经验、观察和调研设计的,并没有通过实际数据的验证,其中可能存在或大或小的偏差,产品的特点也许并不能满足原先设想的客户群体的实际需求,或者没有推销到真正需要的客户群体中。

关联规则挖掘对于商业银行信贷产品的交叉营销十分适用,能够通过现有所有客户的所有信息,找出这些客户的实际行为规律,因此是基于实际客户、实际信息和实际行为而设计顶层规则的自下而上的做法。关联规则挖掘能够充分利用商业银行长期以来积累的所有数据,为其制定符合实际的策略提供支持,与上述传统方式互相补充、互相提升。

三、模型和数据处理

(一)关联规则挖掘模型

在关联规则挖掘中,若分析得出30%的客户购买了A产品,这些客户中的80%还购买了B,该规则可表示为形如“A→B”的蕴含式,其中A通常被称为前项(antecedent或left-hand-side,LHS),B为后项(consequent或right-hand-side,RHS)。在考察关联规则的代表性和有效性时,需要同时考虑两条独立的标准,即支持度(support)、置信度(confidence)。支持度表示关联规则的前项在所有交易中出现的百分比,用来衡量关联规则的重要性;置信度表示在前项出现的情况下,后项也出现的百分比,表示这条规则成立的概率。在上例中,“A→B”的规则支持度为30%,置信度为80%。

最常见的关联规则挖掘算法是Apriori算法和Carma算法。Apriori算法把挖掘关联规则的过程分为两个阶段:一是获取频繁集。这些项集出现的频繁度至少和预定义的最小支持度一样。二是由频繁集产生关联规则。这些规则必须满足最小可信度。[8]CARMA是Berkeley大学的Christian Hidber教授1999年提出来的,该算法改进了传统关联规则挖掘算法,占用内存较少,能够处理在线连续交易流数据,并且能够在扫描交易流的过程中不断改变支持度,以控制输出的规则的大小和数目。[9]

(二)数据处理

本研究采用某商业银行的2014年基数数据。采用Access数据库管理系统,将时间窗口内的中小企业贷款业务月度报表合并在一个数据库里,并采用SQL语言对数据进行查询、计算和整理,得到13098条业务数据和9566条客户数据。根据客戶购买记录将其分为仅购买1次信贷产品、购买同一种信贷产品多次、购买多种信贷产品三类,筛选出购买多种信贷产品的客户,对其购买情况进行关联规则挖掘。

该数据集中共有36种信贷产品,根据其特征和性质分为4类:信用产品,即不需要抵押和担保的信用类贷款;特色产品,即专门针对三农、文化、绿色、科技、惠民等特色金融领域开发的符合行业特征的信贷产品;专项产品,即对企业资质、担保等有专门要求的产品;基础产品即没有特殊命名的普通贷款,在该数据集中被标识为“其他贷款”。

四、关联规则挖掘

同一客户对同一个信贷产品,甚至同一类别的信贷产品需求总是有限的。例如,短期内一个企业的抵押物是有限的,因此不可能无限制地购买抵押贷款产品。购买多个产品,甚至是多种类的产品,能够在金额、期限、利率、放款节奏等各方面互补地为企业提供资金支持。如果能够恰当地为企业推荐多个、多种类的信贷产品,就能在更好满足客户需求的情况下,增加商业银行的业务量和利润,这也是交叉营销的意义所在。

为了挖掘出哪些信贷产品倾向于被同一客户购买,首先对该银行客户购买的不同信贷产品类别进行挖掘,然后挖掘客户同时购买的具体产品,从而为交叉营销提供两个层面的依据。在这两个层面的关联规则挖掘中,都同时使用Apriori和Carma两种算法,并对两种算法的结果进行比较和分析。

(一)按信贷产品分类进行关联规则挖掘

采用Apriori算法对不同类别信贷产品被同时购买的情况进行关联规则挖掘,设定置信度在25%以上。支持度较高的挖掘结果如下表所示。以挖掘出的第一条关联规则为例,在所分析的客户群体中,18.67%的客户购买了特色产品,其中85.71%同时还购买了基础产品,这说明对已购买特色产品的客户交叉营销基础产品成功率较高。

除了“A→B”的形式,挖掘结果中还有“(AandB)→C”的形式。该形式体现在本数据集的挖掘结果中,如下表所示。下列关联规则的支持度都不高,在实际操作中,适用范围较小。

采用Carma算法的挖掘结果与Apriori算法基本一样,置信度不低于25%,支持度较高的关联规则同表1,但是Carma算法没有挖掘出表2的关联规则。

(二)按具体产品进行关联规则挖掘

1.采用Apriori算法进行挖掘

采用Apriori算法对具体产品进行关联规则挖掘。支持度在25%以上的产品共有4个,例如,购买了其他贷款的客户为80%,这些客户同时还购买信托贷款买断的概率为23.33%。所有支持度在25%以上,置信度在20%以上的关联规则,如下表所示。

以上关联规则的置信度都不高于70%,该算法还挖掘出一些置信度为100%的关联规则。购买了创意贷(广告和会展;文化体育休闲;出版发行和版权交易;广告影视节目制作)、节能贷(EMCo贷款)、法人设备按揭、就业贷、荐信贷、软件贷、智权贷、订单贷等11种信贷产品的客户,100%也购买了其他贷款。类似的,购买了创意贷(软件、网络、计算机)和留学人员创业贷款的客户,100%也购买了信用贷;购买了集成电路设计贷款的客户100%购买了信托贷款买断,同时也100%购买了瞪羚计划贷款。但是这些产品的支持度都比较低,在0.67%-3.33%之间。另外,还有4条形如“(AandB)→C”、置信度为100%的关联规则,它们同样支持度很小(0.67%)。如下表所示:

2.采用Carma算法进行挖掘

采用Carma算法对具体产品的购买情况进行关联规则挖掘,支持度不低于25%、置信度不低于20%的关联规则挖掘结果与表3一致。

Carma算法与Apriori算法的一个显著的区别是,Carma算法能够挖掘出形如“A→(BandC)”的规则,即Carma算法的结论可以包含两项产品。例如,购买了瞪羚计划贷款,同时有8.7%的可能性会购买信用贷(“融信宝”中小企业信用贷款)和其他贷款2个产品。这样的关联规则没有在Apriori算法的结果中出现,如下表所示。这些关联规则的支持度比较小,在6.52%到9.52%之间。对于已购买这些前项产品的客户,可以考虑直接推销后项中所显示的产品组合。

Carma算法所挖掘的置信度100%的规则少于Apriori算法,仅有7条。两种算法的结果的不同,正显示了同时使用两种算法的必要性,即有助于做出更全面的分析。

五、结果分析和交叉营销建议

采用Apriori和Carma算法对商业银行信贷产品购买情况进行关联规则挖掘,两种算法的结果基本吻合,也比较符合现实情况,证明采用关联规则对商业银行信贷产品交叉营销进行决策支持是可行的和有效的。不论是针对产品类别还是具体产品层面的关联规则挖掘,都给商业银行信贷产品的交叉营销提出了一些参考思路。

(一)基于产品类别的交叉营销建议

基于产品分类而不是单个产品的关联规则分析,有利于对商业银行客户的购买行为有整体的了解,由于产品分类比较简单明了,相应的关联规则也比较简单清晰,据此进行交叉营销容易操作。

根据关联规则挖掘的结果——4种产品类别相互之间被同一顾客购买的关系显示,对已购买不同种类的信贷产品的客户,其交叉营销策略应有所区别:

1.对于所有基础产品以外的产品,都可对已购买该产品的客户营销基础产品。

2.对于已购买基础产品的客户,可向其营销专项产品。

3.对于已购买专项产品和信用产品其中任意一种的客户,除了基础产品之外,还可向其推荐前两种信贷产品中未购买的另一种。

4.关联规则挖掘结果显示,特色产品很少和专项产品、信用产品一起被同一客户购买。同时,也没有任何一种产品被购买之后,能向该客户推荐特色产品。这是由于特色产品对企业所处领域、所从事业务范围的针对性较强,特色产品适合根据企业特征直接营销,而非根据企业购买的其他产品来交叉营销。

上述四类关系及其支持度、置信度如下图所示。其中,每类产品下方标识的比率为支持度,表示该产品在所有共同购买关系中出现的几率;每个箭头上标识的比率为置信度,表示依据该规则进行交叉营销成功的几率。

(二)基于具体产品的交叉营销建议

在对产品分类挖掘的基础上,再对具體产品数据进行挖掘,有助于找出覆盖面较大、或者营销成功率较高的具体产品,为交叉营销提出更有针对性的建议。挖掘结果显示,根据不同类型的关联规则可制定不同的交叉营销策略。

1.批量营销。支持度比较高的规则的前项产品由于本身被购买较多,依据这些关联规则进行交叉营销,覆盖面较大。根据挖掘结果,应采取短信、微信、邮件等成本较低的广撒网的批量方式进行营销,向相关客户优先营销关联规则中置信度排在前列的后项产品,对于重点客户可单独采取重点营销。例如,根据表1,对于购买了其他贷款的客户,优先营销信托贷款买断和瞪羚计划贷款,这两类信贷产品都属于专项产品,这也与关于产品分类的结论一致。

2.精准营销。支持度比较低的关联规则的前项产品被购买的几率较小,因此已购买这些产品的客户群体较小。尽管如此,关联规则显示,某些产品与这些产品被共同购买的置信度为100%,这意味着依照这些关联规则进行交叉营销成功率较高,也就是将交叉营销的对象和产品的范围缩小到了较为精准的程度。对于这些客户建议采取精准营销,采用电话、面谈等点对点的方式进行。例如,前面提到的15组置信度为100%的产品购买关系。

3.套餐营销。Carma算法能够挖掘出对客户营销一个产品组合(即多于1个产品)的关联规则,如表5。本研究得出的这类关联规则虽然支持度低,但是对于购买了这些产品的客户,营销规则中的后项产品组合营销成功率高(置信度高),并且由于客户可能一并购买两种之前没购买过的信贷产品,这对于提高业务量、利润和客户忠诚度的作用都优于仅再购买一种产品。对于这些客户建议在不投入太大额外营销成本的基础上,设计套餐进行营销。

六、结论

交叉营销是商业银行开展营销活动、进行客户关系管理,降低成本、增加利润的关键。关联规则挖掘能够分析银行海量交易数据获得潜在规则,为商业银行交叉营销提供强有力的支持。

为了充分发挥关联规则挖掘对商业银行信贷产品交叉营销的决策支持作用,本文针对商业银行的实际情况和交叉营销需求,采用Apriori和Carma算法,以某银行的实际业务数据为例,对其信贷产品的中小企业年度购买记录进行数据挖掘。经过对信贷产品分类和具体产品两个层面的挖掘分析,改善了商业银行进行信贷产品交叉营销过程中针对性不足的问题,给出了交叉营销思路和相关建议。

从关联规则挖掘的结果来看,两种算法的结果基本吻合,也比较符合现实情况,从而证明了采用关联规则对商业银行信贷产品交叉营销进行决策支持的可行性和有效性。产品类别和具体产品层面的关联规则挖掘结果都显示,对于已购买不同种类、不同具体产品的客户,需要综合考虑支持度、置信度和规则形式等各方面,制定批量营销、精准营销、套餐营销等不同的交叉营销策略。

[参 考 文 献]

[1]孙景,田甜.基于多层关联规则的银行产品交叉销售策略[J].中国金融电脑,2008(10):76-79

[2]Jiawei Han, Micheline Kanber. Data Mining: Concepts and Techniques [M]. San Francisco: Morgan Kaufmann, 2000

[3]戴稳胜,匡宏波,谢邦昌.数据挖掘中的关联规则[J].统计研究,2002(8):40-42

[4]丁振国,陈静.基于关联规则的个性化推荐系统[J].计算机集成制造系统,2003(10):891-893

[5]李虹,蔡之华.关联规则在医疗数据分析中的应用[J].微机发展,2003(6):94-97

[6]李德毅,邸凯昌,李德仁,史雪梅.用语言云模型发掘关联规则[J].软件学报,2000(2):143-158

[7]王明哲,基于数据挖掘技术的信用卡客户的信用评价[J].商场现代化,2007(8):77-78

[8]于海波,姜锴.数据挖掘在银行交叉销售中的应用研究[J].计算机技术与应用进展,210:423-426

[9]左映华,高居泰,李晋宏.Carma关联规则算法的一种改进[J].韶关学院学报(自然科学版),2004(3)

[责任编辑:王凤娟]

猜你喜欢
商业银行
2020中国商业银行竞争里评价获奖名单
2019年农商行竞争力评价报告摘要
我国商业银行会计内部控制研究
基于因子分析法国内上市商业银行绩效评
基于因子分析法国内上市商业银行绩效评
2018中国商业银行竞争力评价结果
商业银行人力资源管理工作研究
银监会:商业银行押品管理指引公开征求意见
2016中国商业银行竞争力评价陪名表
我国商业银行价值管理核心机制框架的构建