基于客户特征的信用控制模型

2014-06-28 03:54陈仁强

移动通信 2014年5期

陈仁强

1 引言

近年来移动运营商陆续建立了以控制欠费风险为核心的信用控制体系，对保障公司运营收入发挥积极作用的同时也存在一些问题和薄弱环节。例如：用户信用评估标准单一，无法综合反映用户在收益、风险、潜在价值等方面的评价指标；信用服务内容少，缺乏针对不同信用等级用户提供的差异化服务；过于强调风险控制，产生大量不当停机，影响客户感知以及公司收益。

随着市场逐渐进入饱和期，服务行业竞争日趋激烈，信用控制已经从单纯控制风险发展为控制风险、完善服务、提升收入并举的有效手段。金融行业早已根据用户信用情况提供差异化动态信用服务，消费高、收入高、信用好的用户可获得更高的透支额度、更长的还款期限，在提升客户服务的同时鼓励客户消费。

为此，中国移动以最大程度方便客户、提高客户感知、并兼顾提升收益和降低坏帐风险为出发点，建立用户信用的科学评价体系，实现各信用等级用户的差异化服务，支持动态信用控制策略的灵活配置，贯彻“客户为根，服务为本”的理念，全方位提升用户信用服务体验，加强用户粘性，增加企业运营收入。

2 信用度模型

信用是一种建立在信任基础上的能力。现代市场经济中，信用无处不在，信用销售是市场销售发展的最高形式。移动运营商为移动通信用户提供的是一种典型的信用消费方式，通常情况下用户是在本月费用期间结束之后支付通信及服务费用。

信用度是用户可以透支话费的额度，是基于对客户属性、身份、消费额、消费行为等各方面因素综合提取，在一定模型下综合分析评估，按照一定的算法得出的对用户信用的量化评价指标。信用度是用户的一个属性，在一段时间后系统可以进行重新评估。

2.1 数据来源分析

对用户信用度进行评价需使用以下几类信息：用户的基本信息、用户的业务信息、用户的费用及缴纳情况信息等。

（1）用户的基本信息（只列举部分信息）：姓名、性别、年龄、身份证号码、用户品牌、在网时长、用户积分等。

（2）用户的业务信息（只列举部分信息）：移动号码、保证方式（保证人、保证金）、保证金额、交费方式、是否开通国际长途、增值业务使用活跃度、客户状态、客户离网概率。

（3）用户的费用及缴纳信息（只列举部分信息）：近6个月欠费次数、平均每次欠费金额、欠费次数比入网时长、上期3个月月均ARPU、ARPU差值、ARPU离差等。

从上述数据可以看出，用户的基本信息、业务信息都是定性的，用户的费用及缴纳信息大都是定量的。

2.2 信用特征选取

信用特征即信用因素、信用评价指标，是指在用户的基本信息库中，影响用户信用的因素。在信用特征的选取上，一方面要尽量选择能反映评价对象信用水平的特征，一方面要注意这些特征的可获得性，另外还要注意的是避免对用户的歧视。移动用户的信用特征可以分为基本信用特征、业务信用特征、信用记录三方面的信息。

（1）基本信用特征：选择对用户信用水平有较大影响的特征，包括职业类型、所属行业、任职部门、职务、教育水平、收入水平、联系方式、是否能联系上、身份证号码重复数。这些特征的取定一方面是考虑这些信息对用户的基本信用水平的影响较大，另外也参照了很多现有资料的用户特征，但为避免产生用户歧视，未将用户的性别、年龄等列为信用特征。

（2）业务信用特征：交费方式、保证种类、入网方式、业务开通种类、是否每月交费、客户类型、离网概率等。

（3）信用记录：入网时长、欠费次数、平均每次欠费金额、欠费次数比入网时长、欠停次数、平均每次欠停天数、欠停次数比入网时长、透支次数、平均每次透支金额、透支次数比入网时长、最近3个月月均ARPU、上期3个月月均ARPU、ARPU差值、ARPU离差等。

2.3 信用模型建立

本模型对各个信用特征采用特征分析方法进行量化，对各个特征的权重采用回归分析方法来确定。特征分析方法的核心思想之一是提供一套统一的、规范化的客户特征描述和表达方式，并在此基础上进行全面的信用分析。特征分析方法具有内容较为全面且扩展性强、具有较大灵活性、可根据用户的特征进行定义等优点，因此在信用分析中得到广泛应用。回归分析是处理各个特征变量间相关关系的一种有效工具，它可以提供变量间相关关系的数学表达式，易于理解和操作。

（1）信用指标特征分析

特征分析方法的另一个主导思想是将上述各个选定的信用特征进行定量化的评定，因此，将各个定性、定量的特征（指标）按照统一标准进行评定就成了特征分析的关键技术环节。本模型以百分制来评定每个特征所反映的客户资信水平，每个特征从小到大，表示该客户在该项特征方面的好坏程度，最高分代表最好，最低分代表最差，在此基础上制定科学准确的评分标准。

在数据准备阶段制成的宽表中，数据可分为两类：定性的和定量的。

1）定性指标

这类指标是根据信用特征的不同性质来划分种类和进行评价的，主要由各种基本信息特征和业务信用特征组成。这类特征的评价方法是结合维表分档和业务专家调查意见给分档打分二者实现的。

下面以某省为例，给出各定性指标的量化分数，如表1所示。

2）定量指标

定量指标本身是量化的，通过一定的评价函数转换为评价值，本模型中定量特征的评价函数主要根据指标的经济意义进行确定。

◆直线递增的分段函数：这类指标为正向指标，信用评价值随其指数的上升而上升，在某一数值达到满分，这类指标包括入网时长等。这种类型的函数图像如图1所示：

图1 直线递增分段函数图像

◆曲线递增的函数：这类指标为正向指标，信用评价值随其指数的上升而上升，并且上升的趋势是在初期上升的较慢，而靠近临界点处上升较快，在临界点达到1，这类指标包括预存次数比入网时长等。这种类型的函数图像如图2所示：endprint

图2 曲线递增函数图像

◆直线递减的分段函数：这类指标为负向指标，信用评价值随其数值的上升而下降，在某一数值（临界点）达到0，这类指标包括平均每次欠费金额等。这种类型的函数图像如图3所示：

图3 直线递减分段函数图像

◆曲线递减的函数：这类指标为负向指标，信用评价值随其数值的上升而下降，并且下降的趋势是在初期下降的较慢，而靠近临界点处下降较快，并在临界点达到0，这类指标包括欠费次数比入网时长、透支次数比入网时长、ARPU离差等。这种类型的函数图像如图4所示：

图4 曲线递减函数图像

（2）确定基准信用度

从数据准备阶段做好的宽表中随机抽取30%的数据做为样本集S。对S集做聚类分析、数据统计，根据S中数据特点、统计分布规律为用户设置基准信用度分数。对S样本集数据做主分量分析、因子分析，分析指标间的相关关系，将其归纳成5～10个因素，然后使用回归方法确定基准信用度公式。其数学模型为y=b0+b1x1+b2x2+…+bnxn，其中b0为常数项，b1、b2、…、bn称为y对应于x1、x2、…、xn的偏回归系统。

在S样本集上尝试以下几种变量选择方法分别建立基准信用度公式：

1）向前法（只进不出）

此法是比较所有自变量与因变量的偏相关系数，然后选择最大的一个作回归系数显著性检验，决定其是否进入回归方程。其主要缺点是：由于自变量间可能有相关关系，计算初期引入的变量当时显著，而随着其他自变量的引入，就可能使初期引入者变得不显著了。

2）向后法（只出不进）

此法是首先计算包含所有变量的回归方程，然后用偏F检验逐个剔除对因变量无显著影响的自变量，直到每个自变量在偏F检验下都有显著性结果为止。此法可行，但缺点是开始建立的方程可能自变量过多，使计算过于繁琐。

3）逐步回归法（有出有进法）

此法是对向前法的改进，首先对偏相关系数最大的变量作回归系数显著性检验，以决定是否进入回归方程，然后对方程中的每个变量作为最后选入方程的变量求出F值，对偏F值最小的那个变量作偏F检验，决定它是否留在回归方程中。重复此过程，直至没有变量被引入，没有变量可剔除。

选择其中R值最大的公式，作为最优的基准信用度公式。

（3）确定信用度定期调整公式

当用户使用运营商提供的服务一段时间后（此处假设为半年），可以根据用户的信用记录变化情况，对用户的信用度做进一步的评估，进而得到信用度定期调整公式。此时应考虑的特征为：

◆基本信息方面：交费方式变更、保证金增幅（如果减少则为负数）、客户类型变更。

◆信用记录方面：近期欠费次数、近期平均每次欠费金额、近期欠停次数、近期平均每次欠停天数、近期单通次数、近期平均每次单通天数、近期透支次数、近期平均每次透支金额、近期预存次数、近期平均每次预存金额、近期预存金额离差平方和、近期是否每月交费、交费日期离差平方和、最近6个月月均ARPU、最近6个月月均ARPU、ARPU差值、ARPU离差。

使用确定基准信用度类似的方法，确定信用度定期调整公式。

（4）计算信用额度

根据基准信用度公式和信用度定期调整公式，运营商对所有后付费用户使用基准信用度公式评估出其信用度后，可结合自身的业务开展情况，将这些用户划分为几个等级，例如，划分为7个等级，如表2所示。

理想情况下，在信用度指标上的用户数量应呈现正态分布，即信用度极高和极低的比重较低而大多数处于中档。

通过上面的分析，已经得到了用户的信用度评价和信用等级。那么如何来确定它的信用额度呢？显而易见，用户的信用额度肯定和他的信用度和信用等级有关，如果他的信用等级越高，其信用额度就应该越大，而增长的幅度也越来越大，这样不仅有利于用户消费的便利，而且有利于吸引用户提高其信用水平；另外，对于老客户来说，信用额度还应该与手机的当月应收费有关，二者存在对应关系；最后，用户缴纳的保证金也应列入其信用额度。于是，可给出指数形式的信用额度计算公式：

CO=f（CV，B，PT）=PT（eCV/100-1）+B （1）

其中，CO表示信用额度，CV表示信用度，PT表示近6个月平均应收费，B表示保证金。

或者也可以简单地以用户的信用级别为自变量，则相应公式为：

CO=f（CG，B，PT）=PT（e（7-CG）/6-1）+B （2）

其中CG表示信用等级。

对于新入网的用户，运营商可根据经营实际情况设置一个初始的信用度级别，待用户入网满6个月时，再使用基准信用度公式评估用户的信用度。

3 信用模型评估

经过实践检验，该模型误差率在1%以内，利用此模型取得了明显的效果，通过对客户信用等级的划分，实现了对客户分层分级的信用管理，为客户提供了差异化的服务，全方位提升了用户信用服务体验，加强了用户粘性，增加了企业运营收入。

参考文献：

[1] 杨建刚. 移动电话客户信用控制和管理[J]. 通信世界， 2005（31）： 30-31.

[2] 翟清兰. 基于Logit模型和人工神经网络的商业银行信用风险评估[D]. 大连：东北财经大学， 2006.

[3] 郭瑜敏，徐清宇. 电信业客户信用控制过程的优化[J]. 电脑开发与应用， 2009（8）： 70-71.

[4] 朱晓明，刘治国. 信用评分模型综述[J]. 统计与决策， 2007（1）： 103-105.

[5] 刘慧. 基于数据挖掘技术的信用卡申请评分模型研究[D]. 大连：东北财经大学， 2010.

[6] 刘戒骄. 个人信用管理[M]. 1版. 北京：对外经济贸易大学出版社， 2003.endprint

图2 曲线递增函数图像

图3 直线递减分段函数图像

图4 曲线递减函数图像

（2）确定基准信用度

在S样本集上尝试以下几种变量选择方法分别建立基准信用度公式：

1）向前法（只进不出）

2）向后法（只出不进）

3）逐步回归法（有出有进法）

选择其中R值最大的公式，作为最优的基准信用度公式。

（3）确定信用度定期调整公式

◆基本信息方面：交费方式变更、保证金增幅（如果减少则为负数）、客户类型变更。

使用确定基准信用度类似的方法，确定信用度定期调整公式。

（4）计算信用额度

理想情况下，在信用度指标上的用户数量应呈现正态分布，即信用度极高和极低的比重较低而大多数处于中档。

CO=f（CV，B，PT）=PT（eCV/100-1）+B （1）

其中，CO表示信用额度，CV表示信用度，PT表示近6个月平均应收费，B表示保证金。

或者也可以简单地以用户的信用级别为自变量，则相应公式为：

CO=f（CG，B，PT）=PT（e（7-CG）/6-1）+B （2）

其中CG表示信用等级。

对于新入网的用户，运营商可根据经营实际情况设置一个初始的信用度级别，待用户入网满6个月时，再使用基准信用度公式评估用户的信用度。

3 信用模型评估

参考文献：

[1] 杨建刚. 移动电话客户信用控制和管理[J]. 通信世界， 2005（31）： 30-31.

[2] 翟清兰. 基于Logit模型和人工神经网络的商业银行信用风险评估[D]. 大连：东北财经大学， 2006.

[3] 郭瑜敏，徐清宇. 电信业客户信用控制过程的优化[J]. 电脑开发与应用， 2009（8）： 70-71.

[4] 朱晓明，刘治国. 信用评分模型综述[J]. 统计与决策， 2007（1）： 103-105.

[5] 刘慧. 基于数据挖掘技术的信用卡申请评分模型研究[D]. 大连：东北财经大学， 2010.

[6] 刘戒骄. 个人信用管理[M]. 1版. 北京：对外经济贸易大学出版社， 2003.endprint

图2 曲线递增函数图像

图3 直线递减分段函数图像

图4 曲线递减函数图像

（2）确定基准信用度

在S样本集上尝试以下几种变量选择方法分别建立基准信用度公式：

1）向前法（只进不出）

2）向后法（只出不进）

3）逐步回归法（有出有进法）

选择其中R值最大的公式，作为最优的基准信用度公式。

（3）确定信用度定期调整公式

◆基本信息方面：交费方式变更、保证金增幅（如果减少则为负数）、客户类型变更。

使用确定基准信用度类似的方法，确定信用度定期调整公式。

（4）计算信用额度

理想情况下，在信用度指标上的用户数量应呈现正态分布，即信用度极高和极低的比重较低而大多数处于中档。

CO=f（CV，B，PT）=PT（eCV/100-1）+B （1）

其中，CO表示信用额度，CV表示信用度，PT表示近6个月平均应收费，B表示保证金。

或者也可以简单地以用户的信用级别为自变量，则相应公式为：

CO=f（CG，B，PT）=PT（e（7-CG）/6-1）+B （2）

其中CG表示信用等级。

对于新入网的用户，运营商可根据经营实际情况设置一个初始的信用度级别，待用户入网满6个月时，再使用基准信用度公式评估用户的信用度。

3 信用模型评估

参考文献：

[1] 杨建刚. 移动电话客户信用控制和管理[J]. 通信世界， 2005（31）： 30-31.

[2] 翟清兰. 基于Logit模型和人工神经网络的商业银行信用风险评估[D]. 大连：东北财经大学， 2006.

[3] 郭瑜敏，徐清宇. 电信业客户信用控制过程的优化[J]. 电脑开发与应用， 2009（8）： 70-71.

[4] 朱晓明，刘治国. 信用评分模型综述[J]. 统计与决策， 2007（1）： 103-105.

[5] 刘慧. 基于数据挖掘技术的信用卡申请评分模型研究[D]. 大连：东北财经大学， 2010.

[6] 刘戒骄. 个人信用管理[M]. 1版. 北京：对外经济贸易大学出版社， 2003.endprint