电信宽带客户流失问题研究
——基于生存分析方法

2019-06-04 02:25袁旭梅时国强
关键词:网速套餐合约

孙 丽,袁旭梅,时国强

(燕山大学经济管理学院/区域经济研究中心,河北秦皇岛066004)

一、引言

随着宽带市场竞争日趋激烈,中国电信在宽带市场的占有量日趋饱和,宽带客户流失现象越发严重。目前宽带服务提供商已经将关注的焦点从宽带基础设施建设转向如何能够减少宽带客户流失的问题上。在大数据时代下,各运营商已建立完善了客户关系管理系统,如果能够充分利用现有的客户数据建立有效的分析预警模型,分析宽带客户的消费行为,总结影响客户流失的潜在因素,运营商将可以对潜在流失客户采取有效措施进行提前干预,达到通信运营政策的有效实施,打破市场的极不平衡状态,从而可以减少客户流失并在市场竞争中取得优势。

二、国内外研究文献综述

电信行业的客户流失问题一直以来都是国内外学者研究的重要问题,多集中在影响客户流失的因素、客户流失预测模型及挽留等方面。在影响因素方面,徐旭通过发放调查问卷、直接面谈的方式,归纳出影响终端客户流失因素有品牌、年龄、入网时间、机型、价格[1];周静等以某移动公司为研究对象,归纳出最能影响客户流失的因素有个体的信息熵、个体的度、联系的强度三个指标,并且提出了业务人员的流动、竞争对手产品、公司诚信问题、服务态度等也是造成客户流失的原因[2];黄元碧提出了影响电信客户满意度的因素有产品、服务、关系、资费价格、新业务的感知、网络安全等[3]。目前在宽带业务的客户流失研究中,选取的研究变量多为客户的年龄、职业、家庭成员等人口统计学变量和客户的使用宽带行为,对客户与运营商之间的变更套餐行为、签订合约等行为考虑较少,而客户变更套餐的行为等对客户流失有影响。

在客户流失预测模型方面,国内外学者大多是通过对原始数据的不断挖掘和分析,建立各种客户流失预测模型,常用的方法有决策树、支持向量机、神经网络、回归分析、生存分析、混合模型等[4]。张宇基于C5.0决策树算法以中国邮政短信服务的100多万条实际业务数据为研究对象建立了客户流失预测模型,得出C5.0决策树模型有较高的命中率和覆盖率,具有良好的预警功能,能帮助企业及时发现有可能流失的客户,减少客户流失率[5];夏国恩利用支持向量机对网络客户流失进行了研究,分析中融入了客户价值和情感,取得了相对较好的结果,但在研究中参数的选择影响了预测结果的精度[6]。Rygielsk等应用神经网络方法建立客户流失预测模型,有效识别了客户价值,预测了客户行为[7];Coussement等利用Logistic回归算法以欧洲电信运营商的客户数据为样本建立了预测模型,研究涉及客户的通话行为、客户和运营商的交互行为、套餐订阅以及人口统计学特征[8];张珠香等利用生存分析方法以某电信用户数据为样本建立预测模型,考虑到了客户流失事件的随机特征,解决了大部分的数据生存时间不能准确观测到的问题[9];张小敏等将决策树C5.0、BP神经网络及SVM支持向量机3种算法组合构建了新的客户流失预测模型,利用最优加权组合预测方法确定了各模型的权重值,转化成二次规划问题,得出的组合预测模型的准确率高于传统单一分类预测模型,能够直观地分析出流失客户的基本特征[10]。综上所述,传统Logistic回归、支持向量机等算法对数据的精确度要求比较高,对于数据中存在的没能观测到结果的数据要求删除,数据的利用率不够充分,而生存分析方法正好解决了这方面的问题。近些年生存分析方法被广泛应用于医学、金融、电信等行业,国内学者对生存分析方法的起步较国外晚些,大多集中于COX模型的研究[11]。生存分析方法应用广泛,任何分布的数据都可以应用。

本文将使用生存分析方法,将观测期内客户的生存状态和离网时间作为双因变量,并考虑客户与运营商之间的行为,对观测期内流失和没有流失的客户的生存时间一同进行分析,研究宽带客户在不同的影响因素下的离网率随时间的变化,并运用COX模型分析不同影响因素影响客户流失的风险大小。

三、生存分析理论

生存分析(survival analysis)也称为生存时间分析、寿命分析(lifetime analysis)、失效时间分析、时间—效应分析、时间事件分析等,属于与时间相关的分析方法。生存分析是调查两个时间点之间间隔的分布和规律的方法,第一个时间点通常定义为一次调查研究的开始时间,第二个时间点定义为某个预设事件的发生时间。因此,生存分析一方面调查了要持续多长时间才能发生某个事件,另一方面调查了是否真正发生了预期事件。生存分析的目的是描述生存随时间的演变过程和生存的概率。

1.生存时间

生存时间被广泛地定义为某一事件开始时间到结束时间,可以是银行信用卡客户的开卡到关卡的时间,也可以是电信客户入网到离网的时间等。生存时间分布通常用生存函数、概率密度函数、危险函数来描述[12]。

(1)生存函数

生存函数用 S(t)表示,是个体生存时间长于t的概率。

S(t)表示生存函数,t表示某个时间点,T代表生存时间,是随机变量。

(2)概率密度函数(或密度函数)

生存时间T的概率密度函数f(t)的公式是:

h(t)表示的是在时间t时没有发生预测事件的个体,在往后的单位时间区间内发生预测事件的概率。

对于危险函数有:

当 t≥0 时,f(t)≥0;t<0 时,f(t)=0。

(3)危险率函数

生存时间T的危险率函数h(t)的公式是:

2.删失数据

所谓的删失数据是指在观测期间结束时有些数据仍然没有出现关心的现象,这些数据的确切生存时间不知道。将不能确定具体生存时间的数据称为删失观测值,能够确定生存时间的数据称为非删失观测值。删失类型可以分为Ⅰ型删失、Ⅱ型删失、Ⅲ型删失。

Ⅰ型删失:指数据在观测期结束时均出现关心的现象,所有数据的删失观测值都等于观测期的长度。

Ⅱ型删失:指在观测期时有固定的数目的数据出现关心的现象为止。这种类型要求没有意外删失的数据,删失观测值都等于最大的非删失观测值。

Ⅲ型删失:指观测期固定,数据在观测期内的不同时间进入研究,有些数据在观测期结束之前就出现了关心的现象,这些数据的确切生存时间是知道的;有些数据在观测期结束后仍然未出现关心的现象,这些数据确切的生存时间未知。如果将研究的时间范围确定为从时间t1到时间t2,某些数据的开始时间在t1之前,被称为左删失;某些数据终止于t2之后被称为右删失。

3.生存函数的乘积极限估计

乘积极限估计(PL)方法是Kaplan和Meier在1958年提出的生存函数非参数估计方法,也称Kaplan-Meier法。在发生目标事件的每个时间点都有对事件发生概率的估计,以及构成这些事件发生概率的乘积极限值,从而可以随时对生存概率做出估计,适用于当调查两个事件之间的时间分布时存在删失数据的情况。该方法基于一个个的数据,应用广泛,可用于小样本、中样本及大样本各种情形。在应用过程中可以通过绘制Kaplan-Meier曲线比较不同条件下样本生存函数之间有无差异,还可以采用Logrank test对数秩检验等定量分析不同样本的分析有无显著差异。

设t1,t2,…,tn是n个精确的生存时间数据,将这n个时间从小到大排列t(1)≤t(2)≤…≤t(n)。生存函数在t(i)的值可估计为:

其中n-i是生存时间长于t(i)的个体的数目。

4.COX模型

由于乘积极限法只能得出单个变量的累积生存曲线及单个变量随生存时间变化的结果,无法同时分析多个变量并进行比较分析,因此引入COX模型。COX模型(又称COX回归、比例风险模型)是一种最常用的生存数据分析方法,可研究多个变量对生存时间的效应,并根据预测有关的变量进行调整,实现更精确的估计。因此本文还选择使用了COX模型,该模型可分析有删失数据存在的数据,对数据的分布也没有严格的要求。依据的模型是:

其中:x为协变量;β为待估参数。

四、电信宽带客户流失现状

1.宽带客户流失的定义

客户流失通常指的是客户放弃使用某种产品或服务,转而使用市场上另一竞争企业的产品或服务[13]。不同行业对客户流失的定义也不同,Rob Mattison认为电信业是建立在客户流失基础上的行业[14]。在电信行业传统观念认为客户流失就是客户不存在了,其表现形式是离网或转网。随着电信行业的发展,产业链结构越来越复杂,产业链上的多个环节都对客户的行为有影响,现在的客户流失是指客户从限定的条件内消失了,比如说从一家运营商那里或从某项业务内或从某一个消费范围内消失了、ARPU发生变化、换号等[15]。张伟等则将客户报停、预销、强关、销号等八种状态定义为离网状态[16]。本文根据宽带业务的特征和各位学者对客户流失的定义,将宽带客户出现欠费暂停服务、强拆销号和客户退网界定为流失客户。

2.电信宽带客户流失现状

我国固定宽带网络已经实现了全面光纤,宽带用户已达3.78亿,其中光纤用户达3.28亿;下载速率已经达到100M以上,位居全球前列;固定宽带用户每月均支出为42.1元,每户每兆为0.49元,在世界处于中等偏低水平。本文所研究的A电信公司位于地市级城市,拥有311.08万常住人口。该公司在全市光纤宽带客户的存量确保值达26.66万户,全年宽带客户的离网客户达到了3.7万户,月均离网率达到了1.21%,其中非校园客户月均离网率达到了1.08%。随着电视网上客户数量的增加,其离网量也随之倍增,宽带电视的离网客户达到了1.3万户,月均离网率达到了0.69%。网上宽带客户停机达到了2.3万户,停机率7.63%,其中新增宽带客户的停机达到了0.7万户,新增停机率高达2.3%。该公司急需采取有效措施,改善客户严重流失、高值客户低迁状况。

3.变量选取

本研究选取该电信公司2016年12月至2018年11月内共5525个宽带客户数据,观测这些客户在24个月内的使用情况,所选取的客户信息数据来源于一个独立的IP地址。根据数据的可获得性,选取了客户的在网时长、是否流失、片区、月套餐价格、缴费方式、带宽、改变行为、融合数量、服务合约等16个变量进行分析。各个变量的定义及类型如表1所示。

表1 变量明细表

续表1

五、电信宽带客户流失生存分析

1.电信宽带客户流失生存模型构建

本文的分析数据包括在观测期内客户发生流失的3 766条完整数据(占比68.2%),即非删失数据;在观测期结束后仍然在网的1 759条客户数据(占比31.8%),即删失数据。

由于本次研究选取的宽带客户流失数据的分布未知,并含有31.8%的删失数据,因此采用乘积极限法(PL)。

1.设宽带客户的生存时间为t1,t2,…,tn,n为本次研究的宽带客户数据共5 525个,包括3 766个非删失数据和1 759个删失数据。将这n个数据的时间从小到大排列t(1)≤t(2)≤…≤t(n)。当出现删失数据的生存时间与非删失数据的生存时间相等时,非删失数据排在删失数据的前面。

2.每个生存函数在t(i)的值可估计为:。其中n-i是生存时间长于t的个体的数目。(i)

3.如果出现有两个或更多个t(i)相等,采用保守估计使用最大的 i值。即,若 t(i)=t(i+1)=t(i+2),则

K-M估计式为:

(1)片区:A公司将所覆盖面分成了9个片区(如图1)。该公司在该城市的宽带市场渗透率较高,各个片区的宽带客户流失率接近,这说明客户所在的片区对宽带客户的流失率影响不大。

图1 不同片区客户类型的生存曲线

(2)宽带套餐价格:从宽带套餐的价格上看(如图2),套餐价格越高的客户越不容易流失,价格低的客户在使用一年以后更容易流失。这是因为价格高的套餐网速较快,套餐内包含的服务更能满足客户的需求,增加了客户的粘性,开展的营销活动和售后服务更全面,因此客户满意度更高,不易流失。而选择低价格套餐的客户所使用的宽带多为单宽、网速较低且多为按年缴费,很难满足客户的使用需求。这类客户在使用期限满后往往会选择离网、更换套餐或者直接更换运营商,选择更优惠产品。

图2 套餐价格的生存曲线

(3)缴费方式:从缴费方式来看(如图3),目前该公司推出的缴费方式为包月、包年和日租三种形式,客户选择包月的较多,其流失率也比其他两种方式小。选择包年的客户在使用期结束后往往会根据体验选择继续使用或者终止使用,如果公司不能及时了解客户的使用体验,客户更容易流失。选择日租型宽带业务的客户多为过渡期,居住不够稳定也容易流失。而选择月包的客户在使用过程中有任何情况都会及时地反馈,增加了客户的自由选择度。

图3 缴费方式的生存曲线

(4)更换套餐:从更换套餐方面来看(如图4),未有过更改套餐行为的客户在使用了15个月后出现大量流失,而更改过套餐的客户流失率大幅度减小。当使用的套餐不能满足当前的需求时,客户往往会通过增加套餐融合项目或升级套餐的价格,满足需求,也提升了客户对公司的满意度;而未更改套餐的客户,当现用的服务不能满足需求时,没有及时反馈造成了一定的经济浪费,最终选择离网或转向其他运营商。

图4 更换套餐的生存曲线

(5)带宽:从宽带网速上来看(如图5),网速越快的客户生存时间越长,越不容易流失。一般客户在选择宽带业务时首先咨询的就是宽带的网速,稳定、快速的网络成为客户选择的首要依据。目前,为了更好地挽留客户,电信公司一般提供免费宽带升级服务,套餐价格也更优惠。在套餐金额增加幅度不高的情况下,客户更愿意选择网络更快、更稳定的套餐。但由于其他运营商的竞争,该公司的宽带覆盖率、网速的升级也受到一定的影响,竞争对手采用低价位策略吸引了不少网速低的客户转网。

图5 带宽的生存曲线

(6)欠费行为:从是否有过欠费行为方面来看(如图6),有过欠费行为的客户比没有过欠费行为的客户更容易流失。公司一般选择在月初扣除当月客户的宽带费用,当客户账户金额不足时,公司将暂停提供宽带服务,直接影响客户的正常使用。即使客户发现后及时续费并继续正常使用,但公司的停机行为影响了客户的满意度,也使有意见的客户渐渐成为沉默的投诉客户,甚至最后选择离网。

图6 是否有过欠费行为的生存曲线

(7)融合:在融合项目中可以发现(如图7),同时与高清电视和手机相融合的客户最不容易流失,其次是只与手机融合的客户,选择单宽或与电视融合的客户更容易流失。宽带业务融合项目越多,对公司的依赖就越大。现阶段公司推出的套餐多为融合套餐、价格优惠,而推出的单宽套餐往往网速较低、需要包年缴费。选择单宽套餐的客户在使用过程中常遇到网络不稳定的情况,由于套餐升舱不及时,客户满意度差,往往在包年结束后就选择了离网。有线电视网络推出的4K高清电视业务,在画质上与电信公司接近,视频点播业务传送速度快,画质更清晰,此外广电也推出了10G以上宽带网络业务,因此在高清电视方面广电更有竞争力。

图7 宽带融合的生存曲线

从与手机相融合上看(如图8,9,10),生存时间比没有融合手机的客户长,没有额外通话时长的客户比有额外通话时长的更易流失,没有额外流量的客户比有额外流量的客户更易流失。主要原因是有额外通话时长和流量的客户经常使用绑定的手机卡,此卡作为自己稳定的联系方式,也会与银行卡、社保卡等多个业务关联。因此在更换其他运营商的宽带业务时,需要同时更换绑定的手机卡,造成很多不便,增加时间成本,因此离网率相对会变低。与手机相融合的客户流失会受手机套餐价格的高低影响,手机套餐价格越高生存时间就会越长(如图11)。这是因为高价位套餐的客户得到的通话时长、流量等业务更多,宽带网速也更高。在竞争对手推出更低价位套餐时可能对客户有一定的诱惑,但是出于对电信宽带网速质量的考虑,低价也不足以刺激客户离网。

图8 与手机融合的生存曲线

图9 是否有额外语音的生存曲线

图10 是否有额外流量的生存曲线

图11 手机套餐价格的生存曲线

(8)合约:从是否签订合约来看(如图12),购买套餐时同时签订了合约的客户的生存时间比没有签订合约的客户长。没有签订合约的客户,当对服务不满意或竞争对手提供更优惠套餐时,可能终止宽带业务,因此客户流失率增加;而客户与运营商签订合约,会获得价格上的优惠。公司还推出了由政企担保的合约类型,为这类用户提供更优惠的服务,因此这类客户不易流失(如图13)。但在合约结束后客户的流失率也会大幅增加,其中参与集团性合约的客户比个人客户流失量大(如图14)。

在选取的数据中,客户多为合约类型(如图15),购买合约机,同公司签订合约的客户最容易流失。这是因为客户所购买的合约机,一般要求一次性付清租机款(大多以预存话费的形式),并被要求与公司签订一年或多年在网的合约。但是如果客户在签约期内,出现违约行为,手机将会被锁机,预交的话费将不返还,甚至要交违约金。客户出于对电信公司的信任,往往签订的合约时间比较长(一般要求在网2至3年),当合约期满后,手机也将需要更换,此时客户会选择更优惠的手机或者直接购买裸机,大大增加了客户的离网率。

图12 是否有合约的生存曲线

图13 公众合约、政企合约的生存曲线

图14 合约是否结束的生存曲线

图15 合约类型的生存曲线

2.COX比例风险回归建模

将通过检验的变量纳入COX模型,并将原始的分类变量转化为17个协变量。利用SPSS 20.软件输出的结果如表2所示。可以看出协变量都对应一个β,如果β为正,则说明该协变量增加了宽带客户流失风险;如果β为负,则说明该协变量能够降低宽带客户流失风险;如果β为0,则说明该协变量与宽带客户流失无关。宽带客户COX模型结果为:

表2 COX模型结果

从表2中可知,宽带套餐金额小于60元、与手机相融合、签订乐享4G计划合约、签订政企担保合约、网速在100M和网速在200M的β的值为负且p值大于0.05,这些协变量对模型的影响小。有过欠费行为和手机套餐价格高于100元的β的值虽为正但p值大于0.05,对模型的影响也小。其余系数均通过显著性检验。

COX 模型结果显示,x″1、x′4、x″″4、x′5、x″5、x′6、x‴、x7共8个协变量的回归系数为正且p小于0.05,说明这些变量组客户比对照组客户流失风险更大:宽带套餐价格在60元至100元内的客户流失风险是宽带套餐金额大于100元客户的1.656倍;与手机和电视相融合的客户的流失风险是单宽客户的1.637倍,而与电视相融合的客户的流失风险是单宽客户的2.013倍;与手机绑定的客户中手机套餐价格小于50元的流失风险是没有绑定手机的客户的21.474倍,手机套餐价格在50元至100元之间的客户流失风险是没有绑定手机客户的18.012倍;签订翼支付红包合约的客户流失风险是没有签订合约客户的4.72倍,而购买合约机优惠的客户的流失风险是没有签订合约的客户的2.42倍;签订合约且合约期未结束客户的流失风险是没有签订合约客户的3.095倍。

而β值为负的系数虽然不显著,但并不代表可以接受原假设,只是没有足够证据表明可以拒绝原假设,因此该回归系数仍旧具有参考价值,即宽带套餐金额低于60元的用户流失风险是高于100元客户的1.036倍1.036);有过更改套餐行为的客户流失风险是没有过更改套餐行为客户流失风险的1.035倍;与手机相融合的客户的流失风险是单宽客户的1.067倍;签订了乐享4G计划套餐合约的客户的流失风险是没有签订任何合约客户的1.007倍1.007),而签订了政企担保合约的客户的流失风险是没有签订任何合约客户的1.55倍,网速在100M的客户的流失风险是低网速客户的1.163倍1.163),网速在200M的客户的流失风险是低网速客户的1.074倍

利用建立的COX模型可以画出该公司宽带客户的生存率曲线和风险累积曲线,分别如图16、图17所示。从风险累积曲线可以大致分析出自客户入网之日起,流失率风险在风险累积函数曲线的最高点对应的时间(约24个月)达到最大化。与之对应,生存率曲线在此刻下降至最低点,宽带客户的留存率降到了最低点。

图16 宽带客户生存率曲线

图17 宽带客户风险累积曲线

六、防止电信宽带客户流失的策略

为了减少客户流失,根据生存曲线分析结果结合A公司实际情况,提出四项提前干预策略。

1.注重线上服务系统管理,提高基础服务满意度

尽管互联网业务的高速发展一定程度上为电信企业发展提供了有利条件,但根据A电信公司宽带客户流失生存模型数据可以看出,带宽、缴费方式和欠费等因素导致的问题,会直接影响客户流失程度。因此,电信宽带服务的便利性成为解决客户流失问题的主要途径之一。运营商应当事前加强线上服务系统升级管理,坚持打造高品质的服务品牌;事中优化服务流程,及时解决客户的痛点;事后跟踪客户,创造客户体验,确保客户满意度。做到线上服务系统与企业内部管理的无缝整合,建立科学高效的客户沟通长效机制。

2.内容/应用+网络深度融合,提升客户需求匹配度

宽带网络的速度不断提升,使得客户需求不断被激发。从套餐业务的价格、更换套餐行为、产品融合和合约等因素分析不难发现,现有的套餐业务不能更好地满足客户的需求,成为影响宽带客户流失现象的主要因素。因此,运营商应综合考虑客户的不同需求和消费习惯,尽可能提高客户的满意度,有效提升客户的粘性。根据客户数据统计分析结果发现,网络服务内容的实用性与娱乐性能否满足客户需求,是影响客户购买宽带网络服务的关键。因此,高价位的宽带套餐除了提供高速上网,能否提供如多媒体、语音、游戏及其他各种实用性的应用,将是运营商吸引和留住客户的重要因素,也是促进宽带市场快速发展的动力之源。宽带运营商可以通过对套餐内容进行设计,注重应用/内容+宽带网络的融合,并为特定需求的客户提供稳定的网络保障服务,提升客户在特定互联网应用下的体验,不断探索新渠道管理模式。

3.整合营销手段,提升产品竞争力

从生存分析模型结果可以看出,价格是影响消费的一个主要因素。想要提高产品竞争力,培养优质的客户粘性,应考虑以下几方面:针对不同的客户需求,采取针对性的营销活动——如“电子优惠券”“积分兑换”“低价位套餐业务”等,增大优惠力度;宣传渠道上,将广播、电视、网上营销和网上营业厅等渠道有效结合起来,以提高宣传力度,拓展宣传覆盖面。通过各种有效措施,进一步提高客户的满意度,提升在同类品牌中的竞争力。

4.对客户价值进行分层管理,打造差异化

目前宽带运营商对客户管理还没有做到完全“精准”,即推出的某一业务是针对一批目标客户。需要指出的是,在注重高价值客户的管理外,还需要注意低价位的客户,这类客户使用业务量小,对公司的贡献小,其维系成本也很低,但利润为正,因此这类客户对于公司也有价值。根据客户价值分层管理,对不同阶层的宽带客户进行个性化管理,制定专门的营销策略,使得宽带客户价值及规模得以层次化推动,扩大市场占有率。

猜你喜欢
网速套餐合约
《加什么不要钱》
英国网速快慢相差800倍
儿童套餐
婚姻是一份套餐
绘潭
网速太慢
合约必守,谁能例外!——对“情势变更”制度不可寄于过高期望