基于数据挖掘的电费风险评价研究

2018-06-04 03:42张耀赵猛于海涛田雨婷国网天津市电力公司信息通信公司
数码世界 2018年5期
关键词:电费数据挖掘用电

张耀 赵猛 于海涛 田雨婷 国网天津市电力公司信息通信公司

引言:随着电力体制改革加速推进,面向终端客户的售电侧市场正在快速放开,作为传统电力企业应逐渐加大对客户服务的持续关注与改进,不断提升对客户服务的持续关注与改进,不断提升对客户的服务水平和自身营销能力。

在营销业务应用系统的运行过程中,公司积累了大量的用户基础档案数据、缴费行为数据、用电行为数据,通过对此类数据的深入挖掘,建立电力客户标签模型,应用电力客户标签模型开展电费风险回收预估,有针对性的开展电费催缴、预付费等预防措施,促进电费回收。

1 总体设计

目前电力企业面对客户的能力与整个社会整体高度的维权意识、以及其他行业完善的服务体验相比仍处于落后水平,因此电网公司服务理念亟待从“客户需求导向”进一步向“客户体验导向”提升,挖掘海量的营销服务数据价值,用以创新营销策略和服务模式,提升内部管控水平和保障企业效益。

电费回收风险监测工作历来是供电企业的工作重点,它直接关系到销售收入能否真正实现,直接关系到供电企业的经营成果和经济效益,关系到供电企业的生存与发展,因此需要细化用户分类,利用客户的用电类别、行业分类、用电量、抄表例日、欠费次数、欠费金额等信息构建客户标签模型,通过客户标签信息与欠费状态的相关性分析,得出相关性系数,用于计算客户的电费回收风险得分,从而预估客户的电费回收风险。

2 详细设计

基于数据挖掘的电费风险评价研究,主要应用RFM分析方法,考虑到电力企业用户交费存在一次大量金额、交费次数少等特点,此次研究工作对原有RFM分析模型进行适应性调整,将原有RFM模型的最近一次消费时间、消费次数、消费金额三个指标替换为客户最后一次欠费时间、欠费次数、欠费金额,以此作为RFM分析的三个指标,同时结合客户基础属性信息,用电行为信息等,构建基于RFM的客户标签模型,针对客户标签模型与欠费状态的相关性分析结果,对未来发生的欠费风险进行预估,重点主要分为以下三类:

一是在客户电费风险标签方面,完成客户用电类别、行业分类等基础属性数据归拢,实现客户欠费行为、违约行为、业务变更行为等用电行为的分析,得出用户标签明细数据,形成客户电费风险标签明细清单。

二是在客户电费风险模型构建方面,依据得出的客户标签明细清单,结合电力行业本身的特点,本项目对RFM分析方法进行深化应用,将客户的欠费次数、欠费金额、最近一次欠费时间作为衡量用户欠费行为的三个因子,得出RFM评价结果,同时结合客户的用电类别、行业分类等客户标签属性完成客户电费风险模型构建。

三是在电费风险评价方面,根据客户标签明细清单中用户标签数据及RFM得分情况,结合用户欠费状态,进行相关性分析,得出用户标签与欠费状态的相关性系数,依据相关性系数及预估月份的用户属性信息得出欠费风险得分。

3 模型算法梳理

3.1 RFM模型分析

在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。由于电力行业自身的特点及客户的行为特征,通过购电行为难以实现客户的评价,因此选取截止到当前时间前1年的客户的最近一次欠费时间、欠费次数,累计欠费金额作为RFM评价用户电费风险的三个指标,综合客户的标签属性信息进行客户标签模型构建。

3.2 数据标准化分析

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。通过使用离差标准化方法对客户的违约用电发生次数、增量、流失工单办理情况、欠费次数、欠费金额等数据进行数据线性变化,使结果值映射到[0-1]之间。

3.3 相关性分析

相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。线性相关是相关性分析最常见的一种,即当一个连续变量发生变动时,另一个连续变量相应的呈现线性关系变动,用皮尔逊相关系数来度量。

皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。假设有两个变量X、Y,那么两变量间的皮尔逊相关系数可通过以下公式计算:

公式一:

公式二:

公式三:

公式四:

以上列出的四个公式等价,其中E是数学期望,cov表示协方差,N表示变量取值的个数,在本项目中变量值为数据标准化之后的多个客户标签数据值,依据数据相关性分析,得出客户标签与当前欠费状态的相关性系数。

通过相关性分析得出的威尔逊系数,客户欠费状态,客户标签信息,构建客户电费风险预估模型,模型公式如下:

g(x)为最终得出的客户电费回收风险得分,,等为客户标签标准化数据,,,…等为威尔逊相关系数。

通过获取10kV以上客户在近一年内(2016年1月至2016年12月)的客户用电行为、交费行为等数据,如增量工单办理情况、流失工单办理情况、客户交费时间,通过基础数据的映射得出客户标签标准化数据,结合2017年1月客户的欠费状态,进行相关性分析,得出威尔逊相关性系数。

4 预估成效

根据构建的客户电费风险模型,结合客户欠费状态,采用相关性分析方法,对客户标签属性与客户当前欠费状态进行相关性分析,得出威尔逊系数。经过对电费回收风险未命中的客户进行抽样分析,发现两类现象,分别为客户的交费日期提前和客户的缴费期限延后,建议业务部门依据预估结果及客户特点,及时走访客户,了解往月欠费原因,制定短信催费、收取预收或调整客户缴费期限等电费风险的预防措施,减小电费回收风险。

通过该项目的研究成果,为业务部门对客户的差异化管理提供依据,基于电费回收的风险预估结果,有针对性的开展电费催缴、欠费.停电和预付费等预防措施,制定个性化催缴方案,加强欠费催缴力度,促进电费快速积极回收,从而降低公司经营风险及经济损失,保障企业经营业绩。

[1]杨一帆,傅军,朱天博,等.电力客户用电行为特征挖掘与预测[J]. 电测与仪表,2016, 53(s1):111-114.

[2]林嘉晖.基于数据挖掘的电网用户行为分析系统的设计与实现[D]. 中山大学,2013.

[3]徐天池.基于数据挖掘的电网客户细分系统设计与实现[D].中山大学,2013.

[4]陈明亮.客户价值细分与保持策略研究[J].成组技术与生产现 代化,2001:

[5]贺仁龙,叶宇航,赵晓康.电信企业客户细分模型构建与应用研究[J].情报杂志,2011:

[6]刘英姿,吴昊.客户细分方法研究综述[J].管理工程学报,2006

[7]王春叶.基于数据挖掘的电力客户细分研究[D].北京:华北电力大学,2009

[8]程启月.评测指标权重确定的结构熵权法[J].系统工程理论与实践,2010

猜你喜欢
电费数据挖掘用电
基于ε-SVR模型的日电费回收预测
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
对输配电及用电工程的自动化运行的几点思考
电费核算在电费管理中的重要作用
用电安全要注意
用电监察面临的问题及反窃电对策
供电企业电费复核工作中需注意的问题研究
软件工程领域中的异常数据挖掘算法