基于大数据挖掘的终端感知与换机应用研究

2015-03-01 09:32:32宋燕辉
湖南邮电职业技术学院学报 2015年4期

宋燕辉,陈 霖

(1.湖南邮电职业技术学院,湖南长沙410015;2.中国移动湖南公司,湖南长沙410014)

基于大数据挖掘的终端感知与换机应用研究

宋燕辉1,陈霖2

(1.湖南邮电职业技术学院,湖南长沙410015;2.中国移动湖南公司,湖南长沙410014)

【摘要】通过对移动大数据的分析和挖掘,能够提升终端感知,并为用户换机推荐提供强有力的数据支持。基于早期终端营销存在的问题与不足,提出了基于大数据挖掘的终端感知与换机应用系统解决方案,具体包括基于聚类算法的隐性换机用户提取方法,基于神经网络的指标分析法,基于决策树的换机预测方法。

【关键词】终端营销;大数据挖掘;终端感知;换机应用系统

运营商通过对大数据的分析和挖掘,能够提升移动终端感知,并为用户换机营销提供强有力的数据支持。相应的背景如下:

1)随着“互联网+”的提出,基于移动互联网的大数据分析已经成为ICT行业最热点的问题。

2)各大运营商的业务竞争越来越激烈,中国移动都需要进一步优化终端营销方案。

3)国内电信市场呈现“端管云”协同竞争的新模式,终端营销成为各大运营商的必争之地。

4)因为大数据分析结果不到位问题,中国移动尚未形成一套成熟的“互联网+大数据营销”模型。

5)终端营销精细化管理的新手段是大数据挖掘技术,大数据挖掘能支撑精准终端营销。

早期运营商的终端营销主要存在下列几个问题:

1)随着数据种类的多样化和数据量的增大,用户喜好特征建模变得复杂,传统的数据提取方法需要进行改进。

2)现有终端营销方案缺乏大数据理论支撑,数据采样分析能力有待提高。

3)在营销终端数据分析各个环节中,大数据分析采样不到位,换机预测成功率不高。

4)终端营销方案缺乏规范,各厂家在营销分析方面采取不同的方式,不能适用于集中地管理和进一步优化。

1 解决方案

1.1终端营销分析体系总体架构

某省移动建有终端营销分析体系,该体系主要包括售前终端营销和售后移动终端能力分析两大功能模块,如图1所示。

图1 终端营销分析体系示意图

1)售前终端营销模块

终端营销是售前完成的内容,其具体流程如下:根据终端属性和用户喜好,建立业务、用户与终端的适配体系,根据用户历史使用终端的厂家、型号、系统等信息构建用户终端喜好特征库,最后根据IMEI变更信息推测下次换机时间。从而通过构建基于终端的用户画像,在合适的时间向用户推荐合适的终端和捆绑产品,以此达到精准营销的目的。

2)售后移动终端能力分析模块

终端能力分析是在售后才完成的内容,其具体流程如下:首先完成IMEI与用户号码的一对一对应表,分析终端的在网分布、分流能力、业务表现,做好网络和市场协同支撑;之后完善终端分析工作,为解决终端售后问题提供数据依据。通过对终端的售后信息跟踪分析梳理,提升营销活动准确率,从而达到品质营销的目的。

1.2终端感知与换机分析方案

在终端营销分析体系中,终端感知与换机分析显得尤为重要,本文提出了基于“互联网+大数据挖掘”的终端感知与换机分析方案,该方案包括换机监控、换机预测和终端推荐三大模块,如图2所示。

图2 终端感知与换机分析方案

1)换机监控模块

换机监控模块主要包括构建终端喜好特征库及换机时刻分析两个部分。首先建立用户IMEI号与手机号的对应关系,基于IMEI号构建终端属性库,完善终端属性库相关属性,并形成属性评分数据库。由于用户换机缺乏明确的判定指标,并且用户换机特征具有不确定性和模糊性,因此采用聚类的方法进行分析。基于用户终端每周使用频率,对用户进行聚类,确定换机用户及换机时刻。

2)换机预测模块

换机预测流程如图3所示,首先将用户上网数据分为换机前数据(A组)、换机后数据(B组)和非换机用户(C组)。然后针对ABC三组的数据,通过基于神经网络的指标分析模型得到关键指标。再对于每个关键指标,按一定时间为单位计算相应指标输入维度进行决策树分析。再通过决策树算法建模,形成换机预测模型,得到换机预测规则。最后输入目标用户数据,通过预测规则,判断用户是否需要换机。

图3 换机预测过程

3)终端推荐模块

基于明星机型的终端推荐流程如下:首先按照用户手机类别、ARPU值、流量等参数进行用户细分;再对每一类用户中已换机用户所换机型进行排序,取排名前20的终端作为明星机型;然后计算该用户与明星机型用户的相似度排序,提取排名前50的终端作为推荐机型;最后对此类用户之后一个月的上网数据进行分析,验证用户是否换机,核对换机预测准确度。

2 主要创新点与应用效果

2.1主要创新点

综上所述,基于大数据挖掘的终端感知与换机应用系统,主要具有以下3个方面的创新点:

1)提出了基于聚类算法的隐性换机用户提取方法。

通过聚类算法,从用户上网数据中提取已换机用户进行换机分析,而不是依据市场换机数据,具有很强的时效性和较高的准确率,在大数据时代,隐性换机用户的提取能够提高终端营销的效率。

2)提出了基于神经网络的指标分析法。

预测用户是否换机,归根结底是要找出影响用户换机指标,我们采用了三级选取的策略。选取GN口上网数据所有可能对换机有影响的因素;通过对换机前后数据进行纵向对比,对换机与正常用户数据进行横向对比,找出有差异的因素;采用神经网络方法,得出影响换机的指标。

3)提出了基于决策树的换机预测方法。

将用户的关键指标作为输入属性,将用户是否换机作为类标号,建立决策树,并形成分类模型,对用户是否换机进行预测。原有换机分析方案中,分别对用户特征、在网时长、ARPU值、流量等指标进行统计分析,得到用户换机特征。现有换机分析方案中采用决策树的方法,能够多个指标联合分析用户换机规则,且具有很高的时效性。

2.2应用效果

本方案的应用效果如下:

1)通过聚类算法,不是依据市场换机数据,而是直接通过用户上网数据中提取已换机用户进行换机分析,具有很强的时效性和较高的准确率,准确率为97%。由于终端与IMEI号的一一对应关系,能通过用户每个IMEI号的上网数据的分析,可准确反映用户使用该机型的频率和走势,从而确定已换机的用户,有针对性的制定增值业务策略,并且反映这段时期的用户换机规律,节省了时间和人力花销。

2)预测用户是否换机,归根结底是要找出影响用户换机指标,我们采用了三级选取的策略。选取GN口上网数据所有可能对换机有影响的因素;通过对换机前后数据进行纵向对比,对换机与正常用户数据进行横向对比,找出有差异的因素;采用神经网络方法,得出影响换机的指标。本项目利用基于神经网络的指标分析法成功从终端数据和上网数据的113个属性中提取对用户换机影响较大的15个指标,主要包括终端出厂批次、屏幕尺寸、请求会话频次、平均上下行速度、网络类型、日均流量、服务成功率等。

3)现有换机分析方案中采用决策树的方法,能够多个指标联合分析用户换机规则,且具有很高的时效性。在一万个用户的样本数据中,通过对已换机用户和正常用户数据,分为80%的训练集,20%的测试集,利用训练集建立决策树,利用测试集计算换机准确度为73%,换机误判率为22%。

本方案有效降低了终端测试、换机分析过程中的人工成本。在数据分析效率方面,对于一万个用户一个月的Gn数据(100G,单节点),整个分析过程只需要十分钟以内,相比原有系统有显著地提升。在预测准确度方面,换机行为判定准确率为97%,整体换机预测准确度为73%,相比原有系统也有大幅提升。同时,从工作量上看,本系统提供大量数据挖掘算法库和换机应用示范库,为数据分析人员提供强大的数据支持和人性化的操作体验,能使工作效率提升一倍以上。该系统的实施,能极大推动终端营销的发展。

3 未来展望

下一步工作主要包括以下两点:

1)提升算法效率和准确率。本方案数据分析中主要采用神经网络算法和决策树算法,在算法效率和模型准确率上还有待提高。下一步拟采用基于遗传算法的算法组合,提升模型准确率准确率;采用并行挖掘,提升算法运行效率。

2)分析更多更广的数据源。本方案目前分析的数据主要包括用户上网数据和终端数据,下一步将考虑

用户更多的数据源。此外,本次分析主要针对一万个用户的样本数据,下一步将分析更大数据量的用户。

【参考文献】

[1]范建.浅谈手机终端营销中的拦截销售[J].中国新通信,2014(10).

[2]邓逸斌,等.大数据挖掘助力电信运营商终端营销[J].中国新通信,2013(12).

[3]魏国华,等.以客户需求为导向的定制终端潜在客户挖掘模型研究[J].信息安全与技术,2014(3).

[4]沈洪波,等.基于“端管云”分层接入的移动互联网管理模型探索[J].电信技术,2014(10).

Application research on terminal perception and replacement based on big data mining

SONG Yan-hui1, CHEN Lin2
(1. Hunan Post and Telecommunication College, Changsha, Hunan, China 410015; 2.China Mobile, Hunan Branch, Changsha, Hunan, China 410014)

Abstract:Through the analysis and mining of mobile big data, we can enhance the terminal perception and provide strong data support for the user's mobile phone replacement. Based on the problems and shortcomings existing in the early terminal marketing, this paper proposes a solution which is based on big data mining, including extraction method of hidden replacement user based on clustering algorithm, index analysis method based on neural network and replacement prediction method based on decision tree.

Keywords:terminal marketing; big data mining; terminal perception; replacement application system

[作者简介]宋燕辉(1978-),女,湖南浏阳人,湖南邮电职业技术学院副教授,高级工程师,硕士,研究方向:移动通信技术、4G技术。

[收稿日期]2015-10-25

【中图分类号】TP311.13

【文献标识码】A

【文章编号】2095-7661(2015)04-0013-04

【doi:10.3969/j.issn.2095-7661.2015.04.004】