张竞贤
一、引言
目前已有基于通话基站的区域化模型可以实现中国移动手机用户的粗略定位,就是先找出该住宅小区附近的网络基站,然后找出在该网络基站下面经常通话的用户就判断为该小区用户,但是因为基站不可能只覆盖一个住宅小区,这种方法势必会把在该基站下面通话但是只是居住在附近不是该小区的用户归到该小区,误差较大。所以迫切需要一种新的算法可以实现住宅小区用户的精确定位。
二、解决方案
2.1 解决方案概述
同一住宅的小区会有一些共性的通话行为,比如会跟同一个物业电话进行联系,通过分析小区用户的拨打行为,通过加权判分最后排序筛选的方法找出该小区的类似物业电话的具有很强小区内部属性的电话,再反推出本小区用户的方法,可以更精准的判断同一小区归属,更具有现实的准确性。
2.2 具体解决方案
步骤一,提取出通信运营商经营分析系统中的数据仓库中用户的通话信息,包括用户号码、通话时间、通话地点等信息;步骤二,确定用户的归属基站,以用户晚上的最后一次通话基站确定为其归属基站,从而将所有用户按照基站分好类;步骤三,由于同一小区客户一般都拨打过具有很强小区内部属性的电话,如该小区的物业电话,后期维修电话等,所以查询同一基站下面用户的话单,都拨打过某一具有很强小区内部属性的电话的可确定为同一小区用户。下面关键是如何确定小区内部属性电话。我们以基站为最小单位统计该基站下面所有用户的通话,按照拨打过某一对端号码的人数占基站总人数的百分比进行降序排列;步骤四,对于超过50个基站下面的用户共同拨打过的号码是10086、114等公共电话,予以剔除后,取前10个号码为疑似小区内部属性电话,并且对前10的号码按照斐波那契数列进行打分处理,前十名得分分别为:89,55,34,21,13,8,5,3,2,1;步骤五,将全区所有基站下面的号码的分值相加,分数超过1000分的说明有很多小区的用户会经常打该电话,分数低于10分的说明很少有用户打这一电话,都不能作为区分小区的标识,删除这些号码后重新执行步骤四,选出前十号码,再执行步骤五,一直循环执行,直到号码全区累加的分数都在10-1000之间。步骤六,A基站排名第一的号码可确定为该小区的内部属性电话,与该号码有通话行为的可确定为同一小区用户。如果B基站下面的用户也有与该号码通话并且两个基站的归属用户有不少有在对方基站通话的经历并且基站经纬度表中二者距离较近,可确定两个基站用户为同一小区,将B基站下与A基站排名第一号码通话的确定同一小区用户。以此类推,可将不同基站划分为同一小区;步骤七,上面确定了该小区拨打过小区内部属性电话的用户,同一个家庭可能只有一个人拨打该电话,对于其他家庭成员的确定可通过家庭网、互相通话和交往圈重合度来确定,可以按照每月通话20次以上,通话次数排名前10,非上班时间通话天数,非上班时间通话次数均在前3的条件来计算家庭交往圈,并且使用已知集团用户或家庭用户关系的其中一方除已知关系外的所有关系作为反例,产生训练集来交叉验证; 步骤八,通过以上步骤可以将全区的移动用户分到一个个的小区,而小区名字的确定,一是可以通过网络部基站和小区的对应关系来确定,二是办理过移动或者铁通宽带的用户都需要录入小区名称和地址,可以从数据仓库中取得小区名称。至此,通过数据仓库找到具有小区内部属性的电话从而确定小区用户的流程结束。
三、实验结果
对这一模型,采用了外呼验证的方法进行验证,通过客户服务中心组织向随即抽取的1000位模型识别客户进行外呼,获得有效答复876个,结果显示小区属性识别率为73%。综合评定:本发明弥补了现有的通过基站只能粗略的判定该用户在该小区附近,会把在该基站下面通话但是只是居住在附近不是该小区的用户归到该小区,可以更精准的判断同一小区归属,有利于针对小区用户的精细化营销的实现。
四、结论
本成果,通过经分系统对话单、信令的大数据的处理能力,基于数据仓库,实现了对中国移动手机用户住宅小区的精准定位,并通过异网交往圈判定,准确定位了联通和电信用户,准确率达到70%,构成了完整的宽带精确营销目标用户分析支撑体系。
本成果解决的上述问题,传统的人工方式和普通的技术手段均无法解决,填补了中国移动精准营销领域的空白。另外,该成果使用的分析模型和算法估计可在较长时间内保持稳定。本成果得到的目标客户清单是企业宝贵的无形资产,且除了可用于宽带精准营销这一成果外,完全可推广于其它需要客户精细画像的领域,具有很高的应用价值。
?地址,改成石家庄维明大街南二环中华城2107,赵雪收13582041882