黄棣
(上海交通大学 电子信息与电气工程学院,上海 200240)
当前手机已经普及,企业如果能够充分利用收集到的客户基本信息和消费行为信息,跟踪并分析不同客户的需求及其对新产品的接受程度,就能采取相应的措施完善客户使用体验并提升企业收益。
目前国内外对移动互联网中用户的研究一直比较关注,国内的研究侧重于用户偏好现象分析,国外的研究则侧重于用户满意度、接受行为建模与仿真研究,主要以TAM模型作为基础,整合创新扩散等其他理论[1]。已有多种新型用户偏好提取算法被提出,如传统用户偏好提取技术与马尔可夫决策过程建模方法相结合的用户偏好评估模型[2]、文本挖掘算法[3-4]等。
本文重点讨论用户特征标签的刻画方法。通过建立适当的模型,在收集到客户的使用特定业务行为、互联网访问行为等有效信息之后,对客户在不同时间段的行为变化与频次进行综合分析,就能为客户打上特征标签,并应用于企业决策。
在分析用户的偏好程度时,既要关注用户对某类产品的使用次数,也要关注其近期使用该产品的连续性,结合这两个因素进行综合评分。
次数评分法即对用户在某段时间内对业务的使用次数进行评分。由于用户对不同业务的使用频次不同,直接用使用次数进行评价,在不同的业务之间可比性不强。因此,可以将次数统一映射为0~100之间的分值来统一评价。如何合理地评分是关键,需要选择合理的函数,本文设计了以下几种评价函数。
次数评分法有两个主要原则:第一,用户使用某种产品的次数越多则评分越高;第二,由于很多用户每月只使用数次,那么函数曲线应为上凸的。
常见的次数评分法有根号法、反正切法、指数法等,具体使用哪种方法应根据具体情况来确定。
(1)根号法
设计一个函数,将用户的使用次数映射到区间[0,100]上的一个数值即分数。由于实际使用次数的非均匀性,同时对少数使用次数很多的用户不需单独进行分类,因此该映射函数可定义为:
其函数曲线如图1所示。这种模型保证了y随x单调递增,并且函数曲线上凸,随着x的增大曲线变得平缓,因为当使用次数足够多时该用户已经拥有较高的评分,说明为活跃用户,则其分值的变化率应越来越小,接近于 0。当 x=0时(用户拨打次数为 0)评分为 0,当 x=100时分值最大为100。
图1 根号法评分示意图
由于y最大为100,那么当x超出100时仍取分值y=100。这种函数模型适用于x的值分布范围较小(最好在 0~100之间)的情况。
(2)反正切法
假设次数为x,评分公式为:
函数图像如图2所示。其中x/10是为了在x属于[0,50]范围内的函数曲线不至于太过平缓。这种函数也是单调递增的,并且随着x的增大曲线变得平缓,当x=0时y=0,当x趋于正无穷时y取最大值100。这种模型适用于 x的分布范围较广(0~+∞)的情况。
图2 反正切法评分示意图
(3)指数法
假设次数为x,评分公式为:
这里a的大小可以适当调整,一般可设定在1.1~2之间,本文取1.5;b根据基数大小取适当值,本文取10。如图3所示,y随x单调递增,并且曲线逐渐变得平缓,当 x=0时 y=0,当 x趋于正无穷时 y取最大值 100。这种模型适用于 x分布范围较广的情况(0~+∞),注意到反正切法的模型中当x较小时y的变化率非常大,而指数法中y随x的变化相对慢一些。
图3 指数法评分示意图
评价假定:如果一个用户在近几个月内都使用某项业务,那么可以判断该用户为此项用户的忠实用户;如果仅在前期偶尔使用过,近期均未用过,则属于该业务流失用户。
基于此假设,可以对用户在近3个月内使用某项业务的情况进行连续性评分。设当前月份为m,则m-2、m-1、m 3个月份使用连续评价规则可按表1进行定义。
表1 连续性评分规则
(表中前3列的 “1”表示在本月使用过该项业务,“0”表示未使用过)
基于评分模型得到的分数,可对用户进行分类,一种可能的分类方法如表2所示。
表2 用户分类
借助从运营商获得的数据可以统计出各类偏好地址 (把得到分数不小于75即中度爱好程度以上的地址认定为用户的偏好地址)的用户数量,从而判断各类网站的受欢迎程度。
依据手机用户利用宽带上网对网站主题的访问用户数对网站主题进行评分。评分方法可以采用指数法,a取 1.5,根据用户数的规模,b取 2 000。
依据手机直接上网用户对网站主题的访问用户数对网站主题进行评分。评分方法与基于宽带上网用户的评分方法相同。
根据某运营商一个月的数据,利用前文所定义的分析模型,可对用户、网站主题进行以下特征刻画。
统计得到的数据及其评价如表3所示。
表3 特征刻画统计表
根据对相关主题网站的访问统计,依据最近一周访问量来分析手机换购用户。
由于是对最近一周的用户数据集中分析,那么不宜采用打分的方法对用户分层。可以考虑使用定阈值的方法。如最近7天有3天以上访问天数,且平均访问同类偏好地址2次以上的用户,当其在上月的偏好月表中不存在,则判断其为有手机换购意向的用户。以某一星期数据为例,统计总用户数104 227,有换购意向的用户数达318,表4列出了统计分布表 (只列出用户数大于20的分布情况,天数是针对某特定主题,总天数是针对所有主题)。
表4 手机换购意向统计表(部分)
对手机用户一段时间内的访问次数、访问天数,分别根据前面的模型进行评分,得到一个总分:
得分=(天数得分+次数得分)/2,其中定义天数得分=100×(1-2-访问天数/1.1068),次数得分=100×(1-2-访问天数/1.1068)。
根据某运营商一周的统计数据,对用户是否为体育迷进行分析,得到表5所示结果。
表5 手机用户体育迷偏好等级
3.4.1 移动宽带上网偏好统计
参照从运营商获得的某个月数据,找出曾经访问过各类偏好地址的宽带用户191 613个,其中“3G达人”、“iphone4s”、“iphone 相关网站”、“手机综合”、“手机软件下载”的访问用户数量较大(高于 10 000),列出用户数大于1 000的偏好分布如表6所示。
表6 宽带访问偏好地址分布(部分)
为了找出用户访问频率较高的地址而不仅仅是用户数量大的地址,再统计出有5天和5天以上访问频率的用户1 583个,分布如表7所示。
3.4.2 手机直接上网偏好统计
根据运营商提供的月数据可以找出访问各类地址的手机直接上网用户193 148个,其中访问次数最多的为13,列出用户数大于1 000的偏好地址分布如表8所示。由统计结果可以看出,分布频率较大的是“360手机卫士 ”、“Android 天气通 ”、“天翼阅读”、“安 卓 市 场 ”、“手机酷狗”。
表7 5天及以上访问次数用户分布
表8 手机上网偏好地址分布(部分)
移动互联网逐渐成为大众生活必不可少的部分,移动互联网服务已成为网络服务发展的主流方向。为了提升客户的使用体验并为企业赢得更多的用户,本文介绍了通过固网用户的互联网访问行为以及手机用户的访问行为进行偏好分析并准确定位 “手机发烧友用户”的方法,提供了3种常用的评分模型,描述了宽带上网、手机上网数据分析的步骤和分析用户特征的策略,以某运营商提供的数据为例找出了比较受欢迎的用户偏好地址。企业可以以此进行用户特征标签的刻画并将其应用于营销服务活动,从而提升服务质量。
[1]徐潇.移动软件产品的用户接受研究——以苏宁彩票Android手机软件为例[D].南京:南京理工大学,2014.
[2]黄海清,张平,张曦文.用户偏好提取算法[J].无线电工程,2006,36(13):16-19.
[3]吴双.客户需求信息管理与用户偏好分析[J].科技致富向导,2013,25(17):409-431.
[4]张欢.网络用户偏好分析方法的研究[D].北京:北京交通大学,2010.