■ 肖志良 博士生(1、佛山职业技术学院 广东佛山 528000 2、武汉大学 武汉 430071)
从历史客户的消费行为和倾向中寻找启示,这便是学习型大数据的重要前提和假设。随着企业逐步涉足电子商务营销,依赖传统订单生存的发展模式发生了根本性的转变,企业不再是面对几个传统的、熟悉的老客户订单,而是面对所有不确定性的潜在客户群,这时构建和提供精准服务显得尤为重要。电子商务营销的背景下,企业的竞争越来越趋向竞争情报的竞争,企业往往注重来自于外部环境的竞争情报,却忽略了企业内部环境的竞争情报,对企业营销活动进行大数据分析与挖掘同样是提高企业竞争力的有效手段(黄晓斌等,2012)。
1.数据的学习性。数据学习(Data Learning,DL)源于机器学习(Machine Learning,ML),机器学习的本质上就是包含各种算法的数据学习模型。数据学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是人工智能的核心,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。本文研究的重要前提是假设数据具有学习性,所谓数据学习性就是指在特点环境条件下既往发生的数据逻辑和规律会预示未来在相同或相似环境条件下新数据产生的趋势和逻辑,利用这种预示的规律可以帮助人们对未来某一事物的发展趋势做出研判。事实上,所有数据都具有二重性:描述性和参照性。数据的描述性是数据本身描述事物的属性度量值,数据的参照性是数据对其他同类事物的同一属性具有相对参考性,因此,数据既可学习其他同类的数据,同时也成为被学习的目标数据。数据的这种特征为人工智能、智慧服务的实现提供了良好的手段和支撑。
2.数据的多维性。数据的本质是描述某一事物的某一属性的特征值,由于被描述的事物往往复杂而又多面,因此准确描述事物特征属性需要从多个维度加以考量,这就是数据的多维性。比如描述某人的身高用一维数据即可,而描述某人在地球上的位置信息则需要二维数据:经度和纬度,如果要描述这个人的体重状态(体重是否达标)就需要三维数据了:身高、年龄、体重。本文研究的是客户的消费行为趋势,首先需要描述客户的消费行为(这需要采用二维数据:消费种类和消费量),然后再针对多次消费行为描述其消费趋势(需要增加一个维度:消费的时间节点),因此本文的研究采用了三维数据模型。
3.消费的行为与趋势。本研究假设客户对商品的多次消费行为蕴含并预示着某种消费趋势,并且客户在一段时期内会基本遵循这一消费趋势。笔者曾经对某一大型品牌服装企业的客户消费行为进行了详细研究分析,发现约80%的客户遵循自身的消费习惯和规律。因此,本研究对企业营销服务的指导作用仍然是显著有效的。
本文研究的基本思路是:在二维结构化数据的基础上加入“时间戳”,构建三维数据模型,将采集的原始数据按照三维数据的结构进行部署和存储;然后以数据的时间戳为基准,构建数据的趋势特征模型,这种趋势特征模型由多个特征参数来描述,不同的应用应该具体确定这些特征参数及其权重;最后是通过数据学习进行数据挖掘分析,预测事物发展趋势,数据学习的具体方法是通过趋势特征模型的特征参数构建搜索引擎,动态生成作为被学习的参照样本模型,并将样本模型的发展趋势作为被预测对象的未来趋势,为营运者提供决策支撑。
在探讨企业营销精准服务模式之前,首先需要研究数据的内在特征,也就是企业过往营销历史数据之中包含了哪些能反映客户消费行为规律、倾向、趋势的特征,对已经发生过多次消费行为的客户,通过大数据分析的手段将客户的消费行为倾向抽象成一个样本模型,并将这个样本模型作为学习的对象,供正在发生消费行为的客户学习模仿使用,也就是按照样本模型的消费倾向和趋势,向正在发生消费行为的、与样本模型具有同样消费行为特征参数的同类客户提供精准服务。因此,研究的关键是如何通过特征参数来描述客户的消费行为倾向和趋势,并由此创建客户消费趋势模型。
图1 消费行为三维大数据模型
图2 消费趋势度E折线图
图3 学习型消费预测模型结构
本文需要解决以下主要问题:一是通过引入“时间戳”的概念,构建三维数据模型,解决二维结构化数据对事物的动态性和趋势性描述乏力的问题;二是通过对三维数据的分析,构建描述事物发展趋势的参照样本模型,这种参照样本模型通过搜索引擎动态生成,为学习型大数据分析模型提供参照学习对象;三是通过引入“数据学习”的方法,解决大数据分析成长性问题,也就是随着数据逐步增加,数据的价值性与潜在真理性也逐步成长,而不是简单的数据样本堆积。
企业营销精准服务的推送和目标功能的实现很大程度上依赖客户消费行为数据的支撑,要科学、客观描述客户的消费行为,用简单的二维关系型结构化数据已经不能满足系统的设计需求,尤其是预测客户消费倾向和趋势时,二维数据显得力不从心。对于消费行为数据的描述,时间节点因素十分重要,比如,某个客户在不同时间节点分别购买了三件服装,三件服装的档次分别为高、中、低档,如果是按照时间先后顺序分别购买低、中、高档服装,便可以推断这个客户的消费能力在持续增强,他的未来消费倾向应该是高端产品;反之,这个客户的消费能力在持续下降,他的未来消费倾向应该是低端产品。
本文采用HBase数据库技术构建三维大数据模型,在传统二维结构化数据的基础上增加“时间戳”,形成三维结构化数据。对于半结构化数据和非结构化数据采用标识索引,使之转化为三维结构化数据。有了“时间戳”这个强有力工具,分析微观客户消费行为和宏观消费趋势就方便了。三维结构化数据具有三个轴,X轴对客户的消费量进行测量,Y轴描述客户的消费行为,Z轴记录客户的消费时间节点。其中Y轴(消费行为)是一个综合性参数,代表客户的消费规律、倾向和趋势。消费行为三维大数据模型结构图如图1所示。
构建了三维大数据模型,就可以创建企业营销数据库了。大数据的价值关键在于数据的价值性和可用性,因此企业必须严格对客户的每一次消费行为进行原始数据采集。大数据的可用性至少要满足五个特性:一致性、精确性、完整性、时效性、实体统一性(李建中等,2013),确保数据质量是构建服务模式的关键。
大数据计算是构建消费趋势特征模型的基本手段,目前大数据计算分为批量计算和流式计算(孙大为等,2014),消费趋势特征模型反映的是一种趋势,显然需要采用流式计算的方法。
首先确定消费趋势特征模型的特征参数。以客户在电商平台购买某一品牌的服装为例,这些特征参数应该能够充分反映客户的消费行为,经过反复调研和分析,本研究对消费趋势模型的特征参数的设定方法如下:
设一个数据挖掘周期内客户消费行为发生次数为n(即客户共发生过有效消费行为的次数),客户消费产品总数量为m(即客户所有消费行为的消费产品数量),每一次的消费总额分别为P1、P2、…Pn,D1为第1次消费行为发生的日期,Dn为第n次消费行为发生的日期,Dn-D1为第一次消费到第n次消费之间的相隔总天数。则定义趋势模型的特征参数如下:
平均消费单价A:用以描述客户消费产品的档次。
平均单次消费额B:用以描述客户消费能力。
消费行为密度C:用以描述客户消费的频繁程度。
消费离散方差D:用以描述客户消费产品档次的变化大小程度。
其中A1为第一次平均消费单价,…,An为第n次平均消费单价。
消费趋势度E:用以描述客户消费档次及能力的变化总趋势。
其中Pn-Pn-1为两次相邻消费行为的消费金额之差,Dn-Dn-1为两次相邻消费行为的时间之差实际上是两次消费行为的变化斜率,可见消费趋势度E反映的是客户每次购买行为变化趋势之和,E值越大,说明客户消费能力、档次(或者欲望)增强明显,E值为负数,说明客户消费能力、档次(或者欲望)在逐步减弱,E值为0,说明一段时间内客户消费能力、档次(或者欲望)基本稳定,变化不大。消费趋势度E折现图如图2所示。
以上定义了趋势模型的五个特征参数,现在可以用这5个参数来构建消费趋势特征模型。本研究认为,一个客户的消费行为趋势特征模型是这5个特征参数的函数,即:
其中,k1,k2,k3,k4,k5分别为特征参数A,B,C,D,E的测量权重,不同的应用应该通过数据测试分别设定特征参数的权重。为确保准确测量消费趋势模型,在没有条件的情况下(如数据样本数不够多),可以定性确定特征参数的权重,所谓定性确定就是根据实际应用的特点,对5个特征参数的权重由强至弱进行排位,然后按照这个顺序分别构建搜索引擎,权重越大的特征参数先进行数据搜索,权重小的特征参数后进行数据搜索,并逐步缩小搜索结果限制。
信息技术的学习功能是未来信息消费的重要趋势,也是人工智能技术的理论基础。本研究将学习功能用于构建客户的消费预测模型,具有严谨的科学性和严密的逻辑性。客户的消费行为尽管千差万别,但都具有一定的逻辑性。在大数据背景下,某一个客户的消费倾向模型往往能从历史的客户群中找到线索,这就是学习型模型的构建基础和假设。学习型消费预测模型主要针对公司的长期客户和有成为长期客户潜力的消费者,每当客户的消费行为发生时,系统将通过消费趋势特征模型构建搜索引擎,搜索其他曾经有类似消费行为的多个客户,将这些客户的消费行为描绘成一个“虚拟参照客户”,对“虚拟参照客户”的消费逻辑进行科学分析,形成消费样本模型,继而向目标客户推出精准服务。学习型消费预测模型的构建流程图如图3所示。
表1 消费趋势模型特征参数权重排列表
表2 消费趋势模型数据结构
1.创建消费趋势模型数据结构。前述所知,消费趋势模型是由5个特征参数来描述的,这五种特征参数的权重分别为k1,k2,k3,k4,k5,用定性分析的方法来创建消费趋势模型M。假设5个特征参数按照权重从大到小的排列顺序如表1所示。
由于是定性处理权重,本文并未对权重确定具体的值,只是按照权重由大到小的顺序安排数据搜索,首先对权重最大的特征参数(消费趋势度E)进行搜索,结果的样本数定为50个,然后对权重次之的特征参数(消费行为密度C)进行搜索,结果的样本数缩小为40个,以此类推,直到搜索完成5个特征参数,并保留10个搜索样本。搜索的结果需要暂存到中间数据表,这个数据表实际上就是样本的消费趋势模型数据结构,本文创建的消费趋势模型数据结构如表2所示。
2.创建消费趋势学习样本参照模型。本文希望对正在发生消费行为的客户提供精准服务,首先应该通过对该客户的消费行为数据进行特征参数计算,确定该客户的消费趋势模型,然后以该客户的消费趋势模型作为标准,在企业的海量历史客户数据中进行搜索,找到若干个与该客户消费趋势模型最为相近的消费趋势模型,并以此作为供学习的样本参照模型。这样,便可以认为当前正在发生消费行为的客户未来的消费倾向应该跟样本参照模型的历史客户消费倾向相似,并以样本参照模型已经发生的消费行为作为精准服务项目向当前客户推送。
假设通过数据搜索和分析,当前客户的消费趋势模型为M(e0,c0,d0,b0,a0),历史客户的消费趋势模型为M(ei,ci,di,bi,ai),我们便以M(ei,ci,di,bi,ai)≈M(e0,c0,d0,b0,a0)作为搜索引擎的条件进行搜索,步骤如下:
搜索消费趋势度E最接近e0的50个客户样本;在50个样本中搜索消费行为密度C最接近c0的40个客户样本;在40个样本中搜索消费离散方差D最接近d0的30个客户样本;在30个样本中搜索平均单次消费额B最接近b0的20个客户样本;在20个样本中搜索平均消费单价A最接近a0的10个客户样本;按照表2的格式将最后10个样本保存在消费趋势样本参照模型数据结构表中。至此,创建了10个可供某一当前客户学习的消费趋势参照样本模型。
3.营销精准服务的实现。前述所知,已经成功为当前客户找到了10个可供学习的消费趋势参照样本模型,为了向当前客户提供精准服务,还必须解决如下问题:
向谁学习?—虚拟参照样本模型的构建。由于创建了10个可供学习的消费趋势模型,究竟以哪一个模型为样板来为当前客户提供学习目标呢?虽然这10个样本参照模型具有非常类似的特征参数,但也不宜用单个样本模型作为学习对象,而是要将10个样本模型进行抽象,形成虚拟参照样本模型。设10个参照样本模型分别为:M(e1,c1,d1,b1,a1)、M(e2,c2,d2,b2,a2)、…、M(ei,ci,di,bi,ai)、…、M(e10,c10,d10,b10,a10),虚拟参照样本模型为M(ev,cv,dv,bv,av),则:
学习什么?——精准服务项目的推送。虚拟参照样本模型M(ev,cv,dv,bv,av)为当前客户提供了学习的对象,这个模型同样由5个特征参数来描述,需要将这5个特征参数转变成精准服务产品,以便向当前客户推送服务,也就是通过这5个特征参数的分析向当前客户推荐合适的企业产品,让客户感觉到企业猜透了自己的购买意图,从而提高客户感受度。
消费趋势度ev代表客户消费能力的趋势,用此参数作为增长率(或者下降率)计算客户的预测消费产品的价格,然后向客户推送大于(或小于)这个价格的企业产品。
消费行为密度cv代表客户消费行为发生的频繁程度,用此参数计算当期客户下一次可能发生消费行为的时间节点,适时向客户推出营销服务。
消费离散方差dv代表客户消费产品档次的波动程度,参数的值越大,说明客户消费产品的档次和数量跨度很大,反之,参数的值越小,说明客户消费产品的档次和数量基本停留在某一稳定的价格段或某几种型号。前者应该扩大向客户推送的企业产品范围和型号范围,后者应该向客户推送既往的类似档次、类似型号的企业产品。
平均单次消费额bv代表客户的消费能力,用此参数作为参考预测客户每次可能的消费额,然后向客户推送大于(或等于)这个额度的企业产品组合。
平均消费单价av代表客户消费企业产品的档次,用此参数作为参考预测客户未来可能的企业产品档次,然后向客户推送类似这个档次的企业产品。
“大数据”正以各种方式和路径影响着企业的商业生态,它已经成为企业商业模式创新的基本时代背景(李文莲,2013)。在大数据背景下,企业营销进入了一个崭新环境,企业必须主动适应这种新的营销模式,树立以服务精准化、个性化为核心的企业营销理念至关重要。精准服务的构建无疑离不开对大数据科学的分析和挖掘,数据样本横向学习功能的研究,使得在相同数据量的情况下,学习型数据更具挖掘潜力,大数据更加具有动态性和成长性。将三维大数据模型与数据学习功能结合起来,大数据挖掘将更有可能、更加容易预测事物发展的趋势和内在逻辑。
1.李建中,刘显敏.大数据的一个重要方面:数据可用性[J].计算机研究与发展,2013(6)
2.黄晓斌,钟辉新.大数据时代企业竞争情报研究的创新与发展[J].图书与情报,2012(6)
3.孙大为,张广艳,郑纬民.大数据流式计算:关键技术及系统实例[J].软件学报,2014(4)
4.李文莲,夏健明.基于“大数据”的商业模式创新[J].中国工业经济,2013(5)