Causata:利用数据创造个性化客户体验

2013-08-08 04:46杨学濡
电脑与电信 2013年9期
关键词:结构化预测客户

特约通讯员 杨学濡

无论你是否意识到,大数据时代都已经进入我们的生活。也许它已经与你打过交道——比如,海量数据的存储、访问,数据处理、数据的结构化分类。或者是更深层次的大数据分析,通过分析庞大的数据集提炼出一些有价值的数据,从中得到一些关于客户、业务或者企业所处商业环境的信息。即使你还没做这一步,但是数据管理的重要性已经日益显著。

作为云计算领域的重要延伸,大数据是海量的(Volume)、多种类的(Variety)、需要大规模的处理才能够凝聚足够价值的(Value)、处理和检索响应速度快的(Velocity)的数据。处理大数据所需要的系统,和传统的数据挖掘工作所需要的系统有根本性区别。同时,大数据时代愈发强调数据的关联性,将各种数据进行关联组合,以产生更大的价值。作为一家提供海量数据实时分析技术的年轻公司,Causata在这一领域备受业界关注与好评,该公司主要基于行为预测分析、机器学习及Hadoop/HBase架构等核心技术,提供了实时互动式存储、实时决策、动态行为预测和网络个性化等服务方案。也正由于其出色的技术,今年 8月,NICE Systems公司(NASDAQ:NICE)宣布收购 Causata,帮助NICE的解决方案更精准地观察、捕捉客户在网络上的活动数据,使各机构在面对万亿字节量的信息时,能够更好地进行实时决策和指导。

Causata:客户体验管理

大数据(Big Data)是指所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内进行撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。随着云时代的来临,大数据也吸引了越来越多的关注。利用大数据,企业能够挖掘用户的行为习惯和喜好,在凌乱纷繁的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化。越来越多的政府、企业等机构开始意识到数据正在成为最重要的资产,数据分析能力成为一种核心竞争力。然而,许多企业并不能真正利用好大数据,对于如何管理并运用庞大的数据无从下手。

来自加利福尼亚州的Causata公司正是一家致力于提供海量数据实时分析方案、让企业轻松管理大数据的客户体验管理(CXM)软件供应商。公司成立于2009年,总部在加利福尼亚州的圣马特奥。其基于Hadoop海量数据架构的预测分析和实时全渠道提案管理应用,能够让B2C(商家对顾客)公司借助数据,提供有价值的客户体验。Causata针对不同行业有不同的应用,这些应用可以帮助公司增加交叉销售、争取更多客户、减少客户流失。

以“利用数据创造个性化客户体验”为经营理念,Causata的目标是——在营销上,把实时数据转化为正确时机的数据;在分析上,利用大数据创造更好的数据;在管理上,信息不是力量,是潜力。Causata的数据分析应用是建立在平行大数据存储结构上的,这种结构可以有效分析数以万亿字节计的多样化、碎片化、多结构化的客户数据。

Causata大数据结构

Causata能将未结构化的和结构化的客户交互数据结合起来,组合成简单且结构化的客户记录,用于专业分析、预测建模和高级机器学习。这些数据通常来自于不同的数据来源和渠道。其数据的存储和分析流程如下:

利用HBase分布式存储系统存储数据

在最底层的结构层,Causata利用HBase分布式存储系统存储了一组巨大的碎片化事件数据。HBase分布式存储系统是一个高度可伸缩的数据库,是开源云存储的组成部分,利用HBase来存储每个个人客户的交互数据具有高效廉价的优点。

Causata储存来自各个数据频道的详细客户交互记录,比如一次网页点击,一项产品购买记录,一封邮件或一条微博。每个数据点都被记录为一组简单的关键字键值,称为一个事件。

举例来讲,一次网页点击记录可能包括网页链接、分类页、浏览器类型、语言设置和时间区域;一项产品购买记录包含的信息可能包括库存单位、品牌、价格、尺码和、颜色。Causata将这些凌乱的、多结构的事件数据转化成结构化的数据以供分析。有时这些结构化数据被称为“矩形数据”,因为每个客户记录都包括了同一组计算域。

使用HBase还有便于增加新的客户交互数据类型。Causata并没有一个传统的固定或关系数据模式。任何来源的数据均可以加载或流入Causata,数据的结构和信号提取在读取数据时才进行。

为了快速访问个人客户记录,数据会在Causata多个服务器间冗余存储。这样可以有效防止数据丢失,并且通过并行处理可以支持大容量数据检索和分析。

客户识别和事件-时间轴

Causata的大数据引擎中一个关键要素就是它的身份图(Identity Graph)。通过观察一起出现的标识符的模式,Causata建立了一个对应于个人的标识符图谱,将每个数据片段都映射到正确的客户上。随着客户数据的不断增加,这张图谱会越来越丰富。

比如说,如果一个客户在家里登录了他的网络账户,一个星期后,他在办公电脑上再次登录,那么两个信息都会连接到该客户上,并且两组网络活动数据会整合在同一个事件流中,让客户的档案更加丰富。

来自邮件、手机、社交网络和传统实体企业渠道的数据,通过信用卡、会员卡、账号、邮件地址、手机号码等标识符的比对,就可以很容易地整合在一起。标识图谱会实时对新的连接事件进行调整,使得在任何时候都可以及时提供关于客户的尽可能完整的信息。

此外,Causata通过组织和存储客户的交互数据,还形成了一条以事件为基础的客户时间轴。按照时间顺序保留详细的事件序列,允许分析员分析客户行为的起因和影响,并调查特定场景或做路径分析。

生成预测数据

事件流或客户时间轴对路径分析是十分有价值的,但对专业分析或统计建模就比较困难。Causata将客户的事件流和描述性属性提取成为一组预测变量或集合,计算出一个具体的时间表。

举例来讲,一般计算过去一个月内顾客的消费总额是将顾客在当月购买物品的金额进行加总。对于一些特定行业,比如金融服务、通信和数字媒体行业,Causata还会预先内置一些有用的特定变量,方便业务分析师管理和分析数据。

当读取客户数据时,Causata能根据需求利用其并行计算能力来计算这些变量。根据需求计算能够保证客户的档案总是最新的,并且考虑到了客户最近的活动。新的预测数据或变量只需几秒钟就可以定义好,并立即激活添加到客户档案中。

行为预测

Causata提供了内建的回归模型,以确定那些因果变量的准确度和预测能力。这些线性和逻辑回归模型能够让分析师和营销者快速地为他们的客户找到最有价值的变量来提供分析。

一旦建立了统计预测模型,分析师或建模员就可以通过Java API实时把模型导入Causata并按需执行,导入时间只需要几秒钟。每当客户档案被请求访问或更新时,Causata都会对任何可行的模型进行评估并得出模型分数,该模型分数会作为客户预测数据的其中一个参数。模型是在HBase服务器中并行执行的,模型分数的计算也与其他预测变量的计算相类似。

预测模型分数可用于数据查询。例如检索事件流、预测数据甚至是查询出具有大概率流失可能的客户名单;此外,也可用于实时决策,例如决定网页上显示的内容,或者营销员向客户提供最优匹配的销售方案。

数据查询

Causata检索数据一般通过客户层面或事件层面进行。

在客户层面,通过Causata SQL查询语言可以根据客户行为进行查询,对非结构化数据提出结构化问题。这些问题查询在数据库并行计算,并返回事件流、预测数据和模型分数。查询还可以是对特殊事件、模型变量和预测分数的组合。

举一个简单的查询例子,比如一个银行分析师,他可能会选择查询哪些客户在过去的一周中使用移动设备在线支付账单,也可能会选择查询哪些客户在过去90天中下载了一个宣传银行的电子邮件。返回的结果通常是一组结构化的记录,里面是所有满足查询条件的客户,这组记录集就可用于后续分析。通过允许分析师对大规模数据集的查询,Causata可以节省大量的时间,避免浪费在所谓的“数据争论”中。

分析师或营销员可以选择对所有满足特定标准的客户执行一项完整查询,也可以只检索一个样本以用于初步分析。Causata合理安排了这些客户数据,以保证所有这些数据都是无偏差的,而且可以用于可靠的分析,可结合Tableau、QlikView和 Excel等数据可视化工具来作进一步分析。

事件数据的查询也可以通过Hadoop工具来完成,如Hive、Cloudera Impala,这两种软件分别采用批处理和交互的方式来查询Causata的原始事件数据。这对查询那些非结构化的具体客户行为数据非常有用,但对传统的商业智慧宏观分段分析则没有什么价值。

CXM:个性化客户体验

Causata的客户体验管理(CXM)应用致力于应对现代B2C市场营销的挑战。基于Causata大数据结构的分析技术,CXM通过与客户在各种渠道的接触过程中,采集、识别和分析大量客户的在线和离线交互数据,实时确定合适的营销手段(如交叉销售,打折,促销,个性化等等)。通过个性化个体客户体验,Causata帮助营销人员和企业分析师实现了其主要业务目标,如增加收入、提高客户参与度、增加客户生命周期价值等。其主要技术手段包括:身份图(Identity Graph)、下一步行动预测(Next BesToffer)、机器学习(Machine Learning)和决策(Decisions)。

身份图(Identity Graph):以事件为基础的客户时间轴

在上文中,我们已经对Causata的身份图作过介绍,通过这个工具,企业可以识别不同的个体客户,整合他们的信息,并理解他们的意图。身份图通过Hadoop/HBase存储系统和预建数据适配器为通常的营销应用进行数据提取,每一组客户数据都被存储在一个具有关键值对的单独的记录中。其数据存储具有灵活、以事件为基础的特点,允许分散式的数据进行横向和纵向的连结,形成完整的信息结构。并且,在这里,客户的信息会相应地受到最大的隐私保护和安全对待。

下一步行动预测(Next BesToffer):进行客户细分并预测客户意图

Causata的“Next BestOffer”应用数十个预测模型包含的客户资料来进行客户细分和预测客户的意图。Causata认为,客户数据的价值在于预测客户的下一步行动。该技术利用了大数据结构中的“预测资料”以及“模型分数和行为预测”,对客户资料及时更新,而相关的线性和逻辑回归模型能够让分析师快速地为他们的客户找到最有价值的变量来提供分析,使企业可以清晰了解客户的意图和偏好。

机器学习(Machine Learning):建立更好的预测分析模型

Causata正在申请专利的“Machine Learning”算法利用在线强化学习技术,在客户做出决定的同时不断建立更好的实时动态预测分析模型。该技术不仅可以预测如何为个体客户提供最好的销售方案,还能预测一系列的营销方案以帮助客户生命周期价值最大化。

决策(Decisions):为每个客户创造个性化体验

Decisions确保在任意渠道中,都能在不到50毫秒的时间内预测客户的下一步行动,提供始终如一的优化客户体验。该功能使得营销人员可以大规模地进行跨渠道的一对一营销,思客户之所思,使用Decisions,营销人员可以方便地进行反复测试,跨渠道地为客户和细分市场找到最好的营销策略。

总结

Causata将数字渠道和传统渠道整合到一起,对各渠道的多结构化客户数据按照客户事件进行连接和储存;实时分析客户在多个渠道当前和以往的活动,在此基础上生成动态客户资料;使用预测分析和机器学习技术,指导工作人员采取下一步最佳行动,从而完善实时决策。

通过使用这些先进的技术,Causata可以更好地了解客户体验旅程,从而满足客户个性化的需求和喜好,同时根据分析的结果,提升客户体验,以取得更多商业成功。Causata在海量数据分析方面成绩斐然,引以为豪,加入NICE之后,后者在全球市场的地位将能够让更多的人使用到Causata的技术。

参考资料:http://www.causata.com/

猜你喜欢
结构化预测客户
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
为什么你总是被客户拒绝?
如何有效跟进客户?
不必预测未来,只需把握现在