忘大数掉据

2013-09-01 13:13郭嘉凯
软件和集成电路 2013年11期
关键词:用户企业

文 本刊记者 郭嘉凯

提到大数据,几乎每个IT服务商都会精神大振。因为,在他们看来,大数据背后所隐含的市场空间和机会无比巨大,而且,几乎涉及到IT产业链中的各个环节。这意味着,每个企业都能从大数据的普及中受益。不过,对于IT服务商而言,还有一个问题:谁能从大数据中获取最大的利益?要想在大数据市场获取最大的利益,首先要成为大数据市场的领导者。因此,在大数据市场仍处于起步期之时,占位就显得至关重要。

于是我们就看到了这样一种场景:几乎每个有实力的IT企业,都在积极推出大数据的相关产品、方案。每个企业都宣称,自己的大数据技术最先进。一时间,大数据领域新技术与新产品乱舞,新名词和新概念齐飞。

但令IT服务商尴尬的是:用户对此似乎并不买账。一个直观的体现是:大数据概念和技术虽然炒得十分火热,但真正在用户中落地的成功案例寥寥无几。

“现在的大数据概念和技术都太学术,坦白说我看不太懂,更别提怎么使用了。”在企业中和数据打了多年交道的殷钟说。殷钟曾在多家零售企业、电商企业供职,主要工作内容就是做企业消费者数据的收集、管理和分析。而在他之前的工作经历中,他也并没有用到过什么太先进的技术和产品,但他通过对数据进行分析,给多个企业的经营、决策提供了很多有价值的建议。虽然自称对大数据并不是十分了解,但凭借自己和数据打交道十多年的经历,殷钟说:“我认为,大数据是因为对它的分析使用,才产生和体现它的价值,而不是因为其用到了多么先进的技术和算法才体现了它的价值。”

何为大数据?

说起和数据打交道的历史,大朴网COO苏威坦言要追溯到2007年,那时他还在库巴网工作。库巴网成立于2006年,业务增长非常快,发展到第二年,已经明显感受到了来自数据的压力。“庞大的数据量怎么应对?”这是苏威当时经常思考的问题。

在公司成立之初,数据的处理和分析基本是靠人脑,由几个领导来对数据进行分析,然后给出决策。但当企业销售规模过亿元时,数据量也急剧增长,此时人脑已经跟不上了。特别是在2011年,库巴网的年销售额已经达到20个亿,一年有上千万个客户,SKU(指一款商品,每款都会制定一个SKU,便于电商品牌识别商品)达到十万个以上。此时的数据量已经十分庞大。

众所周知,3C类电商市场的竞争一直十分激烈,由此也带来了一系列的问题:

比如,通过低价促销一款商品,虽然带来了火爆的销售场面,但实际上的利润却寥寥无几。这也直接导致了商品的动销状况较差,大部分品类处于滞销状态。同时,由于对庞大的数据库没有进行系统的分类,更没有个性化的服务,消费者的弃单率较高,老会员复购率较低,会员的活跃度逐渐下降。

在看到这些问题后,库巴网决定通过引入数据分析,来帮助企业解决这些面临的问题。除了构建自身的数据库系统之外,库巴网还选择了百分点公司作为企业数据分析的服务商。

基于对库巴网所积累的大量消费者数据的分析,百分点公司为库巴网制定了整体的解决方案,通过“个性化商城推荐”产品,来解决3C行业的转化率、动销率和客单价等各项转化指标;同时,深度分析和挖掘老会员的兴趣和偏好,为库巴网量身定制了“个性化站内EDM”方案,保证每个会员都可以收到一封与众不同的email,在email上看到的商品都是符合其兴趣偏好的商品,由此逐步解决复购率和投资回报率(ROI)提升问题。

除了将数据应用在营销层面外,当时库巴网还想做一件事情:向上游渗透,做定制化的家电:让所有的家电品类,都能根据用户的需求实现定制化。这种模式对于消费者而言,无疑具有非常大的吸引力。而当时库巴网之所以有这样的想法,核心就是来自于消费者数据分析的支撑。

2012年8月,从库巴网离开的王治全、苏威等人创立了大朴网,这是国内第一家自主设计、生产,并以B2C为主要销售方式的家居品牌电商企业。

由于之前在库巴网尝到了数据分析所带来的甜头,在大朴网成立之初,数据就成为了管理团队最为重视的资源。“现在,数据应用已经贯穿大朴网运营的每个环节。”苏威说。

很多网站都有这样的困惑:企业为宣传自己的网站用尽各种途径,花大量的时间和金钱获得新的客户,但98%的第一次浏览网站的用户不会转化为客户。如果能够专门针对这部分人群,在不同的时间和网站,进行二次以上的追踪投放广告,不断提醒他们,并对这些来访过的人进行专门的促销(区别于网站常规的销售定价),就很有可能会带来好的销售转换 ——因为这些访客登陆过你的网站,这就表明他们对网站的产品已经表现出了很大的兴趣,就是企业的真正潜在客户。

因此,采用更为精准的营销策略,无疑可以更加高效地获取优质客户资源,避免广告投放的浪费。其中,使用“访客找回”技术,对消费者的网络动向进行追踪,就是非常好的一个手段。

“访客找回技术的核心就是数据,也就是曾经登陆过企业网站的消费者的数据。”苏威说。简单而言,“访客找回”技术可以通过在互联网上传播目标讯息,对每个访客实现利用最大化,把那些访客从别的网站上再带回到自己的网站上,发展成潜在销售甚至销售。

在找到客户后,如何吸引客户并提高客户购买转化率,也是企业所关注的重心之一。其中,十分关键的一点就是如何帮助客户找到他需要的产品。“这一点,对于电子商务企业尤为重要。”苏威分析说,“在实体店,客户可以一眼看到货架上的商品。但在电子商务网站,SKU数量庞大,消费者无法迅速看到所有的商品,因此,如何将消费者感兴趣的商品第一时间推荐给消费者,就成为决定消费者购买转化率高低的关键因素。”

一般企业传统的做法是根据商家自身的需求或者库存量来进行推荐,但这显然是不合理的,很难引起消费者的购买欲望。“现在,我们会根据用户的实际需求来进行商品推荐。比如,根据用户以往的购买历史记录,推荐其偏好的相关商品;或者基于用户的购买行为,推荐同类偏好用户在购买过该商品之后所购买的商品;或者根据用户的浏览历史,推荐符合用户偏好的热销商品等。”苏威说。

在如何留住客户,更好地为客户提供售后服务方面,数据也起到了重要的作用。大朴网把顾客进行了分类,针对不同的顾客,制定了不同的营销策略。比如,对新注册用户会发送一些体验券;对曾购买过商品的顾客,则会发送折扣券,来促进购买;而针对忠实顾客,则是给予新品的特别优惠政策,作为给这些忠实顾客的回报等等。

除了在顾客营销层面,数据还对大朴网的产品设计、生产有着重要的参考作用。“例如,我们通过对登陆网站消费者的数据进行分析,发现很多人在网站上搜索内衣关键词。通过对用户和市场的深度数据调查和定性分析,我们逐步增加了内衣的品类。”苏威举例说。

在大朴网上还有一款很特别的商品:带袖套的床上四件套。这款产品的产生,也和数据分析有着直接的关系。通过对网站消费者数据的分析,大朴网发现,有很多消费者在搜索带袖套的床上四件套,通过一系列的数据调研之后,大朴的设计师最终设计了这款产品,来满足消费者更个性化的需求。

苏威坦言,正是有了数据分析的支持,大朴网才能实现对上游供应链的快速反馈,从而生产出满足用户需求的产品。“以往,这一反馈过程可能需要一年以上,但现在只需要1~2个月就可以完成。”

通过苏威的介绍不难看出,数据分析已经根植于大朴网整个企业的各个流程之中,而且,数据对于大朴网的价值也是不言而喻的。“不夸张的说,我们有70%的订单增长都是由数据带来的。而且,顾客的二次购买率也在35%以上,这在电商企业中也是非常高的。”

“正是有了数据分析的支持,大朴网才能实现对上游供应链的快速反馈,从而生产出满足用户需求的产品。”

虽然数据意识已经深入骨髓,但在大朴网,却很少有人会提到大数据。“我们平时很少会刻意地强调大数据。事实上,在之前我连大数据这个概念都没听说过,只是最近两年大数据概念火起来后,我们才发现,其实我们做的很多东西就是大数据。只不过,我们的数据分析,是随着用户需求的变化、企业业务的发展而自然应用。”不过,苏威也坦言,即便现在,他对于大数据的概念也不是十分清晰,“究竟什么才是大数据?我经常看到一些专家给出的大数据定义,比如3个V(Volume、Velocity、Variety)。但如果按照这个定义来衡量,我们的数据似乎还算不上大数据?”

苏威的疑惑折射出一个问题:究竟该如何定义大数据?是不是只有符合3个V的才能称之为大数据?

在IBM新兴市场部大数据中心技术总监王晓梅看来,大数据并不意味着数据一定要大数据量,在现阶段而言,这个大字的侧重点应该是重要性,也就是对企业十分重要的数据。

SAP大中华区技术产品业务总经理陆大昕则认为,是不是大数据,关键是要看能否给企业带来价值,“只要数据能够给企业的业务、管理等方面带来帮助,产生了价值,那么我们认为就是大数据。”

“只要数据能够给企业的业务、管理等方面带来帮助,产业产生了价值,那么我们认为就是大数据。”

而在文思海辉技术有限公司CTO芮祥麟看来,大数据应该是在企业数据仓库之上的补充,让更多有价值的信息、数据能够为企业所用。

“目前整个业界对于大数据技术的讨论非常热,可以说是铺天盖地,对于这种时髦的技术现在定义非常乱,目前业界对大数据的定义基本都是基于4V,我个人认为大数据不是在于如何定义,最重要的是如何使用,因此我们最关注的是大数据的Value(价值)。艺术来源于生活,同样大数据不会凭空出现——大数据都是企业的各种业务数据的集合和升华。”华胜天成邮政事业部副总经理巫志辉如是说道。

可以看到,虽然每个人对于大数据的定义都有所不同,但是核心却基本一致:能够为企业带来价值的数据,就是大数据。

对此,北京百分点信息科技有限公司创始人苏萌认为,关于大数据概念、定义的炒作已经有些泛滥,这对大数据的落地应用肯定会形成阻碍。“应该停止概念炒作,回归到数据的本身,去探讨数据究竟能够帮助企业解决什么问题?或者说,帮助企业建立起用数据去指导决策、运营、管理的一种思维模式,这才是大数据的真正意义所在。”

芮祥麟也认为,在大数据领域,最大的问题是过分强调技术上的先进性、优越性,而很难讲清楚到底能给用户带来什么好处?

“目前国内大数据的现状基本都是为大数据而大数据,基本都是追求时髦的大数据技术而进行大数据项目建设,很多企业慢慢掉进技术为导向的怪圈。企业业务发展产生需求,需求影响技术发展和变更,因此建设大数据项目必须有明确的业务需求,换句话说就是用商业思维来推动大数据,只有这样大数据的价值才能充分体现。”巫志辉说。

中国惠普有限公司软件集团首席技术官魏喜勇则坦言,大数据一定是业务驱动的,技术是支撑手段,“但从另一方面,很多商业思维或商业应用也都是在有了数据之后才被驱动的,是依托于技术的创新的,技术也可以做到引领业务的变革。因此这是一个需要两方面相结合,并共同到达一个碰撞点的过程。简单的说就是既要有企业对业务的洞察力和创造力,同时也要有数据和技术手段的支持。”

其实,空谈大数据的概念和定义,没有太多的意义。也许,从现在开始,我们应该忘掉大数据的概念和各种所谓的先进技术,踏踏实实地去探寻概念和技术背后,数据的真正内涵和价值。

大数据如何落地?

国内一家大型啤酒企业的老总,曾向王晓梅问过这样一个问题:我知道大数据的重要性,但是却不知道如何开始去做大数据?这可能是很多企业在大数据应用时所遇到的最大难题:如何切入大数据?或者说从哪里入手,来应用大数据?

因小而美

一些企业在做大数据应用规划时,经常会有这样的想法:既然叫大数据,那么一定要做一个宏大的大数据应用平台,最好这个大数据平台能够解决企业所有的业务问题。

这样做的结果往往是,项目做到一半就难以为继,最后只能草草收场,不了了之。事实上,企业在切入大数据应用时,决不能贪大求全,而是要从小处入手。

这里所说的“小”,不是指数据量的大小,而是指具体的需求和应用目标。举个例子,对于一款数据应用,如果我的目的是分辨两种决策谁更好,差异在哪里,这是很具体的问题。但如果我的目标是想知道如何让公司赢利,这就是一个空泛的目标。相比之下,显然第一个目标更容易实现,也更容易见到效果。

王晓梅建议说,在大数据应用的起步阶段,要从小做起,而不是一开始就要做一个大而全的大数据平台,把无数大数据应用场景都放上去。“根据我们过去的实践经验,大而全的项目失败的可能性非常高。因此,我们通常会建议客户,最好是选择两三个月或三五个月能够完成、可控性比较强、比较小的项目作为切入点。”在王晓梅看来,这一点十分重要,“因为,在很多人脑袋里,对于大数据其实还是有一个大大的问号,在没有看到真正的投资回报时,他并不知道大数据对于企业而言是否是真正有效而且必要的,一旦项目失败或者见效比较慢,企业就会对大数据应用产生更大的怀疑。所以先期一两个起步项目的成功,是在企业和机构里,广泛全面地推动大数据落地一个非常重要的基石。”

寻找合适的业务场景

在确定从小处切入后,大数据落地的另一个重要点或者说难点就是找到合适的业务应用场景。这一点,对于大数据应用的最终效果也会产生非常大的影响。

专业调查公司Wikibon研究发现,46%的大数据投资者只能勉强维持着他们的投资项目,甚至有2%的企业完全失败了,所有投资尽付东流。而这些企业的大数据项目之所以失败,其中一个最大的原因是它们在投资大数据技术,比如Hadoop时,缺乏具体且可测量的相关商业应用。他们听说某个项目与大数据有关,便直接投钱进去,实际上它们根本不知道他们期望的目标是什么。也就是说,他们根本就没有找到合适的大数据应用业务场景。

“找到真正有代表性的行业业务场景,是大数据落地过程中最困难的事情之一。”芮祥麟说,“不能客户一表示想应用大数据,就马上把一大堆的大数据产品、解决方案塞过去,而是要和客户的业务部门一起,对客户所面临的问题和业务需求进行仔细深入地分析,看看什么是用户目前最迫切的需求,从哪里入手最容易产生效果,进而找到合适的应用场景”。

“在大数据应用的起步阶段,要从小做起,而不是一开始就要做一个大而全的大数据平台。”

对此,王晓梅也十分认同。在她看来,大数据落地的核心是由业务来驱动,而不同的行业,业务需求会有很大差别。因此,必须要针对每个行业的特点,找到有针对性的业务场景,“IBM去年在全球研究了600多个各种各样的业务场景,最终梳理出适合大数据应用的两大类行业业务场景:一类是跨行业的业务场景,适合于各个行业,例如数据探究、风险管理和反欺诈、流程优化等等,这类的需求每个企业都存在;还有一类是基于具体行业的,比如医疗、零售、银行等等行业,会有自己独特的业务需求,例如,零售业基于位置的精准客户营销等。这类的业务场景一般只适合某个具体的行业。”

作为全球领先的企业应用软件解决方案提供商,SAP在行业应用方面可以说积累了大量的经验。陆大昕认为,当前大数据落地的最大问题就是行业应用场景的识别,“这直接关系到数据是否能够变成企业的实际效益,而具体的应用场景,不同的行业有很大的差别。SAP凭借自身所积累的行业经验来为用户分析,大数据在企业中该如何应用、怎么落地,这是SAP的独特视角” 。

事实上,目前业内主要的大数据服务商,都已经开始进行大数据应用场景的研究,不过,这需要一个长期的积累过程。“如果大数据分析的结果可以成为企业CEO判断未来的依据,那么传统商业的预测逻辑就会被新的大数据预测所取代,但这个假设有赖于行业专家能够真正建立起可信的模型和深刻的行业见解,并利用恰当的技术手段形成一种可用的框架。如果企业自身不知道该如何分析,那么大数据的技术体系就不可能提供任何帮助。目前,比较成熟的方式还是商业公司对社交媒体的语义分析并用于商业决策,比如Social Data Services这种服务。这其实是Facebook数据分析模式的企业变种。更多的行业应用场景,有赖于各个行业专家的慢慢耕耘,这绝不是一个一蹴而就的市场。”甲骨文大中华区技术总经理喻思成分析说。

“如果大数据分析的结果可以成为企业CEO判断未来的依据,那么传统商业的预测逻辑就会被新的大数据预测所取代。”

在找到合适的切入点和业务场景后,大数据落地便进入了实际操作阶段。这时,企业又该注意哪些问题呢?

喻思成认为,大数据落地关键因素包括如何获取实时非结构化数据流、如何组织大数据并集成到数据中心、使用哪些技能和工具来分析大数据并提供实时的共享,从而进行更好更全面的业务决策等等。“企业不能只是将对其关键业务数据的管理作为唯一的重点,而是需要多类型的大数据与关键业务数据并重。企业必须将传统的关系数据库技术,与目前流行的大数据技术都作为主要的数据管理手段。”喻思成说。

对此,巫志辉则提出了以下几个建议:

1、做好企业非结构化数据的“数字化”。

经过长时间的信息化建设后,企业的结构化数据处理已经做得相对较成熟了,反观非结构化和半结构化数据则还处于半休眠和休眠状态,这些数据以往是被忽略的。首先,企业可以从这方面入手,运用业界成熟的技术和产品进行“数字化”,将此类数据激活,并将其纳入企业的整体数据中进行统一管控。

2、做好企业内部数据整合。

在开展大数据时,应先以内部数据为基础,逐步开展大数据应用工作。内部数据是企业所能获得的最成熟、最易于理解的数据,这些数据是通过企业IT规划、主数据管理、业务系统和其它渠道收集而来,需要对这些内部数据进行整合和标准化。然后,利用大数据分析技术解读这些来自客户交易、业务数据、事件、单据、电子邮件的内部数据等,进而为企业提供有价值的分析” 。

3、建立合理的长期规划。

大数据是一项持久的工程,往往不是一蹴而就的,是一个不断迭代的过程。好比建设完成ERP、CRM等业务系统以后,企业IT系统的建设仅仅是一个开始,未来随着业务的发展还会有更多的系统有待建设。对于大数据来讲是同样的原理,当内部数据得到充分的应用以后,目光就会转移到外部,这里还有大量的数据,特别是移动互联网、社交商务、微博和微信等,这些数据中仍然存在着大量的数据财富。这给企业的大数据建设带来更大的挑战,因此面对未来大数据的应用,作为企业,需要对大数据做好长期的规划,分步实施,只有这样才能让大数据的价值发挥得更大、更广。

4、培养一支专业队伍。

大数据建设的每个环节都需要依靠专业人员完成,因此,必须培养和造就一支懂指挥、懂技术、懂管理的大数据建设专业队伍,特别是大数据的分析人员尤为重要。

中国惠普有限公司软件集团首席技术官魏喜勇建议,企业要想成功应用大数据,首先要定义想要做什么,比如业务创新、精确营销、电子商务、视频分析等等,有些可能是以前想到但没法实现的,比如一些技术的障碍、知识的匮乏等,而这些现在随着大数据技术的出现,很多以前无法实现的或很困难实现的想法和业务模式,现在都可以进行,这应该就是大数据的切入点。

具体来讲,为了帮助企业找到和业务的最佳结合,一般可以从数据的规模、数据的联系、数据分析的实时性三方面考虑。

首先,要针对足够规模的数据,这样帮助企业从众多的数据中获取更有效的业务价值数据;

其次,明确数据的作用是什么,找出不同数据集之间的联系,才能真正制定出更有效的、更有针对性的业务战略,帮助企业提升竞争力;

最后,快速的获取信息,并形成业务策略的数据依据,是业务执行的保障。

魏喜勇举例说,在如今快节奏的世界中,能够随时掌握最新报道和业界发展动态,对于广播、媒体以及情报机构而言,可能是脱颖而出的关键所在。随着网络上的视频资料激增,以及大量频道每天在全球范围内进行直播,因此需要全天候监控掌握相关内容,而利用传统的手动方式收集这些资料的成本高昂、效率低下。

“企业要想成功应用大数据,首先要定义想要做什么,一般可以从数据的规模、数据的联系、数据分析的实时性三方面考虑。”

图 大数据在各行各业的应用场景

“惠普大数据解决方案中的广播媒体监控是新一代的监控技术,这一技术可以帮助客户在大规模的视频数据中,分析和掌握最新的报道,并快速地进行处理和应用,从而使在之前很困难实现的想法成为现实。”魏喜勇介绍说。

落地仍存挑战

虽然各个IT服务商对于大数据落地都有自己的解决方案和途径,但在实际应用中,我们仍能看到距离大数据真正落地,仍有很多挑战。

在魏喜勇看来,目前大数据在落地的过程中确实还存在着一些问题,如I/O处理速度等技术方面的挑战、大数据分析人才培养方面的挑战等等,“但最大挑战是来自于如何解决业务部门的业务需求和技术部门的技术实现之间的矛盾。技术部门希望业务部门可以首先提出大数据的具体分析需求,而业务部门往往希望技术部门针对数据提出分析建议,这对双方都是很大的挑战。协调好业务需求和技术实现之间的关系,才能使大数据真正为企业发挥作用。”

在芮祥麟看来,大数据在国内落地的最大挑战来自于实施咨询团队的缺乏,“国内缺乏很好的大数据实施咨询团队,而且,目前也没有太成熟的大数据落地方法论。当然,这是需要时间积累和沉淀的。”

巫志辉则认为,尽管大数据意味着大机遇,拥有巨大的应用价值,但同时也遭遇工程技术、管理政策、资金投入、人才培养等诸多领域的大挑战。只有解决这些基础性的挑战问题,才能充分利用这个大机遇,让大数据为企业、为社会充分发挥价值与贡献,“特别是在实时数据分析与实时业务响应方面,将会遇到很大的挑战” 。

巫志辉认为,企业的海量数据可能会成为企业的真正优势,为业务运营提供超越竞争对手的洞察力,但随之而来的问题就是数据处理的能力和速度。数据的运算速度会受到物理设备极限能力的限制,这意味着一个复杂的计算将无法实时完成,可能会持续几个小时,甚至几天。任何企业的目标都是希望获得一个真实的且实时的数据分析,因为大数据往往涉及了多年的历史管理数据,企业可以从中提高决策、加速性能,并提高生产力和效率。现阶段,企业自身也正在以惊人的速度发展业务。“企业越来越需要对影响他们业务的事件做出更快的反应。通过对数据的分析,企业能够找出提高其业务规划趋势和预测的模式,以减少在处理顾客需求和投诉方面的响应时间,同时,也可以及时向销售部门提供所需的信息。为实现企业缩短响应时间的目标,企业必须要在事件发生时做出实时的交易信息评估,基于实时数据进行动态的问题处理。”巫志辉说。

而在陆大昕看来,大数据落地最大挑战来自于用户在人才方面的储备不足,“很多企业还处于信息化初级阶段,企业刚刚明白信息化的重要性,好不容易上了ERP、又接着上了CRM,现在突然出现了大数据的浪潮,其实很多企业还没有为此准备好。大数据需要企业具备既懂IT技术、又对业务十分了解、还要精通数学的复合型人才,很多企业并没有这样的人才储备。”

数据服务商正在兴起

如果消费者已经光顾过你的网站,那么数据服务公司就能通过场景引擎技术,分析出用户的瞬时和长期消费偏好、阅读偏好,并综合分析他(她)的性别、年龄、婚姻状况、职业等人口统计学信息,构成一幅饱满而又生动的“用户画像”。

一旦这个消费者再次来到网站,网站还可以通过原先的画像,实时影响消费者的点击行为。消费者每刷新一个页面,网站都可以实时分析其即时购物偏好,推测出该消费者此时是否有明确的购买意向、处于购买中的哪个阶段、对什么样的产品有兴趣,而后结合网站的经营目标和业务特点,以及消费者的购买历史记录等信息,将最合适的商品展现在他面前。

假设一个用户已经购买了一款3000元的品牌手机,现在打算为家人挑选一款手机,他在网站上的行为运作过程将如表一所示。不难看出,推荐引擎会追踪用户的购物全过程,根据用户画像和零售行业经验,帮助其挑选商品。

这就是百分点公司正在做的一项事情:为消费者建立“用户画像”。那么,“用户画像”有什么价值呢?

在苏萌看来,“用户画像”对于很多企业而言,就像是指引企业实现精准营销的指路明灯,“考虑一下这样的场景:一个商场的洗衣机做促销活动,我们可以通过‘用户画像’,筛选出若干批符合这次活动的人群或会员。假设用户群A最符合本次活动,用户群B次之,用户群C最后。对A,商场发送频次不等的个性化短信;对B,发送个性化邮件;对C,则适当发送、投递宣传资料。对于A,导购会直接向他们介绍洗衣机活动,并提供一个不错的折扣;对于B,导购会详细介绍洗衣机和其他家电,刺激他们的需求;对于C,则可能任由他们在店内自由闲逛”。

不难看出,所谓的“用户画像”,就是通过对用户在网站上的信息和数据进行分析,了解用户的消费行为和偏好,并对用户的消费能力和价值进行准确评估,从而为企业提供决策支持。据苏萌介绍,目前百分点正在做消费者全网的“用户画像”,“通过对几百家网站消费者数据的整合和分析,全网的‘用户画像’可以更全面的了解消费者。对每个企业网站用户数据进行分析,看到的只是用户的一方面偏好,比如在凡客上看到的是用户购买衣服的偏好,在京东商城上看到的是用户购买电器的偏好,但全网的用户画像,则整合了几百家电子商务网站的数据,包括1号店、凡客、国美等等,可以了解到用户全网的购买行为和偏好”。

“‘用户画像’对于很多企业而言,就像是指引企业实现精准营销的指路明灯。”

如果真如苏萌所言,可以建立全网的“用户画像”,那么其应用空间无疑是十分广阔的。例如,国内一家知名银行的信用卡中心想全面了解其在线申请信用卡和贷款用户的特征,了解哪些用户的消费能力高并且信用好。传统做法是通过在线问卷和电话回访,评估用户的购买力和信用状况。不过,这些问卷中涉及的数据很少,而且很多可以造假,很难做出准确的评估;如果采用电话回访,代价又太高,不方便全面推行。

这时,全网的“用户画像”就可以派上用场:用户最近在衣、食、住、行、玩等各个方面的消费金额和消费频次,可以很客观地描述其购买力;用户经常访问的社区论坛、媒体网站,可以很全面地了解其社会属性,比如属于哪个社交圈子、生活品位等等。有了这些数据,银行可以对申请人做出更好判断,是否给其发信用卡,发什么类型的信用卡,透支额度多大;或是否为他提供贷款,贷款额度多大,贷款利率多少等等。

如果对苏萌所说的“用户画像”进行分析,就会发现,“用户画像”能否成功并产生价值的关键在于用户消费行为数据量的多少。数据量越多,对于用户的画像就会越精准。“这就是百分点作为独立的第三方大数据服务商的价值,我们通过为500多家电子商务提供服务,积累了大量的消费者行为数据。”苏萌说。不过,苏萌也坦言,在公司成立初期,这一数据的积累过程十分艰难,“我们用了两年多的时间,一点一点地进行数据的积累。”

在完成全网的“用户画像”之后,百分点接下来想要做的是大数据SaaS服务商。“我们希望通过SaaS服务的形式,让这种基于数据而得到的对用户的理解能力流动起来,使那些自己没有太多数据的企业,也能够从大数据中受益”。

在苏萌看来,如果数据不能流动的话,那么每个企业看到的是一个数据孤岛。大数据真正能够给社会带来价值,是在于数据能够流动起来,企业外部数据占的权重会越来越重要。苏萌以沃尔玛和宝洁之间数据交换和数据流动的故事为例,讲述了这种数据流动带来的好处:沃尔玛非常了解消费者在线下店里购买的行为;而宝洁非常了解对宝洁旗下的众多品牌,什么样的消费者会有什么样的偏好,两个企业通过数据的融合和贯通能够从不同的层面更好地了解消费者。苏萌还认为,相同行业数据的扩展是加法效应,而不同行业数据的扩展是乘法效应,“比如说沃尔玛和宝洁公司,以及汽车生产制造商和上下游企业数据共享,能让单个的企业对于消费者有更深刻、全面的洞察,能够通过数据来提高企业的运营效率。而百分点现在试图打造的就是一个集合各行业数据的分析平台,并通过这一平台,使各个行业的数据流动起来,产生更大的价值。”

百分点公司所做的事情,其实是大数据时代一个十分具有潜力的市场:专业的第三方数据服务商。“这是一个非常重要的发展方向,文思海辉公司十分看好这一市场,这也是我们公司正在积极投资的一个方向。”芮祥麟说。

表 “用户画像”应用说明表

事实上,这里面不仅市场空间巨大,而且也会引发很多行业原有商业模式的变革。以汽车行业为例,欧洲一家传统的汽车制造商,就正在向数据服务商转型。现在,这家汽车制造商所生产的汽车中,都会装配传感器。传感器能够收集两类信息:第一类信息是汽车内部的各种关键零部件信息,包括雨刷、引擎、安全气囊等等,在汽车运行过程中,相关的关键数据点都会收集起来。第二类信息是汽车外围的信息,汽车在行驶过程中,周围其它车辆的信息,以及其所处物理环境的关键信息等等,都会通过传感器收集起来。只要汽车在行驶的过程中,两类数据就会源源不断递送到相关的数据中心。之后,汽车制造商通过数据分析技术,对数据进行实时的分析。

有了数据分析,这家汽车制造商可以做很多事情。首先,可以为汽车驾驶员提供收费的增值服务,比如汽车驾驶员可以实时了解,最佳行驶路径是怎样的,哪条路有交通障碍或者出现了危险等。

更重要的是,在掌握了这些数据后,这家汽车制造商专门成立了数据分析部门。从2012年开始,已经把原始数据不断地进行精加工,包装成各种各样的数据产品,然后把这些数据产品销售给上下游企业,甚至卖给一些政府部门。

可以看到,通过数据,这家汽车制造商正在向数据服务商转变,这对于汽车制造行业所带来的冲击无疑是十分巨大的。

事实上,在几年之前,阿里巴巴就已经向世人展示了数据服务的潜力。2010年3月,阿里巴巴旗下的淘宝平台宣布,将面向全球首度开放数据。淘宝的数据开放一是对公众的免费信息,比如推出类似于宏观经济数据的“淘宝指数”。商家可以根据以往的销售信息和“淘宝指数”进行生产、库存决策。对于大众来说,淘宝的数据发布就像是统计局和价格监测机构的功能,淘宝指数相当于行业和宏观经济的各项指标。

作为针对企业数据开放的商用产品,淘宝推出了“数据魔方”产品,通过淘宝数据魔方平台,商家可以直接获取行业宏观情况、自己品牌的市场状况、消费者行为情况等,但是不能获得竞争对手的数据。2012年7月,阿里巴巴集团的“聚石塔”正式发布,其“数据分享平台”战略全面展开。“聚石塔”是阿里巴巴首次联合全集团大数据力量打造的一款大数据商用产品,为用户提供数据存储、数据计算两类服务。据阿里巴巴公布的信息显示,到2013年年初,短短几个月内,已有十多万的商家入驻“聚石塔”,数据服务的吸引力由此可见一斑。

未来,可以预见的是,随着数据的价值被更多企业认可,各个行业的专业数据服务商会大量出现,而他们也会成为推动大数据落地并普及的最重要力量之一。

“找到真正有代表性的行业业务场景,是大数据落地过程中最困难的事情之一。”

关于大数据的五大误区

1 大数据等于Hadoop

一提到大数据,很多人首先想到的就是Hadoop。Hadoop是一个能够对大量数据进行分布式处理的软件框架。在互联网行业,很多企业利用Hadoop进行大数据的存储和分析,因此,Hadoop也被很多企业认为是大数据时代最热门的技术。这一点,从最近两年国内外各大IT厂商纷纷拥抱Hadoop就可看出,Hadoop的流行程度。一时间,Hadoop似乎成了大数据的代名词。但事实果真如此吗?

“Hadoop绝不是大数据的唯一。在很多情况下,传统的数据仓库技术,同样能够处理大数据。”芮祥麟如是说道。

确实,企业中的数据,可以分为两类,一类是精确数据。精确数据是指每条数据都有着准确的含义和确定的价值,表达很明确的信息。比如,制造业的一条生产记录。传统关系型数据库以处理这类数据。并基于此类数据通过复杂逻辑分析推演出业务价值为强项。

另一类数据是模糊数据。这类数据,如果看单条数据,并没有确定的价值和明确的含义。比如,一个网页的点击记录。Hadoop的优势是能对海量模糊数据进行汇总排序比对等操作,把他们变成有意义的数据,再通过海量的样本比对等方式归纳产生业务价值。

而在处理精确数据时,Hadoop并不一定适合。“传统的数据仓库技术也可以满足用户的很多需求,所以企业在应用大数据时,要对自己的需求进行仔细分析,看看采用什么技术的投资回报率是最高的,而不是盲目的采用Hadoop。”

2 要应用大数据,必须要懂技术

一种观点认为:应用大数据,必须要对技术十分了解。但事实上,这是一个认识误区。因为从本质上来看,大数据并不是一个技术问题,而是由业务来驱动的。它代表的是一种商业思维:用数据分析来支撑决策。从这个角度而言,只要对业务有足够的了解,就可以应用大数据。至于技术问题,可以交给专业的IT服务商去解决。

3 数据越多越好

很多人认为,既然叫大数据,那么数据量当然是越大越好。但事实并非如此。数据量的多少,并不是衡量大数据的一个重要标准。“数据量多少并不是很重要,我们应该从以下两个方面来衡量数据:一是有价值的数据。对于企业而言,需要的是有价值的数据,没有价值的数据,即便是再大的量,对于企业也只是数据垃圾。二是数据是否能‘活’起来。数据必须使用,才能产生价值。只有不停地使用数据,挖掘数据背后的关系和价值,才能使数据之间的映射关系更加丰富和完善。”苏萌说。

4 不是所有的企业都需要大数据

最近,看到很多人发表言论,认为并非所有的企业都需要大数据。其实,这种说法仍然是将大数据视为是一种技术或是一个IT解决方案。但本质上,大数据代表的是一种处理问题的思维方式和技能,即从数据中去发现价值、挖掘价值的技能,以数据作为决策的依据,而不是拍脑袋来决定。从这个角度来说,其实所有的企业都需要大数据,即便是非常小的企业。因为我们已经进入一个数据无所不在的时代。

5 大数据可以搞定一切

还有一种观点认为,在应用大数据之后,企业就能高枕无忧。他们相信:大数据能够替他们制定战略并进行决策,这是一种十分危险的想法。因为,如果数据不完整、断章取义或者被破坏,系统可能会产生错误的决策,从而削弱企业的竞争力。所以,大数据虽然能够进行分析、预测,但它仍然只是一个工具,它可以帮助决策者缩小范围,让决策者能更精确地了解市场需求、用户喜好,但最终制定决策时,必须由人来完成。

虽然,在大数据落地方面,仍有很多挑战和误区,但我们也看到,国内已经有一些IT服务商,正在全力推动大数据在用户中的落地进程,而且,也已经有一些成功案例出现。为了对这些优秀的IT服务商进行鼓励,并让更多企业有所参考和借鉴,我们精心推出了“2013中国大数据应用风云榜”,希望通过这种评选表彰的方式来让更多的IT服务商,加入到推动大数据应用落地的队伍中,使用户能够真正体会到大数据应用所带来的价值。

2013中国大数据应用风云榜

2013年度大数据领袖企业

2013年度大数据突出表现企业

2013年度大数据行业最佳服务商

2013年度中国大数据应用最佳产品·最佳平台系统·最佳解决方案

猜你喜欢
用户企业
企业
企业
企业
企业
企业
敢为人先的企业——超惠投不动产
关注用户
关注用户
两新党建新媒体用户与全网新媒体用户之间有何差别
关注用户