秦嫣
“大数据”这个概念,好像在2013年至2014年的时候,作为一个互联网概念火过,后来也逐渐淡出了创业圈、投资圈和大众的视野。
事实上,“大数据”并非什么概念,数据是特别真实和客观存在的一种事物,由来已久,只不过,因为互联网对数据的传递、集成的速度,不断地加快,所以有很多互联网公司所拥有的数据量级,看起来比一般传统企业要大得多,不知道是不是这个原因,“大数据”成了一个互联网概念。
那究竟什么是“大数据”,它又会给我们的生活带来什么影响呢?不如我们用一个流传在网上的段子来解释一下,可能会比较容易理解。
一家比萨店,外卖电话响了,店长拿起电话。
店长:××比萨店。您好,请问有什么需要我为您服务?
顾客:你好,我想要一份比萨。
店长:请问您是陈先生吗?
顾客:你怎么知道我姓陈?
店长:陈先生,因为我们的CRM(客户关系管理)系统对接了三大通讯服务商,看到您的来电号码,我就知道您贵姓了。
顾客:哦,那我想要一份海鲜至尊比萨。
店长:陈先生,海鲜比萨不适合您,建议您另选一份。
顾客:为什么?
店长:根据您的医疗记录,您的血尿酸值偏高,有痛风的症状,建议您不要食用高嘌呤的食物。您可以试试我们店最经典的田园蔬菜比萨,低脂、健康,符合您現阶段的饮食要求。
顾客:你怎么知道我会喜欢这种比萨?
店长:您上周在一家网上书店买了一本《低脂健康食谱》,其中就有这款比萨的菜谱。
顾客:那好吧。我要一个家庭特大号比萨,多少钱?
店长:99元。这个足够您一家六口吃了。但您的母亲应该少吃,她上个月刚做了心脏搭桥手术,还处于恢复期。
顾客:好的,知道了。我可以刷卡吗?
店长:抱歉,陈先生。请您付现吧,因为您的信用卡已经刷爆了,您现在还欠银行5000元,而且还不包括住房贷款利息。
顾客:那我先去附近的提款机取现金。
店长:陈先生,根据银行记录,您今天已经超过了日提款限额。
顾客:算了,那你们直接把比萨送到我家里吧,家里有现金,你们多久能送到?
店长:大约30分钟。如果您不想等,可以自己来取。
顾客:为什么?
店长:我这边看到您家的地址是解放路东段22号,距离我们店开车只有5分钟路程,您名下登记有一辆车号为×××××××的轿车,这辆车目前正在距离您家不到两分钟车程的地方。如果您等不及,可以回家拿了现金就开车来店里取,这大概要花您10分钟的时间,正好是一个比萨出炉的时间。这样,您总共只需花15至20分钟就可以将比萨拿回家,比我们送货上门要快。
顾客差点儿晕倒。
这就是所谓的“大数据”,一家比萨店,因为把自身的CRM系统和各种网络数据进行了对接,变得仿佛无所不知、无所不晓,而对那个顾客来说,从上到下、由里到外,所有的信息都被整张网络全部掌握,还被商家进行了有效的利用。这就是大数据。
其实,数据这个东西一直都在,在上面这个例子中,大家不难看到,无论是电话号码、地址、家庭成员、医疗记录,还是信用卡消费记录、银行提款记录,这些数据信息一直围绕在我们的周围,一直都存在于我们的生活里。只不过,以前,因为没有方便快捷的工具,这些数据可能没有被完整地记录下来,或者记录下来之后都被孤立地锁在了仓库里,不但没有被有效地利用,而且还很难被准确地找到。互联网信息技术让这些数据的记录、集成、互通都可以在一瞬间完成,所以数据变得前所未有的大而全,并且衍生出各种各样的应用方式。
数据的应用目的是提升供需两者之间的匹配效率,在面向供应链侧,数据应用的主要作用是为不同的生产单元找到成本、效率最合适的匹配关系;而在面对普通用户、普通消费者时,数据的主要应用场景,还是营销。
上面这个例子,比萨店的店长,在一系列完整的用户数据的支持下,所做的就是一次完美的精准营销(虽然这个例子的营销是被动式的),通过数据实现了比萨和用户真实需求之间快速、良好的匹配。当然,我们这里说的营销是指广义上的营销,可以理解为,不惜使用各种方法把合适的东西卖给合适的人。例子中提醒顾客的身体状况以及家人的身体状况,这可以理解为增值服务,是有效的营销手段之一,是提升卖货转化率以及提升普通顾客到长期用户的转化手段之一。同样,例子中提到因为顾客的银行记录,建议使用现金,这是避免销售风险的有效措施,这虽然是风控,但也可以理解为整体营销策略的一部分。
作为平台,对数据最直接、最有效的应用方式,也是营销。平台希望的是长久地留住海量的消费者,希望这些消费者能持续不断地贡献成交量。平台通过营销要实现的是持久的有活力的消费行为,需要为所有的消费者构建一个轻松、自在、简单、便捷的购物环境。于是,在浏览,也就是“怎么让消费者找到想要买的东西”这件事上,几乎所有的电商平台,都要解决这样一个问题:“猜你喜欢。”
双11的天猫也不例外,并且,当参与双11的品类越来越多,商品种类和规模越来越大,在消费路径上,内置一层精准度越来越高的“猜你喜欢”,也就变得越来越有必要了。
对普通消费者来说,“猜你喜欢”很容易被理解成,我需要买一个东西,除了输入关键词打开搜索列表之外,可能还有一个叫“猜你喜欢”或者类似称呼的入口,点进去之后展现出来的都是和我的喜好比较接近的东西。但实际上,对于平台来说,“猜你喜欢”不是一个入口、一个页面,也不是一个数据产品,一种数据模型,而是在消费者应用侧的一种数据要素。什么意思?什么是消费者应用侧,什么是数据要素?消费者应用侧的意思是,只要是面向消费者的,或者有消费者以重要角色参与其中的应用场景都应包含其中;数据要素是指,只要包含数据的计算和使用,就必须涉及或者使用某个元素。说得具体一点儿也就是,像搜索结果排序、广告展现概率、活动页面坑位的分布和排序,等等,这些展现在消费者眼前等待他们去挑选商品的场景,无论商品分布所参考的主要数据元素是什么,“猜你喜欢”都必然是其中必不可少的一项。
对传统零售,尤其是超市这种零售业态来说,货架的摆放是一门很有讲究的学问,合理的摆放对消费者的购物欲望有着很好的带动作用。我们都知道的宜家,除了场景式体验之外,常常被人称道的另外一点就是:它的货架摆放为消费者勾画出了一条既能带动购物欲望,又有不错购物体验的行走路径。这种货架摆放设计也是一种“猜你喜欢”,只不过对传统零售来说,把更多的消费者吸引进来已是相当不易,所以路径足够长,就能让消费者在已有空间内停留足够长的时间,以确保所有的品类都能被到达,这成了货架摆放设计最重要的事情。另外,传统零售无法照顾到入场消费者作为每个个体的喜好,只能基于大众的消费心理,把成本小、复购率高的快消品放在最惹眼的位置上,以提升整体的动销率。
相对传统零售,电商最不一样的就是它的开放性,每一个消费者前一秒钟还开着A站点的网页,下一秒钟有可能已经转战到B站点了,两者之间不需要什么过渡,甚至不需要成本。所以,对于电商平台来说,留住用户的最佳办法并不是强制消费者的停留时间,而是帮他们更加快速便捷地找到自己喜欢的东西。“猜你喜欢”可以让整个平台的匹配效率得以提升。
我们在这里所说的“效率”,可能比较接近这么一个术语:一种现有的技术匹配方式能带来的交易效益增长的情况。特别是那些能让交易的双方在交易中获得更多收益的技术匹配方式,将会获得更多的成长机会和空间。我们所讲的平台交易效益可以从两个角度来理解:一个是每一件商品和它的潜在消费者之间的匹配速率;另一个则是能够匹配到潜在消费者的商品量和商品类型在整个平台的商品当中的覆盖面积,或者反过来说,平台通过分发商品能够满足的消费者的绝对数量以及类型。
据不完全统计,2015年双11参与打折的商品超过10万件,那么多商品如果按照千篇一律的方式展现在每一位消费者面前,或者只能通过消费者主动的搜索才能依据需求展现出区别的话,10万件商品想要全部得以展现,得需要多少时间?双11当天的24小时肯定是不够的,把7个双11的时间加起来,也恐怕还是不够。当我们把“猜你喜欢”作为一个数据要素,放到展现端,在每一次供需匹配的过程中都做一次消费者喜好关联度的匹配,10万件商品就无疑会被打得更散,在天猫将近两亿的买家面前分布得更开更广,商品和潜在买家得以找到对方的概率也就更大,这就是从第二个角度来理解的平台交易效益的提升。
其实,不仅是在电商领域,在其他领域也一样,只要最终需要落地到面对普通大众的场景中,数据需要解决的首要问题,都是“猜你喜欢”。在我目前所从事的文化内容行业里,有不少人对数据仍然抱着嫌弃和鄙夷的态度,他们认为,至少在这个行业里,数据只能成为“马后炮”,在事后总结当中为“嘴炮”们提供佐证。可是,照样有一些浅显的数据实例可以证明,在“猜你喜欢”这一方面,数据是有用的。比如,广东省的电影院线,粤语电影的上映频率最高,票房成绩最好;像《战狼》这样的电影,北方院线的表现要明显好过于东南沿海地区;而上海永远是进口大片表现最好的地方。这样的数据难道不能为电影的发行和院线的排片做出指引吗?
“猜你喜欢”其实就是精准营销。在传统快消品行业,市场营销中有一项重要的工作叫作消费者心理洞察,在没有互联网的时代,需要先做大量的问卷调研和线下观测、数据搜集工作。和传统零售、传统市场营销工作一样,未来的互联网只会变得越来越拥挤,接触消费者的机会,即互联网所謂的流量,来之不易,流量在变贵的时候,如何把流量尽可能地转变为现实成交,这就是精准营销的任务,也是精准营销越来越重要的原因。