本刊记者 | 石菲
↑“大数据”时代已经降临,它为我们看待世界提供了一种全新的方法
当人们在享受互联网时代所带来的种种便利时,大数据时代扑面而至。正如《纽约时报》的一篇专栏中所称,“大数据”时代已经降临,它为我们看待世界提供了一种全新的方法,在商业、经济及其他领域中,会有越来越多的决策是基于数据和分析做出,而并非基于经验和直觉。
在短短数年间,大数据在商业领域的应用已经到达了极致。那么,哪些行业可以从大数据中率先获利呢?
2014年,让我们来看看大数据的魅力。
零售业无疑是最先从大数据中获得好处的行业。
电子商务这种新业态出现以后,人类的商业组织第一次出现了全程可记录、可追溯的交易过程。通过电子商务,商家可以在任何时候、任何地点,看到所有有关信息,其中包括交易金额大小、交易的时间,以及客户的所在地、年龄、性别、职业等信息。这些信息能够让商家精确地知道他们的客户是谁、在哪里、正在做什么。而在电子商务产生之前,任何商家对其客户都不可能掌握这么多、这么全面的信息。
啤酒和尿布的故事出自沃尔玛,如今,这个故事早已经发展出新的一页。
2011年4月,沃尔玛以3亿美元高价并购了Kosmix,Kosmix不仅能搜集、分析网络上的大量资料给企业主,还能将这些资讯个人化,提供采购建议给终端消费者。这意味着,沃尔玛使用的大数据模式,已经从挖掘顾客需求发展到能够创造消费需求。Kosmix为沃尔玛打造的大数据系统被称做“社会基因组(Social Genome)”,连结到Twitter、Facebook等社交媒体。 工程师从每天热门消息中,推出与社会时事呼应的商品,创造消费需求。
作为世界最大的零售业巨人,沃尔玛在全球超过200万名员工,总共有110个超大型配送中心,每天处理的资料量超过10亿笔。沃尔玛本身就是一个巨量资料系统,适用各种商业上的分析行为。消费者在沃尔玛采购,可以从手机接收到一份建议清单,看似毫无关联却相当实用的推荐商品,可能是沃尔玛分析了上万笔销售纪录后,得到的宝贵成果。 同时,沃尔玛会记录每一笔顾客行为,设置在行动物流系统中,让全美各店都能分享大数据的情报资讯。
沃尔玛电子商务总监拉詹曼表示,“我们如果能透过社交网站的大数据分析,掌控消费者行为,我们就能以此重新定义消费的方式。”下一步,Kosmix还将通过收集每个顾客在全渠道,包括地面店、网店、移动商店、数字货架和主要的社交媒体(如Facebook、Twitter、微博、微信等)产生的碎片信息,借助云计算,拼出完整的全渠道顾客社交云图。
从多年的电力营销工作出发,电力营销稽查室管控电力营销风险的最直接有效的途径。电力营销稽查工作的开展可以使监控只能得到加强,从而在很大程度生预防电力营销风险的发生。但是需要注意的是,电力营销稽查必须形成常态化,只有常态化的稽查才能可持续有效的对一切风险进行分析,对各电力用户的情况进行排摸记录,从源头上防治电力用户的偷盗电费,降低电力营销风险,在最大程度保障了电力用户需求的同时最大化的保障了电力企业的经济效益。
再来看流行服饰零售代表Zara,你是否知道中南美洲的顾客偏爱颜色鲜艳、合身性感的服饰,而在法国和日本,顾客偏爱色系沉稳、剪裁利落的风格。借助大数据,Zara掀起了平价奢华风潮。
在柜台和店内各角落都装有摄影机,店经理随身带著Pad。当客人向店员反映“这个衣领图案很漂亮”、“我不喜欢口袋的拉链”,这些枝微末节都将由店员反馈给分店经理,经理透过Zara内部全球资讯网络,每天至少两次传递给总部设计人员,由总部作出决策后立刻传送到生产线,改变产品样式。关店后,销售人员结帐、盘点每天货品上下架情况,并对客人购买与退货率做出统计。再结合柜台现金资料,交易系统做出当日成交分析报告,分析当日产品热销排名,然后,数据直达Zara仓储系统。
搜集海量的顾客意见,以此做出生产销售决策,这样的作法大大降低了存货率。根据这些电话和电脑数据,Zara分析出相似的“区域流行”,在颜色、版型的生产中,做出最靠近客户需求的市场划分。
尽管癌症研究和治疗已经实现了巨大进步,但每年还是会新增1300万癌症确诊病例,还有800万人死于这种复杂的疾病。随着人口老龄化的加剧,全球癌症患病率到2030年可能会飙升到惊人的75%。癌症还将消耗约20%的医疗成本,给政府、医疗系统和患者都带来沉重的负担。如今的疾病诊疗模式通常都不够精确,而且都采用了一刀切的治疗方案。以往都是根据症状和发病位置治疗癌症的,这可能产生巨额费用,而且效果不佳,甚至适得其反。
研究人员认为,基因序列和云计算感知系统的发展,将在未来5年帮助医生精确地治疗癌症,为每个人定制治疗计划。更好的是,这套系统具备持续的学习能力,变得越来越聪明,因此无论是癌症,还是心脏病和中风,只要是与DNA有联系的疾病,其治疗效果都将逐步提升。
此外,医疗大数据领域还蕴含着巨大的机遇,利用基因方面的知识可以在血液型癌症的治疗上实现很好的效果,例如白血病和淋巴癌。关键问题在于,不仅要定制治疗方案,还要通过对无数治疗方案的分析,迅速找到平均效果最好的方案。一旦能够将目前的繁杂信息关联起来,并对其加以利用,便会实现重大突破。
保险立业之本是大数法则,而大数据将挑战大数法则,这是大数据时代的重要特征。
保险业分析师认为,大数据所带来的思维和技术变革,将提供创新的金融产品,也在加强各类金融基础信息保障能力。未来,保险业和互联网大数据将进行深度结合,一个历来以数据为生产资料,培训数据统计专业人才,以严格的数据和准则监管报批核准的金融行业和一个掌控海量咨询数据库的如空气般弥漫在每个人身边的新兴行业,其在思维中融合将带来颠覆性的变革。
企业战略转移为以小众为核心,服务小众赢得大众的口碑,小众具有差异化需求,微不足道和原本无暇顾及的小组织将使企业对客户的经营分解为对无数小众的经营,正是大数据使得金融企业对小众的服务成为可能,针对小众的信用与风险评估,使创新性业务得以开展。过去传统银行贷款业务无法覆盖小微企业,其根源就在于此。而逆袭金融业的阿里巴巴因此有了分一杯羹的资本,这是互联网特征的体现。互联网世界是草根的世界,最广泛的民众成为互联网的主要组成与活跃力量。服务小众意味着传统“二八法则”的概念不应成为企业的客户视角,价格将成为客户选择的敏感因素。行业竞争将首先在价格层面展开,当进入合理的低价格区域后,竞争将转向产品与服务的品质,企业这一客户视角转变的根本性将带来其他领域的变化。
2013年11月25日,众安保险联合阿里巴巴,推出首款互联网保险产品“众乐宝”。众乐宝的目标客户群是淘宝的900多万卖家,当买卖双方发生维权纠纷、卖家需要进行赔付时,众安保险可先垫付理赔款,事后再向卖家追款。“众乐宝”由互联网保险公司实现突破,而紧随其后的“乐业保”则由传统保险公司再下一城。11月26日,泰康人寿联合淘宝,推出针对互联网创业人群的乐业保。根植于泰康的传统保险产品设计思路,乐业保着眼于范围较大的风险,选择意外、医疗等主要保障,并设计了2款寿险保障产品,一是癌症及身故保障,每月缴纳10元保费,保障金额为10万元;二是误工保障,每月缴纳5元保费,如因病或意外住院而耽误了日常工作,每天可获得的补偿金额为50元。此外,乐业保也首次实现了寿险产品从设计、销售、到理赔的全程互联网化。
再看农业领域,有谁能想到猪肉和大数据的关系。新希望集团董事长刘永好提出,要把历年的数据集中起来,建立一个动态的养殖、生产和市场体系。通过大数据和云计算进行猪周期的预测,会发现猪的价格波动周期有一定的规律,大概3到5年是一个完整的周期,少的时候2年多,多的时候5年多,而这个周期又受国家的政策变化、天气变化、传染病变化、农民收入变化、原料价格变化等多重因素影响,同时又跟人们的生活水准和购买力有关系。全国所有养猪的农户,如果通过云计算、大数据对庞大的数据进行研究、分析、判断,研究出一个模型,建立信息系统,养猪会变得更加科学化。
其实,农业大数据可以渗透到耕地、播种、施肥、杀虫、收割、存储、育种、销售等各环节,是跨行业、跨专业、跨业务的数据分析与挖掘。
在娱乐行业也是如此,《纸牌屋》不仅在全美热播,还红到了太平洋彼岸的中国,但这并没有让制作方奈飞公司感到意外,因为该剧导演在喊“开机”之前就知道它一定会火,秘密在于大数据。奈飞数据科学家分析了用户每天超过3000万条播放记录,包括用户在何时、何地、何种设备上观看什么内容,并在记录暂停、倒退、快进、评分、搜索的同时,进行大量截图,试图分析用户在音量、画面色彩甚至场景选取上的喜好。奈飞公司分析了庞大的播放数据后发现,有相当数量的用户喜欢《社交网络》导演大卫.芬奇的作品,而著名影星凯文.斯佩西的电影和英国版《纸牌屋》都是点击率比较高的节目。因此奈飞公司决定把这些收视吸金点结合到一起,于是有了美剧《纸牌屋》。
与互联网公司的诸多实践相比,被认为具有数据资源先天优势的电信运营商却走在了后面,即便放眼全球,电信运营商的大数据应用案例也是屈指可数。日本最大的移动通信运营商NTT Docomo 2010年以前就开始着手大数据运用的规划,但其大数据发展至今还处于规划阶段,是因为NTT Docomo还没解决客户隐私问题。在德国,身为主流运营商的德国电信和Vodafone在利用大数据为自身业务服务之余,已向商业模式跨出了一步。主要尝试是通过开放API,向数据挖掘公司等合作方提供部分用户匿名地理位置数据,以掌握人群出行规律,有效地与一些LBS应用服务对接。
而我国运营商由于技术、数据系统限制、用户隐私和商业模式不明确等问题,目前大数据运营只处在探索阶段。但移动宽带和固网宽带快速发展、OTT的强势崛起决定了电信运营商必须充分利用自身掌握的数据资源,另辟蹊径,从而实现网络价值的最大化。因此,电信运营商应用大数据是必然的,而且市场前景十分广阔。
对此,IEEE会员,芝加哥洛约拉大学计算机科学系教授George Thiruvathukal对《中国信息化》表示,“有人提出,在大数据成为热点名词之前,类似金融、医疗保健以及保险业等行业的数据方式已经是大数据。如今,有很多厂商的大数据分析已经成型,比如围绕社交网站的数据分析。而跨行业大数据分析的实现,可能会催生出一批新兴公司,也会为现存的企业或组织带来新的机遇。行业泡沫不断产生,且随时有可能爆发。事实上,大数据的影响将会相当深远,但我倾向于从长远角度考虑,大数据将为绝大多数领域带来更高的效率,并提高现存企业的盈利能力。那些最富有的企业能负担得起自有基础设施与大型数据库(比如沃尔玛)的建设费用,并且很有可能从随之产生的规模效益中受益。”他说。潜移默化之中,大数据对每一个行业都在进行着渗透和影响。而在我们执着于大数据所产生的翻天覆地变化之时,还有很多问题值得注意。
对此,George Thiruvathukal提出了他的看法。首先,在数据收集阶段要注意分类,很多时候,数据的模式会在它们被查看并初步分类之后呈现出来。其次,在数据安全方面,George Thiruvathukal建议将数据匿名化(为了保护隐私),并对管理数据的员工进行严格的背景审查。这样的审查不能是一次性的,而应该包含随机的后续审查。因为许多数据中心或数据本身出现安全漏洞,都涉及内部人员与外部串通的情况。最后,对于大数据的法律监管,George Thiruvathukal说,“法律正在成形之中,但是大体上,对大数据问题的掌握不够深,使得法律不能发挥应有的影响效力。至少对美国最近的情况而言,其中一大挑战便是制定出一套让政府也可以遵守的法律。”
此外,伦理问题是大数据的主要挑战,比如体检数据会被多方所获取。包括医生、医院、药房、医疗服务提供商、雇、政府等都可以获得体检数据。而这些数据如果被用作商业用途,就必须权衡其中的伦理道德问题。“同样地,在数据方面必须有严格的信息公开法,数据的所有权归属于谁?数据应该如何被使用?除了医疗保健行业,实际上有更多其它的行业和机构拥有我们的数据,我们必须重视这个问题。” George Thiruvathukal表示。