大数据要玩好两招“鲜”

2013-04-29 00:44刘敏行
中国信息化 2013年16期
关键词:南丁格尔沃尔玛啤酒

刘敏行

大数据浪潮汹涌来袭,与互联网的发明一样,不仅仅是信息技术领域的革命,更是全球范围内加速企业创新,引导社会变革的利器。由此世界各国举措频频,在推动各行各业信息化加速的背景下,大数据产业呈现出前所未有的发展前景。

然而,大数据在我国,虽然学术与舆论界早已形成热潮,但具体到各行各业的应用,却有些雷声大、雨点小,或者有些舍本求末的感觉。一谈到大数据,众多人想到的是扩建数据中心(IDC),一提起大数据产业,各地想到的是规划圈地。

其实,大数据的本质是基于互联网和数据挖掘、数据可视化等技术,实现庞大数据的收集整理、信息的加工提炼,形成知识服务。毫无疑问,我们今天面对的是数据海洋、信息爆炸,数据的更加全面充分收集固然重要,但关键的是数据的分析和处理。由此,我认为,发展大数据产业,关键是要玩好两招“鲜”——充分用好数据挖掘和数据可视化技术,真正为各行各业提炼出新知。

所谓数据挖掘是指通过特定的计算机算法对大量的数据进行自动分析,从而解释数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。沃尔玛是全世界最大的零售商,拥有8400多家分店,200多万雇员;2012年收入突破4691.6亿美元,超过了很多国家的GDP总值。沃尔玛还是最早应用数据挖掘技术的企业。营销分析人员在一次例行的数据分析之后发现,跟尿布一起搭配卖的商品竟然是啤酒!经过跟踪调查,研究人员发现事出有因:一些年轻的爸爸经常要到超市去买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。这么有趣的、令人惊奇的结论,如果不是通过数据分析与处理,怎么能被挖掘出来呢?沃尔玛工作人员对这一现象做了合理性分析之后,决定将尿布和啤酒捆绑销售。这一举措大有成效,从此尿布和啤酒的销量双双上升。

大数据另一个值得关注的技术和应用是数据可视化。所谓数据可视化是指以图形、图像、地图、动画等更为生动、易为理解的方式来展现数据的大小,诠释数据之间的关系,以期更好的理解、适用数据分析的结果。“现代护理业之母”——英国人南丁格尔,通过对战场上伤亡情况数据的统计与分析,发现非战斗死亡(指受伤但未得到应有救治而死去)的人数远超战斗死亡人数,南丁格尔将她了解的一些数据向上报告,并未引起重视。后来她将这一统计结果制成一个图表发表到报纸上,该图表清晰反映了“战斗死亡”和“非战斗死亡”两种原因死亡人数的悬殊对比,强烈的视觉效果引起了英国社会的极大反响,最后直接促成了英国政府出台建立野战医院的决定,野战医院由此而来,也最终使得英国士兵死亡率大大下降。

由上述例子,笔者认为,发展大数据产业,关键是针对各行各业的特点情况,积极采用数据挖掘技术和数字可视化技术,在现有数据基础上提炼出新的知识来。关注大数据产业发展的各位信息技术主管(CIO),如能真正玩好这两招,可能比扩建IDC及规划圈地更有意义。

猜你喜欢
南丁格尔沃尔玛啤酒
No.2 沃尔玛第一季度总营收达1416亿美元
弗洛伦斯·南丁格尔
提灯天使:弗洛伦斯·南丁格尔
永川中医院闪靓的南丁格尔风景
——三朵“疫线”铿锵玫瑰
南丁格尔展
《啤酒》
哼哼猪买啤酒
沃尔玛、京东和1号店的那些事儿
阳朔啤酒鱼
把第一部iPhone 6丢进啤酒