魏坚
摘要:现在很多行业对多项数据的分析是企业取得成功的一个强有力的支撑条件,如李克强总理在谈到大数据分析时不断的强调,经济数据和目标的进一步调整,中小企业将面临更大的压力,互联网金融除了解决便利性问题外,更重要的是如何围绕特有的大数据资源展开对实体经济的服务。
关键词:大数据;数据的特征;分析运用
笔者最近看了一部好莱坞的励志电影《点球成金》,是由布拉德·皮特主演的一部美国奥斯卡获奖影片,所讲述的是皮特扮演的棒球队总经理利用计算机数据分析,对球队进行了翻天覆地的改造,让一家不起眼的小球队能够取得巨大的成功。在片中布拉德·皮特基于历史数据,利用数据建模定量分析不同球员特点,合理搭配,重新组队,并且打破传统思维,通过分析比赛数据,寻找“性价比”最高球员,运用数据取得成功。
那么什么是大数据呢?对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在现在的信息成爆炸式的增长下,面对海量的数据,给我们带来了思维上的革新:更多,更杂,更好。而大数据的4V特征更是值得我们去研究会。
第一,Volume 是对大数据在于数据结构上面的一个简单的总结,它简单的阐述了数据的单位换算和数据的不同结构,不同于传统的数据结构,在现在的信息中,非结构数据的规模和增长速度远远超出了我们的预料,几乎占据了总量的80%-90%,而且比结构化的数据增长量快10-15倍。
第二,Variety 这一块体现了大数据的不同的数据结构以及其多样性,很多不同的形式,比如图片,音频和其它复杂的形式,在大数据中,很多的结构是无序或没有其固定的格式也没有固定的语法和语义其模式也不明显。
第三,Value 在信息爆炸的时代,大量无关的信息充斥着我们的互联网,如何从这些信息当中剥离出有用的信息,就成了我们大数据要面对的问题,也因此出现了对于未来趋势和可预测性分析的各种方法,如人工智能,搜索引擎和各种可行性算法。在这里,我们必须认识到,大数据分析不仅仅是一种技术,而是要产生生产价值,对于在大数据里去挖掘有用的信息,就好比在深海里去淘金,从海量数据中挖掘稀疏但珍贵的信息,价值的密度很低,也是大数据的一个重要的特征。
第四,Variety 主要是大数据的来源和处理的方式方法,对于大数据的来源,我们一般从互联网,物联网和企业的内外部去获取,那么获取后的数据如何去处理呢,在信息急速更迭的时代,我们在处理数据的时候一定要实时分析而不是批量式,要讲究立竿见影的效果而不是事后诸葛亮,对于分析的数据要采取输入,处理和丢弃,而且数据之间频繁交互,比如游客在旅行途中上传的图片和日志,就与游客的位置、行程等信息有了很强的关联性。
越来越多的行业已经认识到大数据的商业价值,像银行这类的金融机构在对贷款、保险、发卡等多业务线数据集成分析、市场评估,新产品风险评估,股票等投资组合趋势分析,来增加其市场份额,并且在一定程度上提高了客户的忠诚度,既提高了银行的整体收入,也降低了风险。对于零售产业,可以在基于用户的地理位置信息进行精准营销,通过用户的网络社交习惯进行购买行为的分析,这样既促进了用户的购买热情,也极大的顺应了用户的购买习惯,如某家商店是专门卖牛奶的,通过对用户的购买行为分析得出在本店购买牛奶后又到了另外一家包子店去购买包子,且人数还不少,那么这家店铺就可以考虑和包子铺进行合作或者在店里增加卖包子的这个业务,使其利润最大化。
企业在进行大数据分析架构时一般会采用以下几个步骤:第一,在当前的数据里更加深挖并分析当前数据。第二,针对数据的多样性和数据量进行结构化分析。第三,提高数据分析的速度。第四,保持现有的地位并发现新的模式。在这里美国的亚马逊和塔吉特率先利用大数据来提高自身的竞争力,《纽约时报》的一篇报道曾引爆了整个美国:一天,一位美国父亲气势汹汹的冲进了塔吉特的卖场,并大声质问塔吉特的工作人员,为什么往她女儿的邮箱里发送带有婴儿用品的优惠券,而他的女儿才读高中,这让他怒不可揭。
然而经过几天后,他父亲认识到他女儿真的怀孕了,因为他女儿在互联网的搜索引擎上搜索的关键词以及在社交网络上的种种迹象和行为的轨迹,使得沃尔玛捕捉到了她怀孕的信息。在沃尔玛的数据分析模型里,许多孕妇在第2个妊娠期的开始会买许多大包装的无香味护手霜;在怀孕的最初20周大量购买补充钙、镁、锌的善存片之类的保健品。然后塔吉特经过25种的数据化模型分析在消费指数里建立了一个“怀孕指数分析”,通过这个指数的,塔吉特就会通过邮件和电话短信的方式给她们发送指定的优惠券。
与塔吉特相比,亚马逊在大数据分析上更加先进一布,亚马逊 有一种“预测式发货”的新专利,他们通过对用户购买习惯和行为的数据的分析,可以在他们还没有下单购物前,提前发出包裹。这项技术可以缩短发货时间,从而降低消费者前往实体店的冲动。因为亚马逊的大量数据表明,如果在网上购物的时候从下单到收货之间的时间拖延的话可能会降低人们的购物意愿,导致他们放弃网上购物。所以亚马逊根据自己的大数据模型分析,来了解和解析之前的订单状况,追踪用户的购物习惯,从而在他们提前下单前将包裹寄出,根据该专利文件,虽然包裹会提前从亚马逊发出,但在用户正式下单前,这些包裹仍会暂存在快递公司的转运中心或卡车里。而亚马逊的分析依据就是可能会参考之前的订单、商品搜索记录、愿望清单、购物车,甚至包括用户的鼠标在某件商品上悬停的时间。
大数据正在改变我们的生活,它将所有依赖信息不对称盈利的业务都将消失。也在颠覆一些传统的行业,带来一场信息化的革命,正如一些专家所说:“大数据对政府、金融机构、企业来说,象空气一样不可或缺”。(作者单位:湖北省黄冈师范学院商学院)
参考文献:
[1][美]伊恩·艾瑞斯(Ian Ayres) 著;宫相真 译
[2]][美]伊森(Jean Paul Isson),哈里奥特(Jesse S.Harriott) 著;漆晨曦,刘斌 译
[3][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶 著;盛杨燕,周涛 译