张静成 王侃 王美琼、
摘要:大数据是一个体量特别大,数据类别特别多的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。而在互联网飞速发展的今天,大数据的应用已渗透到各个领域和行业。该文概述了大数据的概念和特征,互联网中大数据的应用以及互联网和大数据给传统行业带来的巨大变革。
关键词:大数据;互联网;应用行业
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)06-0255-02
互联网是一个互动的平台,并且可以互相沟通,互相交流。每天打开网络,扑面而来的不仅仅是各类信息也许是或正要发生的改变,人们无时无刻不被包围在这张无形的网中,成为人们日常生产和生活中不可缺少的一部分。短短几十来年的爆炸式发展,深刻改变了人们的工作、工作及生活方式,甚至影响了整个社会进程。而就在互联网在高速发展中前行时,大数据时代已悄然而至。
1 什么是大数据
大数据(big data)的概念是由美国硅图公司(SGI)的首席科学家John R.Masey于1998年提出的,大数据是一个数据集,是指在无法容许的时间范围内用常规软件工具对其内容进行捕捉、管理和处理的数据集合。最先提出“大数据时代”到来的是全球领先的咨询公司麦肯锡,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。
业界将大数据的特征归纳为四个“V”,第一,具有海量的数据规模(Volume),大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,多样的数据类型(Variety),在编码方式、数据格式、应用特点等方面存在的差异,多信息源并发形成了大量的异构数据,例如网络日志、视频、图片、地理位置信息等等;第三,价值密度低(Value),商业价值高;第四,快速的数据流转(Velocity),涉及到感知、传输、决策、控制开放式循环的大数据,对数据实时处理有着很高的要求,通过传统数据库查询模式得到的“当前结果”很可能已没有价值了,最后这一点也是和传统的数据挖掘技术存在着根本性的差异。
2 互联网中大数据的应用
麦肯锡称:“今天的数据,已经渗透到当今每个行业和业务功能区域,成为一个重要的生产要素。人们对于大量的数据挖掘和利用,预示着一个新的生产力增长和消费者剩余影响的到来。”大数据在物理、生物、环境、生态学等领域以及军事、金融、通信等行业存在已有一定时间,近年来,互联网和信息产业的发展已引起了人们的关注。互联网行业的大数据是指这样一种现象:互联网公司在日常运营中形成的积累用户网络行为数据,其特点是海量的数据规模、多样的数据类型、价值密度较低、快速的数据流转及时效性要求高。毫无疑问,大数据将加速推动互联网的发展。大数据能提供宏观经济分析服务,能有效地支持信息消费,大数据的应用也体现在我们的生活之中。中国互联网协会理事长邬贺铨在河南省首届互联网大会主题演讲中指出“随着互联网的快速发展产生大数据,大数据反过来加速推动互联网各种各样应用的演进。在可预见的将来,通过对大数据的全面挖掘将产生更多新的应用,将促使产生更多的新业态,将给我们带来更多的便利和惊喜。”
2.1 网络广告个性推送
很多人讨厌广告的原因,在于它推送的是对你无用的信息。互联网的出现更是放大了这一特点,而如今人们发现自己搜索过的或者买过的商品都能被针对性的推荐,出现在浏览的网页广告中。这便是随着信息数量的持续增加,大数据的到来,在这些数据中,隐藏了消费者的消费习惯、市场的变化、产品的趋势以及大量的历史记录,这些关键数据对于企业和组织的后续运营和发展起到了至关重要的作用。更准确的营销手段已经成为了一种广告工具,这种个性化的广告推广,主要是为了缩小范围来针对某一类人群。美国亚马逊的推荐系统就是一个很好的例子,亚马逊收集了大量来自每个客户的数据,如曾经购买了的哪些商品,以及哪些商品只是浏览而没有购买,浏览时停留了多久,还有哪些商品是合并在一起购买的,利用大数据分析准确判断出客户的兴趣爱好、购买意愿,通过它寻找到产品之间的相关性,并以此来推荐关联性最高的产品给客户。亚马逊的最终期望是达到最成功的推荐应该只有一样,那就是用户要买的下一样产品。
而“京东+腾讯”这样的“电商+社交”的合作在全球尚未有先例,目前在国内第一次尝试打通。前不久,京东和腾讯签订了“京腾计划”,所谓的“京腾计划”指的是京东和腾讯将基于各自最强资源和产品建设名为“品商”的创新模式生意平台,旨在为品牌商提供一套有效的品牌建设、提高营销效果和客户体验的完整的解决方案,基于腾讯的社交行为数据和京东的购物行为数据,才能对用户的喜好做出精准判断,为品牌商提供精准的目标消费群体画像和多维的联系接触渠道,帮助品牌商实现精准营销,精准投放广告。
2.2 网络安全
大数据已经与我们的生活息息相关。微博的社交关系,淘宝的购物记录,GPS导航的移动数据,快递的物流信息……这些形形色色的数据包括了人们的各种行为细节,同时也记录了人们大量的个人隐私。不难看出,大数据时代的到来,给传统的网络与信息安全带来了新的问题,传统防御威胁的手段已逐渐失效。大数据将安全带入了一个全新、复杂和综合的时代,不安全的那些蛛丝马迹在浩瀚数据的掩护下,正在精准地发起一次又一次的攻击。近年来,有关网络威胁导致服务器宕机、个人和企业信息泄露事件频繁发生,网络信息安全问题已成为全球关注的焦点。然而,任何事物都具有两面性,人们常常担心大数据带来的不安全性,但同时大数据技术也是一种保户信息安全的工具。
对于互联网,利用传统安全设备从终端数据或本地网络中发现未知的威胁,就如在森林中找到指定的叶子,效率极低。从技术、人员、数据等几个方面拥抱大数据技术,基于数据为驱动来解决问题。在数据采集、测试、分析的过程中以威胁为中心,利用数据来驱动安全是一种检测APT类型威胁(高级持续性威胁)的有效手段。
3 互联网与大数据颠覆传统行业
如在教育行业,教师可以利用大数据技术和智能算法对每位学生的学习情况进行分析,依据学生在作业中反映出来的薄弱知识点,定向推送学习内容和测试题目,有效提升学习效率。在高考志愿填報和录取环节,让互联网大数据为考生提供帮助,根据分数、兴趣、专长选上自己心仪的大学和专业,大大减少了志愿撞车,这在过去几乎无法想象。其背后揭示的趋势更令人兴奋,技术不仅在弥合知识鸿沟,技术背后的“隐力量”正在逐渐打破信息的不对称,推动教育公平。而且,随着用户的激增,大数据的运算技术将被进一步开发,未来借助智能化的大数据运算技术,学习内容将会“靶标式”推送,只针对个人,而不针对多人,一直以来教育所追求的“因材施教”将会完全实现,那么这将彻底改变传统的学习模式。同时,建立大数据心理模型,对学生进行个性化的发展及长远规划,将单一的以成绩为主导的教育转变为对个性的全面认可与挖掘,从单一走向多元。
又如电视剧《纸牌屋》的大获成功更是让全球影视界对大数据的应用刮目相看。美国视频网站NetFlix收集数据如观众在视频观看过程中的每一次暂停、快进,或是对这个视频的评论,基于大数据投资拍摄的这部电视剧,无论是剧情设置还是选择演员、导演阵容,都以用户在网站上的行为和使用数据做支撑,从而受到观众热捧,NetFlix也凭借该剧名利双收。这些由观众在不经意间产生的“数据”,正成为影视业提取数据的一个方式。而正是这些数据,影响着影视剧从前期拍摄到后期营销的全产业链。
互联网与大数据的价值最好的体现在对已有行业潜力的再次挖掘,而不仅在于自身能生产多少新东西,用互联网思维和大数据思维去重新提升传统行业,使得信息透明化、对称化,对产生的大数据进行整合利用,也使得资源得到最大化利用。
参考文献:
[1] 官建文, 刘振兴, 刘扬. 国内外主要互联网公司大数据布局与应用比较研究[J]. 中国传媒科技, 2012(17): 45-49.
[2] 杨秀萍. 大数据在互联网金融风控中的应用研究[J]. 电子世界, 2014(17): 12-13.
[3] 刘渊. 大数据时代:互联网广告的创新营销模式探讨——以原生广告为例[J]. 消费导刊, 2014(7): 154-154.