大数据时代带来的“数据财富”

2013-01-30 14:01李菲
浙江经济 2013年17期
关键词:维克托

文/李菲

浩瀚的数据是新的生产要素,已成为一种继自然资源和人力资源之后的重要战略资源。我们必须拥有一种新型能力:通过对海量数据的分析,获得有巨大价值的产品和服务

“大数据”无疑是当下的最热门话题之一,掘金大数据的“寻宝游戏”正在全球上演。由英国维克托·迈尔-舍恩伯格和肯尼思·库克耶所著、浙江人民出版社出版发行的《大数据时代》中译本,于2013年1月和英文原版同步面世,再次引爆了国内业界对“大数据”的广泛讨论。维克托被誉为“大数据时代的预言家”,他在该书中高屋建瓴地提出:大数据开启了一次重大的时代转型。那么,什么是大数据,它具有哪些特征?在大数据时代,我们的思维模式将经历哪些变革?挖掘和利用大数据将对我们的生活、工作方式产生怎样的影响?应对大数据的汹涌来袭,我们应该怎样建立规范自身的新准则?《大数据时代》一书以宏大的视野、掷地有声的观点和丰富翔实的例子,回答了这些问题。

大数据时代已悄然到来

联合国于2009年正式启动了“全球脉动”倡议项目,拉开了大数据促发展的序幕。与此同时,世界各国政府都逐渐意识到大数据的作用,着手研究大数据发展战略,并开始有益的尝试。最引人注目的是美国政府于2012年3月提出《大数据研究和发展计划》,这标志着美国把大数据的研究与应用上升为国家战略。

(一)“大数据”的概念与基本特征

“大数据”这一概念最初起源于美国。维基百科对“大数据”的定义是:没有办法在允许的时间里用常规的软件工具对内容进行抓取、管理和处理的数据集合。简言之,“大数据”就是传统IT技术和数据库软件无法处理的海量数据。通常认为,“大数据”具有明显的3V特征,即Volume(大量化)、Variety(多样化)、Velocity(快速化)。随着大数据分析与挖掘的深入,其第4个V的特性日益突显,即Value(价值)。

——大数据体量浩大。大量的数据从各种源头通过不同渠道定期产生,数据量级已从GB、TB、PB发展至EB,甚至是ZB(泽字节,等于270字节)。《大数据时代》书中预言:到2013年,全球数据约达1.2 ZB。如果把这些数据全部记录在书,这些书可覆盖整个美国52次;如果将之储存在光盘,就能堆成五堆,每一堆都可以伸到月球。

——大数据类型繁多。其类型包括结构化数据、半结构化数据和非结构化数据(如文档、网页、音频、图像和视频等)。随着社交网络、电子商务、移动互联网的快速发展,非结构化数据呈现爆发式增长,至2012 年末其占整个数据量的75%以上。

——大数据生成快速。数据的生产、获取、处理、分析的速度在持续加快,形成高速的数据流。维克托在书中提到,数据的增长速度比世界经济的增长速度快4倍,计算机数据处理能力的增长速度则比世界经济的增长速度快9倍。

——大数据创造价值。大数据隐含着巨大的经济、社会和科研价值,有效地挖掘和使用大数据,促进各个领域的持续创新,将对经济社会发展和科学研究产生巨大的推动作用,其运用前景十分广阔。

(二)“大数据”研究与应用的战略意义

在大数据时代,浩瀚的数据是新的生产要素,成为一种继自然资源和人力资源之后的重要战略资源。大数据是人们获得新的知识、创造新的价值的源泉,大数据将成为理解和解决当今许多紧迫的全球问题所不可或缺的重要工具。

大数据是促进产业升级与结构转换的重要推力。在大数据的时代,对数据海量存储、快速处理和实时分析的需求,一方面,将对芯片、存储以及软件等产业产生重要影响,推动产品的升级换代;另一方面,将催生数据挖掘、数据分析等服务业,创建新的产业群。采用大数据处理方法,生物制药、新材料研制的生产流程会发生革命性的变化,还可能形成数据制药、数据材料等一系列战略性新兴产业。

大数据是提高企业创新能力与竞争力的重要因素。拥有大数据的企业通过挖掘“数据财富”,将获得不菲的收益,甚至能改变整个行业结构。维克托提到:能置身于信息流中央并能收集数据的公司通常会繁荣兴旺,大放异彩;大数据会加剧优胜劣汰,企业一旦掌握了大数据,不但有可能超过它的对手,还有可能遥遥领先。

大数据是改善政府决策能力与国家治理的重要工具。一国拥有大数据的规模及其对数据的分析运用能力,将直接关系数字空间安全和社会稳定。建立在大数据基础上的社会管理,可有效实现对重大安全问题、危机、风险的防范和预警,更好地服务民生,促进服务型政府的构建和国家的长治久安。

大数据的价值挖掘与风险掌控

维克托在《大数据时代》一书中,用了近1/3的篇幅详尽地论述了大数据时代的三大思维变革——从依赖随机样本向包容所有数据转变、从精确性向混杂性转变、从因果关系向相关关系转变,这些转变将改变人们理解和组建社会的方法,调整在管理与决策等方面的传统理念。维克托强调:只有5%的数据是结构化且能适用于传统数据库的,如果不接受混乱,剩下95%的非结构化数据都无法被利用;而建立在相关关系分析基础上的预测是大数据的核心。

维克托强调,当今社会必须拥有一种新型能力:通过对海量数据的分析,获得有巨大价值的产品和服务。在《大数据时代》一书中,作者通过上百个通俗易懂的实例,生动阐述了大数据所引发的变革,及其带来的全新创业方向、商业模式和投资机会。以下择其经典案例按制造业、服务业和社会管理三大类作一介绍:

——大数据与制造业:以汽车制造业为例。大数据一旦得以有效利用,就能为改进产品质量、拓展创新性应用和发现商机提供有力的支撑。如今的汽车装满了芯片、传感器和各种软件,一经启动,它们就会及时把汽车状况信息发送到制造商的电脑上。这些数据在整合之后会进一步改进汽车零件质量,掌握这些数据的整车制造商就拥有了较大的竞争优势。

——大数据与服务业:以商业、交通与物流为例。如大数据促成了亚马逊的个性化推荐系统,亚马逊在记录顾客购买书籍的同时还关注了顾客浏览过的页面,利用这些数据梳理相关关系,为客户提供个性化的建议。据说,亚马逊销售额的1/3来自它的个性化推荐系统。又如当位置信息被数据化,新的用途、新价值也会随之不断催生。UPS作为世界上最大的快递承运商与包裹递送公司,在货车上装了传感器、无线适配器和全球定位系统,通过快速多效地利用地理定位数据,优化行车线路,2011年UPS的驾驶员们少跑了4828万公里路程、节省了300万加仑的燃料、减少了3万公吨的二氧化碳排放量。

——大数据与社会管理:以公共卫生、社交网络为例。最经典的例子是谷歌流感趋势预测。2009年,在甲型H1N1流感爆发的几周前,谷歌就预测到了冬季流感在全美范围的传播,而且具体到特定的地区和州,这一预测与官方数据的相关性高达97%。谷歌是通过观察网上的搜索记录来完成这个预测的,其关注的是特定检索词条的使用频率与流感在时间、空间上的传播之间的联系。而当沟通变成数据,社交网络(Facebook,Twitter)坐拥了大型数据宝藏,轻易获得各行各业以及三教九流的几乎所有的动态信息。

数据资产取之不尽,用之不竭。但是,一个亟需正视的现实是,大数据在改变世界的同时,也使得个人信息安全、企业信息安全甚至是国家信息安全面临着前所未有的挑战。此外,过分依赖数据、滥用数据会导致“数据独裁”,以及大数据预测、运算法则等引发的黑盒子风险。这需要进行多方面的管理变革,建立全新的制度规范。

以大数据促转型、促发展

制定大数据战略。要深刻认识大数据价值,尽快开展大数据领域的研究,制定符合国情的大数据战略,为打造“数据中国”尽早布局。要把大数据作为现代社会基础设施的重要组成部分,把握核心环节和关键技术,完善相关机制体制,加快推进重点领域的应用。

打造大数据产业。一方面,鼓励拥有大数据资源和大数据技术的互联网公司开展数据挖掘与应用。阿里巴巴、百度、腾讯等国内知名互联网公司在挖掘大数据方面,有着强烈的利益驱动力和与生俱来的技术优势,应顺理成章地成为大数据价值链上的创业公司和领衔先行者。另一方面,推动各领域、各行业大数据的开发应用,从数据资产中掘金,最大程度地实现大数据的真正价值。

推进大数据技术创新。大数据真正价值就像漂浮在海洋中的冰山,第一眼只能看见冰山的一角,而绝大部分都隐藏在表面之下,需要通过持续地创新,不断挖掘更多的潜在价值。要解锁数据的价值,必须借助新一代的方法和技术。积极探索数据再利用、重组数据、扩展数据等数据创新,不断挖掘数据的“潜在价值”。深入研究大数据计算模型和算法,提升数字内容加工处理软件效用,努力推动云计算等创新突破和跨越式发展。

确保信息安全。要在充分评估大数据风险的基础上,认真研究从数据生成、数据收集到数据分析和应用各个环节敏感数据的保密问题。同时,通过制定相关法律法规来规范大数据开发利用行为,建立大数据使用规范和安全标准,促使数据使用者以负责任的态度使用数据,规避或减轻对用户的潜在伤害,加大对信息窃取及篡改的惩罚力度,优化大数据发展环境。

猜你喜欢
维克托
做爸爸那样的英雄
从创伤心理学分析《微笑》中维克托的心路历程
大侦探福尔摩斯5
维克托先生的春天
了不起的菲丽西
愿所有疲惫的灵魂都能安睡
愿所有疲惫的灵魂都能安睡
我不是海豹也不是企鹅
说大话的维克托
虎吻