韩俊俊
【 人物简介 】
姜奇平,现任中国社会科学院信息化研究中心秘书长,《互联网周刊》主编,同时担任国务院国有资产监督管理委员会第一届国资监管信息化专家组专家,中国信息经济学会常务理事,中国电子商务协会常务理事,数字论坛成员。
“大数据时代”是全球知名咨询公司麦肯锡首先提出,进入2012年后,“大数据”一词被越来越多地提及。大家都在谈论“大数据”,对它的定义也越来越多,但对很多人来说,大数据并不是一个非常清晰的概念。为明晰大数据的内涵,本刊有幸邀请到中国社会科学院信息化研究中心秘书长姜奇平教授,他为我们带来关于大数据方面的最新见解,以及对大数据是什么、大数据时代给我们生活带来哪些改变的探索。
不可思议的大数据时代
英国维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》是国外大数据系统研究的先河之作,书中提出大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。但作为特指的大数据,按EMC的界定,其中的“大”是指大型数据集,一般在10TB规模左右;多用户把多个数据集放在一起,形成PB级的数据量;同时这些数据来自多种数据源,以实时、迭代的方式来实现。IBM把大数据概括成了三个V,即大量化(Volume)、多样化(Variety)和快速化(Velocity)。大数据通常与Hadoop、NoSQL、数据分析与挖掘、数据仓库、商业智能以及开源云计算架构等诸多热点话题联系在一起。作为泛指的大数据,则指向了定制化、差异化、个性化方向的竞争力。
姜奇平认为,通俗地讲,大数据就是对网上海量的文本、图像、音频和视频数据进行采集、分析、加工和利用。在这之前,有数据但达不到海量的规模,数据可以分析但主要是针对文本。他认为,大数据并不像某些人说的,是云计算之后的又一浪,而就是云计算本身。因为它们都是数据的大规模集聚与定制化分布的结合。他认为这是一个人类新的分水岭,由此要把农业文明的分散化,与工业文明的集中化,在大数据中融为一体,集天地之精华,释放出无穷的能量,达到信息时代的“光明顶”。
其实真正的数据时代是从2012年开始的,标志性的区别就在于,以往的数据只是结构化的数据,是非个性化的数据;而进入2012年,非结构化数据占有比例将达到互联网整个数据量的75%以上,这意味着个性化数据时代的到来。
什么是大数据时代?为此,姜奇平形象的描述了未来大数据时代的一个场景,当你走进一家陌生的小咖啡馆时,耳边响起了只有你才熟悉的音乐旋律。技术实现并不难,咖啡馆只要读出你手机音乐下载记录,通过数据分析,就可以定制播放。这就是大数据时代。
在真正的数据时代,网商将不再奔向数据趋同的淘宝商城,而将涌向提供个性化竞争力的AaaS(分析即服务,analytics-as-a-service),扑向3V的怀抱。
淘宝目前每天活跃数据量已经超过50TB,共有4亿条产品讯息和2亿多名注册用户在上面活动,每天超过4000万人次访问。“大数据”的作用,就是把这些数据采集进数据仓库中,然后用分布式的技术框架(Hadoop),对非关系型数据进行异质性处理(NoSQL),通过数据分析与挖掘,发展一对一的商业智能,从中产生让网商因小而美、不再打价格战的企业和个人竞争力;让中国产生不再依靠“中国制造”,而转向“中国创造”的国家竞争力。
大数据的时代特征
姜奇平认为当前人们谈论大数据,多是从技术角度观察。从这个角度观察大数据,对技术人员来说是大数据的全部;但如果工商管理人员仅从技术角度看大数据,就会把大数据看低,看成是工具性的东西。我们需要先从技术经济学角度,把大数据先从技术现象,转化为经济现象,再理解它的经济社会意义。作为技术的大数据,主要指对海量复杂数据进行采集、加工和利用的技术。而作为生产力的大数据,主要指智力工作者运用数据技术处理数据以获得智慧的能力,是一种高级信息生产力。为此,姜奇平从生产力、生产关系和生产方式的角度分析大数据的时代特征。
首先,大数据的时代特征表现在它的生产力特征上。而生产力包括劳动者、劳动对象、劳动资源和劳动目的四个要素。其中,掌握大数据的劳动者是智力工作者,他集劳动与资本于一身,是资本家;劳动对象是数据,这些数据不仅是资源,而且是财富;劳动资源包括语义网等公共基础设施上分享的开源软件、Hadoop、NoSQL、数据分析与挖掘、数据仓库、商业智能(BI)等技术条件;最后,从劳动目的看,从事大数据是为了“从中获得知识和洞见以提升能力”,进一步说,要洞见的是意义,要获得的能力是智慧,有意义的数据是智慧,没有意义的数据是垃圾。大数据要完成从客体的数据向主体的智慧的转换。忘记这一点就会陷入为数据而数据。
其次,大数据的时代特征体现在它的生产关系特征上,表现在生产、交换、分配和消费四个环节上。在生产上,分布式计算的大数据,推动生产组织向去中心、扁平化转变,向自组织、自协调方向演化,智能化的大数据将促进劳动与资本的一体化,推动决策前移,并且可以提供平台支持创造性的自主劳动(如DIY+3D打印的“创客”);在交换中,具有语义功能的智能网络成为与现有市场互补的新组织形式,商品交换与包括情感在内的信息交流在新的市场结构中相互融合,用户体验和意义满足成为定价的重要因素,情境定价成为可能,依托数据分析可以实现一对一精准营销和“人单合一”;在分配上,在数据财富归属与利用的平衡中,形成以“使用所有权”(access over ownership)为特征的分享型经济(Sharing Economy),在物质财富极大丰富基础上,逐步实现以自由看待发展;在消费上,在大数据引导下,出现产消逆转(C2B)和产消合一趋势,人们在满足生存发展需求基础上,日益产生通过自主劳动满足的自我实现需求。
最后,大数据的时代特征特别体现在它的生产方式特征上。不同时代,人相对于劳动对象的作用方式不同,生产的社会目的也不同,形成农业生产方式、工业生产方式与信息生产方式。大数据推动着信息生产方式的形成。endprint
简言之,农业时代的生产力以土地为中介,分散地从对象中解析出有助于满足人的温饱需求的功能;工业时代的生产力以货币为中介,集中地从对象中解析出有助于满足人的社会发展需求的价值;信息时代的生产力以数据为中介,集中与分散结合地从对象中解析出有助于实现生产目的的意义。功能、价值与意义的关系,在于前者为后者的基础,后者有条件地决定前者。
姜奇平认为,对人均收入5000美元以上的社会来说,大数据有助于在全社会水平专业化地提高以意义满足(所谓“满意”)为核心的智慧水平,推动发展方式转变,实现经济和社会转型,在提高GDP水平(功能与价值水平)的同时,提高社会幸福水平(意义水平)。
发展大数据的战略意义
姜奇平认为,大数据的发展会深刻改变我国社会生产力状况,在此基础上对社会生产关系及其相联系的经济运行机制产生影响,对推进中国新四化建设,提高国家竞争力具有战略意义。
托夫勒在1980年《第三次浪潮》中的一个断言,准确刻画到大数据的时代特征:“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据则是第三次浪潮的华彩乐章”。可以认为,大数据是信息时代发展到“华彩乐章”阶段上的先进生产力和先进生产方式的代表。
我们需要从社会生产力引起生产方式变革高度,充分认识大数据对提高国家竞争力的战略价值。实物的积累、货币的积累,曾经成为过去时代国力的标志。在信息时代,数据的积累、加工和利用能力将成为国力的新标志。对于一个国家来说,发展方式转变只有跟上生产方式转变的时代步伐,才能保证在更高水平的现代化竞争中不落伍、不挨打。而对于处在第二次浪潮与第三次浪潮之间的中国来说,大数据发展具有战略紧迫性。
从国际上看,发达国家已进入信息时代,大数据的发展意味着社会生产力水平质的提升。按照信息时代的现代化标准,中国在社会生产力上存在与美国等发达国家拉大距离,陷入数据鸿沟的现实危险。虽然中国的GDP将再次回到世界第一,但应清醒认识到,GDP与社会生产力水平不可混为一谈。清朝一直到1820年,GDP仍是世界第一,但社会生产力水平却与英国相差一代,主要就差在生产方式的时代落差上。如果中国不能在大数据时代拉近与各国社会生产力发展水平的距离,仍然有可能落后挨打。
从国内看,中国新四化建设正处在从“工业化不断加快”到“工业化基本实现”的转变中,同时要完成全面提高信息化水平的历史任务。与发达国家不同,中国存在要同时发展工业时代的生产力与信息时代生产力的双重任务。上个世纪50年代,中国曾面对同样的形势,要同时发展农业时代和工业时代两种生产力,那时提出“工业为主导、农业为基础”的正确方针,促进了社会生产力的跨越式发展。历史经验具有启示借鉴意义。中国的和平发展不可能建立在低水平社会生产力体系之上,要认清发展以大数据为代表的信息生产力的紧迫形势,从顶层建立大数据的国家战略,使我国社会生产力状况适应世界民族丛林竞争所要求的新的现代化水平,在此基础上对社会生产关系及其相联系的经济运行机制进行改革。坚持信息化带动工业化,工业化促进信息化,实现高水平现代化,才能充分保证中国的国际竞争力。
大数据给中国发展带来新的机遇。抓住生产方式转变这一关键,才能解决发展方式转变的深层次矛盾。面向未来,大数据将激发巨大的内需增量,建设比城市现代化水平更高的智慧城乡,密切政府和民众的联系,促进民主与社会进步。大数据产业将形成新的增长点,数据业务主营化带来各行各业转型升级。我们相信,借大数据的东风,用信息生产力与先进生产方式带动发展方式和经济运行机制的转变,可以为中国带来数字红利,提高新四化建设的现代化水平。
姜奇平坚信,大数据是未来引领性的先进技术,它在信息技术中的地位,好比两弹一星在各种技术中的地位,是高科技的制高点,关系到信息强国的位势,值得国家下大力气推动。在大数据上弱,制脑权就会全面受制于人,国将不国。斯诺登事件暴露出各国在信息安全上面临的严峻形势,信息的全面收集、整理、分析和深度利用将成为未来国际竞争的制高点,关系到网络安全和信息化的全局,关系综合国力。没有大数据就没有信息化,没有信息化就没有现代化。万万不可掉以轻心,落后就会再次挨打。endprint