“大数据时代”的奇幻虚构

2013-04-29 05:41:01刘建明
西部学刊 2013年5期
关键词:两面性虚构大数据时代

刘建明

摘要:目前,“大数据”问题被国内外学术界和媒体火热爆炒,认为人类已经或即将进入大数据时代,体现出人类思维的理性化,真理之门因而被打开。实际上,大数据仅是认识事物的一种统计分析手段,不具有物质生产和社会管理彻底变革的性质,因此不具有时代的特征,它更不完全等于理性。过高估计大数据的理论和应用价值,不啻是一种奇幻的虚构。

关键词:大数据;大数据时代;虚构;两面性

中图分类号: 文献标识码: 文章编号:

自2011年,西方有关“大数据”(big data)的理论像旋风一样席卷知识界,“大数据”的学术讨论接连不断。媒体火热的爆炒,各种危言耸听的结论,充满种种玄思,Google上竟有13多亿条这方面的报道和言论。我国IT业和新闻界也开展探讨,并发表多篇文章。许多文章声称,企业和政府如不谙熟和掌控大数据洪流,将导致厄运,许多社会规律将被颠覆。

一、“大数据”是个什么概念

有人说,大数据实际是符号,是后信息时代的标志;有人说,“大数据”是一种新的信息技术,是控制社会、占有财富的工具;还有人说,大数据是资源宝库,将决定一个国家的命运。什么是“大数据”?“大数据”的概念究竟如何理解?

大数据(big data)是巨量资料、浩瀚信息的另种称呼,实际是80年代末盛行一时的信息爆炸的同义语。早在1980年,美国未来学家阿尔文·托夫勒曾在《第三次浪潮》一书中,就将大数据称为“互联网上的海量数据”,当时并没有引起大惊小怪。但今天我们阅读国内外有关“大数据”文章,似乎感到它对人类的影响是致命的,让人产生坠入神秘地带的恐慌;社会管理如不改变以往规则,可能遭遇灭顶之灾。与这种感受恰恰相反,“大数据”是社会发展的新生,作为人类认知社会方法的一次飞跃,“大数据”技术将给企业运营、政府管理和媒体传播的科学化创造有效的机制。

“大数据”在根本上是数据分析的前沿科学,创立全新的量化研究的系统知识和方法,包括大数据技术、大数据工程、大数据理论和大数据应用。 “大数据”这一语汇的深刻意义不在于“信息巨量”,更不是“巨量信息的记录”和“对社会的描绘”,而是如何对巨量信息迅速做出有价值的处理和加工,使人类在信息爆炸面前成为主宰。处理“大数据”需要诞生一批新兴产业,出现以分析海量信息为专业的新职业,社会各领域的发展将极大提高效率。

《大数据:改变我们生活、工作和思想》一书的作者维克托·迈尔恩伯格(Viktor Mayer-Schonberger)和肯耐茨·N.库基尔 ( Kenneth Niel Cukier )向读者发问:大数据到底有多大?一天之中,互联网产生的全部内容可以刻满1.68亿张DVD,发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量),网络发出的帖子达200万个。据预测,到2020年,全世界所产生的数据规模将达到今天的44倍。①根据IT界人士的初步设想,大数据分析依据水平集成数据模型,把隐蔽于服务器的杂乱信息通过多个接口连接到程序上,在程序运作后立刻掌握完整的信息流。再根据垂直集成的数据模型直接访问SOA组件,通过“云构架”查询信息分析的结果,解决各种问题将变得异常便捷。

二、“大数据时代”的虚构

最早提出“大数据时代”这一概念的是世界知名的思想库麦肯锡(MGI)。麦肯锡在研究报告中指出,我们这个世界的数据量已经爆炸,分析大数据将成为竞争的基础,支撑新的生产力增长。②“大数据”技术带来社会的上述变化,是否意味一个新时代的开始?“大数据时代”和“信息时代”有根本区别吗?

“时代”这一概念通常用于社会文明形态,是指在一定时空范围内由物质生产、政治制度或文化变迁而改变社会的整体面貌,并非可以随意贴上何种标签。虽然人们可以对某一阶段的流行思想或行为打上“时代”的标记,但那绝不是严谨的科学概念,而仅仅是一种习惯称呼。有史以来,人类社会出现过石器时代、红铜时代、青铜时代、铁器时代、蒸汽时代、电气时代、信息时代、蒙昧时代、启蒙时代、奴隶制时代、资本主义时代、社会主义时代的说法,都是指物质生产方式、政治制度或意识形态的特定状况。“时代”绝不等同于年代,也不是任何新玩艺一出现、一普及,就打开了一扇新时代的大门。

“大数据”是信息技术的子集,仅仅是海量信息的统计分析方法,不具有物质生产和社会管理彻底变革的性质,因此不具有崭新的时代特征。作为信息经济时代的组成部分,“大数据”没有超出“以数据流通推动产品流通,信息技术和信息劳动占有整个经济巨大比重”的信息生产形态。它只是信息时代的特征之一,而不是一种新的经济形态或社会形态,因此“大数据时代”的概念,是奇幻的虚构。

国内某IT人士认为:“大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。” ③这个结论正是把“大数据”视为一种时代特征,玄思的味道十分浓厚。第一,在地球的温度、磁场、大气含氧量和紫外线不变的条件下,我们不可能变成新的物种,即使变也需要上百万年。第二,大数据不可能使物质产品的生产退居次位。我们只能依靠食品、水、房子、衣物、空气和交通工具等物质来生存,物质产品的生产永远处于首位,开发大数据技术或加工信息产品都是为了提高物质产品的生产效率和质量,永远不具有主导地位。大数据本身既不能充饥,也不能让人们安居。

迈尔恩伯格和库基尔得出更为荒谬的结论:“大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之的是关注社会的各类关系。即只要知道‘是什么,而不需要知道‘为什么。这就颠覆了千百年来人类思维的惯例,对人类的认知和与世界交流的方式提出了全新的挑战。” ④如果大数据技术使人类只知道“是什么”,就不再有探索客观规律的要求——寻求“为什么”,那么“大数据”只能让人的认识停留在事物的表面现象,使人类走向无知,以致消弭科学研究,最终导致社会倒退。这样,“大数据”还有什么“时代”分量呢!?实际上,“大数据”分析平台不仅让人知道“是什么”,而且有时还让人知道“为什么”,否则就没有重大的工具性价值。

三、“大数据”的两面性

大数据正在成为一股热潮,不仅引发IT业的技术革新,也在不断冲击政治、商业、社会和其他科技领域。对其模式的思考,以及如何应用它,已成为新一轮技术变革的最强音。但是,大数据技术也有两面性。

从积极方面说,大数据确实已成为数据王国的主线,是下一步信息研究的主要对象。大众媒体、社交媒体和各个经济和社会领域如何使用大数据,正确评估大数据的商业价值,建立大数据的新兴产业,培育大数据的专业人员,将极大推动社会变革和经济发展。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。” ⑤

虚拟世界有取之不尽的资源,数据可以转化为资产和财富。据预测,仅美国医疗服务业大数据技术的应用每年创造的价值就在3000亿美元左右,全球个人位置服务的最终价值将达到7000多亿美元。每天各种机构、每个人和大量传媒发送的图片、文档、视频和言论杂乱无章、周而复始,人类早已无法掌控。而这些信息正是人类活动的真实记录,大量来自人类的心理层面和社会组织的内幕,通过大数据分析,人类完全有可能认识复杂、隐秘的社会和自然现象,使科学研究进入快速发展时期,过去的不可知领域可能将被人类破解。

从消极方面看,大数据技术不是万能的,不能解决一切问题,它只是决策的一种量化手段。正确认识事物的是非和利害,遵循人文精神是更为重要的前提。缺少这个前提,大数据不仅毫无用处,而且能为谬论寻求证据。

有的文章说:“大数据的时代其实是弘扬理性精神的时代……美国在这方面就做得好很多,美国政府在各个领域都用数据分析,用数据决策,用数据创新。” ⑥美国确实重视数据,研究社会问题都搞民意测验或其他实证调查,已有80多年的传统。但2008年金融危机已过去5年,它的各种经济决策没有使其走出困境;它的情报部门搜集的许多数据都是虚假的(例如伊拉克有大规模杀伤性武器、向国际原子能机构提供虚假情报等)。尽管有大量脑库提供佐证与数据,美国历届政府都有重大失误。美国盖洛普民意调查所预测美国大选,每次通常搜集、分析十多万个数据,但却多次预测失误。大数据本身不完全等于理性,决策基于数据分析而并非基于经验和直觉,是一种理性的表现,但更大的理性是人文法则。即重视人民的普遍要求,维护各民族的尊严和文化,尊重人的自由、平等和权利。不尊重其他民族的历史和风俗,奉行种族歧视,只知道本国利益而不考虑他国利益,在某些国际事务中奉行双重标准,让美国政府在内政外交中屡屡受挫,给一些国家的老百姓造成不可弥补的伤害(例如多次对外战争滥杀平民),其中美国公民也遭到报复性的无辜虐杀。

遵循社会(国际)公德、人道主义、公正与正义、平等互利等友善原则,是分析数据的指导性准则。数据是有类别的,它真实与否,对全社会是否有利,哪种意见是绝大多数人拥护、赞成的,赞成的人是哪个阶层,等等,数据本身还存在一定的模糊性。对社会问题提取大数据,主要了解绝大数人的意见,依据人民是否满意做出结论。大数据与人民的数量绝非完全等同,“大数据”的应用不会使真理之门为之洞开,也难以解决大众传媒的是非判断。新闻传媒反映主流舆论,做出正确而精准的报道,仅仅依赖数据还远远不够。

互联网、大众传媒和社交媒体每天提供的巨量信息有大量冗余、虚假和有害的内容,其中侵犯他人隐私权、生存权和精神健康权的信息与图像大肆泛滥,“价值密度较低”。人类不但不能把大数据一股脑地当作宝库,而且要冷静审视数据的两面性,抛弃有害和无用的信息,使数据分析立于价值和法律层面,避免浪费专业人员的时间和精力。

机器储存和分析难以囊括几十亿兆数据,即使储存了这些数据,专业人员也无法全部调阅,删除和忘掉无价值的、不相关的信息是处理大数据的重要原则。正如迈尔恩伯格在《删除:数字时代遗忘的美德》一书中所说,数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复忘记。人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。“大数据的取舍之道,就是把有意义的留下来,把无意义的去掉。只有理解了在大数据中,需要的是什么,以及如何判断这种需要,才能举一反三地明白到底为什么要去掉那些不需要的。”⑦

猜你喜欢
两面性虚构大数据时代
融媒时代,如何正确地“非虚构写作”
传媒评论(2019年4期)2019-07-13 05:49:20
理性看待经济数据的两面性
中国外汇(2019年21期)2019-05-21 03:04:04
虚构的犹太民族?
大数据时代下图书馆的服务创新与发展
科技视界(2016年21期)2016-10-17 19:30:45
大数据时代高校学生知识管理
科技视界(2016年21期)2016-10-17 18:42:37
从“数据新闻”看当前互联网新闻信息传播生态
今传媒(2016年9期)2016-10-15 22:06:04
论文学创作中的虚构
农村大学生“失业”具有两面性
外部技术影响企业绩效的两面性——一个非线性视角的实证研究
财经论丛(2015年1期)2015-02-27 07:10:34
专利制度的两面性