徐仲伟
摘要:大数据的时代已经到来。数是高度抽象的事实,大数据的本质是现实社会大量具体事实的反映和汇聚。互联网是信息汇聚的大平台,思想交流的新通道,经济发展的推进器,政治风向的晴雨表。互联网内容的本质是现实社会,其形式的本质是它的工具性。我们必须清楚认识两者的本质属性,充分利用大数据和互联网相互发展给我们带来的有利机遇,转变我们社会的发展方式和人们的生活方式,朝着科学健康、永可持续、和谐共进的方向发展我们的事业,实现中华民族伟大复兴的“中国梦”,为人类作出更大的贡献。
关键词:大数据;互联网;本质
中图分类号:G201 文献标识码:A 文章编号:1673-8268(2017)01-0083-06
一
全球最大的战略咨询公司麦肯锡咨询公司(MeKinsey&Company)曾经指出:数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。在当今世界“大数据”这一社会现象发生、发展的过程中,实际上其早已被运用于物理学、生物学、环境生态学领域以及军事、金融、通信等行业。但是,近年来由于互联网和信息行业的飞速发展,特别是“云计算”的出现,使大数据不仅引起人们广泛的关注,而且很快被不断地运用,同时,也把大数据的问题推到了社会发展的前沿。《纽约时报》2012年2月的一篇专栏文章就曾经指出:“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于对数据的分析而做出,而并非像过去那样仅仅基于已有的经验和自身的直觉。哈佛大学社会学教授加里·金也进一步指出:大数据时代的到来“是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程”。
目前据有关统计,在互联网行业日常运营的过程中,所生成和累积的用户网络行为数据规模已经变得非常庞大,以至于已經无法采用以前我们常用的G或T来衡量了。大数据到底有多大?据有关学者对大数据的统计和预测以及现有数据显示,互联网上一天产生数据的全部内容就可以刻满1.68亿张DVD光盘;发出的邮件就有2 940亿封之多,仅是这一数据就相当于美国两年的纸质信件的总量;发出的社区帖子达200万个,这相当于《时代》杂志770年的文字量:卖出的手机达37.8万部,这个数据已经高出全球每天出生的婴儿数量37.1万……2012年,数据量的记量单位已经从TB(1 024GB=1TB)级别跃升到PB(1 024TB=1PB)、EB(1 024PB=1EB)乃至ZB(1 024EB=1ZB)级别。国际数据公司(IDC)的研究结果认为,2008年全球产生的数据量为0.49ZB,2009年为0.8ZB,2010年为1.2ZB,2011年高达1.82ZB。这个数据相当于2008年全世界每人产生了200GB以上的数据。到2012年,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究结果更显示,整个人类文明所获得的全部数据,有90%是过去两年内产生的。也有专家预测,到2020年,全世界所产生的数据规模将达到今天的44倍,即35.2ZB。全球大概需要376亿个1TB的硬盘来储存这些数据。大数据并不仅仅是指数据之大,而且是指更经济、更方便和更高频率地从这些大量的、不同结构、不同类型、不同表现形态的数据中获取对人类社会的发展和进步,特别是对当前我国和世界经济社会发展等各方面具有价值和意义的东西,从而设计出的新一代社会结构和科学技术。涂子沛先生在其所著的《大数据:正在到来的数据革命》一书中就指出:“‘大数据之大,不仅仅意味着数据之多,还意味着每个数据都能在互联网上获得生命、产生智能,散发活力和光彩。”同时,他还认为,大数据更多的意义在于,人类社会可以通过对大数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”“大科技”“大利润”和“大发展”。目前,世界各国,尤其是西方发达国家已经大量地、十分广泛地在经济、国家安全和社会管理等领域开始运用大数据,推进其在相关领域的发展。另外,从发展趋势看,大数据已经成为未来社会发展的一种非常重要的资源。因此,在今后较长的时间内,大数据已经成为了继海、陆、空、天等领域竞争之后的又一争夺和博弈的领域。为此,英国牛津大学教授维克托·迈尔-舍恩伯格在其专著《大数据时代》中就说:“大数据是一场革命。它不仅将对各行各业带来深刻的影响,甚至会改变我们的思维方式。”他还认为,大数据的出现,会让人们放弃对因果关系的渴求,转而关注事物、尤其是数据之间的相互关系,到那个时候,人们只需要知道是什么就行了,而没有必要去关注为什么。如果到那一天,可以说这不仅将颠覆千百年来的传统思维方式,而且将会对人类社会的认知方式和交流方式提出新的挑战。
今天,大数据不仅已经出现,而且正成为我们当今社会的一个重要的时代特征。不少人认为,我们已经进入或者说正在进入大数据时代。既然如此,我们就不能不去思考一个问题,这就是当前我们大量谈论的大数据到底是什么?我们所研究的大数据其本质又是什么?由于大数据是谈论时间还不太长,但却是引起世界各国的广泛关注,涉及范畴极其广范的一个社会问题和社会现象,因此要在笔者的视野和能力范围内研究和阐释这个问题,显然是力不能及的。但是,笔者又希望通过积极的交流,谈谈对其中一些问题的粗浅看法,以向大家求教。
我们都知道,“数”是人们创造的用来记录事物的量的符号。也就是说,任何一个真实的、有意义的“数”或者数据,只要它在现实社会当中存在,它就始终是代表着相应的事实,反映或者说明着相应的事物的量。古希腊著名的数学家、哲学家毕达哥拉斯曾经有一个非常著名的论断就是“万物皆数”。虽然在当时的情况下,毕达哥拉斯的“万物皆数”这一认识是从完全颠倒了的“数”与万物的本源的角度来看待和认识“数”的,当后来人们经过对社会事物和“数”的认识与研究之后,断然抛弃了毕达哥拉斯以“数”为事物本源的唯心主义错误认识。但同时人们又从社会实践中看到了“数皆万物”的真正意义,即真正的“数”,它是事物的量的表现,是社会事物量的客观记录和反映,这才产生了人们对“数”和社会事物的新的正确认识。因此,“数”不是社会事物的本源,而是社会客观事物的另一种表现形式,即社会事物的量的表现形式,或者说社会事物的量的记录(记载)形式。因此,有人就提出“当哲学家要说明世界上的一切时,他看到万物都有一定的量,呈现出具体的形,数学的对象寓于万物之中”。从这个意义上说,“数”就是社会事物从量的角度的真实反映,是社会事物高度抽象的结果,即将社会事物抽象为一个“数”。数据,是社会事物从量的角度真实记载或者真实反映高度抽象的依据。所谓“数据”,必然是以社会事物为“据”的,必然是社会事物真实的客观存在的一种量的状态,或者说,社会事物的这种状态是以量的形式而运用“数”“数据”来进行反映和表现的。从这个角度去理解“数”和“数据”的本质,我们就可以得出这样的结论:我们在大数据问题上说的“数”,其本质就是社会事物从量的角度经过高度概括和高度抽象的事实。所谓“数据”,就是从量的角度反映社会事物的一种依据。因此,我们说,“大数据”的本质就是对社会事物从量的角度,并经互联网等技术所产生的,体量浩大、类型复杂、生成迅速、价值巨大的社会事物量的一种表现(或者说记载、一种信息)。因此,“大数据”的本质就是通过互联网所汇聚起来的社会事物的大量事实。endprint
如果以上关于大数据本质问题的认识和描述能够成立,并能够得到大家的认同,那么在大数据领域的一些问题就需要引起我们的高度重视。社会事物是浩瀚无垠的,因此记载社会事物的大数据之大一样是无可局限的。社会事物是丰富多彩而又纷繁复杂的,因而在现实社会当中所产生的大数据也必然是五花八门而又庞大纷杂的。社会事物是瞬息万变、千变万化、变无止境的,而大数据也自然可能是随着社会事物的这些变化而显得异常复杂、变化无穷的。大数据的出现,是人们从量的角度对许许多多的社会事物认识和反映的结果。社会事物自然有它内在的规律和外在的联系方式与结构形式,作为反映和记载这些社会事物的大数据,自然也一样有它的内在规律和外在的形式与联系。
虽然数据是我们从量的角度对社会事物的认识,社会事物又是长期的一种客观存在,但是大数据并不是自有人类社会就自然存在的。大数据与一般数据的不同之处就在于,它不仅是因其数据的浩大而出现,更重要的是,它是在今天高科技不断发展,特别是互联网、云计算出现之后才由人类自己所发现、所创造的一种新的资源和新的社会事物。
大数据是当代人类社会所创造并建立在事实基础之上的、真实存在的社会事物,是社会事物高度抽象的反映,因而它始终是客观的。正如有人指出的那样:“数据它不是社会事物的附加品,而是社会事物本身”,“数学世界是人创造的,但它是客观的”。
由于社会事物始终是处于变化状态之中的,因此大数据也始终是不断地变化着,而不会一成不变的。同时,这种变化是无穷无尽、层出不穷的。它一定会随着科学技术的飞速发展和人类社会的不断进步,越来越迅速地发生变化,并得到發展。
二
互联网,又称因特网(Internet),它始于1969年的美国,是以计算机等作为终端设备,由各种不同的网络按照一定的通信协议组成的全球性网络。互联网是一种公用信息的载体与平台,是大众传媒的重要工具和手段,是当今世界最具有快捷性、普及性、大众性,最为流行、最受欢迎的信息记载与传播的工具。互联网这种大众传媒方式,运行起来要比以往任何通信媒体都迅速得多。互联网的出现首先是人类通信技术的一场革命,但在今天,如果仅仅从通信技术的角度去理解互联网的意义,去认识它的本质,显然远远不够。我们知道,虽然互联网最先是用于ARPANET的军事和技术目的,但就在当时的具体情况下,它从一开始就起到了帮助人与人之间进行交流、沟通与服务的作用。经过这么多年的发展,互联网的作用与意义早已远远地超出了仅仅作为人类社会交流与传播工具的这一领域。今天的互联网不仅构成了一个全球范围内,甚至扩展到外太空的极为广泛、十分浩大的社会交流平台,更重要的是,它已经成为在社会的经济、政治、科技、教育、文化、军事以及生活的众多领域,都得到无限延伸和广泛运用的一种先进的科学技术。它不仅传播着世界范围内的各种信息,而且在今天社会生活的各个方面及世界事物的各个领域都起着极为重要的作用。同时,在今天乃至未来,它的发展还将不断地影响并改变着人们的思维方式、行为方式和生活方式。由于互联网技术的快速发展,加上它所逐步形成的多功能互动、人工智能、虚拟世界、注意力经济、在线视频等各方面的科学技能的不断改进,一茬茬内容丰富、形式多样和功能多种的网络应用正出现在我们的眼前。当今社会几乎已经成了一个互联网络无处不在、无人不用、无所不包、无事不能的新型社会——这就是我们常说的“网络社会”。
那么,从一定角度来看,互联网到底是什么呢?在当今的现实社会中,不同的人对互联网自然有不同的认识和看法。
有人认为,互联网是信息汇聚的大平台。在今天的互联网上,各种信息,无论是正面还是负面的,是中国还是外国的,是个人还是大众的,是他人还是自己的,是经济还是政治的,是长期存储还是突然发生的,是巨大还是弱小的等等,都通过网络的作用汇聚到互联网这样一个巨大的平台上。人们无论在任何时候或任何地方,都可以通过互联网找到自己需要的信息或者发布有关信息。尤其是在近些年,由于“云计算”的出现,互联网这一巨大的信息平台更是随时汇聚并储存着每天数以万亿计的各种信息。从2013年美国斯诺登事件所暴露出的“棱镜”项目看,仅在这一个项目内,其每天监控的电子邮件和电话就高达10亿件次之多。由此我们可以想见,随着互联网技术的发展和人们参与互联网社会行为的增加,这个信息大平台所汇聚的信息不知还将扩大多少倍。
互联网是思想交流的新通道。自从互联网出现之后,人们的交流渠道更加快捷和畅通。在互联网世界里,无论男女老少、国内国外、亲疏远近、认识与否,都可以通过互联网这个新的渠道交流思想、倾诉感情、表达意愿、说明情况等等。互联网已经构建起了与人类社会传统方式完全不同、十分方便快捷地域十分广阔的思想交流与沟通的新通道。
互联网是文化传播的好载体。自从互联网以图文并茂、声色俱全、鲜活感人的传播形式出现之后,它就以惊人的发展速度在文化传播领域占据着其他媒体无法企及的独特优势与地位。特别是近些年随着互联网传播技术革命的兴起,尤其在3G、4G等技术不断涌现和光缆等传播载体技术不断更新以来,各种高保真、极快捷、广范围和移动式的互联网传播方式,立即获得了传统传播方式永远无法比肩的发展速度。由此,也致使不少报刊杂志、电视广播等很快走向破产歇业。据了解,曾经在文化传播领域,一直对传播西方价值观念,宣扬西方社会生活方式和政治建构模式起着重要作用,在美国的政治人物眼中长期处于重要地位的“美国之音”,也在前几年宣布放弃在广播领域的传播,转而全面启用互联网来宣传西方的政治制度、价值理念和生活方式。
互联网是经济发展的推进器。当今世界,互联网本身的发展,首先就带动了大量与互联网产业直接相关的经济新业态和经济发展的高速度。更为重要的是,在今天,互联网已经成为了世界经济结构中的一个非常重要和关键的组成部分。在世界经济范畴内,由互联网所形成的经济形式和经济业态,已经占据了相当大的份额。甚至可以这样说,今天如果没有互联网,整个世界无论是经济领域还是其他任何领域,都会是一片黯淡,甚至将全面瘫痪立即死亡。但我们看到,正是由于互联网的出现和不断发展,才使整个世界在资源极为紧缺的情况下,反而出现了从未有过的全新的经济发展。endprint
互联网是政治风向的晴雨表。互联网的出现不仅直接影响了世界经济的发展和人类的生活,而且它的出现对一个国家、一个政党、一个社会乃至整个人类在政治方面的影响也是非常巨大的。几年前,以美国为首的西方世界,为达到干涉一些中东欧和阿拉伯国家政治,推行他们的意识形态和政治价值观念的目的,不断地大量利用互联网对其进行所谓的“颜色革命”,企图掌控这些国家的意识形态、政治风向和发展导向,最后,有的国家的确也不得不发生了政权的更替、意识形态的改变和政治价值观念的演变。
互联网是军事制敌的新武器。在军事问题上,互联网已经起到了非常重要的作用。在当代军事领域,任何一个国家都会利用互联网来获取军事情报,分析军情战况,组织军事力量,甚至开展军事动员,传递军事命令,指挥军事行动等等。在现代军事领域,人们不仅用互联网分析军事情报,更多的时候还将互联网作为军事的新式武器来直接攻击敌方。据德国《南德意志报》报道,英国就投资5亿英镑建立了一支网络攻击部队,以对其他国家的网络基础设施开展有针对性的攻击。美国、俄罗斯、以色列等国也一直在积极地组建自己的网络部队,培养大批的网络攻击人员,以通过互联网攻击敌方指挥系统,干扰敌方军事部署,打击对方的军事目标。也有的国家通过互联网大量收集军事情报,窃取军事秘密来达到知己知彼、以网致胜的目的。美国在“棱镜门”事件中就曾宣称,他们通过每天监控世界各国数十亿的电子邮件和通话记录,来分析他国对美国造成的影响,掌握恐怖分子等对其形成的威胁,实现其所谓“反恐”的目的。
互联网是国际交往的大舞台。在今天的国际交往过程中,国与国之间、人与人之间通过互联网开展交流活动早已比比皆是。在不少国与国的首脑之间,多年以前就建立起了一种便于相互联系的专门网络,他们可以随时通过互联网就国家之间或者国际上的某一问题交换看法、讨论商议、增进共识。在民间,无论是在科技、教育、文化还是社会生活领域,人们通过互联网与不同国家之间的人进行各种各样的交流已成为当今世界的常态。2003年,当SARS出现、开始威胁人类健康和生命安全的时候,中国政府和有关医疗机构就立即建立起了开展SARS治理,与世界各国科学家和医务工作者随时进行交流与磋商,共同开展研究,对付SARS的科研大平台。在这一交流中,互联网的确起到了及时掌握科研进展情况,有效战胜SARS病魔的积极作用。
互联网成了人类生活的好帮手。互联网在人们的社会现实生活中所起到的帮助作用,已经是无法用简单的数据来计算和用具体的形式来表述了。它不仅可以在人们的经济、政治、文化、生活等各个领域给人类带来好处,起到帮助作用,而且在互联网的一些新领域,许多新应用越来越受到人们的欢迎。当“物联网”“车载网”等新型互联网络形式出现并迅猛发展以来,在“智慧城市”“数字社区”“智能家庭”等网络社会生活状态下,人们可以通过互联网联系机器人或者其他控制器,在生活中帮助我们治理城市、管理社区、服务生活等。在有的家庭里,通过互联网洗衣、做饭、搞卫生,负责家庭安保,管理家庭事务,开展家庭理财等,已不是新鲜事。互联网不仅已经成为我们生活的好帮手,而且它在处理家庭事务的智能化、便捷化,实现绿色环保、控制资源浪费,做到科学治家等方面,都起着非常重要的作用。
但同时,我们也要看到互联网是一把双刃剑。它在给人类社会带来科学技术、思想观念、生活方式、行为方式等伟大革命的过程中,其所导致的负面作用也是不可小视的。为此,有的人认为互联网是魔鬼、是妖孽,是人类自己给自己创造的一种灾难等等。2013年9月29日,《今日美国报》网站就载文说:罪犯们正在把阵地从街头转向推特网,他们越来越多地利用推特招募成员,鼓吹其非法活动,为自己摇旗呐喊,利用推特和其他社交媒体犯罪的例子越来越多。人类社会走到今天,互联网发展到现在,我们到底应该如何认识和看待互联网,互联网到底是什么?它的本质属性又是怎样?这的确需要我们认真认识和思考。
在今天这样一个网络社会,由于互联网的构成方式的复杂性、表现形式的多样性和网络内容的丰富性,要非常准确地对这个问题作出十分科学的回答是很困难的。但是,只要透过我们上面谈到的情况和许许多多还没有谈到的互联网的现实状况,坚持从互联网所表现和反映的这些纷繁复杂的社会现象中深入进去,认真地加以研究,寻找其具有本质意义的东西,我们就会发现,从互联网所表现的内容的角度看,笔者认为互联网的本质实际上就是它的社会性,或者可以这样说,互联网的本质就是现实社会。也就是说,互联网所反映的问题无论怎样复杂,无论如何丰富,无论怎样虚拟,归根到底,其所反映的完全就是我们的现实社会。反过来,在互联网上反映的各种复杂问题,只不过是我们现实社会在互联网上的另一种表现形式罢了。因此,互联网只不过是通过数字、符号、图像、声音等特定的科技手段,把我们的现实生活在互联网上作了另一种反映。
当然,如果我们从技术手段的角度去看,毫无疑问,互联网的本质仍然是它的工具性。因为互联网无论怎样复杂,无论怎样科学,无论怎样先进,它也只不过是人类自己制造的认识社会和改造社会的一种工具而已。从对互联网的以上认识出发,我们在促进人类社会发展,推进互联网络科技进步的过程中,就必须很好地把握它的内容的社会性本质特征和科学技术的工具性本质特征。只有这样,我们才能通过对互联网本质特征的认识,有效地利用其为促进人类社会的进步和互联网科学技术的发展作出努力,而绝不能利用这个工具和它所具有的特定本质属性做出有损于人类社会、不利于科技进步的事情来。
三
互联网的内容是以数据为基本记载方式产生和发展起来的。大数据是由于互联网的出现和发展才产生的。在当今网络社会和大数据的时代背景下,如何利用大数据时代形成的良好契机发展自己,抓住互联网发展的大好时机,在实现中华民族伟大复兴和推进人类社会不断进步的进程中有所作为和贡献,这的确是值得我们去认真思考和努力践行的。
既然大数据的本质是具体的事实,那么在今后社会生活不断变化发展的长时间内,作为记载和反映社会事物的大数据的形成和表现形式也完全可能会日新月异,体现出大数据发展的突飞猛进。在这样一个变幻莫测、眼花缭乱的大数据时代,我们要对来自互联网的各种各样的海量数据进行分析分类、深入研究、去伪存真、科学储存、依法管理、有效利用,坚持从大数据的本质属性出发,认识现实社会各种具体事物,不斷转变我们社会的发展方式和人们的生活方式,使我们始终朝着科学发展、永可持续、和谐共进的方向前进。
既然互联网内容的本质是现实社会,那么我们首先需要高度重视的就是,一定要通过对互联网本质的认识,增强对互联网社会的表现形式、丰富内涵、发展规律等问题的准确认识和科学把握,从而使我们对当今的网络环境与现实社会中的事物都有更加科学、深入、透彻的认识和理解,使我们真正成为社会事物规律的掌握者和人类社会发展规律的遵循者。只有这样,我们才能够在实现中华民族伟大复兴的“中国梦“的进程中对人类社会做出更大的贡献。
(编辑:蔡秀娟)endprint