“大数据”革命与科学哲学变革的三重维度

2016-03-24 17:26贾向桐
人民论坛 2016年5期
关键词:相关性大数据

【摘要】大数据时代的来临,意味着人类历史上发生了一场新的科学技术革命,同时这也预示着一次新哲学变革的孕育与发展。这场新技术的变革,深刻改变着当代整个人类社会的生活状态,并在无形中影响着人们的认知和思维模式。当代科学哲学研究由此也发生了一系列的新变化,这主要表现在存在论、认识论和价值论三个层面上。其中,科学认识论和价值论是对大数据革命的直接哲学回应,“数字化生存”则是大数据时代新存在论的基本形式,它决定着大数据时代科学认识论和价值论的深层变化逻辑与特征。

【关键词】大数据 数字化生存 数据监控 相关性

【中图分类号】B0 【文献标识码】A

进入新世纪以来,“大数据”(Big Data)一词正在迅速冲击着人们的传统视野和思维,并由此掀起了一场全新的数据技术革命。这场新的大数据变革正在以前所未有的深度和广度改变着我们的日常生产、生活、教育、思维等诸多领域。以大数据为基础的技术革命,同时也是一场新的文化和思维革命,对当代科学哲学产生着全方位的影响。本文将结合这场科学革命的发展特征,具体探讨与之相关的科学哲学研究在存在论、认识论和价值论三个层面变革的逻辑、特点与意义问题。

大数据信息技术与人类的“数字化生存”

在大数据时代,“数据”以及“数字化”信息深入社会生活的方方面面,海量的数据与人类的生存状态直接密切联系起来。正是借助于网络计算机作为云计算的新技术平台,大数据通过虚拟化的数字形式实现了人与人之间的新式交往这一实践活动方式,从此,人类的生活逐步被数字化。这一状况是传统人类生活和生存方式所从来不具备的,这是我们前所未有过的生活状况。在传统意义上的社会生活中,信息以及经验数据总是有限的和可控的,经验数据起着自然实体存在的显现以及证据的作用。①这些所谓的信息和数据,仍然无外乎于物质实在的自然属性的表现,也即我们通常所理解的数据仅仅是物理实体的现象或显现。这样,信息数据的存在形式以及运动过程(如信息的产生、传递、加工、交换、存储和接收利用)都是物质化和实体化的。但大数据技术的发展彻底改变了这种信息数据的实体存在模式,也就此进一步改变了整个人类的存在状态和生活形式。

与传统数据具有的属性相比,大数据相对于个人的认识和把握而言则是接近于无限,甚至是不可控的。具体来说,这就是人们通常所概括的大数据的几个基本特征:海量性(volume)、多样性(variety)、高速度(velocity),“大数据就是超出传统数据库系统的处理能力的数据”,这些数据数量巨大,传输速度极快,“必须选择替代性方法处理这些数据”。②并且,这些方面的特征决定了“大范围(large-scale)数据集在算法上的对照与分析产生了预料到的新洞见和对信息的有价值的来源,巨量的信息储存和计算力需求使得数据的物理显示(在传统框架中这属于个人所有)研究和分析成为必要。”③在后信息技术时代,大数据技术进一步将人们的存在推向“数字化生存”,而且,这种“数字化”生存状态有着许多新特征。

这种转变首先表现为人类生存实践从实在转向数字模拟化生存。“我们在日常生活中所体验的世界其实是非常‘模拟化的。从宏观的角度看,这个世界一点也不数字化,反而具有连续性的特点”,但“从微观的角度看也许不是这么回事,因为和我们相互作用的物体都是相互分离的单位。”④这一特征意味着人们传统生活方式和交往方式的根本改变,信息交流的实在性和物理性为信息技术的虚拟化所逐步取代。实现这一转变的基本单位就是所谓的“比特”(Bite),它构成了虚拟世界(Virtual world)的DNA,大数据技术进一步强化了信息传播和管理的重要性,数据信息以数字“比特”的形式最有效地把现实实在与虚拟世界沟通起来。这是信息社会人类生活的一大特点,大数据革命带动着整个人类生活的一次巨大的变革。

其次,人类社会生活的虚拟化是以数据化和数字化技术为基础的。大数据之所以成为现实的一个重要原因在于其存在形式的简单性—数字化,这超越了传统信息存在的物理局限性。包括计算机、物联网等新信息技术的发展,使得海量数据的获得、处理和分析成为可能,这是信息革命的物质基础。在传统社会中信息的加工和处理相对简单,人们的认识活动也较为单一,主要局限于相对孤立、静止的经验现象,只要从实体、局域出发认识世界即可。但在大数据环境下,大量经验数据的处理超出了单个人的能力范围,云计算、大数据模型分析系统才能探究经验数据的“相关性”,建构数字化的科学模型。在这一复杂的过程中,数据成为人们认识和分析世界存在和规律的基本单位,世界的客观规律表现在数据结构的逻辑关系上,毕达哥拉斯的数为万物本源的思想得以展现。

再者,大数据的虚拟化特征在人类开创的这个具有虚拟和实在相统一的新空间里,构建起来一个全新的数字交往和虚拟沟通的以视觉为中心的网络社会。在大数据社会中,通过海量数据和数字的传输和交流,人们的生存实践活动空间大大扩展,虚拟空间具有了流动性和跨越性特征,这是一种人类前所未有的存在方式。无可否认的一点是,数字化决定着人们的生产和生活,这就是当代“数字化生存”的基本含义。在整个虚拟化和实在性相统一的世界里,人类生活的一切都几乎被数据化了,转化成了简单的数据信息,甚至人的社会地位、财富的差异等,也主要表现在信息控制和掌控的差别上,信息鸿沟的产生在某种意义上决定了人们不同的社会阶层和生活状态。不止如此,社会组织和团体也同样具有了以上特征,例如数据资产越来越成为企业核心竞争价值,并引导着社会产业升级和经济的发展。

当然,有利有弊,人类数字化生存也出现了“数据监控”现象,因为每一个人的活动都日益被电子信息化,我们的所言所行、所思所想都离不开强大的人工智能、计算机网络、电子信息等等数字代码形式的控制。数字化生存的这种集虚拟性和实在性于一体的状况,构成了科学认识论和价值论研究的重要思考来源。概而言之,大数据意味着信息资源的社会化,大数据共享为全球范围人类的生活提供了统一性的基础。数字化使得全球作为地球村彻底成为可能,迅捷的信息网络遍布于地球的各个角落,大数据的迅速与便捷实现了人与人之间的超距离、超时间交往,人们对世界的理解随之延伸和扩展,他们的思想、观念实践和思维等都有了前所未有的自由发展。所以,大数据技术的发展极大扩展和深化了人类的实践存在形式、认知能力和交往能力,数据的“数字化”和“海量化”渗透和影响着我们的日常行为,冲击和拓展着我们的生活方式和价值观念的变化。

“密集数据”中的新认识论范式

相对于传统数据的疏散和零散,大数据时代的数据表现为“密集型数据”(Data-intensive),以至于对大数据的处理被人们称为“密集数据科学”。密集数据科学面对海量的经验数据,数据挖掘工作成为大数据时代科学认识和研究的重中之重,这种密集型数据的出现,使得传统科学方法论和认识论的研究方法面临巨大挑战,为此凯林(Steve Kelling)等人将传统认识论界定为“以专家为中心”(expert-centered)的认识论范式:传统科学方法论的研究依赖于以“专家为中心的参量分析”,“其完成需要实验设计以获取所需的数据来检验假说的有效性”,经验证据和理论模型之间的关系成为方法论研究的中心。但在大数据条件下,这种方法论有了“内在的局限性”,由于时间、空间范围等的局限,大数据分析“对单个专家来说已经是不可行的了”。⑤科学哲学经验—理论的单线理解模式难以应对大数据时代的认识论这种新情况,数据的密集型特征使得单个专家甚至更广泛意义上的科学共同体也难以短时间完成数据的挖掘工作。

所以,传统认识论对经验或数据地位的经典界定,在大数据哲学背景下已经不适用了。因为大数据中的数据不再是简单静止、孤立的、不变的所予(The Given),它们具有无限性和开放性,即这些数据是动态的、变化的,甚至是可错的和矛盾的。大数据的复杂性和不确定性特征意味着逻辑经验主义以来的“概率—统计模型”和“演绎—归纳模型”失效了。与此相应,经验主义以及历史主义的各自观念(观察中立说和观察负载理论)均受到质疑,新的科学哲学观念有待提出。而且,以大数据为基础的科学研究范式关注的重点也不再是“因果”问题,面对海量数据的存在,科学家更多开始关注于相对弱化的“相关性”分析。以物理学为代表的传统自然科学研究模式对事物线性因果关系的探求方法,被相对模糊化的模型推理方式替代了。

以上认识论观念的变化还表现为对传统还原论思维方式的超越。因为大数据强调的是对事物和信息整体的把握和分析,它更多着眼于集多样态、复杂性于一体的信息集合本身,这是一种整体论的思维方法。而古希腊直到近代工业时代,可以说都是原子式思维模式的时代,“它给我们带来了机器化大生产的观念,以及在任何—个特定的时间和地点以统一的标准化方式重复生产的经济形态。信息时代,也就是电脑时代,显现了相同的经济规模,但时间和空间与经济的相关性减弱了。”⑥为此,有机论、模糊性和系统论的思维方法愈发重要。

这样,传统认识论从以机械论、因果论为基础的方法论过渡到了有机论、复杂论为内容的方法论研究,其研究的对象是密集型数据。作为与以往具有巨大差异的方法论,⑦“这种数据密集型科学采用的是‘数据—驱动进路(data-driven approach),其中的信息源自于数据,这与传统的‘知识驱动进路(knowledge-driven)相反(从数据预期检验假说模型)。”⑧这种新范式的数据探究“一般还包括需要及时处理的、未经组织的大量信息(大数据会带来发现各种新价值的机会),这有助于我们对其背后深层结构的理解,并推动如何对这些数据的有效组织和管理。”⑨这就是前面我们刚刚分析到的模型推理的特点,与传统认识论对精确性的追求相比,大数据时代的哲学研究不得不重新处理认识论中的精确性与模糊性的关系,强调统计和概率在科学预测和解释中的意义和作用。而且,他们还试图再次阐释科学中的精确性和模糊性辩证关系。

由此以来,大数据不仅是一种科学研究和认识的存在形式,也是科学研究的一种方法和途径。这种新的认识论范式表现为数据模型的思维模式,“其基本目标有两个:描述(descriptive)与预测(predictive)。通过描述以刻画海量数据中潜在的模式,并根据数据中潜在的模式来进行预测,从而发现数据中有价值的模型和规律。”⑩从方法论层面看,大数据的探究和处理工作已非传统私人科学研究模式所能胜任的,这是一项复杂的社会工程,一种社会化的认识论事业。当然,“可视性(Visualization)仍是强密度数据科学工作研究和分析的本质部分”,以“可视性”为基础,虚拟化的全方位感官体会成为信息和大数据处理问题的核心和关键。这也要求大数据处理技术空前的系统化,为此,科学与技术研究方法和科学技术的管理和运作模式结合起来,大数据处理要被置于全社会平台之上,信息数据的收集、管理、分析和储存都是社会认知劳动的有机程序之一。正因如此,传统科学认识论和方法论的理论至上观念进一步破产,自然科学方法还需要社会组织的分工合作,即科学社会实践的优先性问题突显出来。正是大数据的混乱性和无序性彻底颠覆了人们对经验基础的迷恋,以此为条件的个体主义(individualism)认识论受到质疑,而数据和信息的处理与认知问题更多和互动主义的社会认识论(Interactionist Socialism)联系起来。还不止如此,在大数据技术的社会建构背景下,自然科学研究与人文社会科学研究的界限进一步被打破,信息数据作为所有学科(包括自然科学和社会科学在内)所共享。数据处理等工作既是科学研究的方法,也是社会管理活动的一部分,而且,数据密集型科学、公众科学(Citizen Science)和信息化科学(E-Science)的结合成为未来学科和方法论发展的趋势。

大数据技术理性与价值论的融合

我们在大数据的科学哲学分析中往往会忽略掉科学技术的价值论这一层面问题,或者仅仅只是从工具(实用)价值角度来看待大数据革命。例如,我们在分析大数据基本特征时就特别强调海量数据的“价值”属性,很多人还把“价值性”(value)列为大数据的基本属性之一,但这主要是一种实用的、经济学意义上的价值。但这种价值只是大数据革命产生的一部分内容,实用价值只是整个人类生活世界的一个维度,科学技术革命带来的是我们现实生活全方位的变革:人类思维和认识的价值、审美的价值、经济实用的价值、伦理道德的价值等等。在这里,我们要强调的价值论是指大数据革命引起人类实践和存在形式变化之后随之而来的人文价值和意义问题,以及人文精神与科学精神的价值论融合问题。

如前所述,大数据以信息技术为平台实现了海量信息的快速传递、多维度交流以及潜在与实在信息价值的社会互通。由此,数据和信息资源构成了一个统一而仿真的全新信息空间。大数据系统以网络、技术构造的数字虚拟世界为中心真正实现了社会时空的伸缩,大量数据和信息转瞬即可获得,这为人们的日常生活带来巨大的便捷。但这种便捷是以信息技术的数字化、虚拟化为中转的,与传统信息交流方式,如言语的沟通、肢体的动作、眼神的交换等相比,巨量信息以网络技术为媒体的传播只是间接性的、数字符号化的,这种虚拟化的实践交往模式缺乏传统人与人直接交往所带有的情感温情,语言和行为也通过数据形式转化为了冰冷的信息符号。这就是大数据时代人类生存实践中的非人性化和工具化问题,这一状况进一步加剧了现代社会以来的技术异化现象。可见,在定位上,大数据信息技术的异化仍是传统技术异化问题的延伸,科学技术的人文化和价值论批判还是适用于对信息技术的反思的。

这种信息技术异化具体表现为信息与大数据的无限量扩张和渗透在实现服务于人的需要的同时,使得人们不得不面对过量的信息轰炸和数据监控等技术的自然属性和社会属性问题。面对铺天盖地的海量信息数据,人们往往会无所适从,“信息主体失去了对信息的控制能力并为信息所奴役和支配,陷入“信息崇拜”的异化盲区,正是信息作为“技术”的异化结果。”由于大数据技术将人们的生活信息数据化,数据监控、数据安全、网络失范、信息伦理等问题均是依存于技术异化现象的,所以大数据技术异化的技术控制和相关伦理问题,我们还需要将之还原到人的数字化生存这一基础上,反思技术理性的片面发展问题,结合人生的意义和价值问题来综合解决。

大数据代表着近代以来技术理性精神在当代世界的支配性发展,这导致了工具(技术)理性进一步扩张到了人类社会生活的各个方面。相比于传统科学技术,数字化和数据化的信息技术革命更具抽象特色,它在无形之中就改变了整个人类的生活形式。在大数据的控制下,人的一切存在属性,甚至包括人的身份、财富和地位等都被量化和数字化,每个人的言行也要与数字化生存相适应。大数据技术带来的数字化生存形式支配了人们的日常生活,形式化和单一化的生活成为许多人的普遍生活状态,人们在这一数字加工厂中被生产成为了同样属性的五花八门的电子产品。但这种多样性只是形态和种类的形式多样性,精确加工厂中的人是没有个性精神的单向度人,是名副其实的负载数据的电子产品。但是,相对于形式多样性的实质多样性却被统一的数字一笔抹平了,可以说,不仅近代科学革命造成的自然界“祛魅”被彻底合理化,自然界被数字化。而且,人类生活世界本身也进一步被“祛魅”,本来充满意义和价值的人的世界在数字化的技术控制下同样数字化了,在技术功利性取向的引导下人类社会效率大大提高,但同时必定会消减人及其存在和生活的意义和价值维度,即人活生生的存在和实践的形式化和数字化使得“生活世界”失去了原有的意义和价值。

但大数据时代也孕育着新的文化超越性,新的技术发展和哲学思想的转变为融合事实与价值的分离提供了可能性。在传统上,自然科学将自然界数据化,使得毕达哥拉斯“数是万物本源”思想得以实现,而大数据时代的技术革命进一步使得人类社会的数据化成为可能,在此意义上,自然世界和人类社会又重新统一起来。所以,大数据革命带来的信息与数字化生存状态既带来人类未来命运的危机问题,但又是超越这种危机的一次机遇。从近代理性原则这一现代社会的核心价值观来看,技术现代性的实现表现在大数据时代,同样是作为主体的人对图像世界的重构过程,信息数据作为技术平台蕴含着人本主义和技术理性主义二者的双重逻辑。只有在关注于人类生存这一根本价值的前提下,才能恢复生活价值于科学认识和科学实践的标尺地位,从而实现技术理性与价值理性的有机统一,这表现在人与自然关系上就是人与自然关系的和谐。所以说,人类生活的价值和意义问题是我们处理好科学哲学认识论以及科学伦理问题的总出发点,人类的这种新的存在状态决定了大数据时代科学认识论和价值论问题的提出与问题解决的基本逻辑。

余论

大数据意味着人类数字化生活时代的来临,在这场科学技术变革中,人们的生活方式、认知模式和价值观念都在发生着深远的转变。人类符号化的社会实践活动将我们的生活推进到了一个无限广阔的领域,数字化生存状态成为科学认识论和价值论研究的新视角。就此,在大数据语境下,科学实践这一存在论维度于科学认识论和价值论中的重要性更加突出,传统认识论研究范式发生了重大变化:信息和数据的密集化使得认识论个体主义的基础地位急剧下降,而“互动主义”的社会论的理论地位上升,如此以来,认识论和方法论的个体认知和社会建构模式综合起来。同时,科学认知社会维度也彰显了科学实践的基础性地位,这为事实与价值的沟通提供了确实可靠的桥梁。一方面,科学事实即是人们在感性科学实践中打交道的经验数据,这些信息数据必然具有属人的性质;另一方面,科学价值更是以科学实践为中介而形成的,这并非纯粹的主观判断,它具有科学实践的客观依据。简言之,大数据奠定的新的科学实践形式,为科学哲学观念的变革和发展提供了新的研究视野和研究内容,在这一探索过程中,我们只有将其中的存在论、认识论以及价值论三重维度统一起来,才能使得具有超越性的大数据时代的科学哲学研究拥有新的发展前景。

(本文系教育部新世纪优秀人才支持计划项目与国家社科基金项目阶段性成果,项目编号:14Bzx020)

【注释】

①Peter Machamer. Phenomena, data and theories: a special issue of Synthese .Synthese,2011(1) :1.

②David Feinleib. Big Data Bootcamp. Apress L. P,2014:1.

③Mél Hogan and Tamara Shepherd. Information Ownership and Materiality in an Age of Big Data Surveillance. Journal of Information Policy, 2015(5):7.

④T. Hey, S. Tansley, and K. Tolle, The Fourth Paradigm: Data-Intensive Scientific Discovery,Proceeding of the IEEE,2011(8):1334.

⑤⑧Steve Kelling,W.Hochachka,D.Fink,M.Riedewald,R.Caruana,G.Ballard,G.Hooker. Data-intensive Science: A New Paradigm for Biodiversity Studies, BioScience,2009(7):613-617.

⑥[美]尼葛洛庞帝:《数字化生存》,海口:海南出版社,1997年,第191页。

⑦格瑞尔(Jim. Gray)、海尔(T. Hey)和陶利(K. M. Tolle)等人都认为数据密集型科学研究为一种新的,继实验科学、理论推演、计算机仿真方法以来的第四种科学研究范式。

⑨Min Chen, Shiwen Mao, Yin Zhang, Victor C. M. Leung. Big Data:Related Technologies, Challenges and Future Prospects.Springer International Publishing,2014:1

⑩张晓强,杨君游,曾国屏:“大数据方法:科学方法的变革和哲学思考”,《哲学动态》,2014年第8期。

Philip Kitcher. The Third Way: Reflections on Helen Longinos The Fate of Knowledge. Philosophy of Science, 2002(1):550.

贾向桐:“论信息异化的技术根源与调控”,《信息系统工程》,2010年第2期。

责编 /王坤娜

猜你喜欢
相关性大数据
基于Kronecker信道的MIMO系统通信性能分析
小儿支气管哮喘与小儿肺炎支原体感染相关性分析
脑梗死与高同型半胱氨酸的相关性研究(2)
脑梗死与高同型半胱氨酸的相关性研究
会计信息质量可靠性与相关性的矛盾与协调
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
决策有用观下财务会计信息质量研究