齐志远
(上海大学 马克思主义学院,上海 200444)
在信息技术高速发展的现代社会,大数据成为国内外学界持续关注的前沿领域。大数据技术的发展,既为自然科学和社会科学开辟了新的研究领域,也推动了人类思维模式、思维方法的变革。对大数据技术背后的数据本体进行分析,研究数据、大数据对人类社会尤其是对人类发展的影响,将促进现代信息技术与哲学社会科学的结合,丰富和发展辩证唯物主义哲学,提升人类的思维方式,提高人的素质并促进人的全面发展。
“数据”(data)一词源于拉丁文“datum”,指“已知”“事实”,即人类对客观物质世界的理解、认知和确证。《中国百科大辞典》将“数据”定义为“可由人工或自动化手段加以处理的那些事实、概念和指示的表现形式,还包括字符、符号、表格、图形等。”[1]涂子沛在《大数据》中则将其定义为“对客观世界进行量化和记录的结果”[2]。综上所述,数据指人类对客观物质世界的表征,即主体生成数据用以解释客观的物质实体[3]213-224。由于“物本身是对自身和对人的一种对象性的人的关系”[4]190,人类通过数据表征物的概念,与客观世界建立联系,人类的认知从无知到模糊理解,再到确切证实。在主客二元的框架里,限于人类认知能力与数据采集技术的发展水平,主体无法完整、准确地“表征”客体。数据所呈现的只是客观现实的某种取舍或近似描述[5]95-101,无法等同于客观世界。
数据表征“是用主观的知识来说明或解释客观的实体”[3]213-224,既非纯粹的主体观念,亦非纯粹的客观概念,其存在处于主客体之间,蕴含着主客二分的缺陷,因此数据中隐藏着认识论悖论。一方面,“客体”外在于“主体”而“自我存在”,因此数据表征客体必须祛除主观价值的影响,保持物质世界的客观性。而另一方面,数据获取、数据分析都需要“主体”知识、价值的预设,无法超脱于主体,因此数据表征的物质世界并非真正的客观。数据所呈现的知识也是不完整的,是碎片化的合理性,而非全部的合理性。无论是人的数据化还是物的数据化,数据表征既无法将其统一,也无法完整呈现人、物本身的复杂性以及人与人、物与物、人与物之间的复杂关系。因此在科学认知的核心问题上,物的数据化、人的数据化乃至整个世界的数据化[6],都蕴含着主客二分的裂痕。
物质作为人类发展的基础,物的数据化为人类利用物能资源、满足自身发展提供了数据支持。物的数据化,主要通过人的记录行为或信息采集技术来实现。在资本主义社会,物的数据化主要表现为物商品化、货币化。物作为商品,被打上价格标签,并在交易过程中转化为货币数据。工业革命将“自然形成的关系变成货币的关系”[7]。资本主义使以货币为度量的雇佣关系和劳资关系成为人与人之间最主要的社会关系。人类社会的一切生产、交易活动都被转化为货币数据。而货币数据实质上体现个体、群体占有生产资料或社会资源的多寡,成为制约个体生存、发展的前提条件。货币数据被视为一种客观的存在,但其背后所蕴含的社会资源及其生产方式,在持续影响并塑造着人的主观价值。“生产方式或生产条件是社会结构的基本决定因素,而人类的态度、行为和文明又是社会结构所孕育出来的。”[8]因此在资本主义时代,人的发展是基于个体所占有的货币数据及其所代表的生产资料,即“以物的依赖性为基础的人的独立性状态”[9]。货币数据所代表的物质财富,为人的个性发展创造了条件,使人获得相对独立性,但人的发展又受到物的限制,被货币数据所代表的物质资源所支配,导致人的异化。而雇佣关系的存在,使人的劳动活动被货币数据所表征,劳动的产出品也被货币数据计量,成为一种“异己的存在物”,人类劳动为产品、货币所奴役,导致劳动产品、货币与人相异化。
人的数据化还涉及到人类的认知、情绪、思维、行为习惯等多个方面。人类就其本性而言是复杂的、多元的。沙因曾提出“复杂人”的概念[10],他认为人的需要和潜在欲望是多样的,不但不同个体之间存在差异,甚至同一个体在不同阶段都存在差异,而历史的发展和社会的复杂性进一步加剧个体的复杂性。人类所具有的这种复杂性在思维领域中表现为观念复杂性与自我矛盾性[11],远远超出静态的、碎片化的数据所具有的表征能力。因此数据只能表征人类部分特征,即人类被呈现为“单个人所固有的抽象物”,成为一种“平均人”“片面的人”或“缩小的人”,而非“现实中的人”。在主客二分的框架下,现代教育体系为凸显客观性和公平性,使教育的每个环节都趋于技术化、数据化,忽视了教育的整体性和人的完整性[12]。考试成绩等数据亦外化为一种对人的“规训”,人被数据化的同时也被标准化和规格化,人成为被数据奴役的“物”[13],失去人所具有的复杂性、多样性和鲜活性,“现实中的人”与“数据化的人”相异化。
“人的本质不是单个人所固有的抽象物,在其现实性上,它是一切社会关系的总和。”[14]而人的发展也离不开客观物质世界,人类发展所需要的物质条件和时空条件被表征为离散的、碎片化的数据,主客二分的缺陷表现为抽象的人与复杂的社会现实、社会关系之间的矛盾,且矛盾日益突出。数据把人类自身的丰富多彩“祛魅”掉了,现实中鲜活的、多元的人被异化为“片面的人”“抽象的人”,人的发展被限制在数据表征的“藩篱”之内。
技术是人类在实践过程中,依据实践经验或科学原理,建构的各种物质手段以及经验、方法、技能、技巧的总和[15]。因此技术作为一种物化的人造物,是主观的技术意向与客观的科学原理相结合的产物,其本身就具有“建构”特征。现代技术及其数据化的趋势主要源于工业社会。卡萝塔·佩蕾丝指出从18世纪中后期到21世纪初,人类社会相继出现五次技术革命①卡萝塔·佩蕾丝(Carlota Perez)所指的五次技术革命分别为:第一次技术革命是产业革命,以机器的出现和工业时代的来临命名;第二次技术革命是蒸汽和铁路时代;第三次技术革命是钢铁、电力、重工业时代;第四次技术是石油、汽车和大规模生产时代;第五次技术革命是信息与远程通讯时代,也被称为信息时代或知识社会等。本文采用佩蕾丝的“五次技术革命”说。。其中工业化,蒸汽和铁路,钢铁、电力和重工业,石油、汽车和大规模生产这四次技术革命就是现代技术,这四次技术革命呈现出愈来愈明显的数据化的趋势。也就是说,这四次技术革命已然具有信息技术的“建构”特征。而第五次技术革命为信息和远程通讯革命[16],属于现代信息技术,是技术高度数据化的产物。人类步入工业文明,但人类仍面临着物能资源匮乏的困境,因此现代技术革命是围绕物能进行的,以发现新的物能资源、提升物能使用效率为目标。
这就是说,现代技术数据化的诸多功能中,用来表征物能、控制物能、改造物能的技术功能日益凸显,数据及信息的重要性仅仅被用来凸显物能的稀缺性。而人类社会的个人、事物、组织之间的丰富联系通常也以物理方式来实现,即按照“物的依赖性”进行物质、能量、信息的连通、互动与交换。人与人的联系、物与物的联通,其状态是零星的、分散的,不具备连通性,其连通形构也是相对分割的[17]。一句话,人被物分割,因此人并未获得独立性和自主性。
现代技术的数据化趋势,意味着技术的科学化、科学与技术的融合,意味着技术呈现出信息的部分特征,即信息对物能的“建构”特征。现代技术通过数据化,强化其科学属性,并凸显技术、数据中蕴含的理性、客观属性。近代科学的显著特征是它的数据化,但它根源于自然的数据化。而从数据的视野来看,科学的本质就是数据化,科学化的过程与数据化的进程是完全同步的[18]。牛顿在《自然哲学的数学原理》中,将数学、数据与现代科学相结合,通过研究“实体”,追求精确、清晰和周密的分析方法,为技术发展以及工业革命奠定科学基础。按照佩蕾丝的观点,前四次技术革命,是基于牛顿力学理论体系,围绕着“实体”展开的技术革新。自然“实体”被分门别类,使得科学能够在实验的基础上走向精确。分析“实体”的诸多“属性”,通过研究“属性”认识“实体”,而认识“属性”被等同于认识“实体”,具有强烈的还原论色彩。
在“实体”的思维下,世界被当作确定性的“实体”,客观世界的变化及其所蕴含的“关系”特征被忽视。带有牛顿力学特征的科学技术,无法处理非线性的复杂系统问题[19]。而实质上,无论是规律,还是知识,都具有信息的“关系”特征。任何“表征”客观世界的数据,或多或少地具备信息的“关系”特征,都带有“建构”的痕迹。建构主义的一个基本观点是,自然科学知识的内容是科学家在社会活动中建构出来的。尽管这种观点有失偏颇,但是从某种角度上看,现代技术的确是人类以主观价值对客观世界潜在“关系”进行建构的产物[20]。基于现代技术的数据化趋势,人类以数据量化的研究手段,从有限的、碎片化的数据中“建构”客观事物的内在“关系”,掌握客观规律用以改造、重构物质世界,为人类及社会发展创造物质基础。
现代技术的数据化趋势展现了客观世界以及人类的信息存在方式,也展现了技术、数据的“建构”特征,在一定程度上扩展了人类生存与发展的时空边界。一方面,空间被认为是一种特殊的资源,是人类生存和发展的环境和条件。前四次技术革命带来了新的能源和新的交通工具,为人类生存与发展“建构”出更为广阔的空间。即便通过物理手段,使人与人之间沟通、交流的现实空间范围也得到明显扩展。城乡、地区等物理空间开始融合,人类社会逐渐走向融合并呈现全球化的趋势。“狭隘地域性的个人为世界历史性的、真正普遍性的个人所代替”[21]。而另一方面,现代技术的数据化趋势表现为人对时间的跨越。技术与数据为人类发展提供了新的物能资源与生产力来源,以技术建构出崭新的时间范畴,取代人类工作的时间,使个体的劳动强度降低、劳动效率提升,劳动形式也更加自由。个体、群体以及人类整体可支配的自由时间大幅增加。“人将在极大的程度上从对物(满足生活需要的生活资料的物、自然关系和社会关系中的物质性力量)的依赖性关系中解脱出来。”[22]
现代技术的数据化趋势,展现了客观世界以及人类的信息存在方式。“实体”中蕴含的“关系”被数据所呈现,物理世界与数据世界紧密交织,建构出理想的数据化关联世界[23]114-119,推动人类社会向前发展。由数据建构的世界实质上是由人类认识形成的主观世界,并非全真的世界,甚至可能与客观世界大相径庭,但是其基础却是客观的牢实的,是在确证的基础上的,具有客观物质的“烙印”。因此数据的“建构”特性,意味着主客体在一定程度上的融合,即主体以数据进行自我“建构”以及“建构”客观世界的过程。
在后工业时代,人类已经通过四次技术革命将物质文明发展到一定阶段,第五次技术革命则推动信息技术的普及以及互联网连通技术的高度发展,人类的物质生产、社会交往以及衣食住行都被数据化、信息化。因此,现代信息技术是技术高度数据化的产物,它在人类社会的广泛应用,生成海量数据,由此集聚而成的庞大数据集合就是大数据。在大数据技术诞生前,人类对数据的理解和认识存在明显的局限性,传统意义上的小数据或者零散数据,其生成都需要通过人类的记录行为或由人类预设好的机器来完成,数据所呈现的也只是客观现实的某种取舍或近似描述[5]95-101,因此无论是自然界的物质“实体”,还是人类社会的“关系”,都无法被数据准确“表征”。与之相比,大数据不仅仅是“量”的积累,更是“质”的变化。这种差异性在认识层面表现为,大数据具有规模整全性和实时流动性[24]。大数据的规模整全性意味着数据的维度全,且数据采集具有最少的在先预设。而大数据的实时流动性则意味着数据的高速流动和实时获取,大数据作为人类现实生活的映射,提供了与现实生活同步的过程性。基于此,大数据技术揭示了客观世界的信息维度,指出人类赖以生存的世界,是一个诸多事物之间具有内在联系、相互渗透而又相互作用的世界。因此大数据所呈现的客观世界比传统小数据更全面,也更接近客观现实。
大数据技术构建出个人、事物、组织高度互联的社会,海量数据在互联网建构的过程中产生、生产并再生产,并建构出具有“新质”的数据“关系”、数据结构和数据分析技术,使得零散的、碎片化的数据被大数据技术建构为信息,并逐渐显现出信息的有序化、多层次化和系统化特征。数据中蕴含的信息及其潜在价值被发掘,且日益显著。单个数据与大数据的关系,是“要素”与“系统”的关系,二者之间存在内在一致性[25]。宏观世界的内部秩序通过复杂的“系统化”进入到具体的各个“要素”之中。与此同时,各个“要素”内部的秩序也通过系统内部的相互作用扩张为整体的秩序[3]213-224。而智能算法则通过模拟人脑的思维过程,建构出数据的逻辑关系,提供一种自动化、智能化的手段,使数据、大数据中蕴含的宏观世界秩序直接呈现在人类面前。大数据和智能算法融合,共同推动数据的有序化、信息化、多层次化以及系统化,使物质世界向信息世界转化。在物理世界与数据世界紧密交织的基础上,建构出理想的世界的数据化表象[23]114-119。但这种理想世界也仅仅是客观世界在人类认识层面的呈现,“人应该在实践中证明自己思维的真理性,即自己思维的现实性和力量,自己思维的此岸性”[4]500。
大数据技术的“实践”性,主要是通过“远程操作”或者遥控的方式体现的,通过这种方式将人类的实践活动“数字化”。换言之,遥控使大数据具有人类的部分实践能力,即大数据被实践化。特别是通过现代社会中广泛存在的通讯基础设施和物联网,人类将自身的思维认知、信息交往能力以“电子化”的方式增强和延伸,根植于现代城市的网络结构之中,并同其他人同样的延伸相互作用,形成了传递、刺激、感知、控制的全球系统[26]。通过“远程操作”,人类获得在远程性的条件下,以数字媒介对客观世界进行干预的能力[27]。如马克思所说,生产者通过使用“由许多机械的和有智力的器官组成的”的自动机[28]208,不再直接参与生产过程,因此“工人不再是生产过程的主要当事者”[28]218,而是通过控制系统遥控生产过程。在大数据技术高速发展的现代社会,人们甚至只要通过手指敲击鼠标、键盘或者电子屏幕的方式,就可以对生产活动进行操作和控制。而大数据算法与机器制造业的结合,更是使无人工厂的自动化生产成为现实,整个社会的生产效率得到提高。如果说,大数据算法建构出理想世界的数据化表象,那么大数据算法与智能终端的结合,特别是与机器设备的结合,则使这种大数据形成的理想的数据化表象反馈于现实世界,成为一种对客观世界进行改造的实践活动。在此基础上,大数据技术赋予了人类以数据、信息干涉和改造虚拟世界和物质世界的强大的实践能力。大数据技术使人类的实践能力以数据和信息的方式呈现,而大数据技术本身也呈现出极强的实践取向,由“表征”逐渐走向“实践”。
大数据技术的“实践”性是通过其物质载体的功能实现的。一方面,人类通过大数据基础设施建设,将5G基站、智能终端、智能传感器等大数据技术的物质载体嵌入生活环境,推动人类社会的数据化,建构出理想的数据世界。基于此,人类通过大数据技术的物质载体进行“远程操作”,以自身的实践能力干涉并改造客观世界。人类通过大数据技术的数字化符号即数据,以信息的方式进行实践,使人类社会活动的信息经由计算机系统进行数字化处理和合成转换,使主体置身于一个“关系实在”的现实之中[29]。当数据“按人的方式同人发生关系”,物被数据化也就意味着数据“在实践上按人的方式同物发生关系”[4]190。因此大数据技术基础上的人类实践突破了物质的限制,共同构成信息社会、信息文明中具有虚拟、现实双重维度的实践方式。另一方面,大数据技术在通过嵌入人类社会的物质载体改造客观现实的同时,也在不断生成新的数据,推动着大数据理想世界的不断完善,并且重塑着人类对客观世界的认识。随着人类实践形式的扩展,大数据技术作为人类实践的直接手段,使人类的实践活动越来越数据化、信息化。换言之,虚拟世界与现实世界基于大数据技术的物质载体进行融合,共同组成了人类的社会生活。因此人类的“全部社会生活在本质上是实践的”[21]8。而作为人类社会生活实践领域的虚拟世界和现实世界,以大数据技术支持下的数据化、信息化的实践活动为基础,融合并统一于信息社会中人的社会生活。
综上所述,在大数据基础之上的数据,既是共时的,也是历时的。大数据既是对客观世界的记录与认知,也是客观世界规定主体、主体内化并生成对于客观世界认识的过程。二者相互交织、相互融合,是有限主体与无限客体的同一。正是在大数据生成、传播、分析和使用的过程中,主体和客体相互融合为客观“过程”,进而主体和客体各自从对方身上获得了对自身的规定。在物质世界与数据世界紧密交织的基础上,物质世界被数据表征,物被数据化,以一种可计算、可视化的数据形式输出,人类通过大数据算法解析数据关系、形成新的知识[23],并以客观规律影响、干涉物质世界。物的数据化及其信息化提升了人类对客观世界的认知能力。而人类一直以来所具有的,改造客观物质世界的创新、创构能力,就是数据和信息物化的过程。大数据技术极大地提升了人类所具有的这种现实实践能力。在大数据技术的推动下,数据的实践化和实践的数据化,使大数据突破了主客二元分裂的局面,弥合数据表征中主客体的裂痕,使人类主体认识与客观现实统一于大数据之中。因此,大数据基础上的物数据化和数据物化标志着信息文明的到来,物数据化和数据物化意味着物信息化和信息物化,这两方面的循环构成了与整个物能文明并列的信息文明[30]。大数据技术为人类通往信息文明社会提供了一条具有潜在可能的技术路径。
但是也需要注意到,大数据技术为人类社会带来诸多便利的同时,也使人类面临着相应的社会风险。在资本主义社会中,包括计算机、智能手机、网络光纤、移动通信基站等大数据技术的物质载体都已被商品化,谷歌、亚马逊、Facebook等大数据网络平台甚至已经形成对数据的垄断,因此人类需要对资本保持警惕。一旦大数据技术被资本逻辑所掌控,将异化成为剥削人类的外在力量,形成一种新的“数据垄断资本主义”。资本通过对数据的占有,形成数据垄断优势,制造“数字鸿沟”以攫取利润,并通过大数据技术对劳动者进行监控,不断提升其劳动强度,以榨取其剩余价值。优步就建立了一套严密的信息监控系统对司机的工作方式进行掌控[31]。垄断资本还将通过大数据算法对用户进行个性化推送,不断刺激用户的消费欲望,使其支出更多的金钱[32],甚至形成“大数据杀熟”这种价格歧视行为。大数据技术甚至使人类被异化为由资本和数据所奴役的“数据工人”,形成一种新的异化劳动形式。
但即使大数据技术存在如此巨大的社会风险,它自身蕴含的解放人类的巨大生产潜力和技术力量,也仍然是人类必须高度重视的。大数据技术,特别是大数据算法,是在海量数据的基础上迭代形成的。而数据积累以及信息增值的来源是数据、信息的扩散性和共享性[33],数据一经传播,被其他机器接收、使用、加工后就会增加新的数据导致信息增值。由数据的开放、共享所导致的数据积累和信息增值,是大数据技术持续发展的动力。而资本逻辑具有独占性,这种独占性不仅表现为对大数据技术载体的垄断,也表现为对数据的垄断。因此大数据的开放性、共享性,天然就与资本的垄断性、独占性相矛盾。而当大数据技术发展到一定程度,资本对技术的独占性必然将成为阻碍其继续发展的因素。“社会的物质生产力发展到一定阶段,便同它们一直在其中活动的现存生产关系或财产关系(这只是生产关系的法律用语)发生矛盾。”[34]那时大数据革命将到来,推动人类社会向信息文明社会发展。
展望未来,在信息文明社会,大数据技术基础上数据的生成、传播、分析及使用,将成为人类未来主要的实践方式,使主体与客体交互融合,上升为一种自由自觉的活动,人在充分认识自然、社会以及人类自身规律的基础上,自觉、智能、能动地改造世界,与外部世界和谐相处。人将“以一种全面的方式”“占有自己的全面的本质”[35],以“类”的方式构建“命运共同体”,人类社会将以信息文明的方式,向着更高级的社会不断发展。