□ 黄在忠
在数字经济(digital economic)时代,大数据、物联网技术与现代社会生产生活的关系密切。对数据(data)的收集和运用体现了技术的进步,也呈现出一种数据商品化和资本化的特征。数据通过不断累积其体量,借助自身被数据库记录和加工为信息商品在市场上交易的过程,完成了数据的资本化转变。在有关数据的生产和交易过程中,数据的所有权和使用权互相分离,为企业增加利润和扩大市场影响力带来了新模式。
数据是当今生产生活中常见和不可或缺的要素。数据的本质是一种信息,它承载的内容和体量反映了特定时期经济社会发展的水平。现代社会治理工作的展开需要借助统计学对数据进行收集和分析,对数据的利用水平受人们接收与处理信息的能力制约,这个能力随着科技进步实现了从过去基于抽样调查的因果分析到如今利用大数据技术进行相关性分析的跨越。
数据经历了从统计学数目字到宏观经济数据的转变。在17世纪中叶的欧洲即古典统计学萌芽时期,人们采取抽样调查模式,以求从最少的数据得到最多的信息。例如英国政治算数学派代表人物约翰·格朗特在1662年就利用当时教区对伦敦死亡人数的记录来估算整个伦敦的人口,“但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择”[1]34,样本的随机性会影响结果的准确性。由于抽取样本的信息量十分有限,它在排除与调查目的不相关或者错误的信息的同时,会导致结论不具备普遍性,让调查数据的真实性受限于样本与结论之间的线性因果逻辑。现代社会比过去更加重视对社会经济运行情况的审计考察,有关社会的数字(digit/number)统计成为考察和研究经济发展情况的晴雨表,其最直观的表现就是每个季度由审计部门公开的各项事关人们“吃喝住穿”的经济数据,如CPI(居民消费价格指数consumer price index)、PPI(生产价格指数producer price index)、GDP(国内生产总值gross domestic product)等。这些来自计量经济学的调查方法将数字统计与社会经济结构分析有机结合起来,强化了基于人口与数字化经济总量在分析和理解上的数字逻辑同构性。因此,在从事这种审计工作时,就必须将具体的生命活动抽象化为精确的数字,呈现社会共同体多种事关社会大生产的行为在特定时间、区间或者事件中的动态分布或者大体分布趋势,每一串数字的背后都指向体量非常庞大的社会群体。
在智能时代,通信技术的进步和数字计算机的普及,推广了电子记账和在线交易等新型数据记录与保存方式,经济数据得以利用一种与人类存在的时空完全异质且更精确的样态,实现了从问卷和账本上的统计数据向网络和系统上存储和传输的流动数据的转变,统计科学也就在物联网和云计算等新技术运用的加持下发展成为更加依赖数据分析的数字科学,构成当下数字经济的重要特质。现代社会的存在根基也越来越被这种表现为数字统计的加速活动所表达,生动表现为社会有机体在生产和生活领域中通过联网设备留下的大量行动痕迹。此外,与抽样调查的线性因果逻辑不同,数字科学的统计逻辑是非线性的,它通过尽可能多地占有数据以占有一种事实与数据之间的相关性,靠这种相关性贴近对现实情况的描画,形成了“大数据”逻辑。“大数据”是指数字科学中“需要处理的信息量过大,已经超出一般电脑在处理数据时所能使用的内存量”[1]8,技术人员必须借助性能更强大的计算机和通信网络等软硬件工具才可以收集和处理这些数据中隐藏的大量信息,分析涉及人类生活的各种问题,挖掘复杂的数据来统计规律。海量的数据、繁多的信息种类以及数据对现实的有效反映,是数据分析能够对现实决策产生有效影响的重要保证。
海量数据的实时传输和记录保存需要精密网络设备的支持。技术哲学家芬伯格指出,当今世界已经形成一个利用数字计算机“控制自然、经济、管理或其他环境”[2]的数字智能领域,技术与社会互为嵌套,我们在网上进行的娱乐与消费以及分享和传输数据行为也离不开使用智能设备服务来实现。据统计,2000年全年社交网络数量仅相当于2018年一天的量,到2020年更是只等于1小时的量[3]。数据是对人们日常生活动态的记录,数据存储和流动(传输)构成了数字经济的“大数据”基本样态。海量数据的传输需要更加高效和智能的网络技术支持,物联网(internet of things,简称IOT)正是能够满足这一需要的技术,它通过诸如红外感应器、全球定位系统(global positioning system,简称GPS)、激光扫描器等传感设备,利用计算机智能协议将各种终端设备与互联网结合起来,把用户端产生的庞大的数据流量传输到各个智能应用技术端口,把人与人之间的社交网络沟通形态拓展到人与人、人与物、物与物之间,实现多维度的智能化识别、定位、跟踪、监控和管理。
马克思认为,“个人的一定的活动方式,是他们表现自己生命的一定的方式,他们的一定的生活方式。个人如何表现自己的生命,他们自己就是怎样”[4]。在数字经济时代,物联网和大数据所搭建起的技术平台存在着大量动态数据,让数字化成为发展技术生产力的新趋势。通用电气在2012年就曾主张用“大数据与智能化机器”“把整个地球建成一个可以识别传感器数据的巨型计算机”,创建“工业互联网”[5],通过把设备、生产线、工厂、供应商、产品和客户紧密连接融合起来,实现跨系统数据流动,借助“数字孪生”技术进行产品建模分析,推动工业生产的智能化。此外,诸如京东、淘宝、亚马逊等在线电商平台,也通过后台程序记录人们浏览网页和购物消费的行为所产生的数据信息,时刻在网上进行传输,与快递物流动态追踪、网约车和餐饮在线预订服务等平台有着数据上的交互共享。产业和商业领域的数字智能化发展搭建起一种独特的信息平台,依托这类平台开展的经济活动也被称为“平台经济”,它囊括了当下诸多利用平台建立起来的社会生活关系。资本得以在产业资本和商业资本的形式之外,借助互联网企业寻找增加利润的新途径,构筑起一种新的资本运作模式,将数据传输、挖掘、分析和计算等一系列操作和流程集于一身,利用产业升级的契机将数据商品化。
迄今为止,资本主要通过剥削实体制造业中的劳动者,利用劳动者生产相关的产品创造剩余价值,再借助产品的销售来获得利润。在人类进入智能时代之后,大数据和物联网技术推广让生产和生活增加了数字化、信息化、智能化特征,资本要获得利润,除了继续依靠实体经济中劳动者的辛勤劳动之外,还通过发展出平台资本这种新样态实现对数据信息的深度经营。这种经营方式离不开数据的商品化趋势,离不开由数字智能在全社会范围内不断构筑的物联网结构,即自下而上互相配合的感知层、网络层和应用层三部分:感知层负责利用传感器、二维码等设备随时随地识别和采集物体的信息;网络层将电信基础网络与互联网中各行业的专业通用网络融合,对各类数据信息进行组网传输,完成信息的实时准确传递;应用层作为结构的顶层,负责通过计算机的云计算平台处理信息和数据,实现对物体的识别、定位、跟踪、监控,为企业或个人提供基于数据分析结果的应用管理和决策参考。这个结构使得海量信息能够被数据系统捕捉并传输,由企业雇用的技术团队从事有关数据分析和产品研发的工作,资本也通过捕获来自社会各行业领域活动的数据,根据产品研发需要对数据进行定量采集、更新信息并加以整合,将技术团队的分析和研发成果转化为数据商品,提供数据管理服务和决策,这便是数据挖掘产业。
数据挖掘产业的成型和发展高度依赖大数据和物联网技术。第一,就技术所依赖的数字科学而言,大数据时代的相关性逻辑体现在不断保证海量数据收集工作是否符合现实客观性和有效性,它让分析师不再通过深究事物的具体运作机制来做研判,而是展开覆盖面极广的社会数据调查或者信息集合分析,去尽可能地预测关于未来的发展趋势。在具备强大运算能力的数字AI和程序的帮助下,人们依靠数据标注和选择关键词进行信息筛选,利用云计算绕过了因果逻辑,转而对现实采取“是什么”以及“会怎样”的算法预测,其精确度随数据量的不断增加并且越发贴近现实情况。不断收集和更新数据就是数据挖掘工作的有效性的重要保证,即通过占有越来越多的数据进行相关性判断,取代基于有限数据所做出的因果性推断。
第二,数据分析是应对不同需要而展开的信息处理和数据统计工作,具有严格的技术要求,面向复杂多样的数据产品和服务市场。从建立智能制造工厂所需要的“数字孪生”技术,到电商平台常用的“用户画像”所需的针对消费者信息进行深度挖掘和制定营销策略,再到门户网站的搜索引擎功能具备的智能推送与推荐算法,甚至是依据搜索关键词点击率为网友呈现搜索内容的优先次序排位等服务,都需要十分精确的数据挖掘技术服务做支撑,而这种工作的劳动强度远不是个人仅靠人脑的反应能力和思维能力可以承受的,而是需要熟练掌握相关知识和技能的团队配合拥有强大计算能力的AI数字网络作为硬件设施从事专业性极高的操作才可以实现。这也是大数据统计所需要的技术支持。
第三,数据挖掘产业提供的是不同于一般物质产品的数据商品。当互联网企业成为新的市场主体时,资本就能让这些企业以不直接投资实体经济的技术优势参与全社会的生产生活中,推广数据挖掘业务,承载市场动态信息的数据最终由数据分析员和技术工程团队基于分析结果进行转化处理,甚至是研发出用于进一步感知世界、传输数据的应用程序软件,为使用者提供配套服务,让数据作为商品而存在,成为经济活动中一种活跃着的生产要素。这就要求数据挖掘团队必须对原始数据进行标注,挖掘分析出相较于杂乱无序的初始样本更加有序和完整的“干净数据”,作为初始样本的剩余,它既是本次分析流程的成果,又是下一次分析流程的原始数据;等到将新采集的数据加入到本轮分析结果后,开始加工新的“干净数据”。在数据挖掘过程中,数据库会随着整理工序的不断推进产生“一次数据”“二次数据”的持续累积处理并记录保存结果,即要求必须始终有基于样本数据的剩余数据存在并不断积累,这个要求在整个数据挖掘过程中被凸显出来,让每一轮由数据挖掘团队劳动所创造的成果,都借助一种被不断积累和拓展其信息量的数据承载,它构成数据商品的大数据技术特征,也体现了数据商品的特殊性。
概言之,数据在不断被上传和分享于网络的过程中增加自身蕴含的信息量,对于这些数据的利用和开发,唯有借助掌握了使用AI计算机和相关的算法程序处理并实时转化运算结果才能充分实现,并且在市场经济条件下,只有让这些已经经过分析并被利用起来的数据融入平台资本或互联网企业的产品中,才能体现这些商品化了的数据的使用价值。数据在这个分析与加工的过程中,也就必然呈现出一种能根据需要不断被收集和积累并持续重复使用的特征,作为一种不局限于一次使用的特殊生产要素,在数字化产业升级的作用下成为不断积累和增加其使用价值(与价值)的资源,融合到企业提供的商品与服务中。
在技术团队劳动生产数据商品的过程中,每一次研发都凝聚了团队劳动所创造的价值,这个研发过程需要有相当多的数据剩余并保留下来,作为下一轮开发周期的基础,原先收集来的海量数据也就可以分为被使用的部分和未被使用的部分。有学者将未被分析和采用的部分数据称作“剩余数据”(surplus data)[6],这其实指的是数据挖掘过程中的数据剩余(remain data)现象,即积累着的尚未被加工的数据。笔者认为,真正的“剩余数据”是一种经过技术团队分析和加工后的数据,而不是尚未被使用的数据,它作为数据挖掘的直接产物,不仅和未被加工的部分一样需要积累起来,还必须融入数据商品中从而凝聚数据挖掘产业的技术工程师与团队劳动所创造的价值。这是能让资本借助这种新兴产业获得利润的秘密,也是应该结合数据商品化劳动过程来加以考察和理解的重要概念。
在大数据时代,来自各个行业的零散数据只有汇聚成海量信息流,才能充分体现大数据的统计学意义,针对数据展开收集和分析工作才有意义。此外,数据商品化的含义是“数据平台将信息交流的公共服务转化为商品的生产与消费,并在市场经济的影响下持续商品化。”[7]对此,有学者指出,“私人数据如果不被企业收集处理,就不会直接进入生产过程,也不会进入数据的生产要素化过程;即使私人数据被企业收集处理,私人数据也是没有价值的,因为并非是在劳动过程中产生的”[8]。这种判断有其合理性,因为数据挖掘工作是极度依赖物联网大数据和云计算技术的,融入数据商品中的“剩余数据”也具备能够被长期积累的特点。此外,已经生产出来的“剩余数据”还能伴随互联网企业商品和服务的推广而在云端数据库里被动态地记录与回收,与新收集的数据一起整合为新一轮“剩余数据”的生产原料,具有一种可在重复使用过程中丰富其精确性的特点。这就体现了数据商品及其相关服务不同于一般物质商品的大数据特征,即时刻收集信息、更新内容。
可见,“剩余数据”中的“剩余”并不是指每一轮数据挖掘后没有被采纳进分析结果的部分,而是指始终在数据挖掘中被采纳和不断在积累周期中形成的部分,成为一种必须存在的“剩余”,正是这种独特性让数据的收集过程与企业增加利润的目标之间有了某种关联性,互联网企业不仅能以更低的成本获得利用数据的机会,还借助数据挖掘产业搭建起数据库和技术平台之间的联系,对数据的开发也由此实现了一种资本化运营,成为一种数字资本,它是“剩余数据”商品化之后的结果。由此,资本掌握了有效开发与利用数据的技术,通过数据商品化实现了数据产业化。
商品作为用于交换的劳动产品,是具有使用价值和价值两重属性(即商品二重性)的统一体,数据商品也是如此。当互联网企业通过出售技术服务与其他企业进行交易并购买到数据包时,原始数据直接以商品的形成存在;当互联网企业是通过与其他企业合作的形式获得原始数据时,原始数据的商品属性则体现为其他企业所购买的能够产生和搜集原始数据的设备的附属物。原始数据的使用价值不能与“剩余数据”的使用价值相混淆,这是因为:(1)对数据挖掘团队而言,原始数据的使用价值只是短暂体现在制定分析工作目标和丰富数据商品使用价值时的参考过程,但是数据挖掘的成品不再是原始数据,所以互联网企业和技术团队也就不生产和保留原始数据的使用价值;(2)在数据挖掘团队生产的智能产品、程序软件以及提供的配套服务中,“剩余数据”的使用价值融入数据商品的使用价值中。原始数据的使用价值和“剩余数据”的使用价值也对应了两种价值:(1)原始数据的价值,但它不是数据挖掘的产物;(2)“剩余数据”的价值(即融合了“剩余数据”要素的数据商品的价值)。这里便存在着这样一个问题:数据商品作为一种不同于一般物质商品,其价值是由什么样的劳动生产出来的?这个问题在数字经济的语境下便转化为:能否将和生产数据商品有关的活动称为一种创造价值的生产劳动,即“数字劳动”?
近年来,随着数字经济的不断发展,学界围绕“数字劳动”概念本身的定义和适应范围的讨论也逐渐激烈,存在诸多争议。在此,受限于本文篇幅,笔者不便做详细述评,而是基于“剩余数据”背后的生产关系,结合马克思对“生产劳动”概念的讨论,提供另一种理解。
对于“生产劳动”概念的判别标准,马克思在《政治经济学批判(1861—1863 年手稿)》中认为,“从资本主义生产的意义上说,生产劳动是雇佣劳动,它同资本的可变部分(花在工资上的那部分资本)相交换,不仅把这部分资本(也就是自己劳动能力的价值)再生产出来,而且,除此之外,还为资本家生产剩余价值。”[9]在资本主义生产关系中,决定一个劳动是否是“生产劳动”,或者说是否具有“生产劳动”的性质,在于这种劳动是否为资本家创造了使用价值或价值(包括能转化为资本的利润的剩余价值)。那么判断数字劳动是否是生产价值的劳动,首先就要看它是否生产出具有使用价值和价值的数据商品,为资本榨取利润提供源泉。此外,马克思也强调,对“生产劳动”的定义是就直接生产过程而言的,“只有那种在同对象化劳动交换时能使对象化劳动表现为一个增大了的对象化劳动量的劳动,才是生产劳动。因此,资本主义生产过程并不单纯是商品生产。它是一个吸收无酬劳动的过程,是一个使生产原料(材料和劳动资料)变为吸收无酬劳动的手段的过程。从上述一切可以看出,生产劳动是劳动的这样一种规定,这种规定首先同劳动的一定内容,同劳动的特殊效用或劳动所借以表现的特殊使用价值绝对没有关系。”[10]331-332综合来看,判断一种劳动形式是否是“生产劳动”必须包含这样几个特点:(1)以直接劳动形式将生产原料加以转化;(2)通过对商品的直接生产来实现的;(3)增大了劳动过程中的劳动量。因此,能够创造价值的“数字劳动”应该是直接生产数据商品的劳动。那么从事这种劳动的又是什么人呢?
回顾数据挖掘产业中“剩余数据”的诞生过程,不难发现,作为数据挖掘产业重要的生产原料(原始数据)的提供者,即处在物联网上应用层的个人用户与掌握数据库的平台和企业,他们并不是从事数字劳动的劳动者,因为通过使用智能设备和数字平台而产生大量在线数据的行为本身并不是一种数字劳动,智能工厂在生产过程中产生了数据以及个人观看视频、网上购物和订餐、查阅地图、滴滴司机接受载客订单等行为,都不是以生产数据为直接目的的劳动,这些数据提供者与生产、提供数据商品和技术服务的互联网企业之间不构成直接与间接的劳动关系。另外,收集和分析原始数据对组织商品生产、物流派送、提供在线服务的企业或平台而言,并不是它们获得利润的直接来源,即企业和技术平台不以生产和开发利用这些数据为主要目的开展业务,这些数据具有用来考察自身运营情况的使用价值,但不具有增加本行业利润的价值,无法为资本获得利润提供直接途径,也就是说,原始数据的使用价值,虽然对数据挖掘团队所在的互联网企业而言并不重要,但是对其他企业而言却是重要的。
因此,从原始数据来源广泛和提供数据的行业复杂多样的情况来看,产生和提供原始数据的行为并不是一种由平台资本主导的“生产劳动”,即不是数字劳动,原始数据也不是这种数字劳动的直接产物,在收集原始数据的环节,不存在平台资本通过数据资本化(即数字资本)的途径来获得利润的情况。原始数据的使用价值唯有在被平台收集和整合获得大数据的原料形式之后才得以凸显,成为数据挖掘所需的原料,原始数据自身的价值来自生产这些采集数据的设备的生产过程,是生产智能设备的劳动的价值转移的结果,生产和提供智能设备的制造业也由此与数字经济建立了联系。
“剩余数据”的商品二重性(即价值和使用价值)来自数据挖掘团队研发新数据产品的劳动过程,换言之,生产“剩余数据”的劳动是创造新价值的“生产劳动”,即数字劳动。“剩余数据”是对原始数据的加工和深度分析挖掘,其价值来自数据挖掘团队借助数字AI与计算机进行的数字劳动,这种劳动不同于用户制作视频和分享个人生活、观点等的私人行为,是一种以小企业接受劳务外包或者团队受雇于大型互联网公司的形式而展开的社会劳动,利用计算机程序将数据作为一种生产原料进行直接生产和加工。尽管数字计算机的运算能力减轻了劳动者分析庞大数据量的工作负担,但仍需要劳动者具备分析解读信息并让结果可视化呈现的专业知识,并为此消耗脑力。数据分析师通过对原始数据进行有目的性和针对性的挖掘,完成一系列统计学层面的分析和描绘,获得了有关数据背后体现的其他行业的生产和运营状况信息,这些信息以原始数据的不断积累和挖掘、经历无数次对数据的处理周期和次数,成为一种凝聚了技术工程师及其团队的数字劳动的价值承载物,即“剩余数据”。“剩余数据”作为一种技术产物,其使用价值具有数字智能化和网络化特征,当数据挖掘产业的商品和服务进入市场后,借助数据商品能够追溯出厂信息的功能,连接买家与厂家,使得这些数据能够继续在系统网络上为数据挖掘团队追踪和了解产品使用情况、改进数据研发服务和调整分析结果提供更多的信息,帮助团队实现对“剩余数据”的再生产。由此可以看出,从事数据挖掘工作的工程师团队才是从事数字劳动的人,是真正的数字劳动者。
在生产“剩余数据”的过程中,作为原料的原始数据没有作为商品(即数字劳动的产品)的能让资本获得利润的价值。原始数据的价值来自生产这些收集数据的设备的劳动过程,是通过技术设备本身的出售和使用过程实现价值转移,让价值进入原始数据中的,而不是由使用者产生数据这一行为本身生产出原始数据的价值,因为用户也不以生产数据为目的去使用智能手机和物联网。生产这些设备的劳动所创造的价值随着原始数据作为数字劳动生产原料进入数据挖掘流程而一起发生价值转移。当原始数据被进行数据加工的互联网企业购买,或者通过其他商业合作途径获得,它们作为数据挖掘产业中数字劳动的生产原料,其价值就被数据挖掘这种数字劳动转移至“剩余数据”的物质载体即数据商品中,成为包含在产品和服务中的新的价值组成部分。
数据商品的使用价值和价值需要数据工程师、技术人员利用计算机设备从事高效的数据分析工作才能被生产出来,这些商品中的“剩余数据”的意义也不只体现在有限的几次数据挖掘和产品研发过程。在互联网企业将商品和服务投放市场之后,这些“剩余数据”会作为产品参数被备份在云端数据库,而活跃在已经出售的产品与配套服务中的“剩余数据”,则表现出大数据和云计算技术对现实生产生活动态地进行精准描画功能,将这些动态信息利用物联网重新传回数据库,更新原来的备份数据,成为云端存储系统里下一轮数据挖掘的原始数据的一部分,即“剩余数据”的价值具有一种必须借由数据商品和数据库来实现收集与更新的功能,原来的“剩余数据”经过这个数据商品的信息反馈过程变成了新的“原始数据”,也就是说,新的“原始数据”来自原“剩余数据”的价值的商品表现形式,即数据程序软件、智能设备和服务等在收集到市场反馈之后进一步被整合为新数据,成为原“剩余数据”的价值转移的承载对象,由此就形成了“原始数据1——剩余数据1(原始数据2)——剩余数据2”这样的数据积累过程。换言之,“剩余数据”自身的持续更新,能为数据制造业、商业等改进生产工艺、升级程序,提高服务水平等提供更多基于市场动态的与时俱进的参数,在全社会形成对数据挖掘工作的持续不断的技术需求,生产包含“剩余数据”的数据商品的互联网企业会比生产一般物质商品的企业拥有更短的生产周期和更小的经营成本优势,“剩余数据”的更新会伴随着新一轮工作的展开而进行。
数据挖掘产业的出现让平台资本吸纳了技术团队的数字劳动,这种劳动“作为创造价值的活动却增殖资本的价值”[10]327,生产出包含“剩余数据”的数据商品,数据商品的价值随着其他企业或平台对数据挖掘服务和商品的购入,进入其他领域的生产和服务环节,实现价值转移。当互联网企业通过提供包含着“剩余数据”要素的商品和服务与市场上的其他企业或个人完成交易后,平台资本便能获得利润。
由于数字化转型正影响着社会方方面面,数字挖掘产业的发展与繁荣便彰显了数据作为生产要素在其他行业内的作用,加深了互联网企业与制造业、商业领域其他企业的合作与深度融合,这更有利于形成“数据生产要素占有者要求获得其他企业创造的剩余价值”[8]的局面。换句话说,提供数据挖掘服务的互联网企业能够通过持续参与其他行业的运营并从中获得利润。譬如,互联网企业为智能制造业提供“数字孪生”即可视化平台的技术支持,研发监测产品(如汽车零部件)生产情况的系统软件、车间系统的智能控制程序,让这些数据商品成为制造业中生产劳动所需要的生产原料的一部分;设计行业利用互联网企业根据本行业需要打造的在线广告平台进行营销,或者借助数据挖掘来完成的自身产品的设计和制造,“剩余数据”的价值就转移进其他类型的产品价值中。电商平台和外卖配送平台购买来自互联网企业出售的数据商品服务或者利用服务外包与互联网企业开展商业合作,利用外包技术公司提供的大数据挖掘分析成果了解市场动态,构造“用户画像”和使用推荐算法调整营销方案和改进配套服务,“剩余数据”的价值也就转移到制造业和商业领域中。当数据商品以智能服务与软件程序在市场上普及,任何市场主体都能够使用数据挖掘技术的产品和服务为本行业带来便利,也就必须为使用这种技术商品和服务支付费用,也就是将本行业的一部分利益让渡给提供数据商品的互联网企业。
有学者将平台资本通过数据商品化获得的利润统称为“数字剩余价值”[11],这固然肯定了“剩余数据”为资本带来利润的重要作用,但是它并没有揭示出隐匿在数据商品化背后的所有权和使用权相互分离的问题。
作为数据挖掘素材的原始数据由被物联网传感器收集的碎片数据构成,这些碎片数据诞生于人们使用智能设备之时,带着提供这些设备的企业品牌烙印(例如京东,亚马逊,微软、滴滴、美团等)。人们使用技术设备的直接目的不是为了生产这些原始数据,原始数据的价值来自生产这些设备之后发生的价值转移。当碎片数据被采集并由物联网构成原始(大)数据的时候,个人用户便不具有对这些原始数据的使用权和所有权,这些数据的拥有者也变更为提供设备服务的制造业企业和电商平台。只不过,对组织实体商品生产、物流派送、提供在线服务的企业或电商平台而言,原始数据的价值并不是其获得利润的直接来源,这些企业和电商平台不以生产与研发这些数据为主业,甚至会为了节约经营成本而将数据挖掘排除在自己经营的业务范围外。加拿大学者尼克·斯尔尼塞克将这些接受和购买其他互联网企业服务、将几乎所有可能产生额外成本业务都外包出去的平台称为“精益平台”[12]。生产数据商品的是数据挖掘产业中的技术团队,“精益平台”只是为数据挖掘团队提供原始数据以及间接地为验证数据商品质量提供应用场景和市场反馈,它们购买经由原始数据加工成“剩余数据”后生产出来的数据商品,只是为了满足自身对数据信息处理结果的需要,用来改进自身的业务经营水平或者产品制造工艺,从而延迟性地实现了这些原始数据的使用价值。由此可以看出,“精益平台”在购买技术外包服务或者企业合作时,将自身拥有的原始数据使用权让渡出去,而保留了作为原始数据提供方所拥有的数据所有权。
互联网企业通过承接技术外包业务和参与企业合作,获得了原始数据的使用权,同时也获得了数字劳动生产出的“剩余数据”的所有权和使用权。如果互联网企业是通过购买数据包的形式得到了原始数据,那么原始数据就成为了商品。在生产“剩余数据”的过程中,互联网公司所管理的技术团队及团队使用的生产资料(原始数据、进行数据整理分析的AI计算机设备、软硬件设施等)等都掌握在互联网公司手中,都从属于企业背后的资本,数据工程师即数字劳动者也不拥有数据的所有权,而只有针对使用原始数据进行研发和生产“剩余数据”时对数据资料和电子设备的使用权。“剩余数据”的价值最终将通过数据挖掘团队的劳动生产出来,进入公司出售的服务和商品中。互联网企业对“剩余数据”原材料(原始数据)的使用权随着接下来外包服务与技术合作的商业互动(譬如收取使用技术平台时的租金、获得商务合作费用等)的发生而被让渡出去,企业仅保留了对“剩余数据”的所有权。
当互联网企业具备独立运营数据商品的能力时,“剩余数据”的使用权和所有权便可以被互联网企业独自占有,如阿里巴巴、华为、三星、微软、特斯拉等企业就有属于自己的生产智能设备商品的产业链和材料供应链,它们通过提供适用于不同应用场景的数字产品和技术服务,让作为商品的“剩余数据”的价值能够更直接地转移进生产自家品牌产品的实体制造业中。借助数据化产业升级,数据商品中的“剩余数据”可以作为一种生产原料,在具体的、由制造业的产业资本所主导的生产关系中发生价值转移,成为实体制造业产业工人生产的产品的新价值的一部分,“剩余数据”也就促进互联网企业提升自主经营的产品和服务质量。
总的来说,数据商品化导致数据的使用权和所有权发生分离,这种分离表现为:(1)不掌握数据商品原料使用权与所有权的个体用户通过使用智能设备产生了碎片数据,被电商平台和制造业企业通过物联网收集形成原始数据,但这些用户不是受雇于这些企业以从事数据生产活动的劳动者,这些电商平台和企业被称为“精益平台”;(2)原始数据在物联网结构作用下诞生,其所有权和使用权归“精益平台”所有,但“精益平台”自身不具备数据挖掘技术优势,只能向互联网企业寻求合作或者购买其提供的服务,原始数据使用权和所有权的分离便发生在平台购买和使用数据挖掘技术服务的过程中,“精益平台”仅保留对原始数据的所有权,使用权则让渡给了数据挖掘公司,转化为承包了业务的互联网企业在数字劳动过程中“剩余数据”的使用权和所有权;(3)在数据商品发生价值转移的阶段,“剩余数据”的使用权和所有权发生分离,“精益平台”通过购买技术设备、支付技术外包服务费或者租用设备的费用的形式,让“剩余数据”的使用权归自己所有,互联网企业保留了数字劳动过程中云端数据库里“剩余数据”的所有权。技术团队作为数字劳动力虽然生产了“剩余数据”的价值,但他们和不参与数字劳动的个人一样不享有对“剩余数据”的所有权,这些技术人员只拥有在生产过程中对“剩余数据”的使用权。
数据商品化导致的数据所有权和使用权相互分离,意味着数据不是一种面向全社会范围的公共产品,而是一种由数字产业化和要素市场化的经营和外包模式决定的私有制商品。马克思强调,在生产中“劳动预先具有的共同性决定着对产品的分享”[13],既然“剩余数据”的生产原料本就来自日常生产生活,那么这些原料在被加工为数据产品和转化为技术服务后,资本理应将通过经营这些商品和服务所获得的经济收益回报给社会。可是,数据挖掘所需的云端智能算法、高级设备与劳动力(技术研发团队)以及获得数据的渠道都不是独立个人和一般市场主体能够完全掌握的,遑论对数据要素的生产和经营,互联网企业正是利用显著的技术优势在市场上获得高额利润并扩张其影响力,使得购买和使用数据商品的企业与个人只能处于产业链下游或者终端,不断提供和反馈数据给互联网企业,无法通过占有“剩余数据”这个大数据技术内核的价值而获得利润。数据作为一种独特的商品被互联网企业排他性地占有,成为平台资本在数据商品化过程中榨取和增加利润的关键。
在数字经济时代,数据的意义不仅仅在于作为承载信息情报的“数字”存在,还在于其背后统计学和数字科学方法论上的大数据逻辑的合理性,即数据累积性更新的重要性。数据挖掘产业是数字产业化背景下互联网企业经营的行业,它将数据变成一种为平台资本所控制的商品,让数据要素活跃在生产生活中。互联网企业通过不断地把从其他行业收集到的数据和实时动态信息交由专业团队完成挖掘分析,生产出数据商品并把配套的服务一并提供给有需要的个人或企业,让管理和加工数据的生产活动能够更好地作用于生产生活。互联网企业组织数据工程师和技术团队借助AI进行数字劳动,以生产“剩余数据”为目标,获得数据产品,并以此作为技术优势,实现了与产业资本和商业资本的进一步合作,为其他行业的生产和人们的日常生活提供重要的商品和服务,丰富了数据要素的使用价值,数据也由此被以互联网企业为代表的平台资本所吸纳,发展成数字资本。
“剩余数据”的生产过程是数据商品化和资本化趋势下平台资本获得利润的必要途径,这个过程也产生了数据商品的使用价值和价值。广大用户借助物联网的技术设备终端提供了一种能够反映市场动态的数据,作为数据挖掘的生产原料,即原始数据,它被“精益平台”以服务外包或数据库商品的形式交给互联网企业,由后者负责组织技术团队进行大数据云计算数据挖掘分析处理,生产出能融入数据商品中的“剩余数据”,服务于其他行业的生产和销售甚至是消费需要。实时更新调整始终是包含着“剩余数据”的产品和服务所具有的技术特征。“剩余数据”的价值不管是以互联网企业自主营销还是借助外包服务与合作提供的产品和配套服务形式来实现,在市场上出售之后都能够通过价值转移进入其他领域,最终转化为资本的利润。作为商品化了的“剩余数据”,它的使用价值和价值来自数据挖掘过程本身,即一种针对采集自全社会各领域的数据所进行的分析整理与推送的数字劳动过程。创造了“剩余数据”价值的数据挖掘团队成为了平台资本掌握的劳动力。
数据商品化背后的资本逻辑外在表现为挖掘原始数据“让数据说话”的大数据统计逻辑,让“剩余数据”成为资本控制下的技术产物,互联网企业便以不直接投资实体经济的方式参与全社会的生产生活中,通过收集数据和加工数据,让技术团队生产“剩余数据”,向其他需要且能够获得海量数据的企业或者资本提供融合了这种要素的技术服务和商品。数据只有以商品形式被分离了有关自身的使用权和所有权,才能被资本吸纳为数字劳动的生产原料发挥作用,甚至为资本榨取利润提供新形式。借助数字产业化和产业数字化的相互促进,“剩余数据”得以在不同行业内发生价值转移,并凸显全社会大数据统计和分析应用的重要性,隐藏了一个数据商品化背后更深层的秘密,即平台资本正在通过技术优势不断扩张并获得高额利润。
因篇幅所限,对平台资本扩张问题的进一步考察,笔者将在后续的研究进行。需要强调的是,未来我国在大力发展数字经济、深入推进“反垄断”的监管工作过程中,将会面对一个随数据商品化与资本化不断深入而变得更为复杂的现实环境。所以,关注和研究数字经济的发展动态必须坚持从马克思主义的劳动价值论立场出发来进行,尤其是在资本逻辑仍在一定范围内发挥作用的阶段,更需要深入考察和厘清数字经济发展过程中存在的具体问题,警惕平台资本借助“剩余数据”的生产进行无序扩张,有效防范和化解风险,才能进一步推动市场规范化目标的实现,使资本健康有序地参与社会生产中,同时,相关研究也需要借助马克思主义理论进一步聚焦和分析资本盈利的模式,才能为实际问题提供更具体和与时俱进的方案。