数据空间结构:基于社会科学场论框架的理论抽象(上)

2024-12-31 00:00:00姜奇平于小丽
互联网周刊 2024年21期
关键词:算力空间

中国工程院提出基于数据场的数据空间概念,这是数据基础设施、数据经济(数据产业化)和产业数据化的高度理论抽象。数据场本是一个来自物理学的概念,用物理学的场论来概括解释数据的空间特征。当把数据场的概念从技术领域扩展到经济领域,成为数据要素场(流通基础设施)后,如何理解与把握数据空间作为物理的空间与社会空间的结合,需要理论创新。本文试图将“社会科学中的场论”的研究框架,用于数据空间的解释,重点为数据空间技术体系提供一种前后一致的功能性解释。

1. 场论空间基本框架

1.1 Lewin场论框架:九要素场论结构

1.1.1 社会科学中的场论的基本框架

有没有通用参考模型可以为整个数据空间提供基本理论抽象?

Lewin(Kurt Lewin,库尔特·卢因)的《社会科学中的场论》[1]就提供了这样一个通用参考模型。

Lewin场论中最基本的结构是“场”。所有行为包括行动、思考、愿望、努力、评价、实现等,都被视为场在给定时间单位内的某种状态的变化。Lewin指出,如果一个值对应于势力场(power field),任何值的变化都必须被视为一个依赖于整个势力场的过程,包括社会、政治和个人权力场域情况。

Lewin试图给这种场以结构化的数学描述。作为著名心理学家,Lewin在提出社会科学的场论之前,1936年出版了以场论思想构思的名著《拓扑心理学原理》。高觉敷形象地将拓扑译为形,将向量译为势,1937年将Lewin的这本书译为“形势心理学原理”,后改译为《拓扑心理学原理》。

Lewin提炼出了构成场的基本要素,作为对场的理论抽象(如图1所示)。这一框架提供了一个从整体上概括数据空间的通用参考模型。这个模型是一个全息模型,其任何一个子模块内部又全息地映射全局的结构。利用这一特性,可以将数据空间四大技术分支的结构,映射回数据空间的整体结构(如表1所示)。

Lewin场论的主旨,是概括社会的场与物理的场之间的异同。他认为社会空间不同于物理空间之处,主要在于在物质的层面之外,社会具有与人的手段及目的相关的能力、功能这两方面的独特维度。

把社会理解为社会实践,将Lewin场论从心理空间扩展到整个社会实践空间,可以为数据空间的场论提供理论借鉴。

1.1.2. 数据空间的三层结构

利用城市空间的“廊道-功能体”理论,可以将Lewin场论九要素分为三个层次,即廊道层、能力层、功能层,分别对应数据空间中的网络基础设施(未来网络)、算力基础设施(算力网)和流通基础设施(数据场和数据要素场)。

根据Lewin场论,参照城市空间理论,可以将数据空间划分为廊道层、能力层、功能层。

1.1.2.1 廊道:客体特性基本抽象

廊道层,分状态变量“位置”(position)与生成变量“结构”(structure),以“活动”(locomotion)为场域行为。设施是对场的客体存在的基本抽象。廊道层反映了数据空间特有的中介对象的特性。

1.1.2.2 能力:相互作用的基本抽象

能力层,分状态变量“权力”(power)与生成变量“效力”(force),以平衡(由conflict达到equilibrium)为场域行为。能力是对相互作用中的作用力的基本抽象。能力层体现数据空间具有社会方面的动力学性质。

1.1.2.3 功能:主体特性的基本抽象

功能层,分状态变量“目标”(goal)与生成变量“价值”(values),以“反馈”(time perspective)为场域行为。功能是对功利(人的目标价值)的基本抽象,功能层反映了数据空间的主体主导特征。

1.1.3 数据空间的“场”的特性

对Lewin场论九要素的第一个重要分类,是将九要素分为相同性质的三组,分别体现场的粒子性、场的波动性和场的波粒二象性。由此可以将场论的九要素分为状态、生成和场域三类,三者关系类似粒、波和波粒二象性。这三组性质分别从场的三个方面,全面描述场的特性。

对粒子性的哲学概括是存在(being),是对事物的状态描述,侧重事物的物;对波动性的哲学概括是生成(becoming),是对事物的过程描述,侧重事物的事。定义为人的活动空间的场(场域,field)是物与事的结合(即事物)。场的波动性和粒子性是相互依存的,这意味着场的性质既可以用波的术语来描述,也可以用粒子的术语来描述。从社会角度可以描述为“事物”,即与人的活动(事)相互依存的物。

1.1.3.1 状态与生成

按牟宗三的观点,西方宇宙观以“状态”(being)为根本;中国宇宙观以“生成”(becoming)为根本。前者对应标量,后者对应向量。“生成”对应数据空间中的利用、使用、流变、活动等具有方向变易特征的行为,典型例子如数据交互。

在连接与流通的关系上,连接更接近状态(主要是软硬件网络的就绪状态),而流通更接近生成(包括从算力到要素流通的过程行为)。前者更多偏向数字经济,包括数字基础设施、数字产业、产业数字化;后者更多偏向数据经济,包括数据基础设施、数据产业、产业数据化(如数据要素×)。

从辞典上的词义说,数字与数据这两个词本身并没有如此界限分明的含义区别,二者在真实世界中是一个统一体,主要是结合政策背景与职能分工,产生各有侧重的理解与不同工作重点。

1.1.3.2 标量与向量:“通量”计算

计价尺度中,状态变量为标量,偏重数字基础设施的静态存在特征,如权力(power)对存储来说,就是存储空间的大小这种潜在的能力;生成变量为向量(矢量),偏重数据基础设施的动态流变特征,如效力(force)可以对应数据场中的势值(potential value),对于算力来说表现为存储空间被利用时的内存活动过程产生的效果,不以存在或不存在(用后是否保留在存储空间)来衡量,而以计算活动发生时有效无效来衡量。此时的算力网就是一个势场(potential field),即一种特殊的向量场。势值也可以用势熵来表示。

Lewin给出的场论的简单公式为B=f(PE)。

式中,以人为P、环境为E、行为为B。纯粹环境论者(如心理学行为主义、SR理论)认为,行为是环境的函数,即B=f(E);纯粹人格特性论者则主张行为决定于人,B=f(P)。Lewin认为人境是互相依赖的变量,人境是交互影响的,因此他的公式是B=f(PE)。

这相当于说,一方面,人是环境创造的;另一方面,“环境正是由人来改变的”(马克思语),人和环境存在交互影响。

孙凝晖院士创造性地给出场的“流公式”为:并发度×响应时间可满足率=通量。

1.1.4 数据空间的实践行为:活动、平衡与控制

活动、平衡、反馈是场作为活动空间的三种基本活动。这三类基本活动决定状态(being,如软硬件实体)能否或在多大程度上经过生成(becoming,如算力)转化为有序结果(如与应用结合实现价值)。

其中的“活动”,对应数据空间中人作用于物(符号、实体)的实践活动;“平衡”,对应不同利益相关者相互作用的动力机制,以及技术投入(形成的潜在能力)与经济产出(应用效果)之间的力量均衡;“控制”对应对数据流动性目标与结果之间的全生命周期的过程管理。

2. 数据空间的法则与规律:与信息网络空间比较

孙凝晖院士提出数据空间具有主权属性与流通属性,是对数据空间法则的重要总结。

2.1 数据空间的权利属性

信息网络空间有梅特卡夫法则,数据空间的法则是什么?数据空间有主权属性,原来的信息网络空间只是技术空间、物的空间,没有主权属性。

权利属性是数据空间的主客一元性的体现,马克思主义政治经济学实践观点是在突破西方主客二元对立世界观基础上形成的。根据实践观点,传统的信息网络空间主要是技术空间、物的空间,因此主要是客体空间。而数据空间是一个主客体统一的实践活动空间。因为内生了主客体及交互作用,而使权利属性变得重要。

Lewin场论也认为社会空间不同于物理空间,但他把主体特征主要理解为心理特征。而从实践观点看,数据空间不同于物理空间,不在于个人主观心理,而是因为具有主体特有的权利属性。

数据空间的权利属性,包括政治、经济和社会文化方面的属性。政治属性中最主要的是主权属性;经济属性主要是数据要素的三权属性——持有权、使用权、经营权属性;社会文化属性包括参与权、访问权等。这是作为实践活动空间,加入了主体才有的特别属性。

数据空间的权利属性决定了不应将关于数据要素的权利仅仅局限于物权(如知识产权、数据交易中的确权),更应包括行为权利(中央党校张恒山观点),如开放(内生外部性的权利)、共享(有偿共享的权利)与数据交互的权利(非确权使用的过程性、流式的权利)等。

2.2 数据空间的流通属性

2.2.1 中国数据空间与美国信息空间之异同比较

根据孙凝晖院士所提出的流通属性,可以认为流就是从场论角度对数据行为(算力)的基本抽象。因为根据场论,数据本质上不是物本身,而是体现在算力中的行为(人的活动),算力是人的行为、活动的能力,数据这种状态性存在以算力这种活动中的生成能力的方式存在。

算力是数据空间中客体(数据符号)从状态转化为生成活动的能力,这种有机的生成活动就是流。算力资源空间与原子化空间资源排列的区别主要在于,算力资源空间的活动是有机交互中的流,是复杂生命系统的活动;而原子化空间资源的配置,主要是原子之间机械化的排列组合。二者的联系与区别可以用经络与交通的关系进行比较。

流动属性是场的波粒二象性中波不同于粒的属性。这是数据场理论不同于基于西方原子论的美国信息空间(单纯客体空间)的根本理论分野。

数据空间有流通属性(流的属性),流通在技术上对应互联互通的传输;在经济上流通属性是数据的运动属性。精神和意识,是依托于人体这种高级物质的高级运动。

根据哲学“场有”论,流(变易、连接、过程、涌现、生成)是生命存在的方式,具有主体的生成特质“生生之德”的现象),而不同于物理现象。比如,同为互联互通,电路的互联互通与经络的互联互通,前者是死的、机械的;后者是活的、有机的。死的网络可以随时分解为零件并组装成整体,不存在“人活一口气”的主体现象;而活的网络中,有“气”这种流动性存在,一旦切断,局部无法还原回整体。

为了实现算力的协同联动,在廊道层面,一是需要构建低时延、智能化的承载网络,低时延、智能化都是为了保证数据具有流的活性特征,表现为自由流通;二是需要构建高效、泛在的接入网络,实现用户方便使用,这就要求算力具备流的特性;三是需要解决算力的调度问题,确保算力使用的便捷性和自动化,提高资源使用率,便捷性和自动化也是流的特性。

与原子化的资源配置相比,数据空间强调了从技术、能力到功能的活性特征(如协同联动)。美国只是把这理解为韧性(弹性),而协同联动首先是人与人的协同联动,由此决定人机协同联动。流程再造也是一种协同,但并没有真正体现以人为本的特征。因为流程再造不能面向个性化应用,而是以生产者为中心的协同。协同联动实际强调的是人的最终应用对技术的主导。活的协同联动,强调通过社会协调,使技术为人服务,而不是死的自动化,不是把文章仅仅作在中介上。

综上,数据空间的权利属性与流通属性与Lewin场论九要素的位置对应关系如表2所示。

2.2.2 流通属性在数据空间中表现出的运动规律

2.2.2.1 数据空间廊道层的流变规律

在数据空间的廊道层面,流通隶属于生成(becoming)的顶层范式,是场中“波”的方面的属性,具有连接、流动、变易、涌现等与运动相关的特性。

数据空间的场的特性(数据的波粒二象性),体现在基本单元(物质)与相互作用(运动,如协同联动)在场中的结合上。

一是基本的单元。(1)数据单元的结构是什么?相较于物理学中的电子、质子,数据的基本单元是数据件。数据件作为关系性的存在(波的存在),犹如物理学中的弦,将场物化为符号对象,代表着事物的基质。(2)数据依托、依存于实体(介质)之中,但不是实体本身(不是介质本身),而是介质(符号能指)代表的背后质的存在(所指)。关系(“弦”)作为数据的实存,以结构表示功能,以功能表示性质,因此,如果一定要说数据是实体,则数据的“实体”是质的存在(以熵表示的有序与无序的质的变化),这种存在一旦与物质实体结合,就可以体现在物质的质(性质)之中。

二是相互作用。(1)数据以相互作用的方式存在。相互作用是数据流动的实现方式,借助人机相互作用,可以进行人与人的相互作用、人与物的相互作用。数据的相互作用具有社会性,主体可以通过数据相互作用,而进行不同利益间的力量博弈,因此不同于物理学的相互作用,而是具有社会意义的动力学性质。这种相互作用也可以通过或借助意识而发生,如通过符号发生精神相互作用。(2)数据还有价值效应,通过交互作用这种活动,涌现生成单独存在时不具有的价值。例如,在双边市场形式的场(“前店-后场”中的场)中进行数据交互,会产生交叉网络外部性,从而带来一加一大于二的溢价效应。

2.2.2.2 数据空间能力层的流变规律

在数据空间的能力层面,存在着社会性的力量相互作用,其中的动力学机制可以对应信息场、舆论场的机制。

其动力机制存在漩涡效应的规律。即,一旦汇聚,越来越深。也就是说,数据的力量在网络结构的交互中,可以释放聚变的价值,由汇聚而产生爆发式的质变。

结构洞所带来的漩涡效应,在数据空间中,主要发生于从权力(power,潜在的力量)向效力(force,真实发生的力量,如实际影响力)的转变之中。其有四个标志性特征:第一,竞争力是一个关系问题,成功不是因为自己,而主要归功于朋友;第二,竞争力是一种突现的关系,平时是不可见的;第三,竞争力爆发是一个力量偶然释放的过程,而非确定性力量起作用的结果;第四,竞争力由非对称的、随机的形势使然,而不仅仅是权力的问题。

与信息空间的中心化结构不同,在数据空间中,产生漩涡效应的节点不是中心节点(如权力中心),而可能是偶然处于结构洞(即漩涡)中的节点。结构洞使分布式节点中的某一个,由于机缘而临时成为权力中心,对整个数据空间产生不亚于权力中心的巨大影响,如突发热点事件中的网红。漩涡效应从长期来看难以持久,但在短期却影响巨大。例如,美国在中东发动的“颜色革命”,可能在极短时间内带来漩涡效应,而颠覆权力中心。

由于漩涡效应会带来权力(power)与效力(force,真实发生的实际影响力)之间的极度不对称,因此可能打破权力中心与外围(分布式节点)之间的力量平衡,而引发力量的冲突(conflict)。有鉴于此,Lewin将“冲突”作为场域的一个基本要素。通过对冲突(力量不对称)的管理,可以达到力量的平衡(如社会从波动复归平稳)。

对数据空间而言,由于漩涡效应的存在,因此“平衡”成为空间活动的一类重要行为。例如,舆情监控、应急管理等,都成为数据空间必不可少的活动。对经济行为来说,漩涡效应有可能产生正面影响,如直播带货一夜走红;也可能带来负面影响,如突发疫情,需要紧急处理。

2.2.2.3 数据空间功能层的流变规律

数据的波的特性,决定着流动的规律,并从流动中生成和释放不同的几种价值,如关联释放的价值、聚变释放的价值和倍增释放的价值。

数据空间的功能层存在爆发式传播规律,像传播中的波,可以成倍放大。在网络科学中,这种爆发现象称为幂律分布规律,主要由美国物理学家Barabási(巴拉巴西)最先加以总结。幂律分布规律是一种自然和社会科学中常见的分布规律,表现为少数几个因素起决定性作用,而大多数因素则相对次要。幂律分布规律的核心在于,对一件事情起决定作用的往往是少数几个因素,其他大部分因素都无关紧要。

幂律分布规律的具体表现形式可以通过数学表达式来描述,即p(k)~k-r。p(k)表示某个量出现的频率,k是该量的值,r是幂指数,通常取值在2到3之间。幂律分布规律的应用非常广泛,不仅在物理学、地理学、生物学等领域有重要应用,还在经济学和社会学中起到关键作用。例如,二八定律也是一种幂律分布现象,80%的财富掌握在20%的人手中,80%的用户只能使用20%的功能,而20%的用户贡献了80%的访问量。

正是由于存在这样的规律,决定了数据空间功能层中的“控制”行为的定位。

在数据要素场中,控制与反馈活动(time perspective)是通过衔接数据要素时间先后环节(前店-后场环节)服务功能实现的。服务在场域中的主要功能,应是在目标(如时间在前的数据要素预期价值)与价值(如时间在后的应用实现价值)之间,实现相互反馈校正,包括利用价值评估(如时间贴现与空间贴现的结合)、利用前店后场机制进行供需匹配(要素与应用的匹配)、通过检索查询促进要素与应用结合。这本质上都在于将数据要素的价值创造(采集、加工)与价值实现(应用)更好结合起来,目的在于推动数据经济与实体经济深度透明融合。

功能层不仅可能放大正能量,也可能放大负能量。例如,一旦信息造假,会诱导众多人信以为真,而产生巨大社会波动。不同的传播节点,单位信息密度不同,信息密度大的(如粉丝节点众多的大V),能量密度大(对粉丝的影响大)。

为此,反馈控制还要具备对功能层面的负面效应进行实时管控的功能,包括提供合规服务。对于虚假信息的传播放大、背离真实价值的恶意炒作等,进行穿透式的过程管控,保证安全。

参考文献:

[1]库尔特.卢因.社会科学中的场论(英文版)[M].北京:中国传媒大学出版社,2016.

作者简介:姜奇平,研究员,qpjiang@cass.org.cn,研究方向:数量经济与技术经济、互联网产业经济;于小丽,博士后研究生,研究方向:数字经济分配制度、国民经济学。

猜你喜欢
算力空间
多方求解智能时代算力挑战
新华月报(2024年7期)2024-04-08 02:10:56
基于网络5.0的重叠网形态算力网络
这个第二不一般
都市人(2023年11期)2024-01-12 05:55:06
卫星通信在算力网络中的应用研究
卫星应用(2023年1期)2023-02-21 06:51:50
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
基于SiteAI算力终端的交通态势感知系统
创享空间
空间是什么?
创享空间
创享空间