李雪梅,赵小磊
(北京交通大学 经济管理学院,北京 100044)
随着数字化时代的来临,数据作为一种重要的生产要素正日益受到广泛关注。数据的广泛应用不仅可以提高企业和个人的商业洞察力并为其提供决策支持和创新机会,而且对经济发展和社会进步产生了深远影响。在此过程中,数据要素的定价是数字经济时代要素市场化改革的核心环节,也是新时代加快完善社会主义市场经济体制的重要内容,党和国家高度重视数据要素定价机制和体系的建立健全[1]。中共中央、国务院于2020年印发的《关于构建更加完善的要素市场化配置体制机制的意见》中提到要“加快要素价格市场化改革”“完善要素交易规则和服务”。此后,2022 年国家发改委印发的《“十四五”数字经济发展规划》进一步强调加快建立数据要素定价机制与体系。然而,数据要素定价涉及数据的价值评估、交易和分配等,尚且处于初步的探索阶段,仍然面临许多挑战。
尽管数据要素定价领域已经有许多经济学的研究,但仍存在需要进一步探索和完善的地方[2-5]。一是现有的数据要素定价研究往往集中在理论模型和方法的开发上,如拍卖机制和基于博弈论模型的定价研究,而缺乏实证研究的支持。在实证研究方面,可以开展更多的实证研究来验证和检验不同定价方法的效果,以及数据要素市场的实际运行情况。二是现有文献并未完全将经济学研究仍面临的一系列挑战纳入统一的框架并予以应对,如数据要素的非排他性和非竞争性特征、信息不对称、数据隐私与安全、规范和监管问题。三是数据要素定价的经济学与信息技术的交叉融合依然处于初步探索阶段,仍然需要进一步完善。本文旨在对数据要素定价的经济学研究进行综合分析和探讨。本文立足于国家数字经济深化发展的重大战略需求,试图厘清数据要素流通的基础理论、重要实践、关键环节和瓶颈,旨在构建数据要素及其价值释放与高效流通的理论框架,优化数据要素的市场化机制,突破面向数据要素流通全过程的基础制度、流通机制及其支撑技术,从而在理论上为数据要素及其流通的理论创新做出贡献,在实践中有效支持我国数据要素基础制度的构建、市场流通机制的建设、数据要素价值的释放,从而为加快我国数据要素市场规范化建设和我国数字经济高质量发展做出应有贡献。
数据是关于特定实体、现象或事件的描述、测量或记录的信息。它可以用来描述事实、属性、特征、关系或行为,是对某个领域的理解和分析的基础。数据通常以结构化或非结构化的形式存在[6]。数据的最主要特征包括两个方面:稀缺性与可复制性。一方面,数据的稀缺性意味着数据并非无限可得或无成本可获得。数据的稀缺性主要源自有限的数据收集和生成成本与数据获取的限制[7]。另一方面,某些数据可能受到访问限制、法律法规限制或专有权限制,导致数据供给受到限制。在某些情况下,多个实体可能竞争获取有限的数据资源,这也增强了数据的稀缺性[8]。
数据的经济学特征主要包括非竞争性、非排他性、外部性、经济增值以及网络效应[9]。首先,数据的非竞争性意味着多个用户可以同时访问和使用同一份数据,而且一个用户的使用不会妨碍其他用户对数据的使用[10]。其次,数据的非排他性指的是数据的使用权或控制权不被独占地归属于某个特定的个体或组织[11]。数据的非竞争性和非排他性特征使得数据具有较强的共享和开放性,促进了数据的广泛流通、共享和协作使用,有助于创造更大的价值和创新[12-13]。再次,数据的使用可能对其他个体或组织产生积极的外部效果,即数据的使用者可能会创造附加的社会价值。最后,数据的价值可能随着数据的规模和使用者的增加而增加。数据产品的交易面临着一系列难题,主要根源于数据来源的多样性和数据结构的复杂性。为满足数据产品的多样性,需要设计不同类型的数据定价方法,而每一种方法都伴随着独特的考虑因素,这使得确保定价结果客观性变得十分复杂。此外,以往的研究发现,大数据的价值存在着双向不确定性,即在数据产品交易中,买卖双方很难就产品的价值达成一致[8],导致数据消费者期望数据价格反映其任务价值,而数据拥有者和数据平台更倾向于以数据收集和管理成本为基础来定价。因此,数据价值成为当前数据定价所面临的最为重要的问题[14]。
1.供给和需求理论
从经济学的角度来看,数据的价格是由数据的需求和供给之间的相互作用所决定的。在需求方面,数据的需求取决于各个行业和组织对数据的价值和用途的理解。在供给方面,数据的供给取决于数据的收集、整理和提供机制。根据该理论,价格是由市场上商品或服务的供给量和需求量之间的平衡关系所决定的[15]。当需求超过供给时,价格上升;当供给超过需求时,价格下降。供给和需求的相互作用决定了市场均衡价格和数量。市场出清的条件是需求等于供给。
2.边际分析和边际定价理论
边际分析和边际定价理论强调了边际效用和边际成本的重要性。边际效用指的是消费者获取额外产品或服务时所感受到的额外满足程度,而边际成本则代表生产或提供额外产品或服务所涉及的额外成本。基于边际分析的边际定价理论可以帮助决定数据的均衡价格。根据边际定价理论,理性的数据供给方会将数据的价格设置为边际成本的水平,以确保在给定市场需求下获得最大化的利润。
3.效用理论和消费者行为
效用理论是经济学中的一个重要理论框架,它描述了消费者对不同商品或服务的满意程度。根据效用理论,消费者在有限的预算约束下,通过对不同商品和服务的效用进行评估从而做出理性的消费决策。在数据市场中,效用理论可以用于解释消费者对数据的需求和数据价格的形成。消费者在决策购买数据时,会尝试将其有限的预算分配到不同的数据产品上,以实现最大化的效用。消费者将根据数据的价格和数据的效用进行选择。如果某个数据产品的价格较高,消费者可能会寻找替代品或降低购买数量,以获取更高的效用。相反,如果数据的价格较低,消费者可能会增加购买数量或选择更高价值的数据,以实现更高的效用。数据的均衡价格是在消费者对数据的边际效用与数据的价格相等时确定的[16]。
4.市场结构
在经济学中,常见的市场结构包括以下几种:完全竞争市场是一种理想化的市场结构,其中存在许多买家和卖家,产品是标准化的,并且市场参与者具有完全信息和自由进出市场的能力。在完全竞争市场中,价格由市场供需关系决定,没有任何单个买家或卖家能够影响市场价格。垄断市场是一种市场结构,其中只有一个卖家或供应者,不存在直接竞争者。垄断者能够控制产品的价格和供应量,因此在垄断市场中,价格常常较高,供应量较低。垄断市场通常会受到政府的监管,以防止滥用市场支配地位。寡头垄断市场是一种市场结构,其中存在几个具有市场支配地位的卖家或供应者。寡头垄断市场中的供应者相互之间存在竞争,但其市场力量较为集中。寡头垄断市场的价格和供应量取决于寡头企业之间的竞争策略和互动关系。垄断竞争市场是一种市场结构,在垄断竞争市场中,存在多个相对小规模的卖家,他们提供类似但稍有差异的产品。每个卖家都能够在一定程度上影响产品价格,但市场进入门槛相对较低,使得新进入者能够进入市场[17]。
1.信息经济学
信息经济学是经济学中的一个分支,研究信息在经济活动中的作用和影响。在数据市场中,信息经济学提供了一些重要的理论和模型,可以用来解释数据的价值和数据均衡价格的形成。
首先,信息的不对称性是数据市场中常见的情况。供给方通常拥有更多关于数据质量、可靠性和用途的信息,而消费者拥有的信息则相对较少。这种信息不对称性可能导致市场失灵和非有效的价格形成。信息经济学中的信号传递和信号筛选模型可以用于解释数据市场中的信息不对称性。供给方可以通过价格信号、品牌声誉、质量认证等手段向消费者传递关于数据质量和价值的信息。消费者则通过筛选和解读这些信息,来决定购买哪些数据和支付多少价格[18]。
其次,信息的价值取决于数据的稀缺性和独特性。稀缺性和独特性使得这些数据具有较高的价值,消费者愿意支付更高的价格来获取数据。另外,对于大量可获得的常规数据,其价值可能较低,消费者支付的价格也相应较低。信息经济学中的市场竞争模型可以用于解释数据市场中的价格竞争和均衡价格的形成。最终,均衡价格取决于供给方之间的竞争水平和消费者对数据的需求[19]。信息经济学的理论可以用如下简化后的不完全信息模型来展示:信号模型中的期望效用公式为EU=Σi(Pi·Ui),其中EU 表示期望效用,Pi表示事件发生的概率,Ui表示i事件下的效用。逆向选择模型中的条件期望效用公式为,其中,EUcond表示条件期望效用,Pi表示事件i发生的概率,Ui表示事件i下的效用,表示在事件i下观察到信号s的概率。道德风险模型中的概率等价条件为,其中表示在假设h下观察到信号s的概率表示假设h的否定。
拍卖机制是一种用于资源分配的经济工具,可以应用于数据市场。通过拍卖,供给方可以将数据提供给竞争的买方,并根据买方的出价确定数据的最终价格。拍卖制度的设计涉及拍卖类型、出价策略和信息披露等因素,以实现确定最优的价格和分配资源[20-21]。拍卖机制在数据市场中的应用可以帮助确定数据的均衡价格。供给方可以通过拍卖机制来吸引竞争的买方,从而推动数据价格的上涨。经济学家对拍卖理论模型进行了许多优化和拓展,这里仅列举基础的第一拍卖价格模型。第一价格拍卖中的期望收益公式为R=Σi(Pi·Qi),其中R表示期望收益,Pi表示竞标者i的出价,Qi表示竞标者i的需求量。第二价格拍卖中的期望收益公式为R=Σi(Psec,i·Qi),其中,Psec,i表示竞标者i 的第二高出价,Qi表示竞标者i的需求量。
3.博弈论
从博弈论的视角来看,数据市场涉及多个参与者之间的相互作用和决策,其中每个参与者都追求自身的最佳利益。数据提供商是数据市场的供应方,他们的目标通常是最大化其数据的价值和收益,同时也关注数据的广泛使用和推广,以吸引更多的客户。数据消费者是数据市场的需求方,他们的目标通常是获得高质量、有价值的数据,并且以合理的价格进行交易。在数据市场中,平台和中介机构充当连接数据提供商和消费者的桥梁,他们的目标是促进数据交易并提供交易的便利性和安全性。平台和中介机构可能追求提高市场份额、增加交易量以及提供高质量的服务来吸引更多的参与者。政府监管机构在数据市场中发挥着监管和规范的作用[22]。他们的目标是确保数据交易的合法性和公平性,维护市场的竞争秩序,并保护数据隐私和安全。基于博弈论开展的定价也是使用频率最高的定价模型,主要被应用于以下两种情况中:一种情况是当博弈双方关于价格的意见无法统一时,二者在第三方的介入下通过讨价还价的方式下完成交易[23]。另一种情况是博弈双方关于价格的意见无法统一且没有第三方介入时,二者在数据平台的撮合下通过讨价还价的方式完成交易[24]。
定量评估方法是通过数学和统计分析来量化数据的价值。这些方法通常使用数据属性、市场需求、数据的稀缺性等指标来计算数据的经济价值。主要包括成本法、市场法与收益法三种。
成本法是基于数据获取、处理和维护成本来评估数据价值的方法。成本法基于数据获取成本将数据的价值与获取、处理和维护数据所需的成本相联系。数据获取成本公式:,其中,Ca表示数据的获取成本,Ci表示获取数据的成本单价,Qi表示获取的数据量。数据处理成本公式:,其中,Cp表示数据的处理成本,Cj表示处理数据的成本单价,Qj表示处理的数据量。数据维护成本公式:Cm=,其中,Cm表示数据的维护成本,Ck表示维护数据的成本单价,Qk表示维护的数据量。数据的总成本可以通过将上述三个成本相加得到:C=Ca+Cp+Cm。成本法的优点是简单便捷,也是无形资产评估方法中最为基本的方法[25]。Fontana等认为,使用成本法可以有效评估医疗体系所收集数据的市场价值[26]。然而使用成本法来估计数据的价值也存在诸多缺陷。首先,数据具有可复制的特性,即边际成本趋近于零,加大了数据成本量化和按单位产品分担的困难[27]。其次,成本法在定价上效果不佳,因为它主要基于历史成本评估,忽视了数据产品的增值潜力。再次,由于数据的独特生产过程,无法使用社会平均必要劳动时间来衡量数据资产的价值[28]。
基于市场价格的方法是一种以均衡价格为理论基础的估值方法,它参考类似数据交易案例的价格,并根据技术水平、价值密度、评估日期、数据容量等可比因素进行修正,以计算待估产品的价格[29]。具体公式为V=(P1+P2+…+Pn)/n。其中,V 表示数据的价值,P1,P2…Pn表示类似数据在市场上的价格,n表示比较的数据样本数量。
收益法通过估计数据使用所带来的经济收益来评估数据的价值。具体公式为,其中,V表示数据的价值,Ri表示待估计的数据在第i阶段的收益,r表示待估计数据在第i阶段的收益率。收益法广泛应用于多个情形,包括基于项目数量和用户规模的比例制定租赁费用的订阅模式、根据买方的咨询需求和模型训练精度的定价策略[30-31]。收益法最显著的特点是价格随着市场集中度提升而降低,随着数据组合的协同程度提升而提高。
教师设置情景设置1:去年冬季,我校励行楼底楼上午第一节课上课前,发现一女生晕倒在洗手间门口。如果你发现了,你最先做的会是什么?阅读教材76页第一段,回答问题。
数据的价值同时受到市场因素和非市场因素的影响。如供需关系、交易频率、市场竞争等,而非市场因素涉及数据的独特性、稀缺性、法律和合规性等市场因素,这些市场因素往往对数据的价值产生直接影响。但是,基于市场因素的定价方法较为简单,因此并未被广泛采用。非市场因素是指与数据本身的特征和属性相关的因素,主要包括数据查询的个性化、数据的隐私权与信息技术的进步。基于查询的数据要素定价模型与方法首先由Koutris等正式提出[32]。在此基础之上,Koutris 等进一步完善了其研究,提出了一种新式基于查询方式的定价系统[30]。相较于传统的定价方法,该方法可以有效应对更为复杂的查询定价需求。另外,为了应对数据交易中的重复交易问题,Upadhyaya 等在传统的定价模型基础上,将“退款”引入了定价模型中[33]。具体来看,如果数据购买者发现存在重复交易的问题,在递交必要的证明材料后即可选择退款。为了应对传统查询定价无法对数据进行聚类查询的缺陷,Nget 等基于差分隐私,提出了一种能够聚类查询的定价方法并明确了隐私补偿的标准[34]。
由于数据被视为数字经济时代世界的“石油”,隐私保护对企业日益重要。以消费者个人数据为主体的数据交易越来越广泛。其中,个人信息的保密性与隐私性可能是数据定价的关键决定因素。Ghosh等首次提出交换个人隐私数据交易的概念,例如向卖家提供金钱以换取其隐私[35]。该研究考虑到这样一个事实,即数据所有者对他们出售的数据的隐私有不同的看法。Jia等创建了一种基于KNN模型①的定价系统[36],他们利用夏普价值方法估计不同数据点对定价模型的贡献程度,并以此确定数据的价格。Chen等认为,通过向数据买方直接提供相关的算法实例与代码,并以模型的精准程度定义价格是一种更为合适的方法[37]。Agarwal 等采用更彻底的方法对这三种方法进行了参数化,并通过数学模型精确地阐述了上述模型在数据要素市场中的作用机理[31]。
数据质量是数据价值的源泉。高质量的数据通常具有更高的价值,因为它们能够提供准确、可靠、完整的信息,从而支持更好的决策和分析。数据质量问题可能导致数据的价值降低。Stahl 等创建了一个适用于数据定价的数据质量评级系统,并根据是否可以自动收集,将数据质量的各个方面分为自动、手动和混合类别[38]。此外,Yu 等研究了基于多种数据质量参数的垄断平台定价问题[39],他们创建了版本控制机制,考虑了数据质量各维度之间的联系,并构建了以数据平台为领导者、若干数据消费者为追随者的双层编程模型。关于数据质量的综合评估系统方面,Yang 等基于精确性、完整性与冗余度构建了综合策略体系,对数据进行拆分与重组以对质量存在差异的数据进行估计[40]。与此类似,Zhang 等将及时性纳入定价方法中,通过浮动计算的方式对不同质量的效用函数进行求解[41]。
定价协商机制是指数据卖方和需求方通过谈判和协商来确定数据价格的机制。这种机制通常适用于双方之间有较强合作关系、数据需求量较大或具有特殊性的情况。协商定价公式:P=(MC+MD)/2。其中,P表示数据的价格,MC表示数据供应方的最低接受价格,MD 表示数据需求方的最高支付价格。在协商过程中,双方根据各自的最低接受价格和最高支付价格,通过谈判确定一个均衡的价格。
数据拍卖模型是指通过拍卖的方式来确定数据模型价格和交易方式的模型。拍卖模型可以根据竞拍者数量、出价规则和竞拍方式的不同分为多种类型,如英国拍卖、荷兰拍卖、第一价格封闭拍卖等。其中,第一价格封闭拍卖公式:P=max{B1,B2,.…,Bn}。其中,P 表示数据的价格,B1,B2,…,Bn表示各竞拍者的出价。在第一价格封闭拍卖中,最高出价的竞拍者将以其出价作为数据的定价。
数据订阅和授权模型是指数据卖方通过订阅和授权的方式向数据需求方提供数据,并按照一定的费用结构来定价。订阅费用公式:Cs=F+R*Q,其中,Cs表示数据的订阅费用,F表示固定订阅费用,R表示每个数据单位的订阅费率,Q 表示数据的订阅量。授权费用公式:Ca=L·P。其中,Ca表示数据的授权费用,L 表示数据的授权许可数量,P 表示每个数据单位的授权费用。
在基于经济学理论进行数据定价时,应当遵循以下原则:一是边际效用与边际成本原则[3]。二是考虑市场需求和供给的变化,确定数据的定价[42]。三是数据的定价应该公平合理,以避免市场垄断和不当歧视[43]。四是在数据定价中,应该追求信息对称,确保买方和卖方都能够获得准确和完整的信息。五是数据定价应该根据市场需求和供给的动态变化进行调整。
1.数据的供给和需求分析
通过分析供给和需求曲线的相互作用,可以确定数据的均衡价格,即供求平衡点。根据供给和需求曲线的交点,即供求平衡点,可以决定数据的售价[11]。具体决定数据售价的公式可以通过联立供给和需求曲线方程组来确定。
2.边际效用与边际成本分析
在数据定价中,边际效用分析可以帮助确定数据的定价,使消费者对每个数据单位支付的价格与其所获得的边际效用相匹配。根据边际效用递减原理,随着消费者购买的数据数量增加,每个数据单位的边际效用逐渐减少。因此,在定价时,边际效用分析建议将数据的价格设置为消费者对数据的边际效用所愿意支付的金额。同理在数据定价中,边际成本分析有助于确定数据的定价,以保证每个数据单位的成本与其产生的边际收益相匹配。根据边际成本递增原理,随着提供的数据数量增加,每个数据单位的边际成本逐渐增加。因此,在定价时,边际成本分析建议将数据的价格设置为每个数据的单位边际成本。
3.效用理论和数据定价的关系
效用理论一般是基于离散选择模型,本文可以使用以下公式来描述消费者对数据选择的效用:Ui=βXi+εi。在上述公式中,Ui表示消费者对数据的效用;β是待估计的参数向量;Xi表示与数据i相关的一组特征变量;εi是误差项,表示除特征变量之外对效用的不可观测因素。在数据定价中,本文可以通过估计参数向量来衡量不同特征对数据价值的贡献。通过观察不同消费者对不同数据的选择,可以利用统计方法估计出参数β的值,从而确定特征变量对数据定价的影响程度。然而,前三类定价模型过于基础、数据要素产品通常呈现出高固定成本和低边际成本的特征,导致传统的经济学定价模型不再完全适用,直接利用前三类模型为数据定价的文献较少。
4.数据交易的市场结构
通常文献将数据的市场结构分为垄断[44]和竞争两类[45]。此外,Pantelis 与Aija 认为,在数据市场发展的早期阶段,一些数据平台所有者在数据获取和定价等方面具有优势[46]。因此,某些关于数据定价的研究明确或隐含地假设了垄断的市场结构,其中数据卖方(数据买方)并不面临来自他人的竞争。例如,Bergemann 等提出了一种基于卖方垄断市场的数据定价模型[10]。该模型假设数据卖方作为垄断者,提供不同质量的数据产品菜单,以实现利润最大化目标,而购买方则根据使用意愿进行选择。随着数据市场的发展,可能会出现寡头垄断的市场结构。Balasubramanian等研究了双寡头垄断市场结构下免费和按使用量付费两种定价策略对数据卖方收益的影响[47]。
1.信息经济学理论的应用
信息经济学在数据定价中的应用主要集中于对数据质量与价格的研究。Yang等指出,数据质量是影响数据产品定价的关键因素[40],他们建立了基于质量等级的效用函数,并使用神经网络模型对真实数据集进行分类训练。随后,Stahl等对数据质量的维度、衡量标准和适用性等方面进行了探索,并建立了以数据准确性、完整性和冗余程度为代表的多维数据质量评价体系[38]。虽然定量、定性或综合方法可以有效对数据质量进行估计,但是无法解释维度的权重与客户完整性。为了解决这一问题,Xie等提出了一种纳入数据内在价值的定价模式,既有利于数据卖方实现利益最大化,同时也满足了数据买方对数据的差异化需求[48]。
2.拍卖机制设计的应用
在数据定价中,拍卖机制是一种重要的经济工具,用于卖方将数据提供给买方,并通过竞拍来决定最终的数据定价。维克里拍卖是一种最高出价者获胜,但只需支付第二高出价的拍卖机制。Xiong等提出了一种基于区块链和智能合约的反串通数据拍卖机制[49]。他们在智能合约中设计了反串通数据拍卖算法,通过采用密封竞价、竞价掩码和竞价揭示的方式来实现反串通数据拍卖,并设置了惩罚机制以惩罚拍卖过程中的不当行为。序贯拍卖是一种按顺序进行多轮竞拍的拍卖机制。在数据定价中,序贯拍卖可以用于逐步决定数据的售价。序贯拍卖通过多轮竞拍,根据买方的估值逐步确定最终的数据定价。Ausubel 等基于社会福利的角度拓展了维克里拍卖,并提出VCG 拍卖②[50]。Agarwal 等采用机器学习方法,构建了训练数据的市场。Cao等认为,现实情况下存在多个数据拥有者、收集者和用户的数据市场。因此,他们开发了拥有多重参与主体的数据交易机制,并基于不同主体的差异化效用需求使用迭代拍卖的方法交易数据[51]。Jiao 等通过将服务提供商的角色纳入拍卖机制,同时使用动态贝叶斯估计对获得的批量数据进行预测分析,以实现参与拍卖消费者的利益最大化[23]。
3.博弈论的应用
在数据定价中,博弈论是一种重要的工具,用于分析卖方和买方之间的策略互动和最优定价策略。以下将详细阐述博弈论在数据定价中的应用,并提供非合作博弈的定价模型、Stackelberg 博弈的定价模型和讨价还价博弈的定价模型。首先是非合作博弈的定价模型。在非合作博弈中,卖方和买方是独立决策者,各自追求自身的利益最大化。Luong 等定义了非合作博弈,并创建了一个物联网数据交易模型来阐释如何使用该模型。该模型反映了非合作博弈的一种典型的应用情况,即所有数据所有者都以竞争的方式参与交易[52]。其次是Stackelberg 博弈的定价模型。Stackelberg 博弈是一种领导者-追随者模型,其中卖方作为领导者首先制定定价策略,而买方作为追随者在卖方的定价策略下做出反应。Haddadi和Ghasemi发现Stackelberg博弈模型更适用于数据要素定价,可以有效促使参与博弈的主体实现各自的利益最大化,且相较于追随者,博弈中的领导者的利益往往更大[53]。对于捆绑销售和独立销售,Mei 等基于Stackelberg 博弈创建了一个交易模型,其中数据平台被认为是追随者,数据所有者被认为是领导者。此外,为了缓解数据买方与数据卖方的信息不对称问题,Liu 等在数据定价问题中引入了两阶段Stackelberg 博弈模型[54]。再次是讨价还价博弈的定价模型。讨价还价博弈是解决复杂谈判条件问题的一种合适方案,通常被应用于数据拍卖情境。在这种情况下,数据供应商和需求方分别提出他们认为最优的定价策略。如果需求方的出价高于供应商的出价,交易就达成;反之,双方继续谈判。Jung等提出了个人数据市场交易公平讨价还价的框架。在该框架下,交易双方隐私暴露的单位价格与程度可以通过差分隐私的方式进行估计[55]。同时该框架综合考虑了数据买卖双方的需求、偏好,交易价格以及预算和数据准确性等变量,提高了交易的公平性。
与传统商品不同,数据具有非排他性和非竞争性特征,即数据可以同时被多个用户使用而不互相排斥,并且使用数据并不会消耗或减少其价值。这种特征使得数据定价变得复杂,难以确定数据的边际成本和供需关系。
数据的价值往往是难以准确衡量的,因为数据的价值与其用途、质量、可靠性以及对决策和创新的影响等因素相关。数据的价值衡量问题增加了数据定价的难度,需要考虑到数据的多维特征和多方利益的平衡。
数据市场存在着信息不对称的问题,数据拥有者通常对数据的质量、隐私和使用条件等信息了解更多,而数据使用者则相对不完全了解这些信息。这种不完全信息可能导致数据定价中的信息不对称问题,影响数据市场的有效运作和定价结果的准确性。
数据的隐私和安全问题是数据定价中的重要挑战之一。隐私和安全的保护要求增加了数据定价的成本,并且需要考虑隐私和安全措施对数据价值和定价的影响。数据在定价和交易过程中可能面临未被授权方访问的风险。这可能导致数据泄露,对数据拥有者和使用者都构成潜在威胁。数据定价必须符合相关法律和法规要求,尤其是涉及个人数据的情况。例如,GDPR《欧洲通用数据保护条例》等法规对个人数据的处理有严格的规定,数据定价必须符合这些规定,以防止法律责任和处罚。
在数据要素定价经济学研究中,数据定价市场的监管和规范是关键问题,它涉及保障市场公平竞争、维护数据市场秩序和保护各方权益等方面。首先是市场准入与退出规则。经济学可以研究和设计市场准入和退出规则,以确保市场参与者的合理竞争和市场的可持续发展。其次是数据市场的价格监管与反垄断。再次是信息披露与透明度。透明的市场信息和数据定价机制可以促进市场参与者决策和提高交易效率,减少信息不对称带来的不确定性和不公平。
数据要素是传统生产要素理论的重大突破,准确反映了当今经济社会发展所呈现出的特征和趋势。自2019年十九届四中全会以来,党中央发布多项政策文件,围绕数据要素发展谋篇布局,并将关注点聚焦于数据要素市场化流通。特别是2022 年12 月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》正式出台,标志着我国数据要素市场进入有序规范的探索和发展阶段。本文基于经济学的视角,对数据要素定价领域的相关文献进行分析,揭示数据作为新型生产要素的经济学原理,研究纳入数据要素的新生产函数,构建数据要素生产、流通、分配等基础性经济理论,探索数据要素定价的可行性路径。
随着经济学理论的发展和计算机新兴技术的进步,数据定价的相关研究也不断更新。未来研究方向和发展趋势可以涵盖以下几个方面:首先是不断完善数据市场的机制设计。在数据定价领域,未来的研究可以关注更加高效和创新的数据市场机制设计。这包括研究不同类型的交易机制,如双边交易、拍卖和谈判等,以及定价机制,如动态定价、差异化定价和定价弹性等。此外,激励机制的设计也是一个重要方面,可以研究如何设计合适的激励机制来吸引数据提供方参与数据市场,并确保数据定价的公正合理。其次是有必要综合考虑非经济因素。除了经济因素,数据定价还受到社会、政治、技术等非经济因素的影响。未来的研究可以深入探索非经济因素对数据定价的影响机制。例如,数据定价与社会环境的关系,如公平性、平等性和社会价值等因素;数据定价与政策制度的关系,如数据保护法规、数据开放政策和数据治理机制等;数据定价与技术创新的关系,如新兴技术对数据市场和定价机制的影响。再次要重视数据隐私与知识产权保护。数据隐私和知识产权保护是数据定价领域的重要问题。未来的研究可以关注数据定价中的隐私保护机制和知识产权保护机制。包括研究匿名化和加密技术在数据定价中的应用,以保护数据的隐私;研究数据所有权和授权机制,以保护数据的知识产权;同时也需要探索如何平衡数据共享和保护的关系,以构建可持续的数据定价生态系统。此外,要加快新兴技术的应用。新兴技术如人工智能、区块链、机器学习和物联网等对数据定价产生了新的挑战和机遇。未来的研究可以探索这些新技术在数据定价中的应用。例如,利用人工智能技术分析数据市场的供需信息,优化定价策略;利用区块链技术确保数据交易的透明度和安全性;利用物联网技术实现数据定价的自动化和实时性。最后是要积极开展跨学科研究。数据定价问题涉及经济学、计算机科学、法律、社会学等多个学科。未来的研究可以加强跨学科合作,深入研究不同学科视角下的数据定价问题。
注释:
①K最近邻(K-Nearest Neighbor,KNN)分类算法,机器学习算法之一,用于计算某给点到每个点的距离作为相似度的反馈。
②VCG 原理是由Vickrey、Clarke 和Groves 三位经济学家于20 世纪60 年代提出的,它是一种拍卖机制,用于解决资源分配问题。VCG原理的核心思想是通过设定适当的激励机制,使参与者在报告真实信息的情况下,能够获得最大的效益。