陈 溪
(南京审计大学,江苏 南京 210000)
2020年4月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》对外发布,提出要构建数据要素市场化配置。数字经济已经成为新时代推动经济发展的一个新的增长点,数据资源也被认为是与土地、劳动力、资本和技术并列的新型生产资料。数据的价值需要在流转中实现,数据资源流转的实践尝试和立法也在如火如荼地进行中。公权力机关在国家治理过程中获取大量数据,形成了海量的公共数据池,为了使“深藏闺中”的公共数据得到有效利用,各地纷纷建立起了公共数据开放平台以促进公共数据的开放共享。在实践中,互联网平台基于其日常运营中所获得的数据,建立起平台的数据库,基于平台数据库的开放及数据产品,也给自身带来巨大的收益。有关数据权属的立法,地方也在做出积极的探索,如深圳、重庆等地在地方的数据立法中尝试建立起公共数据国家所有权制度。但更多地方的数据立法则是回避了数据权属的确定问题,主要原因是所有权制度属于基本制度,通过地方立法确定数据权属不合时宜。此外,基于数据本身的特殊性,数据的非排他性和更新频率快也使得数据确权难上加难。
数据的价值在聚合和流转中得到实现[1],因此促进数据资源的流转是构建数据要素市场的重中之重。公权力机关虽然建立起了公共数据开放平台,但是受限于预算法定主义,没有足够资金支持的数据开放效果大打折扣,“数据沉睡”成为公共数据资源池面临的最大问题。平台数据在对外流转过程中也因为缺乏定价的标准而缺乏活力,比起共享开放平台更加愿意“垄断数据”。随着《中华人民共和国数据安全法》(以下简称《数据安全法》)和《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)等数据领域保护立法的出台,公民的数据安全意识也日益崛起。数据领地意识成为阻碍数据流转的最大障碍。针对这种情况,有学者提出要“两头强化,多方平衡”[2],即对涉及国家利益和个人权益的数据进行强化保护,以及平衡多方主体的数据权益,合理分配数据利益的归属。对数据利益进行定价也是数据利益分配的基础,事先确立好数据资源的定价标准是打破各方疑虑,实现数据开放共享的有效途径。
有关数据权属界定的研究,学界虽然未能达成共识,但也形成了丰富的研究成果。数据资源的权属争议主要围绕公共数据、企业数据和私人数据三个方面展开。公权力机关、平台以及个人实际上是这些数据资源的掌控者,这三者也构成了数据权益分配框架中的三大主体。
目前我国中央立法还未界定公共数据的概念,地方数据立法在如火如荼进行中,并主要通过主体、目的和行为三大要素为公共数据的内涵和外延划清界限[3]。尽管各地标准不一,但公共数据的内涵在公共利益这一核心观点上达成共识。公共数据服务于公共利益,公共数据的开放共享旨在实现数据资源利益无差别供给全体公民。
公共数据的权属争议主要聚焦于国家所有、政府所有以及全民所有。将公共数据视为一个虚拟的公共数据信托资源库,国家得到全体公民的授权代为管理公共数据资源库,公共数据权益最终由全民共享,故而证成了公共数据国家所有权的正当性[4]。此外,宪法确立的国家经济干预职能也为公共数据国家所有提供规范依据[5]。公共数据国家所有在数据共享开放领域所展现的强大效能也反映了其生命力。公共数据资源库的形成有赖于公权力机关在进行公共管理活动和为公众提供服务的过程中所收集的数据,很难将这些数据再归属于行政相对人。有鉴于此,有学者提出将公共数据的权属定位为政府所有,意在强化政府促进公共数据资源流转的义务[6]。以公物制度为研究方法的公共数据资源权属构建,本质上与公共数据国家所有和全民所有并没有太大的区分,因而有关公共数据的权属争议主要就是政府所有还是全民所有。无论如何配置公共数据资源的权属,公共数据最终只能是服务于公共利益,公共数据资源的定价收益应由全体公民共享。
平台对其数据池内的数据资源享有所有权主要基于平台同平台用户之间的“网络服务协议”,双方基于“合意”约定彼此的权利义务与责任承担。当前网络平台的话语权为大型平台公司所掌握,因而赋予平台以数据资源所有权容易造成数据垄断,阻碍平台所有海量数据的流转。同时,平台对数据资源所有的合法权益也理应得到保护,不然会严重打击平台企业的创新性和积极性。
平台数据权益的保护立法在地方已经初见端倪,上海和深圳的地方数据立法,在“数据要素市场”专章中规定了“市场主体对合法处理数据形成的数据产品和服务,可以依法自主使用,取得收益,进行处分”。地方立法回避了对平台数据资源权属的界定,取而代之的是承认其对数据产品和服务合法的权益。公权力机关的公共数据池和平台企业数据库已经基本囊括了数据市场中数量最大、更新频率最快、类型最多的数据。立法确定了平台企业对数据产品和服务的合法权益,平台产品和服务的定价标准则成为打破平台数据垄断,促进平台数据共享开放的关键一环。
总之,确立平台数据的合法权益就是承认平台对其合法取得的数据以及在此基础上所形成的产品和服务的使用、收益和处分的权利。
因为单独个人的数据权益缺乏流转性和聚合性,所以单独来看缺乏价值。私人数据的权益主要通过一次次的免费数据换免费服务得以实现。平台和公权力机关为私人提供服务,作为代价,个人数据被收集最终形成了公共数据池和平台数据库,平台则通过数据的再利用获得收益,反哺其成本投入。
个人数据的此种交易模式往往难以被察觉,个人所投入的时间、精力以及数据泄露所带来的风险则构成了私人数据的代价。尤其是随着《个人信息保护法》和《数据安全法》等个人信息保护领域的法律出台,私人的数据保护意识逐渐加强,倾向于隐藏自己的个人数据。数据资源的最大来源就是私人的网络活动,因此这样的情况则不利于数据资源的聚合和流转,大大影响了数据资源发展空间。
个人数据权益的重点应该聚焦于个人数据的保护,打消个人对数据安全风险的疑虑。此外,再把目光转向个人用免费数据换取免费服务这一交易过程的公平性,进一步激发私人共享数据的热情。
可见,数据资源权属争议的探讨最终都归结到公共数据、平台数据和私人数据背后的公权力机关、平台和私人对其所控制数据的流转问题。这三大数据的控制主体在数据权益分配框架中占据主要地位,他们的流转意愿直接决定了数据资源的生命力。唤醒“数据沉睡”和打破“数据垄断”的关键在于数据定价,在于能否达成让交易双方满意的定价标准。
传统的商品定价是以生产成本和一定数额的利润为基础确定商品价格,此种价格确定模式不适合数据价格的确定。数据价值的不确定性和主观性进一步加大了数据定价的难度。大数据的关键特征在于“3V”(volume,variety,velocity):其一是数量大,海量数据资源被收集和存储,且这个数据池还处于不断增长中;其二是种类多,在万物互联互通的时代,数据种类的丰富程度远胜以往;其三是更新频率快,数据处理技术的不断发展加快了数据生命周期各环节数据的更新速度。这是从数据本身角度出发对决定数据价值的要素进行的分析。此外,也有学者提出了基于数据本身的生命周期以及数据价值链的定价模式[7]。此种定价模式聚焦数据生命周期,将数据收集、分析、储存和使用等环节中所需要的人力成本、税费和管理费用、设备投入均纳入数据价值确定的考量因素中,多种因素共同决定了数据资源的价值。
3.1.1 数据数量(volume)
大数据时代,数据的数量越大,对数据经过统计和分析之后得到结果的精度影响越大,“大数规律”在大数据时代更加明显。掌握了数据,便掌握了数字时代的话语权,数据权力因而产生。反映到数据定价领域,数据样本的数量、数据所占据的存储空间等均是决定数据价值的重要因素,也是在确定数据价格的时候首先需要考量的一个因素。
3.1.2 数据种类(variety)
一般来说,利用大数据技术对海量数据进行分析时,数据的种类越丰富,最终得到的结论也越加准确。不同种类数据的聚合和重构也为新数据的产生奠定基础,进而又继续扩充数据资源库。数据资源库得以不断地扩充,变得更加完备,从而提升了数据资源的整体价值。
3.1.3 数据更新速度(velocity)
当今世界瞬息万变,数据更新的速度远超想象。数据资源库在不断地更新中扩充自己容量并提升自身的准确性。数据资源的生命力也在于它的时效性,时效性越强,基于此数据库的分析所得结果的精确度便越高,则数据权益的价值越高。
总而言之,基于数据不断变化的特征,需要以动态的视角考量与平衡数据权益配置,这也是数据价值确定的痛点所在。
从数据数量、种类和更新速度来确定数据价值是一种很直观的方法,是基于数据本身特征的考量方法。此外,数据的直接控制者为数据所付出的“代价”也应是确定数据价值的重要考量因素。因此,需要解构数据生命周期中的收集、存储、分析、利用等各个环节,数据的价值才能得到进一步展现,而这就是数据价值的完整实现过程,我们称之为一个数据价值链(the data value chain)[8]。此外,这种定价方法亦可以解决数据流通过程中各主体地位不平等的问题,以动态的方式评估数据的价值,从而形成一套稳定、准确、科学的数据价值评价机制。
3.2.1 收集环节
数据收集环节所得到的数据是原始的数据,这一阶段的数据价值还不是很高。公共数据在收集阶段主要依赖于公权力机关进行行政管理和提供公共服务过程中所收集的各种数据,基于预算法定主义,此类数据的成本得到了财政的补助。因此,公共数据的公共利益属性明显。平台在收集数据时,以为用户提供免费服务为代价获取了用户的免费数据。此外,数据收集阶段各种传感器的使用也构成数据收集的成本。私人在数据收集过程中,基于保护自身隐私的考量,越来越不愿意分享个人信息,这也是数据收集顺利进行的一大阻碍。
3.2.2 存储环节
数据存储环节所要支出的成本也是不容忽视的,海量的数据对数据存储环节提出了更高的要求。除了需要专业的人才,高速运转的存储设备也面临损耗等问题。此外,存储环节对数据安全提出了很高的要求,为保障数据安全所要支出的必要费用也是需要考量的。
3.2.3 分析环节
为挖掘数据的价值,分析环节可以说是数据生命周期中最为重要的部分。经过分析挖掘后的数据,其价值才能够得以充分实现。数据分析阶段,最大的支出应该为人力资源的支出,数据专家脑力劳动的结晶被注入数据分析的过程和结果之中。
3.2.4 利用环节
数据的利用环节关系到数据资源如何转化为数据产品和服务,这也接近数据流转过程的最后一步。数据资源转化为数据产品和服务,这一环节需要投入产品研发费用、市场推广费用以及产品所需的税费和财务费用等。
总之,应从数据价值链的角度解构数据生命周期各环节的价值所在,逐步发掘数据的价值。此种定价方法可以避免数据界权给确定数据价值带来的问题,使数据利益的分配有章可循,也考虑到了数据生态中的各方利益,平衡各方利益,进而推动数据资源的有效流转。
对数据资源进行场景化的定价需要率先形成一套符合当下数据定价市场需求的规则。因此,目前需要通过场景化的个案和理性的规则来推动数据定价规则体系的形成[9]。数据权益定价问题需要以场景为基础,这就意味着,个人数据权益、公共数据权益和企业数据权益的定价需要采取场景化的定价方式。通过具体的场景能够确定数据的性质和价值所在,各方在具体场景中有着不同的合理预期,从而确定并分配各个数据权益主体的数据权益,可以有效解决数据权属争议与数据定价问题。
公权力机关在行使行政管理职能时收集了海量的数据,形成了巨大的公共数据池。数据资源在公权力机关内部共享,极大提升了公权力机关的行政管理能力,形成了科学、教育、体育、文化、医疗卫生等诸多领域的数据库。此外,以公共数据资源池为依托,平台企业也开发出了各类数字产品和服务。如依托各工商部门数据的企查查及依托地理和交通数据的高德地图等,公共数字资源经过平台企业的处理变成了各种数据产品和服务。
一般来说,公共数据开放是为了公共利益,原则上应该是免费开放给社会公众的,但在实际运行中,受限于预算法定主义,仅依靠财政补助的地方公共数据中心和以此为依托构建的数据开放平台运行效果差强人意。现实中,对公共数据有着更大需求的大型平台企业请求数据开放的规模和频次远高于普通公民,公共数据大规模和高频次的开放加重了公共数据处理的负担,且这部分企业以公共数据为依托获得的利润无法直接反哺公民,有违公共数据的公共利益属性。因此,基于“受益者负担”原则,作为“特别受益人”的企业就需要承担“特别负担”[10]。公共数据的有偿开放场景下,数据定价具备一定的必要性。
公共数据的有偿开放可以选择的路径有依据成本进行定价的模式以及基于成本和利润的综合定价模式[11]。由于公共数据资源的核心在于公共利益,不具有盈利的属性,因而以利润为考量因素确定公共数据开放的定价有违其公共利益属性。公共数据有偿开放的目的在于补偿运行成本,在具体操作中可以参考政府信息公开制度中的有偿公开模式,以公共数据的调用频次为依据确定公共数据开放的定价收费标准。政府数据开放收费应符合行政收费的法治框架,可事先构建公共数据调用频次的定价模型,再由政府确定公共数据开放的指导价,完善公共数据开放收费的程序,加强对收费行为的监督。
此外,公共数据的授权运营制度也是挖掘公共数据资源价值的一种选择路径,实践中已经有了相关的探索,但还缺少相关的法律规定[12]。公共数据授权运营场景下,数据的定价收费规则有待讨论。
为破解数据孤岛,更大程度推动数据资源的流转,平台企业也希望推进自身数据资源与更大的数据资源库融合。数据权益分配机制的缺乏是阻碍平台数据积极对外流转的最大阻碍。数据权益分配主要参考各主体对数据价值提升所做出的贡献,而各方的贡献度由市场来评判,以贡献度作为数据权益分配的基础,有助于协调数据在平台与平台间流转过程中的各方利益。
平台数据的定价方式可以分为协商定价和第三方定价两种方式[13]。协商定价具体主要包括拍卖和协议定价等,第三方定价的主要方式是固定定价和实时定价。这些定价方式各有利弊,拍卖定价主要针对的是隐秘性和安全性高的数据;协商定价双方都有议价能力,磋商过程也是双方利益再分配的过程;固定定价缺乏灵活性,所针对的数据资源价值也有限;而实时定价的方法则具备很强的应用价值,有很大的发展空间。
平台数据的产生过程中,平台用户是数据的直接生产者,用户应该对其产生的数据享有数据利益。在此种场景下,用户选择使用私人数据作为平台提供服务的对价。此种数据交易模式每天都在互联网上发生无数次。这种定价的依据是用户与平台签订的网络服务协议。但私人在这种交易中没有议价权,未来要考量的是此种交易的公平性如何保障,以及如何强化私人的议价权。
新时代,数据资源的供给和需求在规模、结构等方面都发生了深刻嬗变。数据资源定价制度的建立,将会极大地推动各类数据资源的有效利用,还将促进数字经济的发展。确立数据资源的定价标准将确保数据资源的真实、合规、有效,充分发挥数据的价值,减少数据安全风险,也是推进国家治理体系和治理能力现代化的必然之举。