姚 佳
(中国社会科学院 法学研究所,北京 100720)
中国数字经济的发展已步入快车道。世界范围内,虽然各国对于数字时代的到来具有极大共识,但是各国就数字化、智能化在科技、经济、社会、文化等领域发展的理念与侧重点却差异较大,在体系建构、治理路径以及规则配置上各有特色。中国近年来在发展数字经济方面独具优势、路线清晰。习近平总书记指出,发展数字经济意义重大,是把握新一轮科技革命和产业变革新机遇的战略选择。数据作为新型生产要素,对传统生产方式变革具有重大影响[1](P17-18)。从数字经济实践来看,中国在系统构建网络安全、数据安全和个人信息保护的基础上,当下以及未来旨在面向如何促进数据高效流通使用、赋能实体经济等方面构建数据基础制度体系[2]。在数据要素市场化的国家战略基调下,如何进一步构建数据基础制度体系,成为中国科技与经济发展进程中的重要理论与实践问题。为保障数据基础制度在规范化、法治化的轨道上发展,法律制度又将如何跟进、调试与完善,成为当下理论、立法与监管等各领域所共同面对的重要且迫切的任务。
数据要素市场化的发展既符合数字经济发展的客观规律,又与国家政策引导紧密相关。当下,数字技术、数字经济是世界科技革命和产业变革的先机,是新一轮国际竞争的重点领域[1](P18)。2020年3月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中,确立数据作为一种新型生产要素。将数字经济活动中客观化的数据转化为市场要素动能,是中国的重要政策创新。
综观域外,各国都重视发展数字经济,但是各自发展和治理路径不尽相同。美国近年来以持续强化数字基础和数字技术如5G无线通信、人工智能、网络安全为建设的重心[3](P35),同时延续其一贯的商业发展开放态度,对互联网的发展也持自由开放态度[4](P9)。受美国隐私保护传统的影响,对于个人信息或个人数据的保护,主要从消费者隐私保护的角度予以规制。而专门对于数字经济发展的强调,在国家层面并无统一行动,而主要依靠商业领域自身发展。
欧盟数字经济发展并不显著,但是数据治理立法却较为密集。2018年《一般数据保护条例》(GDPR)施行之后,又陆续推出欧盟《非个人数据自由流动条例》,意在打破非个人数据之间存在的壁垒,以更好地推动非个人数据在欧盟境内的自由流动。近年来又相继推出《数据法案》、《数据治理法》、《数字市场法》、《数字服务法》等法案。欧盟推出这些法案,意在对数据进行系统治理,但在推动数字经济发展方面却并未有更为显著的行动。
相较于美欧,中国发展数字经济的优势显著,并且强调数据要素市场化以及数据基础制度的构建。对于数据基础地位的强调并将其上升为生产要素,是中国近年来发展数字经济的顶层设计与重要环节,成为发展数字经济的显著特征,走出了有中国特色“要构建以数据为关键要素的数字经济”[5]之路。近年来,国家层面不断推出相关政策,强调数据要素的基础地位以及数据基础制度的构建。在世界范围内,对于数据要素的认识和制度的系统构建,中国居于较为领先的地位,也为做强做优做大数字经济奠定了基础。
在国家整体推动数据要素市场化以及构建数据基础制度之时,仍然存在诸多障碍以及制度阙漏,这就要求经济、法律与社会在各个制度层面予以回应。2022年6月22日,中央全面深化改革委员会第二十六次会议审议通过了《关于构建数据基础制度 更好发挥数据要素作用的意见》,强调数据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系[6]。江小涓教授曾指出,如果数据市场或数据社会无法形成有效的自发秩序,不能依靠竞争和主体间的博弈维护交易秩序和稳定预期,不能促进创新,那是否就意味着需要形成一个行政监管和法律秩序为主的经济和社会?其中,数据的权属和交易秩序如何形成是一个大问题,预示着数字时代与数据市场是否与“市场经济”相容[7]。尽管数据产权命题需要经济学和法学等共同作业,但是对于任何客体,可交易的前提均是主体对相应客体具有明确的权利边界,否则就不存在交易的基础。数据权属问题素来是法学界关注的重要问题,也是未下定论之题。但是,面对数据要素制度等前沿制度的急速发展,相关理论和问题的障碍与难题已不可回避,法学理论与法律制度应对数据确权与数据交易予以系统回应。
数据是一种电子记录,其本身是一种客观存在。个人、平台、公共机构等不同主体的数据,在不同场景之下,既存在客观归属,又存在一定价值评价。需要明确的是,数据本身可能并不一定具有经济价值。如姚期智院士所指出的,数据经济价值的产生是在决策模型的使用上,分配经济价值实际上分配的并不是原始的数据资料,而是分配数据原始资料所产生的决策模型所带来的经济价值。事实上,随着算法的运用、算力的提升,通过数据分析,有效地提升了人类的决策力和判断力。人们更多地聚焦于一种“体量”意义的数据给各领域带来的改变[8]。与此同时,人们也较为自发地在数据资源、数据资产、数据资本等多个向度讨论数据的价值与功用[9][10][11]。在《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中,确立数据作为一种新型生产要素。认识数据相关概念及其核心特征,对于思考即将推进的数据要素市场化以及数据基础制度构建,是一个必要前提。
在认识论上,数据虽然具有经济价值,但是就概念构成而言,从“数据”到“数据要素”之间仍需要一系列概念支撑与证成。在计算机科学、经济学、管理学和其他学科领域,主要系由数据资源、数据资产、数据资本等概念作为中间过渡性概念,最终形成“数据要素”概念。而对中间系列隐性概念的理解,也有助于更好地理解数据何以成为数据要素,以及数据要素如何更好地发挥其独特价值与作用等关键问题。
数据资源,是指有含义的数据集结到一定规模后形成的资源。信息化的广度和深度都达到了相当水平,数据就成为资源[12](P32-33)。对于“数据资源”这一概念的使用,《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)提出,发掘和释放数据资源的潜在价值,有利于更好发挥数据资源的战略作用,为此应积极推动公共数据资源开放与保护以及数据资源权益等相关立法工作。在2021年3月《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中,对于数字资源的利用和保护等问题,在公共数据开放共享、建立健全数据要素市场规则、加强网络安全保护等方面多次提到。同时各地方政府也纷纷推出加快公共数据资源开放利用实施方案等文件。无论是抽象层面对于数据资源的概括,还是在具体政策指引方面对于数据资源的强调,都表明这一概念在当下所具有的重要意义。
数据资产,是指拥有数据权属、有价值、可计量、可读取的网络空间中的数据集[13](P73)。这一概念一般是从企业角度出发,旨在挖掘数据对于企业的价值。也有论者认为,应从个人、企业、政府、国际等多层面审视数据资产的作用和意义[14]。这一概念在讨论数据价值和确权等问题之时也有一定的运用,有利于人们理解作为数据集合的数据的价值和意义。
数据资本,是指以现代信息网络和各类型数据库为重要载体,基于信息和通信技术的充分数字化、生产要素化的信息和数据。这一概念与单纯的数据信息、信息与通信技术资本相区分,重点分析数据和信息的生产要素化过程,及其作为生产过程的关键投入对于经济增长的影响[15](P39)。在已有的数据相关概念体系中,数据资本这一概念已经相当接近于数据要素这一概念,并将其置于生产要素的地位。从生产投入与经济增长的角度进行讨论,由于数据资本化仍然需要较多条件,因此数据资本这一概念在当下所讨论的数据流转利用方式中使用不多,但近年来在讨论数字经济等新经济方式之时也有所关注[11]。
数据要素,是数据成为用于生产产品和服务的基本投入因素之一[16](P24)。从生产要素的角度探讨数据的地位,更推进了数据在经济、社会乃至国家发展中的基础地位。在《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中,从加快培育数据要素市场、加快要素价格市场化改革以及健全要素市场运行机制等多角度探讨数据要素的机制体制配置。至此,从生产要素角度探讨数据的开发、利用、流转等具有了相应政策依据,并致力于从不同层面实现数据的生产要素作用。
以上对于已有数据相关概念的初步探讨,有助于理解当下可能会在不同背景和场景下运用的不同概念。这些概念可能是从“数据”到“数据要素”之间的一系列概念,它们之间或有交叉和重合,又具有自身的独立性,对于观察数据领域的概念发展与实践发展过程具有重要意义。在数据要素市场化过程中,这些概念都在不同层面和不同程度上具有意义。就概括的数据而言,除了数据治理之外,尚需从流通利用、社会生产、社会资源开发等多角度理解和观察,而数据、数据资源、数据资产、数据资本和数据要素是理解这些不同场景、讨论不同情形的概念基础和理论工具箱。
数据要素的价值以其开发、利用和流通为关键。数据的虚拟性使得其必须在以其他生产要素作为载体才能发挥作用,其多存在于信息和通信技术产品之中。经济学领域有论者认为,虚拟性是数据区别于其他传统生产要素如劳动力、资本和土地的最主要差异,也是知识、技术、管理和数据等新型生产要素的主要特点。同时,数据还具有非竞争性、排他性、规模报酬递增、强正外部性、产权模糊以及衍生性等特征[17](P143-144)。数据本身的特征加之数据要素的主要特征,共同构成了数据要素的独特特征。
数据要素本身的作用与数据基础制度的构建,为如何发展以数据要素为核心的数字经济带来新的动能。数据要素所具有的特征划定了其与其他生产要素的边界,并对其他生产要素的作用和功能的实现发挥辅助作用,甚至一定程度的主导作用。比如对于劳动、资本、土地、知识、技术、管理等要素,传统上数据主要发挥辅助作用,提供一些决策辅助支撑。但是面向未来,数据对于这些传统生产要素的发展可能会发挥主导作用,使传统生产要素向智慧化方向迈进,从技术的角度提供更具有深度和广度的决策支撑[16](P28)。总而言之,从数据要素角度观察数据的全生态,才是构建数据基础制度的前提与基础,数据基础制度的构架也必然是覆盖数据全生态的规则提炼。
数据要素的利用也存在一系列亟待解决的问题。比如产权边界不清晰,如何界定不同主体之间的数据和相应可能享有的产权,甚至如何界定数据产权这一概念,都存在较多分歧与争论。上述数据要素的特征是否对数据赋权具有决定性作用?有观点认为其非竞争性、产权模糊等特点对于赋权存在极大障碍,因而否定数据产权。有观点基于数据占有即排他而认为存在赋权空间,但赋予何种权利类型则仍需探讨。值得关注的是,数据要素更多是从数据如何发挥更大功用的角度考察,在涉及可能的赋权问题时,则会基于数据、数据资源、数据资产等不同形态而予以讨论。
若数据产权问题存疑,则数据交易就成为难题。产权不清晰、数据内容定价缺乏相应标准,就导致数据产权与数据交易之间产生“鸡生蛋还是蛋生鸡”的难题,从而使数据要素市场化的实现存在诸多障碍。如何破解这一系列难题是数据要素市场化的关键,不仅需要解决为何市场化的问题,更需要解决如何市场化的问题。尤其是在国家层面推动数据要素市场化的大背景下,即便面对可能存在障碍的问题,也不能再采取“鸵鸟政策”,而应当积极回应数据要素市场化,构建系列基础制度。
数据要素市场化应当建立在客观事实与实践需求的双重基础上。与此相应,法律应在客观认识事物与社会事实的基础上作业。数据确权制度的构建虽然是要解决数据要素市场化的问题,但更是为了解决数据归属与利用行为的公平与激励问题。对于不同主体,应当根据数据生成的原理与路径,对不同的数据享有不同权利,对于可利用的数据,则进一步讨论流转利用的问题。
数据确权究竟应指向哪些权益以及包含哪些内容,近年来争论颇多。有论者认为,数据权益分配应遵循二阶序列式论证规则,即公共利益与人格利益一般优先,财产利益则按各方在数据活动中的贡献度确定权利边界[18](P67-75)。有论者则认为,应从物权法的角度着眼,以权利分割思想为基础,以数据用益权和数据所有权二分为思路,由数据原发者享有所有权,由数据处理者享有用益权[19](P117-127)。另有论者认为,对于处在公开状态的没有独创性的大数据集合,应当为耗费实质投入并达到实质规模的大数据集合设置有限排他权,即公开传播权[20](P10-13)。还有论者认为,基于对数据的事实控制,数据控制者具有事实上的数据使用权,在确立数据流通利用责任规则的基础上,可进行数据的流通利用[21](P1419-1422)。这些争论从不同角度,对数据确权问题进行讨论。数据确权主要集中于数据的财产利益,在这方面,基本上均认同根据数据活动中相关主体的实质投入和贡献度予以确权的思路。
财产权益的确认与分配比人们想象得更加复杂和困难。当提及对一项所谓的财产是否应有相应财产权时,英国哲学家、社会学家霍布豪斯(Leonard T.Hobhouse)认为,法律理论与经济事实之间、成文法与习惯之间以及权利的推定内容与实际享用之间存在着巨大差异,导致同一制度(在一定限度内)被描绘得全然不同,且均诚意满满又言之凿凿[22](P168)。数据确权主要以面向数据的利用流通为关键,进入流通利用活动中的数据事实上与个人信息保护相区隔。在中国实施《个人信息保护法》并已构建较为充分的个人信息保护制度之后,前端基于个人信息处理规则的适用,可以认为其切断了个人数据与数据处理者所处理的数据之间的联系。数据处理者可以利用的只能是匿名化信息,尽管在技术上能否完全实现法律意义上的“匿名化”另当别论。隐私保护与个人信息保护是一个当然前提。除个人信息之外,个人仍生产或贡献了其他属于财产权益范畴的数据,比如个人撰写相关文字内容、上传相应图片、视频等可能构成著作权或者其他权利的内容。数据确权也应包括如何看待这部分内容的性质以及归属等问题。总而言之,数据要素市场化的主要立足点应集中于数据的财产权益的确权,以实现数据要素市场化的初衷与主要目标。
任何利益确认的前提均为事物本身的实际存在、基本原理以及实践或习惯中各方主体所共同认可的事实。在数字经济已发展多年的背景下,对于如何确认不同主体的数据权益,已形成一定共识,也有一些问题尚待商榷。
基于不同主体生成数据的事实,在众多争论之中,“数据来源者”和“数据贡献者”的思路,基本上为各界所认可。从个人与数据处理者之间的关系来看,二者对于不同数据的区分以及性质,在相当程度上已形成一定共识。
个人数据以个人生成为基本原则,并与个人信息相区分。在中国现有法律制度下,个人信息保护规则已将个人信息与后端的个人数据切断,实现相应区分。因此,在数据要素市场化背景下讨论的数据确权中的数据,实则并不涉及个体的人格利益,侵害人格利益的侵权法适用则另当别论。在与个人信息相区分之后,以“数据来源者”为基本评判标准可知,个人撰写相关文字内容、上传相应图片、视频等可能构成著作权或者其他权利的内容,在平台与用户订立的格式化的用户协议中,平台也认可用户对这些内容享有相应所有权,而平台仅享有相应使用权。另外,还有一些数据是为实现某种市场基础设施的辅助功能而形成的数据,例如,身份认证、行为分析、连接匹配和声誉信用等,进而形成认证数据、分析数据、连接数据和声誉数据等[23](P1585)。这些数据大致属于用户作为数据来源者所贡献的数据,但是这些数据实际上也会在不同活动中呈现为不同形态,并且根据不同场景而分别归属于个人或平台等不同主体,因此,此处对于这些数据仅属于客观描述。
对于上述前一类用户享有著作权或其他权利的内容,应当属于个人数据。准确而言,用户属于此类数据的来源者。那么,在讨论数据要素市场化之时,接入用户作为平台运营的“贡献者”的这一话题之时,个人可否就平台在运营过程中概括使用这部分数据获得的收益而请求作为数据贡献者参与相应的利益分配呢?这个问题实则是近年来讨论较难逾越的障碍与争论点,但或许也能以相对抽象简单的思路来理解。
首先,个人有权授权平台等主体使用自身的数据,但同时也有权不授权包括平台在内的相关主体使用这部分数据。未获得用户授权而使用或者不当使用这些数据而对用户产生不利评价、侵害用户名誉权的,应承担相应侵权责任。
其次,若仅从一端或一个横截面来看,个人确实是数据的贡献者,但是平台经济最大的特点在于其突出的网络效应、规模效应以及生态性,只有在平台这一载体上的互动、指数型叠加等活动,才能产生最终的经济价值。有学者认为,数字技术不仅赋能文化产业全链条,而且创造出了新的平行数据市场——海量消费者数据被广泛收集使用,创造出精准推送广告的价值[24](P15)。但是平台与消费者之间的关系,必须放置在平台与消费者之间无限频次互动行为与活动之中才有意义。事实上,平台通过一系列网络生态的形成与塑造,进而提升用户的体验和平台的服务,也是一种对于用户交互的“反馈”与“对价”。
最后,若从数量上计算,用户数据的贡献随着用户的增加被无限摊薄,因此以何种“利益池”为基本标准来计算十分困难。这一点与作为著作权人的作者与文献数据库类平台主体之间的关系完全不同。数据库属于完整地使用相应作品,除了作品的形式被数字化处理以外,其余并未有实质性改变。从已有的作者与数据库之间的信息网络传播权纠纷来看,也多以侵权责任的承担来判定相应损害赔偿数额。虽也有作者主张要求数据库基于日常运营而分配相应收益和利润,但目前实践中尚未有先例支持。因此,作为平台的数据贡献者,其数据以无限量级体现,如何确定每一数据以及数据来源者的实际贡献,似乎理论上和实践上均不太可行。
企业或平台对其自有数据以及基于其投入与贡献而生成的数据享有相关权益。企业或平台在自身运营过程中,已产生相应经营、财务、管理等诸多数据,系企业或平台的自有数据。在用户数据经授权已由平台享有使用权的前提下,平台基于投入与贡献而享有相关数据权益,即经过算法加工的数据属于平台。“数据作为新型生产要素”,其中的“数据”实际上包括多种形态,如个人信息匿名化处理后的数据、平台自有的信息或数据、平台自身生成的数据、基于技术介入而形成的认证数据、分析数据等。这些数据经由算法以及技术的加入,形成新的数据,供平台自身或者公共性意义上的统计、分析、决策以及提升社会福祉等多种目标的实现。
根据劳动理论以及劳动投入是否产生增值价值等,经算法加工挖掘而增值的数据,具有商业秘密的属性,甚至可成为商业数据权[25](P92-97)。这一观点也是在不断争论中逐渐形成的。当下所聚焦讨论的数据产权等问题,实际上也主要聚焦于这部分数据。在“大数据时代”以前,线下经营者或数据持有主体对其所掌握的数据也会进行统计以及后续利用,但对于这部分数据权属似乎并无争议,也未见讨论此类数据的权属问题。在进入“大数据时代”之后,由于数据体量的剧增和算法的加入,使得数据发生了“质”的飞跃,能够发挥更多价值。同时又由于平台经济中用户与平台之间的距离更近,其连接更为直接和直观,使得用户权益的强调更为突出。有学者也将此种理论概括为数据生产理论[26](P11)。对于企业或平台数据,就有数据集合、数据聚合以及数据资产、数据资本、数据资源等多种描述性概念,但其实质仍为数据的多种样态。因此,此处讨论数据确权等问题时并未对其进行区分。对于一般而言的企业数据,或可概括地归属于平台,即这些数据具备匿名化个人信息、经加密和算法加工挖掘、具有(交换)价值与具备技术相通的可行性[27](P115)。至此,企业或平台的数据权利边界也相对比较清晰。
除此之外,工业数据的产权问题值得关注。在工信部《工业数据分类分级指南(试行)》中,工业数据是工业领域产品和服务全生命周期产生和应用的数据,包括但不限于工业企业在研发设计、生产制造、经营管理、运维服务等环节中生成和使用的数据,以及工业互联网平台在设备接入、平台运行、工业APP应用等过程中生成和使用的数据。这类数据也是当下亟待开发利用流通的数据,其产权如何界定也是较为重要的。
至于公权力机关与个人之间对于数据权利的界限以及对数据享有的权益问题,实际上与企业或平台等享有相应数据权益的基本逻辑相同,只不过公权力机关对数据的使用等会存在基于公益目的的例外考量。在以往实践中,至少从数据确权角度而言,人们并不会否认公权力机关对于相应个人、企业或平台数据的使用,只不过需要遵循个人信息保护、数据安全等方面要求。同时,对于财产权益分配的请求,至少从目前的理论和实践来看,公权力机关对于数据的使用更多旨在实现公益目的,如何衡量其中所谓的财产性收益尚难以界定。相应地,公共数据本身则应被定位为公共产品而向社会开放共享。
数据确权是数据要素市场化的基础与关键。实践中业已形成一些基本事实,以及主体之间基本认可的事实,并且一定程度上符合理论逻辑。在这些基本事实的基础上,有一些可纳入现行法律框架之中,有一些则需要立法予以进一步确认与强调。因此,就未来的立法而言,一方面是对于人们认识到的但却可能有所忽视的已有的社会事实予以确认;另一方面,应同时补足需要调整但是现行法又未予规定的内容。
确认已有的社会事实以及主体权利。如个人对于其生成的数据享有相应著作权或类似权利。而且在平台实践中,就用户享有数据所有权、平台享有使用权在绝大多数的平台协议中均有约定。当然,此处的“所有权”并非财产法意义上的所有权,而是类似于著作权意义上的权利。这部分内容实际上在现有法律框架下可以通过侵权法解决,但是可进一步确认实践中业已认可的用户权利,同时明确企业数据权益的范围。
2022年6月中央深改委会议提出,要建立数据产权制度,推进公共数据、企业数据、个人数据分类分级确权授权使用,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,健全数据要素权益保护制度[6]。这一数据领域的“三权分置”与传统上农村集体土地的“三权分置”的思路不同,它强调的是一种“持有”,意在防止除数据主体、数据持有主体之外的其他主体的侵害。同时,数据加工使用权、数据产品经营权也是从流通利用角度确认数据加工者、数据产品加工者的相应权利。
增加完善财产权益分配的规定。对于企业、平台等利用匿名化信息、经算法、技术等投入而获得的收益归企业或平台等享有,同时对于个人信息的匿名化通过相应标准予以规定。公共数据开放共享,以免费为主,个别情形下可考虑以弥补成本为依据的有偿模式,但仍应以无偿为主,有偿为例外。
数据交易是数据流动和利用的重要制度依托。财产权制度意在确认财产等客体之归属,这是数据交易的前提。任何交易均旨在针对权利边界清晰的客体进行交易,也是旨在维护交易安全,否则就不可能存在交易。同时,数据交易也是国家数据要素市场化的重要制度与关键环节。法律制度如何回应,亟待思考研判。而信息领域的交易,也曾经遭受质疑。美国经济学家阿罗(Kenneth J.Arrow)曾提出信息交易悖论,即在交易时,买方需要事先了解或获取数据或信息,以确定数据或信息的价值。一旦卖方向买方披露了数据,买方就相当于免费获取了信息或数据[28](P145)。阿罗悖论提出了一个很关键的问题。在由来已久的任何买卖或交易之中,法律对于当事人之间主要解决的就是信息不对称的问题。在合同法或消费者法的各种规则建构之中,通过强化经营者或卖方的说明义务和信息披露义务,也是旨在解决信息不对称问题。当“信息或数据”本身成为交易客体时,交易中所要解决的信息不对称是否包括所要交易的数据或信息本身呢?这似乎又陷入另外一个循环论证之中。面对一系列疑问,下文拟探讨数据交易制度的基本构造及其规则配置需求。
数据交易作为一种以数据为交易客体的制度,关于数据、交易、数据交易管理等一系列规则均涵盖于其中。2021年6月通过的《数据安全法》规定了国家建立健全数据交易管理制度。其中,第19条规定:“国家建立健全数据交易管理制度,规范数据交易行为,培育数据交易市场。”第33条规定:“从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,并留存审核、交易记录。”这是首次在国家立法层面明确规定数据安全之下的数据交易管理制度。这一制度的确立既为后续数据交易流通制度的构建奠定了基础,同时也留下一些问题尚待探讨。比如,到底应如何界定数据交易制度、数据交易管理制度?哪些数据可以交易?涉及哪些主体以及具体交易形式?这些问题都直指数据交易制度的核心。
在个人信息保护立法的过程中,也曾对个人信息流动利用等有所关注。2020年10月《个人信息保护法(草案)》(一审稿)第1条规定:“为了保护个人信息权益,规范个人信息处理活动,保障个人信息依法有序自由流动,促进个人信息合理利用,制定本法。”其中明确提出“保障个人信息依法有序自由流动”。不过后来考虑到个人信息保护法主要致力于对个人信息的保护,而对于信息流动规则等应由其他法律规定,因此在《个人信息保护法(草案)》(二审稿)中将该句话删除,改为“为了保护个人信息权益,规范个人信息处理活动,促进个人信息合理利用,制定本法。”对于合理利用的情形在个人信息保护法中有所规定,而对于流动等内容未再提及。这一点可以理解,因为无论从原理上还是在法技术上,都很难完成在一部法律中规定信息数据法全部规则的任务。包括欧盟在内的比较刚性制定信息数据法律的国家或地区,对于个人信息保护、非个人数据的自由流动以及数据系列市场制度都是逐步推进的。
在国家市场监管总局和国家标准化管理委员会联合发布的《信息技术 数据交易服务平台 交易数据描述》(GB/T 36343-2018)这一推荐性标准中,第3.2条规定,交易数据是在数据交易服务平台上供需双方进行交易的合法、合规数据。第3.3条规定,源数据是数据供方未经过特定需求加工直接用于交易的数据。第3.4条规定,服务数据是以源数据为基础,经过特定需求加工,满足特定目标的数据。而对于数据本身,在第5条交易数据描述框架中规定,交易数据描述信息包括必选信息和可选信息两部分。必选信息包括:数据编号、数据名称、关键词、所属行业、数据种类、数据内容、数据价格、数据计费方式、数据规模、数据存储格式、采集时间、数据发布时间、数据溯源、数据质量、交付方式、供方权属范围、需方权属范围、更新频度和更新方式。可选信息包括:语种、数据用途、失效时间、水印标识、签名标识。
综上,《数据安全法》中的数据交易管理制度和《个人信息保护法》中的“个人信息不包括匿名化处理后的信息”等作为数据交易的关键前提和制度指引,是数据要素市场化的制度基础。《信息技术 数据交易服务平台 交易数据描述》这一推荐性标准中的相关内容从交易数据的标准化角度进行了细化,也为数据交易提供了必要的指引。在进一步构建数据交易制度时,已有的规则应进一步细化,明确标准、边界,新的制度需求则需进一步构建。
数据交易的客体,理论上和实践中的范围可能会存在差异。在概括地讨论数据交易的范围时,应考虑个人、平台或企业、国家等不同角度,除涉及隐私、个人信息以及数据安全而不得交易的数据之外,其他数据几乎都存在交易的可能。然而,由于不同数据主体作为数据贡献者的地位和作用不同,因此其是否享有参与利益分享的必要以及是否有交易数据的必要,仍需逐一考察。
个人数据理论上和实践中似无交易的必要。虽然有的主体是数据贡献者,但其参与后续数据流通链条中的利益分配似乎未必合理,其权利仍可通过侵权法等其他途径予以保护和救济。那么,个人数据可否交易呢?理论上而言,个人数据也可以交易,只不过这种交易可由私人自由安排,似无纳入数据交易规则或数据交易管理制度的必要,遵循当事人之间的意思自治即可。通常可能需要构建交易制度的领域如房地产交易、证券期货交易等往往与市场联系在一起,不与市场联系在一起的交易似乎难称为交易制度。这一点与私人间的交易在语义和制度建构上迥异。数据交易制度更旨在调整难以界定、难以衡量和定价的大规模、海量数据集合的交易与流动。
对于企业或平台而言,其可就自有数据以及基于其投入与贡献而生成的数据进行交易。但由于企业或平台本身在数据类型、技术能力等方面极具差异性因此其自有数据往往并非标准化的。即便能够交易,也可能对于其他企业而言意义未必很大。同时,这些数据往往可能构成企业的商业秘密,因此有的企业就自有数据与他人交易的意愿很低。当然,如若双方有交易意愿,法律上并不存在限制交易的制度障碍,主要是技术层面交易的可行性等问题。
对于企业或平台基于其投入与贡献而生成的数据,则属于目前数据交易的主要内容。一般认为,在市场上交易流通的数据应当是经过处理后的数据商品,即数据产品[29](P71)。对于这一类数据产品,当下交易较为普遍。比如在个人征信领域,相关机构或企业可能就个人在相关平台上的行为或活动的特征性内容(数据画像)等进行交易。当然,这类去标识化与匿名化的处理首先要符合《个人信息保护法》的规定。至于在技术意义上的隐私计算技术等能否绝对实现去标识化或匿名化,暂且不论。另外,与前一类企业或平台的自有数据相关,企业或平台也可能就这一部分数据通过算法的应用而使数据增值,形成新的数据集合,从而进行交易,此种经加工的数据一般是数据交易的主要客体。
地方立法为可供交易的数据划定了“红线”。虽然对于企业或平台的数据哪些可以进行交易还存在探讨空间,但对于哪些数据不得交易则已有一定共识,并已在相关地方立法中有所规定。比如,2021年6月通过的《深圳经济特区数据条例》第67条规定,市场主体合法处理数据形成的数据产品和服务,可以依法交易。但有下列情形之一的除外:交易的数据产品和服务包含个人数据未依法获得授权的;交易的数据产品和服务包含未经依法开放的公共数据的;法律、法规规定禁止交易的其他情形。2021年11月通过的《上海市数据条例》第55条规定,本市鼓励数据交易活动,但有有下列情形之一的不得交易:危害国家安全、公共利益,侵害个人隐私的;未经合法权利人授权同意的;法律、法规规定禁止交易的其他情形。这些规定与《个人信息保护法》的相关告知同意规则保持一致,划定了不得交易的数据的禁止性标准。
总体来看,可交易的数据类型已基本达成共识,即可交易和可分配并非是一个问题,通常所说的需获得授权而交易的个人数据实际上已经成为一种数据产品,并应限定使用目的。比如用于个人征信等情形或场景,个人为了获得相应授权或信用交易,则可能会将自己的数据主动或应授信主体、信用交易主体的要求进行披露[30](P88-89)。再比如,医疗数据等也是为了医学研究等需要而进行授权使用。但即便是获得个人授权的数据,也不宜进行较为广泛或不加限制的交易。
数据交易应遵循数据自身的特性而设定相应模式。有论者认为,从数据产品的逻辑来看,以数据共享和流通为主的交易模式主要包括数据管道模式、客户主导的数据集市模式、供应商主导的数据集市模式、数据平台市场模式、做市商市场模式五种。通常提到的数据交易所和交易中心大多属于数据平台市场模式,即平台不持有数据,只连接供需双方[31](P7)。有论者认为,数据交易应成为撮合数据交易、提供安全认证的机构,而非以商场或证券交易所为模型[28](P154-155)。在一系列交易模式之下,除交易主体之外,数据流通交易体系中还存在数据资产评估商、数据交易服务机构、技术中介、咨询中介、数据聚合商等主体[32](P32)。
中国的数据交易不仅由市场自发形成,政府也通过制度建设、政策激励等对数据交易制度加以引导。近年来国内已建立40家数据交易平台,并不断探索数据交易机构的适当方式。我国数据交易平台在不断发展的同时,也仍然面临数据产权不清、数据交易活跃度不高、新技术支撑不充分、出现平台同质化竞争苗头等问题[33]。数据确权问题,实践中也多通过数据登记等方式要求说明数据来源,这一点也符合《数据安全法》第33条规定的“从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,并留存审核、交易记录”等要求。
目前,在系统构建网络安全、数据安全以及个人信息保护制度的基础上,我国已在世界范围内率先通过自上而下与自下而上相结合的方式推动构建数据要素市场化制度,同时系统构建网络安全、数据安全以及个人信息保护制度,因为只有充分保障数据安全,数据要素市场化的发展才有意义。有论者认为,当下数据要素市场化还存在诸多问题,比如,数据要素交易流转链条长、交易法律法规不完善、数据要素治理效能较低,造成数据要素在流动、交易和配置过程面临诸多安全和滥用的风险[34](P17)。针对实然层面和制度层面可能存在的漏洞,须通过不断研发新技术赋能数据权益的保障。比如隐私计算、联邦学习等技术,通过“数据不动模型”实现“数据可用不可见、用途可控可计量”等目标,推动数据交易发展,同时避免侵害个人隐私,保障数据安全。
数据交易制度作为数据要素市场化的关键制度,既要在保障数据安全的基础上求发展,更要在发展的过程中保障数据安全,同时应聚焦于主体权利、权益分配、合同安排、法律责任等诸多基础问题。国家通过数据基础制度的构建,促进数据交易的进一步发展,这既是市场发展的需求,也是数字经济做强做优做大的基础。
在世界范围内,中国在推动数字经济发展方面走出了一条特色之路。相较于欧盟、美国,中国并未停留于对抗互联网、数据、科技发展之中存在的风险而予以治理,而是充分发挥新技术的动能,通过一系列推动市场发展与激励制度的构建,充分发挥制度势能。针对数据要素市场化面临的数据产权、数据确权、流通交易、收益分配、安全治理等系列难题一方面应按照事物的本质和客观规律加以认识,并充分确认在同一个法律关系中各方主体所共同认可的事实;另一方面,在确认事实和已有良好实践的基础上,再通过制度构建,合理分配相应利益,以实现制度公平。在面对数字经济发展问题时,通常将其置于技术的场域予以审视。当遇到制度漏洞或技术漏洞时,人们往往寄希望于通过更加先进的技术予以弥补。新的技术或许在相当程度上可以奏效,但也可能面临“效率-安全-效果”的三角困境。而正是由于要持续不断地应对这些难题与困境,才更加需要思考如何促进技术发展与制度完善。中国在本轮数字经济发展中已在相当程度上占据优势地位,国家通过系列法律政策推动数字经济发展。中国的实践与经验,可凝练为中国经验、中国样本与中国智慧,亦能更好向世界分享。