杜小勇
专家视角
对数据要素的几点认识
杜小勇
中国人民大学信息学院,北京 100872,E-mail: duyong@ruc.edu.cn
2023年3月10日,十四届全国人大一次会议表决批准了《国务院机构改革方案》(以下简称《改革方案》),其中组建国家数据局令人瞩目,也是这次机构职责优化调整的重点领域之一。新组建的国家数据局将负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。根据这个方案,中央网络安全与信息化委员会办公室承担的研究拟订数字中国方案、协调推动公共服务和社会治理信息化、协调促进智慧城市建设、协调国家重要信息资源开发利用与共享、推动信息资源跨行业跨部门互联互通等职责,国家发展和改革委员会承担的统筹推进数字经济发展、组织实施国家大数据战略、推进数据要素基础制度建设、推进数字基础设施布局建设等职责划入国家数据局。
组建国家数据局是为了更好地发挥数据要素的基础资源作用和创新引擎作用而整合优化中央层面相关职能的必然路径,有其背后的理论逻辑和现实考量。以下从三个方面进行分析。
2010年前后,大数据作为一类技术出现在Gartner曲线上。2012年被认为是我国大数据的元年,中国计算机学会等学术组织都在这一年成立了大数据专家委员会。在过去的十多年中,对大数据价值的认识,经历了三个阶段。
第一个阶段,大数据是作为科学研究的新范式被公众所接受的。2009年,微软研究院为了纪念伟大的计算机科学家、图灵奖获得者、也曾是微软研究院的首席科学家吉姆·格雷博士出版了《第四科学范式:数据密集型科学发现》,将大数据作为继科学观察、逻辑推理、计算机模拟之后的第四种科学研究范式。书中介绍了用大数据重新定义科学学科,包括天文学、环境科学、生命科学等等。按照这种科学范式,研究起始于数据的收集,通过开发数据工具实现对数据的分析,获得科学的洞察。这种研究范式尽管不能替代传统的科学研究范式,但是突破了个体研究者的能力局限,在许多科学领域取得了瞩目的成果。大数据的价值被广泛认知。
第二个阶段,大数据是作为赋能工具对传统的工业和商业、以及政府管理和社会生活等各个方面产生影响,带来巨大的变革。大数据犹如血液流淌在信息系统中,促进了社会经济系统效率的提高。2015年9月5日,国务院发布《国务院关于印发促进大数据发展行动纲要的通知》,2017年12月习近平总书记在十九届中央政治局第二次集体学习时,就实施国家大数据战略进行了布局。大数据正式成为国家战略,在国家层面开始大力推动政府部门数据共享,稳步推动公共数据资源开放,统筹规划大数据基础设施建设。在政府领域,以解决民生堵点问题为抓手的各种惠民项目(如“最多跑一次”)的推出与实施,有效地推动了公共数据的共享。“数字化转型”成为这个阶段的最显著的特征。
第三阶段,大数据是作为生产要素参与经济活动和价值分配。这是一次重大的理论创新,体现了党和政府对数据价值认识的进一步深化。2020年3月30日,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次把数据作为生产要素写入中央文件,数据作为一种新型生产要素,正在加速融入我国经济价值创造体系,重塑经济运行的生产、流通、分配、消费等各环节。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中提出要打造数字经济新优势,迎接数字时代,激活数据要素潜能。以数字化转型整体驱动生产方式、生活方式和治理方式变革。2023年先后发布的数字中国顶层设计和数据要素基础制度(简称“数据二十条”)更是将数据要素推到了一个新高度。
由此可见,大数据从科学研究的新范式,到数字化转型赋能各行各业,再到数据作为生产要素,体现了我们对数据价值认识的不断深化。当然,并不是说大数据作为科学研究范式已经过时了,更不是说数字化转型已经完成了,而是说人们对数据的认识越来越深入了。在这样的背景下,成立国家数据局是很自然的选择。
释放数据价值关键在培育数据要素市场,而数据要素市场的繁荣需要一个可持续的、健康发展的数商生态来支撑。笔者曾从数据价值链的视角,厘清了数据价值释放需要具备的基本活动和辅助活动,构建了数商生态的主体模型和职能。数据价值创造的基本活动主要包括数据资源化生产、数据服务化开发、以及数据价值化利用,这三者之间并不一定是线性或单向的关系,例如,在数据服务化开发的过程中,可能会发现缺少一些必要的数据资源,从而触发新的数据资源化生产的活动,在数据价值化利用过程中可能发现新的数据服务需求,从而催生新的数据服务化开发活动,等等。数据价值创造的辅助活动是围绕上述基本活动而展开的,虽然这些辅助活动不是直接以创造数据价值为目的,但是能够降低价值创造过程的成本与风险。辅助活动至少可以包括技术赋能、风险管控和价值分配三个方面。例如,在数据服务开发过程中,风险几乎是必要存在的。特别是级联风险更具有破坏性。因此,级联风险的隔离就显得非常重要。我们需要有一些中介机构,对数据服务开发进行风险评估,帮助识别潜在的风险,并为风险兜底,这样可以降低数据服务开发商的风险成本,提高整个价值链应对风险的弹性。
释放数据价值还需要处理好与数据安全的关系。一般认为释放数据价值必然带来数据安全问题,我们的研究表明这两者是数据要素对立统一的两个方面。一方面,数据的使用会带来数据安全的隐患,无视数据安全底线会带来系统性风险,但过度的数据保护会伤害数据价值的释放。这体现为日益严峻的数据危机。另一方面,良好的数据保护会促进数据价值的释放,而数据的充分使用,也有利于数据的安全保护。这体现为数据价值的可持续发挥和整体社会效益的最大化。
数据作为一种新型生产要素,对于我们都是一个新生事物,对其本质和规律的认识还远远不够,我们需要在实践中探索其本质规律。政府要创新体制、明确安全底线,积极引导数据要素市场以有效应对数据危机,同时又要定好位,为实践和探索留足空间。企业要充分发挥企业家的创新精神,勇于探索。要把握机会、创造数据价值,更要正视数据危机日益严峻的现实,牢记社会责任感,树立牢靠的企业责任意识和自律意识,从生态共创的视角,压实数据治理的责任,积极参与治理规范的塑造,遵纪守法不违规。此外,还要引导各种社会力量来参与数据要素的治理,共同营造发挥数据要素价值的健康生态。
无疑,成立国家数据局,可以促进数据价值的释放,统筹发展与安全的关系,减少内部消耗,有利于数字经济健康有序发展。
2022年12月19日,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(俗称“数据二十条”),提出了构建包括数据产权、流通交易、收益分配和要素治理等四大方面数据基础制度。这为大数据的价值释放开辟了新的空间。但是,我们必须对构建数据基础制度的困难性有充分的认识,这方面的工作才刚刚开始,存在诸多难题和挑战。
首先是数据资源分类体系。类比于自然资源(例如土地),需要构建资源目录,对资源做到心中有数。但是,对于数据资源如何构建资源目录?目前文献和实践中一般分为个人数据、企业数据和公共数据,这样的分类还不能满足实践的需要。例如,有些平台企业,事实上承担了一定的公共事务,这部分公共事务所涉及的数据显然具有公共数据的属性。再比如,企业数据中也有大量的个人数据。数据资源分类是数据要素化过程中必须解决的一个难题。
其次是技术支撑体系。数据有关制度需要有合适的技术支撑才能落地,比如如何标识数据,如何为数据定价,如何确保数据拥有方的利益等等,如果没有合适技术的支撑,有些关于数据的制度就是一纸空文。所以,我们在推动数据基础制度制定的过程中,所提出的概念、要求等应充分考虑技术的可行性。
第三是数据治理体系。数据要素不能像一些自然资源一样,完全由政府管理,而是要引进多方治理的概念,开展数据治理。梅宏院士主编的《数据治理之论》提出了数据治理的一个三维框架,即从治理主体看,包括国家、行业和组织三个层次;从治理的内容看,包括资产地位的确立、管理体制机制、开放与共享、以及安全与隐私保护四个维度;从治理工具看,包括支撑技术、制度法规、标准规范和应用实践等四个方面。围绕这个框架存在大量的科学问题还没有答案,还有大量的研究工作需要展开。
第四是数据要素化体系。从数据资源化到数据资产化到数据资本化,是释放数据价值的三个阶段。每一个阶段都有很多的基础性课题需要研究和突破。在数据资源化阶段,要解决数据的标识问题、连接问题、以及互操作问题,还要解决数据的质量问题等。只有具有一定的条件下数据才能成为资源,才具有价值,并不是所有的原始数据都是具有价值的。在数据资产化阶段,包括了产品化和商品化,要对数据产品进行标准化的描述,要研究其定价的机制和利益分配的机制等。在数据资本化阶段,包括了数据证券化以及相关的一系列问题。目前在全国各地出现了一批数据交易所,这些数据交易所就是数据资本化的一个重要设施。
这些问题都需要我们从理论和实践两个维度上去探索和解决。我国的新型举国体制,要求有这样一个国家局来做顶层设计,一体化推动。
Preliminary Exploration of Data Factors
10.19788/j.issn.2096-6369.230104
杜小勇
中国人民大学校长助理/教授
教育部数据工程与知识工程重点实验室主任