陈 华,李庆川,翟晨喆
(1.山东财经大学 金融学院,济南 250014;2.美增科技(北京)有限公司,北京 100010)
作为数字经济发展基础的数据被称为数字时代的新“石油”。根据国际数据公司(IDC)对全球数据量的测算,2020年全球数据量达到了64ZB(1ZB=2B),到了2025年,这一数字将接近180ZB,全球数据量迅速增加,数据成为全球竞争的关键性资源。数据驱动经济发展已成为各国共识。以美国、英国、欧盟等为代表的国家和地区,制定了一系列大数据战略,企图抢占先机,建立优势。例如,欧盟为了构建单一数据市场,加快数字化转型,陆续出台了《通用数据保护条例》《欧洲数据战略》《数据治理法案》等政策法规。面对各国采取的举措,我国要把握好当前数据发展的窗口期,激发数据价值,壮大数字经济,抢占大国竞争新的制高点。
在这一背景下,党的十九届四中全会将数据增列为生产要素;在2020年4月发布的《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据与土地、劳动力、资本等传统要素并列;2021年3月发布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》设专篇对我国数字化发展做出明确规划指导。习近平总书记在主持中央政治局第三十四次集体学习时强调,要充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。数据作为新的生产要素,与其他生产要素相同,已逐步渗透到实体经济的整个运行过程中,是我国重要的基础性战略资源。但我国数据要素仍面临大量问题,如数据权利界定不清晰、数据估值定价困难、数据流通渠道不畅通、数据交易效率不高、数据孤岛与数据鸿沟现象严重等,尤其是数据的估值定价与流通交易环节,其背后存在许多安全风险,有不法分子利用数据安全漏洞给数据市场造成极大危害,数据安全治理问题亟待解决。
为厘清数据界权,首先要理解数据的概念定义。国际标准化组织(ISO)对信息做出定义,信息是关于事实、事件、事物过程或思想等客体的知识,在特定语境中有特定的含义;关于数据的定义,我国数据安全法定义数据是任何以电子或者其他方式对信息的记录。由此可知,数据与信息不同,数据只是信息的体现形式;信息是指具有内容含义的知识,只有经过数据处理,才能揭示出从数据中导出的信息。德国法学者Herbert受到信息在三个层面被支配和控制的启发后,将信息区分为结构性信息、符号层面信息和语义层面信息。我国学者纪海龙在此基础上对信息与数据的关系进行研究,将信息分为存储介质层、数据文件层和信息内容层。存储介质层指物理层的数据载体;数据文件层指数据产品,即信息整合的表现形式和组织结果;信息内容层指数据信息,即数据产品蕴含的信息内容。本文所说的数据是指数据产品与数据信息。
数据产品包含的数据信息可分为个人数据与非个人数据。因此,数据信息与数据产品不同,其权利界定与流通交易也不同。数据产品的生产者拥有数据产品权利,而数据信息中的数据权属存在部分分歧。以个人隐私为准绳,个人数据可分为个人信息数据与非个人信息数据。个人信息数据是指以电子或其他方式记录的能够单独或结合其他信息识别自然人个人身份的各种信息,如姓名、住址、电话号码、身份证号码等。在大数据等技术的迅猛发展下,个人信息数据的范围也越来越广,如生物数据、基因信息等。非个人信息数据是指数据自身以及结合其他信息不能识别特定自然人身份的各种信息,如脱敏加密处理的个人信息。这两种数据权利的取得依据是不同的。
个人信息数据权利应属于个人所有。个人信息数据具有人格权属性,其涵盖的信息体现了人格尊严和自由意志,如人脸识别技术,人脸就是肖像,肖像属于人格权。我国《民法典》第111条规定“自然人的个人信息受法律保护。任何组织和个人需要获取他人个人信息的,应当依法取得并确保信息安全,不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息”,肯定了个人信息的人格权属性;《网络安全法》以及《消费者权益保护法》中,同样有多条法律规定个人信息数据归属于个人信息数据主体。而非个人信息数据权利归属在经济学界仍有争议。一部分学者认为非个人信息数据也是由个人行为产生的,且有学者研究发现将数据权利赋予个人时,有助于促进个人数据的分享与交易,因此,权利应属于个人。大多数学者研究认为数据所有权归属的最优解取决于个人对数据货币化的能力和数据对企业的价值。经济学家Tirole认为,对于用户数据权利的界定,如果企业需要创新性手段或承担较高成本收集数据,就应授予企业使用权与收益权;如果收集数据很容易且成本低廉,数据应归用户个人;若用户提供原始数据处理与企业数据处理两者之间存在界限,应赋予用户可携带权,只要用户同意就可以将原始数据转移给第三方,即相同的数据可被其他企业用于不同目的,以提高经济效益。
非个人信息数据与非个人数据都是无法识别特定个人的数据,两者权属问题可一同讨论。非个人数据指可以自由获取、使用,且不需要承担法律上不利后果的数据,如某一软件下载次数、国家机关公开的信息、具有公益性质的企事业单位涉及公众利益或知情权的信息等。从数据权利的属性上来看,非个人信息数据与非个人数据显然已不具有个人信息的人格权属性,两者仅具有财产权属性,且属于无形财产,因此其权利归属应围绕其特征来进行配置。根据科斯定理与洛克的劳动生产理论,两者的权利应归属于能够使其价值最大化的使用者和为其生产开发投入了人力、物力和财力的主体,如果不对数据开发主体赋予财产权,就会对数据的生产、开发、应用及相关技术的发展失去激励作用,使数据资源失去战略意义。这表明数据处理者只要对非个人信息数据与非个人数据的收集、核准和提供等方面有实质性投入,数据处理者就可以获得其财产权。
综上可知,多数学者认为个人信息数据权利归属于个人数据主体,非个人信息数据与非个人数据权利应归属于投资主体,这也为数据资产化奠定了理论基础。
由前文对数据权利界定的探讨可知,数据是一种可交易、可界定产权的商品。Pei基于数据属性,将数字产品与数据产品相区分。数字产品是指可以通过电子产品消费的无形商品,例如电子书、网络音乐、电子消费券等;数据产品是指关于特定对象的行为轨迹和关联信息被网络、传感器和智能设备等记录下来的数据,具有较强的分析价值,例如手机软件收集的内容。数据资产化与要素化主要是指数据产品的资产化与要素化。数据资产化是指将数据融入具体业务之中,让数据驱动业务变革、改善业务效率、实现数据价值。例如,在银行业、证券业中,利用数据对客户进行分析,制定更适合用户的投资产品;在制造业中,利用数据对成本和效益进行预测;在互联网行业中,利用数据分析用户行为,从而进行精准式商品推送与广告投放等。
中国信息通信研究院云计算与大数据研究所将数据资产定义为“由企业拥有或者控制的、能够为企业带来未来经济利益的、以物理或电子的方式记录的数据资源,如文件资料、电子数据等”。这一定义与我国对资产的定义类似,从中可以看出,并不是所有的数据都能成为资产,只有可以给企业带来价值的数据才能成为资产。而数据的质量参差不齐,垃圾数据不但不能给企业带来价值还会提高企业处理的成本,因此,要更加注重数据质量,高质量数据才能够创造价值成为资产。此外,数据资产的特征与普通资产存在一些差异。首先数据资产需要储存在存储介质(如机房、存储设备等)中,同时数据具有存在属性,即可读取性,两者构成其物理存在性,属于有形资产范畴;数据资产真正的价值是蕴含的信息,是其信息属性,属于无形资产范畴。由此可知,数据资产既包括有形资产的部分特征,也拥有无形资产的部分特征,其并不属于任何一种,应当作为一种新型资产类别予以区分。
实现数据资产化还包括两个环节:数据资产估值和数据资产定价。目前国内外学术界对两者的研究仍处于探索阶段,大多数学者认为两者应当独立分开进行。尹传儒等人认为数据资产估值和数据资产定价是不同阶段的独立行为,在一定时间周期内,数据资产价值是固定的,在一定程度上,可以把数据资产价格看成数据资产在单次交易中的价值体现。即数据资产估值是对数据资产的使用价值进行度量,与数据资产是否被交易无关。数据资产的价格是动态变化的,在数据资产交易过程中实现,数据资产价格并不等同于其价值,而是围绕其价值上下波动。
数据资产不同于传统资产,其特征与传统资产显然存在差异。数据资产的可复制性、不确定性、再生性等显著特征影响着自身的估值与定价,因此,在对数据资产进行估值与定价前,应先对其特征展开分析。
数据资产具有可复制性。这是数据资产与其他普通资产显著不同的特性,其复制和分享的边际成本几乎为零,即数据资产可以无限复制和分享,且不影响数据资产本身的价值。同时,数据资产不会因为使用而产生损耗,可以重复使用与加工处理。这是普通资产所不具有的优势,但这给数据资产交易带来新的问题。当数据资产复制分享不需要成本且对个人或企业不会造成福利损失,而分享者能够从中获利时,即使对数据资产进行界权,也难以防止数据资产二次分享,进而造成数据资产价格下降,对数据资产所有者的利益造成损失。
数据资产具有不确定性。这一不确定性是指数据资产的价值与获利能力不确定。首先,数据资产的价值受多方面因素影响,包括体量、质量、时效性、应用场景等,这些因素自身就存在一定不确定性。例如,在数据质量方面,如当数据真实性较低,数据存在偏差,或者数据造假,那么使用数据后可能会产生完全相反的决策,使数据失去价值;在数据时效性方面,如道路状况信息、股票价格等数据,只有在特定的时间内才有价值。数据价值还受应用场景的影响,如保险公司可以通过司机的驾驶行为数据掌握司机的驾驶技术程度及驾驶习惯,从而针对不同的司机制定不同的保险费率。该数据还可以帮助出租车公司招聘司机,但对于招聘场景而言,帮助保险公司提高利润所体现的价值或许更大。其次,数据资产价值随使用者的不同而具有不确定性。这是因为数据资产的经济价值只有被企业或个人使用时才会体现出来,主要用于影响企业或个人的决策、行为等。因此,对于具有不同使用目的、处理能力、已知信息的购买者来说,相同数据资产的价值有很大差异,这也体现出数据满足不同主体需求的多样性。最后,数据的可访问性会影响数据获利能力。由定义可知,若数据不被使用便不会产生经济利益,就不是资产。可访问性影响着数据的使用频率,如果不能够从数据中提取价值,不但无法获利,还会增加成本来存储和维护数据。
数据资产具有再生性。传统资源大都是消耗性的,而数据是使用越多,数量越多。新的数据资产可能产生于原有数据资产的组合、分析等,这些新生成的数据资产将带来更多价值。因此,当拥有较多数据资产时,可能产生的新数据资产也随之增加。
在考虑数据资产特征的重要影响之后,再利用估值方法与定价模型对数据资产进行估值定价。
在一定时间周期,数据资产价值是静态的,而数据资产定价是动态的,数据资产的价格围绕其价值上下波动,且会受到自身特征的较大影响。因此,数据资产定价是在数据资产估值的基础上,考虑数据资产的供求关系和数据资产可以多次交易且交易行为不会造成价值减损的特性进行的。数据资产价值评估在前,进而再根据各影响因素进行具体定价。
1.数据资产的价值评估
由于数据资产价值在于其信息属性,并不具有实物形态,因此,国内通常采用传统会计学中无形资产的估值方法对其进行分析。无形资产的估值方法分为三类:成本法、收益法与市场法。
成本法是指无形资产的价值由生产该无形资产的必要劳动时间决定,并且从资产重置角度估值,即无形资产价值等于重置成本减去资产贬值。成本法虽然计算简单、容易理解,但各类数据资产成本难以细化区分,且贬值难以估算,忽略了数据资产自身特性与买方异质性。由此可知,成本法适用于成本公开、买方差异较小的数据资产。
收益法是指无形资产的价值取决于其所带来的预期收益,其价值为对未来各期收益进行贴现的现值之和。收益法可以反映出数据资产的经济价值,但折现率难以选择,且数据资产是动态的,使用期限也难以确定,主观性较强,因此当未来收益可预测且可采用货币计量时,此方法适用。现实中大多数企业难以从数据资产中获得直接收益,但可以根据使用数据资产获得的间接收益来估计部分企业数据资产的收益。此外,与数据资产卖方相比,买方企业对数据资产的使用场景、业务融合及预期收益等方面更加明确,因此,收益法更适合数据买方企业采用。
市场法是指类比市场中相同或相似资产交易案例对资产进行估值的方法。数据资产估值采用市场法时,需要依据相同或相似数据资产的往期成交价格,并对数据资产的特性或市场条件差异等影响因素进行调整,从而估算数据资产的市场价值。能够客观反映数据资产当前的市场状况是市场法的优势,相关评估参数可以直接从市场中获得,真实性更强。但市场法需要以活跃的公开交易市场为基础,对市场环境要求严格,而我国现有大数据交易平台尚未成熟,无法提供全面的数据交易信息。目前,我国公布的(含筹建)大数据交易平台已超过80个,如京东万象、聚合数据及贵阳大数据交易所等。随着数据交易平台的不断发展探索,市场法估值也会不断完善。
从三种估值方法的优劣可以看出,市场法估值在未来更具优势,我国学者对其也展开了深入研究。刘琦等人考虑到技术水平、价值密度、数据容量等差异因素,对各差异因素进行量化以修正模型,进而评估同一类型数据资产价值,构建出运用市场法评估大数据资产的基本框架。李永红和张淑雯重新构建了数据资产价值评估模型,结合层次分析法和灰色关联分析法两种方法,将数据资产价值影响因素嵌入评估模型中,进而修正了市场法。左文进和刘丽君借鉴经典资产估价方法,创新性地引入Shapley值法和破产分配法则,设计了数据资产分解估价方法;在最近的研究中,左文进和刘丽君引入多维偏好线性规划分析模型融合用户分项评价信息和专家总体偏好信息对数据资产进行综合评分,再结合可比大数据资产的价格确定待估大数据资产的价格,这是一种基于用户感知价值的数据资产估价方法,但其本质上仍属于市场法。随着数据交易中心的发展以及研究的推进,市场法估值运用将更加成熟。
除此之外,数据资产的估值定价运行机制也十分重要,这也是当前亟须完善的基础性制度体系。陆岷峰和欧阳文杰提出构建数据资产的一二级市场,由数据交易中心统一管理;一级市场主要用于数据资产估值,二级市场主要用于数据资产定价,这为我国数据资产估值定价提供了基础。我国应继续重点推进估值定价基础性制度建设,可以设立相应的研究试验中心,对估值定价机制进行研究,为数据资产估值定价提供制度保障。
2.数据资产定价
在数据资产定价策略方面,综合中国信息通信研究院、蔡莉等人、尹传儒等人对数据资产定价策略的研究,本文将定价策略分为8种并进行分类描述(见表1)。
表1 数据资产定价策略
在数据资产定价模型方面,国内外学者从多个角度对数据资产定价模型展开研究,提出了多种不同的定价模型,目前主要分为5大类,分别是基于博弈论的定价模型、基于信息熵的定价模型、基于数据特征的定价模型、基于查询的定价模型以及基于元组的定价模型(见表2)。
综上,在对数据资产内容进行定价时,为了保护数据内容,防止内容泄漏造成数据价值降低,卖方可利用上述各种资产估值方法对随机抽样部分的内容进行价值评估,进而对整体数据资产内容进行定价。
数字资产的估值定价为数字资产的流通、交易提供了前提条件。由数据资产特征可知,其作为一种特殊资产,在使用和流通中可以产生新的价值。因此,在数字经济时代,数据资产流动将成为常态。
1.数据资产的流通
数据资产流通可以结合不同领域的数据资产,进而产生新的有价值的数据信息,这些新数据可以被企业生产经营所使用,从而帮助企业获取更多利益。数据资产流通方式包括数据资产开放、共享等形式。
数据资产开放主要是指政府机构开放数据服务于企业生产经营以及为个人提供便利,进而产生相应的社会和经济效益。如济南市大数据平台,通过接入市不动产登记中心,与水、电、气等服务企业实现连接,在办理不动产过户业务的同时,实现水、电、气业务一并办理,为市民提供了便利。数据资产共享主要存在于合作企业之间,数据的流动受企业间合同契约约束。如某旅行公司在取得用户授权时,以支付宝的芝麻信用作为信用标准,为用户提供便利。
这两种流通方式是数据资产流通的主力军,其打破政府间、行业间、企业间的数据资产壁垒,从而成为激发数据资产流通活力的重要着力点。例如在工业领域,优势产业中的上下游企业可以开放数据,建立数据共享机制,从而最大化利用工业数据价值,实现互利共赢。各政府部门之间应着力破除“信息孤岛”问题,可以通过打造数据共享开放平台,实现数据的互联互通。
表2 数据资产定价模型
2.数据资产的交易
数据资产交易与前两种流通方式有些不同,它是数据流通中的生力军,帮助引导数据资产的合理分配。数据资产交易是指买卖双方按照共同遵守的定价机制和交易规则签订交易合同,对数据资产交易合同中的条款和价格达成共识后进行交易。我国数据资产交易主要采用B2B模式,数据买卖双方通过第三方数据交易平台促成数据交易。
各地数据交易平台在不断的交易实践中,按照数据处理程度,形成了两种主要的交易模式。一种是数据撮合交易模式。在此交易模式下,数据交易平台仅对数据进行简单的收集整合,并不会对数据进行预处理或挖掘分析,整理完毕便将数据售出。因此,交易平台主要提供未经加工的原始数据,如用户的性别、年龄等。该模式一般应用于数据交易平台成立初期,也是一些金融数据销售企业(如CSMAR、Wind)等主要采用的交易方式。此外,当数据买方异质性较大且数据负外部性较小,无法满足买方对数据的处理要求时,也可以考虑撮合交易方式。另一种是数据增值服务模式。数据交易平台通过对数据的整合、清洗、分析等形成定制化的数据资产组合,然后提供给数据买方。许多数据交易平台成立后,经过多次的交易探索,最终选择这一交易模式。
除此之外,随着区块链技术的发展,其优势逐渐显现出来,例如区块链公钥与私钥的双认证技术,可以用来验证数据交易双方身份,确认交易是否履行;区块链与智能合约的结合,既可以帮助解决法律缺失而存在的数据确权问题,还可以解决数据资产交易的“信息悖论”问题等。区块链技术应用于数据资产交易得到国内众多学者的广泛讨论。刘绪光等人认为证券交易所或其他交易机构的交易模式难以被数据交易平台所采用,这是因为数据资产具有可复制性。因此,他们提出了一种以区块链技术为基础的标准化数据产品合约交易模式和交互定制式产品交易模式。李源等人提出了一个基于联盟链的大数据交易平台的方案,可以有效保护个人隐私、帮助数据定价、避免“数据孤岛”等问题。在区块链技术的不断成熟下,未来数据资产交易模式应重点基于区块链技术。
虽然数据资产的估值定价以及流通交易已经有了诸多可行的模式方法,我国北京国际大数据交易所、上海数据交易所也相继成立,但整体而言,我国在数据定价、交易模式等方面仍处于探索阶段。以全国首家大数据交易所——贵阳大数据交易所为例,其成立之初一年交易金额突破7 000万元,如今却几乎陷入停滞状态,这表明数据交易仍存在许多问题阻碍其发展。因此,厘清这些问题有利于我们更好把握数据资产定价交易的未来发展方向。
1.数据资产形成各环节价值难以计量
数据资产价值形成过程是数据生产的过程,而数据产生价值链条长且过程复杂,包括数据采集、数据整合、数据分析,以及应用场景和买方异质性等多个环节,每个环节都需要进行价值计量,给数据资产估值定价带来困难。比如数据应用场景差异所对应的数据价值存在差异,对于前文提及的司机驾驶习惯数据,用于招聘司机的出租车公司出价低于用于保费计算的保险公司,因为数据集后续可能产生的价值量不同,所以使得数据价格难以确定;不同买方使用数据创造的价值差异巨大,相同数据用于相同的场景,由于各买方公司技术水平存在不同,有些公司可以与本身积累的数据相结合,从而增加采购数据生成的价值,因此,不同买方也会带来价格差异。
2.数据资产自身特性导致估值定价困难
数据资产具有虚拟性,与劳动力、资本等传统实物生产要素相比,数据要素表现为虚拟形态,这使得数据资产价值难以从生产结果中分离出来,难以进行量化。数据资产的可复制性造成“搭便车”现象难以避免,数据在进行多次交易后,会创造大量供给,导致数据价格快速下降。数据资产的时效性也是估值定价困难的重要原因之一,随着时间的推移,有的数据资产价值可能随之增大,而有的数据资产如果不能在适当的时间被分析使用,其价值会随时间慢慢减小,甚至失去价值。此外,由于数据资产无法形成稳定的价格区间,所以会制约数据资产的规模化交易。
1.隐私数据界定模糊制约数据流通交易发展
以欧盟和美国为例,欧盟注重数据保护,特别对个人隐私权的保护,而敏感数据往往具有更旺盛的市场需求和较高的市场价格,这在一定程度上降低了数据产业发展活力;美国则更加注重数据流通,积极推行数据交易市场化,但难以保障个人权利。我国《数据安全法》虽已出台,但确权规则仍不清晰,确权缺位、越位、错位等问题仍比较突出,这也造成数据流通时可能产生冲突。因此,数据提供者出于对数据安全的考虑,在提供数据时采取数据不出域的方式,从而制约数据流通交易。
2.数据开放共享水平与企业数据资产化程度较低
在数据开放共享方面,我国目前处于较低水平,政府开放数据质量不高,企业之间缺乏共享共用动力。虽然政府一直在大力推动政府数据开放共享,但由于开放共享规则不成熟、共享机制不完善、共享主管部门缺失等,以及数据规模较小、数据利用率低、数据质量差等问题,政府数据开放共享效果并不理想。企业缺乏开放共享理念,为了保持自己的竞争优势,相互之间开放共享程度低,再加上法律法规、技术标准等的不完善,大多数企业主要使用内部产生的数据,彼此之间形成坚固的行业壁垒同时,由于数据的专用性和行业性,数据孤岛和数据垄断现象难以破除。此外,还有许多企业数据资产化程度低,对数据不够重视,“不想用”;缺乏相关的人才和数据分析的方法,“不会用”;面对数据应用的较大投入,缺乏正确认识,“不敢用”;等等。这使得作为数据流通主力军的开放共享并没有成为主流形态,限制了数据开放共享规模的扩大。
3.数据交易市场不健全,交易流程不完善
在数据交易方面,数据要素市场建设不健全,规则不完善,交易规模小、效率低。我国有过半数据交易平台的年数据交易量不足50笔,大多数交易平台处于半停运状态,场外交易混乱。这是因为缺乏统一的交易撮合定价体系,企业之间采取点对点交易,还有部分企业为了实现对用户的精准画像,提高竞争力,在交易平台外购买大量个人数据进行加工,使得场外交易泛滥,个人隐私数据泄露,扰乱数据交易市场。同时,由于全国并没有统一的数据交易市场,难以建立完善的交易信任机制,缺乏交易各方可信度的评价体系,难以保证平台交易的数据质量,所以经常发生假数据交易事件。此外,在数据交易完成后,若没有强有力的监管机构,数据用途则难以控制,从而产生诸多后续问题。
我国互联网企业收集的用户信息大多为企业拥有。企业向消费者提供免费或低价的高质量、个性化服务来获取个人数据,大量累积的个人数据驱动软件算法不断优化,持续优化的软件算法不断挖掘个人数据潜在价值,两者之间相互促进,成为互联网公司的核心竞争力。部分企业为了提升自己的竞争力,追求利益最大化,滥用其所收集的个人数据,侵犯用户隐私,危害数据安全。此外,尽管进行交易的数据都会进行脱敏化处理,但数据在进行关联分析和深度挖掘时,难以保证数据应用的合规性,数据权益被侵害时无法找到侵权者。当前,少数互联网企业占据了主导地位及大部分市场份额,他们利用数据集中形成数据优势,这种优势使得企业具有垄断或不公平、不合理的竞争优势。具有独特数据资源的企业可能滥用市场支配地位,拒绝数据开放共享,实行价格歧视、算法合谋等垄断行为,损害消费者权益,打压竞争对手。如2017年,菜鸟网络科技有限公司与顺丰速运快递公司发生的“丰鸟大战”,表面是丰巢快递柜数据信息共享问题,实际是争夺快递物流数据信息的控制权和话语权。此外,企业为了维持自身地位,可能会采取不正当手段来获取数据,从而使用户行为数据集中到少数企业手中。
由于数据资产蕴含巨大价值且采用集中储存管理模式,很容易受到网络攻击和窃取,导致数据泄露事件频发,危害日趋严重。尤其政府数据平台将社保、医疗、工商等数据进行整合,具有极高的社会和经济价值,这些数据一旦泄露,对个人可能带来财产损失,对企业可能造成商业机密外泄。IBM Security机构近期发布了《2021年数据泄露成本报告》,该报告基于17个区域发生的537个真实数据泄露案例显示,平均每起数据泄露事件成本高达424万美元,客户个人数据(如姓名、电子邮件、密码)是数据泄露中最常见的信息类型,近一半的泄露事件包括此类数据,个人隐私遭到严重泄露。
大数据技术发展的同时,也催生出许多新型的网络攻击手段,使得安全防护系统暴露出严重不足,让不法分子有机可乘,网络威胁、勒索等事件频发。例如,由于大数据储存数据量非常巨大,所以一般采用分布式系统将数据和操作分布于多个系统,便于数据处理分析;但这也产生了安全隐患,黑客攻破其中一个系统便可以渗透整个网络,从而窃取数据。在数据传输过程中,可能遭到数据流攻击,使数据传输出现失真情况,同时还存在泄露风险;在数据处理过程中,由于数据传输具有多源、异构、关联等特点,且数据集类型多、来源广,企业在进行数据分析时,会将其关联起来进行分析挖掘,这会复原脱敏化数据,从而造成个人信息泄露。大数据平台在安全机制方面仍采用传统网络安全防护手段,无法监测更加隐蔽的攻击方式,一旦出现漏洞,波及范围将十分广泛。据知名网络安全公司SonicWALL的一份报告显示,2021年上半年勒索软件攻击次数高达3亿多次,已超过2020年全年勒索软件攻击事件数量的总和。
数据伦理问题一直被学术界广泛讨论,其中最主要也是讨论最多的三个方面是:个人隐私、数据安全、数字鸿沟。个人隐私问题及数据安全问题在前文已深入分析,此处重点对数字鸿沟问题进行分析。数字鸿沟本质上是一种“技术鸿沟”,是一个公正的问题。不同群体、企业及国家之间对数据技术的开发、使用程度存在差距,从而形成“强者愈强、弱者愈弱”的马太效应。数字鸿沟问题随着新一代技术的发展不但没有被解决,反而愈加凸显。不管是个人、企业还是国家,数字鸿沟带来的负面影响在不断扩大。例如在个人层面,与年轻人相比,老年人学习能力差,且受传统观念影响难以使用手机打车、网络外卖、移动支付等数字技术应用;在企业层面,数字化转型领先企业与滞后企业差距不断扩大;在国家层面,发达国家利用先行优势已占据数字经济制高点,而部分发展中国家却因此被边缘化。
由前文对数据资产目前存在的问题分析可知,我国数据治理已迫在眉睫。当前,数据已被视为一种新型生产要素,数据要素市场要“统筹好发展与安全”。在未来,它将从助力经济发展变为引领经济发展,因此,要使“有为政府”与“有效市场”有机结合,处理好两者的关系,多方面协同发力,促进实现数据要素共建、共享、共治,提高数据治理能力,实现治理能力现代化。针对数据资产发展的现状和面临的问题,提出以下几点协同治理建议:
数据界权是数据发展的前提,数据权属不清不但会造成数据滥用和侵权,还会限制数据流通交易发展。数据权属的确定可以明确数据交易各方的责任与权利,使数据交易各方自觉规范自己的行为,从而化解数据产权纠纷,保护各自的权益,形成良好的交易秩序。虽然数据权属界定存在许多难题,但面对数据产业的飞速进步,不可任其发展,因此,可以建立全国统一的数据确权体系,对数据进行分级分类权属界定,明确数据权利类型与主体。在数据界权法律建设方面,应当随着数据产业的不断发展逐步修订法律法规。因此,我们要密切关注国外有关数据立法,结合我国数据发展中遇到的问题,对数据确权相关法律法规进行研究,积极推动数据界权法律法规建设。
数据作为一种新时代的价值资源,其资产属性得到越来越多人的关注。数据资产化可以促进企业数字化转型,提升企业核心竞争力。在全球市值排名前十的公司中,有7家是数据技术公司,这些高科技公司能够充分利用大数据技术,挖掘数据背后的价值,为公司创造丰厚的收益。如美国的科技公司谷歌的市场估值高达1.85万亿美元,而拥有数百架飞机等大量资产的美国航空公司的市值仅有119.78亿美元。因此,我们应全面深化融合数据应用,积极推动数据资产化。在数据供给端,培养数据技术人才,建立数据应用服务体系,降低企业数据应用的成本,提高为中小企业进行数据服务的能力,解决企业不会用、不敢用问题;在数据需求端,可以培育数据驱动的新业态,举行大数据应用成果展示、大数据竞赛等活动,让更多企业深入了解数据价值,引导企业将数据应用到各流程中,解决企业不想用、不敢用问题。此外,估值定价困难也是困扰数据资产化的主要原因之一。对此应明确数据估值定价方法,建立评估数据资产价值和价格的统一标准,形成准确高效的估值定价机制,促进数据资产化进程,为数据资产交易提供依据。
实现数据价值最大化,需要数据在不同主体间开放共享。作为数据流通的主力军,数据开放共享不顺畅,不利于数据市场的形成与发展。因此,应继续着力推动数据开放共享。在政府方面,一是推动数据开放共享相关条例法规的建设,如制定全国性的《政府数据开放共享条例》等;二是继续积极推进政府数据开放共享,构建统一的政府数据开放共享标准体系,探索完善政企数据共享机制。在企业层面,一是健全企事业单位共享制度,建立统一的数据开放共享管理规则和技术标准,同时为信息化水平较低的中小企业提供数据技术服务;二是打通政企之间、企业之间的数据接口,推进企事业单位之间数据开放共享利益分配制度建设,通过市场化引导企业各方在互信互助、合作共赢的基础上进行数据开放共享。
数据交易市场可以通过以下三个方面来激活。一是数据交易主体培育方面,充分发挥数据交易平台的中介作用,积极培育一批金融、电信、互联网等数据密集型行业企业成为合格市场主体,同时,简化规范数据市场准入程序。二是数据交易标准方面,研究制定交易规则标准,规范数据资产交易流程,明确数据交易主体的权利和义务,保障数据使用安全;明确数据处理、转移、保存等规则,对数据应用进行标准化分级分类,加强数据标准研发,保障数据质量。三是数据交易模式方面,成立一批专业化的数据交易平台,探索效率高、安全性强的数据交易模式,如结合区块链等新一代技术的交易模式;建立面向场景应用的数据交易模式,通过数据场景化的应用展示,让企业更加了解数据,让交易更加高效。
第一,明确数据监管主体职责,厘清各数据交易参与主体的权利义务,强化数据反垄断执法。数据作为新兴产业同互联网行业相似,随着数据要素市场化的发展,企业之间不断积累数据,逐渐形成马太效应,进而涌现一批数据垄断企业。这些数据“巨无霸”往往会采用“二选一”“大数据杀熟”等手段,侵害消费者权益。因此,要加大数据要素反垄断力度,明确数据监管部门职责范围,建立数据流通监测和数据交易举报维权机制,加强数据市场监管,严厉打击数据欺诈、数据垄断以及非法交易等行为,实现事前、事后、事中全方位监管,维持数据市场秩序,确保市场良性健康发展。第二,在监管大数据交易平台的同时,可以通过让大数据交易平台承担部分监管职责,从而形成“政府-平台”双重监管体系。大数据交易平台作为数据交易的中介,可以在市场准入、数据审查、交易规则等环节进行监管,有效弥补政府监管效率低、成本高等问题。政府监管可以有效防止数据垄断、恶意竞争等行为,调控监管整个数据交易市场。因此,要处理好政府与平台之间的关系,使自律监管与行政监管两者之间相辅相成。第三,完善数据跨境流动监管机制,积极与全球各国展开谈判合作,探索构建公开、透明、严格的监管体系,参与国际数据流动市场相关规则制定,提升我国在数据领域全球治理中的话语权。
面对数据安全问题,要站在总体安全观的高度,由政府、行业及企业协同治理,构建数据安全防控体系。政府层面,首先要强化法律法规在数据安全方面的支撑保障作用,除了出台《数据安全法》外,还需要民事与商事等法律的配套推进,如完善《民法典》中与数字交易相关的内容,《反垄断法》中关于数据垄断问题治理的内容等。其次要加强数据安全技术建设,推动产学研用相结合,积极研发数据防泄露、数据匿名化、数据交易安全等技术,对数据安全关键环节进行技术研究,完善大数据安全技术体系,解决数据安全技术漏洞。最后要建立覆盖数据采集、处理、流通等所有环节的安全防护体系,引入用户身份认证、数据脱敏、数据安全审计等隐私保护机制,建立风险预警防控机制,形成统一高效、协同联动的数据安全管理体系,从机制上解决安全问题。行业层面,一是要加强行业自律,保障各方数据权益,禁止通过非法手段获取他人享有合法权益的数据,不使用非法获取及来源不明的数据,组织协调企业之间的数据交易与互联互通,营造公平良好的行业环境。二是要积极推动并参加企业与科研机构的产学研合作,引导安全技术创新,不断完善数据安全标准。企业层面,一方面要严格遵守行业自律,主动承担社会责任,在利用大数据取得市场支配地位的同时,要保护好消费者个人隐私,不违规滥用收集数据。另一方面要积极研究数据安全技术,加强与政府、科研机构等之间的合作,增强数据安全产业整体实力。
一是利用数据技术带动数字化场景应用研发,针对老年人、残障人士等弱势群体,收集数据信息,融合数据技术,打造适老化、关怀式数字应用场景,促进其生活品质提升,让数据技术有“温度”、惠及全体百姓。二是利用数据技术助推企业数字化转型,对于转型滞后企业,应主动学习数字化转型领先企业的成功经验,吸收先进数据技术应用经验,挖掘企业数据资产价值,激活企业数字化经营动能,缩小企业之间的差距。三是利用数据技术赋能数字中国,运用大数据技术推动创新发展,将数据技术应用到政务服务、智慧城市等领域。同时,抓住“一带一路”发展机遇,加强与世界各国合作,大力发展数字经济,将我国数字化成果、数字经济理念输出海外,为世界数字化发展提供中国智慧和中国经验。