孙震, 白云鹤, 王潮
(1.北京大学,大数据分析与应用技术国家工程实验室,北京 100871;2.中国工业互联网研究院,北京 100020;3.上海大学,特种光纤与光接入网重点实验室,上海 200444)
随着信息技术在人类生产、生活的深度应用,数据的生产、汇聚、应用逐步扩大、深化,数据价值受到社会各界的广泛认可和重视。国内外涌现出一批大数据交易平台,在数据确权、定价、数据交易等方面开展了应用。数据定价是数据交易的核心问题,是形成数据价值从产生、倍增到赋能良性循环机制的中枢。
目前对大数据交易平台中数据定价的研究,主要集中在3个方向:不断优化数学模型,对微观细节进行优化;对交易机制的讨论;综合性论述。
基于数据模型的数据定价基本上从经济学或数学角度出发,对数据模型的因素、基本原理进行探讨,如何玉长[1]认为数据定价的主要因素包括:生产成本、产品质量、应用效益和风险水平,其中生产成本将作为数据价格的下限。数据历史特征越丰富、数据质量越高,数据价值越高,可以利用效用函数、数据熵等方式构建数据定价模型,如STAHL等[2]基于逆向定价(Name Your Own Price)原则提出一种数据产品的定价模型,该模型充分考虑数据质量、购买方偏好、购买方报价、供应方要价等因素,由购买方先行提出数据偏好和报价,进而调整数据维度和数据质量,为购买方提供定制化的产品和价格;WU等[3]讨论了企业在购买大数据产品时的两种定价方式,即订阅定价和根据使用量定价,企业使用数据产品时可以先选择根据使用量定价,之后根据其财务状况和使用效率进行调整,同时强调,更新频率更高的大数据产品能够为企业带来更多的价值。
张玉卓[4]认为平台能够将网络外部性内部化、价格杠杆内部化,需要充分考虑平台双边的非中性价格问题。陆岷峰等[5]认为,应当设计和构建数据资产一、二级市场和数据资产交易所,并指出数据估值与数据定价应区分看待,先由以银行为代表的金融机构对数据进行估值,再在交易市场上达成供需平衡状态下的市场出清价格。郑苏瑶等[6]从数据资产证券化角度出发,将数据的定价流程划分为根据已有交易记录数据定价、基础模型定价、证券化和期权定价,并分别讨论了不同阶段的定价方法,认为未来数据资产证券化将成为定价的主流方式。
主要对市场上现存的定价策略和定价模型进行综合讨论,指明现存的问题和进一步完善方向。如:蔡莉等[7]综述了现有数据定价策略和定价模型的机制、优缺点及运用场景,并认为未来要进一步寻找有效的数据价值度量技术,以采用数据质量、信息熵和元组来源等作为核心定价要素。刘枬等[8]认为数据定价应以成本导向的定价为价格下限,顾客导向的定价为上限,以市场导向的定价为参照,以利润和消费者福利最大化为目标。彭慧波等[9]认为应以隐私度量作为核心价值参考,并综合评估其他价值影响因素,构建普适的、可解释的数据定价模型。尹传儒等[10]讨论了数据资产价值和价格、数据资产价值评估和数据资产定价之间的内在联系和区别,认为收益法、成本法局限性较大,而基于深度学习、信息熵的方法难以落地。
目前,国内大数据交易平台中可交易标的偏少、交易频率偏低,成交量长期处于较低水平,数据资产的价值体现远低于预期。2015年4月,贵阳大数据交易所总裁王叁寿表示,预计未来3~5年日交易量达到100多亿元[11]。但自2015年5月正式上线至2019年7月,该交易所累计交易额仅4亿多元,此后交易量未见公开披露。交易量的缺乏导致了数据资产市场实践不足,数据资产的价值未充分挖掘。
国内关于数据质量的权威标准是2019年实施的《信息技术——数据质量评价指标》(GB/T 36344—2018)[12],对数据的规范性、完整性、准确性、一致性、时效性、可访问性提出了要求,为数据质量评价提供了重要参考,但因为数据来源、数据格式、数据采集工具、数据应用场景等存在复杂性,在细分领域还需要更加细节的标准进行指引。在数据质量缺乏评估的情况下,市场上易出现劣币驱逐良币现象,从而影响数据交易市场的发展。
根据LIEW[13]讨论的DIKIW理论,数据是被记录的符号和信号,随后将被加工处理为信息、知识、智能、智慧,由符号和信号读数逐步扩展为对其处理、内部化、重组、增加合理判断和适当执行,其内涵、应用范围也逐步扩大。目前的大数据交易平台中,除了对数据质量的分级分类缺乏细化外,还有对数据价值的内涵未清晰定义,原始数据、过程数据、结果数据未有成熟的分级分类交易体系。
数据资产价值的发现、价格的形成可参考传统金融资产的定价理论和运行机制,对数据定价机制进行完善。数据资产价格的形成不仅需要一些算法、模型,还需要完善数据管理、法律、交易机制、应用场景等。
数据资产是表象,需要系统的数据管理作为支撑,要从全生命周期考虑利益相关方的数据需求,获取、存储、保护数据的完整性,确保数据和信息的质量。如韩华锋等[14]针对电力交易大数据专门设计了存储与分析系统的硬件和软件,有效提升了数据的完整性,提高了系统的容错率和稳定性。重点要做好元数据管理,主导方应当首先制定元数据的战略,充分理解元数据需求,明确更新频次、历史信息、质量要求、安全要求等,其次打造元数据管理系统,实现元数据的有效创建、维护、查询、报告与分析。同时,需要发展数据质量评估机构,对数据质量进行专业性评价[15]。
数据的价值发现需要在现实的场景中。目前,数据的产生更多来自于企业,主要场景为满足企业自身生产经营、政府监管等相关方的要求,不同的相关方对数据的质量、维度都有不同要求。在交易数据之前,需要提前考虑数据交易相关方的利益诉求。数据资产定价相较于其他资产具有其特殊性,如复制成本几乎为0,在数据交易过程中交易的标的物不同(如数据的所有权/使用权/收益权等),交易形式不同(API/数据集/数据结果等),根据不同的交易标的和交易形式,对应的交易成本和实现价值也各不相同,需要在具体场景中实现价值发现。
全球证券市场已经建立起较为完备的基础设备,如法律法规、交易规则、物理场所、协调机制等,同时具有相当庞大的专业人才。在实际交易场景中,金融资产的价值评估与定价,算法、模型的结果仅仅作为参考。未来,数据价值实现的核心不在于模型,而在于专业的人才、在细分交易场景和环节中的专业机构,对数据资产进行确权、质量评估。数据定价短期内可能会受到成本、市场的竞争情况、供需情况的影响,长期可借鉴DCF模型,从未来应用场景中充分挖掘价值,反向测算数据净现值。
数据资产在社会总资产的比重、地位逐步提高,数据的定价、交易需要基础设施完备、规则清晰、信息对称的交易市场。未来,一是要创造数据价值发现、应用的场景;二是要培育专业机构和人才,数据资产的评估要兼顾科学性和艺术性;三是要建立完善的数据管理标准体系和测试、认证体系。