大数据价值计算研究

2023-12-18 18:13马文胜侯锡林
计算机时代 2023年11期

马文胜 侯锡林

关键词:大数据价值;粒度树;使用关系;价值模型

中图分类号:TP311 文献标识码:A 文章编号:1006-8228(2023)11-146-05

0 引言

20 世纪80 年代,美国未来学家阿尔文·托夫勒(Alvin Toffler)在《第三次浪潮》中第一次使用了“大数据”一词[1]。从此大数据开启了一次重大的时代转型。大数据是改变市场、组织机构以及政府与公民关系的方法,大数据还是人们获得新的认知、创造新的价值的源泉[2]。

大量的数据在开放多源的渠道中产生,并持续记录物质世界和精神世界运动状态和状态变化的数据空间[3]。在这个大数据空间中,蕴藏着巨大的科学研究价值、公共管理与服务价值、商业价值以及科学决策价值[4-5]。这些蕴藏在大数据中的各种“价值”逐渐被人们所认知[6]。

于是大数据的价值是多少?怎么计算大数据的价值的数值?就成了研究的重要课题。目前人们已给出了很多不同的研究方法和方向。

⑴ 按照一种定价模型方法对大数据价值进行研究[7-8];

⑵ 按照一种数据资产对大数据价值进行研究[2];

⑶ 按一种价值评估方法对大数据价值进行研究[9-10]。

以上这些对大数据价值的研究都是以分析、探究、论述、描述、叙述、解释等为主,而都不是以计算出一个具体的“价值数值”为主。然而计算出“价值数值”是非常有意义的,理由如下:

(a) 作为大数据交易价格数值的参考;

(b) 作为大数据失窃“索赔”的参考;

(c) 作为大数据更新“删除”的参考;

(d) 作为大数据行业“标准”、“规范”制定的参考。

还有很多领域需要大数据的“价值数值”,因此侯锡林教授认为,对大数据的价值进行科学的评估和计算,创建大数据的价值模型,给出大数据的“价值数值”,无论在理论上还是在实践中,都是亟待解决的最重要问题[6]。

如何给出大数据的“价值数值”呢?

人们发现只有使用大数据,大数据才能体现出价值。大数据的价值的多少应体现在大数据使用的多少上。

人们还发现,体现大数据“使用”情况的价值才是最核心最基本的价值。各个领域的各种价值都是这个核心基本价值的外在表现。

本文将探讨基于“使用”的大数据最核心最基本的“价值数值”计算。

本文首先将大数据“粒化”,在大数据中建立“粒度树”。然后考虑每个粒及每个粒集合的使用情况。并将使用情况分为3 种:“正则使用”、“必然使用”、“相关使用”。取它们对粒及使用项目的平均值作为大数据的“正则价值”、“必然价值”、“相关价值”的数值。并给出应用实例。

1 粒计算与粒度树

大數据是巨量数据、海量数据,是无法在一定时间范围内通过人工或计算机进行捕捉、管理和处理的数据集合[11]。所以大数据的“价值”计算也必须使用非传统的方法。在这些非传统的方法中Chen 等将“粒计算”列为驾驭大数据的第一方法[12]。

粒计算的基本思想是把初始形式的数据分为不同的粒度进行处理。用粒度合适的“粒”作为处理对象,从而在保证求得满意解的前提下,提高解决问题的效率[13]。

目前大数据粒化的方法有粗糙集的方法[14]、聚类的方法[15]、商空间的方法[16]、模糊信息的方法[17]和云模型的方法[18-19]等等。