张弘
提要:数据天然地具有连接属性,越连接越有价值。由此,数据产业就是围绕着数据生产、流通、应用这3个前后相续的环节,推动数据不断增值的企业、个人、机构集合体。
本轮数字化转型的特点表现为万物上线、数据互联、智能决策,其中数据是将三者连接到一起的核心和主线。离开数据谈这轮数字化转型,就是无源之水,数字化转型根本无从谈起。
万物上线意味着所有的行为轨迹都有可能被数字化,从而留下痕迹。随着数据量的急剧增长,进而成长为一个全新的数据产业。
对数据产业及其生态存在多種观点
对这个全新的产业及其生态,存在各种各样的观点。
有把整个数据产业分为数据收集、数据管理、数据使用3个层面的,也有分为大数据技术、大数据服务和大数据应用的,还有分成数据源、数据架构、分析、应用4个模块的,不一而足。
仅以第一种分法为例,在数据收集层面,又包括数据采集和数据源。在数据采集底下,典型企业包括IBM和Oracle等。在数据源底下,又进一步细分为位置数据、图片数据、文本数据、音视频数据等。在数据管理层面,包括数据仓库、数据平台,数据平台底下又分为云存储、第三方数据平台、物联网。在数据使用层面,则包括数据挖掘、商业智能、数据可视化、垂直化应用(如智能营销、语音服务、图像分析)、行业化应用(如金融、零售、旅游、政府、电信、医疗等)。
这样的分层与分类,造成很大的疑惑——因为在分层分类过程中,交织穿插着各种维度,既有技术维度,又有行业维度,还有企业维度。由于大多数公司的业务都会发生变化,而且又常常会造出新的概念,同时还不断地有新公司出现,所以这种看似宏大而全面的分类最致命的问题是极不稳定。由此而引发的后果是,分类越来越来庞杂,交叉重叠的现象越来越多,归类不合理不准确、甚至遗漏的问题也越来越多。
因此,希望通过对企业进行穷尽性分类而准确把握数据产业的本质,是一件费时费力且南辕北辙的事情,就好比我们试图通过描述树叶的形状和颜色来对植物进行分类一样。
数据产业的本质是怎么来和怎么用
要理解数据产业的本质,我们首先要理解数据是怎么来的,又是怎么用的。
简而言之,数据的来源主要有两种。一是一个企业或机构、个人带着明确的目的,主动采用某种手段而采集的数据,最常见的形式莫过于基于统计抽样的问卷调研。另一种是在持续性的生产过程中,消费者和企业、机构互动而产生的数据。如:运营商数据、金融数据、电商数据、社交数据、工商税务数据、高速数据、电力数据等等。随着万物上线,第二种数据来源渐渐成为主体,占据了数据量的绝大多数。这两种来源,或主动、或被动,其实就是数据的生产过程。
在企业端,数据的应用主要有3种:销售名单、市场洞见和数据产品。
销售名单是直接提供获客名单,帮助企业实现销售。例如在保险行业,就有很多公司通过赠送低成本的意外险获取潜在客户信息,然后将领取了赠险的客户名单提交给客户经营部门,以供深度开发。
市场洞见指的是数据在加工处理和分析之后,为企业的经营决策提供依据,从而转化成有价值的情报或曰商业洞见。
数据产品则是将数据在深度加工后变成可不断复用的资源,提升企业自身的业绩,或者对外销售,成为企业的新盈利点。例如运营商就将用户的数据加工成庞大的客户标签库,既用于自己的精准营销,也帮助其他企业进行营销和客户维护。
数据就像石油,只有经过加工和使用才能产生价值。但两者又不一样,一桶油加一桶油等于两桶油,是简单的叠加,但一类数据加另一类数据,却不是量的简单叠加,而很可能带来质的变化。例如,运营商数据和信用卡数据相互打通,我们就可以更准确地认识我们的客户,甚至开发出全新的产品,比如贷款、理财。再比如,智慧城市的建设,就不能仅仅依靠一个部门的数据,而是需要聚合公安、交通、电力等诸多部门的数据。
换言之,数据天然地具有连接属性,越连接越有价值。由此,数据产业就是围绕着数据生产、流通、应用这3个前后相续的环节,推动数据不断增值的企业、个人、机构集合体。
在这个集合体中,每个企业、个人、机构都有可能既是数据的生产者,也是数据的流通者、应用者。而为了实现数据的生产、流通和应用,每个参与者都有可能使用不同的工具和技术,例如在生产环节有ERP系统、CRM系统、数据仓库、数据湖,与其相关的还有各种数据安全、数据治理技术。为促进数据流通,在数据流通环节,在机制上有数据合规审计、数据交易平台、数据信托平台等,在技术上则有多方可信计算、隐私计算等。在数据应用环节,则有各种机器学习和深度学习算法、AI运营系统等。
技术有变迁,企业有生死,但数据沿着生产、流通、应用3个环节移动而不断增值的行业本质不会发生变化。
大数据与小数据构成了完整的数据产业
一般人讲到数据产业,心中默认的就是大数据。但事实上,离开小数据的数据产业,会是一个不完整的产业。
小数据一般指通过抽样调查而获得的数据,包括通过一对一深访、小组座谈会等方式取得的非结构化数据(以开放式的非结构化文本内容为主),也包括通过问卷调研等方式取得的结构化数据(以量表形式为主)。
大数据因其大更能发现事物之间的相关性,而小数据因其小更能发现事物之间的因果性,这已是业界不争的事实。因此,虽然人们一度以为大数据将彻底取代小数据,但现在大家越来越倾向于认为大小数据将长期共存,发挥不同的作用。
但这并不意味着小数据作为数据产业的一个旧子集,不需要与时俱进。小数据行业主要由市场研究公司组成,这些公司沿着数据采集、处理、分析3个环节分布。数据采集和数据处理环节上的公司多数为小微型企业,其特点是规模小、利润薄、手工作业为主、科技化水平低,主要服务对象局限于头部市场研究公司。而头部市场研究公司则倾向于跨越所有的3个环节,因此业务链极为冗长,每个环节的价值增加有限,只好压低下游配套企业的利润,导致整个行业利润日益下降,逐渐丧失活力。
如何将传统的小数据行业现代化、科技化,并和新兴的大数据行业联接,使两者实现更为良性的互动和相互促进,是未来数据产业领导者应该思考的问题。