如何培育出大数据时代的No.1企业

2013-11-04 06:56:38李辉梁晓峣
科学与管理 2013年2期
关键词:数据处理客户政府

李辉 梁晓峣

(1.上海市科学学研究所 2.上海交通大学 上海 200240)

网页时代,google凭借强大的搜索功能抢得先机;社交媒体时代,facebook凭借领先的分享模式独领风骚;大数据时代,什么样的企业能执牛耳?

1、大数据时代的三种公司

按照牛津大学教授、《大数据时代:生活、工作与思维的大变革》作者维克托·迈尔·舍恩伯格的观点,大数据产业的价值创造一般有三部分组成:数据本身、处理数据的技能以及利用数据的创新思维。这三者也分别代表了大数据产业中的三种公司类型。

大数据掌控公司。这类公司拥有大量数据或至少可以收集到大量数据,却不一定有从数据中提取价值的技能或者用数据催生创新的思想。最好的例子是twitter,它拥有海量数据,但是它的数据都通过两个独立的公司授权给别人使用。

大数据技术公司。这一类公司通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或提出数据创新性用途的思想。比如,沃尔玛和Pop-Tarts这两家零售商就是借助天睿公司(Teradata)的分析来制定营销方案—而天睿这样的公司就是大数据分析公司。

大数据点子公司。Jetpac是通过想法将大数据转化为价值的一个例子。这家公司通过用户分享到网上的旅行照片来为人们推荐下次旅行的目的地。对于这些公司来说,数据和技能并不是成功的关键,让这些公司脱颖而出的是其创始人和员工的创新思维,它们有实现数据新价值的独特想法。一般来说,这类公司的创始人会是外行人,他们思考的只是将数据转化为价值的可能性,而不考虑所谓的可行性—可行性交给技术人员操作。

当然,有一些公司,比如google,就是既拥有数据,也具有技术,同时还不缺点子的公司。以上分类,舍恩伯格也认为,只是针对采用信息化系统已久的非互联网公司的大数据价值链。而这些公司,正是大数据成为信息技术领域最新创新点的主要原因。

2、大数据处理:外包模式

国内一些具有大数据的非互联网公司也逐渐意识到了大数据能够带来的机遇。如上海的上广电就是一个典型例子。他们通过安置机顶盒,在给电视观看者提供数字内容的同时,也获得用户观看习惯的数据。同时,电视的位置也是可知的。基于这两种数据,就可以开发出一定种类的新的服务。

比如,基于客户行为的个性广告。如果某一家庭喜欢看少儿节目,广告就可以推送与儿童有关的。再比如,基于客户位置的信息推送。如果某用户居处附近有商家在打折,电视就可以推送这些打折信息。还比如,基于群体行为的广告定价。根据用户的过往数据,可以比较有把握地预测一部电视剧是否会火。

作为电视台,上广电(至少目前)并不具备大数据开发技能,但他们显然也不愿意将他们的数据直接交给大数据处理公司。所以如果他们想要从机顶盒数据中开发新的服务,一定会选择有能力的大数据专家或者公司上门服务。而他们根据计算结果进行应用即可。

3、大数据处理:中间商模式

在大规模爆发的大数据产业中,舍恩伯格认为,全新的数据中间商将横空出现。他例举了交通数据处理公司Inrix。这家公司位于美国西雅图,它汇集了来自美洲和欧洲近1亿辆汽车的实时交通数据。这些数据来自宝马、福特、丰田等私家车,还有一些出租车和货车等商用车。私家车主的移动电话也是数据的来源。一方面这家公司通过智能手机为用户提供免费的交通信息,另一方面它也得到了这些车辆的同步数据。Inrix是典型的独立运作的大数据中间商。每个汽车制造商可能都会利用自己的车辆在行驶过程中生成的成千上万条数据来预测交通状况,但这种预测不准确也不全面。但Inrix汇总了各家车厂车辆的数据,随着数据量的激增,预测结果越来越准确。

作为汽车制造商,各汽车公司并不一定掌握分析数据的技能,他们的强项是造车而不是路况分析。所以他们都很乐意第三方来做这一预测的工作,而且这些同行业的竞争者并不介意通过行业外的中间商来汇集他们各自手中的数据。

第三方的数据商出现固然是一种趋势,但这只解决了公司愿意提供的那些数据的处理。事关商业竞争力的数据一般公司是不会交给第三方数据公司的。

4、面对更大的客户需求,还有没有别的模式?

大数据越来越“大”。媒体、交通、运输、食品、医疗等领域,都有大量数据在持续积累当中。目前几乎所有对大数据的定义,都包括了“海量”、“实时快速”、“多种类”这三种特点。在大小公司的数据开发成为规模后,大数据将呈井喷状态。

根据IBM和牛津大学的合作报告《大数据在真实世界中的运用—创新型企业如何从不确定数据中提取价值》,2012年,在接受他们调研的1061家公司中,28%的公司开始试点和实施大数据战略,47%的公司处于规划阶段而剩下24%则处于概念认识阶段。他们的全球调研发现,虽然大多数企业对大数据是为何物还不清晰,但是都表现出了越来越浓的兴趣。未来越来越多的公司将意识到大数据的价值并寻找大数据技能和创新公司。不利用大数据的公司,很有可能被利用大数据的同行公司甩开。

可以预见,绝大多数公司都实行大数据战略后,数据分析的要求要比现在大的多。这一方面将会刺激大数据技术处理公司的增长,同时也会刺激大量的数据中间商的出现。但是,应对越来越大的大数据处理需求,还有什么新的模式来吗?

5、大数据处理的技术黑箱

大数据处理最主要的目标,就是将机器可读的“数据”转化为可以应用的“知识”。

无论是交给大数据技术处理公司,或者中间商,他们的工作内容,都是将公司的“数据”转化为可供利用的“知识”。而这个转化过程,一则需要一定的技术,二则需要一系列的软硬件。具体的转化过程—大数据处理的技术黑箱。如下图(由上海交大梁晓峣教授和朱其立教授联合绘制)所示。

在目前热炒的“大数据”概念中,其实对于不同企业意味着不同的意义。如,IBM、Intel等比较关注最底层的硬件层,oracle等则比较关注系统软件层,百度、街旁等比较关注最上面的应用软件层,现在最为大众所知的也是最上面这一层,如facebook、新浪微博的广告推送,腾讯的微信即时聊天服务等。

图1.大数据技术处理框架图

但是“知识工程层”,也就是,在硬件和系统架构的基础上,如何将“数据”转化为“知识”,一直被当作是大数据公司内部的技术能力,人们往往并不对其深入剖析。

6、一种新模式:大数据处理平台模式

事实上,从“知识工程层”着手发展,是可以大有作为的。如果一个客户,将其数据提供给一个大数据技术公司,该公司将其数据转化为“知识”,就完成了一种业务。这也就是本文一开头提到的第二种公司—大数据技术公司的业务流程。

如果,有多个客户将数据传给不同的数据技术公司,而这些公司同时在这一平台作业。那么,各个数据处理公司不仅分别满足了各自的客户,同时平台也汇集了各个客户的数据,进而有了将这些数据重组、混搭的机会。这种情况所能带来的效益更是不可估量的。因为大数据处理,数据越“大”,创新的机会越多。而在处理各种数据的基础上,平台的技术能力和数据基础也得到一步步加强。随着领先者效应,有可能成为大数据时代的No.1企业。

所以,有没有可能建立一个国有数据处理平台?此平台,可以处理各种客户的数据处理需求。在满足各种客户自身需求的基础上,还可以利用客户的数据—在客户同意的条件下—进行新的二次甚至三次开发利用。同时客户也可以分得新一轮开发所创造的价值。

大数据带动的在这一层级的产业需求,其下层的IBM、Intel、oracle等以及其上层的facebook,百度等,由于“船大难掉头”无法顾及。当然,即便他们想发展,也还面临另两个关键问题。一,第一桶数据哪里来?二,由于客户众多,数据必须有足够的安全保障。

7、政府的作用:提供第一桶数据和控制平台发展方向

最近几年,政府数据开放运动(open data)在很多国家展开。这些国家公开政府数据的目的是为了刺激各种数据处理公司对政府的数据再利用从而创造新的价值。中国由于各种原因一直没有加入此一行动,所以大部分的政府数据是处于搁置状态的。

我们认为,在不公开政府数据的情况下,政府也可以成立一个国有的大数据处理平台对政府自身的数据进行处理。这样,既可以保证政府数据不发生外泄,同时也可以二次开发利用创造新价值。

而这一政府主导的平台,也可以接受各个企业将其数据融入。企业出于对政府数据安全的信任,会愿意将自己的数据分享到政府的平台。作为回报,企业可以得到该平台基于各种类型数据所计算出的知识,提供的各种创新应用以及盈利的一部分。

当然还有另外一种可能,企业而不是政府建设这一平台,但政府可以分享自己的一部分数据给以支持。通过这第一桶数据,该平台可以进一步吸收其他企业、社会数据,并最终壮大。

8、待讨论的问题

政府提供数据培养企业,一定存在这样一个问题:政府数据作为一种独特的资源,政府应当提供给哪个企业?选择企业,无论是一家还是若干家,都是“选择赢家”式的。这无疑会被认为是某种程度的政府“慈父主义”。欧美发达国家的处理方式,是将能够公开的政府数据公开在互联网上,任何企业或个人都可以开发利用。但是,在中国的背景下,一旦政府数据也通过互联网公开,很有可能被国外发达数据公司抢先开发。如何平衡这两者之间的矛盾,还需进一步研究。

[1][英]维克托·迈尔·舍恩伯格(Viktor Mayer-Sch-nberger)肯尼思·库克耶(Kenneth Cukier).大数据时代——生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.12

[2]IBM商业价值研究院、牛津大学赛德商学院.分析:大数据在现实世界中的应用(http://www.ibm.com/cn/services/bcs/iibv/)[R].2012.

[3]涂子沛.大数据:正在到了的数据革命,以及它如何改变政府、商业和我们的生活[M].桂林:广西师范大学出版社.2012.7

猜你喜欢
数据处理客户政府
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
心理学报(2022年4期)2022-04-12 07:38:02
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
水泵技术(2021年3期)2021-08-14 02:09:20
知法犯法的政府副秘书长
支部建设(2019年36期)2019-02-20 13:21:22
为什么你总是被客户拒绝?
如何有效跟进客户?
做个不打扰客户的保镖
山东青年(2016年2期)2016-02-28 14:25:41
依靠政府,我们才能有所作为
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
政府手里有三种工具
中国卫生(2015年10期)2015-11-10 03:14:22
23