总裁 施水才
各位新老朋友大家上午好。
非常高兴能有这个机会与大家分享有关大数据的一些思考和媒体实践。可以说,引起媒体业下一步革命的新技术主要包括四项,即大数据(Big Data)、云计算(Cloud Computing)、移动互联网(Mobile Computing)、社会化计算(Social Computing)。这四项技术几乎成为各行各业每天都在谈论的内容,今天我的主题演讲也是围绕这四项新技术,谈三方面的内容:大数据时代已经来临、媒体业在大数据时代的挑战和机遇、拓尔思在媒体业的大数据实践。谈谈有关大数据的思考。
早在1993年,美国《纽约客》刊登了一则由彼得•施泰纳创作的漫画,这幅漫画因它的标题——“互联网上没有人知道你是一条狗”而变得流行,这是当时对“远程通讯”的一种理解。但是20年后的2013年,随着人们对移动互联网、社交网络、电子商务的广泛使用,互联网不仅仅知道对面是一只狗,还知道这只狗喜欢什么食物、几点出去遛弯、几点回窝睡觉。是谓“处处行迹处处痕”,这一切都是基于大数据对用户的大量行为数据的累计分析。
“人类历史上最早的一批城市都诞生在河边,河流为人类提供了食物、水和交通。而我们要做的,就是创造一条数据的河流,来滋养信息经济的发展。”这句话来自美国的一家开放数据平台网站,这也是我最喜欢和认同的关于大数据的看法。前两天,政府公布了2015年我国信息消费将达到2万亿人民币,信息产业也将成为我国经济发展的支柱型产业。截止到2011年,全球创建和复制的数据总量为1.8ZB(约1.8万亿GB),每两年翻一番,到2020年全球将达到35ZB的数据信息量——世界已经不折不扣进入“大数据”时代。
近两年关于大数据的分析研究也受到了各个领域的追捧。比如,2011年5月,麦肯锡发布《大数据:创新、竞争和生产力的下一个新领域》;2012年1月,达沃斯世界经济论坛发布《大数据,大影响》报告,宣称数据已经成为一种新的经济资产类别,就像货币和黄金一样,是21世纪的石油;2012年10月,IBM也发布大数据报告《分析:大数据在现实世界中的应用》。
2012年3月,奥巴马政府也提出了有关大数据的国家战略,发布《大数据研究和发展倡议》,投资2亿美元启动“大数据研究和发展计划”,目标是增强收集海量数据、分析萃取信息的能力。这事关美国国家安全、科学和研究的步伐,以及引发教育和学习的变革,其重要性堪比当年的信息高速公路。
图1:互联网上没有人知道你是一条狗
大数据概念如此流行的原因到底是什么?有关专家学者分析得出,数据的爆发式增长及其社会化趋势是大数据产生的本质原因。不论是作为个体人的我们,还是马路边的摄像头,任何事物都将成为数据的一部分。同时,我们还要清楚的认识到,大数据的特征并不是量大就是大数据,而是业界总结出来的“4V”特征,即更大规模的数据(Volume)、更多样化的数据(Variety)、更实时的数据(Velocity)、价值密度低商业价值高(Value)。另外,大数据的精髓更要明确,我的总结有三:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。
对大数据有了一个初步的认识之后,接下来我们还要考虑的问题是,如何应用大数据。可以说,云计算和大数据是一个硬币的两面,云计算是大数据的IT基础,而大数据是云计算的一个杀手级应用。总而言之,大数据应用的落地是通过云计算来实现的。云计算的应运而生,主要是由于现有的信息技术和软件难以处理大数据的规模和复杂性。对大数据的获取、存贮、搜索、分享、分析以及可视化等等,都是大数据对现有信息技术提出的挑战。
此外,大数据时代的三大发展趋势对媒体的发展有很大的借鉴意义。第一,数据将成为资产,这里的数据既包括媒体的内容数据,也包括媒体的经营数据、用户数据等各方面的数据。第二,行业的垂直整合。比如,苹果公司从内容到设备,再到软件等的一条龙发展模式。第三,泛互联网化,未来我们的任何行为都有可能和互联网有关系。媒体行业在未来的发展道路上应该借鉴大数据的这三种发展趋势。
大数据带来的变革是多方面、多领域的,不仅对科学技术的发展提出挑战、给媒体行业变革以参考,还对经济生态产生了一定的影响。大数据作为一种自然资源,是新经济竞争力,将形成一种新的经济生态——反馈经济。数据本身没有意义,但是基于大数据的反馈经济模式将带来新的一场生产革命:一切将以数据为中心,基于数据进行深度挖掘和分析;以最小的成本创造更快更好的产品;通过实验性思维和微创新,降低商业风险;反复迭代与用户紧密联系,做到更加精益求精。同时,反馈经济还会带来量化自我运动,硅谷的先驱者们今年开始了一项活动,就是找到一群自愿者,自愿戴上传感器及手持移动设备,尽量把每天生活的轨迹(衣食住行)记录下来,然后从中发现规律,反哺经济。
大数据带来的跨界竞争和颠覆性创新非常重要。
挑战一:传统媒体影响力日渐式微,渐成老年人专利
调查数据显示,目前北京地区电视机开机率从三年前的70%下降至今天的30%,传统广播电视收听收视群体逐渐向老年人集中,年轻人不再看电视;截止到2012年底,我国网络视频用户已达到4.5亿,在全国网民总数中占比超过70%;2008年《芝加哥论坛报》及《洛杉矶时报》宣布破产,2009年105家美国报纸宣布破产,2009年德国《纽伦堡晚报》《法兰克福论坛报》《德国金融时报》相继破产和停刊,2012年《中国新闻出版报》报道称10月报纸广告收入环比下降41.7%,同比下降6.6%……以上调查结果显示,传统媒体影响力日渐式微,传统媒体有朝一日真的可能成为老年人的专利。
挑战二:两个舆论场正在进行能量转化
以党报、电视台等传统媒体为主的官方舆论场和以QQ、微博、论坛、社区等互联网传播方式为主的民间舆论场,正在进行着能量的转化。人民网舆情监测中心得出的一组数据显示:在20世纪80年代,官方媒体掌握着80%的话语权,而在2012年的20个网络热点事件中,非官方媒体掌握了75%的话语权。从长远来看,话语权从官方舆论场部分转移到民间舆论场的趋势是不可逆转的,两个舆论场正在进行能量的转化。
挑战三:报纸在衰落
由图2我们可以得出美国纸质媒体的广告收入情况,2002年左右和1990年是报纸广告收入的高峰峰值,大约为600亿美元,而1950年左右的美国报纸的广告收入约为200亿美元,这也是如今2012年的数值。从报纸广告收入的迅猛下滑,我们也可以看到报纸的衰落速度。见图2所示。
“往年4月报纸广告环比应该大幅增长,今年4月环比仅增长7%,导致4月报纸广告同比下降幅度达到15%,说明报纸广告下降的趋势不仅没有得到改善而且有继续恶化的趋势。一年过去了1/3下半年回暖可能微乎其微,已经可以判断报纸广告进入一次新的衰退期。”中国广协报刊分会主任梁勤俭给出这样的预期。
相较之下,网络广告早在15年前就开始繁衍生息,从1998年到2013年,可以说这是网络广告腾飞的十五年。2003年,网络广告收入就突破十亿,2007年,电商行业的爆发式增长使得网络广告突破100亿,预计到2015年网络将成为广告投放的最大媒体。
另外,自媒体粉丝数或影响力挑战着报纸的发行量。最为全国发行量最大的报纸《参考消息》,它的发行量达到340万份,而新浪微博拥有粉丝数最多的博主李开复的粉丝数却高达5000多万,这是一个让传统报纸媒体的小伙伴们惊呆的数字。
那么,传统媒体之所以衰落的根源在哪?这是我们需要探究的一个重要问题。首先,受众注意力的流失,受众的注意力已经向网络媒体、社交媒体和自媒体转移,特别是微博和微信的爆发式增长,吸引着越来越多的受众注意力。次,传统媒体未能解决好用户身份和反馈机制。传统媒体需要以“反馈经济”的思路来生产内容,细分人群,精准营销,创新服务。第三,缺少互联网和大数据思维,传统媒体创办自己的电子报和手机版失败的例子是最为成功的说服。
图2:报纸在衰落
经过和有关专家学者的探讨,我们得出,媒体转型的关键就是转变思维,也就是要有互联网思维。所谓的互联网思维,大体可以概括为五点,即平台思维、个性化思维、社区化思维、网状思维和跨界思维。
图3:网络广告腾飞十五年
举个例子,美国的一个线上视频网站——Netflix,用大数据捧火《纸牌屋》。在开拍之前,Netflix 是否知道《纸牌屋》会火呢,Netflix 在美国有2700万订阅用户,在全世界则有3300万,它比谁都清楚大家喜欢看什么样的电影和电视。每天用户在 Netflix上产生3000万多个行为,比如你暂停、回放或者快进时都会产生一个行为,Netflix 的订阅用户每天还会给出400万个评分。《纸牌屋》的成功得益于Netflix海量的用户数据积累和分析。
综上所述,我们可以分析出大数据时代媒体业的发展趋势。大致有三:平台型公司;细分媒体;平台向大,细分向小。
同时,大数据也使传统媒体的作业流程有了全面改造的空间,这也是大数据为传统媒体带来的机遇。不论是在稿件的选题上,还是在稿件的撰写以及对其内容的评估上,都要全面引进大数据的理念和分析方法。选题:传统媒体作业方式中,选题的来源一般为记者自主策划,上级领导命题,或来自网络、电话、线人举报。而如果借助大数据,可以形成一个选题数据库,把最新的热点、重点进行数据化呈现。记者的经验能力结合数据决策,可以找到最好的选题(普遍存在,领导重视,群众关心)。撰写:记者在撰写文章时,会涉及到一些社会调查,通过街头随机访问、抽样统计的方式,样本小,难免以偏概全。而借助于大数据,可以在无提示、无干扰的情况下,采集全网数据。更全面、更客观、更真实的反映整个社会基本面的状况和各界的态度以及立场分布。评估:借助于大数据可以实际评估出,传统媒体的某一篇文章,某一个专题,某一个观点、某一个记者、评论员在整个网络世界的影响力。也可以看到竞争媒体的影响力状况和变化趋势。这样,对于内部管理、绩效评估、媒体发展都有了可量化的数据和指标。从经验决策全面转向数据决策。
拓尔思在媒体业的大数据实践始终围绕着三个核心:以数据为核心、以服务为核心、以移动互联网为核心。
拓尔思服务于媒体业的产品和服务主要包括:
1、全媒体管理系统——媒体单位新一代全媒体应用解决方案。全媒体的核心是以数据为中心,拓尔思全媒体平台已经在诸如人民日报、中新社等多家媒体和国家级新闻单位落地,同时也在研发基于云平台的新一代全媒体应用。
2、移动应用产品——拥抱移动互联网的全方位解决方案。拓尔思在媒体业的最新应用是关于西藏人民广播电台的移动互联网方面的全覆盖应用,包括资讯、广播、电视、音乐、视频、图库等。
3、SMAS社交媒体分析云服务——以大数据为核心的媒体分析和内容挖掘服务。包括全媒体信息发现、大数据云服务平台、全方位服务等。《中国汽车报》以此搭建起了“国家级汽车产业信息数据平台”——有数(Yousure),其在报纸上刊登的大量数据图表皆是源于此数据分析平台。
4、Netsnap网络新闻转载云服务——为媒体网站提供精选的网络新闻,以互联网服务形式提供的在线待编稿库,与内容管理系统(CMS,如WCM,方正翔宇等)无缝集成,以达到采、编、发工作流程完美统一。其主要的功能定位是对编辑人员感兴趣的网页进行自动抓取和清洗,转换成规格化内容填充到内容管理系统的编辑界面,实现一键式发布。
5、焦点快报——一款新闻聚合App。用于网络热点的快速发现与分享。作为一款免费的社交网络新闻聚合APP其功能是,基于大数据的采集、分析和聚类,以及每天从数千万的新闻中聚合分析网络热点,及热点的强度和变化趋势,并进行实时更新(目前是每小时)。另外还兼有热点新闻分享(微博、微信等)、历史热点搜索、关键词和语音搜索等功能。
拓尔思为媒体服务截止至今已有20年之久。2011年6月拓尔思在创业版上市,以大数据、云计算、移动互联网和社交网络技术助力媒体转型升级。在大数据时代的媒体转型升级过程中,拓尔思还将继续与各媒体共同发展。■