大数据在媒体运营中的应用及思考

2015-11-30 04:00黄升民吴殿义
关键词:运营者内容用户

黄升民,吴殿义

(中国传媒大学 广告学院,北京 100024)

早在两三年前,大数据的概念就已经蔚然成风,而时至今日,大数据在媒体领域的应用开始发酵,价值开始凸显。“大数据不只是一个概念,实际上是对一种社会状态的描述。谁拥有数据、掌握数据、主导数据并加以整合应用,谁就在社会中占据着重要地位”。[1]对媒体而言,在新旧媒体激烈竞争的格局下,数据被赋予了越来越深刻的意义,成为业务、营销发展的重要驱动力。

笔者以为,媒体机构要通过对海量数据的应用,达到指导内容优化、提升广告和营销活动的实效性的目的,核心是破解数据背后的逻辑关系。而破解之道,在于构建一个闭环的四维空间,首先,占有并整合内部、外部多种类型的数据,搭建统一的数据平台;其次,只有足够精细的分析,才能够发挥、挖掘出海量数据的价值;再者在分析基础上,大数据在媒体领域的应用可以归结到优化内容业务,提升营销价值,构建开放平台,完善内部管理四个方向;最后,无论是哪个方向,媒体的运营都必须直面用户,与用户进行互动,这种互动背后则是数据的流动和再积累。本文将从这几个方面着手,探讨大数据在媒体运营中的应用关键点。

一 占有数据、打通数据是媒体运营数据的基础

在需要优化内容、业务或者广告经营的时候,媒体机构的传统做法是委托数据服务商进行调研,以此指导工作。如今随着业务线的扩展,媒体调研的频率提高,样本量较诸以往也有提升,但这种变化并非大数据运营。真正的媒体大数据运营,首要在于主动占有数据,并且将不同类型的数据打通,形成可供应用的数据平台。

(一)数据的占有

对媒体运营者而言,占有数据的思维至关重要。随着网络融合的发展,智能终端的普及,媒体运营的业务产品日益丰富,用户在媒体内容或者与内容相关的交互应用上留下的痕迹也逐渐增多,从而带来了多元的丰富数据,而丰富的数据又成为支撑媒体业务设计、内容优化和广告营销活动的基石。

在互联网中,以数据为基础开展运营是普遍思路。以国内汽车类垂直网站汽车之家为例,其构建之初,就是着眼于数据仓库的设计、打通、数据的产品化,最终形成了车型对比、检索等易用工具,吸引到海量用户。

反观传统媒体的运营者,为了优化内容和提升广告效果,虽然已经广泛使用了网站、微博、微信平台、APP 等各种互动手段,但是互动过程中却缺少了对于各种数据的积累,所以往往只能短期内吸引用户的关注,难以从根本上指导媒体优化业务,从而在激烈的竞争格局中脱颖而出。

由此可见,主动去占有数据是运营数据的关键基础。

(二)数据的打通

大数据之所以得名,一方面在于数据体量,另一方面则是数据来源和类型的多样态与复杂性。虽然这正是数据的价值所在,但是要将这样的数据付诸应用,就必须建设统一的数据平台。唯有数据统一,媒体运营者才能全面、清晰的了解自身平台积累的和外部平台获取的数据情况,对数据应用有所把握。

此外,从业务的角度考虑,来源于某一业务的数据,未必只能用于该业务的优化,可能在另一业务或者营销活动上发挥价值。因此,数据打通势在必行。

而这一打通,必须从技术底层和组织结构两个层面同时推进。

在技术层面,海量数据的存储和处理,hadoop 集群的应用,必须要统一管理,才能降低错误率和软硬件成本。而底层数据库的统一建构,又依赖于组织结构的统一。否则数据就会因为管理松散、无法聚合。目前国内外众多互联网企业、传媒集团,都设立专业部门进行数据处理,并且搭建了统一的数据中心,以及从集团顶层设计上新增首席数据官这样的角色,以求能够打通集团分散的数据。

在这方面,国内某些媒体结构动作比较迟缓。内容、广告的数据分别由不同部门占有和分析,各自为政,而不能汇聚在统一的平台。

二 精细分析,让数据成为媒体运营的生产力

随着网民在线行为的日益增加,数据量突飞猛涨,媒体已经进入了海量数据时代。而媒体运营者要将海量数据真正转变为指导内容、业务、广告优化的驱动力,就必须要进行精细化的分析,形成对用户、行业、市场的深刻洞察。

首先,海量数据也需要经过筛选与清理。数据量爆炸性增长的同时,劣质数据也随之而来,导致数据质量低劣,极大地降低了数据的可用性。事实表明,大数据在可用性方面存在严重问题。国外权威机构的统计表明,美国企业信息系统中1% -30%的数据存在各种错误和误差,美国医疗信息系统中13.6% -81%的关键数据不完整或陈旧。国际著名科技咨询机构Gartner 的调查显示,全球财富1 000 强企业中超过25%的企业信息系统中的数据不正确或不准确。随着大数据的不断增长,数据可用性问题将日趋严重,也必将导致源于数据的知识和决策的严重错误。[2]

此外,同样的数据对于不同的对象,有价值的部分各个不同。媒体要根据自己的需求、特征,对现有数据进行清洗过滤,将数据中的“噪声”剔除。如一家区域报刊和一家全国卫视,都购买了新浪全站微博,可能前者需要着重于地理位置、本地竞争对手和企业动态,而后者则看重电视节目、剧集相关的舆情。

其次,当过滤出有效信息后,数据量依然庞大。虽然通过诸如文本切词等简单分析也能够产生出一定的结论,但精细的分析才能够最大化这些有效数据的价值。

例如,海外视频网站Netflix 的编辑们在长达36 页的培训文档指导下,给全站内容打上六万余个标签。反观国内的视频网站如优酷、搜狐视频,其用户数量、内容数量以及用户的使用行为数据,都远远超过Netflix,但他们的数据应用,主要是对单个视频给出基本的播放指数,而这些点击、评论、用户分布等的基本指数,在小数据时代,一样可以获得。内容与制作团队的关联、与时代的关联、与文化的关联、与消费的关联、用户多个层次的喜好度等等,这些本可以挖掘的数据,都不见踪影。

三 数据应用:媒体数据运营的四个方向

在打通数据、精细分析后,媒体要通过应用将大数据落到实处。目前业界的大数据应用,可以归纳到如下四个方向,即优化内容和业务,提升广告营销的效果,支持开放平台,优化内部管理等。

(一)优化内容和业务

对媒体运营者而言,用户在使用其媒体业务、观看其内容的同时,留下了数据痕迹,因此,将数据用于优化内容、业务,是题中之意。

如传统电视收视率这样的数据体系已经存在数十年并且相当成熟,因此,媒体并非完全没有使用数据的思维。但在实际运营中,用收视率执行末位淘汰制这样的做法,与其说是用数据,毋宁说是“看”数据,是一种短视行为。收视结构背后的观众人群及流变、可以与收视率发生关联的数据、数据所反映出文化、消费等层面的趋势、怎样进一步指导内容生产、版权采购、业务集成,这样的思考和实践,才称得上是用数据。

例如,在腾讯视频与唯众传媒的合作《你知道吗?》这档节目中,腾讯视频作为节目模式的购买方,委托唯众传媒进行制作。每一期节目的选题、具体问题的提出,都依赖于腾讯视频基于自身平台的受众调研和数据分析,表面上看,视频网站缺失内容制作的团队,但是凭借数据,腾讯视频能够理解用户,也就能指导节目公司去完成内容。

大数据的应用能力,就意味着在内容、业务领域的话语权,这是未来的造血能力。因此,众多传统媒体不应该过分依赖于将自己的数据外包给其他公司进行分析,而应该提高自己的技能,不然,在新旧媒体激烈的竞争格局中,单凭优质内容未必能够占据高地。

(二)提升广告营销的效果

对媒体而言,广告主是直接的服务对象。广告主都希望自己的投入有所收获,又总是有不知道自己的钱浪费到哪里的困惑。这一方面源于广告投放效果并非完全是可以由数据直接衡量,另一方面也是受制于技术发展。而今用户大量的在线行为数据触手可及,有针对地投放广告成为可能,媒体就可以满足广告主对精准营销的需求。

以美国卫星电视运营商DirecTV 为例,在其可寻址广告系统中,广告主可以自主选定他们感兴趣的家庭类型,同时DirecTV 会委托第三方数据提供商在其注册用户中寻找符合要求的家庭。这些数据包含了收入、性别、是否有小孩以及该家庭最近是否购买了某广告主的产品等信息,随后这些数据将被加载到用户的DirecTV 机顶盒中,一旦进入广告时段,机顶盒就会从机顶盒预存的广告中挑选出最适合该家庭的广告。同时用户对于广告投放的点击或是收看行为数据会再次被收集。[3]

然而大数据只是部分解决了营销问题。目前可用的数据依赖于用户的在线行为,但在线行为不能涵盖一个人的所有方面,即使通过监控设备获得了用户的更多行为数据,而用户行为背后的动机、心理状态的变化,以及对品牌、产品、价格的态度转变等等,也并不是依靠大数据就能够获得的。当前大数据在营销方面的应用,只限于广告投放渠道的相对精准。

有鉴于此,就必须要指出单纯依靠数据存在的陷阱。纯技术支持下的营销,可能会走入死胡同。如淘宝为其平台上的卖家开发了非常多元的营销工具,如直通车、钻石展位等等,这些工具将卖家导向了对ROI、CTR 的片面追求,以降价求销量,的确带来了销量提升,然而随着市场的发展,淘宝卖家必然会碰到天花板,因为ROI 是即时营销的指标,却不能指导长期的品牌建设,而没有品牌,营销的路最终会越走越窄。

必须要将传统营销理论与数据的力量做结合,才能够真正诞生出适合新环境的营销工具。

(三)支持开放平台

随着竞争日益激烈,平台化成为众多媒体的目标。当媒体聚拢了海量第三方,就能够更加深度的黏着用户,获得更大的发展空间。

表1 媒介数据的运营方向简表

而作为平台,在吸引第三方进入的时候,当然要针对其需求提供服务。第三方需要获取用户数据,分析用户行为,支持业务优化,而媒体作为平台方的数据基础就成为巨大的优势了。加盟者们不需要花费时间和金钱采集数据,直接能够获得分析结果,并在数据的指导下不断优化。同时,他们又会将自己获得的数据补充到媒体平台的数据库中,为媒体平台输送更多养料。

比如,优酷作为一家视频运营者,其核心优势就是差异性的内容。这一目的通过采购和自制可以部分解决,但广泛发动社会上的闲散制作力量,汇聚起大量机构和个人用户成为内容提供者,持续为自身的视频库供血,也是不容忽视的重要战略。要达到这一目标,良好的分成机制当然很重要,此外,利用优酷已经积累的数据资源和分析能力,帮助这些“供应商”在生产内容过程中进行优化,也是题中应有之义。

又如Google Analytics(Google 分析)是Google 的一款免费的网站分析服务,只要在网站的页面上加入一段代码,就可以提供丰富详尽的图表式报告,向网站的所有者显示人们如何找到和浏览网站以及如何改善访问者的体验。

大多数如上所述的数据分析工具都是免费的,对以平台为目标的媒体运营者而言,开发这样一些免费工具并不会付出难以接受的成本,却能够换取平台的地位和背后更多的数据原料。

(四)优化内部管理

数据优化内部管理,可以说是老生常谈。但媒体应用数据优化内容管理的早期做法,主要是对员工进行绩效考核。随着数据的打通,内部管理已经超越了单纯“考核”,逐渐与业务融为一体。

比如某个时段网络上的掉话率持续过高,法国电信借助大数据手段诊断出通话中断产生的原因是网络负荷过重,并根据分析结果优化网络布局,为客户提供了更好的体验,获得了更多的客户以及业务增长;T -Mobile 采用Informatica平台开展大数据工作,通过集成数据综合分析客户流失的原因,在一个季度内将流失率减半;SK 电讯新成立一家公司SK Planet,专门处理与大数据相关的业务,通过分析用户的使用行为,在用户做出决定之前,推出符合用户兴趣的业务,防止用户流失。[4]国内的电信运营商也在做类似的事情。

大数据对内部管理的变革,体现在管理边界的模糊。当数据可以直达业务,考核人事在很大程度上就失去了必要性。媒体也应该通过“数据——考核业务——考核人事”这样的逻辑去重置内部管理结构。

四 互动与数据互为表里

经过上述的三个层面后,内容、业务和营销直接面对用户。在这一层面,表面上看是通过各种方式与用户互动,如吸引用户点击、收藏、跳转、下载、参与活动等等,实际上,互动如果没有收集到用户数据,并且将这些数据存留下来,将来的业务和营销就会缺少进一步的指导,互动也就无力为继。

这就要求媒体经营者在设计之初,考虑交互性的同时,还要有数据意识,对可能产生的数据有清晰的理解和把握,在搭建前端的同时兼顾底层数据库的建设,形成一个“利用交互优化用户体验——同时记录数据——通过分析数据进一步黏着用户、开发数据价值”的回路。

比如微博、微信的点赞功能,这是刺激用户活跃度的一种交互方式,但是如果仅仅停留在用户的点击,而不去做进一步分析,对媒体运营者而言就是对数据的一种浪费。因为这种交互方式背后,隐藏着用户对内容的喜好和倾向。而要想利用它,就必须在设计点赞功能的同时,考虑这一数据在整体数据库架构中的沉积和分析。

又比如乐视网推出的“热度曲线”,这款产品通过深度挖掘用户行为,将用户对于视频的观看热度以曲线图的形式展现出来,并且细化到每一帧,曲线的波峰和波谷在哪里一目了然,快速帮助用户找到爆点。目前该产品已在综艺频道上线,未来会覆盖所有的综艺、电视剧等长视频节目,并支持移动客户端。这一案例就切实体现了用户数据的价值所在,乐视利用用户简单的点击、跳转,分析出用户行为特征,形成热度曲线这一产品,除了能够帮助用户更快地找到爆点,将来还可以帮助行业优化内容生产。

五 媒体应用大数据的几个关键认知

大数据既是挑战,也是机遇。挑战在于思维的变革,而机遇在于大数据能够创造出新的价值和模式。与此同时,面对概念的诱惑,如何做到不盲从,有针对性地选择、处理和应用,是所有媒体值得考虑的问题。笔者以为,当前在大数据应用中,有这样几个关键,必须引起业界的注意。

(一)大数据的积累和运用是渐进过程,“小数据”亦不容忽视

从“数据”迈入“大数据”的过程中,越来越多的目光投注到了数据体量“大”上,因此很多媒体走向极端,一方面,认为只有大数据才有变现的可能,自己的数据毫无意义,不去挖掘现有的数据中隐藏的价值;另一方面,认为自己不具备数据的基因和能力,根本不去思考如何根据既有的基础、收集整合更多数据,探索适合自身的商业前景。

实际上,任何一家媒体都有非常多可资利用的数据,对大众媒体而言,客户需求、用户反馈这些数据从来没有停止过积累,并完全可以用来指导新渠道的建设和新业务的开发。对行业媒体、区域媒体而言,长期在细分领域内的摸索,所沉淀的各种资源亦完全可以通过数据的形式做纵深扩展。

比如电视台,一直以来用收视率衡量内容、指挥广告,这本身就是数据运营的思路,当然,这是一种适合过去电视生态的、简陋的数据思维。今天电视台动辄运营数百个微博账号、数十个微信账号、各类APP 和视频网站,如能将传统电视收视率、微博、微信的粉丝行为数据、视频网站用户情况等数据打通、分析,用于指导内容的制作、版权的购买、频道及网站运营乃至广告新品开发,这些数据从体量上或许算不上科学定义中的大数据级别,但是不能否认其价值巨大,值得挖掘。

即使是惯常被看做大数据公司的谷歌、苹果、亚马逊、BAT 等,其日常工作中,也总是小数据处理为主,而非所有人都直接对海量数据进行分析。

媒体不应该将发展缓慢归结于缺少“大”数据支持,如果连现有的小数据都无法把握,面对大数据只能是更加无从下手。

(二)新媒体环境下的营销离不开数据,但数据不是所有问题的答案

广告界有这样一句话,“我的广告费有一半浪费掉了,但我不知道是哪一半”。不得不承认,大数据的确部分解决了这一问题,如RTB 一类的广告模式,能够在毫秒级的时间内对消费者的行为做出响应,实现广告的精准推送,并触发购买行为,自有其价值所在。在两年前,本文笔者之一黄升民教授就已经撰文指出,在营销体系中,大数据从媒体、消费者、广告与营销战略策划、效果评估四个层面影响了传统营销体系,也给营销体系参与机构赋予了新的力量与可能。[5]

但同时也要承认,广告界的这句话本就是一句伪命题。其背后隐藏着的逻辑是:只有当投放带来当期、等值的销量提升,才意味着广告费没有浪费。然而实际上,广告投放的效果是累积、渐变的,包含了消费者心理效果、行为效果、传播效果等多个层级,而产生的品牌效应等层面的价值提升,更不是简单的数据可以衡量。

而大数据这一概念和类似RTB 这种精准营销模型的出现,使得现今营销界俨然陷入了数据狂热,试图将所有的投放都置入现有的数据架构里,而不能框进去的营销手段,就选择性无视或者贬低。传统广告已死,就是这种论调的典型代表。

如上文所提到,在笔者调研的过程中,阿里妈妈事业部(阿里巴巴集团营销业务部门)的负责人提及,在淘宝平台上成长起来很多销量千百万的原生品牌,正面临着品牌建设的考验。然而长期以来淘宝提供给广大店主的数据营销工具,培养了这些企业根深蒂固的ROI、CTR 思维。在这种思维的指导下,陷入了降价求销量的死循环,无暇、无力进行品牌建设。

当传统媒体的营销效果无法纳入到既成的大数据体系中,他们被忽略了,这是令人遗憾的损失,因为既成的体系根本就没有解决,也不能弥补传统媒体在品牌建设、告知方面的价值,而市场上对品牌的呼唤又持续存在,在这样的背景下,还是要重新审视我们的营销架构。

不能否认,当下的新营销环境离不开数据支持,但也必须要说,现在的大数据,是不全面、短视的大数据,不足以支撑新营销的需求。

(三)业务盘活数据,而不是数据驱动业务

当数据越来越海量,我们能够通过数据认识市场需求。但是如何从海量数据中选择出有效内容,继而对有效数据进行精细分析,从而为业务所用,这是媒体运营者的价值和职责所在,而不是数据和技术力所能及。

很多媒体运营者一听到“大数据”这样的概念,脑中浮现出的往往是繁复的算法和服务器。实际上,媒体运营者身为一线的业务员,应该主动去利用业务优势盘活数据资产,而不是反过来,让数据去驱动业务。

原因在于,唯有媒体运营者才最了解市场需求,最能够看到业务和数据的契合点。谈及大数据的例子,Netflix《纸牌屋》总是被视为数据驱动业务的典范。事实上,在Netflix全站运营过程中,设定六万多个标签的规范以及对每一个视频内容打标签、再到某部电视剧拍摄过程中的选角、剧本修改等等,都是由编辑操盘,而不是交给机器决策。

不可否认,在大数据处理上,技术人员通过算法,能够过滤、分析出具有指导意义的结论,前提是媒体运营者给技术和数据一个方向。寄望于计算机专业背景出身的数据工程师提出在内容和营销上具有建设性意见的数据处理意见,绝不可行。

当然,要想让业务驱动数据,媒体运营者们还需要补课,让自己真正具备直面数据、操盘数据、融汇数据和业务的底气和储备。

(四)数据带来权力,同时意味着责任

数据带来媒体格局的变迁。无论在国内外,已经有几家公司逐渐站到了数据的制高点,凭借在数据方面的积累、处理能力,拥有了媒体领域内强悍的话语权。

比如搜索引擎掌握着网页排序的规则,对中小媒体有巨大的影响力;电商平台掌握着用户交易数据,同时进军物流、金融等领域,在线上线下交易中深深扎根;大型社交网站依托社交数据,几乎可以涵盖网民生活方方面面的需求。在垂直领域,视频网站、内容推荐网站等等,也正在加快凭数据换权力的步伐,试图成为小平台。今日头条即是一例。

平台既成,相关的规则随之而来。表面上看,大平台可以任意制定游戏规则,然而,凭借数据获得了权力,对数据生态就负有责任。对数据进行开放和共享是必然选择,否则就只能是不可持续的暂时垄断。

比如视频网站在后端聚拢了包括专业制作、用户自制等海量内容,前端聚拢了海量用户。对内容供应商而言,他们没有直接的渠道获得海量用户的大数据,但他们需要这些数据的支持。对视频网站而言,他们不直接从事生产,供应商是根本依托,就应该让这些数据为供应商造血。将所有数据都紧紧捂住,毫无意义。

事实上,媒体平台确实是在摸索数据开放的路径。另一个问题随之而来,数据开放的基础,在于平台自身的数据处理能力。如果自己尚不具备大数据处理的条件,即使开放了,对第三方的帮助也极其有限。身为平台,至少要能够成为一个大数据的“中央厨房”,为平台的依附者提供足够多且灵活的支持。

(五)国内外数据处理能力仍有差距,不应盲目乐观

从数据库概念开始,中国的媒体就在跟着国外的步子走,至今SQL、Oracle 还在中小型数据库中广泛应用;而大数据时代,绕不开的Hadoop 集群、MapReduce 引擎等技术源自谷歌实验室的开发项目。而国内各大公司和科研单位也启动了用于支撑非结构化处理的基础设施研发,如百度的云计算平台、中国科学院计算技术研究所的凌云(LingCloud)系统等[6],但是目前尚未看到广泛应用。

在最上层的数据可视化部分,2013年5 月,专门研发数据分析及可视化软件的Tableau Software 在纽约上市,融资2.5 亿美元,市值达到20 亿美元。该公司的主打产品Tableau Desktop 支持多种数据库,可以对数据从时间、空间、关系等维度进行便捷的可视化分析,而国内根本就没有出现类似的公司。至于百度、腾讯等公司开放提供的数据图表工具,还只是相形之下堪称原始的柱状图、饼图、折线图等套件。

在中间的数据分析、应用层面,对于海量数据,我们的几大平台又有何作为呢?苹果在最近推出的iOS 8 中内置Health Kit 应用,试图用数据重整医疗;彭博社的财经数据终端,每年收入达到30 亿美元;Netflix 为全站视频内容打的标签接近七万,拿得出《纸牌屋》这样响当当的作品,而优酷、腾讯视频、爱奇艺,这些背靠巨头乘凉的视频网站,拿得出什么内容?

或许国内的媒体,由于用户数量具备优势,在数据量上堪与海外公司相抗衡。但实际的数据产出,多是一些重在可视化的预测报告、数据新闻和夺人眼球的数据跨界概念。

笔者无意否认大数据的价值,但是在媒体运用大数据的过程中,还有很多问题值得思考。必须要直面这些问题,才能真正让大数据落地。

[1]官建文,刘 扬,刘振兴.大数据时代对于传媒业意味着什么?[J].新闻战线,2013(2):23 -27.

[2]李建中,刘显敏.大数据的一个重要方面:数据可用性[J].计算机研究与发展,2013,50(6):25 -40.

[3]冯 烨.电视可寻址广告的“读心术”[J].媒介,2014(11):40 -43.

[4]胡 慧.电信运营商:“掘金”大数据[J].媒介,2014(8):56 -60.

[5]黄升民,刘 珊.“大数据”背景下营销体系的解构与重构[J].现代传播,2012(12):13 -20.

[6]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2012(6):3 -16.

猜你喜欢
运营者内容用户
内容回顾温故知新
公众号再增视频号入口
网络运营者不得泄露个人信息
链接:网络运营者不得泄露其收集的个人信息
关注用户
主要内容
关注用户
关注用户
如何获取一亿海外用户
资讯网站低调而华丽地转身