黄智锐
大数据时代,数据科学让人们越来越多地从数据中观察到人类社会的复杂行为模式。广电大数据涉及的内容非常广泛,既有生产业务系统数据,又有运营数据、收视数据,还有来自双向有线网络的用户数据,以及新媒体平台的互动数据、社交媒体数据等,形式多种多样,有文字、图片、视音频。随着渠道不断拓展,数据形态也发生了变化,从以往的结构化数据向非结构化数据转变。从数据采集渠道来看,主要有三大来源,分别是广播电视台、有线网络公司和第三方合作伙伴。
广播电视台通过传统媒体制播业务产生大量数据,如广电新闻具有不可替代的权威性、公信力和影响力,拥有真实、快速的社会事件动态和舆情数据;播出传输环节产生丰富的频道频率版面节目信息数据,也是重要的EPG数据基础;广告营销掌握整体市场动向,形成了一套体现频道、栏目价值的数据体系;在影视剧购销过程中,围绕一部影视作品所产生的信息汇聚后,可重新整合成包含多维度的产品数据。在媒体融合的趋势下,广播电视台纷纷建立各自的互联网新媒体产品,进一步优化内容传播的最后一公里。通过网站、微信、微博、客户端等,传统媒体采集和积累了海量用户数据,并逐渐形成清晰的用户画像。
有线网络公司作为广电运营商,目前用户数已达2.4亿户,数字化率超过87%,系统内有丰富的数据资源,包括网络建设相关的支撑数据、客服数据、行政数据,更有各种来自有线用户的账务、行为数据、认证数据等。有线网络的大数据来自于实时系统,没有人为干预,是最底层、最真实的数据。大量数据背后隐藏着用户行为习惯和喜好等信息,用户规模使垂直化的数据变得更有价值。
广电媒体通过与第三方公司合作,将传统收视率调查、在线研究、手机测量等结果整合,掌握了涵盖广播、电视、电脑、手机等多终端的全媒体数据信息。虽然收视率本身看似只是一个简单的数字,但其背后却有着一系列科学的样本采集、测量统计等数据基础。在电视机主导的时代,以央视索福瑞为代表的收视率调查公司利用安装在样本户家里的收视率测量仪采集收视数据,通过处理分析得出收视报告。在跨屏时代,由于受众收视行为具有多场景、自主碎片化和多任务整合化的特点,受众测量从电视受众测量向视频受众测量升级,数据采集手段也相应调整,结合各视频网站和互联网数据分析公司的统计数据成为主流。此外,社交媒体对于传统媒体节目的收视情况具有日益重要的影响,因此对其针对性的收集数据并进行调查和测量有助于全面了解节目的传播效果。
现在各行各业都在为大数据而兴奋,因为大数据已经对人们的社会生活产生了重大影响。广电行业对大数据技术并不陌生,早在十多年前就已围绕收视统计分析和双向网络改造等提出了大数据概念,但由于各种原因,迟迟没能结出硕果。这些年,广电行业正遭受前所未有的挑战,新媒体新技术的冲击给传统广电业务带来巨大压力。广电系忙于应付纷繁复杂的外部环境,进行各种资源整合与架构重组,通过公司化、联盟化等手段搞活机制,冲出困局。
此时,互联网企业把握时机,紧锣密鼓地通过各种手段收集加工数据,效果比广电更快、狠、准。这些公司凭借自身互联网技术的专业性和业务灵活性等特点,快速部署,迅速落地了诸如智慧城市、智慧医疗、平安社区等基于大数据运营的项目,更有大举进军媒体业务之势,他们对数据的追求更积极,意愿更强烈。
反观,虽然广电内部不时传出各种大数据联盟、数据产业公司等成立的消息,但往往是雷声大雨点小,一部分仅仅是参与感的结合,落实规划和全面整合力度有限,庞大的用户基数并没有发挥出应有的效果。此外,行业内对数据价值的利用进展缓慢,前期积累起来的经验和优势逐渐被消弭,被超越。广电大数据先发优势逐渐丧失,这几年广电并没有产出有效的数据化产品,导致广电在数据运营方面的价值空间下降。
完整性、准确性和连续性,是广电大数据的特点,也是其价值优势,如何运用互联网思维拥抱大数据,为广电行业带来春天呢?大数据科学里有三句话,分别是“软件定义一切”“数据驱动未来”“算法统治世界”。软件是一切的基础,不仅指计算机软件,还包括运用这些软件的人才。数据时代已经来临,要发挥大数据的强大威力就必须学会如何从海量的数据中发现知识,寻找隐藏其中的趋势、模式、相关性和应用方法。数据越多往往越让人不知所措,最难的是要懂得通过怎样的维度去看怎样的结果。
当前,对于广电大数据来说,要像其他互联网巨头企业那样提供单一的工具化、社会化服务,显然优势和能力都不足够,但在垂直化应用方面却是一片天地。有效应用大数据,不但可以提高节目生产效率,实现媒体多维度的交互呈现,促进构建多元化媒介的新生态,给广播电视台带来全新的制播方式,还可以为广电有线网络带来全新的服务体验和发展空间。在节目制作方面,策划和推广可以通过采集分析观众喜好、特征,有针对性地创作内容和传播方式,在播出阶段,通过互动数据,节目组能及时掌握来自各种渠道的观众反馈信息,播后通过深入的数据分析,进一步调整和优化节目内容。在广告营销方面,大数据可以助力构建适应媒体融合发展的支撑体系,实现广告定价、精准投放、传播监测等。有线电视网络公司通过基于双向数字电视机顶盒回传数据进行收视数据研究,样本更大,分析研究更为精准、客观,数据结果也相对权威、可靠和及时,并可将传统数据调查方法与广电行业大样本收视数据相结合,提供多维度个性化报告。随着新媒体的发展,内容碎片化、媒体分众化趋势更加显著,消费个性化的同时,更需要利用好数据分析。被大数据催生的数据新闻模式正被热捧,这类新闻具有数据公信力基础,用数据说话,不会带有偏见,而且这些数据新闻往往加入了大量可视化元素,对媒体而言,达到了科学与艺术融合呈现的效果。
数据挖掘和应用往往具有实时在线、边生产边应用的特点。在一些可落地的产品上先行先试,让一线团队了解数据的价值和关联,从而对数据资产实现进一步的定义和变现。做好数据分析,人才是基础,大数据不是一般人能学会的,一定要有IT技术基础,因此大数据团队更多是偏向IT方面的人才。广电大数据虽然经过了十多年的发展,但对大数据的理解相对保守,数据分析能力不强。这是因为业内缺少专业IT技术力量,对数学算法的掌握能力不足,受限于对业务的理解和场景模型的设计能力。近年来,各地广电通过内部“创业”,组建专业化子公司,或者采用外包合作等形式,人才缺口问题得以缓解。
其次,如果把大数据比作一种产业,那么这种产业实际盈利的关键,在于提高对数据的加工能力,通过加工实现数据的增值。把数据从生产系统中抽取出来,对这些数据进行结构化清洗、转换、整理、加载、分发,用于数据分析和统计,将会是一笔巨大的开销。所谓“数据驱动未来”,打通数据孤岛,实现数据融合,并重新对数据进行全面的多维度整合,从而产生更多数据集合。社会的变革不是正态的,而是靠转折点去改变,帮人们快速从数据海洋中寻找到这些拐点,靠的就是算法,所以说“算法统治世界”。如果能够了解造成拐点的原因,很多问题将会迎刃而解,数据价值得以最大化体现。