文|曾凡斌
(作者为暨南大学新闻与传播学院讲师,中国人民大学新闻学院博士研究生,本研究是2012年广州市哲学社会科学发展“十二五”规划课题一般项目“互联网使用时间、使用方式对现实政治参与的影响——基于对广州市网民的实证分析”,项目号为2012YB31)
随着博客,微博,社会网络网站,云计算、物联网等技术的兴起,数据正以前所未有的速度不断增长,于是出现了“大数据”时代。“大数据”不仅是科研的热门课题,也是产业界的热门,更受到其他各界的密切关注。2008年9月自然杂志发表一组文章“Big data:The future of biocuration”,“Big data: Wikiomics”, “Big data: Distilling meaning from data”来探讨大数据的出现。科学杂志在2011年2月推出专刊,主要围绕着科学研究中大数据的问题展开讨论。2012年3月,美国奥巴马政府发布了“大数据发展计划”,计划在科学研究、环境、生物医学等领域利用大数据技术进行突破。“大数据”(Big Data),指信息或数据量的巨大,数据的单位,已经从G和T发展到P、E、Z等为计量单位,其中1TB=1024GB,而1ZB却等于10亿TB。如此庞大的数据将对传统媒介经营管理方式产生什么影响?传媒又应如何应对它呢?
传统的媒介经营管理方式或者是建立在经验的基础上,或者是建立在传统数据基础上,如抽样获得,通过财务软件获得,这样的数据往往是结构化的数据,或者是有关联的数据,是管理员按照事先设定的程序获得的。如调查读者,听众,网民可通过严格的随机抽样获得,并且通过样本来推断总体,而对于传媒内容的财务数据则可通过财务软件了解进,销,存,工资,成本,收入,利润等多种经营数据,以满足对数据的分析和决策。
然而,“大数据”通常为非结构化数据,并包含彼此可能无关联的数据集,例如来自各种独立数据流(如Twitter、社交网站、传统CRM、调查结果、人口数据、缺陷数据等)的数据,这不同于通常彼此相关的传统数据集。于是,“大数据”分析通常会突破传统数据库以及分析流程和系统的界限。首先,数据集规模可能过大;其次,数据集彼此无关联;最后,“大数据”需要极为快速地分析。分析这些“大数据”,传统的方法和人才就不能适应新的需求了。分析大数据,就要依赖新兴技术(如Hadoop Map Reduce)、R统计语言,以及并行多处理、高速联网、快速I/O存储(包括基于闪存的新兴存储)等全新的高性能基础架构解决方案。此外,大数据分析还需要新型技术工作者:数据科学家,甚至是数据艺术家。为此,传媒就要采用新的技术方法和使用新的人才才能适应“大数据”的要求。
对“大数据”的分析使传媒经营管理者实时的了解环境内外的最新最全的信息,并从中得出大量深刻见解,改善经营管理的水平和方法。例如,Farmville的制作公司Zynga每天生成超过15 TB的新数据,并通过对玩家行为的持续数据分析结果,测试、调整和优化游戏中的特性,其实现了鼓励玩家行动起来,以促进玩家针对游戏的种种元素支付真正的钱,并保持玩家对游戏的兴趣。于是,虽然在线游戏Farmville是一款非常简单的游戏,但是由于其背后有着对大数据分析的支持,其也能不断的飞速发展。当传媒管理者对数据有较为完善分析能力时,其对事件的把握及预测能力就会增强,通过对大数据分析、预测会使得决策更为精准。
经营管理就是决策,决策需要信息。决策过程实际上就是一个信息输入、信息输出及信息反馈的循环过程。应对大数据的挑战,媒介经营管理需要在新闻生产、受众调查、效果研究等方面进行创新。
媒介经营管理首先离不开新闻生产,传统的新闻生产无奈于依靠作者的采访和编辑的加工,评论等,但现在新闻生产的创新也可利用大数据了,大数据时代数据成为新闻的核心资源之一,数据不仅可以作为新闻报道的内容,数据对于某个事件发生的原因、状况的揭示会比记者的观察与调查更准确,更有说服力。例如,英国《卫报》解读2011年骚乱的事件,除了采用常规的社会科学研究方法,如采访调查外,还请了曼彻斯特大学的专业人士对250多万条的与骚乱有关的Twitter信息进行大数据的分析,在此基础上做成了《暴徒的告白》,这个信息量是非常大的,包括抓取微博的信息,网络上的信息,如果没有大数据的分析方法,是不可能实现的。通过大数据生产的新闻往往给用户提供耳目一新的新闻感官和认识世界的图景。
其次,媒介经营管理离不开受众的调查,受众调查的创新也可利用大数据,与传统的抽样调查相比,媒体可以利用大数据更为精确辨识到受众群构成及其特定阶段的具体需求,可以据此阶段性地调整新闻生产中各类信息的权重,针对性地提供新闻信息服务、增加客户粘度。例如,爱点击iClick自主研发的XMO受众解决方案(XMOAudienceSolution)可以接触到最细分的受众。爱点击iClick与上百营销者合作推出上千个在线营销活动,并在过程中累积了上亿的受众数据,结合第三方数据,强强联合推出22种精选细分受众群体。这些受众群体按行业(例如:旅游、银行、金融以及教育)、生活方式和兴趣(例如:性价比追求者、商务人士、吃货等等)划分,以切合广告主不同的需要。《美国新闻业2011年度报告》报告认为,在媒体市场已成为买方市场之后,用户决定着哪些内容以哪些方式呈现。媒体业的未来属于那些“既懂得公众不断变化的行为,也能准确投放内容,并将广告按每个用户偏好投放的人”。因此,利用大数据来进行受众调查的创新有利于促进媒介经营管理的精确化。
最后,效果研究的创新可利用大数据,效果研究是传播学研究的重点,也是媒介经营管理关注的重点。受众接触了媒介尤其是广告信息时候,其认知、情感、态度、行为如何发生变化,传统的问卷调查采用受众的自我报告难以获得精确的信息,控制实验往往又是在小群体中进行,难以真正的推进到总体。而大数据下的数以亿计的高速度、低成本的运算器,计算机,传感器,网络平台使得获得准确的受众效果数据成为可能。这方面一个重要的例子是美国的Facebook,由于数以万计的Facebook用户的个人信息,个人习惯都在网站中出现,所以Facebook可以通过大数据分析后再将其卖给企业,企业再根据每个人的特点投放最个性化的广告,于是,当网民使用Facebook时,他(或她)只会看到自己最想看的广告,从而实现传播效果的最优化。
总之,只有通过媒介经营管理这几个方面的创新,才能真正使得媒介的经营管理方式由经验型向科学型管理转变。而基于大数据的科学型管理必然是精确、全面、立体而富有预测性的。
在“大数据”的环境下,媒介经营管理怎样才能实现由经验型向科学型管理?这就需要进行数据挖掘,从“大数据”中寻找规律,才能为科学型的媒介经营管理奠定基础。数据挖掘出现于20世纪80年代后期,90年代有了突飞猛进的发展。美国麻省理工学院在2001年1月份的《科技评论》(Technology Review)提出将在未来5年对人类产生重大影响的10大新兴技术,其中第3项就是数据挖掘。
数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
数据挖掘已经在企业的经营管理中发挥了很大的作用,而我国的传媒经营管理也开始利用其为管理服务。例如,作为北京地区有线广播电视网络的建设开发、经营、管理和维护的运营商——歌华有线,其正在建设的呼叫中心系统,专门引入商业智能,实现信息数据的深度挖掘,并以报表、图形的方式对大量的数据信息进行实时的网络在线分析,为歌华有线的业务经营提供了有力的分析工具。而新华社2008-2015年《工作设想》就有关于数据挖掘的思想,如在关于多媒体数据库建设目标中明确提出要强化搜索查询功能,提高搜索查询速度和准确率的思路。
在网络媒体的经营管理中,数据挖掘技术更是建立在博客、微博、社交网络网站这些网民行为的大数据基础上。例如,腾讯拥有超过7.52亿QQ即时通讯活跃账户,1亿微信用户、4.25亿微博用户和超过1亿的视频用户。在积累了个人用户多方面的海量数据后,2012年腾讯提出了“大数据营销”的概念。腾讯网总编辑陈菊红表示“将从这些海量数据中挖掘、分辨出用户的行为模式、兴趣偏好等,打造专属于每个人的智慧门户。”腾讯不仅在各大产品线中都设置了数据挖掘团队,还在和一些第三方数据挖掘公司、营销公司展开合作洽谈,充分挖掘用户在网上的行为、关系、UGC(用户产生的内容)等数据,“通过合理的方法找到对企业有帮助的数据,并且将营销预算合理的分配在为数众多的数据来源平台上”,从而提高营销效率。
“大数据”通常是非结构化数据,通过数据挖掘技术在非结构化的数据中获取规律性的东西,应该是管理者梦寐以求的,也必然会对管理思维、管理方法、管理手段带来变革性的革命。传媒是一个典型加工信息的组织,在加工信息的过程中,必然会接触到大量的数据,在传统的经验管理中,对数据的忽视或者先入为见的猜测,都带来过深刻的教训,后来在抽样技术,统计分析的支持下,虽然可以分析数据的结果,但其往往是结构化的数据,面对新媒体所带来的非结构化的大数据,需要利用更为复杂的数据挖掘技术才能显示现内部的规律,使传播效果达到最优化,而复杂的数据挖掘技术则需要建立更为先进的分析工具和分析人才的基础上,惟其如此,大数据才能真正的引领一场管理革命。