刘逸帆+++肖婧为
源于上个世纪20年代西方的受众调查,自从1982年引入我国后,一直备受业界和学界的关注。历经30多年的发展,国内广电受众调查的技术日益成熟、市场日益规范,但数据篡改、数据寻租和数据滥用等问题一直没有根除。同时,随着互联网技术的发展和互联网使用的普及,受众获取广电媒体内容的方式发生了巨大变化。大数据概念的出现,为广电受众调查提供了另一种思路。在互联网高速发展的背景下,广电受众调查面临着新的挑战。
近日,记者就受众调查的引进对广电行业的影响、广电受众调查的现状、互联网环境下广电受众调查的新问题与新趋势、大数据对广电受众调查的价值与意义等问题采访了清华大学新闻与传播学院党委书记、博士生导师金兼斌教授。
记者:您认为,收听率/收视率的概念和调查方法引进后,对我国的广电行业产生了哪些比较大的影响?
金兼斌:就广电传媒行业本身来说,它需要了解自己节目的收听/收视情况;从做媒体研究的角度来说,需要关心传播效果。我想无论是印刷媒体还是广电媒体,在营利模式上最依赖受众的“二次贩卖”,即基于节目内容的受众品质(主要由其购买力等指标衡量)和规模,作为其在广告市场定价的依据。由此,广电行业的可持续性发展就需要第三方提供关于节目或者频道的收视/收听情况的数据,以了解到底有多少人在收听或者收看、如何收听收看等问题,这些数据是广告主进行广告投放的关键考量指标。受众调查的内容和方式具有国际通用性。
引进规范的受众调查,对我国广电行业有两个方面的作用。一方面是收听/收视“到达率”的统计,这些数据对了解一个节目实际的社会影响和效果是非常有必要的,特别是对节目或者频道各方面的评价,基于受众调查就有据可循。这种关于收听/收视的“到达率”主要是面对普通受众的调查;另一个方面是节目的“美誉度”,它与“到达率”是两个不同的维度。对于广电节目来说,除了收视率调查以外,也会有专家对节目进行更为细致的分项评审和评价,包括节目内容的思想性、艺术性、创新性、趣味性以及节目内容编排方面的专业性、规范性以及创意特色等。
从这两个方面,我们对节目品质的评价,就会相对比较全面。通过对节目传播效果进行不同层面的受众调查,社会、公众和媒体自身就可以从多个方面、不同角度来综合评价一个节目,而不是单单依靠收听/收视这个单一指标。显然,受众调查的执行方,需要是独立于媒体和广告主的独立的第三方,以保证其客观性和公正性。
记者:您认为受众调查中有哪些因素会影响受众调查结果的有效性?
金兼斌:从受众调查的实战性角度分析,受众调查数据的有效性主要取决于测量指标体系的设计和抽样的方式这两方面,这是核心。这里先谈谈测量指标体系的选择问题。
从测量指标体系的设计这个方面来说,主要需要考虑节目内容的传播体系,以及受众的信息接受方式。其中,受众信息接收的方式近年来发生了很大的变化。比如:以前主要的传播渠道就是广播,几乎每家每户都有广播,生产队动员和宣传也靠大喇叭。在那样的传播环境下做受众调查,其受众数据收集主要基于广播这一单一媒体的传播形态。但是,现在一个节目有很多的传播渠道,不同的受众有多种信息接受方式,因此,测量指标体系就会有很大的差异。AC尼尔森(Ac Nielsen)和央视-索福瑞已经认识到单一的电视收视指标无法准确反映媒体或者节目的收视效果,因此逐渐将社会化媒体上的相关讨论和评论作为辅助指标纳入其节目效果的测评范围。
这种收视调查基本内容和框架的调整,体现了现代媒体的立体传播特点和社会属性。在社会化媒体上衡量一个节目的影响力,至少应该考虑三个维度。第一个维度是节目播出的平台或终端,它是单一平台还是多个平台。以广播媒体为例,现在的广播节目可以通过收音机收听,也可以通过网络收听,还有手机、iPad客户端等多种渠道,因此,在统计数据的时候只依靠收音机的收听情况是不全面的。第二个维度是节目收看/收听时间范围的确定,就是说,现在很多人收看或者收听节目并不是实时收听的,他可以将喜欢的节目收藏下来,十天之后再收看或者收听,因此不能只考虑节目播出的那个时间段,可能有一个时间滞后的问题。换言之,我们对媒介内容的消费可以根据自己的日程安排更加灵活多样。第三个维度是节目传播过程中节目形态是否发生了变化。很多节目为了适应受众时间的碎片化,将原来30分钟的节目拆成了很多片段,或者重新编辑,添加了导语和字幕等,这种节目形式的受众到达率也体现了节目的传播效果,我们要考虑由此带来的节目多个层面的影响力。
就媒介测量而言,谈论节目内容的效果或者影响力,必须落实到具体的操作性层面上,需要做很多的界定。
记者:您如何评价目前广电受众调查的现状?
金兼斌:我想发展的大趋势应该是越来越科学合理,涵盖多种终端的调查方法会逐渐取代旧式的调查方法。现在网络调查在技术上很容易实现,在得到网络用户认可的前提下,网络软件可以轻易监测获得用户的网上音视频节目收听收看行为数据。这些数据量都非常大,完全可以把这个人的网上音视频媒介消费行为描述出来。当然,这种方法只能了解其通过网络进行传播的效果,而不是节目的总体传播效果。
传统的广播收听调查一般还是通过记录仪,或者基于电话调查,定期搜集受众的收听数据。同样的,电视收视的数据统计也主要依赖样本户安装的收视记录仪所记录的收视行为数据。这些调查方式是否有效,取决于抽样的方式。比如先将受众分层,按比例抽取后上门调查,这种方式较为科学,当然成本相对较高。与之相比,街头拦访的方式就不太科学,因为它完全是随机的,是一个非概率样本,其调查得出的结果无法推断到总体。
关于抽样调查和非抽样调查的差异,有一个很典型的例子。美国前总统克林顿与莱温斯基丑闻期间,当时美国有一个很有名的网站(MSNBC)发起了一个关于克林顿应不应该下台的在线调查。一周内参与网站调查的大概有20万人,其中75%的人认为克林顿应该下台。与此同时,《华尔街日报》与美国全国广播公司(NBC)合作的一个传统的民意调查机构,通过对全美2000个民众的抽样调查发现,67%左右的人认为克林顿不必下台,换言之认为克林顿应该下台的只有三分之一。那么这两个结果,到底哪个代表全美公众的意见?一定是后面那个。因为它是概率抽样调查,结果可以有效推断到总体,且抽样误差很小,数据具有稳定性。2000人的抽样调查,它的抽样误差率大概在2%左右,这是最大可能的误差,可见以其所得到的结果推断总体即全美民意,是相当可靠的。相反,那20万网络调查参与者,由于属于自愿投票,他们可能只是MSNBC网站愿意发表意见的部分用户,完全不能代表全美民众的人口结构,因此,这20万人反映的只是特殊的一部分人的意见,无法有效推断整个美国公众的意见。
记者:收视率/收听率调查中存在一些诸如数据篡改、数据寻租和数据滥用等问题,您认为这些问题应该如何解决?
金兼斌:调查行业中的数据质量问题,说来说去万变不离其宗,一取决于样本的质量,二取决于测量的指标体系是否合理,这两项决定了后面的数据,最后就是对数据的解读。哲学家尼采说过,世界上本没有事实,有的只是解读。我们不能静态、孤立地来看一个数据,而要把它放在某一个参照系里面解读才有意义,不同的参照系可以解读出不同的结果。比如收视率0.2%,如果从历史的角度来说它可能是比以前高了,但如横向跟其他节目比,它可能又很低。
调查中存在的数据篡改等问题涉及第三方的数据公信力。我们都知道尼尔森在日本的市场上曾经被揭发出数据有问题,之后被迫退出日本市场,所以数据的公信力是调查行业的生命线。比如要和样本户签订保密协议,避免他们受到各种因素的干扰,确保样本质量,这是支撑数据有效性的基本前提。同时在指标设计上要注意合理性,指标定义要明确合理,具有测量的可操作性。通常,要想较为完整地评价一个节目,需要多个指标,简单化的单一指标有时会掩盖问题或者误导相关利益方。
通过样本的数量大概能判断调查结果的可靠性和误差率,样本越小,得出来的结果越不稳定。媒体在委托第三方来进行数据收集的时候,最好要了解甚至参与抽样过程的设计把控,确保抽样的质量,在原则问题上(如是否概率抽样等)不能妥协和简单化,这对数据结果的影响是很大的。
记者:受众调查时在考虑社交媒体的收听/收视情况时,如何避免您提到的类似克林顿与莱温斯基事件中的网络调查数据偏差?
金兼斌:我认为网络调查、受众在网络上的态度反馈等数据不应作为唯一的媒介效果衡量指标,它只能作为一种补充。另外,社会化媒体本身的数据类型也很多,需要注意区别。比如浏览量PV①,用户每1次对网站中的每个网页访问均被记录1次,同一个人如果在计算时间周期里反复访问同一个网页,浏览量数据都会增加。与此相对的一个指标则是浏览人数或UV②,这个指标中,计算周期里一个人多次访问,都不会重复计算,即其统计和反映的是相关网页内容到达的用户数。对浏览人数的分布进行分析,可以揭示用户的集中度。因此,我们在考量这些数据的时候要注意指标含义的区别。
获取网上用户的媒介消费数据有多种途径。但是基于数据挖掘获得的用户媒介消费数据只能作为了解部分用户的部分媒介消费行为,而不是全部用户的完整媒介消费行为勾勒。就数据挖掘得出的结果而言,不同的渠道、不同的参照系,结果会有很大差异,每种结果都不能保证一定是客观、全面的。正因如此,在我看来,大数据时代的受众调查,至少在逻辑和思路上,还没到可以抛弃传统抽样调查方法的时候。至少,基于合理抽样的用户调查结果,可以有效推及总体,为其他方法的调查提供进行比较的参考基准。
记者:受众调查最直接和最主要的目的是为了检验传播效果。现在,从受众角度来看,主流媒体的舆情引导效果如何?有哪些新的特点和趋势?
金兼斌:有些人对主流媒体和主流媒体的传播效果存在刻板印象,认为其收视率不高,这个结论或许是不准确的,至少是不全面的。比如,从央视-索福瑞和AC尼尔森提供的收视率来看,中央电视台《新闻联播》的收视率仍是很高的。
受众喜欢的节目首先跟受众的生活要有相关性,这一点特别重要。其次在于报道的形式,有时候大家对主流媒体的节目编排和表述方式会产生某种反感,其中一个原因可能就是受众对说教报道的排斥。所以报道的形式应该不断有所创新。实际上这些年我们也做了很多的努力,采用不同的视角报道各类社会热点事件,比如老百姓现身说法、专家讲解等,但报道形式的创新总体上仍显不足。实际上,我们的主流媒体的报道、政策的传达跟老百姓的生活息息相关,但有时候受众下意识地把这些内容给忽略了。在实际生活中,经济地位越高、生活质量越高的人,对时政类信息的兴趣也越高。
这就是传播学中知识沟的概念。不同的人的受教育程度和媒介素养不一样,其媒介消费内容会有差别,久而久之,媒介消费带来的影响也会有很大差别:对有些人而言,媒介是赋权工具;对有些人而言,媒介则成为无所作为、生活沉沦的漩涡。传播学者早就发现,受教育程度高的人,或者社会经济地位高的人越倾向于关注时政类新闻。社会经济地位较低的人,越有可能以娱乐性内容的消费为主。
从节目的传播效果来说,主要取决于受众媒介消费的时间和状态。有时人们需要严肃的、信息量大的节目比如《新闻联播》,同时人们也需要轻松的娱乐性内容。因此,需要媒体认真研究受众本身的特征和需求,根据不同渠道反馈的报道效果,分析节目的类型、时间段安排、编排方式等问题,进行合理的定位。不同的选择会导致收听率或者收视率的数据产生巨大的差别。
主流媒体有其独特优势,特别是其内容的提供能力强、可信度和公信力较高等,但是传播形式比较单一常常被认为是其短板,如果在这方面做出改变、有所创新和突破,相信受众的接受度也会上升。比如@新华视点、@人民日报,不仅在微博上的受关注度很高,而且还成为社会媒体话题的主要议程设置者,通过多级传播影响更多的人。因此,对主流媒体来说,一方面要在内容上、传播方式上贴近普通群众,甚至可以草根化一点,让民众产生亲近感;另一方面,不仅要提高粉丝的数量,更要注意多级传播的影响力,注意对有影响力的人即意见领袖的定向传播和双向互动,和意见领袖建立比较好的信任关系、合作关系,有效提升传播的效果和力度。
记者:网络的出现使媒体的形式越来越多样化,比如通过微信、微博传播、通过客户端推送消息等。在互联网环境下,如何通过调查全面了解受众的情况呢?
金兼斌:这个问题涉及如何判断一档节目的综合影响力,不能简单依靠任何单一指标的数据,也不能通过不同渠道测得的数据而进行简单相加。从理论上讲,在调查之前,要考虑很多因素,比如节目的不同传播平台和传播方式等。
这里面主要有两种思路。第一种思路就是把各种可能的因素和指标,都纳入到综合效果评估模型中。其中有一个指标合成的规则问题:不同的数据不能简单地相加。比如一档直播节目,可以看电视,也可能通过网上图文直播,两者对受众的冲击和影响可能不一样,那么是否图文浏览量要乘以一个小于1的系数?这里涉及到每一个指标在总体效果评估模型中的权重设计。操控数据有两个基本途径,一个是对数据本身的操控,另外一个就是对数据合成算法的操控。两者都会对结果产生很大影响。
如果涉及的因素十分复杂,真的考虑不过来,就可以参考第二种思路,就是对目标受众做抽样调查,然后进行访谈,这个是最直接的。当然理论上也有问题,因为访谈的结果和被访者当时的状态有很大关系,他可能想不起来了或者不一定说实话等,或者他对节目的评价取决于一些不可控的因素,如当时的心情。但是汇总上来的数据,理论上来说仍是比较可靠的。我们现在有时候盲目崇拜大数据,但是,大数据的规模大并不必然保证数据反映真正的总体的有效性。在很多情况下,也许小数据的调查结果更加可信,当然前提是抽样要合理、指标设计得当。
记者:您刚才提到的不要盲目崇拜大数据,大数据不一定有效的原因是什么呢?您认为,大数据对广电受众调查研究有什么作用?
金兼斌:大数据如果真的是大而全是没问题的。抽样调查的方式是以少推多,即希望基于小样本能够推断出更大规模的总体的情况,因此抽样时必须基于对总体情况的清晰认识和了解。大数据最大的问题在于,撇开数据的规模,我们是否说得清楚它实际的边界是什么,它理论上应该反映的边界是什么,两者有没有差异,差异有多大。
就像前面提到的克林顿与莱温斯基的例子,20万人比基于概率抽样的2000人要多得多,但是20万人不能代表美国民众,而基于概率抽样的2000人则可以。大数据所挖掘到的数据,是针对媒介消费行为痕迹的,通常有技术门槛要求,比如手机移动终端的相关数据,只有智能手机的使用者,他的数据才能被挖掘到,一定程度上就排除了一部分使用普通手机的用户的媒介消费数据。网络也是如此,有些信息开放的社交媒体平台,我们可以挖掘到用户的使用数据,有些平台其API(应用程序界面)不对外开放,要想完整地挖掘和获取用户使用行为数据,就会有很大问题。
进一步考虑,大数据还有一个问题:它挖掘到的数据能否进行有效处理。比如网络上大量的文本是否含有网络水军或者推手的搅局文本?一个人有多个不同的账号时如何区分等。网络上有很多不发表意见的沉默大多数,因此一条网络意见的背后可能代表着很多人的意见,数据分析如何加权以体现这种差别?网络上的反馈虽然很直观,但是也可能迷雾重重。
当然,大数据分析的确能揭示很多东西,能够敏锐地反映大家对某一事件、社会热点或者议题的群体性意见倾向。受众调查需要利用这种新的手段和思路。我觉得在现阶段,可以把大数据分析和传统的受众调查结合起来,相互补充,或者对大数据的分析结果和抽样调查结果做一些交叉验证和比对。简而言之,大数据有它的优势,但也有使用上的较高要求,因此不能盲目相信基于大数据挖掘的结果,因为有时候“大”不一定有效。