■ 李思屈 诸葛达维
(作者李思屈系浙江大学传媒与国际文化学院副院长、教授、博士生导师,数字娱乐产业研究中心主任;诸葛达维系浙江大学传媒与国际文化学院博士研究生,浙江传媒学院媒体传播优化协同创新中心助理研究员)
认知神经科学方法在媒体效果测评中的应用研究
——以电视剧收视率预测为例
■李思屈诸葛达维
如何科学有效测评媒体传播效果,为决策提供依据,一直是媒体传播效果研究的重要议题。收视率作为影视剧市场评价中常用的客观指标,时常出现与主观评价结果不一致的情况,“叫好”与“叫座”的矛盾一直没有得到很好地解决。针对这一现象,需要理解受众是如何思考的,在此基础上进行科学合理地效果测评方能做出科学决策。认知神经科学的兴起为深入认识受众心理认知机制,服务媒体传播效果优化提供了新的视角。在介绍认知神经科学在影视剧效果测评中的现状基础上,以眼动实验为例介绍该方法在电视剧收视效果测评中的优势与作用,为探寻媒体效果测评提供了新的方法与实证案例。
认知神经科学;传播效果;眼动;电视剧;收视率
电视作品的市场评价一直以来是媒体效果传播研究的重要议题。现行综合性的电视作品评估体系一般分为三种指标:客观评价指标、主观评价指标和收益指标。①客观评价指标是从传播效果“量”的层面进行评估,收视率就是其中一种广泛运用于节目质量评估的客观评价指标。主观评价指标是从传播效果“质”的层面进行评估,目前电视台常用的主观评价指标主要通过专家打分、领导打分、观众打分获得数据。收益指标是从电视媒体的两次售卖行为层面评估节目在广告市场上的传播价值,其数据来源于节目投入产出的核算和节目广告的承载和回报。②在三种评价指标类别中,客观的收视率评价指标与主观的打分评价指标是受众较为关心的两类传播效果评价指标。然而在现实中,客观的收视率数据与主观的满意度打分评价结果经常出现不一致的情况。某些电视节目和电视剧播出之前的专家评价很高,但播出后的实际收视率却不理想;有些电视节目和电视剧播前无人问津,但播出后的收视率却节节攀升。“叫好”与“叫座”的矛盾值得思考。
要破解这类传播效果评价中的矛盾问题,我们不仅要对现有媒体效果测评方法进行反思,而且要对受众在观看媒体内容时是如何思考的这一心理认知机制进行研究。只有在充分理解传播效果发挥作用的受众心理认知机制的基础上,我们才能更好地进行媒体效果测评研究,为媒体传播优化提供科学指导。
受众如何思考是传播效果研究的重要议题。任何传播效果的实现都以心智对信息的认知加工为基础,而宏观层面的传播效果是微观层面的心理机制对符号认知加工的长期结果。因此,对受众如何思考的微观认知机制进行研究,有助于我们更好地分析与预测传播过程的宏观效果。
(一)传统传播效果研究方法的局限
在传播研究中,传播效果通常是指受众接受信息后,在认知、情感、态度、行为等方面发生的变化。传播效果研究的测量方法主要分为言辞的、生理心理的、行为的三种形式(Bradley & Lang,2007)。目前常用的传播效果研究方法主要是言辞的、行为的。这主要因为传播效果研究的传统来自于美国经验主义,即采用调查问卷、内容分析、访谈与行为观察等方法对受众的传播效果进行测量研究。这些研究方法在传播效果研究的历史上取得了一定的理论成果,如议程设置、第三人效果等。这些理论成果主要集中在分析解释传播效果的宏观结果方面,而对传播效果产生的微观心理认知机制的探讨不多。“也就是说,研究者只是通过基于经验性研究的结论来推测传播结果产生的原因,至于这种传播效果产生的内在机理——人脑究竟是如何处理信息的,则无从得知。”③
在心理学中,关于认知、情感、态度与行为等效果的测量主要可以分为外显测量与内隐测量。外显态度测量主要探测的是显意识层面的易于用语言与理性表达的认知与态度;而内隐态度测量主要探测的是知觉阈限之下的潜意识层面的认知态度与感受。现代科学研究指出,对于态度评价等主观感受方面的问题,通过意识层面的语言表达与逻辑解释所得出的结论往往不可靠——因为多达95%的思维过程都是在知觉阈限之下的潜意识中发生的,“这种潜意识来源于一些我们意识不到而且无法表述的认知过程”④。传统的基于言辞表达的问卷与访谈测量方法大多只能测量人们显意识层面的阈上知觉与态度,而对占认知资源绝大多数的潜意识阈下知觉与态度的测量则较为不利。诚然,利用严谨的问卷和周密的访谈有时确实可以发现受众对于一些事物的态度与情感表达,如果这种态度与感情便于决定且易于表达。“相对于人类系统而言,阈上知觉可能只是非常微小的,有时甚至不很重要的部分。”⑤也就是说,我们通过传统的问卷调查、访谈等基于言辞的、行为的测量方法所看到的只不过是“冰山的一角”。这就造成了电视剧测评中专家打分、受众问卷等主观调查结果与客观收视率指标之间不匹配的现象。在没有充分理解受众如何思考的前提下盲目开展传播效果研究,其结果往往不可靠,“消费者所表达的只不过是经理人认为消费者应该正在思考的那些东西。”⑥此外,一些不够严谨的主观态度调研因为存在着明显主试者效应,而使得调研结果不够客观公正。被调查者很可能会碍于主试者的面子而给出主试者期望获得的结论。正如著名的神经科学家约瑟夫·里都克斯(Joseph LeDoux)教授所说,“当我们把基于自我内省式的汇报当作科学依据时,必须格外小心。”⑦因此,了解受众如何思考对于我们科学有效地进行媒体传播效果测评具有重要意义。
(二)认知神经科学方法在传播效果测量中的优势
认知神经科学方法是测量人类认知活动脑机制的心理学方法,对探测人脑对符号等信息的认知加工具有传统经验研究方法所不具备的优势。
首先,认知神经科学测量方法更加全面。认知神经科学方法可以深入测量占认知资源绝大多数的潜意识层面的思维过程,为更加全面地揭示人们的情感、态度、动机等内隐思维过程提供科学指导。认知神经科学家通过科学实验证明了人的思想产生于所谓的“映像”,而不是人们通常认为的语言。脑电波扫描和其他心理功能测量结果也表明:脑细胞和神经元的活动总是超前于我们有意识地思想和包含语言功能在内的一些大脑领域的活动。只有当人们有意想把这些思想以语言的形式向自己或他人表达的时候,那些包含语言功能的神经领域才会被激活。也就是说,“是认知决定语言,而不是语言决定认知”⑧。认知神经科学方法对于受众“不能表达”(Can’t Say)、“不想表达”(Don’t Want to Say)、“无法回忆起来”(Can’t Remember)、“无法追踪的信息”(Can’t Keep Track of)、“不知如何表达”(Can’t how to Express)的内隐态度测量具有明显优势。
其次,认知神经科学方法更加客观。认知神经科学方法能够同步记录人们的生理心理反应,其测量具有实时性,这与传统主观报告的方法相比更具客观性。通过直接探测受众的即时认知反应,而不是在事后通过口头报告间接获得,使得媒体效果测评测量更具直接性与客观性,这解决了以往传播效果研究中面临的“隔靴搔痒”的问题。此外,大多数认知神经科学测量方法都能够排除主试者效应,让被试在没有主试人员干扰的情况下较为客观地完成实验测试与数据采集。
再次,认知神经科学方法的数据采集更加精确。常用的认知神经科学测量仪器都具有高度精确的时间分辨率与空间分辨率。其中,脑电ERP/EEG具有高度的时间分辨率,能够捕捉毫秒级的细微变化;功能性磁共振(fMRI)具有高度的空间分辨率,能够探测大脑皮层内部的生理运动。眼动仪具有高度的时间采样率与空间捕捉能力。
因此,运用认知神经科学方法,配合科学合理的实验设计,研究者们可以更加全面、客观、精确地探测受众的思维与动机过程,使媒体效果测评更加科学可靠。
(三)对于生理心理测量方法在人文学科适用的再说明
对于将认知神经科学等生理心理测量方法引入人文社会科学研究,许多学者存在着质疑与顾虑。其中争论的焦点之一就是质疑单纯的生理反应如何能够正确反应人们的心智意识,人与动物的区别在哪里?关于这类争论,现代认知心理学研究已经破除了研究者的担忧。
首先,人类大脑的认知机制是涉身性的,即“认知源于身体与世界的相互作用。依此观点,认知依赖于主体的各种经验,这些经验出自具有特殊的知觉和运动能力的身体。而这些能力不可分离地相连在一起,共同形成一个记忆、情绪、语言和生命的其它方面在其中编织在一起的机体”⑨。涉身性认知(embodied cognition)具有涉身性(embodied)、情境的(sistated)、发展的(developmental)和动力学的(dynamic)等社会心理特征。⑩此外,大脑等中枢神经系统与身体外周神经系统之间具有广泛的联系,外周生理的反应也在一定程度上体现大脑中枢神经的认知结果。因此,涉身性认知理论揭示出人类生理、行为等生物层面的活动与思维、意识等心智层面认知机制的互动关系。因此,我们可以通过测量受众的生理心理指标去观察他们的认知、情感、态度等传播效果。
因此,正是发现了认知神经科学方法在研究大脑信息加工与态度认知方面的优势,近几年,语言学、心理学、经济学、管理学等学科都尝试运用认知神经科学的方法探讨人类新信息加工、认知、情感、决策、动机与传播效果等社会科学研究关注的普遍问题,开拓跨学科科学研究的新局面。
(一)认知神经科学方法在影视剧测评中的应用现状
笔者所在的浙江大学传媒与国际文化学院数字娱乐产业研究中心长期致力于用传播符号学与认知神经科学等方法进行影视剧市场的预测研究。随后笔者将以电视剧收视评价为例,引介认知神经科学的眼动实验方法在该研究中的作用。
(二)眼动实验原理
表1 眼动的三种基本形式
眼动实验研究重点关注的眼动形式是注视和眼跳。其中,100ms以上的视线(eye gaze)停留称为注视,绝大多数信息只有在注视的时候才进入心理认知加工过程。因此,眼动注视点是眼动追踪技术的核心数据之一。注视点之间的飞速跳跃称为眼跳。眼跳期间几乎不加工任何信息,但眼跳之间的轨迹通常用于分析描述人们视线运动的规律。眼动追踪技术广泛应用于信息加工、广告效果测评、网页浏览、阅读规律、动机与态度研究、发展心理学等研究领域。以动机与态度研究为例,在同一情境下,将消费者的眼动信息记录下来,可以探测到消费者对信息的选择取向,从而研究不同的消费者在相同情景下的动机和态度取向。④比如对不同产品的注视点个数与注视时间等指标可以反映被试的兴趣偏好与消费动机。因此,我们可以通过眼动实验来判断被试对观看对象的认知与态度倾向。
(一)实验目的与测试指标
电视剧正式播出之前播放的预告片往往是最精彩内容的浓缩,其作用是通过预告与宣传来吸引观众收视观看。我们可以通过实验设计测试受众对电视剧预告片片花的关注程度来推测电视剧内容对观众的吸引程度,进而对几部电视剧播出后的收视排名进行预评估。因此,本研究的目的是通过测量被试对几部电视剧预告片的眼动注意偏好数据,将眼动数据与所测试影片的最终收视率数据相比较,分析眼动数据与收视率数据之间的相关性,为电视剧播前的收视评估预测提供新的方法。本实验的主要测量指标有:(1)注视点个数指标(fixation count),该指标记录落在某一兴趣区域(area of interest,简称AOI)内的被试眼动注视点的个数,通常用于分析被试对某一区域的兴趣与注意程度。该指标数值越大表明被试对所注意的区域兴趣偏好与关注程度越高;(2)首次注视前时间指标(time to first fixation),该指标是指被试首次注意到某个区域所用掉的反应时间。该反应时间越短,则表明所观察的区域越容易引起被试的注意。该指标通常用来检测所看区域对被试的吸引力程度;(3)收视率指标,收视率指标采用央视-索福瑞媒介研究有限公司(CSM)公布的电视剧收视率数据,同时参考舜风传播有限公司依据CSM收视率数据编写的《收视率月报》中的电视剧收视率排行数据。
(二)测试材料、被试招募与实验设计
1.测试影片选择
由于该实验属于介绍研究方法的探索性研究,因此,我们选取一部分电视剧作为测试对象,探索眼动实验方法在这几部电视剧收视率预测中的可用性。根据本研究的目的及实验设计的方便需要,我们选择了三部知名度与投资差异较大的电视剧进行测试。这三部电视剧分别是安徽卫视《楚汉传奇》、湖南卫视《陆贞传奇》、央视一套《赵氏孤儿案》。选择这三部电视剧进行实验测试的理由如下:
首先,这三部电视剧的投资力度、播前知名度与播后的收视率存在着“叫好”与“叫座”的矛盾现象。其中,《楚汉传奇》投资2.4亿元,是当年数一数二的大制作电视剧,而《陆贞传奇》与《赵氏孤儿案》投资都只有几千万元;《楚汉传奇》与《赵氏孤儿案》的故事题材耳熟能详,属于知名度较高的电视剧,容易吸引观众,而《陆贞传奇》的故事熟悉度远不及前两部。然而,这三部电视剧播出后的收视率排名却是《陆贞传奇》>《赵氏孤儿案》>《楚汉传奇》。因此,选择这样三部电视剧进行实验测评符合本研究的目的。
其次,由于本研究是在大学校园中招募被试开展的,因此,选择大学生群体较为喜爱和熟悉的古装片进行测试较为符合目标受众的市场定位,毕竟近年来精品古装片的崛起极大地拉动了我国电视剧的收视情况和受关注度。
再次,这几部电视剧上映的时间较为接近,播出平台都具有广泛影响力,可以进行比较研究。一方面,这几部电视剧都是在2012年底至2013年初上映,属于当时各电视台的年度大戏,且与现在有一定时间距离,不会因为一时的口碑与收视热潮而影响实验测试效果。另一方面,这三部电视剧分别在央视一套、湖南卫视和以电视剧定位的安徽卫视播出,对于电视剧来说,这三家播出平台实力相当,不至于所测试的电视剧之间的收视成绩因播出平台差距而过分悬殊。此外,这些播出平台在电视剧领域具有广泛影响力,其收视率数据也能够较为全面地反映这几部电视剧的收视效果。
最后,实验所选取的这几部电视剧预告片片花均属于电视台版本的片花,能够反映电视台对提升收视效果的努力,且与收视率测评之间具有一定的关联。此外,我们控制每部测试影片时长相等,便于实验数据之间的比较分析。
2.被试要求及招募
我们在浙江大学BBS上发布招募被试的信息,要求被试在实验前没有看过这几部电视剧,以模拟现实播前评价的情形。此外,让被试在初选的时候对平时观看的电视剧类型进行选择,筛选出观看古装片的被试。本实验最终共招募32名被试,平均年龄22.4(n=32,SD=2.59),男女人数各一半。实验在“浙江大学985新媒体实验室”进行,实验后支付给每位被试一定报酬。
与一般的问卷调查对人数的要求不同,由于高采样率与高精确度,认知神经科学实验在研究中不需要大量被试重复实验。一般来说,定性研究的样本量为8-15人,8-10人可以发现70%-80%的可用性问题,15个被试可识别出几乎所有观察对象的问题。而对于组内定量研究,30个被试就属于大样本实验,可以当作正态分布进行数据研究(见图1)。本研究参照这一标准进行被试招募。通过精妙的实验设计,AC尼尔森曾用5个被试就成功地解决了用户体验研究中的问题。
图1 眼动可用性测试中被试数量要求与效果关
3.实验设计与设备参数
本实验采用对偶比较法进行实验设计。在被试熟悉实验环境与要求后,让被试自由地在眼动仪屏幕上对几部电视剧进行选择性观看,同时眼动仪同步记录下被试观看时的眼动数据。每组影片观看之间有10s时间的间隔。通过每组影片的对偶比较,计算出每部测试剧目眼动数据的均值,将眼动数据与收视率数据进行相关分析。
本实验选用国际公认的tobiiTX300眼动仪进行测量。首先,该眼动仪采用无干扰设计,被试实验时观看影片的状态就像在家观看电视屏幕一样。其次,该眼动仪的数据采样允许一定的头动范围,让被试能够较为自由放松地进行实验。再次,眼动仪的采样率越高,被试的数据也就越精确。该眼动仪采样频率为300Hz,具有较高的采样频率,保证了眼动数据的精度。
(三)实验结果分析
1.眼动数据可视化效果初步分析:蜂群图
眼动蜂群图(bee map)是眼动数据可视化(visualization)效果的一种,通常用于初步判断眼动数据结果的质化描述过程。蜂群图中的彩色圆点是被试群体的注视点,一个点代表一个被试。我们可以通过观察蜂群图的集体运动趋势来初步观察被试群体对所看影片的兴趣取向与关注程度。从以上三部影片的蜂群图对比来看(见图2—图4),落在《陆贞传奇》影片上的被试数量最多,其次是《赵氏孤儿案》,最少的是《楚汉传奇》。
2.眼动数据结果的量化精细分析
接下来,笔者通过tobii studio、spss17.0等软件对眼动实验的量化数据进行分析。研究发现《陆贞传奇》的眼动数据综合指标排名高于《赵氏孤儿案》、高于《楚汉传奇》。其中,在反映影片对受众吸引程度的首次注视前时间指标排名中,《陆贞传奇》排第一,《赵氏孤儿案》排第二,《楚汉传奇》排第三。在反映受众兴趣关注程度的注视点个数指标排名中,也是《陆贞传奇》排第一,《赵氏孤儿案》排第二,《楚汉传奇》排第三。这两个眼动指标的综合排名结果与收视率数据排名一致。具体数据指标如下表2。
图2 《赵氏孤儿案》(左)与《陆贞传奇》(右)蜂群图对比
图3 《楚汉传奇》(左)与《赵氏孤儿案》(右)蜂群图对比
图4 《陆贞传奇》(左)与《楚汉传奇》(右)蜂群图对比
注视点个数(个/分钟)首次注视前时间(秒)收视率(%)《陆贞传奇》92.330.311.79《赵氏孤儿案》70.810.751.57《楚汉传奇》66.721.100.67
注:眼动数据指标与收视率数据具有显著相关性,可用于收视率预测评估
实验发现,眼动实验测评结果排名与所测电视剧收视率排名顺序一致,且具有显著相关性。首先,通过Spearman等级相关对注视点个数指标与收视率进行相关分析,其结果显示两者具有显著相关性(r=1,p=0<0.01)。其次,通过Spearman等级相关对首次注视前时间与收视率也具有显著相关性(r=-1,p=0<0.001)。具体结果如表3。
表3 首次注视前时间、注视点个数与收视率相关分析表
在.001上具有显著性
注:眼动测评结果在不同测试剧目之间具有显著性差异,数据精确,区分度高
对所有测评剧目的注视点个数指标进行方差分析发现,眼动注视点个数指标在三部电视剧之间具有显著性差异(F=12.341,p=0<0.001)。可见,眼动数据结果能够较好地区分出不同剧目之间的关注度差异,这在分析不同电视剧收视排名中细微的区分度具有精确性,数据客观、精确,具有应用上的可行性。具体分析结果如表4。
表4 注视点个数的方差分析表ANOVA
3.研究结果讨论:优势与不足
首先,我们可以运用认知神经科学的眼动实验方法对电视剧播前的市场评估进行收视率预测。实验发现,通过合理的实验设计,即使是小样本用户的实验数据也能够在一定程度上预测基于大样本调查获得的收视率排名情况。本实验中的眼动时间指标(首次注视前时间)与空间数量指标(注视点个数)都很好地预测了所测剧目的收视率排名。并且,眼动数据与收视率数据具有显著相关性。此外,眼动注视测评数据在各个测试剧目之间具有显著差异性,这说明眼动实验方法的数据具有精确度与区分度,能够辨别传播效果排名中的精微差距。因此,眼动实验方法能够有效地用于电视剧收视率排行预测研究。
其次,就本研究而言,我们证实了高投资与高知名度影片不一定就能保证带来高收视率。从以上三部电视剧可以看出,《楚汉传奇》投资2.4亿、演员阵容强大、故事知名度高,但收视率却远不及投资仅几千万、演员阵容一般、故事知名度低的《陆贞传奇》。但从实验数据可以清楚看到,被试确实对《陆贞传奇》的注意偏好要远高于《楚汉传奇》。
我们通过眼动实验法测量发现,人们在神经认知层面的选择性注意倾向与主观刻板印象的判断结果不一致。收视率评价方法在抽样和采集上基本属于客观评价指标,与认知神经科学实验记录的客观性具有一致性。而我们知道,主观评价与客观评价在认知资源与运行机制上具有较大差别,用主观评价来预测客观评价在逻辑上不如用客观评价预测客观评价合理。因此,合理利用科学的测评方法对电视剧进行播前市场测评有利于预估市场成绩,据此调整电视剧营销策略,这在一定程度上能规避投资风险。
与其他研究方法一样,认知神经科学方法也存在着自身的不足。首先,本研究属于实验室实验法,这是一种在实验室内利用一定的设施、控制一定的条件,并借助专门的实验仪器进行研究的一种方法。实验研究重点在探索自变量和因变量之间的关系时,常常出现内部效度较强而外部效度较弱的情况。一般来说,实验研究优先保证内部效度,在此基础上尽可能拓展其结论的外部效度。本研究所测试的影片在目标被试人群中具有内部效度,其普遍代表性的外部效度需要用更多类似的实验来进行丰富。由于本研究旨在引介影视剧效果测评的新思路,与更大人群范围、更多影片类别测试所运用的方法是相同的。因此,本研究只选取大学生群体针对他们常看的电视剧类型进行实验研究。在此研究基础上,笔者将进行后续研究,拓宽被试人群与影片种类,积极寻求该实验方法的外部效度。
其次,认知神经科学实验需要一定的实验设备与人力成本。不同的认知神经科学实验所采用的实验设备不同,其相应的实验成本也不同。其中,fMRI实验设备成本较高,较少用于传媒效果研究。与之相比,脑电与眼动实验费用较低,适合传播效果研究。本研究之所以引介眼动实验,其相对优势在于除设备购置费用外,眼动仪在耗材与耗时方面的成本几乎为零,是认知神经科学实验中公认的物美价廉、易于操作与推广的实验方法。
注释:
①王兰柱:《中国电视节目评估:理论与实践》,中国传媒大学出版社2007年版,第52页。
②周烨:《节目评估再思考:数据、指标与体系》,《中国广播电视学刊》,2012年第4期。
③⑤喻国明、欧亚、李彪:《瞬间效果:传播效果研究的新课题——基于认知神经科学的范式创新》,《现代传播》,2011年第3期。
④⑥⑦⑧[美]杰拉尔德·扎尔特曼:《客户如何思考》,李华飚等译,机械工业出版社2004年版,第7、8、28、24页。
⑨Esther Thelen ,Gregor Sch?ner ,Christian Scheier & Linda B.Smith (2001).TheDynamicsofEmbodiment:AFieldTheoryofInfantPerseverativeReaching.BEHAVIORAL AND BRAIN SCIENCES ,24(1),pp.1-86.
⑩李其维:《“认知革命”与“第二代认知科学”刍议》,《心理学报》,2008年第12期。
(作者李思屈系浙江大学传媒与国际文化学院副院长、教授、博士生导师,数字娱乐产业研究中心主任;诸葛达维系浙江大学传媒与国际文化学院博士研究生,浙江传媒学院媒体传播优化协同创新中心助理研究员)
【责任编辑:刘俊】