庄玉婕 刘娟
摘 要:本文以2018-2020年32个电视综艺节目为样本,运用Python软件爬取综艺节目收视率相关的网络数据,利用多元线性回归的方法,通过单因素方差分析和逐步回归法筛选影响因素,得到最终的线性模型,结果表明:明星效应、口碑效应、网站评分是影响收视率的主要因素,最后为国内综艺节目制作和节目投资商提出了合理建议。
关键词:收视率;多元线性回归;网络数据;综艺节目
中图分类号:F27 文獻标识码:A doi:10.19311/j.cnki.1672-3198.2020.20.025
0 引言
在网络视频广泛流行,电视收视率逐年下降的时代,我国综艺节目经历了模仿,购买国外项目版权,本土创作的各种情况。又由于制作门槛低、盲目投资、“流量追捧”等种种因素导致了我国综艺节目内容千篇一律、缺乏正向情感引导。当前,数字化新媒体和传统电视媒体融合正加速融合,通过对综艺节目收视率影响因素的研究,不仅可以提高节目的制作质量,还可以丰富自身传播路径,提高观众的参与感,为大众带来更好的精神享受,另外也可以为节目的广告投资厂商给出合理建议。
1 变量描述
影响电视节目收视率的因素主要分为两类:一是与电视节目本身性质有关的播出卫视、播出时间段、播出季节、口碑效应;二是网络数据:互联网搜索量、明星效应、话题讨论度、网站评分。
1.1 播出卫视
同样的电视节目,可能在不同的电视台播放都会有不同的效果。主要有两个方面的原因:一是,每个电视台常年积累下来的或高或低的口碑会直接影响观众的选择;一是,每个电视台有各自的节目编排风格和制作方向,观众会对其形成惯性思维选择固有的频道。此研究随机选取的样本中有湖南卫视、浙江卫视、东方卫视、江苏卫视、北京卫视、CCTV-1。参考索瑞福发布的2019年的全国卫视收视排行榜将以上6个卫视依次赋值为6-1。
1.2 播出时间段
播出时间段作为节目编排需要考虑的重要因素之一对电视节目的收视率有着直接的影响,一般来说我们认为节目播出的“黄金档”即为每天的20∶00到22∶00,因为在这个时候是学生放学,成人下班休息的时间,晚餐之后更是人们看电视的高峰期,另一方面一周中周五的收视率会更高,其次是周六周日,而周一至周四娱乐节目的收视率会偏低。根据以上规律将不同的时间段赋值:周五20∶00-22∶00、周五22∶00-24∶00、周六20∶00-22∶00、周六22∶00-24∶00、周日20∶00-22∶00、周日22∶00-24∶00、周五24点以后以及周一至周四等其他时段分别为7-1。
1.3 播出季节
季播是大部分综艺节目的播出特点,这也是播出季节可能会影响收视率的根本原因。由于每年暑期、春节学生放假,作为大部分综艺节目主力军的年轻人就会有更多的时间收看节目,显然会对收视造成积极的影响。本文结合国内的假期特点将一年内分为不同的“档”:暑期档、春节档、普通档。
1.4 口碑效应
许多综艺节目会选择每年录制一季,因为前几期收获的口碑会使得接下来的几季仍然有高收视,从观众一方来讲,熟悉的节目使他们更加信任和期待,但也存在季播节目收视率逐渐下降的情况,这就是季播特点产生的节目口碑效应。
1.5 互联网搜索量
百度搜索作为百度旗下的产品,是以百度海量网民行为数据为基础的数据分享平台。本文选取了百度指数中的搜索指数作为其中一个指标代表互联网搜索量,搜索指数是统计出某一关键词在百度网站上的搜索次数,进行科学计算的加权和。节目投资方在节目开播之前的宣传力度可以通过该指数体现,如果提前宣传的时间长,策划良好,那么观众可能会在开播前就对节目进行搜索。
1.6 明星效应
本文搜集了每一部综艺邀请的明星嘉宾在新浪微博账户上的粉丝数量,定义方法如下:
明星效应=参加节目的固定明星数量+邀请的嘉宾数量节目期数
1.7 话题讨论度
其中微博话题讨论是新浪微博的一个特色功能,所有用户都可以自由创建话题,发表相关的言论,并且其余用户也可以参与话题的讨论和转发,除此之外,平台会对每一分钟的话题进行排名,热度越高越容易进入用户视线,形成了一种“良性循环”。因此,许多节目的官方网站会在节目播出后创建相关话题,并委托知名度较高的用户转发、评论,引导更多的人参与以达到宣传的目的。
1.8 观众评分
观众评分选用猫眼网站上各节目的评分。由于影评文章、海报宣传的全面集合,影片在站内的口碑就至关重要,影评网站的数据常常被国内很多研究电影票房影响因素和预测的学者作为参考因素之一。猫眼影评是国内著名的影评网站之一相较于豆瓣电影由于评分更加宽容,从而商业宣传的特点更加明显,可以在一定程度上反映网络口碑的同时也反映节目的宣传。
2 实证分析
2.1 样本选取
本文随机选取了2018-2020年间32个已完结的季播综艺节目,播出年份尽量集中在2019年,因为从《中国电视收视年鉴》中可以看到电视收视率在逐年下降,为了尽量排除这个因素,使收视率之间有比较的意义所以对样本年份加以限制。
2.2 数据搜集
样本的播出卫视、播出时间、播出季节在节目的官方网站上搜集,相关网络数据来源于百度指数、新浪微博、猫眼影视等各大官方网站爬取并结合部分手动录入处理。
因为明星微博粉丝数大多集中在1000万-1亿,并且很多综艺节目的明星嘉宾粉丝数量非常少,样本中也包含“素人”节目,真正发挥作用的只是一部分明星,所以明星数量主要统计综艺中明星微博粉丝数在1000万以上的。由于收视率数据范围在为0-2,为了更好地进行多元线性回归,本文对一些单位数量较大的变量单位进行了相应处理,具体如表1。
2.3 多元回归模型构建
本文以收视率为因变量,在对数据变量例如网络搜索量、明星效应分别与收视率进行相关分析检测,分类变量例如播出卫视分别与收视率进行单因素方差分析后得到口碑效应、明星效应、互联网搜索度、网站评分与收视率显著相关,于是繼续将通过显著性检验的指标与收视率建立回归方程。
随机变量y与一般变量x1,x2,x3,x4的线性回归模型为:
y=α0+α1x1+α2x2+α3x3+α4x4+ε
其中x1,x2,x3,x4分别是口碑效应、明星效应、网站评分、互联网搜索度,y是收视率,ε是随机误差。
2.4 多元回归模型结果
选择通过逐步回归方法对影响收视率的4个指标进行筛选,并且逐步回归也能解决指标共线性的问题,结果如表2。
最终回归方程为y=0.066x1+0.064x2+0.089x3-0.173,明星效应、口碑效应、网站评分对收视率的共同影响是显著的。当单独用口碑效应和收视率进行线性回归时,R方的值为0.389,同样的再单独用其他两个指标,R方分别为0.543,0.365。那么在这三个指标中明星效应能够单独决定54.3%的收视率,是最主要的影响因素。
3 结论和建议
(1)在排除的指标当中,与电视节目自身特点相关的播出卫视、播出季节、播出时间段都对收视率没有显著影响。首先,综艺节目播出时间集中在周末、晚上,竞争激烈不易拉开差距。其次,电视收视的主要群体集中在中老年,这部分人群的工作特点和生活习惯使得“黄金时间”的节目优势并不明显。不同于电影,季播综艺节目由于播出时间跨越几个月,因此档期差别并不能带来明显的收视差距。最后,每个卫视都存在优秀的节目和差强人意的节目。
(2)首先明星效应是影响收视率的最主要因素,节目中包含高人气的明星越多的节目收视率越高。综艺节目多会邀请很多明星嘉宾以吸引粉丝观看,因为不同于影视剧中带着角色面具的明星,在综艺节目里明星们更加容易表现出真实的性格,揭开他们神秘的面纱。因此,选择有人气明星助阵的节目更容易获得高收视。
(3)口碑效应的显著性表明观众更偏好熟悉的节目,当人们在选择电视节目时更容易关注熟悉的节目,作为收视主力军的中老年人更是由于接触网络较少,所以更愿意选择老节目观看。收视率取得良好成绩的节目可以考虑续集制作。
(4)网络评分对收视率有显著的正向影响。网络评分一目了然,被大多数人所熟知,并且评分结果来自观众,因此受到人们的信任。总的来说,注重网络营销,控制舆论趋势能够有效提高收视率。
参考文献
[1]聂鸿迪.中国电影票房的影响因素及其实证研究[D].北京:北京交通大学,2015.
[2]万颖迪.中国明星真人秀收视率的影响因素及其实证分析[D].南宁:广西大学,2016.
[3]游珺媚.热播综艺节目的网民满意度影响因素研究[D].杭州:浙江传媒学院,2016.
[4]何双男.中国大陆地区电影票房影响因素实证研究[J].电影文学,2017,(22):4-8.
作者简介:庄玉婕(1998-),女,汉族,四川西昌人,广东财经大学2016级本科生,研究方向:应用统计学;
刘娟(1981-),女,汉族,湖北石首人,博士,广东财经大学统计与数学学院,讲师,研究方向:应用数理统计。