网络口碑对票房表现的影响研究
——基于人工神经网络的电影票房预测

2021-12-04 02:43苏永华王哲平
电影文学 2021年21期
关键词:电影票房量值效价

苏永华 王哲平

(1.杭州科技职业技术学院旅游管理学院,浙江 杭州 311402;2.浙江工业大学管理学院,浙江 杭州 310023;3.浙江工业大学人文学院,浙江 杭州 310023)

引 言

自19世纪末诞生以来,电影在人们追求美好生活的道路上扮演着重要角色:其不仅是个人娱乐和放松的重要消遣品,同时也是跨地区跨民族进行文化交流的重要媒介。作为商业行为的电影制作和发行,票房一直以来都是投资人主要的收入来源,对电影院线公司、电影院和发行公司而言,更是如此。即便是电影行业盈利模式不断朝多元化努力,但各方在衍生品、广告和其他周边上的收入仍无法撼动票房在产业链盈利中的核心地位。包括《长城》《阿凡达》这样的中外高投入电影在内,投资人对票房的期许莫不翘首企足,票房不仅是影片成功与否的事后表征,基于预测的票房来评估风险和收益,进行拍摄、制作、宣传和上映的策略调整,更是投资人追求收益最大化之所急需。

对特定电影的票房进行一个准确预测并不是件容易的事情。电影的出品方、制片方、发行方、影片质量、导演、主演、影片类型、影片时长、上映日期、市场区域、宣传力度还有同档期中的竞品情况,甚至是电影放映期间的社会环境和天气状况,都会影响着最终的票房表现。不仅如此,包括影片投资额在内的许多数据实际上也是很难获得的(抑或是难以准确测量),而电影投资预算对票房和盈利的影响却早已得到证实——预算超过6000万美元的电影相较于低成本制作的电影更能盈利,这就意味着如果采用传统线性方法来预测票房不得不面临对明明已知影响变量却无法控制的尴尬境地。

为了提升对电影票房预测的准确性,已有相关研究试图从两个方向进行突破。在预测方法改进上,包括支持向量机、多项式logit回归、高斯朴素贝叶斯、多层感知器神经网络、自适应增强、随机森林、随机梯度下降、决策树和BP神经网络等一批机器学习的方法应用其中,实证研究结果表明多层感知器神经网络在票房预测中获得了更佳的效果,而电影上映前使用10折交叉验证的神经网络模型则票房预测的准确性可高出90%以上。在预测指标挖掘上,包括微博、推特、优兔和IMDb电影数据库等社交媒体和网络资源上的人气、评分、评论数量以及文本情绪等数据被充分采用,但这些特征在最终算法模型中是否得到支持,答案仍不统一。

对于电影这样一类体验性商品而言,口碑毫无疑问是影响人们观影决策的最重要的信息传播渠道之一,在网络社会中这一媒介效应更是获得极大的增强,网络口碑越来越成为影响电影票房的重要变量。电影《厄夜丛林》以6万美元投资创造了2.48亿美元票房的奇迹成为电影在线口碑营销的典范,相关研究报告更是披露了大约50%的年轻网民正在依靠口碑推荐来购买CD、电影、视频或DVD。本文基于线性回归和机器学习的方法,从电影票房预测角度探求网络口碑的影响机制与效应,揭示网络口碑效价和网络口碑量值在电影票房预测中的异质性表现,并以此为基础对电影口碑营销提升提出了富有针对性的建议。

一、文献综述与研究假说

美国电影协会前首席执行官杰克·瓦伦蒂(Jack Valenti)曾于1979年宣称,没有人能够告诉你电影在市场上的表现,但这并不能阻挡人们探究的脚步。自20世纪80年代初以来,对电影票房进行预测的研究一直都未停止尝试。从预测的时间节点来看,这些研究主要分为两种:一种是在电影上映前对票房进行预测,而另一种则是在电影上映一定时间后(通常是一周以内)进行的预测。就投资策略调整的角度而言,前一种预测似乎更具商业价值,但复杂多样的影响因素加之上映后所面临的动态变化往往令这些模型预测捉襟见肘。值得注意的是,网络口碑(或称之为在线口碑,缩写为eWOM)作为一种可被存储、搜索和再传播的口碑形式,其在电影票房预测中的表现使得后一种预测也成为关注的方向,尤其是整合电影最初几天票房、评级和口碑数据的方法被证实是获得相当准确票房预测结果的方法。

网络口碑影响电影票房的机制和效果都成为研究关注的重点。网络口碑不仅是电影的评分,其还包含评论数、转发量以及积极和消极评论的比重等多个方面。评论深度和数量代表了网络口碑的量值,而评论等级和正面评论的数量则表征了评论的效价。在反映互动总量的口碑量值和反映评价情感趋向的口碑效价之间,传统的直觉倾向都是希望干预口碑效价以提振票房,“价位是推动票房表现的因素,而不是数量”,评论评分对电影的销售有积极影响。在一个指定的市场区域内,效价是票房收入的重要影响因素。从全球范围来看,电影在国际市场上的口碑和票房是呈现出“共线性”的,影片品质决定影片评价,影片评价又决定着影片票房,这也是成熟电影市场的规律展现。Dellarocas等(2007)、Chintagunta等(2010)的前期研究结果也都表明了网络口碑效价对电影票房的正向显著影响,基于此,本文提出的第一个核心假设是:

假设1:在线评价获得的评分越高,电影票房表现越好。

实际上,国内外不少研究也提出了新的观点,认为评论的量值很重要,而效价则无关紧要。网络口碑量值特指网络口碑评价规模的大小,在一部分研究看来,电影评分虽然是电影质量的表征,其有可能有助于预测票房表现,但却不是影响票房成功的因素。另外一些研究也揭示了网络口碑与电影票房之间与直觉相迥异的关系,结果显示了口碑效价与电影票房无关,但在线消息量与电影每周票房则存在着显著相关。对美国动画电影票房的研究也表明,网络口碑量值对动画票房收入产生了积极的正向影响,而网络口碑褒贬(效价)对这类电影的票房收入并未呈现出显著影响。在国家层面的数据研究同样揭示了评论的量值真正影响着电影的票房表现。整体来看,大部分网络口碑量值和票房收入之间的研究均揭示了两者存在的显著正相关关系,如Godes等(2004)、Duan等(2008)、Rui(2010)等的前期研究中所发现的网络口碑量值对电影票房的积极影响。结合主流影评网站可获得的网络口碑评价数量方面的数据情况,本文提出了后续几个假设:

假设2:在线参与评分的人数越多,电影票房表现越好。

假设3:在线发布的短评数量越多,电影票房表现越好。

假设4:在线发布的影评数量越多,电影票房表现越好。

假设5:在线刊载的新闻数量越多,电影票房表现越好。

假设6:在线标记“想看”的人数越多,电影票房表现越好。

二、研究设计

(一)样本选择与数据来源

相较于格瓦拉和豆瓣,时光网(www.mtime.com)的电影评分机制具有类专业特征,其分项评分机制的显著优点是规避了同类网站基于主观笼统印象和模糊评价标准进行评价的弊端,其细致的评分机制、较高的用户专业素质和独立的发布载体特点,令其成为未来有条件向IMDb看齐的专业电影评价平台。本文以该网站2010年—2019年十年间中国内地制作的、对白语言为汉语普通话的各种类型的彩色电影为研究对象,通过公开数据的搜集整理,与艺恩票房数据(www.endata.com.cn)以及中国电影数据网(www.films.cn)公布的电影人粉丝数(新浪微博)相匹配,排除缺失值后(无插补)最终获得有效观测样本541个。在稳健性检验中,采用了豆瓣(www.douban.com)公开的相关电影数据。

(二)模型设定和变量定义

1.多元线性回归模型

本文构建了多元线性回归模型检验网络口碑对电影票房的影响:

LnBoxoffice=β+βScore+βLnScale+βLnFilmreview+βLnShortcomment+βLnNews+βLnDemand+γControls+ε(1)

其中,LnBoxoffice代表电影票房,从票房的数据分布来看,其曾出现偏态分布(正偏态),采用自然对数的方式有效消除了右偏问题。Score为电影的在线评分,取值为0~10,Scale为评分人数,LnFilmreview为长剧评数,LnShortcomment为微剧评数,LnNews为新闻数量,LnDemand为潜在观众数,被解释变量和主要解释变量的数据采集时间为2020年9月29日。

Controls是本文的控制变量。在信息较为缺乏的情况下,消费者更可能是基于冲动和依赖于影评的特征信息(如预告片、剧情介绍、演员目录、出品公司、制作成本等)来判断影片质量并以此做出购买决策,参照之前已有研究,本文对如下变量进行了控制:电影类型(Genre)、电影制式(Type)、主演(LnActor)、片长(Duration)、年度(Year)和档期(Schedule)。除在线评分和片长变量外,本文对连续的自变量均进行了对数变换,以便使得回归的结果更加稳健,同时控制潜在离群值的影响。变量的定义详见表一。

表一 变量定义表

(续表)

2.BP神经网络算法

人工神经网络是机器深度学习算法的典型代表,既可以应用于有监督学习(回归、分类等),亦可应用于无监督学习(降维、聚类等),与支持向量机方法相类似,其也是一种黑箱算法。与早期单层神经网络和前馈神经网络不同,由激活函数、网络结构和优化算法所构成的反向传播神经网络——BP神经网络在预测性能上获得了大幅提升。神经网络模型的参数主要包括权重矩阵、偏误向量以及包括学习率、训练因子、隐藏层层数、神经元个数等在内的多个超参数,其能较好地描述数据间复杂的非线性关系,因此具有非常好的预测能力。本研究的人工神经网络模型设定为一层隐藏网络,每层有10个神经元,算法结构如图一所示。

图一 电影票房预测的BP神经网络模型

(三)变量描述性统计

连续性变量的描述性统计及相关关系如表二、表三所示。从主要变量间相关系数的显著性来看,网络口碑的组成变量均与电影票房在0.01置信水平上统计差异显著。为减轻极端观察值对研究的影响,研究后续采用1%的标准对连续变量进行了缩尾处理。同时,为让数据尽量满足假设以便更好地进行统计推断,对除在线评分(Score)和时长(Duration)外的连续变量均采用自然对数的方式消除偏态问题,并在线性回归中采用稳健标准误进行估计以消除异方差对模型结果的影响。

表二 变量描述性统计

(续表)

表三 主要变量间相关系数

三、实证结果与分析

(一)线性回归模型分析

从多元线性逐步回归结果来看(见表四),模型中放入网络口碑效价因素(Score),在控制了一系列控制变量后该变量在0.05水平上统计差异显著,但是其并未能显著增加模型的解释力(模型2)。而当模型中加入多个量值层面的口碑评价(模型3),模型的解释力立刻得到较为显著的提升,其中新闻数量(Lnnews)在0.01水平上显著,评分人数(Lnscale)在0.05水平上显著。数据缩尾处理后,模型的解释力无显著变化(模型4),但是微剧评数(Lnshortcomment)在0.1水平上表现出显著。初步来看,相较于网络口碑效价,网络口碑量值对票房预测作用更为显著。

值得注意的是,模型在没有放入网络口碑量值时,网络口碑效价对票房的影响是正面的,但加入网络口碑量值系列变量后,这一影响机制发生了反转,在线评分(Score)对票房的影响系数由正转负,且在0.01水平上呈现出显著。此外,还应重点关注的问题是,虽然上述线性回归都采用了稳健标准误,但是模型的内生性问题并未从根本上得到解决,因此,有必要就影响机制做更进一步的研究。

表四 多元线性回归模型

(续表)

(二)BP神经网络模型预测

在涉及度量计算时,变量数值量级的差异会产生很大影响,为提高模型的收敛速度、提高机器学习模型的精度,研究对主要连续变量进行了min-max归一化处理,对分类变量进行了哑变量处理。根据电影票房预测的BP神经网络模型(图一),采用一层隐藏网络、每层10个神经元、取训练因子(eta=0.25)的方式进行不同次数的迭代操作,可以发现,随着迭代次数的增加,BP神经网络模型的解释力也同步上升,迭代1000次时模型解释力发生了跃迁,如表五所示。

表五 BP神经网络对电影票房的解释能力

(续表)

相较于传统线性回归模型,迭代1000次的BP神经网络模型基本已趋于稳定,其校正决定系数(Adj R-squared)达到了0.942,与线性回归模型解释力相比提升了28.9%,拟合相对完美,如图二所示。训练集中机器学习展现出了优异的拟合能力,采用非线性函数方式对电影票房进行预测,未来或将具有较强的实践应用空间和价值,当然这也需要进一步在测试中集中予以验证。

图二 神经网络与线性回归预测电影票房对比

(三)基于BP神经网络模型的特征选取

由于机器学习对样本量要求较高,而客观上囿于当前样本总数不合适再进行二次划分,故上述神经网络是将已有全样本作为训练样本进行的建模,其仍需一批测试样本对模型的外推(预测能力)进行进一步检验。但换一个思路,也可通过BP神经网络的方法进一步找出影响电影票房的关键性因素,从而可以优化线性模型对电影票房的预测。在这一设想下,对电影票房预测的BP神经网络模型可进行适当修改,在其他参数不变的情况下,仅改变神经元的个数(设定为1个)和最优迭代次数(iter=500),可以方便地找到在电影票房预测中权重较大的特征(自变量),分别是评分人数(Lnscale_w)、微剧评数(Lnshortcomment_w)、新闻数量(Lnnews_w)、题材(Genre)和年份(Year),如表六所示。

表六 BP神经网络模型特征权重

(续表)

表七 优化的电影票房预测模型

从机器学习遴选的关键解释变量线性回归模型可以发现(见表七),当自变量从12个(基准线性回归模型)减少到5个时,模型的解释力几乎没有什么变化(校正决定系数从0.73变化为0.72)。从具体指标来看,在控制类型效应和年度效应后,代表网络口碑量值指标的评分人数(Lnscale_w)、微剧评数(Lnshortcomment_w)和新闻数量(Lnnews_w)均在不同水平上显著。

(四)稳健性检验

以数据角度而言,一种常用的稳健性检验方法是剔除可能影响结论的特殊样本(极端异常值),从本文之前对样本进行winsor缩尾处理后进行的回归结果来看(模型4),网络口碑量值对电影票房的影响相当稳定且显著。为进一步揭示研究结论,本文从以下两个方面开展了进一步的稳健性检验。

1.变换解释变量

在时光网之外,诸如豆瓣、猫眼等电影社交平台同样为大众所熟知,自变量具有不同渠道和方法的测量为变量替换法提供了可能。研究进一步采集了豆瓣电影的评分数据,基于BP神经网络进行特征选取,得到了完全一致的关键解释变量。

表八 变换自变量后的核心解释变量权重

2.增加遗漏解释变量

对电影票房业绩产生影响的因素很多,除了演员的因素,导演、制片人、发行公司都被认为是可能的关键性因素。基于此,研究采集了导演相关数据(新浪微博粉丝数的自然对数),同样基于BP神经网络进行特征选取,与前面结果不同,长剧评数指标(Lnfilmreview_w)特征权重表现出显著性,如表九所示。但进一步的回归显示,如果将长剧评数指标放回线性回归模型(见表十),其既不能增加模型的解释力,作为自变量本身也未能表现出显著性。因此,可以认为这一自变量实际上在电影票房预测中的作用有限,其之所以能够在机器学习中呈现特征显著,主要原因可能是采集样本过少。增加的解释变量(导演)在预测模型中也未能表现出显著性,但这与国产电影大数据分析的结论相一致——面对以80后和90后为主导的影视观众,知名导演的核心作用并没能进一步拉升电影票房。

表九 增加遗漏变量后的核心解释变量权重

表十 增加遗漏变量后的线性回归模型

四、研究结论与启示

(一)研究结论

一般认为,网络口碑对消费者的观影选择有着显著的影响,国外部分研究也证实了在发达国家电影市场中口碑评价越好的电影票房收入往往也是越高的。但从本文样本研究来看,仅就票房预测而言,网络口碑效价对最终票房的预测贡献并不大(如表十一所示)——加入在线评分(Score)的预测模型的校正决定系数并无显著变化。而如果就其影响上看,在线评分和电影票房之间存在着负向相关关系,这似乎与汪旭辉等(2015)对中国电影票房的研究结论相一致。

表十一 网络口碑效价对票房的影响

关于网络口碑效价的研究假设1没有获得支持。但值得注意的是,网络口碑效价对电影票房负向影响是在一个模型解释力增加极为有限的情况下显现的,且这很可能还是一个高估的结果,如果继续排除遗漏变量或者双向因果等内生性问题后,其影响的显著性或可存疑。

国内电影发展与国外成熟产业间似乎存在着很大的相悖之处,国产电影“差口碑高票房”的逆增长现象,可以从两个方面进一步理解:一种理解是认为消费者是理性且完全有能力从泛在的网络在线评论中推断出影片的真实质量,而不必受到电影评分的左右;另一种可能的解释是评价机制的自选择,由于网络口碑评价有被操纵的可能,水军对雇主电影打高分、对竞争对手电影打低分,直接导致了对评分机制的不信任。

关于网络口碑量值的研究假设部分获得了支持(假设2、假设3、假设5)。无论是评分人数、微剧评数还是新闻数量,这些量值实际上都反映了口碑的知晓和流行程度,“烂片高票房”后面实际上也生动地反映了电影票房的内在规律:在网络口碑效价评价上,重复评价、水军、刷口碑榜等因素对结果有较大影响,而这对网络口碑量值的影响要小得多,其原因主要是效价评价是带有分数权重杠杆的评价,而量值评价则是均等权重,这也是人们观影决策中之所以偏倚网络口碑量值的一种解释。

(二)研究启示

网络口碑量值相较于效价对电影票房的决定性影响,为电影营销提供了有益的启示。对一个要求在较短时间内完成的产品扩散,过程不变但行程压缩毫无疑问会给营销管理带来更多挑战。电影对消费者而言不是搜寻品而是经验品,对有些观众而言,即便是专家的称赞和推荐都不能奏效,他们或许更愿意参考周围群体对电影的评价来决定这部电影是否值得自己去消费,这也就是说,在电影产品属性之外,网络外部性、社会学习实际上也是解释票房表现的重要路径。但值得注意的是,从电影消费之后产生的天壤之别的效价评分中可以发现,由于信息不对称、消费者意识形态和自我建构等因素的影响,网络口碑效价的参考价值相对有限(但其负向引导作用是否存在偏误仍需更多验证),让更多的受众“卷入”才是营销的重点,广泛借助媒体推广、公共关系、事件营销、“点映”等宣传推广手段,让电影在更大范围、更多人群中发酵并催生更多的网络口碑——无论是“吐槽”抑或是“叫好”,这对提升电影的知晓度及最终票房表现都将产生积极的促进作用。

随着网络在线购票比例的不断上升,越来越多的观影决策出现在观众到达影院之前。电影购买越来越依赖于观众主动的网络搜索,他们对社会化分享内容的识别机制直接影响着电影的销售。评分人数、微剧评数、新闻数量在电影票房预测中的显著作用,进一步揭示和印证了个体和专家的评论参与已成为当今电影票房成败的关键性影响因素。网络口碑量值而不是网络口碑效价在票房上发挥显著作用,这为电影营销策略的有效调整提供了思路。劝说(网络口碑效价)对于票房表现影响式微,而知晓和从众(网络口碑量值)才是营销应当主攻的发力点——在线评论数量的多寡实际上体现了电影的流行性特征,流行性是票房的直接表征,而负面评论同样可以创造出流行性。就此而言,新闻发布会、预告片、主题歌曲、首映活动等诸多形式都被认为是可以增加观众好奇与期待、提升影片话题讨论热度并最终促成知晓效应、从众效应和蜂鸣效应的可行路径。

(三)不足与展望

本文运用机器学习的方法提升了对电影票房的预测能力,更为重要的贡献是,通过改进BP神经网络模型筛选出影响票房表现的关键因素,从而对电影票房的线性预测模型实现了优化改进。但值得注意的是,网络口碑与电影票房的关系实际上并不是外生的,二者存在的反向因果关系已被相关研究所证实,找到合适的工具变量进一步解决模型的内生性问题是本文可以进一步改进之处。

就进一步研究而言,本文仅研究了网络口碑效价的一种形式,而潜在消费者可能受到其他形式影响,如不进一步考虑口碑效价的具体内容,这将不足以深刻理解口碑行为。因此,通过文本挖掘提取在线评论中正面负面情绪比例关系从而进一步理解网络口碑效价对观影决策的影响,是未来值得研究的一个方向。基于展望理论和信息诊断性理论的分析,网络口碑的另一维度——网络口碑离散也对票房有重要影响,网络口碑的影响还存在着非全周期性的问题,这两点同样也值得进一步探讨。

精彩炫目的高科技影视特效为影视作品创作和实现带来了更多想象空间,但作品的人文情怀、时代光华和精神共鸣亦不可缺。“恶评创造票房”的奇观实际上是网络口碑无法为观影决策提供客观可靠的参考标准下的短暂失序,眼下的热炒吸睛是资本逐利的应时之举,但电影美好远方必然是道近易从,一个集专家评论与网民点评于一体、规范可信的网络口碑体系不仅能为人们观影提供有效决策参考,也能成为电影票房名副其实的风向标。

猜你喜欢
电影票房量值效价
多元向量值区域和加权风险值
情绪效价的记忆增强效应:存储或提取优势?
新年新气象,元旦来带头 2021年1月电影票房排行榜
基于QAR数据的碳当量值适航符合性验证方法
打铁还需自身硬 2020年10月电影票房排行榜
意料之中,整体表现平淡 2020年9月电影票房排行榜
暑期档继续“遇冷”2019年7月电影票房排行榜
带有中心值的量值的公差表示
应用HyD在仔猪断奶早期可提高维生素D的效价
旋量值函数的Plemelj公式