内容分选平台助力数据驱动:大数据视阈下影视新媒体平台的发展策略
——以Netflix为例

2020-11-14 13:04刘海波YOUNGANN
电影文学 2020年15期
关键词:影视受众内容

刘海波 YOUNG ANN

(上海大学上海电影学院,上海 200072)

Netflix公司在1997年由里德·哈斯廷斯(Reed Hastings)和马克·兰多夫(Marc Randolph)创立,初期业务目标是利用互联网提供DVD订阅服务。23年来,Netflix公司一直是影视行业竞争中的危险游戏规则改变者。新冠肺炎疫情期间流媒体是获益最大的行业,根据2020年4月21日Netflix发布的第一季度财报,Netflix拥有超过1.829亿的付费用户。根据Variety Insight的调查数据显示,2019年Netflix在美国推出了371部新电视剧和电影,相比2018年增长了54.6%,包括1/4的作品是由Netflix海外市场制作的。

自2010年至2011年,Netflix走出美国开始在加拿大推出了服务,其次是拉丁美洲和加勒比海地区。凭借强劲的发展势头,Netflix随后进入欧洲市场,包括英国、爱尔兰和其他北欧国家。在2013年,Netflix推出了原创节目《纸牌屋》(

House

of

Cards

)、《铁杉树丛》(

Hemlock

Grove

)、《发展受阻》(

Arrested

Development

) 和《女子监狱》(

Orange

is

the

New

Black

)。2013年至2019年,Netflix在全球成功向190个国家及地区推出服务,包括日本、韩国、印度、马来西亚、荷兰、奥地利、比利时、法国、德国、卢森堡、瑞士、澳大利亚、新西兰、意大利、西班牙和葡萄牙等。2018年至2019年进入黄金时期,其间有作品获得艾美奖奥斯卡提名,“2019年第91届奥斯卡颁奖典礼上,由流媒体平台Netflix出品的电影《罗马》获得包括最佳影片在内的10项提名,最终获最佳外语片、最佳导演、最佳摄影3项大奖”。

Netflix业务初期是采用互联网技术运营电影DVD租赁服务,给相同业务实体店构成了挑战。现在,Netflix对电视媒体构成了威胁。今天顶级流媒体视频点播(SVOD)内容服务最大竞争对手是亚马逊(Amazon Prime),例如Hulu,Disney,HBO,CBS,Apple。真正威胁Netflix的第一个因素也是最明显的就是内容成本。但是,Netflix Originals手握海量IP,钳制内容上游,具有一次性发布完整一季影视剧的优势,与竞争对手使用的线性时间表相反,这对于喜欢随时随地观看的受众来说是大优势。此外,随着继续与好莱坞达成独家合作协议会集人才,以挑战传统电影院作为发行新电影的主要平台。

一、技术迷思:对大数据的关注

根据定义,大数据是指超过常规数据库系统处理能力的数据,而且接收量如此之大,以至于需要一个复杂的收集和分析系统来充分理解它。“大数据有三种形式:结构化、半结构化和无结构化。传统的数据通常是结构化的,易于标注和存储。而现在Facebook、Twitter、YouTube以及其他用户产生的绝大多数数据都是非结构化的。”借助Hadoop,Pig,Python,Cassandra,Hive,Presto,Teradata和Redshift之类的程序,Netflix每天能够处理10PB以上的数据以及400亿以上的新事件,以了解其用户的观看习惯情况。数据包含有关在特定时间使用服务的人数、观看者正在观看哪些文本;观看者如何评价他们观看的节目;以及他们从何种设备访问Netflix的详细数据(超过1000选项)。同时,还记录了许多令人惊讶的微小和个性化活动。例如,跟踪受众在观看电影中的精确时间点的动作:暂停或停止观看;跟踪受众何时快进或快退场景,通过算法大数据,科学家可以了解到,此刻那是什么样的场景。还有受众在每周的不同日期点播观看的节目及类型、最受欢迎的节目,以及受众最有可能从家庭智能终端屏幕中选择浏览哪种颜色/风格的海报。

从Netflix的角度来看,大数据的收集和分析是其业务成功的关键。“能够为其受众提供情景感知的内容推荐系统”,并做出智能内容资源推荐获取决策。对大数据的依赖性也极大地改变了消费习惯,影视内容制作、影视内容展示和更加重视内容上反哺的影视规则则成为顺理成章的事情,从而给传统影视行业造成了深刻的冲击。但是,令人惊讶的是,学术界对大数据在影视业中的驱动作用却很少给予关注。这个现象的部分原因是,Netflix通过限制公司内部人员的访问权限来保护自己的专有数据。“当然这包括像通常媒体公司常见的行业规则禁止非员工访问其数据集。而其他新媒体平台是允许展示某些数据”,比如微信、微博、Facebook、Twitter。换句话说,因为Netflix拒绝发布其算法公式和采集的数据集,所以学术研究人员只能非常有限地访问相关公开的数据,借以评估受众的行为如何影响行业转移。但是,这并不意味着对互联网大数据,对Netflix和影视行业变革之间的关系一无所知。实际上通过利用各类技术报告、最新文献与Netflix和其他行业高管的访谈和公开谈话,可以了解到大数据在Netflix发展的主要阶段中的推动作用,并借以评估对影视行业的潜在影响。这样的研究必然受到Netflix数据的限制。

二、类型创新:利用大数据驱动

创始人小威尔蒙特·里德·哈斯廷斯(Reed Hastings)对计算机算法的偏爱也意味着大数据从一开始就将成为Netflix商业计划的核心。第一阶段应用:向一家物流公司及时交付DVD。例如,当数据显示Netflix在24小时内向消费者交付电影DVD的能力与该地区新客户签约率的增长密切相关时,系统就会改变发行计划。第二阶段应用:类似于谷歌、雅虎、百度,提供站内搜索通过关键字查找电影,提供电影评级和剧情的链接,并允许用户输入喜欢的电影以查找相似的标题(模糊查询)。第三阶段应用:像IMDb、烂番茄(ROTTEN TOMATOES)、豆瓣等评论网站一样允许受众打分及点评。第四阶段应用:智能推荐系统,它是大数据工程师们开发出的推荐系统Cinematch,其目的是帮助用户“你想看什么就看到什么”。

在2006年Netflix旨在解决电影评分预测问题,宣布机器学习和数据挖掘公开竞赛时,更倾向于信任大数据科学家的力量,该竞赛向能够将Cinematch系统性能提高10%的任何人提供100万美元奖金“Netflix-prize”。这套新的推荐系统可以看到受众在周末而不是平日对电影进行评级时是否更慷慨,某位电影明星的粉丝是否只喜欢某种类型电影。当然也有不可预测变量,比如:软科幻电影、讽刺意味或争论性的节目内容会超出大数据的预测范围,例如对《光灵》《科洛弗悖论》《静音》等电影的评论产生了尖锐的分歧。

如今,Netflix的推荐系统更加完善,根据Netflix增长和目标定位实验,用户被推荐的内容中,有75%的概率来自马尔科夫链算法驱动。电影不再仅仅依托演员、导演、场景或类型标记。因此,该推荐系统在某种程度上变得更加复杂,就是通过在使用服务过程中建立起来的纯主观心理感受的受众体验,方法理解如下:

方法一:Netflix雇用独立评论者来集体观看其目录中的每部电影以及每部电视连续剧至少三集。然后,这些评论者从1000多个标签中进行选择,以描述他们所观看的内容,包括类型、设置、时间段、性暗示、血腥、浪漫程度、情绪、情节结论性甚至主角的道德诚信等。

方法二:Netflix使用这些标签将其平台电影分类细分以“微类型(micro-genres)”来解构影片,这些微类型有时如此特殊,以至于荒谬。实际上,在2014年初,该公司已经产生了大量新的电影类型——微形类型,向受众推荐用高收视类型替代低收视的部分,赢得竞争力。例如时空穿越、人鬼情感、非洲裔、战斗、犯罪、僵尸恐怖电影等,成为Netflix的竞争优势。这种推荐精确的类型是“策略的关键部分”。计算出如果将最适合的特定类型推荐给受众,并展示在受众主屏幕上的较高位置时,则成员保留率会正增长。

在对大数据集进行复杂分析的推动下,Netflix的Cinematch系统的高性能能够帮助受众找到他们想要的“电影”。“在研究对象是影片和受众的关系时,这种精准分析受众的潜意识和心理状态是不是也算相当程度上满足了受众的欲望(隐私)。”

三、内容反哺:利用大数据感知

Netflix平台必须通过采购电视剧、电影等视频娱乐内容的流媒体版权,来保证每个订阅内容。这场商业博弈中制片公司也在努力以更高价格售卖给流媒体平台,对于给谁首发流媒体版权也更加挑剔。首发版权较高的成本,以及在独家交易中对制片方某些类型的偏爱也意味着Netflix的选择将受到更大的限制和挑战。既要满足更多不同类型的受众在线点播观影,又要为了帮助平台应对这些新挑战,当然仍然是依靠大数据专家,新挑战必然产生新技术新应用协助解决这个问题时可能会容易一些。

Netflix的大数据专家改进了受众情景感知内容系统的另一个重要元素:认知(awareness)。普及常识让用户知道系统是怎么把握到他们喜好的背后的原因“People really want to know why,what’s the reason behind it”,促进用户的信任,而且鼓励用户提交更多的反馈来帮助推荐做到更好。个性化系统的另一个可以提升信任度的方式是提供推荐理由:为什么要推荐这部电影或剧集?不是因为它满足了商业需求,而是基于从用户那里获得的信息(用户的评分、观看记录,用户朋友的推荐等)。这个认知更像是对受众的心理现象的数据采集。

虽然消费者关切他们数据的使用,但愿意甚至迫切希望他人分享他们的一些个人信息(当他们有适当的收益回报时)。当交易和条件合适时,消费者要“花掉”他们的个人数据。对所有利益攸关者的最大挑战是如何确立数据可信的流动。大多数消费者或用户不知道他们的数据如何被利用,也不能够主动进行管理和控制,而是希望他们的数字身份得到负责任的和公开的对待。为此,企业和公共机构要告诉消费者或用户个人数据如何使用和保护隐私。

这些数据可能是隐私,例如性倾向、受虐、兴奋、幻觉等指数。在大数据算法中受众既为主体,也为客体,数据采集后对于受众的认知和关怀进行内容反哺。这种关系的形成就促使受众的依赖性和沟通关系,仿佛是不停鼓励受众表达自己,实际是将获得的数据进行商业化利用。理论上是互相利用的关系,受众体会到的是实用性、易用性、便捷性、舒适度等多维关怀,而Netflix的目标还是内容优势,内容才是视听服务的核心资源和竞争力所在。

四、发行变革:利用大数据决策

从大数据角度来看,流媒体时代最好的事情之一就是用户现在可以在线进行所有操作,并且可以记录、跟踪和分析与站点的每次交互。

2020年1月开源了它的Metaflow Python库,这是它用于构建和部署数据科学工作流的“以人为中心”机器学习基础设施的关键部分。将机器学习应用于其业务的各个方面,从剧本分析,到优化生产计划,预测搅动,定价,翻译,以及优化其巨大的内容分发网络。。

实际上,Netflix的数据科学家现在认为受众真的不再需要对电影进行评分,以便为电影提供准确的建议。也就是说烂番茄、IMDb、豆瓣平台的评分数据对受众影响不是最重要的。大数据可以细致入微分析受众的行为:观看什么节目和电影,以及如何观看它们。通过分析受众的喜好,并使用这些决策来购买最符合受众需求的内容(IP)。当大数据科学家发现目录提供的内容和受众想要观看的内容之间存在差距时,Netflix大数据系统可以去创建内容来弥补这一差距,根据每个受众的需求调整整个受众体验,包括主页、标题、每部电影的视觉效果、其他电影的推荐等。Netflix把这种个性化的过程定义为“消费者科学”。

随着Netflix在国际上的发展,内容合作一直遵循名人效应,就是原著和导演至少要师出有名。与具有跨文化吸引力的明星及内容(IP)达成交易。基于现在上亿的付费订阅用户数量清楚地表明,有能力与明星达成独家内容交易。这种做法可能会将影片的开发从传统的制片厂和院线转移出去。例如:最新上映电影有点特殊,受众没有足够的时间在院线坐着观看上映的每部电影。大数据分析出家庭受众平均要等6~12个月才能观看错过的影视内容。因此,为了改变观看电影的时间和方式,必须开发一种可以控制制作的产品。有些电影开始在Netflix网站上公布首映计划,同时在全球各大影院上映。影院感觉到Netflix具有日新月异的能力成了非常危险的先例,因为院线和网络同时上映削减了院线受众的数量。Netflix也找到了一种方法,通过完全绕开影院系统去规避来自几乎整个行业的抵制。

Netflix最初的电视连续剧《纸牌屋》(

House

of

Cards

)就是最好的例证,它以类似的方式颠覆了电视产业。由大卫·芬彻(David Fincher)执导的《纸牌屋》本质上是英国广播公司(BBC)系列的现代翻拍,由凯文·斯派西(Kevin Spacey)饰演弗朗西斯·安德伍德(Frances Underwood)。讲述主角弗朗西斯·安德伍德(Frances Underwood)在政治形势严峻的华盛顿特区政治界中崛起的故事。本质上,《纸牌屋》是“借助大数据算法开发的”第一部电视节目。这些算法表明,Netflix受众一直喜爱网站上Kevin Spacey的电影,而且许多人喜欢英国版的《纸牌屋》。Netflix找到一个相交点,暗示购买该系列作品将是对原创节目的一个很好的投资。

当然,公司的投放策略使Netflix的影视内容开发交易风险更大,因为这意味着在测试受众吸引力之前,他们必须购买整个节目季。因为大数据分析出,大多数受众都希望按照自己的节奏观看整个季节的系列节目。据此决定一次性发布整个季节的原始系列节目,从而使电视行业发生了革命性变化,而不是让受众每周等待新的一集的出现。显然《纸牌屋》的创作是令行业改变者Netflix决定继续其后续节目内容的发行策略。

五、内容估值:利用大数据进行价值分级

对于所有的数据采集,Netflix拒绝向其内容创建者或公众发布其最基本数据:即有多少人实际看过节目或电影等数据信息。这种拒绝改变了影视内容和创意人才(导演、编剧)的价值方式。从商业角度来观察,Netflix的高度机密性是有道理的。因为它除了提供基于订阅其视频流媒体的付费业务,并没有广告服务和额外的现金流服务,因此,几乎没有理由向公众发布收视率数据。因为电影、电视行业都会通过专业的第三方数据公司采集,并将这些数据用作比较指标,以评估节目的成功与否,确定广告费率以及在续约时协商创意人才的合同。由于Netflix无法从广告商那里赚钱,而且人们可以随时随地观看剧集,因此,传统收视率数据对其意义不大。因此,几乎没有理由向公众发布受众数据。但奇怪的是,关于有多少观看数据的秘密会影响到原创节目者本身的好奇心是须关注的内容。

因为在不知道收视人数的情况下,原创人员无法揣测要续订的剧集经费的合理范围。或许即使提供这些数据,创作者和他们的代理人仍然会觉得受到Netflix的控制,所以,Netflix拒绝发布其观看数据正好迫使影视行业采取更合理评估节目价值的新方式,比如批评性的评论奖项、评级和广告等。Netflix拒绝发布收视数据也促使行业出现了新的发展,原创内容创建者委托第三方大数据公司创建一个独立跟踪在线平台观看情况的启用系统。比如美国尼尔森Nielsen公司专注全球市场研究、市场监测和数据分析,中国广视索福瑞CSM media research公司专注中国内地和香港传媒行业的电视收视率调查、广播收听率调查。这些环节还需要构建企业级的商务合作,然后在被监测数据上增加一些可追踪标签,例如,视频水印、音频轨迹埋码等,合作开放端口标签数据才能采集和监控。对于智能终端的数据又是新的挑战,也需要与电信提供商有商务合作。

除非CSM公司或者Netflix决定发布其收视率数据,第三方数据公司会变得更加重要。Netflix也宣布计划每年投资超过80亿美元用于内容获取,这意味着越来越多的创作者将渴望合作。购买畅销IP的国际化策略,比如Netflix买下了《流星花园》的海外版权,正式签约购买中国科幻大片《流浪地球》海外版权,拿下另一部知名日漫《海贼王》真人剧集的开发权,《谁是被害者》来自徐瑞良小说《第四名被害者》,及与周杰伦合作《周游记》节目,《王国》都是迎合本土观众。本着“越是民族的就越是世界的”原则,借助资源和资本从源头挖掘各个国家文化特色具有开发价值的版权内容资源,实现源头采买、好莱坞工业标准制作和全球市场开发。

六、内容法则:利用大数据参与创作过程

热点话题是大数据可能与影响和破坏控制影视内容的创作过程的方式有关。可以确定的是,Netflix发布整季剧集的决定,鼓励了编剧以更复杂的、连续的故事讲述方式来创作:连续地讲故事,需要“很长的时间来讲述”,并且拥有“复杂的、多层的”故事情节和“复杂的角色”;可以“揭示自我”“时间”中的关系“需要空间来发挥作用”。这种叙事的复杂性并非始于Netflix。在《纸牌屋》之前播出的《迷失》和《绝命毒师》就是长叙事的两个热剧。观影过程无广告中断的流媒体播放过程中,情节之间被暂停时间也大大缩短,这意味着编剧要构建更复杂的叙事文本,不用担心受众会忘记在最初的剧集中发生过什么。受众和影视评论家都自然地接受了这种创作趋势。在电视剧方面,编剧摆脱了传统网络在特定时间间隔广告的限制。至少,网络电视剧必须在一小时或半小时的时段内规律投放广告,而Netflix是无广告的数字化流式传输,只是每个情节的故事长度可能会有差异。

Netflix可能会创造一种更自由的影视文化,吸引那些不需要担心自己的节目不会超过试播阶段的创作者。影视节目中的高额投资也引出了一个问题:大数据将影响编剧的创作。因为大数据算法将开始决定编剧必须去创作什么以及如何创作。当然这方面还是有很多争论,例如,吐槽编剧撰写剧本必须满足一个流媒体公司去迎合小众受众群体?角色可以计算出,剧情难道也能计算出来?可以看到的是计算机算法确实有助于Netflix决定企业发展的方向。

Netflix使用大数据来确定特定影视内容项目的市场规模,并且准确吸引到订阅人群,文章开头的1.58亿付费用户还真不是随便说说的。尽管使用大数据来决定在一个内容系列中投入多少资金、制作哪个系列以及该内容的演员应包括哪些明星等,但是Netflix团队在日常工作中并没有太多参与创作者写作/制作过程。现实中编剧或者内容创作者还是掌握了影视项目核心的创造力。他们才是专业的决定内容文本如何解构、如何表达、如何呈现。Netflix的管理层更像幕后顾问指导创作者的角色及影片类型。

Netflix的大数据可以根据订阅者的观看行为去判断下一季是否出现这个人物、动物或者产生一个场景,并建议保留或者删除,但是,还是要维护导演和编剧创作者的自由和文化。无论确定算法在多大程度上影响了系列剧的写作,尤其是在随后的季中,算法会与其他新媒体或者影视产业的分析有很大不同。某一天机器人、人工智能算法会不会左右人类如何接触新鲜事物和是否改变、影响影视产业的创作和发展?这个问题似乎让笔者回归到了电影创作解构和发展,电影学科包含了很多研究理论,对受众心理、认知多维度大数据的收集和依赖可能已经让电影美学和心理学理论元素汇聚艺术、心理、语言、语境、精神、文化、明星都被人工智能系统聚合后去影响内容创作者,满足可操作性和科学及商业价值。

这是个最好的时代,也是个最坏的时代,21世纪以来,随着互联网通信技术的发展,中国越来越多的媒体公司投入资金开发在线流媒体订阅平台——爱奇艺、腾讯、优酷、乐视等视频订阅平台,同时推动着影视产业的发展。后来者必然会学习和参考前者成功模式,对大数据的收集和依赖只会增加,而这些问题只会变得更加突出。有来的也有离开的,所以面对资本和内容创新的压力肯定会学习模仿Netflix的成功模式,资金和经验都会反哺给影视产业。所以,大数据算法的使用产生的内容会增加而不是削弱影视格局的多样性。随着Netflix在全球遍地开花,在各大奖项提名获奖取得成功声名大噪,在相同的平台、相同决策下这五年来针对亚洲文化内容的大投资,在日本、韩国、印度也出品了很多热播剧集及电影。Netflix真正做到了通过数字技术演变数字文化促使影视内容多元化和国际化发行。

结 语

精彩布局“因材施教”。影视产业现在面临的挑战是如何进一步探索内容决定法的产生和如何获取越来越复杂的算法。不仅是研究什么样的算法,以及算法的结果如何影响到影视公司的投资决策过程,而且还要了解“构成其基础的假设、优先级和再投入”。显而易见,Netflix的业务模式已经改变了影视行业内容(IP)的价值估算方式、谈判方式、购买方式,以及如何使用、制作出品和分发这些内容。2020年是进军亚洲第五年,Netflix原创内容崛起主导了美学及叙事形式,例如,韩剧《王国》第二季上线,第二季的成功再次证实了Netflix在亚洲布局的瞩目位置,这与其在亚洲文化的精准定位密切相关。最后,笔者尝试通过Netflix采用的每个订阅受众创作出的大数据系统不断地挖掘出社会心理,探索人性层面的现象,并转化为可商品化的数据集合,从而推动电影产业的发展。表达出这些新技术不会削弱电影本身,反而会延展其生命力。可以肯定,采用大数据驱动的数字文化如今改变着影视产业游戏规则的“内容决定法”提供基本的观点。令人关注的业内家庭类型内容之王“Disney+”也于2019年闪亮登场。影视产业对流媒体的依赖也驱动着影视产业人能够更智慧地利用大数据技术创作出更有生命力的作品。

猜你喜欢
影视受众内容
影视展
内容回顾温故知新
文学转化影视,你需要了解这几件事
用创新表达“连接”受众
主要内容
用心感动受众
媒体叙事需要受众认同
电视节目如何做才能更好地吸引受众