浅析数据治理在电影行业的应用

2023-06-11 18:23裴智慧
中国电影市场 2023年5期
关键词:数据管理影视

裴智慧

随着大数据、云计算、物联网、区块链、人工智能以及元宇宙等数字技术的发展与应用,中国电影在数字化及数字化转型方面已经取得了有目共睹的成绩。从数字化转型到数字化战略,正在各界形成相对普遍的共识,国家也从政策层面对数字技术给予支持并不断规范。从2016年开始,一系列相关法律法规颁布、施行,比如《网络安全法》(2016)、《电子商务法》(2018)、《网络信息内容生态治理规定》(2020)、《数据安全法》(2021)和《个人信息保护法》(2021)等,这些法律法规的出台对数据的权属、数据隐私、数据保护和数据安全做出更为明确的规定,填补了大数据时代个人信息、网络平台监管、数据安全领域的空白。保护基础信息网络、重要信息系统和数据资源已经成为了国家关键信息基础设施,数字技术的发展在带来巨大经济和社会效益的同时,也给信息安全和管理带来了严峻的挑战,数字技术在电影领域的应用也存在同样的问题。

将大数据技术应用于影视产业,利用其强大的数据分析能力,可以为影视生产和销售提供有力的数据参考。具体而言,就是通过对海量数据的分析和整理,得到观众对某部影视作品的具体评分以及该作品营销业绩等一系列客观数据。这些数据对于影视制作非常重要,通过分析相同类型影视作品的数据,能够帮助决策者更好地进行选择、决策,从而对新作品的收视率和票房成绩产生积极影响。毫无疑问,在影视产业的发展过程中,大数据正发挥着越来越关键的作用。

1.剧本优化。剧本创作是创意性的工作,基于数据分析的剧本优化会给自由创作架起框架,但许多有关剧本创作的理论却以大量例证颠覆这一认知。创作剧本要遵循一定的模式,一般会以一定的篇幅控制开头、中段和结尾的写作节奏,甚至剧中激烈的情节点都是有相对明确的参考位置,绝非是天马行空的游走。基于这样的理论前设,通过收集和分析相关数据,将大数据应用于剧本创作,可让创作方向更加明确,有效地把握观众对题材的兴趣度,也可实现剧本内容(情节、桥段等)的评估。创作者甚至比观众还要了解他们自身的剧情喜好,依据这些分析结果对剧情进行优化,避免创作出现太多违背观众意愿的、个人化的内容,从而实现商业意义上的剧本优化,使影视作品获得更高的市场认可度。

2.演员选择。演员的选择对于电影的市场表现有巨大影响,例如:从对国产高票房青春电影的数据分析中可以发现时下年轻明星强大的市场号召力,相关机构对这一类型影片观众群体做过数据分析:超过46%的观众是12至18岁的女生。这一数据足以证明,抛开剧情、档期等因素,演员号召力所贡献的电影票房不容小觑。因此,除了在剧本优化方面可以利用大数据外,把数据分析的方法应用于演员选择也很重要。

3.营销策略。通过对社交媒体上的海量用户所产生的信息进行大数据分析,可以得到某一地域观众的年龄、性别、职业等各种维度的信息。依据这些信息,制片方可以向不同地域或不同观众群提供个性化的宣传策略,将宣传信息最大限度地辐射至目标观众,而不再是全国千篇一律的“首发视频”。

4.票房预测。将传统分析与大数据分析的进行比较可以发现,传统分析关注的是整体特征,试图挖掘的是某种现象出现的原因,并依此做出调整改进;大数据分析则更关注个体特征,其优势在于预测未来。几年前,有互联网公司在此方面有过成功应用,他们根据用户在互联网上的搜索次数来进行电影票房预测,据验证,此方法能提前一个月预测出电影的首周票房收入,且准确度高达94%。而现在,我们更可以通过收集微博、微信上的话题量以及各大平台所发布的相关新闻,甚至结合文本调查对各用户进行情感倾向分析,从而对电影票房做出更加精确的预测。

数据分析往往涉及不同信息系统中的数据融合,除了数据量增长外,数据来源的广泛性、多样性是以往单系统数据分析所无法企及的。数据来源的广泛性也带来了数据标准、含义不统一等诸多问题。为了解决上述问题,企业在开展大数据分析前应该引入数据治理体系。电影企业数据治理体系的建设需要依据现有信息化水平分阶段分步骤进行,对数据治理的概念、治理要素和框架以及面临的挑战进行探讨,提出数据治理的框架,将数据治理体系分为协同筹划、过程实施和监控评估三大主要板块,并对数据治理的核心功能进行描述。

1.数据收集。在网络上以调查问卷的方式,对观众信息进行采集,包括观众年龄、所观看的电影电视剧及其评价。这些数据比较零散,无法直接作为数据挖掘的对象,需要相应的统計分类才能做进一步分析。

2.数据挖掘分析。一是数据制表将相应数据经过合并排序制成事实表,并做出各维度表;二是处理结果可视化,把挖掘出的数据转化为数据分布图,方便进一步研究及模型推导;三是相关分析,对所制图表进行相关分析,从而找出影响票房或收视率的最相关因素;四是预测未来,通过数据挖掘结果所提出的数学模型对影响票房或收视率的因素进行分析,以便于预测单日票房趋势、单日收视率趋势等。

3.数据整理利用。在收集数据之初会发现这些数据非常杂乱,且存在部分无用数据。为了使数据更为有效,需进行预处理操作,使其变得更有条理,需要对所收集到的数据进行制表。以电影数据为例就包括放映时间、排片占比、上座率、适应人群几个方面。在经过制表环节后的数据,需要将其制成各种可视化的分布图以便于进一步整理,最终实现数据服务于发布、为数据内外部提供数据应用和分析结果服务,分析出影响票房或收视率的最相关因素。

1.脏数据问题。有些影视公司为增加其影视作品的大众关注度,不惜花费重金雇佣“网络水军”进行炒作。“网络水军”采用一些技术手段将这些影视作品的搜索热度、讨论热度等数据不断刷高,脏数据随即产生,使数据质量低下,可信度不高。所以通过对数据质量的管理,识别正常数据和异常数据,制定数据质量预警阈值,对数据质量进行多维度监控,以提高其可用度和可信度。

2.行业内数据维度不一致。根据不同数据维度进行数据统计的影视作品,其数据库无法直接进行对比,难以得出分析结果。比如,采用七大用户的数据维度进行统计而得到的数据,和采用六大影视作品内容元素的数据维度进行统计的数据库,从技术角度来说根本无法进行比对。因此要建立影视行业内的数据标准体系,保障影视行业内部数据使用和交换的一致性、准确性和规范性约束,其中包括基础数据标准和指标数据标准。基础数据标准包括对所有影视相关数据域的库表级别的统一管理及映射,如字段属性、长度精度、值域码表等;建立元数据标准,从技术元数据、业务元数据和管理元数据多个维度对元数据进行管理,统一影视行业不同数据域的元数据标准。指标数据标准包括对影视行业内部的指标统计口径的一致性约束,包括指标本身的业务含义,指标的计算规则,指标的计算维度,指标的管控规则等,达到在影视行业重要指标的统计口径统一。

3.数据分析结果预测功能的局限性。虽然大数据的最强大功能是对未来趋势进行预测,但基础数据质量的高低,会导致未来的票房或收视率不一定与预测结果完全一致。数据质量越高,预测的结果就越准确。这也要求影视行业各企业加强对企业内数据管理重要性的认识。盘点数据资产,分析数据管理存在的问题,明确未来数据管理的组织、流程、制度,制订数据管理的咨询方案。形成影视行业企业内甚至在整个影视行业的数据标准,对重点数据域加强标准化管理,按照标准对既有数据进行数据清洗,提高数据质量,为预测结果的准确性提供强有力的底层数据支撑。

4.数据安全问题。数据已成为国家战略资源和关键生产要素,数据安全关乎国家安全、商业机密及个人隐私,需要处理好数据开放利用与隐私保护之间的关系。国家相继出台了《数据安全法》《个人隐私保护法》等法规政策,要求在加快培育数据要素市场的同时,还要对数据进行分类分级的安全保护,实现数据安全与数据开放利用并重。在对大数据进行挖掘和指标开发过程中,开发工程师对数据拥有绝对访问权,影视行业相关的基础数据和重要指标处于裸露状态。在影视行业企业内或企业间数据传输过程中,也存在数据泄露风险。因此通过数据管理流程、数据管理职责分工、数据管理制度、数据管理考核评价、数据授权、数据流向、数据质量、数据规范等内容来加强数据安全管理,对原始数据进行安全分类分级、不同等级的数据使用不同的加密方式和安全策略,在数据传输过程中的加密及集成安全也尤为重要。

党的二十大报告中明确提出了加快建设“网络强国”和“数字中国”的战略目标。今年年初,国务院印发了《“十四五”数字经济发展规划》,该规划明确指出数字经济是继农业经济、工业经济之后的主要经济形态。5月,中办、国办印发《关于推進实施国家文化数字化战略的意见》,从目标到重点,从路径到步骤都做出了战略部署,成为推动实施国家文化数字化战略、建设国家文化大数据体系的一个框架性、指导性文件。作为电影企业,在响应政策号召,加快推进电影产业数字化转型,推动互联网、大数据、人工智能等同电影产业深度融合,实施“上云用数赋智”等方面要有所作为,根据企业管理要求和数据敏感性要求,在“整体统筹、循序渐进、条件具备”的演进策略中,对数据制定一套合理、科学的安全分类标准、流程和制度,最终实现“数据不动程序动”“数据可用不可见”“只分享价值不分享数据”“保留数据所有权,释放使用权”(见《网络安全与数据治理》2022年12月第6期第41卷《破解数据要素流动与隐私保护相冲突的局》,作者方滨兴。)的安全数据模型,将数据的价值更好地为企业赋能,提高经济质量效益和核心竞争力。

猜你喜欢
数据管理影视
影视展
企业级BOM数据管理概要
文学转化影视,你需要了解这几件事
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
列控数据管理平台的开发
中国影视如何更好“走出去”
对中国影视独特的爱
影视风起