基于大数据智能化的媒资管理与应用研究

2021-05-31 08:19
电视技术 2021年4期
关键词:媒资编目检索

徐 莉

(浙江广播电视集团,浙江 杭州 310005)

0 引 言

当下,随着社会信息化程度的迅速提高,大数据和人工智能等新技术对广电行业产生越来越多的影响,也在不断助力媒体融合向纵深发展。媒体行业竞争日趋激烈。作为广电行业融媒发展的重要战略资源和核心竞争力,媒资系统在媒体发展过程中累积的海量资料库日益受到重视[1]。在融媒时代,人工编目水平直接制约素材检索、内容制作及分发的效率,成为媒资服务快速响应新媒体端的最大短板;迅速更新迭代的数据大幅提升了分析的难度,直接影响分析的时效性;移动端和短视频等碎片化信息不断涌现,倒逼媒资在为传统广播电视制播提供内容支撑的基础上,还需不断满足新媒体的内容分发与营销等新要求。如何使大数据和人工智能等新技术为媒资管理加持,最大效率地利用媒资,使得媒资管理与应用符合“短、平、快”的模式特征,已经受到越来越多业内专家学者的高度重视。

1 大数据和人工智能的概念与特征

大数据往往被定义成一种数量庞大且复杂度高的数据集,不易直接用现有数据库系统或数据处理软件对其进行处理。它的核心在于4V特性:数据量大(Volume)、种类多(Variety)、速度快(Velocity)及价值性(Value)[2]。大数据技术的价值不止于海量数据本身,更在于如何对数据进行有效的数据共享、组织及利用,提升数据处理能力,实现数据价值。目前,大数据技术正在以前所未有的力量,以传统的数据研究方式为决策提供信息。各行各业均在加大力度开发大数据的应用领域,广电行业同样应该主动拥抱大数据技术,掌握未来发展的主动权[3]。

人工智能简称AI,最早出现于1956年的Dartmouth学会,分属于计算机科学学科中的一支。目前该领域研究较深入的有机器人、语言图像识别以及自然语言处理等。如今,人工智能技术日益成熟,应用领域逐渐扩大,不久的将来,它还将引领一个全新的智慧媒体时代。以智能化技术为基石,将AI核心能力与媒资的智能编目、智能识别、内容审核以及鉴黄鉴恐鉴暴等各种业务场景结合起来,打造更具智慧的媒资管理应用,是下一代媒资前瞻而务实的创新思维方式。

2 大数据技术的媒资应用融合

就媒资管理及应用而言,构建大数据分析辅助决策平台,需整合互联网多源数据资源、媒资数据库资源及编目信息,形成统一数据库,深入挖掘数据内部联系,最大化数据的价值,为业务生产提供研发思路,为领导层提供决策方向。

2.1 大数据技术实现媒资内容价值挖掘

节目资料在数字化编目、用户检索及流量下载使用过程中,会生成海量无序数据。这部分看似无用的数据,通过大数据技术的分析和挖掘,能够创造出与内容资产相同甚至更高的价值[4]。通过大数据技术分析用户的检索词、检索习惯以及下载订单等数据信息,媒资管理部门可获取用户检索偏好,进而优化节目资料编目和检索系统设计等方案,提升节目资料内容资产的附加值;通过分析用户的资料需求及资料被调用的过程,进而建立起全面的数据库,相比于目前仅有用户名和所属部门/频道等数据字段更加有效;通过分析用户收视及相关反馈信息,刻画“用户画像”,针对不同用户的不同消费喜好,精准推荐内容,并提供贴心定制服务。

2.2 大数据舆情助力媒资实时掌握热点

大数据网络舆情分析通过动态实时掌握包括互联网、移动终端以及社交网络等方面的数据,预警突发事件,发现追踪热点,分析话题传播趋势和演变过程,形成舆情报告。大数据舆情不但具有经济、便捷、丰富的特点,而且对热点素材的预测极具参考性,成为引导媒资进行主题汇聚的重要前提和依据。越来越多的电视台“中央厨房”采用百度舆情和国双舆情等工具,不仅能够及时将媒体稿件、节目传播力、节目收视率及舆情实时反馈给“指挥中心”,也可以深度挖掘和分析媒资系统中的与早会选题相关的媒资,供编辑记者挑选使用,提高媒资利用率和准确度。具体应用场景为:选题报题系统调用媒资库的查询接口,在创建线索或选题时,可以根据对应的名称在媒资库里进行分词检索,显示匹配到的资源总量。点击媒资总量可以打开新页面,展示其包含的视音频、图片及图文稿等具体内容,如图1所示。在选题编辑状态时,若未输入标题,则右侧默认显示所有媒资内容;若有标题则依据标题进行检索,并做出相关素材推荐,可当作附件素材进行多媒体稿等任务操作。

2.3 大数据挖掘媒资新价值点

媒资管理应合理利用大数据挖掘技术,从战略上搭建“全数据”建设框架并引入大数据分析工具和数据分析人员,同时将媒资生产运营、用户服务、产品研发及内部管理等各类信息,数字化为可识别、关联及分析的数据,实现媒资管理的全面数据化。满足多层次用户需求,推进内容资源整合,提供碎片化、场景化以及实时个性化的内容服务,并通过App联合推出,挖掘媒资新商机,延伸价值链,拓展新领域。

图1 选题报题系统

2.4 大数据可视化运维管理

媒资系统在日常运行过程中会不断累积大量的流程运行、用户管理以及日志等数据[5],对于媒资管理而言,这些展现内容需要丰富且直观,即数据可视化、可分析。多数媒资系统目前都具有对数据进行列表统计的功能。步入大数据时代,数据展现不能仅局限于报表明细,鲜活的动态数据图更有利于展现业务数据的变化规律和比例组成,同时能为监控自动化、运行流程优化以及运维操作预判预警提供决策支持。

3 人工智能技术的媒资应用融合

3.1 人工智能用于筛选查重

目前国内多家电视台存在媒资库重复且冗余内容资源较多的情况,主要是专题纪录片和综艺节目类素材,特别是标杆综艺节目的拍摄机位甚至可达30多个。大量机位全时段拍摄镜头,不同剪辑版本中不乏大量重复内容,给媒资库的存储与管理造成压力,也给用户检索带来不良体验,急需通过技术手段解决。引入人工智能技术,通过智能化手段分析入库媒资重复部分,在重复率达到某个阈值时,提示重复率。具体应用场景为:首先,解决同一场景拍摄多次产生的类似重复画面;其次,针对同一段素材多次剪辑产生的不同版本,利用智能类比技术,对入库媒资内容做重复率提示,在此基础上经人工审核并删除;最终,清除媒资库存冗余信息,从而提升媒资库内容含金量。

3.2 人工智能编目标签化

通过智能识别技术自动形成智能化标签和索引,可用于辅助人工筛选和人工编目。随着节目量的剧增,人工智能可以替代部分人工完成基础工作,解放部分劳动力到更需要人工、更有含金量的编目审核校验工作中,这可以有效提升媒资管理的效率和查询的准确度。特别是在“中央厨房”式融媒新闻中心,媒资内容能够在人工编目尚未介入前,提前进行简单标签分类后投入融媒生产,提供“快、准、全”的媒资内容支持,之后在编目流程中,以基础标签的形式提示编目人员,使工作人员能快速把握节目内容信息,有助于人工编目得到更好、更深的提升。

3.3 多种智能技术助力资料检索

在媒资归档时即进行分类并做智能标签,利用语音识别、图像识别、人脸识别、字幕识别及转场检测等新技术,提供多维度检索功能,提高媒资检索到达率。此外,还可根据时间线、专题、颜色、人脸及标签等多维度检索词查找定位媒资。在移动端还可提供智能检索和图片检索功能,如利用语音识别和检索技术,为用户提供类似问答的语音互动体验,便于在外移动办公的编辑记者第一时间便捷地获取媒资,使得媒资能够更好地支持融媒生产。

3.4 自动水印版权保护

充分考虑节目版权的重要性,在媒资页面低码浏览窗口加注水印,并于节目出库下载通道自动加水印,对版权媒资做好提醒和保护。与此同时,预置版权接口,方便与未来版权管理相关系统进行实时数据互通。

4 结 语

大数据和人工智能技术助力媒资管理应用是未来的大趋势。大数据分析能够反哺媒资管理,人工智能则可以提供更加便捷和高效的媒资应用,两者对于广电行业媒资的重要性与日俱增。本文基于浙江广播电视集团智能媒资系统建设实际,提出新技术融合媒资管理与应用的研究规划,以便更好地提高媒资管理与应用效率。

猜你喜欢
媒资编目检索
大数据技术的媒资档案管理方法
国家图书馆藏四种古籍编目志疑
浅析媒资系统在电视台业务中的应用
粤剧编目整理之回顾与展望
专利检索中“语义”的表现
MRG9000媒资卫士在市级电视台全台网的应用
CALIS联机合作编目中的授权影印书规范著录
图书馆编目业务外包发展探讨
一种基于NGOD架构的VOD系统媒资传播管理方案
国际标准检索