韩小静
【摘要】在当前媒体融合转型发展的进程中,传媒行业正经历一场数字化、网络化、智能化的技术革命。借助大数据、人工智能、云计算、对象存储等先进技术的支撑,对这些珍贵的历史影像资料进行保存保护以及后期的开发应用显得至关重要。我台智慧云媒资系统的建设是在历史媒资数据继承、多媒体稿件和音视频资料的归档与回迁、AI应用等方面的一次实践和应用。
【关键词】智慧媒资;系统架构;AI;4K;融合媒体;历史媒资数据继承
中图分类号:G212 文献标识码:A DOI:10.12246/j.issn.1673-0348.2023.07.067
1. 背景
2018年底,国家广播电视总局印发《关于促进智慧广电发展的指导意见》,以推进广播电视高质量发展为主线,以深化广播电视与新一代信息技术融合创新为重点,加快智慧广电建设,推动广播电视从数字化、网络化向智慧化发展,推动广播电视又一轮重大技术革新与转型升级。2019年,贵州省编制《中国(贵州)智慧广电综合试验区建设实施方案》,建设全国第一个、也是唯一一个国家级智慧广电综合试验区,建设全国第一个、也是唯一一个国家级智慧广电综合试验区。
2018年以来,我台全面推进媒体融合,打造电视、广播、网站、客户端、微信、微博、平台号的“七位一体”融合传播平台。随着媒体内容不断丰富,节目形式多种多样,节目资料中包括各种形式的信息,具有重要的社会价值和历史价值。在当前媒体融合转型发展的进程中,借助大数据、人工智能、云计算等先进科技支撑,更好地对这些珍贵历史影像资料进行继承保护以及后期的开发应用,显得至关重要。
2. 项目目标
依托AI技术、IT技术、5G、大数据、云计算、人工智能等新技术以及网络技术,采用先进的技术构建业务网络以及管理网络,建立一个基于云架构的、面向融合媒体的新型媒资系统,为传统媒体和新媒体提供统一的融合媒体资源库;承载融合媒体的素材存储和再利用服务。
建设全省统一的媒资服务门户,通过面向互联网的统一门户,做“活”媒体大数据,促进媒体数据安全、高效流通,在流通过程中产生更多的数据,形成数据回流,赋能全省文化产业、实体经济。引入人工智能技术,实现媒体资產从内容汇聚到生产、审核、管理等全流程全环节的智能化处理,实现数据的自动分类。同时建成智慧中台,将AI能力赋能全台业务系统。利用AI技术对建台以来的历史媒资数据进行深度挖掘,并进行智能分类、关联,完善历史数据信息。将媒资系统打造成全台的数据枢纽中心,形成媒体大数据。实现版权信息著录,提供版权信息的检索、分类等功能,避免版权风险,并为后期实现媒体数据要素交易提供支撑。
3. 系统总体设计
智慧云媒资系统将基于微服务架构设计建设,其微服务化实现了模块弹性,能够轻松适配业务调整和扩展,实现快速、安全交付,提高了团队间的并行化程度,有利于业务创新发展,同时提升效率,更方便管理,提高模块复用性、安全性与高可用性。
总体系统架构设计如图1所示,系统采用现今“前台、中台、基础架构”模式进行建设,可以在保证数据可靠的前提下,满足不断增加、变化的前端业务需求。采用分层架构设计,架构主要包括基础架构层、通用服务层(通用业务、人工智能服务)、资源管理层。
⑴基础层为系统平台提供计算资源、对象存储、归档蓝光盘库、基础网络系统资源等,能够根据上层应用的需求进行资源的交付。
⑵服务层采用AV+IT架构设计,提供媒资系统通用的转码、迁移、抽帧、合成基础服务。人工智能服务平台提供的AI服务(人脸识别服务、语音识别服务、OCR识别服务、NLP处理服务)。大洋依据多模态AI服务提供的大量数据,对数据进行标签清洗、主题/分类抽取、新闻场景识别、图片比对,对入库的资源进行智能化编码处理。
⑶应用层主要包括对内容的采集、分权分域的管理、智能化的编目检索、素材调用业务。
智慧云媒资系统支持制播网、办公网和互联网接入,实现素材和元数据的交互,为用户提供多终端和不受地域限制的检索和下载服务。智慧云媒资系统支持新媒体业务的素材快速加工整理,提供作为专业非编的第二资源管理器的接口,也可以支持基于办公电脑的B/S的轻量化编辑工具。
4. 主要功能
智能媒资服务平台作为全媒体融合生产的基础资源支撑平台,需实现全媒体资源的编目、管理、检索和再利用的内容支撑。采用开放性设计,支持与各种上层业务应用或工具的高效对接,支持基于人事系统的统一用户认证,实现单点登录。具有完整的可分级的权限控制、日志记录和报表功能,能实现应用管理、全文索引和智能检索、工作流引擎和流程调度管理,以及各种配置管理功能。
智慧云媒资全业务流程,包括入库、编目、发布、归档、出库等各环节。
4.1 资源入库
资源的聚合是智能媒资服务平台的极其重要的业务环节与功能,汇聚的视音频、文字、图片等资源经过智能化处理,自动生成资源相关的元数据信息,以互联网化的方式通过资源门户进行统一展现。
智慧云媒资服务平台,提供多种互联网化内容上载方式,包括线路采集、介质采集、Web在线直接上传、轻量客户端上传、移动端APP上传、远程高速回传以及系统接口对接入库等方式。支持4K文件的导入,可以继承4K文件相关的动态范围、Gamma曲线、色域、分辨率等4K特征参数;支持导入视频、音频、图片、文本、Word文档等多类资源。系统可配置灵活多样的入库流程优化处理,根据节目需求,自动调用不同的入库流程,也可对各类素材进行人工预处理,手动选择相应的流程进行处理,在保证业务正常开展的同时,提高了业务效率。
4.2 资源编目与归档
资源编目是智慧媒资最核心的业务应用,可以实现对资源元数据的人工、机器著录。机器编目利用人工智能与大数据技术,可以对资源内容提取标签,具有覆盖面广、速度快、处理量大的特点,人工编目可对机器编目的数据进行修订,从而完善智能识别标签体系。
机器编目,通过多模态的智能处理,可以快速实现语音识别、人脸识别、OCR识别、标签快速提取、智能切分、NLP语义分析等,大大提高了对视频内容本身的著录描述效率。内容的复杂度不同,智能处理的速率会有一定变化。各栏目根据自身的情况,对资源进行差异化的智能处理。
人工编目,采用B/S架构,升级维护方便、使用灵活。只要能访问服务,就可以随时随地打开浏览器展开工作,对工作站的要求大大降低。使用方式上,同时支持随机性强的选择资源后直接发起编目,以及业务计划性强的基于流程的任务化编目及审核,两种方式进入到编目环节,均可实现对资源元数据的著录。
智慧云媒资系统支持按流程方式的自动化归档,也支持手动发起归档,可配置资源入库及归档,保证资源的数据安全。
4.3 检索浏览
智慧云媒资的资源最终目的还是要被查找再利用,智慧云媒资提供了诸多新颖的检索方式和手段,更加贴近互联网化的检索体验,更加方面快捷的资源定位方式,更加智能的资源主动推荐,更加精准的标签精确匹配查找。智慧云媒资在传统媒资的同音字、拼音、同义词、分类、关键词、文本内容、关联检索等全文检索服务的基础之上,还提供了互联网facet式的主题和分类交叉递进的检索方式,引导用户通过鼠标的点击操作逐步逼近期望的结果集。智慧云媒资还提供了智能图像检索手段,用户可以通过图片搜索库内的资源,如查询包含某个人脸的资源等。
在资源的结果集与详情浏览上,智慧云媒资也同样利用了大数据与人工智能技术,实现了基于用户画像的检索结果个性化排序,相似资源的主动推荐,结果集的图谱式联想检索等,如在结果中显现人物的图谱关系,展现事件的脉络关系等。在实现检索手段多样化的同时,搜索引擎可在百万级数据200人并发访问的情况下,达到百毫秒级的检索效率。在数据量较大的情况下,搜索引擎也可采用多机集群方式,提升效率。
提供资源发布门户,可以将资源平台中所有的资源进行门户推荐、检索和展现。包括动态海报推荐、热门专题推荐、资源分类推荐、个人资源推荐、资源关联推荐、资源排行榜推荐等,同时针对每一类资源都针对性地提供最适合的展现方式。
4.4 多渠道发布
对外提供内容的介质下载导出、系统互联下载/引用、Web/客户端下载、多平台推送/发布、出库敏感审核与提醒等多渠道发布功能。支持将资源下载/导出到指定路径;支持基于系统间的资源交换流程实现资源的调用;支持在Web页面上直接下载资源文件,浏览器或迅雷等下载工具下载保存到本地路径,而无需复杂的业务流程;支持所有面向新媒体渠道的资源发布或推送业务;支持发布前的资源元数据的编辑加工。支持发布申请的审核和任务的管理监控。通过智能化的AI人脸、OCR字幕、语音的内容等比对,支持对敏感人物相关节目进行出库提醒等。
4.5 数据统计分析功能
为不同业务指标及工作量的核算提供报表,作为参考依据,改变传统核算方式,减少人工核算的成本与误差,通过系统快速、准确地展现。作为辅助运营的手段,支持图形化统计结果展现,并且可对统计结果实现报表输出。
4.6 版权信息记录
目前系统能够进行简单的版权记录,在资源入库时,支持将版权信息著录、记录功能,支持对版权信息的检索、分类、识别。未来与第三方版权系统对接,可以实现版权数据的信息化管理、版权合同的流程化管理、版权业务的增值化管理等多种综合管理模式,实现智慧云媒资系统的数据对接。拓展系统服务应用功能,对版权管理,在线交易、媒资大数据、对外服务等进行完善,最终以面向市场,服务公众为目标。
4.7 资源快速加工
智慧云媒资系统,在面向台内业务提供传统服务时,还可在媒资系统本身内部实现适配新媒体业务的快速短视频加工制作与发布,提供轻量化的编辑工具,实现高效的素材资料整理加工。资源快速加工时,不需要进行文件的拷贝迁移,直接引用媒资的资源与URL路径,达到工具与媒资系统紧密耦合。
资源快速加工工具,主要由光影WEB快编工具构成,以适应各种融合新闻生产加工场景,体现媒资对多业务场景适用、高实时性、高兼容性特点,满足互联网化制作的需要,符合移动化、互联网化操作人员的使用习惯。
4.7.1 光影WEB快编工具
D3-LightCut光影BS非编系统中,用户通过浏览器访问指定网址即可获取完整非编功能的编辑系统,系统充分利用浏览器性能及特性,极大降低了后台部署时对硬件平台的要求。系统与各类平台应用可以无缝接入,实现远程快速编辑及发布的新媒体业务流程。
4.7.2 资源服务API
各应用软件可以直接调用平台提供的基础服务API进行应用集成,从而提供更好的应用整合性。平台对外提供的基础服务API几乎涵盖了对资源增、删、改、查相关的所有操作,包括资源管理、元数据管理、存储管理、人员授权管理、资源检索查询等,基于这些API应用工具可以方便地获取资源平台中资源的相关信息,并进行使用或修改,获得与平台原生应用相同的操作体验。
5. 媒资历史数据的继承与AI翻库
5.1 历史数据的继承
原有媒资系统与智慧云媒资系统架构不同,造成两个系统的数据结构以及使用的数据库不尽相同,考虑到媒体文件移植的完整性、安全性,更重要的是要保障跨数据库类型数据移植时,业务描述数据结构继承的全面性。由于数据继承要求的特殊性,需要通过定制开发独立的数据移植工具,实现原有现有媒资媒资数据向新建系统的移植。同时,現有媒资业务系统均为在线使用系统,需要保障业务系统的正常使用。
智慧云媒资系统需要考虑继承原有媒资系统的数据,包括元数据和媒体数据。元数据即为存储在数据库中的数据信息,媒体数据包括高低码率的视音频、关键帧、附件、肖像文件等物理文件。
5.2 智能化AI翻库
基于现有媒资系统进行整体升级,处理新增節目的同时对历史节目通过AI助手进行翻新处理。资源入库智慧云媒资时,AI引擎支持多并发处理,调用资源多模态处理接口对视频、图片或文档进行分析处理,可以融合人脸识别、语音识别、OCR识别、NLP处理、视频标签、场景切分、音效、图片内容、图片颜色、代表肖像等多个维度,对资源内容进行全面内容理解,可以输出丰富的,高价值的结构化和非结构化的元数据类型。
6. 结束语
智慧云媒资系统,继承原有老媒资系统中的数据;与现有超高清制播网、电视播出系统、动静云平台等互通,实现资料的归档、回迁;支持传媒行业高清、4K/8K超高清、IP化音视频、多媒体稿等各类业务数据的入库、编目加工、存储管理、下载使用;采用人工智能、对象存储等先进技术,满足我台及全省媒体资料长期存储与有效再利用需求。通过统一的媒资服务门户提供素材的再利用服务,支持互联网访问方式的检索、查询、浏览,实现版权信息记录功能。同时将智慧云媒资建设成多租户版媒资,为以后支持省内媒体单位的入驻,增加了资源流转的可能性。
后期将对智慧云媒资系统进行能力扩容,使用公有云、私有云结合的系统架构。力求与全省其他传媒系统实现数据对接和共享,成为全省广播影视音像资料的资源库;开发PC端、移动端应用,为全省用户提供多终端和不受地域限制的访问服务;融入多种技术手段全面提升媒资应用的检索体验,为社会提供高层次、多品种、全方位服务;根据不同的账号权限,对智慧云媒资系统内不同资料进行检索、查询、回迁,从而真正实现全省资源有效共享;深入拓展系统服务应用功能,对版权管理、在线交易、媒资大数据、对外服务等进行完善,探索打造全省文化数字资产汇聚、生产、交易的“智媒”平台。
参考文献:
[1]智慧广电建设的优势与未来方向[J].王三军.中国高新科技,2021(07):34-35.
[2]"5G,4K,AI"模式下的智慧广电发展策略思考[J].尹宏宇.广播电视网络,2022(03):23-25.
[3]AI和大数据技术对新媒体传播的影响及应用分析[J].田新梅.中国有线电视,2021(02):192-194.