吴琪 薛丹 马春娟
【摘要】为完成对河北广播电视台广播在播节目按照节目单内容进行保存及编目检索的需求,设计建设一套安全、高效的广播媒资系统,可以对广播节目进行编目、存储,方便查询调用。通过对主备服务器及存储阵列、交换机的冗余设置,可保证数据的安全及系统的稳定运行,通过阿里云语音识别服务,可以进行初编目,设置网闸只让音频文件通过,更好的保障了安全、方便的利用媒资系统的内容。实践表明:该方案设计合理,运行稳定,能满足按照节目单保存音频内容、编目检索及利用语音识别初编目的需求。
【关键词】广播媒资;节目存储;系统建设
1. 背景
经过多年的发展,河北广播电视台广播播出积累了大量珍贵的历史音频资料;开办9套播出频率,每天播出212.5小时的节目;每年举办、直播多场大型活动和重要会议;录制播出大量系列报道和专题节目,这些节目日积月累,产生大量有价值的音频资料和稿件内容,这是宝贵的无形资产。为了更好地完成对广播各频率在播节目进行长期保存和使用,实现对广播节目资源的规范化管理,为后续的可持续发展提供丰富的内容资源,设计并建设了一套广播媒资系统,将实现节目的实时录制保存,对现有9个频率在播栏目的内容按节目单要求有选择的进行保存;对现有资料进行分级化管理及加密处理;并将我台现有老旧媒资系统内的资料及编目信息转存至新系统中查询和再利用。
2. 建设思路
目前我台对于媒资系统最迫切的需求主要包含以下几个方面:播后节目资料的永久存储,并对资料进行详细编目,便于资料的有效分类和查找;播后节目资料的查询以及再利用;老资料库内的历史资料迁移到新的媒资系统中,并完善编目信息。有效利用语音识别手段对新闻节目进行初编目。
针对以上的需求,我们制定如下媒资建设方案:
建设具有高安全性、高可靠性、高易用性相结合的媒资管理系统,符合当下最新的广播媒资的有关编目标准。同时有较强拓展性,为下一步建设预留充足的升级空间,鉴于媒资系统存储资料的重要性,本项目建设主、备二套系统来确保资料的安全。每套系统包括:慢录采集站、交换机、服务器、SAN交换机、阵列柜。两套系统互为备份,防止数据丢失损坏,提高系统安全系数。
新系统媒资文件应与现有慢录储存格式一致,统一为S48格式存储。媒资系统建设时,慢录系统能够按照节目单设置安排自动分切文件,自动填入对应的频率名、节目名称、播出时间、时长。
对栏目进行编目存储,方便再次查询调用,能够对已进行编目存储的资料查询、检索、浏览,并调用进行再次加工利用。建设时能将旧系统中的资料及编目信息对接导入,以完成对历史珍贵资料的抢救和再次开发利用。为防止新闻节目类及保密类资料流失,设置对此类资料素材进行加密处理。为未来媒资再次升级预留接口。
通过阿里云语音识别服务,利用语音识别工具读取慢录资料,并将文字回调给媒资服务器。
新建的媒资系统成为一个独立的局域网,台内的办公用户可通过安全网闸对媒资系统进行访问。
系统拓扑图如下所示:
3. 项目实施
河北广播电视台媒资系统设计的规划过程中充分考虑了兼容性、安全性以及扩展性,通过慢录采集、慢录碎片化、慢录导入媒资程序实现了按照节目单的设置要求进行碎片化的保存并进行后续的编目。
(1)慢录采集。可直接连接音分至慢录采集站,设置采集任务时采用全天整体录制即可,每三个小时形成一个慢录文件,后续可通过节目碎片化程序对慢录文件进行拆分。(2)慢录碎片化程序。先在碎片化后台设置频率、节目名称及录制时间,通过收录节目定位程序,根据节目时间点位和慢录比对,进行录入。通过节目导出程序将碎片化的节目放到临时路径。(3)通过慢录导入媒资程序将碎片化的慢录保存到媒资中。(4)媒资编目。完成对入库节目的文字和音频的编著、审核,以使其方便快捷的提供给系统检索和再利用。并且可以自定义编目分类体系,通过精编业务做深层次元数据著录。从而让媒资能更好地服务于生产。同时可进行资料密级管理,保证敏感资料的高保密性。
媒资服务器建设上采用主备服务器模式,同时在主备服务器上配置域控制器建立域账户进行登录,主备服务器建立群集,群集中的所有者节点代表目前阵列和sql和媒资客户端访问的服务器,当主服务器有问题,在群集中手动切换所有者节点到媒资备服务器。
存储阵列也设置为主备模式,主备服务器均可以连接主备阵列,初始情况下主服务器用主阵列,利用secondcopy进行主备阵列的同步,保证数据的安全性。存储阵列采用了RAID6模式,具有较好的性能且更好的保障了数据安全。在服务器与媒资阵列之间的光交换机采用了主备冗余模式,通过创建新ZONE添加成员的方式实现了安全连接。
网闸设置上,通过设置网闸只让音频文件通过,更好的保障了音频网与办公网的安全且可最大程度安全、方便的利用媒资的内容。
语音识别设置:通过设置识别时音起点来指定所要识别的资料的时间起点;设置云端回调地址来确定音频识别完成后,云端回传数据的接口;并且填入媒资系统的FTP信息,用于获取音频时使用;在拇指云地址上设置上传音频时地址,来进行语音识别云服务;识别完成后,可在“语音识别”编目中查看识别的文字内容;
语音识别流程如图所示:
新建媒资网络接线图
4. 运行效果
经过1年多的时间,河北广播电视台广播媒资系统经历设计、建设、调试、试运行到正式运行,完全实现了设计的功能,并能够安全高效的运行,按一天录制120小时S48格式音频计算,在导入旧资料的同时可保存约5年的播出节目,并且存储阵列可进行后续扩容,稳定、安全、高效的广播媒资系统的建设大大提高了节目的采集以及检索效率,极大的满足目前节目制作的需求,使河北广播电视台的资料管理走上了一个新的台阶,有助于制作出更好的广播节目。在新媒体与传统媒体的融合过程中,新的多样化的广播媒资系统对于广播电台业务能力的开展也具有十分重要的意义。
参考文献:
[1]李澎涛,王力栋.内蒙古广播电视台媒资编目生产管理与实践[J].内蒙古广播与电视技术.2014(03)
[2]郑伟捷.电视台新闻非编和媒资网系统[J].现代电视技术. 2010(12)
[3]夏守玉,方明惠,李靖.結合工作实际谈谈如何构建新闻媒资系统[J]. 电视工程. 2009(02)
[4]高峰.融媒体背景下媒资系统内容管理与再开发利用[J]. 中国新技术新产品. 2019(21)
[5]都升升,王国刚,珍措,贺平.西藏电台媒资系统建设与应用[J].中国广播. 2014(11)
[6]李鹏达.媒资系统中节目的检索调用设计[J].广播与电视技术. 2013(02)
[7]任佳琦.大媒资系统在媒体融合及“中央厨房”中的应用分析[J].科技传播.2018(10)
[8]邵来莉.温州广播电视传媒集团中心媒资系统[J].中国有线电视.2015(03)