IPTV智能化综合运维管理平台介绍

2023-03-07 10:03吴道林
电视技术 2023年1期
关键词:码流端口运维

吴道林

(贵州广播电视台,贵州 贵阳 550002)

1 背 景

据工业和信息化部数据,截至2022年4月,我国IPTV总用户数达3.61亿户,IPTV已正式进入主流媒体阵列。当前,IPTV具有播出结构逐渐IP化,信号处理复杂化,传输方式多样化,播出节目海量化等发展趋势。在全IP化的系统中,每根线缆、每个设备均承载了大量的播出节目[1]。因此,国家广播电视总局对IPTV集成播控平台的安全播出要求越来越高。为进一步提高直播平台的安全性和可靠性,减轻运维人员的工作压力,提高故障应急处置的效率,亟需建立综合运维管理平台。基于此,本文对运维管理平台的一般架构和实际应用进行详细介绍。

2 综合运维管理平台的组成架构

综合运维管理平台主要由码流质量监测系统、环境动力监测系统及设备运行状态监测系统3大子系统组成。各子系统将数据实时采集汇总,经过综合判断、处理分析过滤后,推送至综合运维管理平台,经工作站图形化处理后,以图形化界面推送至监控大屏进行直观展示。整个管理平台的构成如图1所示。

图1 综合运维管理平台组成架构

2.1 码流质量监测系统

码流监测系统采用旁挂方式,将所有节点节目流,包含接收机、编码器、切换器输出的码流数据采集后,经过过滤分析汇总,送至综合运维管理平台,生成图形化界面。任何一个节点的节目码流质量出现异常时,监测界面会及时高亮告警,同时发出语音提示。

2.1.1 高质量全方位监测

信号质量监测系统采用IPMon视频质量监测,4台监测服务器同时运行,监测800余个组播地址对应的节目。监测探针软件运行环境为X86 Windows/Linux系统,主要监测指标为CC连续计数错误、信号丢失、TR101-290P1、视频画面静帧、EPSNR边缘区域、组播码流速率统计等;系统支持SPTS/MPTS分析、MPEG-2/H.264/H.265压缩标准分析、HLS协议深度分析、TS 文件深度分析等功能[2]。

2.1.2 实时监控+节点回查

信号质量监测系统全天7×24小时实时监控运行,监测界面以流水线的形式向左移动,界面支持多频道和单个频道面显示。多频道监测界面以横条显示,每个横条对应一个节目信号,正常情况下横条均是绿色,当节目信号有故障时,横条上会有相应的黄色竖条显示。单频道界面可以实时显示码流各项指标,包含码率、视音频参数等,如图2所示。整个监测系统支持告警情况以Email邮件形式发送给运维人员。

图2 单个组播码流监测页面

2.2 环境动力监测系统

环境动力是整个IPTV集成播控直播平台稳定运行的基础。传统的机房环境状态只能靠人工定时去巡查,这样的巡查需大量的人力且不能全天24小时覆盖,设备的稳定运行存在一定的安全隐患。动力环境监测系统的建设,大大减少了人力定时去机房巡检环境的频率,为设备稳定运行提供一个安全可靠的优良环境。

整个动力监测系统采用ARM架构设计方案,在机房安装具备RS-485、RS-232接口、红外接口、模拟音频采集接口,并支持TCP/IP、简单网络管 理 协 议(Simple Network Management Protocol,SNMP)、可 扩 展 标 记 语 言(Extensible Markup Language,XML)等协议的模块来实现对环境数据的实时采集.采集数据包括整个机房不同位置的温度、湿度、烟雾、水浸等,同时对不间断电源(Uninterrupted Power Supply,UPS)、空调等动力设备的运行数据采集过滤分析汇总后,推送至综合运维管理平台,送至监测大屏直观展示。

运维人员可以根据实际需要,对温湿度阈值进行设定。系统实时监控温湿度、烟感、水浸等数据,如果其中一项或者多项数据超过设定阈值,触发的报警信息会实时发送到主程序进行声光报警,提醒运维人员及时处置,实际监测界面如图3所示。

图3 动力环境实时监测界面

2.3 设备运行状态监测系统

直播平台设备类型复杂,各种播出设备、网络设备、传输设备等较多,每个设备的稳定运行关乎着直播节目的安全播出。设备监测系统对整个平台设备运行数据进行实时采集,采集内容包括各设备运行参数、温度、内存使用率、CPU占用率、端口流量峰值、端口状态、链路状态等。只要其中一项超过设定的阈值或者出现异常,系统都会及时发出声光告警,提醒运维人员及时处置,同时发送远程告警邮件,方便远程维护管理。系统还重点监测交换机和网络安全设备的运行状态。

2.3.1 交换机运行状态监测

交换机是整个直播平台系统的核心设备,其运行的稳定程度直接关系到所有节目的安全播出。交换机新上架后,运维人员只需将其对应的型号写在项目根目录的xml文件夹中,即可在监测界面查看到设备的基础信息、端口流量、端口状态、内存及CPU占用率等。“端口历史流量统计”处,显示端口近3小时、6小时、12小时、24小时的流量曲线图,支持给单个端口配置流量阈值,可以配置端口最大最小阈值,也可以给端口起别名[3]。监测界面如图4所示。当端口时间流量超出最大阈值或者小于最小阈值时,系统均会发出声光报警和远程告警邮件。

图4 交换机监测界面

2.3.2 网络安全设备监测

在IP化播出环境中,网络安全是整个直播平台系统的重中之重。将网络安全设备运行状态纳入综合运维管理平台,以图形化的方式显示,简单明了,有异常时发出声光报警,让运维人员可以实时掌握系统的网络安全性。

网络安全设备监测包含天清入侵防御系统、上网行为管理、天境脆弱性扫描与管理系统、数据库审计系统等。对于防火墙设备,主要显示CPU利用率、内存使用率以及防火墙端口状态。界面显示的设备信息,包括名字、IP、CPU利用率和内存使用率的阈值等都可以配置,可配置预警值和报警值两级报警阈值。如果超过预警值,界面显示的CPU利用率和内存使用率会对应显示黄色标识;若是超过报警值,界面显示的则是红色标识。若监测到端口故障,系统也会发出报警信息,同时向运维人员发送告警邮件[3]。监测界面显示如图5所示。

图5 网络安全设备监测界面

2.3.3 设备细节精准定位

设备监测系统除对设备运行指标进行监测外,同时将设备硬件信息全部纳入运维平台进行管理。运维人员可以方便快捷地查询到每个设备所处的位置,包含地理位置、机房名称、机架编号等,同时可以查询到每个设备端口对应的线缆编号、所属组别地址段等[4]。为更方便地运维管理,综合运维平台中专门开发了设备二维码管理系统,将专用打印机连入系统后,即可选择模板或者自定义编辑二维码样式,可以为每个设备生成独立二维码,运维人员只需将该二维码贴在设备的机身上,需要了解设备业务信息时,只需使用扫描枪扫描二维码,即可查看该设备的所有业务信息。

3 综合管理运维平台的优势

3.1 监管控融为一体

综合管理运维平台通过可视化拓扑呈现,运行分析、故障决策等功能实现综合管控,降低了播出运维的难度,使得运维统一化、简便化、智能化、灵活化,直接提高了运营质量和安全播出保障水平。系统采集信息通过大数据分析评估,对业务、设备、资源进行精细化管理,为系统的升级改造提供合理化的参考价值;从点到面实现了平台的统一管理与控制,有效辅助运维人员工作,降低对值班人员的要求,进一步降低运维人力成本[5]。

3.2 高效安全

将看不见业务信号指标、设备运行状态等数据信息采集汇总,系统经过分析过滤后以图形化的界面进行展示,便于值班人员的判断和处理。数据的实时采集打破传统的运维方式,取代了只能靠人工定时定点去机房巡查设备、检查环境的方式;多种终端如电脑手机等进行实时远程监控,有故障告警时可通过多种方式给运维人员发送告警信息,实现了移动运维;对过往历史故障信息保留存储,可以随时在线分析故障检索;监测界面任何异常节点均高亮显示、故障亮灯锁定故障环节和发出语音告警提示,能让运维人员快速定位到故障点,大大地提升运维效率,减少故障处理时间,保障节目的播出安全。

4 结 语

综合运维平台运行稳定,功能可靠,通过对设备运行状态、信号码流质量、动力环境的实时监控,系统可以精准地定位各个故障信息,可以快速、高效地辅助运维人员定位故障、排除故障和解决故障。平台辅助运维人员解决故障,弥补了运维人员不能及时巡检所有设备信号的缺陷,大大提高了整个直播平台的安全性,保障节目的安全播出。

猜你喜欢
码流端口运维
分布式码流实时监控与录制系统的设计与实现
数字电视TS码流协议简要分析
一种端口故障的解决方案
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
端口阻塞与优先级
基于ITIL的运维管理创新实践浅析
8端口IO-Link参考设计套件加快开发速度
一种比较ASN.1码流差异的方法