地面数字电视广播单频网的智慧运维平台建设

2024-10-22 00:00:00王苹
卫星电视与宽带多媒体 2024年12期

【摘要】随着网络规模的扩大和复杂性的增加,传统的管理手段已经无法满足网络高效运行的需求。因此,有必要对地面数字电视广播单频网的智慧运维平台建设进行探讨。本文从监控与报警模块、数据分析与优化模块、自动化运维模块、用户管理模块等方面,完成地面数字电视广播单频网智慧运维平台功能模块设计,并对该平台进行测试。结果表明,所提智慧运维平台监测误差不超过1%,且故障恢复率在99%以上,可有效完成对地面数字电视广播单频网的运维工作。

【关键词】地面数字电视广播;单频网;智慧运维平台

中图分类号:TN929 文献标识码:A DOI:10.12246/j.issn.1673-0348.2024.12.019

1. 地面数字电视广播单频网智慧运维平台功能模块设计

随着科技的日新月异,地面数字电视广播作为传统广播与新技术结合的产物,在覆盖范围、信号质量和传输效率上均有着显著优势[1]。为满足日益增长的用户需求,并确保服务的稳定可靠,单频网智慧运维平台应运而生,其功能模块划分如图1所示。

1.1 监控与报警模块

监控模块采用Agent方式实现对服务器的集中管控,Server与Agent之间通信应采用OpenSSL加密技术[2]。平台采用Agent方式实现对服务器的集中管控,平台的管控体系采用两层的分布式C/S典型架构,主要包含智能Agent,提供各种服务的Server。图2展示了监控模块的整体架构。

BK Agent是控制中心提供各种服务的执行程序,安装在平台内管的各服务器中。BK TaskServer是控制中心中对Agent所在服务器进行指令管理的程序,对各服务器中的Agent下发各类控制指令,包括执行脚本或执行命令行等。BK FileServer是控制中心中对Agent所在服务器进行文件传输管理的程序。对安装了Agent的服务器,该程序提供了安全、稳定的文件传输能力,与TaskServer程序相互配合,执行控制中心对服务器的文件分发任务。BK DataServer是控制中心中对Agent所在服务器进行数据传输管理的程序。对Agent采集到的数据,该程序提供了汇聚、流转、分类等相关能力。Redis在控制中心中提供存放缓存数据的能力。MySQL在控制中心中提供管理数据的存储,方便控制中心开展基本的管理功能。Zookeeper在控制中心中提供集群管理的能力,主要包含了集群节点的互相发现、探测有效性等功能。BK DB Proxy在控制中心提供了管理Redis集群的能力,为控制中心Redis提供代理服务,方便对Redis进行统一的集中管理。

监控模块通过部署在网络设备上的传感器和执行器,实时收集包括设备温度、电压、电流、网络流量等在内的设备运行数据。这些数据通过无线网络传输至监控中心,实现对网络设备的实时监控。监控中心对收集到的数据进行分析,从而识别出可能存在的故障风险。例如,通过分析设备温度和电压数据,可以判断设备是否过热或电压异常,并提前发出预警。同时,结合历史数据和故障案例,建立故障预警模型,实现对故障的智能诊断。当出现异常数据时,系统会自动发出预警信息,告知运维人员故障可能的原因和位置。监控中心通过可视化技术,将故障信息展示在屏幕上,便于运维人员快速定位故障设备或线路[3]。并且系统还会提供故障排除建议,协助运维人员快速解决故障,降低故障对网络运行的影响。监控与报警模块不仅可以独立运行,还可以与其他模块联动,实现更高效的运维。例如,当发现某个区域网络质量下降时,可以联动信号质量检测模块,获取该区域的信号质量数据。此外,监控与报警模块还可以实现远程管理功能,运维人员可以通过手机或电脑客户端实时查看网络设备的运行状态,接收预警信息,进行远程控制等操作,提高运维的便捷性和效率。

1.2 数据分析与优化模块

该模块具备强大的数据收集能力,通过各种传感器和网络设备实时获取监控数据。这些数据种类繁多,包括信号质量、覆盖范围、信噪比以及误码率等。为了确保这些数据的安全性和可用性,该模块还采用了高效的数据存储技术,如分布式存储系统,以降低数据丢失的风险。

利用大数据分析技术,如数据挖掘、机器学习等,对海量监控数据进行深度分析。通过分析用户行为、网络负载、信号质量等数据,预测潜在问题并提前采取措施;引入人工智能技术,如自然语言处理、图像识别等,对监控数据进行智能分析和诊断。通过识别异常信号、干扰源等,快速定位故障位置,提高故障处理效率;基于大数据和人工智能分析结果,生成优化策略和建议,如调整发射功率、优化频谱利用率、改善信号覆盖等,以满足用户需求并降低运营成本。

1.3 自动化运维模块

自动化运维模块的主要功能包括设备远程控制、故障预警、设备状态监测和远程维护等。该模块通过与设备的通信接口进行连接,实现对设备的远程控制,如开关设备、调整参数等。同时,它还能实时监测设备的运行状态,一旦发现异常,立即发出预警,以便运维人员及时处理。此外,该模块还能根据历史数据和实时数据对设备进行预测性维护,有效降低设备故障率[4]。自动化运维模块基本逻辑架构如图3所示。

自动化运维模块主要是利用Windows和Linux服务器的批量管理基线的工具,对单频网服务器进行基线扫描和初始化的功能。基线工具会根据每个运维对象的实际运行情况自动调整基线的基准值,如果突破了会进行自动诊断和告警。利用与资源中心、作业中心等模块的联动,通过API网关和标准运维(调度引擎)进行编排,实现对广泛设备的运维巡检。

自动化运维模块通过远程控制和监测设备,减少了人工干预的次数,提高了工作效率。以往需要人工现场操作或定时巡检的工作,现在可以由自动化运维模块自动完成,大大节省了人力成本[5]。自动化运维模块的故障预警功能可以在设备出现异常时立即发出警报,使运维人员能够快速响应并处理故障。通过实时监测设备状态,自动化运维模块可以获取更准确的数据,为预测性维护和设备优化提供依据,并且可通过预设的规则和算法,实现标准化操作。

1.4 用户管理模块

用户管理模块是配电网无线传感器网络运维平台的重要组成部分,核心任务是设定并管理不同的用户角色及其对应的权限。首先系统管理员需要明确并设定各个用户角色,如系统管理员、普通用户等。每个角色对应不同的权限,如查看、编辑、删除等操作。管理员拥有最高权限,可以管理其他用户角色,分配任务,修改系统设置等。普通用户则根据其职责和需求,获得相应的权限,如接收信息、反馈问题等。在设定好用户角色和权限后,管理员可以根据实际情况为每个角色分配不同的任务,如维护系统、更新数据、处理故障等。通过任务分配,管理员可以确保每个角色都能在自身职责范围内发挥作用,同时,管理员应根据实际情况调整任务分配,以应对突发情况或系统变化。管理员可以通过动态网页向用户发送信息,及时传达系统动态和任务分配情况。为实现用户管理模块,可以采用多种方式,如数据库存储用户信息、动态网页技术(如JavaScript)进行页面交互等。

1.5 告警管理模块

告警管理模块的功能主要是通过监测设备的运行状态,发现并记录设备的异常情况。一旦出现故障或异常情况,该模块能够迅速将这些信息反馈给运维人员,并自动生成相应的告警日志,以便后续的追踪和分析。此外,告警管理模块还可以通过设置不同的告警级别,确保运维人员能够优先处理重要告警信息,提高故障处理的效率。在具体操作中,可以使用传感器来实时监测设备的运行状态,一旦出现异常情况,传感器就会自动触发告警信号。

对于设备告警的统一管理和通知,可以通过设置不同的告警阈值和触发机制,实现对不同设备告警的分类管理。使用告警推送技术或短信、邮件、电话等,将告警信息发送给相关运维人员或管理人员,以便能够及时了解设备故障情况并进行处理。在告警发生后,运维人员需要按照一定的流程进行故障排查和处理,可将常见的故障处理流程嵌入到告警管理模块中,通过自动化方式进行故障排查和处理。

1.6 系统管理模块

系统管理模块主要负责平台的配置、维护和管理。该模块通过提供一系列功能,如用户、设备、数据、日志管理等,实现对平台的全面掌控。系统管理模块功能:①对平台的各种配置参数进行设置和管理,如频道数量、发射功率、调制方式等参数的设定;②对平台所使用的各种设备进行维护和管理,如设备的定期检查、维修、更换等,确保设备能够正常运行,延长设备使用寿命,降低故障率;③对平台所采集的数据进行存储、处理和分析。通过对数据的分析和挖掘,可了解设备的运行状态、发现潜在问题、优化资源配置等;④对平台的操作日志进行记录和管理。通过查看操作日志,可了解平台的使用情况、发现异常操作、追踪问题根源等,为平台的稳定运行提供保障;⑤对平台的使用者进行管理和授权。通过对用户进行分类、授权,可以确保不同的用户只能在其权限范围内操作平台,防止越权操作和数据泄露。

1.7 可视化与报表模块

可视化技术通过图表的形式展示网络性能数据,包括信号质量、覆盖范围、频率偏差等关键指标。这些图表实时更新,用户可以随时了解网络状态。而且可视化技术还能以图形方式呈现网络拓扑结构,帮助用户更好地理解网络组成和分布。报表模块将根据可视化技术提供的网络性能数据,生成各类报告。这些报告包括故障排查报告、覆盖范围分析报告、频率偏差统计报告等。用户可以清晰地了解网络中存在的问题和潜在风险,及时采取相应措施进行解决。根据报表生成的数据,决策者可以了解网络性能的总体趋势,评估当前运维策略的有效性,并根据实际情况调整策略。

2. 智慧运维平台测试

单频网作为地面数字电视广播的重要组成部分,其稳定性和可靠性直接关系到电视广播的播出质量。因此,构建智慧运维平台,对单频网进行智能化管理。

为验证所提出的地面数字电视广播单频网智慧运维平台的建设有效性,展开测试,以确保其在实际应用中的稳定性和可靠性。现针对该智慧运维平台对单频网运行状态故障的实时监控能力和修复能力展开测试,分别利用误码率指标、故障恢复率指标对其故障监控能力和修复能力进行衡量。则利用所提的智慧运维平台,分别对10个地面数字电视广播单频网进行运维巡检,则误码率指标、故障恢复率指标结果分析如图4和表1所示。

根据表1所得结果可知,采用所提智慧运维平台对所选的10个地面数字电视广播单频网进行运维巡检,其所监测的误码率结果基本与其单频网的实际误码率结果一致,仅存在个别差异,但其监测结果误差均不超过1%。由此可说明,所提智慧运维平台具有较强的单频网运行状态故障的实时监控能力,能够有效发现单频网运行过程中问题,对电视广播单频网及时实施修复措施。

根据图4结果可知,采用所提智慧运维平台对所选的10个地面数字电视广播单频网进行运维修复,其故障恢复率始终高于预期,可达到99%以上。由此可说明,所提智慧运维平台具有较强的故障修复能力,可有效完成对地面数字电视广播单频网的运维工作。

3. 结束语

智慧运维平台可以实现网络智能化管理和运行维护的高效性。该平台集成了多个功能模块,可以全面监控网络的运行状态和安全情况,及时发现和解决问题。同时,智慧运维平台还可以通过对历史数据进行分析和处理,为网络优化和升级提供数据支持。因此,地面数字电视广播单频网的智慧运维平台建设具有重要的现实意义和应用价值。

参考文献:

[1]段琪.地面数字电视广播单频网"智慧运维"平台建设[J].卫星电视与宽带多媒体,2021(15):99-100.

[2]罗伟.基于免疫多Agent技术的煤矿综合能耗B/S动态监控方法[J].矿冶,2023(6):115-120,130.

[3]杨方正,康建华,徐博源,etal.地面数字电视单频网系统运维探讨[J].广播与电视技术,2020,47(7):5.

[4]陈小兰.浅谈地面数字电视单频网组网[J].西部广播电视,2022,43(13):231-233.

[5]王星.广播电视高山转播台站智慧运维系统设计与典型应用[J].电视技术,2023,47(8):123-125.

作者简介:王苹(1977—),女,四川峨眉山人,工程师,研究方向:微波、地面数字电视。