罗 清(作者单位:江苏省广播电视总台)
江苏广播网络中心机房监控管理平台的建设
罗 清
(作者单位:江苏省广播电视总台)
摘 要:为满足广播事业建设发展需求,江苏广播新建了有云计算能力和网络高吞吐量的网络中心机房。具有高可靠性和统一集中管理的监控管理平台是保障中心机房7×24小时安全运维的必要手段。本文介绍了包含视频监控、消防监控、动力监控和环境监控子系统的监控管理平台的设计建设,以及项目实施后的实际应用情况。
关键词:监控管理平台;信息采集层;远程浏览监控
在媒体融合与互联网+的发展背景下,江苏广播事业建设快速地发展。为积极响应江苏广播电视总台深入推进“十项工程”,大力推进技术服务机制,优化技术支撑保障,满足新一代广播全台网、未来江苏广播私有云、以及CDR数字音频广播等新兴项目的建设需求,广播传媒中心异地选址,新建了江苏广播云服务网络中心机房,具备云计算能力和网络高吞吐量。新机房重新构架了全台网基础设施,主要包括双路配电UPS系统、恒温恒湿机房空调系统、新风系统、防雷接地系统、安防监控、环境监控系统等。2014年上半年完成新旧机房技术系统割接,新机房正式投入使用。作为无人值守的云服务网络信息机房,必须要满足可见、可控、自动化的运行维护要求,因此机房监控管理平台是保障7×24小时安全运维的必要手段。
新机房占地面积约100平方米,分为主机房和电池配电间。其中,主机房按功能规划为网络核心设备区、综合业务网设备区、云存储设备区、广播云设备区共四个区域。在运维原有信息中心机房十多年来管理经验的基础上,我们确定了新机房的监控管理平台的建设目标如下:(1)为机房内各系统及设备运行提供高可靠稳定的监控信息资源;(2)建立机房运维管理数据库,实现对机房日常运维的规范管理;(3)集成度高,免维护,提高机房管理工作效率,节省机房运行管理费用;(4)系统软硬件采用模块化结构设计,具有可扩展性、可变性。
图1 监控管理平台的监控对象
图2 机房监控管理平台架构图
机房监控管理平台的监控对象如图1所示,主要包括:视频监控、消防监测、动力监控、环境监控等。通过对相关监控数据的收集、整理、分析,形成对江苏广播云服务网络中心机房运行状态的全面监控,提高机房运维管理水平和效率。在未来规划中,监控平台还将接入总台技术管理系统的全景化监控模块,进行可视化的展示。
机房监控管理平台由现场设备信息采集层、监控服务器、本地或远程浏览终端三个部分组成,架构如图2所示。
现场设备信息采集层主要包括供配电监测、UPS监测、空调监测、温湿度监测、漏水监测、消防监控、安防监测和视频监控。
3.1 配电监测子系统
采用4个八路隔离高压输入模块,在电池配电间的配电柜上安装电量监测仪,电流监测用电流互感器变换后再由电量仪测量,实时监测配电柜主进线的相电压、相电流、相功率、频率、功率因素等,以及监测各配电柜的输入和输出。
3.2 UPS监测子系统
UPS的RS232/485通讯接口通过一体化智能采集器智能接口接入,采集到UPS各种运行数据及状态信息,经过处理后的数据发布到对外数据接口,集中监控平台读取监控服务器对外数据接口的数据,实现对UPS在线实时监控。
3.3 精密空调监控子系统
通过精密空调厂家提供RS232/485通讯接口及通讯协议,对精密空调运行状态进行在线实时采集监控,实现对空调的制冷器运行状态、压缩机高压故障、过滤网阻塞等的监测与报警。还可以控制空调机的启停,改变温度与湿度的设定,实时显示并保存运行参数和状态。
3.4 温湿度监测子系统
在机房的四个重要区域及重要机柜内安装智能温湿度传感器,使用智能通信接口RS485方式并接接入,以3D仿真图示定位方式对温湿度的实时数值进行展示。当传感器检测到的数据超过设定的上限或下限时,监控系统会发出警报。
3.5 漏水监测子系统
采用耐腐蚀、高灵敏度的定位式测漏控制模块,将两台精密空调地板底下可能会有水源的地方用漏水感应线围起来,感应设备通过传感器将漏水信号及时地输送到监控系统,并在第一时间报警。
3.6 消防监测子系统
采用8路隔离数字量输入模块,对消防厂家提供的干接点信号进行采集,与监控服务器进行通讯。同时,消防输出信号接入门禁系统,实现消防联动,实时显示并保存消防主机的放气状态及报警情况。
3.7 安防监控
通过红外微波型双鉴探测器进行布防,8路隔离数字量输入模块,对机房内大物体的移动进行实时监测,出现异常按策略对相应状况进行告警。
3.8 视频监控
采用定焦定向广角彩色半球摄像机,监视8路视频,对机房室门的进出及机房服务器区的状况进行现场视频场景监控。与动力环境监控系统联动,一旦有故障会自动打开摄像头进行拍照并录像,图像内容自动保存到硬盘录像机中,供日后查询管理。
3.9 门禁管理子系统
用RS-485总线与门禁控制器通讯,采用智能感应卡方式的,实现对机房进出人员控制和记录。当有人刷卡进门时,系统立刻弹出相应的门禁记录管理窗口,可将持卡人管理资料一并弹出。能够实现远程开门,有门开超时报警等。
监控服务器采用专用于无人值守的监控嵌入式主机,选用D igiVi3000网络型服务器,配置GSM短信模块、AM S告警管理软件。监控服务器集中了现场视频采集、监控数控采集、协议转换、联动控制、内嵌WEB服务器等各种功能,进行统一的集中监控管理,提供友好的WEB服务,实现个性化的需求。系统支持短信分级报警,当报警信息没有及时回复时,能自动地再次发送报警信息给更高权限的管理人员。为保证报警的准确性。报警系统具备延时过滤功能。
监控服务器既支持C/S客户端监控模式,也支持B/S浏览监控模式。监控服务器可以在本地通过IE浏览监控设备,也能够通过互联网远程访问管理站,实现专业集中监控,为系统管理人员提供多屏、集中报警、报表、管理等功能。即使脱离网络,设备也可独立运行,存储监控数据和联动控制。
系统运行至今已一年多时间,稳定可靠。在实际应用中,我们依据需求不断地调整系统设置,较好地完成对信息中心机房的日常管理维护。其中,主要子系统模块应用介绍如下。
4.1 配电监测子系统
当监测的电压或电流超过设定的允许值时,配电监测子系统诊断为有故障事件发生,监控主系统发出报警。2015 年1月,曾发生因装修工人误操作,将楼道强电井中一路UPS的输入电闸关闭,造成一路供电断电,监控管理平台及时发出警报,避免了重大的办公网络中断事故发生。
图3 UPS监测子系统界面
图4 精密空调监控子系统界面
图5 温湿度监测子系统界面
图6 安防监控子系统界面
4.2 UPS监测子系统
监测各项UPS参数,如图3所示。2015年UPS系统曾发生过四次警告,但都未影响使用,运维人员都及时联系了相关人员进行针对性的维修恢复。
4.3 精密空调监控子系统
精密空调监控子系统包括:监测和控制。监测主要参数如图4所示,可以远程开机、关机、对空调的温、湿度的远程设定等。2015年盛夏,空调曾出现冷凝压力过高、压缩机高压故障、过滤网空气过滤超时等监测报警,经及时联系相关空调维护人员修复。
4.4 温湿度监测子系统
在机房主要区域共布有5个监控点,如图5所示,由温湿度传感器采集各机房内的信号,实时显示温度信号、湿度信号。截至目前机房温湿度一直都很稳定。
4.5 安防监控子系统
安防采用吸顶式红外探测器、监视防盗入侵情况,同时也可以让上级部门对对运维人员日常工作起到随时随地的检查监督的作用。如图6所示。
4.6 视频监控配置
视频监控采用彩色半球定焦定向广角摄像机,对机房室门的进出及机房服务器区的状况进行现场视频场景监控。硬盘容量为2TB,监视8路视频录像,保存30天,其中每路视频24小时的CIF录像文件大小为3G。
总之,通过机房监控管理平台的建设应用,我们很好地实现了对江苏广播网络信息中心运维管理,做到无人值守,提供高可靠的监控信息资源,统一集中的监控管理,实现节能化、功能化和高效率地管理维护,为今后即将开始的新一代广播制播系统的建设以及提供以云采编、云制作、云分发、云存储等云服务信息中心打下了良好的运维环境基础。网站订购信息等,以提高客户对电子营业厅的粘性和忠诚度。
图7 机房视频监控图像及可以选择视频回放页面
1.2.2 统一接口平台
统一接口平台对BOSS系统、呼叫中心等多个第三方业务系统进行统一的接入管理,通过接口封装和适配,屏蔽第三方业务系统变化对电子营业厅的影响,保障业务流程各个环节的正常运行。
1.2.3 统一后台管理
统一后台管理为后台管理员和操作员提供可视化操作界面,为电子营业厅系统稳定运行提供支撑,主要包括权限管理、配置管理、订单管理、产品管理、积分管理、内容管理、报表管理、日志管理等。
1.3 与外部系统关系
1.3.1 与BOSS系统关系
主要包括电子渠道与BOSS之间的实时请求和同步数据接口,实时请求采用WebService接口,同步数据采用FTP文件方式。功能上涵盖业务订购与退订、账本查询、账单同步等。
1.3.2 与支付平台关系
通过与现有支付平台的对接,为电子渠道提供涉及资金账户的支付处理调用。电子渠道通过调用相关接口,可发送支付处理请求,支付平台根据请求内容进行逻辑处理。其功能包括银行卡支付/退款、对账、充值等。
1.3.3 与客服系统关系
电子渠道与现有客服系统采用WebService方式的实时接口对接,提供电子渠道业务的订购情况、缴费情况的查询以及相关业务的受理,可实现电子渠道投诉建议、工单等信息的实时通知,可对在电子渠道上用户的业务预约、业务咨询等业务作出快速响应。
为确保业务系统的高可靠性和高稳定性,建立了相应的监控管理机,实现了对各电子渠道平台的实时监控。系统监控主要包括数据库和应用的监控。
2.1 Oracle数据库监控
作为系统核心之一的数据库,其性能的优劣直接影响到用户的操作体验,因此极有必要对其进行监控,利用Oracle数据库的管理指令以及自定义的告警策略实现对数据库的自动监控。主要监控对象包括:(1)数据库性能,包括Session数、数据库锁、缓冲活动连接数、缓冲池命中率等;(2)数据库表空间,包括碎片化程度、已用/剩余空间、总容量等;(3)数据库连接数,包括用户连接数、登录数、注销数等;(4)数据库进程,包括CPU百分比、执行时间、使用内存数、进程数等;(5)非法访问,即是否有未经授权的IP地址、用户等访问数据库的行为。
2.2 应用监控
应用监控包括进程监控、页面监控、日志监控等。进程监控通过SNMP/WMI/ CLI监控服务器中运行的进程,可全面了解系统资源的负荷,以及服务器中运行的应用程序和服务的进程的性能,当某进程超越设定阀值时,故障管理模块触发相关告警流程;页面监控在检查URL以确保其可访问性以及监控用户登陆状况的同时,还在页面上搜索特定内容,以检测是否遭到破坏;日志监控定时将所有日志文件通过索引引擎制成索引文件提供给监控平台,监控平台通过搜索引擎将日志文件进行特定分类,以便于系统维护人员查找。
电子渠道的实施为广电营销建立了全新的途径,为多渠道营销带来了更多的可能性,为江苏有线苏州分公司在移动互联网时代的整体竞争力、实现创新发展提供了有力的支持,对于整合传统内容、拓宽营销渠道、优化用户交互方式等方面有着指导意义。同时,通过大数据技术的应用,进一步发挥了现有电子渠道的作用,通过用户行为分析,使业务运营发展始终基于科学预测,提升了用户的认可度。
参考文献:
[1]王喆.基于Hybrid App的手机银行开发与探索[D].天津:天津大学2013.
[2]韦恩敏.广电网络渠道建设及运营浅析[J].中国数字电视,2011(7).
[3]王朝晖.湖南移动多电子渠道建设研究[D].长沙:中南大学2007.
(上接第210页)