宗志龙,王 纲,付 庆
(1.四川省辐射环境管理监测中心站,成都 611139;2.北京森馥科技股份有限公司,北京 102209)
电磁环境自动监测系统不仅能够连续完整地反映辐射环境质量状况,避免由于人工监测所得的数据的不全面性,还可大幅缩短长时间段监测到获取监测结果之间的时间[1],而且能把监测数据实时向公众显示,并与国家限值进行比较,让民众对电磁辐射有更具体的认识,有利于消除民众对电磁辐射的恐惧心理,因此,建设电磁辐射自动监测系统十分必要。
我国电磁环境在线监测系统的建设始于2005年,北京市环保局购置了第一套自动监测设备,用于处理信访和环境质量跟踪监测[2]。随后各省开始陆续建设电磁环境在线监测系统,截至2018年底全国共计建设约300套系统[3]。四川省于2017年建立了电磁环境自动监测系统,用 2 年时间布设了18个监测自动站站,覆盖全省成都、绵阳、德阳等 10 个地市,涵盖了广播电视发射台、移动通信基站、输变电设施等有代表性的公共区域及大型电磁辐射源,并计划再建27套,实现全省18个地级市全覆盖。
随着电磁环境在线监测系统建设数量越来越多,运行时间越来越长,设备老化故障的情况日渐增多,加上电磁辐射环境自动化监测设备分布地域广,日常运维信息处理量大,传统的人工运维成本高、效率低等缺点也越发突出。本文研发的电磁环境自动监测系统智能运维平台是基于“数据+互联互通”的环保管家服务理念,通过工业软件和智能硬件的赋能,打造以线上线下互联运维、现场远程协同运维、算法数据创新运维为主要手运维管理体系,能够解决现阶段电磁环境在线监测系统运维存在的很多问题。由于目前我国没有电磁环境在线监测系统智能运维系统,待本智能运维平台申请软件原始著作权,存在可观的应用前景。
电磁环境自动监测系统(见图1)是模块化结构,由探头、主机、供电系统、监控、电子围栏、显示屏构成。其监测对象包括广播电视发射台、中波发射台、移动通信基站、输变电设施、气象雷达等大型、典型电磁辐射体。探头可根据监测对象的不同针对性地选配选频探头、工频探头、射频探头,实现24小时不间断监测,现场监测情况经传输设备反馈到后台数据管理中心,后台数据管理中心对采集的数据进行存储和管理。系统配备有远程监控系统,维护监管人员可远距离实施自动无人监控,系统配备的显示屏终端能实时、直观地将监测结果展示在显示屏上,滚动传播电磁辐射监测结果及相关电磁科普知识。
图1 成华公园自动站Fig.1 Chenghua Park automatic station
为了保障电磁环境自动监测系统平稳运行,监测数据正常,站点状态良好,站点及数据的安全,保障数据的准确性、可靠性和获取率,使电磁环境自动监测系统能够有效发挥监测预警和科普宣传作用,电磁辐射自动监测系统运行维护就显得尤为重要。运行维护内容包括远程巡检、定期例行现场巡检及维护、故障即时维修、期间核查及检定等。
(1)远程巡检内容包括网络维护、电力监控、监测数据采集情况查看、监测数据质量查看、设备运行情况查看等。
(2)定期例行现场巡检及维护。现场巡检内容包括站房基础设施外观检查、外部接线检查、功能检查;数据采集与控制系统数据传输、系统软件UPS电源功能检查;探头检查,即数据获取、监测数据是否正常,连接线有无松动、锈蚀,支架有无锈蚀等;展示屏幕检查,即显示是否正常,连接线有无松动、锈蚀,大屏是否完整美观。现场维护包括电力维护、网络维护、监测及采样设备维护等其他维护。
(3)故障即时维修。一旦发现某个自动站运行故障,在故障无法远程排除时通过技术手段确定故障原因,维修人员备好维修需要使用的工具和备品备件,迅速赶往自动站现场进行故障诊断并即时维修。
(4)自动站期间核查及检定。对电磁自动站进行至少每年一次的期间核查及计量检定。
(1)对运维人员要求高,成本高。要保障自动站长期平稳的工作,对运维人员的技术、经验及素质要求很高,首先要熟悉自动站各部件组成及功能,要熟悉自动站发生故障的类型及相应的解决办法,要能从小问题中去发现发生故障的可能,甚至根据自动站以往发生故障规律能预判系统发生的故障提前更换部件。自动站分布比较分散(18个自动站分布在10个市州),现场巡检一次花费的时间成本和资金成本较高,加上运维人员能力参差不齐,现在人工巡检的效率低成本高。
(2)自动站发生故障难判断。自动站的运行维护,对自动站故障的发生时间以及可能性无法做出精准的预测;对自动站设备故障的类型和严重等级难以做出准确的判断,无法综合评估对后续生产运营的影响。故自动站一发生故障,就得装备齐全赶赴故障现场去维修,间接增加了自动站运维的时间和人力成本,自动站平稳性很难保障。
(3)维修成本高、效率低。由于很难对自动站发生的故障进行判断,加上自动站分布比较分散,自动站发生很小的故障(比如重启就能解决的问题)都得赶赴现场,导致维修成本高,效率低。
(4)运维工作难考核。目前四川省主要委托第三方公司进行自动站运维工作,一般不参与自动站现场巡检与维护,使对自动站运维工作的考核难度增加,运维人员巡检规不规范不好考量。
传统的运维管理都是基于传统的运维模式。随着站点日益增多,传统运维不足以快速响应需求了。因此,自动化操作开始被人们所重视。自动操作可以极大地减轻运行人员的工作量。自动操作是通过编程实现,使计算机自动检测出故障,并能根据预先设定的程序进行报警或解决问题。它主要是把运行过程中大量的重复工作转化为自动操作。
智能运维是用“数据+互联互通”的环保管家服务理念,通过工业软件和智能硬件的赋能,打造以线上线下互联运维、现场远程协同运维、算法数据创新运维为主要手段,以现场标准化服务、专业化团队为辅助手段的“云+端”的运维管理体系。实现电磁监测“无人值班,有人值守”的智能化运维新模式。
3.1.1 界面呈现
整体应用功能将通过B/S方式进行展现,不同的应用人员通过登录可以实现相关系统的应用和资源的浏览查询操作。
目前,软件系统的改进和升级越来越频繁,B/S架构的产品明显体现着更为方便的特性。对一个稍微大一点单位来说,系统管理人员如果需要在几百甚至上千部电脑之间来回奔跑,效率和工作量是可想而知的,但B/S架构的软件只需要管理服务器就行了,所有的客户端只是浏览器,根本不需要做任何的维护。无论用户的规模有多大,有多少分支机构都不会增加任何维护升级的工作量,所有的操作只需要针对服务器进行;如果是异地,只需要把服务器连接专网即可,实现远程维护、升级和共享。所以客户机越来越“瘦”,而服务器越来越“胖”是将来信息化发展的主流方向。今后,软件升级和维护会越来越容易,而使用起来会越来越简单,这对用户人力、物力、时间、费用的节省是显而易见的,惊人的。因此,维护和升级革命的方式是“瘦”客户机,“胖”服务器。
3.1.2 支撑管理
支撑管理建设是项目搭建的基础保障,具体内容包含了用户管理、权限管理、日志管理、自身管理等,通过全面的基础设置的搭建,为整体应用系统的全面建设良好的基础。
3.1.3 外部接口
外部接口就是软件系统不同组成部分衔接的约定。由于近年来软件的规模日益庞大,常常需要把复杂的系统划分成小的组成部分,编程接口的设计十分重要。程序设计的实践中,编程接口的设计首先要使软件系统的职责得到合理划分。良好的接口设计可以降低系统各部分的相互依赖,提高组成单元的内聚性,降低组成单元间的耦合程度,从而提高系统的维护性和扩展性。
3.1.4 采集配置
TCP-传输控制协议,提供的是面向连接、可靠的字节流服务。当客户和服务器彼此交换数据前,必须先在双方之间建立一个TCP连接,之后才能传输数据。TCP提供超时重发,丢弃重复数据,检验数据,流量控制等功能,保证数据能从一端传到另一端。
3.1.5 采集指标
采集指标是整体项目的数据资源的保障,本次项目建设要求实现全面的资源共享平台的搭建,所以对于采集指标的有效设计规划对于本次项目的建设有着非常重要的作用。
从整体结构上划分,我们将本次项目建设数据资源分为基础的结构型资源和非结构型资源,对于非结构型资源我们将通过基础内容管理进行有效的管理维护,从而供用户有效的查询浏览。
智能运维软件功能分为资产管理(站点管理)、任务管理(巡检管理)、告警管理、实时状态、前端控制模块等功能模块(智能运维软件登入界面见图2)。
图2 智能运维软件登入界面Fig.2 Intelligent operation and maintenance software login page
(1)站点管理实现了对四川省18座电磁站基本信息管理,如站点数量,站点名称、探头型号等配置信息。并包含对站点的增加、修改、删除、远程重启等操作功能(智能运维软件站点管理见图3)。
图3 站点管理Fig.3 Site Management
(2)任务管理功能,将18座自动站通过任务形式进行周期性自动巡检并上报巡检信息,信息包含设备离线、无网络、大屏显示异常、涉嫌头异常等信息。任务通过定时任务配置进行周期性功能巡检,并将巡检信息持久化的过程,包含服务器状态、cpu使用率、内存使用率、端口状态、探头状态、机箱们状态等信息(智能运维软件巡检信息列表见图4)。
图4 巡检信息列表Fig.4 Inspection Information List
(3)告警管理功能,实时上报18座电磁站运行故障状态,从而第一时间告知运维人员进行确认并处理,告警包含阈值告警、告警级别定义等。告警管理主要实现告警信息检索及各类告警数据统计,如高级告警、中级告警、低级告警数量以及告警处理,告警处理主要针对当前告警信息进行确认说明(智能运维软件告警详细信息见图5)。
(4)实时状态功能,实时显示18座电磁站的数据采集信息,包含射频电场、工频电场、工频磁场、温度、湿度、GPS坐标等信息(智能运维软件站点健康实时状态信息见图6)。
图6 站点健康实时状态信息Fig.6 Real-time site health status information
(5)前端控制模块,通过远程控制对前端控制模块进行指令下发,从而控制设备的重启、物理断电、设备状态检测等。
前端控制模块,通过现场控制器,使用物联网卡接入互联网,再将站房内相关设备电源接入现场控制器,即可通过控制现场控制器电源接口开关来实现相关设备硬重启。据统计,70%~80%的设备故障通过重启设备可以简单排除,前端控制模块可通过简单操作远程重启设备从而排除大部分自动站故障,免除非必要到达现场故障排除,节省大量成本,提高工作效率,从而提高数据获取率(智能运维软件 站点远程重启功能见图7,现场控制设备见图8)。
图7 站点远程重启功能Fig.7 The site remote restart function
图8 现场控制设备Fig.8 Field control equipment
自动化智能运维软件利用现代化信息化物联网技术,通过其任务管理(巡检管理)、告警管理、前端控制功能模块,能有效提高环境保护工作的效率、安全性,提高资源的利用效率;能节省大量人力成本、时间成本和资金成本,提高运维工作效率,从而提高了站点的数据获取率;能有效解决传统自动站运维中发生故障难判断、维修成本高、效率低、运维工作难考核等问题。其可视化界面、可维护性(公有云、私有云,局域网均可部署)、可扩展性(能满足多样化自动站)、安全性(权限可控查询、数据加密处理)特点,使其应用前景更加可观。