基于“多站融合”的智能运维平台研究*

2022-11-16 08:40钱恒顺王婷婷
科技与创新 2022年15期
关键词:储能运维数据中心

钱恒顺,于 聪,温 磊,王婷婷

(南瑞集团有限公司,江苏 南京211106)

1 背景及意义

国网公司2019 年两会明确树立了“三型两网,世界一流”的新时代战略目标,并指出要“探索利用变电站资源建设运营充换电(储能)站和数据中心站新模式”。作为公司新时代战略的重要落脚点,开展变电站、充换电(储能)站、数据中心站“多站融合”的建设探索,实现多种要素的集成创新、跨界创新,对于推动电网由传统的枢纽型向共享型发展,为公司注入新的发展动能,具有重要意义[1-2]。

“多站融合”是指利用变电站空闲地表资源,根据“因地因站因需”原则,以对外增值服务为目的,可选集成建设数据中心(数据站)、充换电(储能)站、光伏、5G 基站、北斗基站、供冷供热综合能源站。“多站融合”以能源互联网为支撑,汇聚各类资源,促进供需对接,挖掘电力基础资源价值,提高资源利用效率,解决公司和电网发展的突出问题,应对挑战,开辟新的发展路径。

2 多站运维需求分析

“多站融合”不是变电站、充放电(储能)站、数据中心等站的简单堆砌叠加,而应该是在功能集成复用的基础上,实现整体的优化。针对“多站融合”场景下的运维需求以及电力行业的发展趋势,传统人工运维是基于单站的独立运维,分散管理,无法满足“多站融合”的统一运维,需要研究“多站融合”运维体系建设与配套工具,对“多站融合”的运维信息进行有效集成,能够快速处理海量数据,实现“多站融合”的智能运维,支撑电力物联网建设与“多站融合”的有序推进。

2.1 变电站需求分析

变电站为改变电压的场所。为了把发电厂发出来的电能输送到较远的地方,必须把电压升高,变为高压电,到用户附近再按需要把电压降低,这种升降电压的工作靠变电站来完成。变电站是由一次系统和二次系统构成的,一次系统实现的功能是电能传输、电能分配、电压转换,二次系统实现的功能是对一次设备进行监视、测量、控制、保护和调节。变电站的智能运维平台的主要功能是对二次设备进行在线监视、状态评估及监视预警、故障定位、二次检修辅助安措、配置文件管理、保护定值管理、故障信息管理及综合分析等多维度运维管理,提高变电站二次设备维护水平,需要将设备进行可视化展示,为变电站二次系统的日常运维、异常处理、事故分析以及检修等工况提供多维度的可视化信息支撑、决策及安全操作的运维管理平台,提高设备精细化管理水平。

2.2 数据中心需求分析

由于企业信息系统的增多及访问量增大,企业需要持续增加IT 设备数量来维持业务访问性能,因此数据中心的IT 系统变得越来越复杂,任何一个IT 设备资源出现故障时都需要IT 运维人员手工查找与排查故障,使得运维人员难以从容地处理各种各样的网络设备、中间件、业务系统等问题,日常运维工作还是处于被动等待的运维管理状态中,运维事件的发现收集操作为传统手工方式,往往是故障事件发生后,运维人员被动告知后去处理问题,而IT 系统通常是复杂的,因此运维人员通常难以对故障根源进行及时的定位和排查,需要耗费大量时间修复故障,严重制约IT 设备与系统运维的响应速度和执行效率,影响企业单位IT信息系统的顺利使用。出现这些问题的部分原因是企业缺少高效智能的IT 监控和诊断运维工具,导致故障事件难以被高效、准确地处理。通过建立智能运维监控平台,对网络、硬件、安全设备、操作系统、数据库、中间件、应用系统、机房空调、UPS 等资源进行实时监控采集,能够自动地收集信息系统中各类IT 资源设备运行状态、数据库状态、中间件运行状态和网络状态等,及时发现各类IT 资源运行过程中的异常,通知相关责任人和启动相关运维流程,大幅度提升IT资源的运维效率和运行质量。

2.3 储能站需求分析

储能系统作为“多站融合”的重要支撑子系统,其运行的稳定性、可靠性和安全性直接影响项目的成功与否。储能系统由大量的单节电池串并联组成各个子系统,子系统再组成整个大的储能系统。整个储能系统中包含上万个电压信号、几千个温度信号以及其他的各种信号数据,因此带来了庞大的储能系统数据。储能电站的运维不仅仅是基本的巡检、值守、保养,更要不断积累运行数据,对当前电池的容量和健康指标进行实时跟踪,进而不断调整控制策略,甚至可能涉及设备硬件层面的改动等。因此运维人员需要具备较高的知识水平和丰富的实操经验,才能高水平地运维,提升电站的盈利。但现实情况下,优秀的运维人员稀缺而难招,提升运维能力也不能一蹴而就。通过智能运维平台,借助数据信息的力量,对电池侧海量运行数据进行采集、存储,实时监控电站状态,基于大数据分析引擎进行统计分析,自动运算分析结果,包括趋势分析、电池预警分析等,帮助运维人员快速预警、排除故障,从而实现全景展现电池运行状态和精细管理电池全生命周期,保障电池系统的安全运行。

3 运维平台架构设计

在“多站融合”场景下,运维监控将从传统人工运维向数据运维进行转变,对多站生成的运维数据,如变电数据、储能数据、IT 设备数据、日志数据等全站运维数据进行集中采集、统一存储,采用机器学习、大数据分析等技术,识别出具体的关键运维数据、挖掘多站运维数据间的内在逻辑关系,建立不同应用场景的运维模型,对变电站设备运行状态、业务数据进行全方位运维管理,对数据中心的环境进行监控显示,对储能电池的全生命周期健康状态进行管理。

3.1 数据采集层

数据采集层负责从变电站、储能站、数据中心站采集各类设备的运行信息、状态信息、日志信息、流量信息等,数据经过统一接口采集适配器的建设部署,实现数据的采集、缓存及并发处理。首先基于数据的来源不同遵从标准接口协议,利用服务编排组件实现对接,并按照需求对来源数据进行格式处理后借助数据队列定义的分类,进行数据分组发送到不同的队列中,最终利用队列将数据发送到大数据平台,再经过数据格式标准化、数据归并、数据压缩等处理后,完成“多站融合”场景下的全站运维数据采集,提交给上层数据处理平台。采集后的信息经过归并汇总后可在系统中进行查看和编辑。

3.2 数据处理层

数据处理层将采集到的原始数据按照遥信数据、遥测数据、业务系统数据、IT 资源状态数据、网络数据、日志数据等进行分类、统一存储。统一数据存储是一种基于Bigtable 数据模型构造的面向对象的分布式图数据库,将多源异构数据统一存储于一个大数据平台,进行统一的数据建模、查询和分析。在数据处理过程中,通过规则引擎,进行数据解析、数据清洗、数据丰富、数据转换、数据映射、数据关联等操作,调用相关性分析算法,进行关联告警或者预警。同时,可以根据知识图谱,检测实体间的关联关系,实现配置实体数据和关系数据的实时更新提示。数据经过基于站点、基于统计、基于规则的关联分析后,科学合理地定义运维事件的性质和处理级别,作为展示平台的数据基础。

3.3 数据分析层

数据分析层对实时采集数据信息进行分析判断,对发现的大量事件进行过滤、分析和管理,对监控历史数据进行分析和管理,以丰富的报表展示手段对各类数据进行直观显示,辅助以网络拓扑图形化功能为平台用户提供方便快捷的信息获取途径。借助知识库提供的分析策略,对运维数据进行分析,提高数据分析的准确性。知识库在运维系统中主要用来记录运维中的事务和日志[3]。智能运维平台的知识库内容主要包括系统操作记录、系统故障排查经过、系统事务或流程的成功案例、告警或预警方案实施的全过程等;还涉及对不同疑难问题和突发事件的问题解决方案。有效开展知识库的管理和关联可以降低运维成本,可以避免重复解决相同问题的情况,问题和解决方案都能在知识库中方便快捷地获取,提高运维工作效率。在运维体系中,以运维事务为基础,结合运维故障、流程、日志、报表等模块的信息建立知识库,为后期故障提供解决方案,可以大幅提升系统运维的处置效率和响应速度。

3.4 监控预警层

监控预警层实现整个平台系统的监控信息展示和配置管理,并向用户提供访问监控数据的操控界面,预警平台定期扫描变电站、数据中心站和储能站设备的运行状态,使用聚类的方法把一段时间内所有监控到的参数峰值进行分类,根据类别从高到低划分预警等级,当监控项的监控参数超过设定的预警值,系统会生成预警方案,并结合预警体系,给相关运维人员发出警告。预警结束后系统会生成相关的告警日志,记入数据库。从效率上看,预警比告警显得更快速,加快了处理运维实务的速度,提高运维的效率。成熟的运维预警体系,不单单是发现现有系统已经出现的问题,更重要的是能预测可能出现的故障。监控预警层通过丰富的图形化展示方式呈现变电站、储能站、数据中心站资源以及业务系统的整体运行状况,提供有效的安全预警,减少资源和系统运行故障的发生,降低事故造成的损失。

4 “多站融合”投入应用

4.1 应用情况

上海市35 kV 殷家浜变电站位于张江科学城,主变容量为2×31.5 MVA,周边电力用户已稳定,未来不会有新增用户,且有设备布置空间,适合作为“多站融合”试点站点。殷家浜站现状负载率较高,通过配置一定的储能可有效实现削峰填谷,减小站点峰谷差。采用模块化数据中心装备,更加有效地利用了“多站融合”站点面积资源和电能资源,提升上海试点机房的能效比。上海电力公司经过充分的论证分析,选择了35 kV 殷家浜变电站进行“多站融合”试点工作,实现国网云之企业管理云与公共服务云在上海电力“多站融合”落地,进行配电物联网、CDN、综合能源服务等多个创新应用的试点[4]。通过部署“多站融合”运维平台,避免多个运维主体,降低运维复杂度,优化“多站融合”运维模式,简化运维工作,变被动运维为主动运维,提高运维工作效率,为“多站融合”系统稳定运行提供强有力的支撑和保障。

4.2 经济效益

在经济效益方面,通过“多站融合”智能运维平台建设,快速满足监控需求,全面提升故障定位能力,缩短故障修复时间,减少故障损失,实现变电站、数据中心站、储能站的一体化监控、能源优化控制,实现全站运行状态的全景展现和故障联合告警,保障“多站融合”系统的安全稳定运行,有效提高全站的运行可靠性、经济性及环境适应性,扩展数据服务新型业务,具有巨大的市场潜力。

4.3 社会效益

在社会效益方面,多站一体化融合运维管理模式,对于“多站融合”场景下的变电站、数据中心站及储能站的运维具有直接或间接的借鉴指导作用,能有效提升具有“多站融合”特点的变电站、储能站、数据中心的运维效率。“多站融合”的设计利用变电站站址资源,建设“多站融合”,可以缓解建成城区的土地资源紧缺,有益于节约土地、节省投资,减少建设环节,优化社会资源,提高社会的土地资源利用率,通过与智能电网的融合,切实推动电网高质量发展。

5 展望

开展多站智能运维平台研究,实现多站系统的融合运维、智能告警、智能定位、统一展现,有效地缩短了故障排除的时间,大大提高了问题解决的效率,提升“多站融合”的运维效率。当前智能运维平台检测到运维数据异常,仍然需要运维人员对异常信息进行人工检查,确认是否自动执行运维知识库生成的操作建议和执行策略,以保证软硬件系统的安全、可靠运行。未来需要深入开展大数据关联分析技术、信息通信状态评估技术、信息通信趋势预测技术的研究,针对历史事件的聚类分析,针对当前事件的异常检测以及针对未来事件的趋势预测,实现风险实时预警和趋势准确预测,加强对整个多站系统运维工作的自主决策分析,无需运维人员的干预,实现真正的无人值守、智能化运维。

猜你喜欢
储能运维数据中心
考虑用户优先级的云储能用电策略优化
关于间接蒸发冷机组在数据中心中应用的节能分析
储能: 碳中和下的新赛道
基于GPS的电力运维轨迹定位系统
IT运维管理系统的设计及应用
2018年数据中心支出创新高
2017第十届中国数据中心大会榜单
电力系统中的能量储存技术
LW36-126(W)/T型断路器储能超时复归问题改进方案的提出
电子政务甲方运维管理的全生命周期