国网安徽省电力有限公司合肥供电公司 程 辰 赵 晔 王 伟
在电网规模不断扩大的同时,广大用电户对优质、稳定电能的需求也在逐渐提升。因此,为了确保输配电网络能够在较长时间内保持正常运转的状态,需要提高对电网的整体监测水平。输配电全景驾驶舱技术是指基于控制驾驶舱与3D 可视化大屏工具,对一定范围内的监控对象构建虚拟监测模型,基于快速开发、内置图表、三维模型、组件复用、分页设计、多屏适应、离屏控制等技术,实现对范围内电网的全景监测[1]。这一技术的实现基础是电网管理数据的高效率融合,值得重点分析。
电网在运行过程中,每时每刻都会产生大量数据。若要针对这些数据做好汇总、融合、分析工作,必须探索应用数据的深度融合技术。目前,已知的数据融合技术不止一种,本文以Bayes 统计理论支持下的电网管理数据融合技术为例展开分析。
Bayes 统计理论的原理是在不忽视“可靠度”的情况下,基于传感器测量电网运行产生各项数据时(可根据需要,确定哪些数据属于“重点管理数据”),必须确保准确性的两大类关键数值分别为“测量值”和“真值”。具体来说,随机模拟电网运行过程并连续测量多组数据。在每一组测量过程中,都存在n(n 为自然数)个互相之间不可能存在“相容”关系的事件,分别被记为A1、A2,…,An。这些事件或者都不发生,或者有一件发生后,其他事件便不会发生。如果用P(Ai)表示事件Ai发生的概率,则适用的关系如公式(1)所示:
如果使用传感器对事件A 的发生情况进行检测,所得出的检测值以B 表示,则B 便属于Bayes统计理论下的“测量值”,Ai的值为“真值”。
在Bayes 统计理论设置的数据检验逻辑关系是,在不同时间、事件发生前后检验一件相同的事件时,检验人员对事件发生情况的估计存在差异,且一次检验结果如果不同,则对检验人员最终估计造成的影响也存在差异性。基于这种逻辑,有了先验知识、后验知识的划分。
所谓“先验知识”对应的逻辑原理为:以P(An)对应An,前者表示后者发生的概率。这种概率在An 事件发生前得出,故被称为“先验知识”。
当一次检验结果B 出现之后,检验人员对每一个事件发生概率的判断会发生变化,此为“后验知识”。
相对来说,完成检验后的事件发生概率的表达方式更加复杂,具体以P(An|B)表示。对这一表达式进行分析后,可以得出下列两个关系式:
得到公式(2)、公式(3)之后,基于Bayes 估计进行数据融合的原理是,基于“先验知识”对“后验知识”进行连续性地修正。此时需要使用的公式可以是条件概率公式,也可以是全概率公式,具体如下:
上述三个公式中,公式(4)、公式(5)均为条件概率公式,公式(6)为全概率公式。其中的Ai表示对样本空间的划分处理值,即上文所述的Ai(包括A1、A2,…,An)彼此之间均具有“互相排斥--一件事发生后其他事件不可能发生”的关系。
当一次测量结果的值为B 时,Ai事件的真实发生率(即真值)的表达式如下:
总体来看,基于Bayes 估计进行数据的测量及汇总融合、分析处理时,必须对测量对象的“先验信息(先验知识)”进行充分利用,之后根据实际测量结果,对先验概率进行修正,最终得出的后验概率具有更高的准确性。
1.2.1 基于Bayes 统计的目标识别融合模型
基于Bayes 统计对电网运行数据进行收集、汇总、分析、融合处理时,所构建的模型要素见表1。从表1中可以看出,传感器A、B、C 的功能都为“监测特定对象”,在获得相应的数值之后,基于Bayes统计推断,对目标的融合概率进行计算;在初步处理完成后,还应进行决策及判定等深层处理,最后完成身份的报告[2]。
表1 基于Bayes 统计的目标(数据)识别融合模型构成
1.2.2 基于Bayes 统计的目标识别融合步骤分析
基于Bayes 统计的目标数据识别及融合的一般步骤如下:第一,获得每一个传感器单元输出的针对目标身份的说明值,即B 值(从B1到Bn)。第二,需要针对每一个传感器单元对不同目标在“身份说明”方面的不确定性(以P(Bj|Ai)表示)进行计算(其中,i、j 的取值范围均为1、2,…,n)。第三,对目标身份(不同类型数据)的融合概率进行计算,公式如下:
当B 的所有取值均具有相互独立性,则对公式(8)进行变换处理后,得出的结果如下:
对公式(9)进行进一步变换之后,即可得到目标数据的识别及融合判断依据(决策阶段),表达式为:
基于上述原理,可得出的电网管理数据融合实现过程见表2。不同融合层次的性能对比结果见表3。
表2 基于Bayes 估计的传感器监测数据融合实现过程
表3 不同融合层次对应的电网管理数据融合性能对比
基于Bayes 估计的电网管理数据融合技术应用于配电全景驾驶舱构建时,对应的仓库硬件架构特点如下。
总体分为四个层级:最上层应该设置短信预警平台、邮件服务器、4A 认证服务器、应用服务器等。次上层应设置数据展现服务器、数据仓库服务器、数据集市服务器、备用数据仓库。中层应设置FTP 服务器、文件服务器、调度服务器、文件服务器。最下层即应用层,包含诸多业务系统。通过上述方式构建配电全景驾驶舱的仓库硬件架构之后,至少能够得到一个中等规模的电网管理数据处理平台,理论上每天能够处理的最大数据量可达到20TB的规模。与这一数据对应的情况是,实时月处理电网管理数据量总共不超过10TB,这意味着配电全景驾驶舱平均每月能够处理的电网管理数据最大值可以达到20TB×30(天)=600TB,与每月实际处理的数据总量10TB 相比,倍量关系达到60倍,差值达到59倍。此外,配电全景驾驶舱的总集群数量接近300台,其中约有200台搭载Hadoop 节点,总容量最大可达到8P,实际使用容量接近5P。
总体来看,配电全景驾驶舱技术下的数据仓库具有面向主题、集成性及稳定性高、能够清晰反映电网管理数据历史变化的集合的优点,可以为管理决策提供强有力的支持。从数据角度来看,数据仓库搭载传统数据库时,优势更大。原因在于,“离线采集电网数据”这一功能可得到最大化发挥。此外,由于电网管理数据一般具有结构化呈现的特点,每天处理数据量不宜超过TB 集,数据仓库一般在数十太字节到几百太字节以内,数据仓库一般为满足内生的应用,可充分满足内部决策支持分析需求[3]。
配电全景驾驶舱技术下的数据仓库功能架构如下。第一,应用服务方面。访问层,对应数据仓库的门户,涉及个性化定制、移动端、PC 端、信息交互等。应用层,主要涉及角色适配、权限管理、数据安全管理。第二,数据服务方面。数据封装,涉及可视化工具、服务开发管理、服务运维管理等。数据层,需要分项处理中度中间层数据,包括处理后的数据融合。此外,还应处理轻度中间层、存储层、接口层数据。完成各类数据的处理之后,将最终数据传入“获取层”,基于ETL 调度工具,在控制系统中的各个模块中予以显示,此时在全景驾驶舱大屏幕中便会呈现出监测对象的实景图。
配电全景驾驶舱技术下的数据仓库系统的主要功能是对电网管理数据进行运行维护管理。具体的管理分类如下。
第一,数据的质量管理。需要技术人员提前编制数据质量管理规则、基于程序控制算法对获得的数据进行质量校验。第二,元数据的管理。需要在系统内部设置明确的数据目录,进而将不同类型的数据转储到对应的名目下,避免出现混乱。
对电力企业来说,与输配电业务有关的数据类型可作如下分类:一是基础类数据。包括线路杆塔台账、附件金具、杆塔明细、特殊区段、交叉跨越、班组、地理空间信息、运行规程。二是生产数据。包括巡检计划、派工单、工作票、巡检记录及报告、缺陷记录、危险点记录、隐患记录。三是监测数据。包括电网及设备覆冰监测、大风监测、气象监测、测温监测、山火监测、防盗监测。四是环境数据。包括气象预报、污染区域、覆冰区域、山火发生带、地质灾害发生带等。五是运行数据。包括跳闸信息、负荷信息、潮流数据。六是经验数据。包括林木生长、巡检轨迹、专业知识库数据等。基于配电全景驾驶舱技术完成数据仓库技术架构构建之后,上述六大类型的数据在仓库内会分别对应建立一个名目,且每个名目下方还会建立多个子名目。当有任何一种类型的数据得到上传之后,智能管理系统首先会对数据类型进行甄别,之后将数据存储至对应的名目的子名目之中,同时还应标注数据产生的时间。通过这种方式,电网数据的管理不会出现任何混乱情况,可真正实现“有序融合”。
完成数据库架构的设置之后,除了将电网数据存储进数据库中之外,系统还需根据管理需要,在特定时刻完成对数据的提取及转换。传统的电网数据管理系统存在的问题是,从数据库中提取的数据与之前存入的数据可能在格式、完整性方面存在偏差,以致无法满足后续管理要求。造成这种现象的原因包括但不限于数据输入时的格式存在错误、输入错误或者不完整的数据等。
综上所述,通过对海量数据进行收集、分析,可以总结出数据背后的规律。以此为基础,当这种“规律”保持正常运转的状态,意味着产生数据的系统同样保持正常工况;当“规律”出现异常,意味着相关数据偏离正常值,系统中的某些设备大概率出现故障。此时,监控系统通过对异常数据进行“逐本溯源”,便可通过“可视化”的方式,将故障发生位置和故障类型等实时呈现在监控屏幕之中,进而工作人员在第一时间进行处理,这对提高被监测系统的整体运行效率和质量均大有裨益。