杜小月 杨灿东
(云南电网有限责任公司临沧供电局 云南省临沧市 677000)
随着经济的不断发展,社会基础建设的不断完善,每年很多电网公司都会在数据质量维护以及升级上提供大量的资金,但数据的准备性依旧存在缺陷。这主要是因为随着信息化手段的不同,然后在很多数据准备性管控上很难做到有效的管理,形式单一化,这就造成无法有效的管理好整体的系统规范和结构性等问题。例如,在变压器、断路器、互感器这些设备信息录入时存在信息错误,这些都会对电网运营造成影响。这些设备参数的无效性以及错误,都会造成检测的失误,从而无法保证提高数据质量并达到理想范围之内。
随着互联网以及信息技术的进步,主配网设备台账的信息系统具有不小的完善度,但还存在一些限度的数据缺失,这些数据质量的不稳定也就都造成了性能低下,信息误差较大。而在云南南方电网供电局设备台账系统中,数据信息的不准确性是最主要的问题,这些都会造成数据的不完整,从而造成数据错误。2017年至2018年设备检查情况如图1 所示。
除此之外,还有在设备类型选用上面,存在原厂家生产质量有瑕疵,在数据反馈线的设计长度不合适,以及匹配的型号有误等,这些都会造成参数的不精准,影响到电流的不准确。这些系列问题都是造成设备运行和台帐以及信息系统不相符,比如,不能对业务应用提供有效的至此,从而在数据具体分析上无法满足应用要求,其次是无法对录入错误的数据进行纠正分析。2018年配网自动化设备占比情况如图2 所示。
在所有设备台账中,有主网设备和配网设备。主网设备有变压器、断路器、互感器、避雷针等设备;配网设备有变压器、电缆分接箱、美式箱变、欧式箱变、柱上断路器等设备;故设备早期投入使用时,当时未能及时将设备参数信息录入系统,为统一标准化管理,后期对这些设备参数信息录入系统,在录入的过程中存在大量错误信息,系统内的设备台账信息准确性和一致性较低,未能达到省网公司的考核指标。因此主配网设备台账的一致性和规范性对整个系统内数据质量有着决定性作用。2018年配网自动化设备覆盖率如图3 所示。
在很多的数据分析上,相关业务专家对规则进行整理,通过系统对规则进行固定,主要对必须填写的项目以及参数的范围进行着重检查。设备参数分为核心参数和非核心参数,核心参数即必填项,非核参数即非必填项,省网公司检查只对必填项进行校验,传统的检查方法很难保证检测的数据的准确程度,比如:严格要求筛选字段,但是按照规则对数据检查后大致所有的数据全部通过检查,然而实际情况中有效通过的数据存在准确度低等问题。主变压器保持容量固定的前提下,按照以下规则进行精确计算,但是,实际情况中,电压器具有不同的电压等级,检测过程中也存在不小的差异。因此在校验规则中有固定值检查和范围值检查,部分不确定参数只能校验非空数值。主配网台账数据日常检查流程如图4 所示。
图1:2017年至2018年设备检查情况
以数据分析为基础的检查方式主要借助于数据统计与挖掘,之后依据建立的数据分析模型,分析数据分布,其次是运用多样化的智量识别系统,最后对数据的精准性实施判断。然而主配网设备型号多达三千多种,众多的类别也就造就的技术参数的多样繁复,多种设备型号也就存在几十种技术参数。每个类型的设备技术参数量不一样,参数范围不一样,这样众多的技术参数很难做到精准化的单一参数模型分析,一个个查找既耗时,又费力。基于这样的现状,本文通过数据质量模型的组建,然后采取参数离散型统计分析法,在检测组件内,进行文本矫正,对杆塔呼称高、全高分析如图5。
(1)规则模型。这是一种数据量较大的检查校验标准库,针对不同类型设备进行分析,对每一个类型的设备不同厂家和型号的设备建立标准模型,此模型则是根据校验规则进行制定,更具有代表性,对设备参数更加精准,便于整改之前录入的错误信息整改和后期新增投运设备信息录入,很大程度的完善了系统设备参数的一致性,设备台账数据质量也可以得到很大的提升。设备分类汇总如图6 所示。
(2)截尾方法。这是一种对数据规律相差不大的截取保留,对统计的数据变化极大个别数值进行截取排除,这也就是截尾法。如图7 所示,在全高或者呼称高上存有异常的几个点,这些点的数值极大,因此采用结尾法进行操作,把数据点从小到大实施排列,截取九成以上的规律数据,留下一成的可疑数值,然后对其进行标记,这些可疑的数据就是录入有误的,然后再对其进行纠正。
图2:2018年配网自动化设备占比情况
图3:2018年配网自动化设备覆盖率
(3)基于密度的聚类。这个方式基于呼称高与全高的一种关联性,两者的数据可能都存在一定的正常范围,其中全高与呼称高的数据差距较大,这样不同的密度聚集是检测异常点较有效的方式,检测出来后就能进行错误信息的有效纠正。
主要借助数据挖掘技术完成文本的矫正,在整个过程中建立标准库,再借助文本挖掘对标准库与文本中的信息进行相似度计算,从而对文本信息进行矫正,从而更加标准规范的写入文本信息。例如变压器、互感器等设备厂家、型号等字段采用这种方法进行检查,具体看样本分析中的文本校正,最后避免设备信息录入错误。
设备厂家矫正文本的流程:
(1)第一先结合数据库中提取的信息与经过业务人员整理的信息建立标准的厂家库。
(2)借助于数据挖掘技术,从标准厂家库中通过匹配对历史厂家字段或者新增加的厂家字段进行搜索。
(3)把标准厂家信息对数据文本进行矫正。
每个月都会安排业务管理部门数据评价标准,对登记系统进行优化完善,使使用者增加责任心,并对各个部门都使用设备台帐管理的方式。构建审查数据管理制度,对出现问题的数据显示的事件,相关的工作人员以及描述具体的缺陷问题等都进行详细的记录。每隔一定时间对记录的数据的规范性以及及时程度进行检查,能做到立马查出问题,立马就能处理。比如,设置数据质量监控点,对解决的方式进行参考,实际解决问题的方式以及解决完后产生的反馈等。
图4:主配网台账数据日常检查流程
图5:设备参数检查目录
图6:设备分类汇总
图7:呼称高、全高箱线图
图8:设备校验规则及校验工具
通过检查结果和完成率,对台账信息错误信息进行统计汇总,记录每一周期的效果,并定期开展扫描,时时跟进成效,制定相应的台账管理制度。同时,为了能够紧跟信息的发展,将业务员的技术水平进一步提高,优化信息系统的功能,需要对有关的人员进行系统培训。设备校验规则及校验工具如图8 所示。
在很多时候,规范的运用过程往往对数据准确性有很大的帮助。在一些不相关联的信息录入中,对系统信息显示的数据展开整理、分析最后进行汇总录入,这样也就提高了数据精确性,提高了数据质量。其次,对信息化技术加大使用,成立专业的人员培训队伍,对工作人员进行标准化操作培训,并将需要特别注意的问题交代给工作人员。比如,组建以信息技术人员为主的数据核查团队,按照规范操作设备之后,核查数据是否准确,保证审查的人员必须经过相关正规培训并且能安排到不同的业务部门中,对业务部门的操作规范流程进一步加强。
成立数据整理组织专门整体历史数据,而且针对该工作还制定相应的方案,依据顺序有效的整理历史数据。对之前录入的错误数据进行清理更新,对固定值进行固化,优化非固定值,从根本上彻底整理历史问题数据,在上级部门的引导组织下,不同部门之间相互协作,统一盘点资产设备,并与数据目录进行对比。经过对比检查完成之后,将设备台帐进行重新整理与更新,保证最终经过整理之后的数据是准确完整的。
总而言之,在对主配网设备信息录入有误的检测和整改过程中,需要从技术手段以及管理制度两个方面入手进行整改。让变压器、断路器、互感器等设备在信息录入台账系统时有对应标准库进行参照,从源头提高设备台账的规范性;其次,在录入有误后运用数据校验规则分析找出错误数据信息,从而进行文本纠正,最后提高数据质量,提高整个系统数据的完整性、规范性、一致性、准确性。