基于统计分布分析的电能表供应商质量评价方法研究

2023-11-30 09:48罗茜文李铭凯
电气技术与经济 2023年8期
关键词:数据分布偏度峰度

罗茜文 李铭凯

(1.国网河北省电力有限公司雄安新区供电公司 2.国网北京客服中心)

0 引言

随着供电企业智能电能表的大力推广, 智能电能表已在居民日常生活中普遍应用。市场中电能表供应商也是数量众多, 因此选择优质的表计供应商, 对电能表质量管控、技术服务等方面具有重要的意义。当前表计供应商质量评价主要采取专家打分形式, 考虑供货、技术服务等方面较多, 缺乏对电能表客观数据的考虑, 不够全面。而电能表作为法律规定的强制检定计量器具, 目前国家电网公司各省级计量中心均开展电能表规模化自动化检定, 检定数据尤其是基本误差数据反映了电能表的质量情况。因此结合电能表基本误差分析进行电能表质量评价, 可使得评价方法更客观, 更具说服力。

当前针对电能表基本误差数据已有一些相关研究[1-3], 研究主要集中在误差影响因素分析和计量性能分析[4-7], 针对电能表质量评价较少, 文献[8] 基于聚类算法构建质量评价模型, 对电能表基本误差进行分析, 判断电能表优劣。但该方法本质上是对误差值大小分布的判断, 评价方法偏简单,缺乏对电能表大量基本误差数据统计分布规律的研究分析。

本文基于统计学原理, 对电能表基本误差数据分布规律进行研究, 然后提出一种基于统计分布分析的电能表质量评价方法, 该方法可为表计供应商质量评价提供参考。

1 电能表基本误差分布研究

由于每个供应商电能表生产工艺相同, 每个供应商新到货待测试的电能表可看作独立同分布变量, 其基本误差也可看作独立同分布变量, 设其为X(X1,X2, ….Xn), 由JJG596—2012 《电子式交流电能表检定规程》可知, 电能表基本误差存在上下限。因此基本误差存在有限的数学期望和方差, 由中心极限定理可知, 当电能表样本n足够大时, 随机变量X近似服从于正态分布(μ,σ2)。

根据上述理论, 本文提出如下电能表质量评价思路:

供应商表计大量供应, 如果某供应商表计基本误差分布越趋近于正态分布, 其质量评价越高。

2 质量评价模型研究

根据JJG596—2012 《电子式交流电能表检定规程》, 每只电能表会检定多个负载点, 存在多个误差点, 以单相电能表为例, 其基本误差点为10 个, 如表1 所示。

表1 单相电能表基本误差点

由于基本误差点较多, 为了便于分析, 本文以每只电能表的基本误差平均值代表表计的整体误差情况。

为了分析误差分布与正态分布的拟合程度, 基于正态分布三个的特征指标开展分析, 即3σ 准则、偏度与峰度。

2.1 正态分布拟合程度特征指标

3σ准则又称拉依达准则, 正态分布的变量取值在[μ-3σ,μ+3σ] 的概率为99.73%, 在±3σ之外的概率只有0.27%, 该准则认为凡是超过这个区间的误差, 属于粗大误差。

根据3σ准则可知, 正态分布在±3σ之外的分布值极少, 可判定为粗大误差, 因此粗大误差越少, 分布越符合正态分布, 因此定义粗大误差率指标:

式中,F表示粗大误差率,nu表示粗大误差的个数,N为基本误差总个数。F值越小, 分布越趋近于正态分布。

偏度描述数据分布形态的统计量, 其描述的是某总体取值分布的对称性, 即数据的不对称程度, 由三阶中心距计算得出, 具体计算公式如下:

式中,S表示偏度,xi表示第i个数值,表示平均值,n是采样数量。其特性如下:

a) 偏度等于0, 分布形态与正态分布偏度相同。

b) 偏度大于0, 正偏差数值较大, 为正偏或右偏。长尾巴拖在右边, 数据右端有较多的极端值。

c) 偏度小于0, 负偏差数值较大, 为负偏或左偏。长尾巴拖在左边, 数据左端有较多的极端值。

d) 数值的绝对值越大, 表明数据分布越不对称, 偏斜程度大。

峰度又称峰态系数, 表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来, 峰度反映了峰部的尖度。随机变量的峰度由其标准四阶中心矩计算得出, 具体计算公式如下:

式中,K表示峰度,xi表示第i个数值,表示平均值,n是采样数量。

一般为方便计算和比较, 将峰度值减3, 将正态分布的峰度变为0, 方便比较。其特性如下:

a) 峰度为0 表示该总体数据分布与正态分布的陡缓程度相同。

b) 峰度大于0 表示该总体数据分布与正态分布相比较为陡峭, 为尖顶峰。

c) 峰度小于0 表示该总体数据分布与正态分布相比较为平坦, 为平顶峰。

d) 峰度的绝对值数值越大, 表示其分布形态的陡缓程度与正态分布的差异程度越大。

2.2 质量评价指标

针对某供应商电能表基本误差开展质量评价分析, 根据粗大误差率F、偏度S和峰度K特性可知,三者都是绝对值越小, 分布越符合正态分布, 相应质量评价越高。综合考虑上述三个指标, 定义如下质量评价指标E:

E值越小, 质量评价越高。

同时由中心极限定理可知, 电能表样本数量n 越大, 分布越趋近正态分布。因此为了对各供应商质量评价更为公平客观, 应考虑各供应商电能表的数量,当供应商表计数量越小时,E本应越大, 因此要乘以和表计数量相关的系数缩放, 因此本文以供应商的最大数量作为基准, 最终定义如下质量评价指标Ei:

式中,Nmax为各供应商的最大数量,Ni为供应商i的数量。

3 实验结果分析

以某网省电力公司2021 年度检定的单相智能电能表为例开展分析, 共计检定52 万余只, 涉及4 个供应商A、B、C、D。各 供应商表计数量 如 图1所示。

图1 供应商表计数量

计算每只电能表的基本误差平均值代表表计的整体误差情况, 供应商A、B、C、D 整体误差分布情况如图2 所示。

图2 供应商表计误差分布情况

由图2 可知, 各供应商电能表基本误差分布曲线有正态分布趋势, 符合中心极限定理, 表明本文理论分析的正确性。

根据本文定义的质量评价指标, 计算每个供应商的指标Ei, 结果如表1 所示。

根据表1 计算结果可知, 供应商C 无论粗大误差率、偏度和峰度绝对值, 在四个供应商中都较小, 最终质量评价指标也最小, 供应商C 质量评价相对是最优的, 而供应商D 则相反。最终供应商质量评价结果为C >B >A >D, 结果可为供应商质量评价提供依据, 为供应商选择作参考。

表1 质量评价指标结果

4 结束语

本文通过对电能表基本误差数据分布规律进行研究, 得出其分布应趋于正态分布的结论。然后提出一种基于正态分布拟合程度的电能表质量评价方法, 结合3σ 准则、偏度与峰度进行质量评价, 该方法可为表计供应商质量评价提供参考。

猜你喜欢
数据分布偏度峰度
扩散峰度成像技术检测急性期癫痫大鼠模型的成像改变
对称分布的矩刻画
改进的云存储系统数据分布策略
磁共振扩散峰度成像在肝脏病变中的研究进展
基于自动反相校正和峰度值比较的探地雷达回波信号去噪方法
基于偏度的滚动轴承声信号故障分析方法
一种基于给定标准对数据进行正态修正的算法
考虑偏度特征的动态多响应稳健参数设计与优化
试论大数据之“大”
磁共振扩散峰度成像MK值、FA值在鉴别高级别胶质瘤与转移瘤的价值分析