基于层次分析法的乡村电气化指数评估

2022-07-20 03:11何容徐鸿宇邱林
电力大数据 2022年2期
关键词:电气化一致性用电

何容,徐鸿宇,邱林

(1.国网重庆市电力公司营销服务中心,重庆400000;2.国家电网重庆市电力公司,重庆400000)

乡村电气化这一词具体指的是农村地区以及与农业广泛相关的各个产业和各个经济部门,在日常的生活生产过程中使用电力,由此构成了国家电气化的重要一环。随着社会主义新农村的不断建设,以及乡村振兴战略的不断实施,乡村电气化这一重要环节更具时代内涵。但针对目前的乡村电气化相关政策制定以及相关实施相关评估存在以下几个问题。

(1)数据问题。目前相关经济数据范围过大,基本只到省、市一级,针对镇、村这样的维度,并没有相关的经济数据,难以精准定位问题区域;目前公开渠道的数据相对来说较为单一,不能直指乡村发展问题核心。

(2)方法问题。乡村电气化发展情况的评估是需要考虑多方面因素的,而各个影响因素的影响程度有所不同,就需要构建一种科学的量化方法,针对目前的影响因素进行综合评估。目前针对乡村电气化现状大多为一些战略分析,较少有人研究相关的数据综合量化评估模型。

本文针对以上问题,以电力数据着手进行分析,与乡村振兴重点关注项目充分结合,选取供电能力、民生用电、产业发展、绿色用电、用电服务等5个维度作为分析乡村电气化情况的突破口,构建乡村电气化指数。从区县、乡镇、乡村等不同层级以及供电能力、民生用电、产业发展、绿色用电、用电服务等不同维度,多层面、多角度开展乡村电气化情况的监测、评价。

1 整体架构

1.1 总体技术架构

图1 总体技术架构Fig.1 Overall technical architecture

(1)数据层:主要基于营销基础数据平台,根据约定好的方式定期进行数据交互。

(2)分析应用层:利用数据层交互的基础数据,经过模型最终形成乡村电气化指数,并且在分析应用层上集成相关看板展现。

(3)前端应用展现:前端应用展现主要将相关指数数据和指标数据进行可视化。由区域—镇—村层层下转的方式,对民生用电、产业发展、供电能力、绿色用电、用电服务五个维度的情况进行展示。

1.2 数据架构

图2 数据架构Fig.2 Data schema

乡村电气化指数模型采用提取转换加载(extract transform and load, ETL)的方式从相关数据平台抽取各维度需求数据,主要为客户档案、地址数据、95598工单、用电数据、充电桩等数据,并利用可视化平台工具直接调用模型生成的结果数据,最终形成相关的可视化界面,便于有效直观地了解乡镇电气化水平。

1.3 系统架构

图3 系统架构Fig.3 System structure

为了更好地保护数据安全,整体数据、模型、可视化部署在内网环境,通过防火墙统一进行查看权限管理。

2 数据预处理

2.1 数据准备

乡村电气化指数主要与乡村振兴战略[1-5]任务紧密相关,在进行数据准备时,则需要考虑其多方面营销因素。乡村电气化指数主要从多维度、多角度对乡村情况进行分析,涉及营销系统、地址平台、采集系统、工单、充电桩、清洁能源以及外部等多个系统数据,根据实际需求,打破系统之间的壁垒,实现多系统之间的数据融合。

经过多番查阅资料,以及与业务专家的讨论,一致认为对某一乡镇的乡村电气化指数评估,不能单一地从某一方面进行,需要考虑该乡镇的多方面因素,而基于电力侧数据则可从电力方的供电能力、乡镇的民生用电情况、乡镇的产业发展情况、乡镇目前与新能源相关的绿色用电推广情况、电力方的用电服务方面等多个维度进行综合评价。目前的数据基于多个系统的数据融合,主要包含:客户基础档案信息、客户用电信息、工业用电信息、充电桩用电信息、95598工单信息数据等。

2.2 数据清洗

数据清洗[6-17]的主要目的是将原本存在一定问题的数据,经过一系列加工之后,能够消除数据原本存在的逻辑性错误等。本文研究的乡村电气化指数评估,涉及采集系统、营销系统、95598工单系统、电动车系统、外部数据等多个渠道的数据,不同的渠道都有一套针对自己数据的数据字典、业务逻辑等等,在将这多个系统的数据进行融合时,不可避免地会出现数据冲突、逻辑错误等问题,且数据涉及前一至两年的历史数据,数据错误会更为明显。本文的数据清洗目的主要是打破系统之间的壁垒,建立各系统数据之间的联系,并且将不符合业务逻辑的数据进行加工处理,最终得到符合业务逻辑的基础数据。数据清洗过程如下图4所示。

图4 数据清洗过程Fig.4 Data cleaning process

(1)缺失值清洗

①明确缺失值的基本情况:针对不同的字段计算该字段的缺失率,并且根据业务经验明确该字段的重要性程度,根据不同的缺失率以及不同的重要性程度制定不同的策略,数据缺失策略制定如下图5所示:

图5 数据缺失策略制定Fig.5 Missing data policy development

②过滤无效字段:根据业务沟通结果确定对主题分析有意义的数据字段,其余字段直接过滤即可,并不需要过多关注。

③缺失内容填充[18]:针对不同情况的缺失值,可以采取不同的处理方式,这一步与业务交流经验尤为重要,需要明确字段的重要性程度。如果该字段影响不大,直接删除缺失数据,或者直接将缺失数据置零是最快的处理方式;如果需要对缺失值进行补充,常见的补充方式有均值填补、同类别均值填补、手工填补、默认值填补、贝叶斯计算公式或决策树等推断数据填补等等,可根据实际情况进行填补方式的选择。

④业务重新整理数据:某些指标对主题分析结果影响很大,并且数据值缺失又很严重,这种情况就需要与业务沟通缺失的原因,看能否重新梳理相关数据进行主题建设。

(2)格式内容清洗

①数据格式不一致:出现这种问题的可能性很多,例如电力侧的数据,在用户进行新装时,在录入的过程中难免会出现格式不一致的情况,例如时间格式不一致、全角半角等显示格式不一致等。遇到这种情况,需要将不同的格式处理成某种统一的格式,统一的格式也需要对之后的计算有利。例如时间格式不一致,有的为文本格式,有的为时间格式,则可以统一处理成时间格式,时间格式的时间地段可以进行加减计算,而文本格式的则不能。

②存在有问题的字符:在手动录入数据的过程中难免会出现空格或者输入错误及其他乱七八糟的字符,比如用户地址包含“-”等特殊字符。最经常出现的就是空格符,空格符在头尾出现的时候肉眼有时候难以发现,但是在进行数据对比时就会出现误差,这种情况则需要人工分析一下该字段出现的问题字符类型,然后再统一进行处理。

(3)逻辑错误清洗[19]

逻辑错误主要是在进行简单的数据探索时,会发现某些数据存在问题,这些问题并不一定是系统源数据存在问题,也可能是在进行数据融合时引发的数据问题。需要对数据进行处理,以免结果出现较大的误差。主要包含以下几个步骤。

①去重:在实际的主题建设或者项目工作中,建议在每一步都进行重复数据的查看,明确出现重复数据是否存在问题。例如某些字段存在空格,比如户名“张三”和“张 三”通常会被识别为两条数据,所以直接去重并不能正确地去除重复数据,这种类型的数据可能需要通过第一次数据重复检查,发现重复数据,进而进行数据处理,再进行去重;有的情况则是对系统融合时,出现数据一对多的情况,以电力数据为例,一个用户有多个计量点,一个月会发生多笔电费,在进行数据融合时,导致用户电量误差,这种误差就是操作层面的,需要在数据计算之后,对某些数据进行验证来避免数据的重复。

②去除不合理值:例如日电量-10000000,电量为负可能会退补电量,也可能是电量采集误差,这种就需要根据实际情况进行处理,如果是退补电量,就需要明确该用户当月是否有错误发生的电量,从而进行抵消;如果是采集误差,则可以删除该误差值,或者是利用缺失值用插补法对数据进行插补。

3 模型实施

3.1 整体设计思路

乡村电气化指数的分级和测量方法是在借鉴相关文献资料的基础上,经过相关专家指导,历经多次的修改之后确定的。指数由三级指标构成,一级指标即乡村电气化指数;二级指标为供电能力、民生用电、产业发展、绿色用电、用电服务共5个指标;三级指标为户均容量、台区年度实际停电时长、台区达标比例、居民年户均用电量、居民夏季日户均用电量、农业用户数量、农业用户用电水平、农业用户电量年增长率、充电桩数量、故障抢修及时率等22个指标。

采用层次分析法(analytic hierarchy process,AHP)把主题目标分解成为多个下级目标,邀请有关专家对各层的相关因素进行定量评分,以最终确定评价指标的权重。运用差额标准化对指标数据进行处理与转化,从而得到一级指标值乡村电气化指数。

3.2 AHP层次分析法实施

AHP层次分析法[20-32]的实施如下所示。

(1)建立层次结构模型

对问题进行深入地分析,首先探讨并明确影响该主题的各项指标,将不同的指标进行归纳分解,最终形成目标层、准则层和方案层三个层次,相对来说层次越多,判断矩阵相对越复杂。在形成固定的层次结构之后,需要针对同一层次的指标进行一一比较,每个指标都有其重要性程度,根据其重要性程度来划分其重要性等级,并且进行赋值,最终在每个指标赋值完毕之后,就得到判断矩阵:A=(Xij)n*n。

针对乡村电气化指数评估的主题,乡村电气化指数则为最终目标,作为目标层;供电能力、民生用电、产业发展、绿色用电、用电服务5个维度则是最终目标分解之后的各个小目标,作为准则层;而供电能力等5个维度都有描述概括的指标,这些指标就作为各个准则层下面的方案层,本主题的层次分析结构如下表所示:

表1 层次分析结构Tab.1 Analytic hierarchy structure

(2)形成对比矩阵

判断矩阵主要针对本层次和上一层次而言,就某一维度下面的所有相关指标进行重要性比较。例如针对乡村供电能力指数,则需要对下面的用户容量、用电可靠性、用电稳定性、用电稳定性服务、用电可靠性服务几个指标进行重要性比较。在这个比较的过程中,需要对某个指标的重要性程度进行量化,从而使判断更为直观。一般来说模型分为目标层、准则层、方案层三个层次,通常从准则层入手,对于准则层下面的各个相关的方案层进行两两比较,并且针对目标层下的各个准则层进行两两比较,构造比较矩阵。本主题则是针对乡村电气化指数的5个维度(供电能力、民生用电、产业发展、绿色用电、用电服务)得到重要性比较结果。具体的标度定义说明如下表2所示。

表2 方案层的评价尺度Tab.2 Scheme-level evaluation scale

例如对准则层的分类,从供电能力、民生用电、产业发展、绿色用电和用电服务五方面进行评价,而每一方面又需要从各层次、各类元素进行更加详细的评估。对于不同种类以及相同种类不同元素,以上五方面因素的重要性不一定相同。因此,状态评价时需对不同种类以及相同种类不同的子准则层的重要性比较。

以一位专家对准则层体评价为例,用九标度法对供电能力、民生用电、产业发展、绿色用电和用电服务五方面的重要性进行评分,并且评分两两比较,整理得出判断矩阵C为如下表3的形式。

表3 判断矩阵Tab.3 Judgment matrix

由以上可知准则层的总评的判断矩阵为

(1)

(3)计算权向量并做一致性检验

bij=1,bii=1,bji=1/bij,bij=bik/bjk(i,j,k=1,2……n)是判断矩阵B的特征。

bij是判断矩阵中的一部分,它需要经过不同指标两两反复比较最终形成的,期间需要参考层次分析模型相关资料,也需要与相关业务专家进行反复讨论验证。在对层次分析法进行相关应用时,需要对同一目标具有一致的判断,在数学公式上也需要满足这种一致性,当判断矩阵中的bij能够满足上面给出的三个公式时,在数学上就认为判断矩阵满足一致性需求。上述为某一个层次的一致性,在两两比较的过程中,同时也需要考虑到整体的一致性,所以需要对向量进行一致性检验。

设Z=(zij),D=(di)n×1=Z·AiT,则可求最大特征值

(2)

判断矩阵一致性指标(consistency index, CI)为

(3)

利用CI值的大小来对判断矩阵偏离一致性的程度进行表示,CI值越大,说明偏离程度越大;反之,CI值越小,说明偏离程度越小。公式中的n表示判断矩阵的阶数,判断矩阵由人为构造的指标得到,受人为因素的影响,而CI值也受到n值的影响,即CI值也受到人为因素的影响。所以一般情况下来说,可用n的大小来表示人为造成一致性偏离的程度,n越大,受人为因素影响CI值越大;反之,n越小,受人为因素影响CI值越小。

应对这种人为造成偏差,为了减少其影响的偏离程度,当判断矩阵为多阶时,需要利用平均随机一致性指标 (random index, RI)进行一致性检验。具体指标值如下表所示:

表4 一致性检验结果Tab.4 Consistency Check Results

由表中数值不难看出,当n<3 时,平均随机一致性指标的值一直为0,根据一致性指标的判断原则,说明判断矩阵是具备完全一致性的。

针对此种情况,需要用随机一致性比率(consistency ratio,CR)来判断是否接受判断矩阵的一致性,随机一致性比率CR为

(4)

当 CR<0.10 时,说明可以接受判断矩阵的一致性;反之,当 CR≥0.10 时,说明反驳判断矩阵的一致性。当一致性不被接受时,需要对判断矩阵进行一定的调整,并对调整之后的判断矩阵进行一致性验证,循环往复,直到接受判断矩阵的一致性为止。

(3)层次分析法单排序及总排序

层次单排序主要是针对模型中的某一层而言的,针对其中的某一层,根据其重要性得到一个排列的顺序,这一步就是对判断矩阵进行计算,得到其最大特征向量。一般情况下,层次分析模型中用到的方法分为两种:一种是和积法;另一种是方根法,在本主题的研究中采用和积法进行计算。具体计算步骤如下。

将判断矩阵的每一列元素作归一化处理,其元素的一般项为

(5)

将每一列经归一化处理后的判断矩阵按行相加为

(6)

对向量W=(W1,W2……Wn)T归一化处理:

(7)

就是最终想要求得特征向量的近似解。

计算判断矩阵最大特征根λmax:

(8)

层次总排序需要建立在层次单排序的基础上,对每个单排序的重要性程度进行排序,与层次单排序相同,计算之后利用和积法进行计算,得到最终的结果。对本主题而言,在供电能力、民生用电、产业发展、绿色用电、用电服务者五个层次单排序分别计算完成之后,乡村电气化指数直接在这五个层次的基础上进行排序计算。

3.3 乡村电气化成果展示

乡村电气化作为一个业务指数模型,并不能直观让人掌握其数据情况,落地为数字产品,主要以BI可视化为方向,以看板的形式展示不同层级、不同维度、不同指标的情况,对每个层级的薄弱发展环节能够进行精准捕捉。

本研究主要围绕乡村电气化指数的5个维度以及22个业务指标展开,依托现有BI分析平台,以数据地图的形式,展示每个行政区域的电气化水平得分,可下钻至乡、镇等更小的区域维度。

由区域—镇—村层层下钻的方式,对每一个层级的数据进行展示,主页面主要展示民生用电、产业发展、供电能力、绿色用电、用电服务五个维度的情况,而针对五个维度涉及的不同指标,用五个页面对不同维度的详细指标情况进行展示,更直观了解某个镇或者某个村在哪些方面比较突出;镇级页面展示各个镇的指数情况;村级页面展示某个镇下面各个镇的指数情况。

4 结语

电网企业内部也出台了加强农网建设和乡村电气化推广的相关举措,积极响应国家战略要求,自上而下加强包括农业生产、农村生活、农村产业、供电服务相关的18类乡村电气化项目的推广工作。但政府机构、农村业主、电网企业和生态各方在乡村电气化提升工程遇到了较多难题,亟须解决。本文研究的乡村电气化指数评估,则为乡村电气化提升举措给出针对性思路以及数据支撑,乡村电气化指数越高,表明该村综合发展成效越好,潜力越大。乡村电气化指数是指以电力数据为主要计算数据,评价乡村利用现有资源实现全面振兴的能力或潜力。通过指数计算对乡村进行潜力评价和科学分类,优先发展潜力较大的村庄,撤并搬迁潜力较小的村庄,辅助政府乡村振兴战略实施和评价。

猜你喜欢
电气化一致性用电
注重整体设计 凸显数与运算的一致性
商用车CCC认证一致性控制计划应用
云南:广大铁路电气化改造完成 运能大幅提升
发挥党员突击队作用:推动中老铁路电气化建设高质量
Why do we celebrate the New Year?
中老铁路两国同步架设电气化接触网第一线
基于Paxos的分布式一致性算法的实现与优化
印度将在未来四年完成铁路全部电气化改造
第12讲 家庭电路与安全用电专题复习
学习用电小知识