胡金东++梁小雨++高义新++郝菁++王震
摘 要:本文详细阐述和研究了在如火如荼的互联网大环境下大数据与配电网投入与产出效益分析与决策技术研究,介绍了配网规划合理性、配网运行效率、配网线损、故障抢修和投诉、线路台区停电、业扩报装问题分析、项目投入产出等方面的业务聚类分析和关联分析,用于对比项目投产前后供电能力和供电质量的提升情况,形成项目投入产出量化分析数据,实现配网项目建设后评估,确保精准投资、精益管理、精细运维。同时,利用数据挖掘技术,计算业务协同平衡点和参考阈值,实现对拟投资项目的事前量化评估,降低项目投入盲目性,提高投资效率。
关键词:大数据;配电网;数据挖掘;投资效率
中图分类号:F403.8 文献标识码:A 文章编号:1671-2064(2017)01-0181-04
Abstract:In this paper, we studied in detail and researched on big data and power input&output efficiency analysis and decision-making technology in the flourishing environment of Internet. It introduced the rationality of distribution network planning, distribution network operation efficiency, distribution network line loss, fault repair and complaints, line area blackout, expanding new problem analysis, project input and output of business cluster analysis and correlation analysis. It is used to contrast the pre-project and after-project put into production ability and quality of power supply power supply situation, the formation of project input and output data, the quantitative analysis to achieve distribution network evaluation after project construction, to ensure accurate investment, lean management and fine operations. At the same time, it is to apply for the data mining technology, computing business coordination and balance is a reference threshold, implementation to be prior quantitative assessment of the investment projects, reduce project investment blindness and improve the investment efficiency.
Key words:Big data;Distribution Network;Data Mining;Investment Efficiency
1 引言
伴随着社会经济的发展,GDP的增长和产业结构在不断的变化,电力最高负荷和销售电量也在不断地增长;电力公司需根据电力最高负荷和销售电量的增长趋势开展配网投资规模调整。
2013年国务院常务会议作出了“加强城市配电网建设,推进电网智能化”的部署,将加强城市配电网建设作为国家层面重要工作任务,为进一步加快改造配电网建设,提供了更有力的政策支持。
2015年,国家能源局下相关材料,指出近年来随着加大我国配电网建设投入,配电网发展迅速,对该方面的研究的不断深入,发现存在城乡发展不平衡等各种局限性问题,供电的质量有很大提高空间。
同年,刘振亚董事长在国家电网公司第二届职工代表大会第六次会议暨2015年工作会议上的报告中,明确提出要全面加强配电网建设。
近年来国家电网公司在信息化建设上,已全面实施SG-ERP工程,按照集约统一、严格调控、试点先行、积极稳步推进的工作思路,大力推动信息化健康、快速、可持续发展。
根据我国配网行业的特点,基于资产全寿命周期、“五位一体”的管理理念,结合国网公司配电业务现状,以配网资产为载体归集公司在配网领域的投入和产出,研究基于配电网运营数据、业务数据、資源数据的投入产出效益评价模型、分析方法;发现影响配电网投入产出效益的主要因素,进而提出切实可行的改进提升措施;同时,基于大数据的配电网投入产出效益挖掘分析场景,开展多因子关联分析,进行配电网投入产出效益预测方法的研究,从而有力提升配电网运营的科学化和规范化。
构建适合电网企业配电网投入产出效益评价理论框架,建立投资效益评价的指标体系和综合评价模型,对合理把握投资规模和时序、促进电网科学发展、实现配电网投资效益最大化具有重大意义。
第一,目前的投资效益评价主要是关于对电网网架的建设,为了电网安全运行,增强电网可靠性等方面。该研究认为应该在确保电网安全的基础上,还要对配电网投入产出效益评价的各方面进行全面考虑,从而对今后的配电网的投资提供参考和决策依据。
第二,随着我国国民经济的迅猛发展,电力负荷逐年增加,配电网络的结构也日趋复杂,造成耗损逐年增大。
通过该研究成果,实现对各供电公司配电网投资工作的监控,保证更加科学、合理的投资决策工作,实现对各供电公司考核,根据考核的结果来有效提高投资决策水平,以达到电网建设项目管理规范、合理、透明化管理。
2 国内外研究的现状和发展趋势
国外电力企业的投资效益评价主要涉及到可靠性统计方式:基于低压用户的方式:包括英国、法国等欧洲国家以及美国的大部分地区,均对所有终端用户进行供电可靠性的统计和评价;基于中低压配电变压器的方式;西班牙、法国采用基于功率或者电量的方式。在各方面的评估下,国外可靠性的主要技术措施应用范围广,提高了供电质量等。
国内电网行业的投资效益评价主要涉及电力市场评价、电网及电网规划评价、企业经济效益评价、企业绩效评价等。在综合评价方面主要对电源建设项目、电网规划等进行评价,如电建设项目投资风险估计;对输电网规划的投融资糢式的研究;电网运行方式、电网设备检修的可靠性评估。
对电网建设项目评估研究的相对而言比较充分,在配电网项目的供电能力、可靠性、经济性、供电质量、合理性、规范性等基础上,提出相对科学、完整的系统评估标准,并应用多维度分析法建立了评估方案。
在电网企业这个市场环境下,如何构建电网投资项目评价指标体系以及对投资综合评价模型的研究;研究电网投资、电力消费和GDP增长三者之间的关系需要通过泛函数生产计算;对风险进行评估,提出适用于该市场环境的评价方法和市场评估模型;通过利用马柯维茨投资组合理论来对电力项目投资总额的多项目进行合理的分配。
从国内外研究总体情况来看,电网投资效益评价研究主要以电力市场和发电工程为主,对电网的研究主要集中在农网和单电网项目的评价,这些研究主要涵盖安全生产、目标责任制等传统经济。
综上所述:
(1)对电力企业的投资效益评价主要以电力市场和发电工程为主,比如发电企业成本及收益、资产和风险管理等问题。对电网的研究侧重于农网和单电网工程项目的评价,对配电的相关研究很少。
(2)在经济、管理、工程、技术等领域都有深入的研究和应用,都具有较为成熟的研究体系。但在电网企业的配电网研究方面的资料相对比较匮乏。
(3)电网企业配电网投资效益研究评价的理论研究相对薄弱,国内还没有形成配电网投资的评价指标体系,也没有形成相应的评价模型。
3 投入产出评价模型发展的历史
3.1 投资效益评价的早期
关于投资项目的效益评价,从资本主义时期起,企业以追求最大利润为基本目标。古典派的经济学者,大都集中对私有企业追求最高利润的行为进行分析,他们设想投资项目的经济环境政府执自由放任的态度,市场则是权衡商品价值的机器,就无需设置经济管理机制,私人利益及社会利益。
3.2 傳统社会费用——发展效益的方法
随着各国政府对公共事物认知和的提高人民生活质量的加强,政府对经济进行更多的干预与指导。于此同时,经济学家也通过关心社会效用、生活、消费水平、以及一些社会福利问题,提出福利经济学。随着政府计划、公共服务和投资项目的增多,这就促进了项目评价理论基础和实践程序的发展,比较系统的方法论应运而生。
50年代初,随着发展经济学的出现,使项目评价在发展中国家的应用广泛,这些国家通过科学判断,理性分析,制定切合国家实际的国家计划。因此发展经济学将此作为发展中国家对项目评价的理论依据,因此项目评价也成为发展经济学不可分割的组成部分。
3.3 “新方法”产生及应用
从70年代以来,经济学家从政府等多方面进行研究分析,将项目评价在概念上从复杂到简化,在计算上日趋规范化、表格化、程序化、简单化和方法的实用性。在十一届三中全会之后把可行性研究正式纳入基本建设程序。
在这个阶段,引起和使用西方国家项目的评价方法,并结合本国国情开展了广泛且深入的研究工作。随着电力改革的不断深入,原先项目的投资主题由国家改为电力公司,也需要对输变电项目进行经济评价。
4 配电网经济评价方法
配电网经济评价方法主要包括最小费用法、收益/成本(B/C)法以及收益增量/成本增量(iB/C)法等三种方法,下面分别简单介绍这三种方法的特点:
4.1 传统的最小费用法
传统的最小费用法以规划项目费用最小为原则,规划方案是单属性的。该方法均衡协调项目的初始投资与长期运行、维护费用之间的关系,从而将项目费用降到最低,这种方法直观也易于实现。
4.2 收益/成本比法(B/C法)
收益成本比法是以收益与成本两者的比值来对项目进行的经济评价,该规划为多属性,该方法同样适用于方案以及项目的优选。
4.3 收益/成本得增量比法(iB/C法)
收益/增量的成本增量比法是通过收益增量与成本增量的比值来对项目进行经济评价,该规划同样为多属性。该比值不仅体现方案的经济性,还衡量了方案决策的有效性和合理性。
5 大数据发展历史简要回顾
2005年Hadoop项目出现。其基于google的GFS、MapReduce、BigTbale三篇论文实现了开源的分布式计算框架,可在普通硬件上进行海量数据处理,逐渐发展成为治理分布式数据的基础。
2008年末,“大数据”得到部分美国知名计算机科学研究人员的认可,业界组织发表相关文献(大数据计算:在商务、科学和社会领域创建革命性突破)。
从2009年开始,“大数据”成为互联网信息技术行业的 流行词汇,大数据起初成熟应用多在互联网行业,互联网上的数据逐年增长。
2011年5月,麦肯锡全球研究院发布大数据的相关报告:《大数据:创新、竞争和生产力的下一个新领域》,该报告一经发布,“大数据”迅速变成IT行业的热门概念。
2011年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,主要包括了海量数据的存储、数据的挖掘、图像和视频智能分析,这都是大数据的重要组成部分。
2014年4月,世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告》。报告认为,全球大数据产业的日趋活跃,技术演进和应用创新的加速发展,在保障国家安全方面的重大意义。
5.1 数据挖掘技术发展历史简介
从1989年到现在,数据挖掘的定义随着人们研究的不断深入也在不断完善,目前比较公认的定义是Fayyad等给出的:数据挖掘是对数据进行有效、完整等最后以可理解模式对数据进行展示。
5.2 数据挖掘方法论
主要是采用CRISP-DM跨行业数据挖掘标准过程,主要包含有对商业的理解、对数据的理解、相关数据的准备、数据建模、模型的评估及模型的发布共6个主要步骤。
5.2.1 对商业的理解
即商业理解,在第一个阶段我们必须从商业的角度上面了解该项目的要求,需要达到什么目的,并将这些目的与我们所需要做的工作结合起来。
主要工作包括:首先要确定该商业目标,接下来确定数据挖掘的目标,制定项目计划。
5.2.2 对数据的理解
数据的理解阶段开始于数据的收集工作,收集初始数据,对数据进行加工,描绘数据,并且探索数据特点及相关规律,进行简单的统计,校验数据的质量,包括数据的完整性,正确性,缺失值的填补等。
5.2.3 相关数据的准备
数据准备阶段包括从基础数据中构建最终数据(将作为建模工具的分析对象)的全部工作。数据的准备工作有可能被运行多次,而且其实运行顺序并不是预先设定好的。这一阶段的任务主要包括:指标,记录,变量的选择及转换,以及对数据进行清理等等。
5.2.4 数据建模
在这一阶段,会选择和使用各种各样的建模方法,通过建造,评估模型将其参数校准为最正确的值。
5.2.5 模型的评估
从数据分析的角度来判断,在该阶段中,已经完成一个或多个高质量的模型的建立。在这一阶段结束之时,有关数据挖掘的使用应达成一致的决定。
5.2.6 模型的发布
模型的发布,即将其发现的结果以及过程组织成为可读文本形式。模型的创建并不是项目的最终目的。建模期间增加的数据仍需要以用户认可的方式呈现。
5.3 数据挖掘模式
数据挖掘模式有多种,按功能可分为两大类:预测型模式和描述性模式。
预测型模式是根据数据项来确定某种结果。挖掘预测模式所使用的则是可以明确知道结果的数据。
描述型模式是对数据中存在的规则做一种描述,或者根据数据的相似性进行分组。但是描述性模式不能直接用于预测。
在实际应用中,往往根据模式的实际作用细分为以下6种:
(1)分类模式。分类模式是一个分类器,能够把数据集中的数据项反映到某个既定的类上。
(2)回归模式。回归模式的函数定义与分类模式相似,它们的差别在于分类模式的预测值是离散的,回归模式的预测值是连续的。
(3)时间序列模式。时间序列模式根据随时间变化的数据的趋势预测将来的值。
(4)聚类模式。聚类模式把数据划分到不同的组中,组之间的差别尽可能大,组内的差别尽可能小。
(5)关联模式。关联模式是数据项之间的关联规则。
(6)序列模式。序列模式与关联模式相仿,而把数据之间的关联性与时间联系起来。为了发现序列模式,不仅需要知道事件是否发生,而且需要确定事件发生的时间。
6 现有研究工作的基础
自SG186工作开展以来,国網山东省电力公司目前在用的系统主要有以下几类:
(1)国家电网公司统一组织建设的ERP、规划计划、财务管理、生产管理、营销管理、GIS等系统。
(2)自建的一些小的辅助管理系统。财务管理方面,国网山东电力以集中、统一、精益、高效地财务管理理念,实现核算管理、管理会计、费用管理、电价管理、收入管理、税务管理、资产管理、资金管理、产权管理、物资财务管理、基建财务管理、薪酬财务管理、预算管理、财务绩效评价、风险控制管理、财会队伍建设等财务业务的“六统一”和“五集中”,并实现在山东电网的全面覆盖;资金实时在线监控,为配网投入产出积累了大量有价值数据。
规划管理方面,国网山东电力按照统一规划、分级管理的方式,明确分工,建立涵盖所有电压等级和专项、层级的统一规划和计划应用,对规划计划的编制与调整等各环节提供有效的辅助手段;为有利开展配电网方面的投入研究提供了大量历史数据。
生产管理方面,国网山东电力在电网生产标准化建设的基础上,建立了以资产管理为核心覆盖公司省公司、地市公司等基层单位、贯穿电网生产全过程的—体化生产管理信息平台,实现设备台帐管理、工单管理、缺陷故障管理、资产绩效评估、安监管理、应急管理、可靠性管理等生产业务全覆盖,满足检修成本分析需要,进一步推动资产全寿命周期成本管理的提升,实现电网生产的规范化、标准化和精细化管理,提高了电网生产管理水平。
国网山东省电力公司ERP、计划、生产、财务、营销等信息系统积累了大量的历史数据,这些为充分、全面、高效地基于大数据技术开展配网投入产出效益分析和决策技术研究提供了准确数据源,同时也具备了课题研究展示的平台基础。
国网信通公司是国家电网公司的直属综合性科研单位,公司技术人员熟悉电力系统组织结构、电力业务现状和需求发展,了解各种电力信息化业务系统及其接口方式,并形成了一支专家队伍,这为本项目理论研究提供了良好的专业知识和人才资源储备。
目前产业集团内各研发单位已在大数据相关关鍵技术及应用等领域开展研究工作,具备一定的基础,主要包括:
(1)团队建设方面:通过多种渠道招聘,引入高端数据分析等专业人才,从技术、分析、策划几个层面完善了团队结构,该专业化大数据研发团队成员包含业务专家、业务需求分析人员、数据架构专家、数据集成及模型设计实施人员、技术架构专家及技术研发人员等,是一支大数据管理和标准研究的核心团队。
(2)技术储备方面:对数据治理与应用数据挖掘以及数据分析等领域进行了长期的深入研究,产业集团自主开发了智能分析决策平台,并于2014年9月在国网公司正式上线运行。目前已经应用于所有省市电力公司运监中心,对数据质量进行分析。
(3)业务积累方面:产业集团通过遨请业务专家进行专題交流,并长驻电力生产业务一线,深入了解和学习电力业务知识,实施了国网生产、调度等核心业务领域的信息管理系统,有深厚的业务背景和数据积累。
(4)项目实践方面:产业集团通过不同的项目积累经验、锤炼技术、锻炼队伍、积累业务知识。目前拥有自主产权的基于开源的大数据应用技术平台,在营销等业务领域,已经具有落地的大数据应用项目支撑。
(5)合作交流方面:与国际咨询机构、业界主流厂商、科研院所、高效等单位进行大数据方面的相关交流,吸收其在电力能源以及其他行业大数据研究与实施经验,通过交流研讨等多种形式,深入了解并制定适于电网公司的大数据解决方案。
7 结语
传统的配电网效能评估沿用了传统的工程项目评估方法,属于对配电网建成的后评估,评估结果具有一定的客观性和参考意义,但其仍存在很大不足,主要表现在与配电网本身的结合性不强,仅从投资和收入等纯财务角度对配电网进行评估,无法全面、确切反映投资对配电网产生的实际效益、效率、功能,从而很难对配电网建设提供应有的指导和借鉴,本项目将立足传统的效能评估方法,综合考虑供电服务能力、线损、供电可靠性等因素构建基于运营视角的投资效能评估体系,通过对配网项目的定量评价和定性分析,引导公司对投资规模、投资项目及投资时机进行合理安排,全面促进配电网发展方式由重视数量和质量向关注效率和效益转变,加快现代配电网建设进程。