雷君杰 生一兵 乔娇 赵娜
摘 要:随着我国经济水平不断提升,互联网技术也得到了极大发展。电力行业与互联网充分融合,推出了全新的互联网+大数据电力行业运营、管理模式。为了防范电费风险,避免出现损失,电力企业可以采用大数据这一全新手段,将电力大客户电费风险进行细化、论证大数据运行过程中收集和处理信息的技术流程,及时寻找其中出现的风险隐患,找到适合的解决方法,将电费风险防患于未然。
关键词:大数据技术;电费风险;潜在问题;技术应用
1 引言
随着电力大数据技术的具体应用,可以实现对电力企业售电、用电、风控等环节的深入挖掘和分析。电力大客户作为电力企业重要的客户构成,其用电需求大、对供电的安全性、稳定性要求高。特别是钢铁、煤炭等行业,更易受政策和国际形势影响,这就造成以钢铁行业为代表的电力大客户用电情况波动较大,电费风险也相对较高。为了解决这一难题,电力企业可以通过采用大数据技术,建立起一套全新的适应市场的电费风险管控体系,加强电费管理工作,实现电费信息处理全流程治理,细化任务指标,对潜在风险和隐患及时发出预警,从而降低电费风险,保证电费回收。
2 电费风险数据的主要来源
各类电费数据信息是衡量整个电力企业营销工作的重要指标之一,能体现电力企业的公司经营管理效果。电力企业电费管理主要涉及抄表、核算、收费三个业务。电费回收主要包括:发行电费、实收电费、预收电费、欠费电费四个主要部分。其中发行电费、预收电费和欠费电费回收这三个方面流程较为复杂,时间耗费较长,电费风险问题存在较多,现在针对这几方面进行讨论。
2.1 电力企业的内部因素
2.1.1 供电企业
电力企业需要对所辖各个供电单位的电费回收情况和电费回收风险进行对比,以掌握基层单位电费回收的压力和痛点,并制定出切实可行的电费管理办法。供电企业本身的电费管理工作是否到位,会直接影响电费回收。若在供电期间综合运用多种手段,采用有效预防措施,比如:分次结算电费、采用预付费装置、制定有针对性的电费回收策略等,能够有效达到降低电费风险的目的。
2.1.2 电费信息
电力企业在对用户进行电费回收的过程中很容易发现,电费信息当中数据类型和数据量一般比较大。数据中包含的种类较为繁杂,包括用户信息、用电信息和电费信息等内部数据,还有不同结构分化的外部、网络数据等。电力企业要对这部分信息进行采集和整理,工作强度较大,而且风险分析管控制难以深入。
2.2电力企业的外部因素
2.2.1 电压等级
不同电压等级的用户电费回收情况差异较大,能从侧面反映电费风险问题的存在。针对这部分用户,电力企业可以从负荷、容量和安全方面入手,深入分析,结合市场形势,及时识别出其中存在的风险隐患,适时干预,尽可能地将电费风险从初始阶段进行控制和消除。
2.2.2 用户信息
按照用電类别区分,用电客户分为居民用户和非居民用户。非居民用户又包括工业用户、商业用户等。各类用户对电压需求的高低有很大的不同。通常居民用户的基数较大、个体的电费风险和比例影响相对来说会比较低。但是从大型企业单位来看,部分企业需要进行调控的因素较多,管理起来出现的问题也较多,电费风险较大。
2.2.3 行业类别
电费回收情况受用户企业的行业类别的影响。这些因素来自于多个方面,包括用户企业的性质、市场形势、国际环境等,导致用户电费风险级别不同。供电企业前期应该对这部分企业全面了解,及时掌握行业动态,实现电费管理工作前置,从而保证电费的回收情况。
3 电费风险主要技术研究
现阶段我国在大数据技术方面还没有形成自己的系统,主要还是依靠来自于国外的系统。美国 ASF 基金会成功研发出了分布式系统基础架构 ( Hadoop) 。Hadoop 分布式文件系统是由Apache基金会所开发的。该系统具有解决海量数据存储、多样化数据分析支持的能力,另外软硬件的成本较低也是该系统的优势。 Hadoop技术构架可以从数据采集、数据存储、数据管理、数据计算、数据分析五层模型进行研究。
3.1 数据采集
电力企业在使用管理系统时期数据库主要是存储客户、电费等数据信息。其中企业的基本信息、法人代表等都可以从相关政府渠道获得。另外企业的经营状况,国家整体的经济环境等结构类型的问题可以从网站公开的系统中提取。
Hadoop在进行数据采集肯处理主要方式有Kafka、Sqoop两种技术的相互协作来进行,最终实现电费、用户等信息的采集,是企业进行场景分析的技术支撑。Kafka读取用户信息的方式是分布式的,而且信息的吞吐量非常高,可以线上线下进行操作。加上集群机提供用户的实时电费情况,可以即时显示已收电费和欠费情况。
Sqoo则是和Hadoop协作,根据自己本身的技术特点可以将数据库中的电费数据信息进行交换移动,将最原始的数据从数据源转出到Hadoop上。Sqoo具备创建子任务系系统的功能,既能将各个任务模块进行处理,也能输送海量的电费信息数据,这样既能保证系统的基本安全问题,也能实现用户信息、预收电费信息的整合。
3.2 数据存储
“大数据存储从系统内部来讲是将大量各种不同类型的存储设备通过应用软件集合起来协同工作。对外来讲系统提供数据存储和业务访问。目前我国数据库存储管理包括分布式存储、NoSQL、内存存储技术三个方面。”
Hadoop中存储可以用分布式文件存储系统(HDFS),该系统可以进行扩展并通过备份实现高容错性,能够将分散的用户、电费信息资料数据资源构成一个虚拟的寻出设备,通过网络分散存储。
NoSQL数据存储的内部存储技术主要应用于对数据的读取并处理响应较高的场景部分,具有不需要固定的电费数据信息表结构的性能优势。
3.3 数据管理
大数据技术在对电力企业内部电费、用户的数据进行处理时,主要是对原始数据的清理、填补、合并检查数据的一致性,将互相之间没有关联的没有章程的非结构化数据加工成方便的结构类型。已经收取的电费数据清理也可以依靠工具Sqoop将网络上的原始数据进行结构haul的方式进行集中处理。
3.4 数据计算和分析
在进行大数据运算时首先用Kafka采集数据,加上用MapReduce方法,将大数据信息划分出多个数据块,对数据块进行计算任务设置,调度数据中的相应计算节点,进行处理和计算。通过Hadoop进行监控,了解数据模块中的节点基本情况并进行实时控制。在进行数据的计算中通常是使用机器学习方法建立模型,通过数据建模可以通过变量进行参数预测。
4 大数据应用场景的分析
电力企业用大数据技术实现对用电客户信息的收集,找出其中的风险类型进行预测从而建立起电费回收的风险评价体系。其中对数据信息处理主要内容有数据处理、业务数据分析、基于距离计算的聚类分析将用户电费信息相关数据收集,将其中风险发生的因素找出,从业务侧深入分析发现风险点,进行最初的电费风险评估。根据风险程度的高低进行差异化的电费回收方式,制定整改措施。风险评价要通过大数据支持的科学评价体系支持,全面分析用户的行业、城市、类型等方面,通过对相关用户的风险提示,减少电费风险的产生。
5 结语
现阶段大数据在电力企业运用的程度还有待提高,但可以确定的是通过大数据进行用户的信息采集和分析数据,测出其中的电费风险问题对于电力企业来说必然是一个未来发展的趋势,通过大数据技术的支撑,电力企业采取相关措施,保证企业的基本经济效应。
参考文献:
[1] 吴军英,辛锐.基于大数据技术的电费风险分析[J].科技创新导报,2017(7):121~122.