赵昱翰
(贵州电网公司遵义供电局,贵州 遵义 563000)
在新发展阶段,越来越多的先进技术能够被应用到配电网运行发展的过程中,以技术规范配电网相关工作的行为。将大数据技术用于支持配电网的稳定运行,能够基于高效的数据处理和便利的数据传递途径来发挥预警预测与分析的作用,对各类安全风险对配电网运行的影响,在提高配电网运行稳定性的同时,也能够更好地满足市场对电能供应的大量需求。
在配电网的运行过程中,配电自动化系统,电网管理平台等系统在运行中会产生大量的数据信息。这些数据能够呈现出以下几方面的特点:首先,基于当前配电网自动化和智能化发展的方向趋势,但应用各类信息化和物联网技术,开展电力行业业务的过程中都会产生大量的数据,且这些数据大多分布于不同的数据源,难以直接进行集成和收集[1]。同时,配电网运行过程中的数据能够体现出明显的异构性特点,能够具体分为结构化数据、半结构化数据和非结构化数据三种形式。结合以往的数据处理经验,发现配电网运行过程中的可利用数据密度较低,单一的数据信息难以明确反映出信息背后蕴含的规律特点,因而容易对配电网的运行决策造成阻碍。
在考虑配电网运行中的数据量过于庞大这一特点的前提下,考虑将分布式系统用于大数据的处理分析当中,实现对于这些数据的集中储存与计算。以Hadoop这一分布式系统为例,该系统具有更便于扩展和更高效的数据交互,在应用中能够体现出明显的可靠性,因而能够满足处理大数据的要求。该分布式系统主要以符合配电网运行情况的编程模型为基础,对大规模数据进行并行处理。在这一过程中被处理的大规模数据,应能够划分为数据大小角的子数据集,且各个子数据集之间无须进行额外的通信[2]。在这一前提下进行大规模数据量的存储,应选择能够储存数据文件的有效工具,既能够拥有充足的空间对冗余的数据进行备份和存储也能够分类存放,并能够以周期性的方式接受从来源下的检测信息和校验数据,从而保障输入数据的可靠性。
在大数据计算方面,主要依赖深度学习算法,以构建深度学习模型的方式,基于非线性变化的原理角度来对数据进行抽象化的处理,提取数据信息中蕴含的规律和特点。现阶段能够用于大数据计算的深度学习算法模型,以各种类型的学习网络为主。
数据预处理时配电网数据处理的首要环节,为实现对于配电网运行过程中产生的各项数据预处理,具体包括配电网运行异常数据识别、数据选择、数据变换、数据规约等预处理工作。在考虑大数据技术本身应用特点的前提下,考虑配电网运行中存在的大量文本,需要将这些数据信息转化为能够被系统程序认可的数据形式。
具体而言,以配电网运行的文本为例,在数据预处理过程中,从资产全生命周期管理、工作票和操作票、运维日志、报告、国家/行业/企业标准等方面入手,考虑不同单位对配电网运行产生的文本需求差异,应用合适的数据处理方法[3]。例如,由于资产配置,信息等在现阶段的企业单位管理中有着较为规范的书写和呈现形式,具有较强的结构性,可以直接从语法规则的角度,在系统程序中,通过建立向量空间的方式,直接在结构中填充相应的文本内容。假设ys为开始年份,ds代表开始日为该年第几日,ms代表开始分钟数为该日的第几分钟,mr代表操作持续分钟,则可以将文本信息的转换过程表示为操作时间:[ys,ds,ms,mr]。
操作任务表示如下。
以保证配电网供电可靠性为主要目的,在配电网的运行中发挥大数据技术的作用,主要可以从以下3个方面来减少配电网运行中的安全隐患问题。
对配电网噪声数据识别与替补的分析,主要建立在明确配电网整体架构的基础上。配电网运行造成主要来源于各种电气设施设备,噪声数据主要体现在发电侧、输电侧与配电侧、用电侧3 个方面。在受到网络或设备问题影响的情况下,都会产生噪声数据,噪声会对配电网的采集数据产生干扰,进而影响数据的真实性和质量[4]。在考虑配电网系统实际运行需求的前提下,应那个加强对噪声数据的识别,并通过对噪声数据的及时替换,保障配电网整体的运行安全与效率效果。
基于这一前提,主要可以选择应用大数据中的聚类算法和决策树算法,以分阶段的形式来对配电网的噪声数据进行识别。以聚类算法为例,应用该算法来对配电网的噪声数据进行识别,主要基于聚类算法应用流程(图1)实现。考虑应用该算法对噪声数据进行识别主要分为两个阶段,在第一阶段,主要以规划数据集的方式,当配电网运行过程中产生的大数据集受到噪声污染而产生噪声数据时,以引入相关系数这一概念的方式,通过分析大数据集中两个数据之间的相关系数方式,对两个数据之间的相关度进行分析。通常情况下,计算得到的系数值越大,则相对应的两个数据之间也具有更紧密的关系。在此基础上,还需要依据计算的相关系数次数来计算其平均值,在将计算得到的平均相关系数按照降序方式排列后,选出平均相关系数高的数据作为初始聚类中心。在聚类结束后,需要将平均相关系数作为半径,对聚集簇的密度进行计算。
图1 聚类算法应用流程
而在二阶段的噪声识别部分,主要发挥决策树算法的作用。在获得一阶段的噪声数据分析结果之后,基于对疑似噪声数据簇进行分类的目的,在训练决策树的过程中,以正常簇和噪声簇数据为标准依据[5]。在应用该算法的过程中,需要引入信息熵和信息增益两个概念来进行数据信息的计算。其中,依据信息增益大小可以对信息熵进行计算,当信息熵的计算值越小时,可以代表计算依据的集合样本拥有更高的纯度。
对于配电网噪声数据的替补,则主要基于距离分布权重,应用KNN 替补方法来实现。该替补方法在实际应用中,需要对目标数据与正常簇中的所有数据的欧式距离进行计算。在这一过程中,欧式距离的计算公式如下:
依据得到的计算结果,在所有的欧式距离值中,选择最小的数据作为目标数据的最近邻。在此基础上,当计算得到的欧式距离值较大时,则距离噪声数据更近的数据在整体中占据的比重也更大。
用电行为分析也是配电网运行中涉及的主要内容,用户产生的用电行为中包含大量的信息,且不同地区的用电行为能够呈现出多样化的特点。以重点识别异常用电数据为主要目的,对配电网中用电行为的分析,应能够在应用聚类算法的基础上,结合DBSCAN 算法,发挥两种算法的互补作用,从而提升用电行为分析结果的准确性与科学性。
结合以上用电行为架构,对用户用电行为进行分析,最主要的就是能够及时发现其中可能存在的窃电行为,进而导致用电数据异常的情况。从大数据和应用算法的角度来看,可以将离群点作为对用户窃电行为进行判断的主要依据。在实际应用该方法进行用户用电行为分析时,在将配电网中的用户用电量数据收集起来后,首先进行聚类分析,待形成离群点后,再依据k-means 算法来对这些离群点数据进行进一步处理,从而形成聚集簇。在此基础上通过构建结合两种聚类算法的互补模型方式,实现对用户用电行为的分析。
具体而言,以DBSCAN 聚类算法为例,该算法在实际应用中,应能够手动输入样本的邻域距离以及某一样本在邻域距离下的邻域中样本个数最大值,以这种组合参数的方式来对空间中样本周围分布的紧密程度进行描述。
在构建结合两种聚类算法的互补模型时,需要首先应用k-means 算法,对预处理后获得的数据集进行聚类分析,从而形成k 个聚类簇,然后再应用DBSCAN聚类算法对得到的数据集进行聚类,在找出其中的N个离群数据集后,判断其中是否包含离群点聚类簇中的数据。如果其中含有离群数据,则需要将该数据点从聚类簇中划分出去。
在配电网的运行过程中,也可以应用大数据来实现对配电网短期运行负荷的预测分析。基于当前市场对电网运行规模以及电能供应需求的不断提升,以保障配电网运行可靠性为主要目的,在应用大数据技术时,依据对历史用电数值的总结分析,对未来一段时间配电网的复合数据指进行预测,以便能够及时应对可能出现的缺点或电能浪费等情况。而基于对配电网运行负荷进行预测分析的需求,应能够考虑满足复合预测飞机的实时性和准确性。
基于这一目的,主要应用聚类分析和Elman 的方法来实现对配电网短期负荷的预测。考虑电力负荷预测会受到历史数据值以及运行环境下各项因素的影响,最重要的就是能够确保用于预测负荷的历史数据真实准确。受到现阶段配电网运行中历史数据数量较多且分类困难的影响,在应用聚类算法的基础上,引入均值函数的概念,依靠定义数据的均值函数来确定不同年份配电网的运行负荷数据。同时也需要引入方差函数、反常函数以及平滑函数,实现对异常数据的有效处理。用这一方法对配电网的短期负荷预测进行分析的过程(数据预处理流程)如图2 所示。
图2 数据预处理流程
在实际进行数据预处理时,首先应用均值函数E(x)和方差函数V(x),来对电力复合样本数据的均值和方差进行计算,然后再应用反常函数p(x)找出其中疑似异常的数据信息。基于DBSCAN 算法来对配电网的原始数据集进行聚类,将通过聚类得到的异常数据与经过函数得到的异常数据共同作为异常数据的主要范围,则可以及时发现配电网实际运行中可能存在的各种故障问题。
而在应用Elman 进行短期负荷预测的过程中,可以引入动态神经元网络,从而更直观形象的反映系统运行过程中呈现的动态特性。Elman 是一种前向神经网络,是对以往神经网络算法功能的优化与改进。在实际该方法时,需要借助经过反常函数预处理过的数据集,作为Elman 神经网络的输入。在对隐层和输出层的输出值、误差值进行计算之后,对各层间的权值和阈值进行修改,从而得到全局误差。在对这一得到的误差值进行对比分析之后,如果达到正常情况下的系统运行标准,则网络训练过程结束。根据这一流程来反映配电网系统的运行情况,也能够及时发现配电网运行中可能存在的缺电或超负荷情况。
综上所述,将大数据技术应用到配电网的运行过程中,能够从配电网的噪声控制、用电行为分析以及短期运行复合预测等角度,加强对于配电网的进行管理与控制,从而有效提升供电可靠性。在实际应用中应能够明确大数据技术的应用原理与特点,从数据预处理的角度,考虑大数据技术能够满足配电网供电可靠性要求的途径和方法,以便能够在保障配电网安全运行的同时,也能够促进电力行业的发展。