深圳供电局有限公司 林志贤
由于电网调用业务操作具有多样化特征,以单一的标准对其进行判断会影响批卷结果的可靠性,为此,设计了一种基于机器学习的电网调度业务自动批卷系统,将具有强大计算能力的AMD Zen4处理器和数据转化能力的SZ11-CBOX云盒作为硬件,利用AMD Zen4的Raphael搭建BP神经网络,对业务操作的特征进行学习,通过K-means聚类过滤干扰,SZ11-CBOX将业务数据分类后,匹配待批卷数据与各分类特征之间的一致性,实现最终的评分。测试结果表明,系统的批卷结果与实际结果的拟合度可以达到99.0%以上。
为了确保电网调度业务操作的正确性,对实施的调度业务进行合理的评价分析是十分必要的。但是考虑到电网调度业务数据规模庞大,通过人工的方式逐一进行评判不仅会带来大量的人力成本和时间成本,执行效率也难以满足实际工作需求。基于此,本文设计了一种基于机器学习的电网调度业务自动批卷系统,分别对系统的硬件和软件进行了设计,并通过实验测试验证了系统批卷结果的可靠性。通过本文的研究,以期为提高电网调度业务评价工作的执行效果提供帮助。
自动批卷系统的运行是建立在对数据特征学习的基础之上的,因此要求处理器能够实现对海量数据的高效计算,为此,本文选用AMD最新推出的3D V-Cache增强版Zen4处理器,其集成了128MB缓存,因此可以同时实现对更多数据的处理需求,现阶段的主要应用途径是搭载12代酷睿Alder Lake对大规模数据的集中处理。AMD Zen4处理器的搭载系统为Genoa,适配于桌面版的Raphael操作要求。从构架上看,Zen4架构采用分布式的构架方式搭建了更加扁平化的数据管理机制,全新研发的操作模式支持DDR5、PCI-E 5.0的协同操作,与Zen3相比,Zen4升级后新的平台不再受服务器的版本限制,以AMD的EPYC服务器为基础的产品线都可以与之建立适配关系。自带的12组CCD可以满足更大规模数据处理需求,每组8个核心,这种多核心的构建模式使其对不同类型数据的处理更加灵活,对应的192个线程增加了应用系统的荷载能力。不仅如此,Zen4在功耗方面也表现出了更高的先进性,顶级Zen4的TDP默认功率为320W,高压下功率最高可达到400W,极致状态下1ms的瞬间功率可以达到700W,持续时间为5s,这样的处理效率决定了当系统出现负载冲击时,可以通过对Zen4状态进行调节缓解这种压力,确保系统的稳定运行。
为了提高自动批卷系统应用范围的覆盖性,本文在系统中搭载了云盒装置,采用的具体设备为顺舟SZ11-CBOX。为了确保系统中数据的安全性,SZ11-CBOX的防浪涌系统可以将小规模的负载冲击进行解耦处理,将其转化为更加均匀的数据流,通过这样的方式确保系统可以在更大范围内实现可靠运行。考虑到实际的系统应用环境存在一定差异,复杂的电源环境可以会引起系统的异常波动,SZ11-CBOX自带的电源转换模块可以实现交流/直流电源的有效控制,通过采集模块和计量模块的联合作用,对系统的网络路由和交换关系进行实时调控。不仅如此,SZ11-CBOX的设计充分考虑了其在多功能性和稳定性方面的应用需求,将物联网技术作为云盒设计的基本架构,以此为基础,系统在业务数据收集和批卷过程中,可以实现多源同时进行,自带扩展属性可以适应不同硬件设备的接入需求。SZ11-CBOX支持Wi-Fi,4G,网口,光口入网方式,并允许多网同时在线,光口的二层组网能力使之具有更高的灵活性,在环型、链型组网场景都可以有效运行。嵌入式交换通信模块可以满足系统增加或删减网络配置的需求,支持有线、无线相互备份,为数据的正常稳定传输提供可靠基础,断网条件下的数据备份切换不受影响,支持AP,STA,Repeater多种模式的无线扩展请求,在LoRaWAN协议下可以实现数据的透明传输,MODBUS RTU转TCP、MQTT功能的实现都是以LoRa、ZigBee为基础完成的,因此可以帮助用户更加便捷地了解SCADA Modbus指令携带的信息。
对业务的批卷处理首先要建立业务的正确标准,以人工方式进行批卷主要是以实际的操作经验为基础进行的,但系统作为一个单独的个体,其对特征和规律的积累主要是建立在数据积累的基础之上的,因此,为了获取可靠的批卷标准,本文利用机器学习的方式提取电网调度业务的操作特征。
首先在系统的AMD Zen4处理器中导入电网调度的历史数据X,由于不同业务的操纵存在明显的差异性,这也将直接导致对应的操作特征存在不同。为此,本文首先利用Raphael将数据X按照业务类型进行划分,划分后的调度业务数据可以表示为:
其中,x
表示具体的分类结果。以此为基础,利用机器学习的方式对不同分组的特征进行提取,本文构建了三层的BP神经网络实现该过程。其中,输入层的输出结果和隐藏层的输出结果分别作为隐藏层每一个神经元输入和输出层的输入值,隐含层的主要是对数据中相同操作的提取,考虑到相同业务的操作存在不唯一性,因此本文搭建的隐藏层为2层,隐含层的计算方式为:
其中,B表示关于x分类的业务操作特征,p表示i操作出现的频率。此时的提取结果是整体数据的特征,存在部分异常数据的干扰,以此作为批卷的标准会影响结果的可靠性。为此,在隐含层的第二层,对提取的特征值进行聚类处理,以此过滤干扰作用。利用K-means聚类的方式如图1所示。
图1 特征聚类方式Fig.1 Feature clustering method
如图1所示,将第一隐含层的计算结果表现出的规律性作为聚类依据,聚类中心的计算是以规律的重叠位置为基础设定的。通过这样的方式确定最终的判定依据,将其在神经网络中反向输入测试提取结果的可靠性,最后将结果存储到处理器中。
在得到不同业务数据的操作特征后,为了提高判卷的效率,对业务进行分类。
上文已经提到,单一业务的操作是多样化的,从操作特征角度对数据进行分类难度较大。因此,本文利用SZ11-CBOX的数据转换模块,将业务转化为统一的形式,对业务进行分类,分类的过程如图2所示。
图2 业务分类过程Fig.2 Business classification process
如图2所示,SZ11-CBOX首先将业务数据统一化处理,并删除数据中的变异值,这里的变异值是指样本数据中业务操作存在错误的数值。最后再根据上文提取的特征结果构建分类树,这样的分类方式可以在不破坏数据关联性的基础上,实现数据的精细化分类。将分类后的数据保存在处理器的计算单元。
利用分类结果,就可以实现对电网调度业务的批卷处理。
在上述基础上,系统对电网调度业务的批卷处理流程如图3所示。
图3 系统自动批卷流程Fig.3 Automatic marking process of the system
系统接收到待批卷业务数据后,首先对其进行初始化处理,该阶段主要是利用SZ11-CBOX将数据转化为与系统内基础信息一致的形式,通过分析转化后数据的特征,将其与处理器计算单元的分类建立匹配关系,确定其所在的分类,以此为基础,具体对比操作步骤,确定最终的评分结果。以此完成对电网调度业务的自动批卷。
将本文设计的自动批卷系统应用到实际的电网调度业务分子中,测试系统功能是否能够实现对业务办理流程正确性的准确判断,以此检验系统功能的有效性。
本文将同一批工作人员的业务操作样本作为测试对象,比较系统判卷结果与实际操作结果的一致性,并通过逐个对比的方式,对系统批卷结果的可靠性进行分析。其中,实验采集的数据为1000个操作样本数据,样本中覆盖的业务类型为10类,分别面好1-10,每类100个业务。在实验测试前,首先通过人工的方式对业务操作的每个步骤进行判卷,并对结果进行标记,将其作为系统的期望判卷结果,存储于数据库中Sample表中,再使用系统对业务操作进行判卷处理,最后对比系统批卷结果与期望结果之间的差异。
为了简化对判卷结果分析的难度,本文以契合度作为分析指标,其计算方式为:
其中,e表示系统判卷结果与实际结果的契合度,i表示对应的业务分类,p表示系统批卷结果,P表示期望批卷结果。
以此为基础,对系统的批卷效果进行评价。
在上述基础上,统计了本文设计系统对10个分类业务的批卷效果,具体如表1所示。
表1 系统判卷结果统计表Tab.1 Statistics of system grading results
从表1中可以看出,系统对业务的批卷结果与实际结果之间的拟合度始终保持着较高的水平,最高契合度可以达到100%,最小契合度也可达到99.0%。在评分结果上,最小误差为0,最大误差也仅为0.8,未出现明显的误差,表明本文设计的自动批卷系统可以实现对电网调度业务执行情况的准确判断,具有一定的实际应用价值。
随着电力资源应用需求的不断提高,对于电网资源的调度业务操作提出了更高的要求,不仅要实现高精度的资源分配,同时也要对调度的合理性作出更加精细化的管理。本文提出基于机器学习的电网调度业务自动批卷系统,利用机器学习的优势,对以往调度业务操作的特征进行分析,并以此作为判断业务操作效果的依据,实现自动化的电网调度业务评价。通过本文的研究,以期为缩短业务批卷时间,为提高电网调度业务优化效率提供有价值的参考。