郭琦,袁少卿,吕小凡,蔡硕琦
(内蒙古电力(集团)有限责任公司,内蒙古 呼和浩特 010090)
作为新一代智能电网发展的重要组成部分,电网调度指令智能化正面临着技术革新,以提高电网的供电高效性[1-3]。现阶段的调度指令操作智能化程度较低,需要调度人员不间断监盘,人机交互仍停留在人工操作阶段[4-6]。随着新一代人工智能技术的发展,应用新技术提升电网调度指令的智能化已成为了发展趋势[7]。
国外学者对电网调度指令交互技术的研究较早,上世纪60 年代起,就有国外学者将语音识别技术应用于电网调度领域,先后推出了智能语音交互识别系统。在90年代研发出了基于PSOLA 技术的语音识别技术,并且迅速将其应用于电网调度领域[8-10]。我国的电网调度指令智能交互技术研究起步较晚,文献[11-12]将语音合成与智能识别技术应用于电力系统中,但仍未应用于电网调度指令领域。
为了更优地满足电网调度的实际需要,文中基于机器学习技术通过建立人机交互模型和传输通道模型,实现了电网调度指令的智能交互。
人工智能是以机器学习为核心的新一代智能技术,机器学习的研究内容主要可分为概率密度估计、模式分类和回归分析,根据不同的属性可分为有监督学习、无监督学习、半监督学习和强化学习。在预测问题中,通常采用监督学习,主要的数据集有训练集、测试集、验证集;训练模型有神经网络模型、线性模型等;优化方法有梯度下降法、随机梯度下降法等[13]。机器学习是数据挖掘的一种,算法的稳定性由数据量决定,将机器学习与大数据技术结合是未来发展的新方向。
传统的机器学习由单个机器设计,在处理数据时存在不确定性,可通过并行方法进行改造[14-15]。目前流行的并行处理框架是由Apacha 公司开发的分布式架构,其架构中核心部件为决策树。决策树可解决离散型因变量问题,也可以解决数值型回归问题,其结果为一系列叶子节点。决策树的构建通常由3 个步骤组成:特征选择、决策树生成与决策树剪枝。特征选择最为关键的是数据的集成度,集成度的计算方法有3 种,分别为熵、基尼和方差[16],以下分别介绍3 种方法的原理:
1)熵
式中,gain(D,A)表示特征A对训练集D的信息增益,H(D)表示经验熵,pi为训练集D中第i样本集所占的比例,H(D|A)为特征A对训练集D的期望。
2)基 尼
式中,S表示标签总数。
3)方 差
式中,N为样本总数,μ为样本平均值。
在训练过程中,随机性数据的存在使得算法抗干扰能力增强,所使用的Bagging 算法原理如图1 所示。b个不同的样本集相互独立,组成强学习器。根据并行化思路,经过数据处理后生成多棵决策树,最终实现并行化操作。
图1 Bagging算法原理
基于机器学习的电网调度指令人机交互模型主要由执行和评估两部分组成。第一步需要在计算机上输入某个确定的工作,当上述操作完成后评估第二步的工作内容。人机交互模型可分为7 个步骤,每个步骤均表示电网调度员的调度指令。该人机交互系统主要由智能电网经济调度系统、调度员、输入、输出4 个部分组成,如图2 所示。电网调度员按照指令执行调度任务,完成循环过程。调度系统与调度员建立协调通信机制,并将结果传达给调度员,从而对整个调度结果进行评估,完成整个阶段的操作。
图2 人机交互框架
电网调度指令人机交互设计过程主要包括4 个阶段和一个循环过程,如图3 所示。其核心是以需求为中心,通过交互式迭代增强系统的可交互性,使电网调度指令高效化运行。
图3 交互式设计过程
在电网调度指令人机交互系统中还包含语音识别模块,该模块通常是由语音特征提取、模式匹配与参考模型库3 部分组成,如图4 所示。电网调度指令语音信号经过多个步骤进行语音数据预处理过程,并基于语音帧的方法提取语音特征。而后将人机交互模型与语音库相匹配,依据判定规则决定调度指令最匹配的模式,最终输出最优的结果。
图4 调度指令语音识别过程
电网智能调度指令语音交互设计流程图如图5所示。首先启动程序,电网调度员登录界面进行身份识别。根据语音训练及配置的具体需求,用户语音训练模块针对调度指令进行训练并配置文件。语音配置功能可以识别参数,导入调度指令能够进行语音识别。当监测到语音输入时,将调度指令关键词与交互模型内的句式进行匹配,匹配成功即为识别有效;否则,重复循环上述过程。经查询与分析后反馈给交互程序,并传递给下一位调度员。
图5 调度指令语音交互设计流程图
为将电网调度指令语音交互技术与调度后台有效衔接,将识别后的语音数据传递给调度后台。其中,数据结构化设计如表1 所示。
表1 调度指令数据结构化设计
利用机器学习算法完成的数据清洗,会产生状态为不健康的数据。若利用无监督学习算法进行数据预标注可将不同样本数据分开,由于不含样本标签则无法利用输出值误差进行反向传播修正,因此识别准确率较低。应用无监督学习算法K-means 聚类算法对调度指令数据进行聚类,设置K=6,将聚类结果数据进行可视化分析。应用层次分析法对监测状态进行指标评价,计算给出评价表现的优先级,最终得出监测分值。在数据可视化前,对所有数据样本进行归一化处理。同时利用历史数据的特征,制定评价电网调度指令人机交互算法的评价标准。
基于机器学习的电网调度指令采用端对端传输。对于给定的一个调度指令s={}a1,a2,…,an,编码器将该调度指令映射为s∈R2,其中s为虚数。在传输过程中,每个信号均可随机性地表示为多个神经网络层,即编码为2×K维的向量,其中K表示调度指令的采样数,那么s的前K个元素即为接收到的实部向量。
端对端传输由正则化层、映射层和隐藏层组成。其输入为调度指令s,并映射为v0维字符向量v0=C(s),隐藏层将调度指令向量v0编码为vl,且隐藏层内的关系可表示为:
式中,fl(vl-1,θl) 表示l-1 层到l的映射关系,θ={θ1,θ2,…,θn} 为神经网络内的所有参数。
考虑到信号延时、失真等因素,传输通道模型也需要模拟电网调度指令传输环境给编码器所造成的影响。该文提出的通道模型主要为上采样方式,即将编码输出向量s∈R2转化为su∈R2×K,再发送至滤波器,以消除调度指令信号辐射。在接收处亦增加滤波器,以减少信号的失真。定义降噪系数为λ,滤波器的滤波系数为L,其结果输出为xf和xu,通信原理的表达式为:
式中,xt,k为xt的第k个元素,nk为噪声信号。
在访问调度系统前,首先需要调度员通过用户名和密码进行验证,并根据调度实时情况调整运行方式。在系统配置时,通过调度指令的经验识别出灵敏度和响应时间,通过控制程序训练配置文件,以便于保存不同的噪音环境。因此需要系统事先提供调度指令配置文件的训练,以适应不同调度员的语音习惯。通过对典型机器学习识别系统的测试与分析,对调度术语及指令进行训练和识别。在满足精度的情况下,分析调度员的语言习惯,结合调度需求,将常见的调度指令进行配置与保存并提供良好的拓展性和容错性。在训练文件时,可针对性地对语音内容进行训练。
测试地点在电力调控中心,测试分为两个阶段。第一阶段为调度指令语音识别性能测试,第二阶段为调度指令语音训练后的语音识别性能测试。测试过程中采用典型汉语语音词库为样本,测试中以自然方式对调度指令进行语音录入,每个调度员的语速一致、发音清晰。
针对提供的调度指令,对40 名测试样本进行针对性地训练,训练时间大约为3 h。训练过程与测试过程一致,基于电网调度的常见指令建立语音交互模型。训练完毕后,进行结果的分析及处理。
针对文中设计的电网调度语音交互识别技术进行测试,详细记录相关数据以及识别准确率。训练前后的指令识别性能测试结果,如表2 所示。
表2 识别性能测试结果
表2 中,该文基于机器学习对电网调度指令进行训练与识别,对电网调度指令的平均识别率达到91.45%。在电网智能调度领域,目前常见的调度指令训练通常采用国内科大讯飞股份有限公司的在线识别系统,其平均识别率为85%。而将文中所提技术应用于电网调度领域,其识别结果更加精准,可以满足更高的电网调度需求。
该文主要研究了基于机器学习的电网调度指令智能交互技术,包括人机交互模型、调度指令语音交互流程设计、调度指令监测数据预标注、基于机器学习的调度指令传输方法。通过分析日常调度系统的业务需求,与实际的调度指令相结合,实现人机交互。借助大量的调度指令数据驱动,为交替训练编码实现调度指令同步偏移。最终通过实际测试,文中所提方法对电网调度指令的平均识别率达到91.45%,且识别结果更加精准,可以满足电网调度的基本要求,具有一定的工程应用价值。但由于实验条件的局限性,该文缺乏实时数据验证,下一步将研究实际调度系统与人机交互相结合的物理层传输技术。