高 巍,何志雨
(内蒙古电力(集团)有限责任公司呼和浩特供电分公司,内蒙古 呼和浩特 010010)
变电站继电保护系统直接决定着电力系统是否能够安全稳定运行。采用传感器和监测装置对电流、电压等参数进行实时监测,如果检测到电气故障,可以采用先进的算法和逻辑对故障进行准确定位,并迅速采取保护措施切除或隔离故障。保护动作的实现关键在于设定的保护动作触发条件是否合理,触发条件的设定通常基于电力系统特定工况、电力设备特性和系统拓扑结构。只有在系统出现故障时才会触发保护动作,确保电力设备在出现故障时能迅速得到保护,最大限度地减小故障对电力系统的不良影响[1]。但随着变电站电力系统结构日益复杂和运行环境的不断演变,新型电力设备和智能电网技术的应用带来了更为复杂的故障模式。因此,需要继电保护系统具备更强大的数据处理和实时监测能力,并采取先进保护技术和适应性强的模型与算法,以应对不断变化的电力系统需求和安全威胁。
继电保护装置要满足继电保护系统对灵敏度、速动性、可靠性以及选择性的要求。
灵敏度是指继电保护系统在电力系统出现故障或异常情况时能够快速、准确地做出响应。高灵敏度表示系统能够更早地发现潜在问题,从而降低故障对电力系统的损害。速动性反映继电保护系统在检测到电力系统故障时启动保护动作的速度,即保护动作触发的时间延迟,是确保电力系统稳定性的重要因素。高速动性要求系统在极短的时间内做出响应并迅速隔离故障,以防止故障扩大[2]。可靠性是指系统在各种工况和环境下保持正常工作的能力,如在面对极端天气、高负荷等复杂情况下系统能否稳定运行。高可靠性意味着系统能够在各种条件下稳定工作,以确保电力系统的持续稳定运行。选择性指系统在多重故障情况下正确选择并触发相应保护动作的能力。其要求系统能够识别并定位同时发生的不同类型的故障,并采取适当的保护措施,不干扰正常运行部分。高选择性要求系统能精准处理复杂故障,避免误操作。
人工智能技术的引入标志着继电保护系统迈向智能化时代,系统能够学习历史数据并适应电力系统的动态变化,从而精准地识别不同类型的故障。卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网络(Recurrent Neural Network,RNN)等在继电保护中具有出色表现。例如,采用CNN 可以有效处理电力系统中的时空信息,对电流、电压波形等数据进行多层次的特征提取,以提高故障识别精度;RNN 的引入可以更好地处理电力系统中的时序信息。RNN 在检测、定位周期性变化和突发性事件方面具有显著优势[3]。除机器学习算法外,还需要提高系统的自主学习和决策能力,使继电保护系统在实际运行中逐步优化策略,更好地适应电力系统的复杂变化。
2.2.1 环境建模
一方面,需要定义电力系统状态,确定电力系统的各种参数和设备状态,包括电流、电压、频率等关键电气参数以及设备的运行状态等信息。另一方面,要综合考虑环境动态性,即系统状态的变化速度和频率,建立接近电力系统真实运行状况的环境模型。将节点电流、电压、频率等定义为状态向量,即
式中:It为节点电流;Ut为节点电压;Ft为电力系统的频率;Pt为有功功率;Qt为无功功率。
利用状态空间模型,得到状态转移方程,即
式中:A和B表示状态转移矩阵;αt表示节点状态的演变,即系统在时刻t采取的动作;εt表示环境中的噪声。
2.2.2 奖励函数模型
奖励函数的设计是强化学习模型的重要环节,直接影响着模型在训练中学到的策略。继电保护系统奖励函数的设计应综合考虑系统的性能指标,如灵敏度、速动性和可靠性,定义奖励函数为R(st,αt,st+1),表示系统在时刻t采取动作αt后,从状态st转移到状态st+1所获取的奖励。基于电力系统的性能指标,奖励函数需要充分考虑到灵敏度、速动性等多个因素。引入权重参数对不同性能指标进行平衡,则奖励函数为
式中:ωs、ωv、ωf分别为灵敏度、速动性和可靠性指标的权重;Rs、Rv、Rf分别为针对灵敏度、速动性和可靠性的子奖励函数。灵敏度可以定义为目标信号与系统输出信号的匹配程度,则奖励函数对灵敏度的贡献可以表示为
式中:α为调节参数;MSEs为灵敏度均方误差。速动性可定义为系统在检测到故障后的响应时间,则奖励函数对速动性的贡献可以表示为
式中:β为调节参数;tR为系统响应时间。可靠性定义为系统在检测到故障后的响应时间,则奖励函数中对可靠性的贡献可以表示为
式中:γ为调节参数;PC为系统正确触发保护动作的概率。
通过设计奖励函数,模型在学习过程中能够优化对整体性能有益的策略,并平衡不同性能指标之间的关系。
2.2.3 学习速率和折扣因子
学习速率主要用于平衡模型对奖励的学习程度。较小的学习速率有助于模型更稳定地收敛,但可能会导致学习速度过慢;较大的学习速率会加速学习,但可导致模型不稳定。通过在训练过程中动态调整学习速率,可以更好地适应系统动态性。学习速率的动态调整是通过Adam 自适应算法来实现的。该算法通过计算每个参数的梯度和梯度平方的移动平均值,以平衡模型的学习程度、稳定性和速度。因此,需要对参数进行初始化处理,包括学习速率θ、一阶矩估计v、二阶矩估计v以及时间步t等参数。更新参数,使t=t+1,可得到
式中:mt表示更新后的一阶矩估计;vt表示更新后的二阶矩估计;t表示修正后的一阶矩估计;t表示修正后的二阶矩估计;β1和β2表示衰减系数。更新
式中:ε表示为了数值稳定性而添加的小常数。
此外,需要调整折扣因子以平衡对未来奖励的考虑,较大的折扣因子将更加重视未来的奖励,而较小的折扣因子则更注重即时的奖励。由于继电保护系统系统具有动态特性,适度增大折扣因子可以帮助模型更合理地预测未来情况。同时,需要将电力系统的各种参数和设备状态编码为状态,这些状态编码包含系统在不同时间点的信息。为进一步优化模型,可以将折扣因子设置为一个可变的参数,根据系统当前状态、时间步、先前的学习经验,动态地调整折扣因子的数值。
2.2.4 ε-greedy 参数调优
在继电保护系统的强化学习中,算法参数调优是确保模型有效学习和优化性能的关键。ε-greedy策略是强化学习平衡探索和利用的一种方法,基于概率参数ε。该参数决定了在选择动作时,模型进行随机探索的概率[4]。在每个时间步t,模型会根据st选择一个动作αt,并以概率ε选择一个随机动作,即从动作空间中随机选取一个动作;以概率1-ε选择最优动作,即从之前学到的策略中选择具有最大估值的动作。这种概率分配可以确保在训练过程中,系统有一定的概率尝试新的动作并进行探索,同时以较大的概率选择目前认为最优的动作。对应的Python代码为
在继电保护系统的强化学习中,Q_values 表示每个动作的估值。这些估值为神经网络的输出,而ε-greedy 函数根据给定的概率ε来决定选择随机动作或最优动作的概率。
某变电站电力系统引入了基于人工智能继电保护系统,并采取了环境建模、奖励函数模型和ε-greedy 参数调优等措施,以更高的准确性和灵活性来应对电力系统中的故障情况[5]。为验证新系统的性能和优化效果,对传统系统与优化后的系统进行了详细的性能对比分析,性能对比结果如表1所示。
表1 传统系统与优化后系统性能对比
由表1 可知,优化后的系统在故障检测方面取得了显著提升。故障检测灵敏度从0.85 提高到0.95,这意味着在不漏检的情况下,系统能够更准确地识别故障;系统的速动性也得到了明显改善,从150 ms降到了为80 ms,确保系统在故障发生时能够迅速触发保护动作;系统的可靠性从95%提升至99%,确保系统在各种运行情况下的稳定性;系统在选择性方面也取得了显著提升,从传统系统的0.92提高到0.98,表明系统能够更准确地隔离故障区域,从而降低误动作的风险。
文章详细论证了继电保护系统工作原理、性能评估指标、性能优化方法以及具体应用。通过引入人工智能技术,对电力系统继电保护系统性能进行了优化,有效提升了系统的故障检测灵敏度、速动性、可靠性以及选择性。实例证实,文章提出的变电站继电保护系统决策能力优化策略在提高电力系统保护水平方面具有巨大潜力,同时为未来电力系统的智能化发展奠定了坚实基础。