李 刚,智宏鑫
(1.华北电力大学 计算机系,河北 保定 071003;2.复杂能源系统智能计算教育部工程研究中心(华北电力大学),河北 保定 071003)
近年来,随着电力系统基建速度的加快,电力系统的规模不断增大,这给电力巡检带来了诸多问题和挑战。电力巡检旨在通过对电力设备(如变电站、输电线路等)进行定期检查、测试和评估,来保障电力系统的安全稳定运行。
从巡检任务上来看,变电站巡检和输电线路巡检存在一些差异。变电站巡检主要包括对变电设备和周围环境的全面检查和监测,巡检的目的是及时发现设备的异常、故障和安全隐患,以确保电力系统的安全稳定运行。输电线路杆塔巡检是指对高压输电线路及其支撑杆塔工作状态进行的全面检查,包括输电线路的导线、绝缘子、耐张装置等元件的状态检查,以及杆塔的结构稳固性、倾斜和腐蚀情况检查。例如,检查绝缘子是否完好,接地系统是否正常,线路舞动是否过大,防雷设施是否有效等。
通过巡检,可以及时发现并处理线路和杆塔的异常、故障及安全隐患,确保输电线路的安全稳定运行[1]。然而,传统的电力巡检方式因主要以人工巡检为主而面临诸多问题:
1)巡检规模日益庞大。为了确保巡检结果的准确性和全面性,需要大量的人力资源来完成巡检任务;而当前有限的人力资源难以满足规模不断扩大的巡检需求。
2)巡检任务日益增多。电力设备的数量众多、分布广泛。各种变电设备、线路、传感器和继电保护装置等的全面巡检工作,对巡检人员的专业素质提出了更高的要求。
3)巡检条件恶劣。电力设备通常分布在各种不同的地理环境中,其中部分位于高山、丛林或沼泽等复杂地形中,且会暴露在极端的气候条件下。这些恶劣的环境条件给巡检人员的工作带来了很大的困难和风险。
针对上述问题,国内外专家学者们积极探索了各种电力巡检的新型应用手段。其中,智能巡检逐渐受到人们的关注[2]。
电力智能巡检基本有2类场景。
第一种场景:在障碍物已知的情况下,地面机器人对电力设备待巡检点的区域遍历巡检或定点巡检,如变电站和发电站巡检场景。对于此类场景,需要解决的是复杂环境下的避障问题[3]。
第二种场景:使用大型无人机或直升机对输电线路或杆塔等进行巡检[4]。在此场景巡检时,需要事先为多个杆塔目标的巡检顺序规划出一条或多条优化路径,在避障的前提下解决多无人机多目标巡检问题。
路径规划方法发展历程如图1所示。
图1 路径规划方法发展历程Fig.1 The development of path planning method
以图1为线索,本文对不同场景中的电力巡检路径规划方法进行了分析,从不同方法的发展历程、特点和优劣等方面进行综述,并梳理当前行业的发展进程和未来的发展趋势。
电力巡检路径规划是电力智能巡检中的重要环节。为了高效地规划出最优路径,学者们提出了各种算法,如图2所示。这些算法主要分为传统图搜索算法[5]和智能优化算法[6]2大类。
图2 电力巡检算法Fig.2 Electric power inspection algorithm
传统图搜索算法,如Dijkstra算法[7]和A*算法等,其思想是通过有效搜索图中的节点来寻找最优路径。基于随机采样算法,如蒙特卡洛法和人工势场法,其思想是利用随机采样的方式来探索可能的路径,从而来寻找较优解。
传统算法在电力巡检问题简单和规模较小的场景中表现出色。然而,随着电力系统规模增大,复杂性的不断增加,传统算法在应对大规模场景、动态环境下的电力巡检问题时存在局限性,比如动态适应性、路径的平滑性和实时性方面。为了解决这些问题,学者们转向基于智能优化算法的研究。
智能优化算法主要为分2类。一类是基于智能仿生类算法,包括遗传算法(Genetic algorithm,GA)、粒子群算法(Particle swarm optimization,PSO)和蚁群算法(Ant colony optimization,ACO)等,借鉴了自然界中生物的智能行为,通过模拟生物进化和群体协作的过程,实现较优路径的快速寻找。另一类是深度强化学习算法[8]。深度强化学习算法结合了深度学习和强化学习各自的优点。利用该类算法能够实现在复杂环境下的自主学习和路径优化规划:通过构建神经网络模型,可使巡检机器人感知到环境状态、接收奖励信号,并在与环境交互中不断优化路径规划策略;使巡检机器人能够在不同场景下选择最佳路径,完成更智能、自适应更强的巡检任务。
表1对比了各种传统的搜索算法的特点。
表1 传统搜索算法对比Tab.1 Comparison of traditional search algorithms
表中,Dijkstra算法是一种用于解决单源最短路径问题的经典图搜索算法,在计算机科学和工程领域应用广泛。该算法在网络路由、地图导航、交通规划、电力网络和机器人路径规划等方面发挥着重要作用。利用该算法可得到高效、可靠的最短路径解决方案[13]。
如今,对Dijkstra算法的应用主要是基于该算法的改进,如最经典的A*算法。
A*算法:通过引入启发式函数估计从当前节点到目标节点的代价(或距离),使用综合评估函数f(n)来对节点进行评估。
f(n)的计算方式为:
式中:g(n)为从起始节点到当前节点n的实际代价;h(n)为当前节点到目标点的预估代价。
目前,此类算法已经从单源路径规划发展到了机器人避障算法;其应用延伸到电力系统中,解决了变电站环境下机器人的路径规划问题。例如,文献[9]对A*算法进行改进,将父节点的预估路径代价进行指数加权衰减,使机器人能适应各种复杂环境,连续不停地跟踪规划路径到达目标;文献[10]通过结合层次分析法,改进A*算法和梯度下降法,使机器人可以自主选择目标、规避风险、快速到达终点,从而提升了电力应急作业的鲁棒性。
随机采样法主要有PRM算法(Probabilistic roadmaps)、RRT算法(Rapidly random tree)及其变种。
RRT算法的思想是使用树形结构进行探索。从起始点开始,通过随机采样和连接节点的方式来逐步扩展树形结构,直到找到目标点为止。
PRM算法的思想是使用图结构,通过随机采样配置并连接空间中的点,构建一个路标图,最后利用图搜索算法来搜索有效路径。
RRT算法的随机性较强,但用该算法在找到路径时可能不是最优的;而PRM算法在构建路标图时较为全面,所以用该算法找到路径时更有可能得到较优结果。
鉴于PRM算法和RRT算法所具有的优势,许多学者将其用于解决机器人避障问题[13]。
对于PRM算法。文献[14]提出了基于改进概率地图法的无人机电力线巡检路径规划;通过改进分支游动的原理,减少了碰撞检测次数,提高了算法执行效率。文献[15]用局部敏感哈希算法代替最近邻搜索,从而减少了传统PRM的运行时间。
对于RRT算法。文献[11]利用融合有向D*的改进RRT*算法,通过选取关键节点来提高重新布线效率;采用概率采样函数增加路径多样性,并通过距离可变的树枝修剪方案减少冗余节点;最终得到耗时更少、总路径更短的路径。文献[16]提出了适用于未知动态环境下机器人导航的多目标动态快速探索随机算法:以修改的RRT*获得初始路径,用生成状态树结构作为先验知识,并考虑路径长度和平滑度因素,最终生成更高质量的初始路径。为解决RRT算法路径曲折和规划速度慢的问题,文献[17]提出了一种融合PRM和基于概率的双向RRT的算法:首先将规划区域平均划分为2个区域,然后使用规划速度更快的PRM算法在每个区域进行路径预规划,最后在2个区域各选择1个节点形成1对最优匹配点。
对于输电线路杆塔巡检路径规划,RRT算法是一种高效且灵活的路径规划方法。该算法具有随机采样和快速探索的特性,利用其能够实现在复杂的环境中快速搜索并生成优质的路径,使飞行机器人能够高效地穿越各种障碍物,避免不必要的路径重规划,从而显著提高巡检任务的效率和安全性。
综上所述,RRT算法和PRM算法各有其优势和适用场景:RRT算法适合在未知环境中快速探索路径,而PRM算法更适合在全局配置空间中寻找高质量的路径。考虑到上述2种算法各自的特点,实际应用中算法的选择应根据电力场景和问题需求来决定。
人工势场法(Artificial potential field)的思想是通过设置目标点的引力和障碍物的斥力,使机器人沿着梯度下降方向移动,以最小化总势能来规划路径。
人工势场法原理如图3所示。在巡检避障问题求解过程中,通过设定图3中目标点和障碍物的势能场,引导机器人绕过障碍物和危险区域,完成巡检任务。
图3 人工势场法原理Fig.3 Principle of artificial potential field method
对于人工势场法的应用和改进。文献[13]将人工势场结合虚拟势场检测圆模型,在动态障碍环境下实现了无人驾驶飞行器的可靠在线无碰撞路径规划,有效解决了“最小陷阱”问题,提高了路径规划的可靠性。文献[18]提出一种双层路径规划方法:将路径长度和平滑度作为适应度函数,采用优化的人工势场法和改进的动态窗口法得到了人工势场法中障碍物的影响范围、引力系数和斥力系数。然而,传统的人工势场算法及其改进还是很难跳出“局部最优陷阱”。
为了解决上述弊端,有学者通过融合蚁群算法、粒子群算法和遗传算法等仿生智能算法对传统人工势场法进行优化。针对特高压变电站大面积和多设备的特点,文献[19]将蚁群算法和人工势场法融合,提高了巡检机器人路径规划算法的效率和性能。文献[20]通过改进遗传算法来解决最优个体丢失的问题,并以此为基础使用人工势场法解决了局部避障的问题。文献[21]通过融合粒子群和人工势场法构建了引力场和斥力场,进而生成粒子群,克服了2种算法各自的缺点,提高了搜索能力和收敛能力。
综上所述,对于电力巡检路径规划,人工势场法具有简单易实现、避障效果明显、实时性较好和适应动态环境等优点。然而,算法存在可能陷入局部最优、无法规避环路和势能场设置复杂等缺点。
智能仿生类启发式算法是一种受生物学行为和智能机制启发而来的优化算法。表2对各种智能仿生类启发式算法进行了分类对比。
表2 智能优化类算法对比Tab.2 Comparison of intelligent optimization algorithm
智能优化类算法被广泛应用于电力巡检路径规划。在发电厂和变电站等区域内,电力巡检机器人主要任务是避开障碍物、安全到达终点。在输电线路场景下,多无人机多目标路径规划可视为多旅行商问题(Multiple traveling salesman problem,MTSP)。仿生类启发式算法通过模拟蚁群、粒子群和染色体遗传等生物集群特征来减少巡检路径或者飞行时间[31]。考虑到仿生类算法的特点,以下选择地面变电站的避障和输电线杆塔的多目标巡检这2个场景的算法应用来讨论。
3.1.1 智能仿生类避障算法
1)遗传算法。
遗传算法(GA)由John H.Holland等人提出,是一种受到生物进化思想启发而来的优化算法,可以用来解决机器人巡检中的避障问题。该算法模拟了自然选择中的遗传机制,在搜索空间中通过对候选解进行编码、交叉和变异等遗传操作来产生新的解;根据适应度函数的评价,将较好的解代入下一代;逐代优化直到找到满意的解。
使用遗传算法解决电力巡检路径规划中避障问题的基本过程为:首先,通过定义问题空间、设计适应度函数以生成初始种群;然后,通过交叉、变异和碰撞检测等操作,不断进化和选择路径;最终,避开障碍物从而找到最优路径。其中,适应度函数用于衡量个体在种群中的优劣程度。适应度函数的设计对于遗传算法的性能和收敛速度具有重要影响。通过对适应度进行改进,文献[22]使用精英族系遗传算法(Elite family genetic algorithm,EFGA)解决传统路径规划算法存在局限性的问题;将基因适应度纳入适应度评价函数,同时在进化过程中标记精英个体作为多路径规划结果以减少任务的耗时。文献[32]使用遗传算法代替线性规划(Linear programming,LP)和动态规划(Dynamic programming,DP)来寻找两点间的最优路径,提高了模型求解速度和质量。
2)粒子群优化算法。
粒子群优化算法(PSO)是一种模拟鸟群或鱼群社会性群体行为的元启发式优化算法,其思想是通过模拟粒子在搜索空间中的移动和信息共享,在全局搜索空间中寻找问题的最优解。算法中,每个粒子代表一个潜在解。每个粒子根据自身的历史最优位置和整个群体的历史最优位置进行引导和更新,逐步优化解空间。
在电力巡检避障中,虽然粒子群算法本身不是专门用于解决避障问题的算法,但可以通过合理的问题建模和适应性函数设计来解决避障问题,即通过设计适应性函数来引导粒子在搜索空间中避开障碍物,并找到最优的路径规划解。例如,文献[23]提出了一种针对旋翼无人机在已知静态粗糙地形环境下的路径规划方法:通过改进的多目标粒子群优化算法,实现了在最小化高度、长度和角度变化率的条件下避免碰撞,在不同粗糙地形下寻找到帕累托最优路径。文献[33]采用改进的粒子群算法来优化智能制造车间中自动导引车在单线生产线的路径问题:通过改进编码方法、用交叉操作更新粒子位置以及突变机制,避免了局部最优,提高了自动导引车物料运输效率和规划路径的有效性。
3)蚁群算法。
蚁群算法(ACO)是一种模拟蚂蚁寻找食物行为而产生的启发式优化算法,其思想是模拟蚁群在寻找食物过程中留下信息素的现象,通过模拟信息素的积累和挥发来引导搜索过程。每个蚂蚁代表一个潜在解。每个蚂蚁根据信息素的浓度和启发式函数进行决策来选择路径并更新信息素。随着蚂蚁不断搜索,信息素的分布逐渐收敛于更优解的区域。
对于电力巡检避障问题,可以利用蚁群释放信息素和相互通信机制来寻找最优路径并避开障碍物,然后再经过迭代和信息素更新找到较为可行的路径。例如,针对传统蚁群算法在路径规划中收敛速度慢、易陷入局部最优、拐点过多等问题,文献[24]通过对网格图进行预处理来减少冗余搜索,并将蚁群算法与遗传算法相结合以加快算法的收敛速度,最终实现了“引导移动机器人快速找到更加平滑轨迹”的结果。文献[34]提出了双层蚁群优化算法(Double-layer ant colony optimization algorithm,DL-ACO)并用来解决机器人自主导航问题。该算法由2个独立的蚁群算法组成,通过并行精英蚁群优化方法生成初始无碰撞路径,然后应用拐点优化算法的思路对路径进行优化,最终提高了全局搜索能力。
4)其他算法。
除上述的遗传算法、粒子群算法和蚁群算法外,还有一些其他的仿生类智能算法也可以用于解决电力巡检避障问题。
①人工免疫算法。算法模拟了生物体免疫,包括抗体的产生、克隆、变异和选择过程。利用该算法所具有的免疫系统优点,可实现避开障碍物寻找最优解,同时可确保路径的长度和安全性[25]。
②蜂群优化算法。这是一种模拟蜜蜂寻找食物行为而得到的优化算法。该算法模拟了蜜蜂的群体智能。利用该算法可使机器人绕过各种障碍物,找到最优的巡检路径。该算法具备一定的全局搜索能力[26]。
③人工鱼群算法。这是一种通过模拟鱼群寻找食物的行为而发展起来的智能优化算法,可以用于规划机器人的路径,使其在遇到障碍物时能够迅速调整行进方向,找到合适的路径[27]。
④蝙蝠算法。该算法模拟了蝙蝠在捕食时的搜索和追踪策略,可以用来解决避障问题[28]。
综上所述,利用仿生类智能算法能够模拟生物的行为和群体智能的优势以解决电力巡检中的避障问题。这类算法在解决复杂环境下的路径规划问题方面具有一定的优势和适用性,能够为电力巡检任务提供有效的路径规划结果。
3.1.2 智能仿生类多目标巡检算法
在输电线路杆塔巡检场景中,为使无人机依次经过所有待检查的杆塔来完成巡检任务,需要规划多条巡检路径。该问题可转化为多旅行商问题。
1)多无人机巡检。
针对多无人机巡检的MTSP,文献[35]提出了一种基于进化计算模型的改进遗传算法——绒泡菌启发计算模型(Physarum-inspired computational model),通过优化初始化种群并采用爬坡方法,克服了传统遗传算法在解决MTSP过程中出现的过早收敛和解分布不均匀等问题。
为解决MTSP中遗传算法容易早熟、收敛速度慢等问题,文献[36]提出了一种基于探索–开发–跳跃策略的单亲遗传算法,通过探索策略来扩展搜索空间、开发策略以增强算法局部搜索能力;同时,引入跳跃策略来增强算法跳出局部最优解的能力。
为解决多机器人协作任务分配问题,文献[37]以最小化总团队成本来平衡其工作量,提出了一种新的多目标粒子群优化方法;通过帕累托优化和领导者选择策略,将标准的单目标粒子群算法扩展到多目标粒子群算法。
文献[38]介绍了一种改进的基于交换序列的粒子群算法用于解决旅行商问题:将扩展粒子群算法策略融入基于交换序列的粒子群算法中。该算法比传统遗传算法具有更快的收敛速度。
综合考虑最大行驶距离和总行驶距离,结合多蚁群算法和序列变量邻域下降算法,文献[39]提出用一种基于双目标蚁群优化算法来解决移动机器人MTSP问题,通过强大的双目标MTSP局部优化方法来改进候选解。
将蚁群优化与基于分解的多目标进化算法相结合,将多目标优化问题分解为多个单目标优化问题,文献[40]提出了一种新的多目标进化算法,利用蚁群的搜索机制来解决每个子问题。该算法在多目标0-1背包问题和双目标旅行推销员问题上的性能表现较为优异。
2)车–机协同巡检。
对于普通的输电线路巡检,使用多无人机规划可以很好地完成任务;但对于区域较大或者跨区域输电线杆塔巡检,单一的无人机巡检很难完成这类庞大的任务。针对此问题,有学者提出了一种新型模式——车–机协同巡检。
面对无人机电池寿命短、远程机动性差等挑战,文献[41]结合较大区域输电线路电力巡检,提出了“无人机与运营车”协同巡检模式,即通过任务分配模型完成作业圈划分、停车点选址、多无人机任务分配和无人机路径规划。
文献[42]提出一种车载多无人机协同模式:利用小型无人机的优势实现大面积多区域覆盖扫描任务,以车辆为移动基站,与多架无人机协同完成任务。采用文中基于三阶段的智能优化算法,可以快速生成可行解、进行自适应大规模邻域搜索优化。该协同模式相较于车载单无人机任务执行在时间上有显著优势。
综上所述,针对输电线路杆塔巡检任务中的复杂任务和环境,学者们提出了车–机协同方法,即以车机协同模式,将车辆作为移动基站与多无人机协同完成任务。利用该方法可得到高效实用的巡检解决方案。
深度强化学习是一种结合深度学习和强化学习的机器学习算法,其思想是:通过智能体与环境的交互学习最优策略来获得最大累积奖励;利用深度神经网络逼近复杂的状态–动作映射关系,在高维状态空间中进行决策和规划。
深度强化学习具有自适应性和泛化能力,在游戏、无人驾驶、路径规划等领域广泛应用。其中,比较经典的算法有DQN(Deep Q-network)、DDPG(Deep deterministic policy gradient)、PPO(Proximal policy optimization)、TRPO(Trust region policy optimization)、A3C(Asynchronous advantage actor-critic)等。
利用深度强化学习算法解决电力巡检机器人的避障问题的思路是:利用深度强化学习算法获取环境的深层信息,使机器人能够智能地规划路径并与环境进行交互;通过不断迭代优化神经网络,机器人能够实现自主避障,确保在复杂环境中高效地巡检。利用这类方法不仅能提高巡检效率,还能提升机器人的安全性和稳定性。
文献[29]提出改进型DQN算法:通过记录重复状态出现频率,重新计算Q值。该算法提高了机器人对环境的探索能力,降低了网络收敛于局部最优的风险,减少了网络收敛的训练回合。
为训练无人机在三维城市区域中抵达移动或静态目标,文献[30]提出了一个基于深度强化学习的自主无人机路径规划框架:采用DDPG训练无人机;设计了定制的奖励函数来最小化无人机与目标之间的距离。利用该策略可使无人机能够从周围环境中学习并实时确定自身轨迹,可提高算法的收敛速度和避障性能。
此外,深度强化学习算法也可用在解决电力巡检中的多旅行商路径规划问题方面。在大区域输电线路杆塔巡检任务中,通过深度强化学习算法学习复杂的环境信息来不断优化策略,可得到最优或近似最优的巡检路径,最终有效地解决多旅行商问题。
文献[43]提出了一种基于学习的MTSP优化方法:通过共享图神经网络和分布式策略网络构建通用策略;使用2阶段方法,并结合规则优化解决单代理旅行商问题;引入样本批处理训练来提高算法性能。
为解决动态图上的旅行商问题,文献[44]提出了一种融合多头注意力机制和分层强化学习的轻量级模型。
为解决大规模旅行商问题,文献[45]提出了一种新的分层式深度强化学习算法——即上层算法生成子问题、下层算法来求解。利用该方法能够快速得到较优解,并且可减少最优解与其他解的之间的质量差距。
综上所述,深度强化学习算法不仅解决了电力巡检中的避障问题、提高了巡检过程中的安全性、优化了电力巡检任务的执行效率,同时也为大面积跨区域输电线杆塔巡检问题提供了高效的路径规划问题解决方法。
目前来看,虽然关于电力巡检路径规划方法的研究已经取得了一定的进展,但仍有待进一步完善和创新。随着深度强化学习类算法的不断发展和相关技术的不断进步,未来将会有更多高效、智能且低耗的路径规划方法应用于电力巡检。随着新型电力系统基建规模的不断扩大,以及电网对系统安全运行需求的不断提高,未来的电力巡检机器人路径规划的研究有可能呈现出如下新趋势:
1)深度学习避障策略。深度强化学习模型将变得更加智能,能够根据环境变化实时调整避障策略,使机器人能更好地适应不断变化的电力设施和障碍物。
2)多机器人智能协作。电力巡检通常涉及多个机器人协同工作。多个机器人将密切协同工作,实现协作式智能巡检,从而使得工作效率得到大幅提升。
3)多模态感知。通过视觉、激光雷达和超声波传感等,深度强化学习将集成更全面的多模态环境感知,从而帮助机器人更好地避开障碍物。
4)自主决策。路径规划将更紧密融合自主导航技术,如同步定位与地图绘制、视觉识别等。这将提高机器人在未知环境中的自主路径规划能力,确保机器人能够在动态环境中快速做出反应。
5)可持续性。未来,路径规划将重视可持续性,注重降低能耗和对环境的影响,推动绿色低耗巡检。