环卫机器人运动控制及垃圾识别关键技术研究

2023-08-24 19:25:05瞿静吴作清李军
专用汽车 2023年8期
关键词:运动控制

瞿静 吴作清 李军

摘要:对环卫机器人运动控制及垃圾识别关键技术进行了研究,该技术突破了环卫机器人复杂场景智能驾驶运动控制技术和全场景图像垃圾识别技术,应用于多款环卫智慧作业机器人产品,并以长沙、深圳福田区作为环卫机器人集群作业的典型示范点,成为AI赋能传统环卫行业的行业技术新标杆。

关键词:环卫机器人;运动控制;垃圾识别

中图分类号:U467.4  收稿日期:2023-04-23

DOI:10.19999/j.cnki.1004-0226.2023.08.019

1 前言

近年来随着信息化水平的大幅提升和人工智能政策的不断推动,人工智能已成为新一轮产业变革的核心驱动力,对世界经济、社会进步和人类生活产生极其深刻的影响。

据统计,全球人工智能市场规模在2015-2025年将保持平均50.7%的复合增速,2025年规模有望达到369亿美元。2022年中国人工智能市场规模2022年达到1 958亿元。

未来人工智能发展将进入大规模商业化,认知能力指数提高,由产品向智慧服务迈进并对劳动密集型产业产生巨大冲击。环卫机器人作为人工智能应用的重要领域,将人工智能技术赋能传统环卫作业,通过人工智能使现有环卫装备具有更灵活、更智能、更具精度作业的能力,从而进一步将现有环卫工人从繁重、单调且危险的传统环卫工作中解放出来。

2 环卫机器人简介

环卫机器人是指应用于环卫领域,具有清扫、清洗、垃圾收集及垃圾转运等一种或多种作业功能的机器人,主要适用于城市辅道、非机动车道、人行道、步行街、风光带、公园、学校、景点、居民生活小区、商场、高铁站等狭窄或相对封闭区域的清扫保洁作业。

环卫机器人一方面通过机械化智能化设备作业提升清扫保洁效率和效果,提升环卫服务调配能力和智能化水平,创造巨大经济利益;另一方面,可以有效解决目前环卫工人工作量大,工作条件恶劣,社会地位低,危险性高的行业痛点。同时环卫行业还存在招工难,员工老龄化严重的问题,环卫机器人及智能化环卫设备的推广和普及促使环卫工人由人力工种转变成技术工种,有利于提高行业待遇水平,吸引年轻人就业,推动整个行业变革和进步。

3 复杂场景智能驾驶运动控制技术

3.1 研究目标

在獲取目标位置、作业任务等信息后,基于当前位置,从全局层面确定机器人运动策略,结合视觉、激光雷达等传感器采集的环境信息和局部度量地图,并结合强化学习建立运动控制方法,设计混杂运动控制器模块,生成动态避碰的运动轨迹,并通过多模态感知的运动控制实现自主导航。

3.2 主要研究内容及方案

复杂多场景下的环境实时认知与运动控制模块如图1所示。

3.2.1 多目标约束下的机器人实时运动控制

在环境融合和认知的基础上,确定机器人的运动控制的评价函数,设计可求解多目标约束的求解器。在此基础上,运用深度强化学习算法,在最小化危险指数避障、路径能耗和时长等约束下,建立用于动态环境的实时滚动运动控制策略。

3.2.2 多目标约束实时运动控制模块构建

针对不同工种清洁机器人在不同环境下的实时感知与避障能力的差异,采用基于深度强化学习的多目标约束运动控制方案。面向不同机体构型的约束,提出通用的运动控制评价函数,采用策略交叉熵变换法对清洁机器人进行策略采样与策略评价,设计出包含多种异常处理机制的多目标约束实时运动控制模块。

3.2.3 基于强化学习的多目标约束运动控制方案

为准确、全面、精细地使清洁机器人在动态大场景下的工作中实现自主运动,拟采用深度强化学习方法解决清洁机器人运动控制问题。在模型预测阶段,针对动态大场景非结构环境背景复杂、难以提取特征信息的问题,构建预测模型,实现自我学习的模型训练,实现运动轨迹的并行快速搜索,为清洁机器人提供自主运动控制方案。

3.3 试验方法

控制精度:≤5 cm。评测方法:环卫机器人自动驾驶沿直线行驶,测量行驶轨迹偏移度≤5 cm,则满足指标要求。

控制速度:≤50 m/s。评测方法:通过CAN总线下发控制指令,测试执行驱动器开始动作时间≤30 ms,则达到指标要求。

3.4 试验结论

按照上文试验方法进行试验,其结果如表1所示,智能避障的运动轨迹如图2所示。

4 全场景图像垃圾识别技术

4.1 研究目标

针对大规模场景下的长期清扫问题,重点研究基于全局环境感知信息的垃圾分类时空分布与人流量终身预测方法,结合其对整体环境的影响评估,引入强化学习策略。

4.2 主要研究内容及方案

全场景图像垃圾识别方案如图3所示。

4.2.1 基于环境感知信息的垃圾种类、时空分布以及人流量分布的预测

大范围复杂室内外清扫作业环境中,垃圾时空分布复杂、种类繁多以及人流时空分布灵活多变,为大规模清洁机器人实时策略分配与协同作业路径规划带来挑战,要求能够通过环境全局感知信息来实时准确预测垃圾清扫种类、分布以及人流量的全局分布以便完成全局分层式作业策略分配和路径融合优化。本研究基于全局感知信息综合处理技术进行有限标注样本在线学习和互补学习的方法,实现在线学习并预测垃圾清扫种类、时空分布以及人流量时空分布,为清洁机器人调度和路径规划提供服务。

4.2.2 基于在线学习的垃圾清扫分类模型

针对复杂繁多的垃圾清扫分类任务,研究基于全局环境感知信息的学习模型,实现对垃圾清扫种类的长期在线学习并准确实时预测。对于得到的部分少量已知垃圾的多源感知信息,探索基于多分类任务的融合网络信息处理模型。在此基础上,对于大量未知的垃圾感知信息,利用在线学习,从而解决实时准确的垃圾清扫分类问题。

4.2.3 基于互补学习系统的垃圾与人流量分布预测算法

研究基于全局环境时空感知信息的互补学习系统的短期记忆长期概括终身学习算法,实现对垃圾以及人流量时空分布的实时准确预测。针对获取到的不同时间空间下多源环境感知数据,研究视觉激光感知信息融合处理算法,构建垃圾数量以及人流量瞬时预测模型。

4.3 试验方法

垃圾识别精度:95%以上。评测方法:制作带垃圾的图片测试集200张。若正确识别出190张以上的垃圾,则满足指标要求。

垃圾识别速度:≤30 m/s。评测方法:通过视频传感器采集环境图像,图像中包含垃圾信息,若每一帧图像的识别速度≤30 m/s,则达到指标要求。

4.4 试验结论

按照上文的试验方法进行试验,其结果如表2所示。

5 结语

本研究针对不同工种清洁机器人在复杂环境下的实时感知与避障需求,采用基于深度强化学习的多目标约束运动控制方案,通过多目标约束下的机器人实时运动控制,能达到环卫机器人定位平均控制精度4.8 cm、响应平均控制速度47.4 m/s,最终实现智能驾驶运动控制。

本研究针对大规模场景下的长期清扫问题,重点研究基于全局环境感知信息的垃圾分类时空分布与人流量终身预测方法,结合其对整体环境的影响评估,引入强化学习策略,能达到垃圾识别精度95%以上,垃圾识别速度≤30 m/s,最终实现自主作业时的深度自学习与全场景图像垃圾识别。

本研究突破了以上关键核心技术,应用于多款环卫机器人产品,并以长沙、深圳福田区作为智能环卫机器人集群作业的典型示范点,打造智慧环境示范区的城市名片,多次被政府部门、相关协会作为AI赋能传统环卫行业的行业技术新标杆,进行宣传和支持,对行业交流、发展起到了良好的示范应用效果。

参考文献:

[1]张岁寒,张斌,陈凯,等.一种机器人智能自跟随方法、装置、介质、电子设备:中国,发明专利,202011342457.2[P].2021-12-17.

[2]张斌,李亮,蒋志达,等.垃圾清洁机与垃圾清洁机的分类收集方法:中国,发明专利,202111425651.1[P].2022-11-29.

[3]盈峰环境科技集团有限公司.环卫从业人员基本情况及收入现状白皮书[EB/OL]//(2022-05-12).http://www.inforeenviro.com/news/index626.html.

作者简介:

瞿靜,女,1979年生,工程师,研究方向为环卫机器人、智能环卫设备、科技信息及科技管理。

猜你喜欢
运动控制
高速数控系统的运动控制技术研究
二维轮廓设计与运动控制系统设计与开发
价值工程(2017年8期)2017-03-25 04:26:01
人群运动仿真模型分析
具有自主感知行为的虚拟人运动控制技术研究综述
基于Java串口通讯的检测系统程序设计
机械设计制造及其自动化的设计及发展趋势
电子套结缝纫机步进电机控制方案分析与探索
三维平动并联机床控制系统设计
企业导报(2015年15期)2016-01-18 08:49:07
基于双CPU的磨床控制系统
贴片机X/Y轴快速高精度定位的实现