刘红卫,徐 磊,李泰博,陈小前,张育林
(军事科学院 国防科技创新研究院, 北京 100071)
随着人工智能技术的发展,机器人系统无人化、自主化水平得到了显著提高,在工业生产、物流、医疗等领域产生了巨大的应用价值,大大解放了人类的体力劳动。在地外天体[1]、海面和水下[2]、高原、极地等极端环境下,由于存在不适宜人类生存的特殊环境,需要机器人系统具备完全的自主化能力,实现在无人化环境下的长期工作与生存。自然界生物经过长期进化与适应,形成了丰富多彩的物种体系,不仅在气候适宜的地区存在大量的生物物种,在火山口、极地、海底等极端环境下仍然存在生物物种,这些奇妙的生命系统为开展极端环境下的机器人技术研究提供了借鉴和灵感。针对机器人系统的无人化应用需求,已经有学者从自然界生态系统的特征入手,研究了机器人系统的自维持、自复制、自进化等仿生特性。
自我维持是机器人系统在无人化环境中长期生存与执行任务的关键能力。机器人系统应能够获取环境中的能源和物质,对工作过程中出现的各类故障进行诊断与识别,并在必要时对故障进行修复或排除。针对地外天体探索领域的能源自维持问题,文献[3-4]提出了一种在星体表面建设机器人基地的方法,使机器人利用星体原位资源进行自我维持和长期运行。针对野外机器人的生存问题,文献[5]通过模仿自然界树懒节省能量的特征,设计了一款可利用太阳能进行充电的长期自我维持机器人。针对机器人故障识别与修复问题,文献[6]通过对大型六足机器人腿部的研究,利用支持向量机方法对机器人腿部不同伤情进行三维建模和多类型故障识别,建立了基于支持向量机方法的多足机器人故障诊断系统。文献[7-9]研究了模块化机器人自重构和自修复问题,并对相关理论和方法进行了验证。文献[10]基于多Agent思想对异构机器人集群协作体系进行了设计与开发,以期实现机器人集群的智能控制,维持集群机器人高效的任务能力。
自我复制技术将使机器人生命在代际间得以延续,有效延长机器人系统的工作时间。人们在自复制机器人领域已经开展了广泛的研究[11-12],包括自复制机器人系统的体系设计问题[13]、模块化机器人单胞结构设计问题[14]、机器人智能控制问题等。文献[15-17]设计了由4个子系统组成的自复制机器人,包括控制器、左踏面、右踏面和夹持器/传感器子系统,各分系统由乐高积木作为基础架构,辅以磁铁和锁紧机构加强各分系统之间的连接。文献[18]提出在结构化环境下利用分布式电子元件进行自我复制的机器人系统,并演示了基本的复制流程。文献[19]扩展了经典元胞自动机理论,并开发了一个新的模型检验其原理,使机器人在结构化环境中通过重新组装其6个子系统形成一个新的复制体。针对自复制机器人系统的体系设计问题,文献[20]提出了月面自复制机器人工厂概念,使自复制机器人系统的能量和物质流动进一步明确。近年来,3D打印技术迅猛发展,极大地便利了模块化机器人中零部件的制备和获取,使自复制机器人获取硬件的速度大幅提高[21-24]。与此同时,4D打印等新概念也不断被提出,将极大地提升机器人及相关零部件的制造水平[25-26]。
受自然界生物进化启发,将生物遗传进化过程中的基因突变、自然选择等过程应用于机器人领域,使机器人系统具备学习进化的能力,将有助于提高机器人系统对环境的适应能力,进而更好地开展作业。文献[27-31]论述了自进化机器人的发展历程,简述了机器人自进化的基本概念和基本方法,通过总结近年来自进化机器人领域的研究现状和最新成就,提出了一些可能的自进化机器人应用形式。 文献[32]基于人工智能思想,深入分析了几种常用的进化算法,并全面描述了如何将智能计算技术应用于自进化机器人的系统设计。针对机器人的自我学习问题,文献[33]通过模拟由植物和昆虫组成的生态系统,研究了机器人集群系统中的行为进化问题,并基于机器学习方法给出了多机器人行为学习的仿真结果。为解决机器人系统的自动化问题,文献[34]提出了一款具备完全自主能力的机器人工厂概念,利用该工厂生产符合任务目标的物理机器人,并加速机器人进化速度。
针对机器人集群未来智能化、无人化的应用需求,本文提出了具备自复制、自维持、自进化和执行任务能力的机器人生态圈概念。结合机器人生态圈典型任务场景的自主任务决策需求,建立了基于决策树和神经网络的机器人生态圈自主任务决策模型,开展了仿真计算和验证分析,以期为未来实现机器人生态圈的无人化应用提供决策方法支撑。
针对机器人智能化、无人化发展趋势,作者所在团队提出了机器人生态圈概念,从机器人学入手,借鉴自然界生态系统的特征,建立基于分布式人工智能的机器人生态圈系统,通过生态圈系统内部各个智能体的有效协同达到集群共识,从而涌现出自维持、自复制与自进化等生命特征,并具备特定的任务执行能力。自维持是指机器人生态圈系统能够维持自身的稳定状态,进行能量自我补给并自主开展工作。自复制是指机器人生态圈系统能够利用环境资源,制备出与自身形态、结构和功能相一致的子代。自进化是指机器人生态圈系统能够模仿生物界的遗传与进化功能产生“基因突变”,并根据环境的“自然选择”结果保留适应环境要求的新生子代。任务执行能力是指根据不同场景的相关任务需求,机器人生态圈内的机器人可以开展不同类型的工作。
基于机器人生态圈系统的上述基本特性,根据应用场景合理设计其体系结构与机器人样式,可以充分发挥机器人生态圈系统在无人环境下作业的优势。例如:①勘探并获取地外天体资源作为人类未来发展的重要方向,将成为人类拓展生存空间、获取生存资源的重要途径之一。地外天体缺乏人类生存的各类资源,无法满足人类的长期工作需求。若利用机器人的先导性,先行发射机器人系统至地外天体,使机器人系统利用地外天体的原位资源建立机器人生态圈,实现自维持、自复制、自进化功能,并逐步建立人类庇护所,将使对地外天体资源的大规模勘探和开发成为可能。②高原环境监测、极地科学考察等需求愈发强烈,而这些地区气候寒冷、基础设施薄弱,充分利用机器人生态圈系统可在无人环境下作业的优点,使机器人系统仅依靠在这些地区易于获取的太阳能、风能、地热能等资源实现长期工作的目标,将有效解决人类对这些地区的现实需求与客观条件之间的矛盾。
在现实生活中,森林火情常发,不仅为人们的生命财产安全带来极大威胁,也严重破坏当地的生态环境和林业资源。然而,在我国东北的原始森林、西南热带雨林、青藏高原等地,气候恶劣,资源匮乏,难以为人类提供良好的生活和工作环境,给人类进行森林火情监测工作带来诸多不便。森林火情监测任务具有长期性、实时性等特点,而机器人生态圈系统的能量自维持、故障自维修、任务自主决策等优势将有效满足森林火情监测任务的无人化、长期性、实时性等要求,因而森林火情监测任务是机器人生态圈系统进行现实应用的一个典型任务场景。
本文以无人环境下的森林火情监测与处置场景为案例,根据其日常工作需求,建立了场景所需的各子系统及工作体系。其具体功能为:在相应时间派出观测无人机飞抵目标区域进行火情监测,将观测结果反馈给任务管理与控制系统,由任务管理与控制系统决策是否派出灭火无人机完成灭火任务,然后由灭火无人机执行灭火任务。该系统具体包括以下组成部分:
1)观测无人机(2架):负责指定区域的日常火情监测,并将监测结果实时发送给任务管理与控制系统。
2)灭火无人机(2架):负责在出现火情的情况下出动并执行灭火任务。日常驻留于舱体内,处于待机状态,在接收到出动命令后迅速出动。
3)气象站:负责向机器人生态圈系统提供气象信息,包括温度、湿度、风速、能见度、降水等。
4)太阳能电站:负责向机器人生态圈系统提供电能。
5)运行维护机器人(2套):负责无人机的日常维护,包括为无人机充电、监测无人机状态、识别并检修无人机故障等。
6)任务管理与控制系统:由计算机、信号接收机等电子设备组成,负责机器人生态圈系统的任务管理与控制工作。
7)舱体:负责容纳观测无人机、运行维护机器人和灭火无人机,内部合理安置充电桩及电缆,为机器人提供良好的工作环境。
针对无人环境下的森林火情监测与处置需求,建立了机器人生态圈的自主任务决策模型。在这一应用场景中,任务管理与控制系统要根据环境信息、观测无人机对火情的观测结果和灭火无人机自身状态信息对任务做出评估,决定是否出动灭火无人机和灭火无人机出动方式。观测无人机出动后首先监测火情,然后将监测结果反馈给任务管理与控制系统,由任务管理与控制系统判断是否出动灭火无人机执行灭火任务。若出动灭火无人机,则观测无人机应继续保持观测状态,并将任务执行情况反馈给任务管理与控制系统,由任务管理与控制系统评估任务执行效果,若执行效果符合要求,则任务结束,灭火无人机返回舱体进行充电和日常维护;若执行效果不满足预期,则继续执行任务或重新出动灭火无人机,必要时可多次重复上述工作,直至满足任务要求方可结束。执行任务的程序框图如图1所示。
图1 执行任务的程序框图Fig.1 Program block diagram for task execution
在系统执行任务过程中,任务管理与控制系统需要根据实时状态信息对是否执行任务和执行任务的类型做出决策,并收集历史数据扩充数据库以完善决策模型。本文所建立的任务管理与控制系统在决策是否执行任务并判断任务执行类型时考虑以下13个影响参数:
参数1:昼夜情况。夜间不利于无人机观测,对系统可靠性要求更高。
参数2:任务等级。在任务紧急的情况下,可以适当降低对环境的要求以及对系统可靠性、剩余电量的要求。将任务等级划分为一般、紧急和非常紧急三类。
参数3:任务范围。根据距离远近划分任务范围,当距离过远时无人机无法执行任务。定义任务范围0~10 km为近距离;11~50 km为中距离;51~100 km为远距离。
参数4:温度。无人机执行任务时,温度过高或过低都将使无人机上的电子元器件无法正常工作。定义温度-20~40 ℃为适宜;-40~-30 ℃或40~50 ℃为较适宜;-30~-20 ℃或50~60 ℃为不适宜。
参数5:风力等级。风速会显著影响无人机飞行的稳定性,风速过大将导致无人机无法正常飞行。将风等级划分为1~3级、4~7级和8级以上。
参数6:能见度。能见度影响无人机监测效果,能见度过低将使无人机无法正常工作。定义能见度大于1 000 m为清晰;500~1 000 m为较清晰;100~500 m为较不清晰;0~100 m为不清晰。
参数7:雨雪等级。雨雪天气影响无人机飞行性能,雨雪过大将导致无人机无法正常飞行。雨雪等级分为无雨雪、小雨雪、中雨雪、大雨雪和暴雨雪五个等级。
参数8、9:灭火无人机1、2的电量。为保证无人机在一定范围内有效执行任务,电量应保持充足,电量过低将影响无人机航程。电量取值范围为0.3~1。
参数10、11:灭火无人机1、2的可靠性。无人机可靠性过低时,无法安全执行任务。可靠性取值范围为0.4~1。
参数12、13:运行维护系统1、2的可靠性。运行维护系统可靠性过低时,将无法为无人机提供安全维护,不能保障无人机持续作业。运行维护系统可靠性取值范围为0.4~1。
在上述参数中,灭火无人机的电量和可靠性、运行维护系统可靠性均为连续变化值,其他参数为离散值,各离散参数及其划分结果如表1所示。
表1 任务决策影响参数
针对以上影响因素,任务管理与控制系统应综合评判,做出是否开展观测任务以及执行单机观测任务或双机协同观测任务的决策。随着任务开展次数的增多,任务管理与控制系统应不断扩充训练数据集,并更新优化决策模型。
决策树方法是机器学习领域的一类常用方法,具有分类直观、模型可解释性强的优点[35]。神经网络方法善于从原始输入数据中提取抽象特征,具有良好的泛化能力,在模型拟合和数据特征提取方面具有显著优势。本文基于决策树方法和神经网络方法,利用训练数据分别生成自主任务决策的决策树模型和神经网络模型,使系统可基于实时状态信息做出自主任务决策,为机器人生态圈的实际应用和部署提供参考。
基于决策树模型的决策过程就是依据树状结构对属性逐层进行划分并决策的过程。一般情况下,一颗决策树包含一个根节点、若干内部节点和若干叶节点。根节点对应于划分影响最大的属性,叶节点对应于决策结果,而内部节点则对应于一个属性测试[36]。如图2所示,在根节点处选取“温度”为属性划分依据,若温度为不适宜或较适宜,则不执行任务,否则根据风力等级继续划分任务,以此类推直至划分至最后一个属性。
图2 决策树模型示意Fig.2 Schematic diagram of decision tree model
2.2.1 划分选择
在决策树模型构建过程中,关键在于如何选择最优划分属性。一般情况下,随着划分过程不断进行,决策树分支节点所包含的样本应尽可能属于同一类别,即每选择一次属性进行划分后,应使其后续节点的“纯度”尽可能高。“信息熵”是度量样本集合纯度的一种常用指标,其值越小,则样本集合的纯度越高。信息熵定义为:
(1)
其中,D为构建任务决策模型过程中某一节点处的样本集合,pk为该样本集合中第k类样本所占的比例,y为样本的种类数。
假设在任务决策模型的影响参数中有离散属性a(如任务等级),a有V个可取值(如一般、紧急、非常紧急),则使用该属性对样本集进行节点划分,将会产生V个分支节点。给分支节点赋予权重|Dv|/|D|,则样本数越多的节点影响越大。用属性a对样本集D进行划分所获得的信息增益为:
(2)
对应属性a的信息增益越大,则使用该属性对样本集进行划分所获取的“纯度提升”就越高。
2.2.2 连续值离散化处理
对于具有连续值的属性,如无人机电量、无人机可靠性、运行维护系统可靠性等,在进行决策划分时需对其进行离散化处理,本文采用二分法对连续值进行处理。例如,对样本集D的连续属性如无人机电量t,将其按照取值大小顺序依次排列,记为{t1,t2,…,tn},选取划分点m将其分为两个区间,使连续属性所有可能的取值分别落在区间[t1,tm]和(tm,tn]之内,则对于某相邻两个值ti和ti+1,划分点m在[ti,ti+1)区间内取任意值时产生的划分结果都相同。对于具有n-1个元素的候选划分点集合,选取如下划分点:
(3)
则离散化之后的信息增益可表示为:
(4)
按照上述公式对本文所构建的机器人生态圈系统数据进行处理,即可生成一棵可用于任务管理与控制的决策树模型,可在给定实时信息后及时有效地做出任务决策。
基于神经网络方法的数学建模就是通过对生物的神经网络进行模拟和近似,使一定数量的神经元相互连接,构成一个自适应的非线性动态网络系统,进而获得对输入空间或输入数据的有效表示[37]。
2.3.1 搭建神经网络模型
对于本文所建立的神经网络决策模型,决策变量为13个,如2.1节所述。决策结果为3个,分别为:不执行任务、单机执行任务、双机协同执行任务。将13个决策变量作为输入参数,将决策结果作为参数标签,则每一次训练过程即为利用神经网络为13个训练参数拟合适当的标签。建立神经网络模型如图3所示。
图3 神经网络模型示意Fig.3 Schematic diagram of neural network model
根据输入数据与输出数据特点,建立了共5层的全连接神经网络。其中,隐藏层激活函数选用ReLU函数,输出层激活函数选用Softmax函数。在模型中使用了Dropout方法防止数据过拟合,并对数据进行批标准化处理以防止梯度消失或梯度爆炸。
2.3.2 批标准化与防止数据过拟合
在深度学习中,训练数据和测试数据满足相同分布是模型具有良好泛化能力的重要前提。但在层数较多的神经网络模型中,每一层的输入数据都将受到其前层参数的影响,并导致数据分布的改变,模型在训练时需不断适应这些新的分布,从而导致模型训练困难,甚至无法收敛。因此,引入批标准化对输入数据进行规范,将有效提升模型训练速度和泛化水平。
随着神经网络层数的加深和神经元数量的增多,训练极易出现过拟合问题,导致模型在测试集上误差过大。引入Dropout方法,使模型在训练过程中随机失活部分神经元,将有效改善模型的过拟合问题,提升模型训练速度。
本文所建立的基于决策树方法的自主任务决策模型包括以下影响参数:训练集样本数、测试集样本数、训练集划分精度、连续属性划分份数。训练集样本数是指用于生成决策树模型的样本个数;测试集样本数是指用于测试决策树模型是否准确的样本个数;测试集划分精度是指在根据训练集生成决策树模型时,当某一节点被划分后,其子集内的数据与该属性的符合率达到该精度后,则不再继续划分时所取的精度值;连续属性划分份数是指在利用训练集中的某些连续属性生成决策树模型时,在对连续属性进行离散化处理以计算信息增益时在该连续属性的值区间内等距划分的份数和。采用控制变量法,在其他参数不变的条件下改变单一参数,分别对训练集样本数、测试集样本数、训练集划分精度、连续属性划分份数对模型正确率的影响进行了分析。此外,还使用不同测试集对相同训练集生成的决策树模型进行了模型正确率对比测试,并对训练集与测试集样本数均较大时进行了模型正确率测试。
3.1.1 训练集样本数对模型正确率的影响
训练集用来生成决策树模型。图4所示为测试集样本数为1 000、训练集划分精度为0.75、连续属性划分份数为30时,训练集样本数由10增长至1 000时模型正确率的变化情况。计算结果表明,在训练集样本数较小时(如低于300时),模型正确率较低,且振荡幅度较大;在训练集样本数较大时(如高于600时),模型正确率基本保持在80%以上,且振荡幅度较小。这说明,本文所建立的决策树模型可以随着任务的进行逐步吸收新的训练数据,并使模型的正确率逐渐趋于稳定,进而提高机器人生态圈的自主任务决策水平。
图4 训练集样本数对模型正确率的影响Fig.4 Influence of sample number of training set on model accuracy
3.1.2 测试集样本数对模型正确率的影响
测试集用来测试由训练集生成的决策树模型是否准确。图5所示为训练集样本数为1 000、训练集划分精度为0.75、连续属性划分份数为30时,测试集样本数由10增至1 000时模型正确率的变化情况。计算结果表明,当测试集样本数较小时(如低于100时),模型正确率振荡幅度较大;当测试集样本数较大时,模型正确率振荡幅度较小。但不论测试集样本数较大还是较小,模型正确率的均值均保持在80%左右。
图5 测试集样本数对模型正确率的影响Fig.5 Influence of sample number of test set on model accuracy
3.1.3 连续属性划分份数对模型正确率的影响
在对连续属性进行离散化处理时,需将属性值划分至不同区间内,划分的份数将对模型正确率产生影响。图6所示为训练集样本数为1 000、测试集样本数为1 000、训练集划分精度为0.75,连续属性划分份数由2增长至100时模型正确率的变化情况。结果表明,在其他参数不变的情况下,模型正确率并未随划分份数的增加而提高,基本保持在80%以上。但划分份数的增加会降低算法运行速度,因此,为提高模型决策效率,划分份数不宜过大,30份即可使模型正确率保持在较高水平。
图6 连续属性划分份数对模型正确率的影响Fig.6 Influence of the number of continuous attributes on the model accuracy
3.1.4 训练集划分精度对模型正确率的影响
在用训练集数据生成决策树模型时,当某一节点内的某一属性的样本数占该节点内总样本数的比例达到一定值后,即停止继续向下划分属性,并以该属性作为叶节点,该比例值为训练集划分精度。图7所示为训练集样本数为1 000、测试集样本数为1 000、连续属性划分份数为30时,训练集划分精度由0.4增至1时模型正确率的变化情况。结果表明,在其他参数不变的情况下,模型正确率与训练集划分精度呈正相关态势,当训练集划分精度较低时,模型正确率低于80%,当划分精度大于0.7时,模型正确率基本保持在80%以上,因此,为保证模型具有较高的正确率,实际划分时应将划分精度取为0.7以上。
图7 训练集划分精度对模型正确率的影响Fig.7 Influence of the training set partition accuracy on model accuracy
3.1.5 不同测试集的模型正确率
为进一步验证所建立的决策树模型的稳定性,采用两个不同测试集分别对模型进行测试。当训练集样本数为1 000、训练集划分精度为0.90、连续属性划分份数为30时,两个不同测试集样本数分别由500增至1 500时,两个测试集所测试产生的模型精度均在80%以上,如图8所示。这说明,所建立的决策树模型对不同的测试数据均能保持较高的正确率。
图8 不同测试集的模型正确率Fig.8 Model accuracy of different test sets
3.1.6 数据量较大时的模型正确率
当训练集样本数增长到一定数量时,模型正确率将逐渐趋于稳定。本文测试了所建模型在训练集与测试集样本数均较大时的模型正确率,如图9所示。当训练集与测试集样本数均为2 000、训练集划分精度为0.75、连续属性划分份数为30时,多次测试的结果显示模型正确率稳定在85%以上。这表明,由较大样本数生成的决策树模型具有较高的正确率和稳定性。
图9 样本数较大时的模型正确率Fig.9 Model accuracy when sample size is large
本文所建立的神经网络模型的影响参数包括训练集样本数、测试集样本数、神经元失活比例等。训练集样本数是指用于训练生成神经网络模型的样本个数;测试集样本数是指用于测试神经网络模型是否准确的样本个数;神经元失活比例是指使用Dropout方法时,每一层中失活神经元占该层神经元总数的比例。同样采用控制变量法,在其他参数不变的条件下改变单一参数,对训练集样本数、测试集样本数、神经元失活比例对模型训练结果的影响做了分析。
3.2.1 训练集样本数对模型训练结果的影响
为对比训练集样本数对模型训练结果的影响,本文分析了在测试集样本数为1 000,训练集样本数分别为500、1 000、1 500、2 000时的模型训练结果,如图10所示。当训练集样本数较小时,模型对测试集的损失值逐渐增大,存在明显的过拟合情况。随训练集样本数的增加,模型在测试集上的损失值稳步减小,过拟合情况显著改善。
(a) 训练集样本数为500时的模型训练结果(a) Training results of the model with 500 samples in the training set
3.2.2 测试集样本数对模型训练结果的影响
为对比测试集样本数对模型正确率的影响,本文分析了在训练样本数为1 000,测试集样本数分别为200、500、800、1 000时对模型训练结果的影响,如图11所示。可见,当训练集样本数一定时,测试集的模型正确率基本不变。测试集数据量较小时,模型正确率及损失值波动幅度略大;当测试集数据量较大时,模型正确率及损失值的波动幅度均较小。
(a) 测试集样本数为200时的模型训练结果(a) Training results of the model with 200 samples in the test set
3.2.3 神经元失活比例对模型训练结果的影响
为了防止模型出现过拟合现象,使用了Dropout方法,通过使部分神经元失活提高模型训练的准确率。本文测试了当训练集样本数为2 000、测试集样本数为500时神经元失活的不同比例对模型训练结果的影响,如图12所示。当神经元失活比例较低时,模型测试集损失值较高,训练集正确率与测试集正确率的差别较大,更容易出现过拟合现象;当神经元失活比例较高时,训练集与测试集的损失值和正确率差值明显收窄,说明此时Dropout方法的抗过拟合能力更强。
(a) 神经元失活比例为0.3时的模型训练结果(a) Training results of the model when the neuron inactivation ratio is 0.3
3.2.4 数据量较大时的模型训练结果
当训练集与测试集的数据量均较大时,模型的损失值及正确率将逐渐趋于稳定,本文测试了当训练集和测试集数据量均为2 000时的模型训练情况,如图13所示。结果表明,当训练集与测试集的数据量均较大时,模型的损失值和正确率逐渐趋于稳定且波动幅度均较小,模型正确率达85%以上。
图13 样本数较大时的模型训练结果Fig.13 Model training results when the sample size is large
本文提出了机器人生态圈概念,对机器人生态圈的自主任务决策需求进行了分析。针对机器人生态圈的典型任务场景,分别建立了基于决策树方法和神经网络方法的机器人生态圈自主任务决策模型,并分别对两种模型的影响参数进行了分析。
基于决策树方法建模的分析结果表明:①训练集样本数与训练集划分精度对模型正确率有较大的影响。当训练集样本数较小时,模型的正确率较低,且振荡幅度较大;当训练集样本数较大时,模型正确率较高且基本保持稳定。当训练集划分精度较低时,模型的正确率较低;当训练集划分精度较高时,模型正确率也较高。②测试集样本数与连续属性划分份数对模型正确率无明显影响。③同一决策树模型对不同测试集具有相似的测试结果,模型正确率均保持在较高水平。④当训练集和测试集样本数较大时,模型正确率趋近于稳定水平,且保持在85%以上。
基于神经网络方法建模的分析结果表明:①训练集样本数和神经元失活比例对模型的训练结果具有较大影响,测试集样本数对模型训练结果的影响较小。当训练集样本数较小时,模型在测试集的损失值和正确率波动幅度较大;当训练集样本数较大时,模型在测试集的损失值和正确率波动幅度较小且正确率较高。②使用Dropout方法使神经元的失活比例较低时,模型抗过拟合性能不佳;失活比例较高时,模型抗过拟合性能较好。③当训练集和测试集样本数较大时,模型正确率趋近于稳定水平,且保持在85%以上。
分析结果说明,机器人生态圈的自主任务决策需求可以通过机器学习方法如决策树方法和神经网络方法得到有效解决。未来机器人生态圈系统得到实际部署后,可利用实际观测数据代替仿真数据,使自主任务决策模型的决策结果更加贴合实际情况,满足机器人生态圈系统的实际应用需求。