探讨智能机器人的认知与学习

2020-09-10 11:16禤耀佳

内燃机与配件 2020年11期

禤耀佳

摘要：基于人工智能理论发展，其应用进一步拓展，对于下一代人工智能而言，认知与学习已经是其重要任务，例如智能机器人的出现，充分发挥了人工智能技术，进一步模仿人类智能，以完成各式各样的工作，并持续提升自身学习、认知能力。本文将针对这一情况予以研究。

关键词：智能机器人;认知与学习;机器学习算法;范式;强化学习

0 引言

关于智能机器人，其具备高层认知能力，可以很好地适应复杂环境，并完成对应的工作，具体认知包括三个步骤，其一获得数据;其二加工数据，并得出结果;其三自我完善，自我学习。对比机器学习，机器认知与其既有区别，即前者重视人脑学习能力，后者重视人体、人脑的行为与感知，同时二者又有关联的地方，即模仿人类智能。

1 机器学习算法本质及原理

在长期探索人类社会、自然界中，科学家给出了许多数学模型，以描述现象、事物，其可以归纳为三类。

其一，归纳模型：其包含几个参数变量，同时任一变量都代表独特的物理意义。借助该类模型，可以获得某一对象的规律、本质，比如大部分物理、数学定律均属于这一模型[1]。

其二，预测模型：该模型具备一个万能函数，这一函数可以拟合大部分训练样本，同时其中的参数没有物理意义。模型只用来预测、模拟等某一特定现象、事物，不会获得某一对象的规律、本质。目前，大部分机器学习算法均应有这一模型。

其三，直推模型：其不具备明确的数学函数，会借助其采集的大数据，以预测特定标签。该类模型主要结合采集的大数据，客观描述某一现象、事物，同时数据规模越大，客观描述就越准确、越全面[2]。换而言之，与其它模型相比，其不需要明确数学模型，使用起来更加简单直接，但其充分依赖大数据，一般要耗费大量的使用成本、计算量。此外，该模型无法获得某一对象的规律、本质。基于越来越多的人使用互联网技术，可越来越廉价、简单地获得大数据，为直推模型的应用提供了便利[3]。比如，在各大互联网中，搜索引擎会借助用户点击率，以改善網页排序精度。

结合上述内容可以知晓，就机器学习算法而言，其本质是获得一个万能函数，以建立预测模型。在训练过程中，结合用户予以的训练样本，可以获得最优参数集，从而科学的分布训练样本集。借助训练，可获得预测模型，换而言之，提取训练样本集分布，并将其编码到参数集中。利用预测模型，可以预测未知样本x，包括属性、标签等[4]。如今，大部分机器学习算法均应用这一原理，比如谷歌公司的AlphaGo。

结合某一现象、事物获得的训练样本，蕴含着众多先验知识，可以直观描述某一现象、事物。例如，在ImageNet ILSVRC比赛中，其获得1000类训练样本集，彩色图像共计一百多万张。其中，每一类都对应一种物体，包括鸟、汽车等，并涉及不同角度、场景的彩色图像1000张[5]。通过这样的训练，可以获得深度卷积神经网络，其本质是每类物体的个体差异、共性特征，并从中提取信息，以编码的形式录入参数集中。一旦出现未知图像，神经网络就会充分利用先验知识，以分类、识别输入图像。

2 智能机器人的体系结构

关于智能机器人，其体系结构可以明确各部分功能分配、信息流通关系、以及相互关系，并获得逻辑计算结构。智能机器人出于完成任务的目的，就要建立科学的体系结构。现阶段，体系结构可以结合执行、规划、感知等进行划分，大体可分为混合型、包容型、慎思型等范式。

2.1 传统范式分类及问题

关于智能机器人，其系统范式可以界定某一问题的技术、假设，其既是解决问题的工具，也是看待智能的方式。体系结构属于实例，范式属于抽象类，结合机器人体系结构，范式包括三种，其一，分层范式;其二，反应范式;其三，反应/慎思混合范式[6]。关于传统分类方法，其自信息流动方向入手，但没有明确说明产生过程。另外，机器人要具备较高的适应性，在系统设计机器人时，学习能力是重要因素，但传统范式，没有考虑学习能力。

2.2 智能产生方式范式分类

就智能产生方式而言，机器人系统可以划分为五种，其一基于知识的范式;其二基于行为的范式;其三基于学习的范式;其四基于进化的范式;其五基于认知的范式。

2.2.1 基于知识的范式

关于基于知识的范式，其意味着程序员可以借助编程，把知识输入机器。在自动推理与证明、专家系统领域，这一方法是适用的，但是其使用范围有限，即其只适用于抽象思维、逻辑推理知识。另外，基于环境复杂性的限制，有些知识是无法输入到机器中的。就传统分层范式而言，借助符号化知识予以决策，即基于知识的范式。

2.2.2 基于行为的范式

关于基于行为的范式，意味着在编写程序时，要完成机器人自主感知周边环境，同时作出反应的任务，并且在机器人内部存在大量并行的简单指令，结合优先级的不同，可以进行简单组合，从而做出复杂行为。换而言之，其等价于传统反应范式。

2.2.3 基于学习的范式

就基于学习的范式，其意味着程序员会结合特定问题，编写学习程序。该种学习范围有限，只针对特定任务，即输出、输入均受到约束。借助人为的方式，可以输入特定知识结构，通过学习过程，持续调整其中参数。在以往研究中，机器人模式识别、学习等方法，只针对特定任务，也是基于学习的范式。

2.2.4 基于进化的范式

就基于进化的范式，其主要按照生物演化规律。首先，提出机器人知识结构;其次，将其放置在运行环境中自行淘汰，发育;最后，选取新的后代。在这一过程中，机器人的参数、知识结构处于变化状态。在模拟环境中，此种范式比较适用;而在现实环境中，由于机器人造价高、进化耗时过长，其使用起来具有一定的难度[7]。为此，诞生了“进化机器人”，其既继承了这一范式，又进行了适当的发展。关于“进化机器人”，其意味着在进化机制中，不断融入符号、联结机制，促使机器人在交互中，自主实现控制系统。

2.2.5 基于认知的范式

就基于认知的范式，其重点知机器人认知过程，相比较进化过程，其是有区别的，进化意味着整个历史的生命进化，认知注重机器人自主学习，其与机器人学习相关。在这一过程中，机器人主动认知世界、主动与环境交互，并形成内在知识。相比较基于学习的范式，其最大不同是学习范围更广阔，即任何知识，不需要编程特定任务。

3 基于强化学习、认知的学习方法

3.1 认知的强化学习特征

①ODMDP特性：就可以认知得机器人而言，环境状态均可以依靠观测的方式获得，具备ODMDP特性，而行动、状态空间不可以人为事先给出，均可要借助环境交互产生。为此，强化学习模型，要实现ODMDP策略学习，并实现增量学习。

②多任务学习能力：对于智能机器人而言，其不会只针对一个任务，还会涉及充电、导航等任务，同时任务是可以任意添加的。而对于强化学习系统而言，其只完成一个任务。另外，智能机器人可面向不同任务，完成多个策略间转换，即自其他的强化学习任务中，获得策略经验。最后，就强化学习系统而言，其需要机器人予以选择，并给出行动决策。

③兴趣驱动的学习：就智能机器人来讲，其基本的能力就是自主学习，其针对的对象既包括面向任务的知识，也包括由兴趣驱动的知识，借助探索、玩耍等行为，可以广泛学习知识，提升自身能力，这属于智能发展本质。

④实时学习能力：对于认知机器人而言，其重视环境真实交互，为此要具备实时学习能力。同时，对于强化学习而言，原始的動作、传感器等不适用。对此，要借助合理计算分布式、行动、状态空间、优化初始值等，提高学习速度。

⑤状态转移可以不同时进行：在强化学习算法中，迹衰退系数A、回报折扣率Y等状态转移时间一样。然而机器人环境交互，这一条件难以达成，为此要更新强化学习方式。

3.2 认知的强化学习模型

结合传统强化学习方法，知识模块可作为中心数据结构，通过状态值表等予以表示，并通过中心控制程序，持续更新数据结构。若以神经网络以表示，可以统一知识、学习过程。但就神经网络而言，设计结构需要一定的技巧，并结合具体任务来设计，同时行动输出、感知输入等要符合马尔科夫特性，通过调整权值的方式，对应实现行动、状态。

3.3 强化学习算法实现

在STAMN中，任一状态行动值，要借助行动、状态节点间权值以表示。对于任一行动、状态节点而言，其在被内部激活后，要更新状态行动值。一旦获得奖励值，不仅作用于前一步已激活的状态行动值，还要反映在多步激活的状态行动值中。对于强化学习方法而言，其本质是局部更新，为此不需任何修改，就能应用在强化学习模型中。

4 结束语

综上所述，出于精准理解环境的目的，在设计机器人时，要考虑触觉、声觉、视觉等传感器，并利用大数据处理、云计算等技术，借助与环境的交互，加强机器人认决策知、理解、感知环境等能力。另一方面，出于精准操作的目的，既要研制新型传感器，也要研制新型执行器，借助决策、认知、学习，改善机器人解决复杂任务能力。此外，在如今的机器人应用，也引入了新的技术，比如增强现实、虚拟现实等技术，并结合多种穿戴式传感技术，横跨知识、虚拟、物理等空间进行学习，同时自主学习人类智能。

参考文献：

[1]陈玲玲，冯琦，马小霞，等.基于深度学习的认知无线电智能功率控制算法设计与实现[J].信息技术与信息化，2019（7）：95-97.

[2]孙富春.智能机器人的认知与学习[J].机器人，2019，41（5）：561.

[3]孔令龙，田国会.智能家庭中一种基于本体的机器人服务认知机制[J].山东大学学报（工学版），2019，49（6）：85-87.

[4]李振，周东岱，王勇.“人工智能+”视域下的教育知识图谱：内涵、技术框架与应用研究[J].远程教育杂志，2019（4）：75-77.

[5]王广新，王悦.支持智慧学习的语境化叙事游戏开发与学习效果验证[J].中国远程教育：综合版，2019（10）：15-17.

[6]黄敏，路飞，李晓磊，等.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人，2019，41（5）：609-619.

[7]王薇，吴锋，周风余.机器人操作技能自主认知与学习的研究现状与发展趋势[J].山东大学学报（工学版），2019，49（6）：195-197.