探讨智能机器人的认知与学习

2020-09-10 11:16禤耀佳
内燃机与配件 2020年11期
关键词:智能机器人范式

禤耀佳

摘要:基于人工智能理论发展,其应用进一步拓展,对于下一代人工智能而言,认知与学习已经是其重要任务,例如智能机器人的出现,充分发挥了人工智能技术,进一步模仿人类智能,以完成各式各样的工作,并持续提升自身学习、认知能力。本文将针对这一情况予以研究。

关键词:智能机器人;认知与学习;机器学习算法;范式;强化学习

0  引言

关于智能机器人,其具备高层认知能力,可以很好地适应复杂环境,并完成对应的工作,具体认知包括三个步骤,其一获得数据;其二加工数据,并得出结果;其三自我完善,自我学习。对比机器学习,机器认知与其既有区别,即前者重视人脑学习能力,后者重视人体、人脑的行为与感知,同时二者又有关联的地方,即模仿人类智能。

1  机器学习算法本质及原理

在长期探索人类社会、自然界中,科学家给出了许多数学模型,以描述现象、事物,其可以归纳为三类。

其一,归纳模型:其包含几个参数变量,同时任一变量都代表独特的物理意义。借助该类模型,可以获得某一对象的规律、本质,比如大部分物理、数学定律均属于这一模型[1]。

其二,预测模型:该模型具备一个万能函数,这一函数可以拟合大部分训练样本,同时其中的参数没有物理意义。模型只用来预测、模拟等某一特定现象、事物,不会获得某一对象的规律、本质。目前,大部分机器学习算法均应有这一模型。

其三,直推模型:其不具备明确的数学函数,会借助其采集的大数据,以预测特定标签。该类模型主要结合采集的大数据,客观描述某一现象、事物,同时数据规模越大,客观描述就越准确、越全面[2]。换而言之,与其它模型相比,其不需要明确数学模型,使用起来更加简单直接,但其充分依赖大数据,一般要耗费大量的使用成本、计算量。此外,该模型无法获得某一对象的规律、本质。基于越来越多的人使用互联网技术,可越来越廉价、简单地获得大数据,为直推模型的应用提供了便利[3]。比如,在各大互联网中,搜索引擎会借助用户点击率,以改善網页排序精度。

结合上述内容可以知晓,就机器学习算法而言,其本质是获得一个万能函数,以建立预测模型。在训练过程中,结合用户予以的训练样本,可以获得最优参数集,从而科学的分布训练样本集。借助训练,可获得预测模型,换而言之,提取训练样本集分布,并将其编码到参数集中。利用预测模型,可以预测未知样本x,包括属性、标签等[4]。如今,大部分机器学习算法均应用这一原理,比如谷歌公司的AlphaGo。

结合某一现象、事物获得的训练样本,蕴含着众多先验知识,可以直观描述某一现象、事物。例如,在ImageNet ILSVRC比赛中,其获得1000类训练样本集,彩色图像共计一百多万张。其中,每一类都对应一种物体,包括鸟、汽车等,并涉及不同角度、场景的彩色图像1000张[5]。通过这样的训练,可以获得深度卷积神经网络,其本质是每类物体的个体差异、共性特征,并从中提取信息,以编码的形式录入参数集中。一旦出现未知图像,神经网络就会充分利用先验知识,以分类、识别输入图像。

2  智能机器人的体系结构

关于智能机器人,其体系结构可以明确各部分功能分配、信息流通关系、以及相互关系,并获得逻辑计算结构。智能机器人出于完成任务的目的,就要建立科学的体系结构。现阶段,体系结构可以结合执行、规划、感知等进行划分,大体可分为混合型、包容型、慎思型等范式。

2.1 传统范式分类及问题

关于智能机器人,其系统范式可以界定某一问题的技术、假设,其既是解决问题的工具,也是看待智能的方式。体系结构属于实例,范式属于抽象类,结合机器人体系结构,范式包括三种,其一,分层范式;其二,反应范式;其三,反应/慎思混合范式[6]。关于传统分类方法,其自信息流动方向入手,但没有明确说明产生过程。另外,机器人要具备较高的适应性,在系统设计机器人时,学习能力是重要因素,但传统范式,没有考虑学习能力。

2.2 智能产生方式范式分类

就智能产生方式而言,机器人系统可以划分为五种,其一基于知识的范式;其二基于行为的范式;其三基于学习的范式;其四基于进化的范式;其五基于认知的范式。

2.2.1 基于知识的范式

关于基于知识的范式,其意味着程序员可以借助编程,把知识输入机器。在自动推理与证明、专家系统领域,这一方法是适用的,但是其使用范围有限,即其只适用于抽象思维、逻辑推理知识。另外,基于环境复杂性的限制,有些知识是无法输入到机器中的。就传统分层范式而言,借助符号化知识予以决策,即基于知识的范式。

2.2.2 基于行为的范式

关于基于行为的范式,意味着在编写程序时,要完成机器人自主感知周边环境,同时作出反应的任务,并且在机器人内部存在大量并行的简单指令,结合优先级的不同,可以进行简单组合,从而做出复杂行为。换而言之,其等价于传统反应范式。

2.2.3 基于学习的范式

就基于学习的范式,其意味着程序员会结合特定问题,编写学习程序。该种学习范围有限,只针对特定任务,即输出、输入均受到约束。借助人为的方式,可以输入特定知识结构,通过学习过程,持续调整其中参数。在以往研究中,机器人模式识别、学习等方法,只针对特定任务,也是基于学习的范式。

2.2.4 基于进化的范式

就基于进化的范式,其主要按照生物演化规律。首先,提出机器人知识结构;其次,将其放置在运行环境中自行淘汰,发育;最后,选取新的后代。在这一过程中,机器人的参数、知识结构处于变化状态。在模拟环境中,此种范式比较适用;而在现实环境中,由于机器人造价高、进化耗时过长,其使用起来具有一定的难度[7]。为此,诞生了“进化机器人”,其既继承了这一范式,又进行了适当的发展。关于“进化机器人”,其意味着在进化机制中,不断融入符号、联结机制,促使机器人在交互中,自主实现控制系统。

2.2.5 基于认知的范式

就基于认知的范式,其重点知机器人认知过程,相比较进化过程,其是有区别的,进化意味着整个历史的生命进化,认知注重机器人自主学习,其与机器人学习相关。在这一过程中,机器人主动认知世界、主动与环境交互,并形成内在知识。相比较基于学习的范式,其最大不同是学习范围更广阔,即任何知识,不需要编程特定任务。

3  基于强化学习、认知的学习方法

3.1 认知的强化学习特征

①ODMDP特性:就可以认知得机器人而言,环境状态均可以依靠观测的方式获得,具备ODMDP特性,而行动、状态空间不可以人为事先给出,均可要借助环境交互产生。为此,强化学习模型,要实现ODMDP策略学习,并实现增量学习。

②多任务学习能力:对于智能机器人而言,其不会只针对一个任务,还会涉及充电、导航等任务,同时任务是可以任意添加的。而对于强化学习系统而言,其只完成一个任务。另外,智能机器人可面向不同任务,完成多个策略间转换,即自其他的强化学习任务中,获得策略经验。最后,就强化学习系统而言,其需要机器人予以选择,并给出行动决策。

③兴趣驱动的学习:就智能机器人来讲,其基本的能力就是自主学习,其针对的对象既包括面向任务的知识,也包括由兴趣驱动的知识,借助探索、玩耍等行为,可以广泛学习知识,提升自身能力,这属于智能发展本质。

④实时学习能力:对于认知机器人而言,其重视环境真实交互,为此要具备实时学习能力。同时,对于强化学习而言,原始的動作、传感器等不适用。对此,要借助合理计算分布式、行动、状态空间、优化初始值等,提高学习速度。

⑤状态转移可以不同时进行:在强化学习算法中,迹衰退系数A、回报折扣率Y等状态转移时间一样。然而机器人环境交互,这一条件难以达成,为此要更新强化学习方式。

3.2 认知的强化学习模型

结合传统强化学习方法,知识模块可作为中心数据结构,通过状态值表等予以表示,并通过中心控制程序,持续更新数据结构。若以神经网络以表示,可以统一知识、学习过程。但就神经网络而言,设计结构需要一定的技巧,并结合具体任务来设计,同时行动输出、感知输入等要符合马尔科夫特性,通过调整权值的方式,对应实现行动、状态。

3.3 强化学习算法实现

在STAMN中,任一状态行动值,要借助行动、状态节点间权值以表示。对于任一行动、状态节点而言,其在被内部激活后,要更新状态行动值。一旦获得奖励值,不仅作用于前一步已激活的状态行动值,还要反映在多步激活的状态行动值中。对于强化学习方法而言,其本质是局部更新,为此不需任何修改,就能应用在强化学习模型中。

4  结束语

综上所述,出于精准理解环境的目的,在设计机器人时,要考虑触觉、声觉、视觉等传感器,并利用大数据处理、云计算等技术,借助与环境的交互,加强机器人认决策知、理解、感知环境等能力。另一方面,出于精准操作的目的,既要研制新型传感器,也要研制新型执行器,借助决策、认知、学习,改善机器人解决复杂任务能力。此外,在如今的机器人应用,也引入了新的技术,比如增强现实、虚拟现实等技术,并结合多种穿戴式传感技术,横跨知识、虚拟、物理等空间进行学习,同时自主学习人类智能。

参考文献:

[1]陈玲玲,冯琦,马小霞,等.基于深度学习的认知无线电智能功率控制算法设计与实现[J].信息技术与信息化,2019(7):95-97.

[2]孙富春.智能机器人的认知与学习[J].机器人,2019,41(5):561.

[3]孔令龙,田国会.智能家庭中一种基于本体的机器人服务认知机制[J].山东大学学报(工学版),2019,49(6):85-87.

[4]李振,周东岱,王勇.“人工智能+”视域下的教育知识图谱:内涵、技术框架与应用研究[J].远程教育杂志,2019(4):75-77.

[5]王广新,王悦.支持智慧学习的语境化叙事游戏开发与学习效果验证[J].中国远程教育:综合版,2019(10):15-17.

[6]黄敏,路飞,李晓磊,等.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人,2019,41(5):609-619.

[7]王薇,吴锋,周风余.机器人操作技能自主认知与学习的研究现状与发展趋势[J].山东大学学报(工学版),2019,49(6):195-197.

猜你喜欢
智能机器人范式
基于SCP范式的贵州省食用菌产业分析
范式守信不负约
谨言慎行
从教师视角谈“读思达”课堂范式——以“百分数的认识”为例
史上最感人的约饭
工商银行与第四范式正式签约共建银行AI核心系统
人工智能在智能机器人系统中的应用研究
智能机器人实践课程自主创新能力培养研究
人工智能的发展现状及其难点问题分析
“智能机器人”的社会学思考