吴宏鑫,常亚菲
人工智能是研究用机器描述、模仿、延伸和扩展人的“智能”以及动物智能的技术.人工智能自1956年提出以来,历经60多年的研究发展,取得了很大进展,特别是近10年来,人们以极大热情推动和发展人工智能技术.无论在智能制造、工农业生产、航天航空、航海和国防建设以及智能穿戴、家庭服务、健康服务等各方面都出现了非常可喜的局面.
智能控制是1971年正式提出[1],是人工智能一个极其重要的应用领域.智能控制的基本思想就是把人类智能特征引入到控制系统中或者说在控制系统中引入人工智能技术,使系统具有某种智能的控制能力.智能控制需要人工智能技术,而仅仅研究了人工智能不一定能实现智能控制.
一门新学科新技术的产生往往是由于人们对未知世界探索的好奇心以及社会环境的需要.而学科和技术的发展主要取决于其可满足社会发展的需求、社会客观条件和基础,且其发展能为人类社会带来很大好处.智能控制的产生和发展完全符合上述规律.“智能控制”首先由一部分人研究提出,当时大家感到新鲜,一度很热,然而过不久就渐渐冷下来了,其原因如下:
(1)对智能控制认识与研究的片面性
智能控制的基本目标是解决已有传统控制方法难以对付的复杂系统的控制问题以及控制对象的自主运行问题.智能控制区别于传统控制的基本特征是把人的智能引入控制系统,使其具有人的智能特征.因此,应从智能控制的目标与基本特征来研究智能控制,特别是要引入人的智能,包括人脑思维智能,人眼、耳等感觉智能,人的四肢协调动作的智能.若研究仅局限于控制器算法,则无法取得突破性进展.
(2)前一时期实际工程任务对智能控制需求并不强烈
从传统航天器控制来看,大量航天器控制一般使用传统方法,如PID控制,即能完成90%以上的任务.整个工业中,尤其是我国一般产品生产,其中97%左右PID也能完成.而高水平的航天控制与高质量、节能排污控制,由于各种因素人们重视程度不够,所以对智能控制需求无紧迫性.而现在随着工业自动化进展,从国防上无人机控制到深空探测、智能制造,机器人参加工农业生产,参加人类服务、参加对有危险或人们不愿意干的工作而需要机器人去干的工作越来越多.目前,发展智能控制具有迫切需求.
(3)研究智能控制更需要深入实际,结合实际,解决实际问题
控制领域研究人员如果仅是搞一些算法研究,对实际情况不了解,是很难有成就的.传统控制理论研究过程基本上是找一个数学模型,研究一个控制器,做一些仿真,然后用一个稳定证明的研究思路,这在智能控制中显然是行不通的.智能控制要求控制工程技术人员必须了解实际对象特征、控制要求、实际系统组成、所需信息的来源以及执行机构特性等.
面向新时期的智能技术发展需求,智能控制除了研究各种新的控制算法之外,还必须从系统角度研究“智能”的实现方法.本文将对智能控制系统进行简述并提出一些研究构想.
所谓智能控制系统,即具有人类智慧的控制系统,其可驱动智能机器独立自主地实现目标,控制过程无需人工干预[2].
智能控制系统的本质是仿人或仿智,即宏观结构上以知识和经验为基础的拟人控制系统,其应具备如下几方面能力:
(1)感知和认知的能力,这是智能控制的前提.所谓感知就是能对外界环境和被控对象本身运动、状态的感觉和测量;所谓认知就是能认识所感知事物的外形、质地、运动特征等;
(2)在线规划和学习的能力,这是智能控制的核心.通过学习事物运动规律、抓住事物的主要矛盾和主特征,进行预先规划与学习;
(3)推理决策的能力.可根据控制目标要求和当前状态进行预测、规划、决策,实施有效的自主操作和控制;
(4)多执行机构协调操控的能力,这是智能控制系统具备类人能力的基础.人有手、足等多种执行机构;作为智能控制系统,若实现多目标、多功能、高性能控制,须具备多执行机构协同能力以满足不同需求.
随着科技发展和社会进步,人类对深空深海的探索朝着更远更深的方向发展,对探测器的智能自主需求愈发迫切;绿色高效高质的工业化发展需求日益显著,工业生产过程自动化从单性能指标到多性能指标,从工艺参数控制到高质量控制;恶劣危险的作业环境严重危害人类健康,机器人替代人类完成高危工作的需求与日俱增.深空深海探测、智能制造、智能机器人等领域发展需求迫切,要求控制系统具备在复杂且不确定环境下自主运行和强适应高性能的控制能力,传统控制技术遇到了困难,研究智能控制是自动控制发展的必然趋势.
面向国防建设、深空探测、智能制造、智能机器人领域飞速发展的迫切需求,智能控制作为一门新型学科必将登上科技发展的舞台.解决传统控制方法难以解决的难题,提高社会生产效率,提高人民的生活质量水平是发展智能控制系统的目标和任务,具体而言:
(1)解决已有传统控制方法无法或很难解决的控制问题.传统控制方法面临的诸多难题包括:①不稳定非最小相位系统的自适应控制问题,其广泛存在于飞行器控制系统中;②快变系统的自适应控制问题,例如具有复杂不确定性的高超声速飞行器在快速再入过程中,飞行器呈现动力学快变现象;③分布式控制和多目标协同控制,例如卫星编队、大面积柔性帆板的形状与指向控制等多体集群控制系统.
(2)解决控制系统自主运行问题.例如,航天器自主导航、制导和控制问题;地外星表探测器、环境恶劣的工业系统、健康服务系统等的自主运行问题.美国等国家早在20世纪80年代就开始研究并制定了一系列的支持政策,明确实现“卫星自主化”和无人机参加战争等军事需求.杨嘉墀院士在1995年世界IFAC大会上指出“由于传统控制技术在空间飞行器姿态和轨道控制方面存在问题,各空间国家十多年前就发展智能自主控制技术,对中国来说,发展这项技术更有其必要性”[3].
(3)解决突发事件情况下的可靠运行问题,特别是遇到未预料事件出现情况的控制、决策和处理问题,具备临场决策、自主故障诊断与重构等能力.
对于复杂对象的高性能控制,其智能控制系统结构,一般有三种构型[4]:
(1)集散型
复杂的智能控制系统是由多个子系统组成,各子系统之间有联系也相互独立.一方面,应尽可能独立控制,以防止一个子系统出现故障影响其他子系统;然而它又是一个整体,应保持统一管理与操作.另一方面,控制运行有多个不同阶段,不同状态既可有联系,又可无联系,因而必须有全面统一的规划,其系统结构应采用集中管理、分散控制的集散型.
(2) 多重主从型
根据Saridis三级智能控制的基本原理,针对复杂系统、任务多目标的情况,可根据任务不同采用主从型的多级管理与控制,即主要指挥级承担总任务的规划,分层管理和智能决策;中间级负责系统状态特征识别、分析判断、逻辑推理和决策,并且负责协调、调用、组织各种控制策略以及各种故障的分析与处理.中间级应服从最高级管理,它对最高级是从级,而对具体控制级又是主级.根据系统复杂程度可分为多层中间级;最下层是执行级,这一级负责获取信息、具体控制策略的运行和输出执行.每一级又对上一级服从,对下一级指挥,同时又具有独立工作能力.在系统设计中,最高级可决定采用不同中间级.若最高级出故障,中间级又可升级代替最高级指挥.
(3)人机结合型
实现由规划性预见的决策智能,如Alpha Go早期版本,结合了数百万人类围棋专家的棋谱,形成落子选择器、棋局评估器两个决策大脑,并通过强化监督学习进行自我训练.
智能控制系统作为一类拟人的控制系统,其基本组成包括:感知与认知、规划和学习、推理和决策、诊断与重构以及多执行部件协同.
(1)感知和认知
感知与认知是基于对被控对象和外部世界的认识,形成知识.
1)感知是获取外界信息的手段
感知包含对外界物理和化学量的测量,通过视觉敏感外界环境并进行图像识别;通过嗅觉系统、触觉系统来仿真皮肤的触觉.特别地,对于不能直接测量和获取的信息,可通过智能方法从间接信息推得需要的信息,如电解铝浓度信息的获取过程,这是一般控制系统所不具备的.
2)认知是通过认识所感知事物形成知识
①建立事物特征的知识库
感知到东西存在,但需要认识其是什么东西,运动特征和性质如何.如导弹防御系统,测量出有飞行物,但还必须知道该飞行物是什么东西.若知道对方是导弹,还要知道其运动速度、位置特征等.
如何能认识感知的事物,在智能控制系统中或在计算机中应有这一事物特征的知识存储,即建立所研究对象各种特征的认知库.一个人看到一个物体,若已见过,则很快认识这是什么.如一只小猫,小孩一见就知道是猫,这是因为在小孩脑中已存在一个猫的形状特点,当看到与脑中存储猫的特征相同时,即可知道是猫.
计算机系统必须具有一个很大的存储器,将要研究对象的特征规则,一般离线储存在存储器的各种认知对象的特征库中.此外,还需建立一整套存取与更新规则,并且具有在线实时修改的知识库.如下棋,智能计算机离线存入下棋规则的库,而且在下棋过程中还不断学习与积累新的知识库,按规则形成预测、推理、决策.它比人对规则的运行快,如有一个人不按常规下棋,计算机机器人可能失败,但会记录下失败全过程,并且自动学习新规则库,如下次再遇此人,一般就会胜过此人.
②建立不断学习积累新库新知识的方法
这就是说,除了有一个离线积累的特征库和规则库,同时还要有一个随时运行,可随时修改的库,暂且叫运行知识和规则库.此内容经实践可行就可转入总特征及规则库,如不行再修改.
(2)规划和学习
机器学习是智能控制与其他控制最根本的区别,是智能控制的核心.
1)有一个总体规划及实时修改的规则.智能控制系统必须对控制任务有一个全面规划,要有离线规划和在线实时规划.
2)学习包括事先或离线学习得到各种知识,如控制理论已有知识.控制算法还必须在系统运行中不断学习,修改已有控制算法参数和控制规则,如参数估计就是一种在线学习方法.智能控制的参数估计具有永久保存的能力,不像自适应控制中参数估计过程不保存.
3)研究在线学习的新方法.学习的关键是根据运行数据,提取特征和抓主要矛盾,以此找到优化结果.学习就是要能从大量数据中寻找新知识.目前也有不少学习或深度学习方法,但对实时在线控制还要进一步研究.
(3)推理和决策
为推理决策和控制,还必须要有性能评估和预测,要在运行过程中评价控制性能,并预测可能的未来结果.
在学习和认知的条件下,按已有规则分析推导,再用控制性能评价或修改已有推导规则和决策,以及预测当前的决策和控制将对未来有什么影响.如飞行器返回再入落点预报[5],这是准确回收的关键.
(4)诊断与重构
一个智能控制系统必须有对系统本身故障的自主诊断能力和对系统在线运行过程中的重构能力,否则难以实现自主运行.其方法有离线、在线与离线结合型等.
(5)多执行部件协同
人在复杂行为操控时,会调动眼睛、躯体、四肢等多部位,来完成操控任务.一个智能控制系统亦需具备多个执行部件,并可实现多执行部件间的协同操控,例如,机器人踢足球等.通过多执行机构的有效协同,提高操控的可靠性和操控精度.
近50年智能控制的发展产生了各种智能控制方案,尽管这些方案都是围绕某个具体问题的某一种实现方法,还不像传统控制那样具有系统的理论体系和明确的数学工具,但这些方法的产生为自动控制的发展,为一些实际工程任务的完成起到了很大作用,下面就已发表的几类主要智能控制方案作一些简单介绍[6-8].
(1)分级递阶智能控制.分级递阶智能控制是从系统的整个任务的观点出发,总结了人工智能与自适应控制、自学习控制和自组织控制的关系后逐渐形成的,是智能控制系统最早的控制方案之一.其有两种比较重要的理论,知识基/解析混合多层智能控制和Saridis三级智能控制.
(2)专家控制.专家控制的基本点是在与控制专家的不断交互中获得专业经验,形成控制规则,达到模仿控制专家的操作,这是控制论与专家系统相结合的产物,其中主要代表有J.K.Astrom等提出的专家控制和智能PID控制.
(3)模糊控制.模糊控制系统是以美国控制论专家L.A.Zadeb于1965年提出模糊集和模糊推理为基础,并将此应用于控制系统之中.它的最大特点是无需精确对象模型,是人机结合进行控制的一种较好方式,主要针对系统阶数未知、控制性能要求一般且允许在线调试的控制.
(4)神经网络控制.神经网络是在现代神经科学研究成果的基础上提出来的,把神经网络作为一门学科引入智能控制中来,形成了智能控制的一个分支,即神经网络控制.神经网络具有并行处理机制、学习能力和联想记忆能力,特别地,深度神经网络已在图像、语音识别等人工智能领域广泛应用且效果显著.
(5)基于机理特征构造的控制.基于机理特征构造的控制是根据动力学的机理特征,以及结合人的经验知识,通过对控制规律特征的提取而构造的控制.我们所提出的基于特征模型的黄金分割控制、逻辑微分控制、逻辑积分控制、基于特征模型的双误差自适应控制等即属于这类控制.①黄金分割控制是由全系数自适应控制理论和方法发展的一种新型控制律,该方法基于对象的特征结构,并结合经验知识,选取黄金分割系数作为控制参数,既简单又有极强的鲁棒性,已成功应用于多个实际工程.②逻辑微分的控制原理是需要微分时加微分,不需要微分时能够减少或取消微分.它与一般微分控制律不同之处在于逻辑微分作用是根据设计人员的经验知识对控制动态性能的不同要求而设计的,具有自动增加和减少微分的功能,而一般微分则不具有这种能力.③逻辑积分的原理与逻辑微分类似,可根据当前控制误差的大小自动的增加和减小积分的功能.④基于特征模型的双误差自适应控制是在现有基于估计误差的基础上,引入控制误差来自适应调节特征模型参数,提高系统响应速度的同时,提高控制精度.
(6)基于视觉、触觉等多源感知信息的自主规划与控制.例如,地外天体表面探测器利用多种视觉敏感信息进行自主轨迹规划与避障.
智能控制系统中常用的机器学习算法分为有监督学习、无监督学习和增强学习[9].有监督学习需要外部的指导,由外部信息确定提供样本的时机、性能误差和停机条件.这种算法包括BP算法、遗传算法等.无监督学习无需外部指导,只依赖于局部信息和内部控制.增强学习用于目标、期望输出不明确的情况,是有监督学习的一种.外部信息不像有监督学习那样具有直接作用,而更多地利用外部信息评估系统的状态和性能.目前,增强学习得到广泛研究,并成功用于机械臂控制、任务规划等智能控制系统中.
智能控制系统并非仅依赖于数学模型,而是根据积累的经验和知识进行在线推理确定或变换控制策略,而这些经验和知识反映系统运动状态所有动态特征信息[7].特征模型是对智能控制系统动态特征定量和定性描述相结合的模型,它是针对问题求解和控制指标要求不同,对系统动态特征信息空间的一种划分.
(1)特征建模是最基础的研究
1)智能控制系统五个重要组成部分的共同基础是抓特征.
智能控制系统的五个重要组成部分是感知和认知,在线规划和机器学习,推理决策与控制,故障诊断与重构以及多执行部件协同,其共同基础是研究特征建模.
感知和认知需要建立认知的特征库,在线规划与学习也必须有一个顶层设计与规划,从大量数据中寻找新知识,寻找决定运动性质的规则与特征,要抓住主要矛盾;至于推理决策直接就是利用已掌握的特征和运动规律进行分析推理和决策进行控制;故障诊断的基础是根据系统运行状态的特征来分析和确定故障;多执行部件协同的基础也是根据各部件的特征来进行协同.所以,对系统提取特征的方法和对不同系统的特征提取是一个要共同研究的基础.
2)特征建模是控制理论与控制工程的桥梁.
为实现智能控制的目的和任务,必须要研究特征建模.例如一个高阶参数未知开环不稳定对象,用传统控制理论方法是很难设计出满足性能要求的控制器.
例高阶线性定常参数未知,开环不稳定状态不可测,系统只能量测输出量和控制输入.
像这样一个对象状态不可测,bm,…b0,an-1,…a0未知,开环不稳定,目前如不用特征建模方法是很难设计一个满足性能要求的控制器,而用特征建模方法,问题就很简单.
3)抓特征信息具有最广泛的应用前景.
一个漫画家画人形很快画出一个人,使认识的外人一看就知道是谁,如一条狗一看照片就知道是狗,那么构成狗外形特征是什么?首先要存入数据库,然后利用数据对比方法;又如虹膜识别和脸部识别,都是建立个人的虹膜特征库,脸部特征库,所以提出特征、建立特征模型库是研究智能控制的一个基础研究.
控制系统中的特征建模,即根据不同对象的动力学特征、控制目标、环境特征,建立不同形式的特征模型库,是控制系统要研究的基础问题.
4)特征建模从哲学的角度看就是在复杂事物中抓主要矛盾.
任何复杂对象中运行的主要矛盾和特征是少数,特征模型的确定和提取,是研究问题的思想方法.特征模型形式有数学表示,逻辑语言,图像特征等.
从1992年开始,我们在控制中提出特征建模,特征建模就是将动力学特征、控制性能要求和环境特征相结合建立特征量运动规律,从而解决了高阶参数未知对象的控制器设计方法.特征建模仅仅是抓特征的一种数学描述方法,该方法已在复杂高阶对象控制中取得了成功应用,并起了很好的作用.其实在信息时代,各种信息都必须研究其特征,建立特征模型数学描述形式,提取特征模型中特征量,研究特征模型中特征参数的辨识问题.
(2)进一步深入研究特征模型——自学习
自学习是衡量智能控制系统智能水平的重要标志,它在控制规则知识库与环境互相作用中不断使自己得到改进和完善.
特征模型是一种自学习与自适应的具体方法.人具有自学习和自适应能力,而最根本的是学习.自学习要有知识库,人每次通过学习记在脑中,机器则存入存储装置.知识包括学习的理论知识、实践经验知识、运行的各种现象记录分析、各种调试结果的记录以及实时获取的各种信息.根据这些知识积累,在遇到新问题时,通过分析推理机构决策、拟定采取的新措施并在实验中验证措施的好坏,再做修改.
学习有两种,一种是离线学习,比如学习已有的控制理论、数学等有关知识,并对被控对象特征等了解掌握,将这些离线存入计算机中.另一种就是在线学习,即针对具体对象在控制过程中不断学习、总结、修改已有控制决策.只有这两种学习结合才能起到自学习作用.GIS就是离线和在线学习相结合产生需要的新知识——地图知识,是获得到达目的地的最优路程规划[10].
本文是智能控制系统简述和研究构想,其中有些构想已在进行,有些是理想.随着科技发展和社会需求,不同阶段不同关键问题应有不同的研究,应从基础理论、方法、技术、系统和元部件等研究方面相协调,以建立真正的智能控制系统,为复杂航天控制、复杂工业控制系统提供有益支撑.
致谢:
为纪念杨嘉墀院士诞辰100周年,为他提出的航天器智能自主控制思想,特写此文.
本文吸收了研究团队北京控制工程研究所的研究成果,在此表示感谢.