张晓君,郝一江
(1.厦门大学 哲学系,福建厦门 361005;2.福建省仿脑智能系统重点实验室,福建厦门 361005;3.华中科技大学哲学系,武汉 430074;4.中国社会科学院 哲学所,北京 100732)
“行动或行为(action)”是哲学、心理学、语言学、法学、经济学、历史、文学等人文科学和社会科学,以及计算机科学和人工智能的核心概念[1]1。就自主移动机器人而言:行为就是通过感知信息控制执行过程的算法(algorithm);①算法实际上就是定义良好的计算过程,它取一个或一组值作为输入,并产生出一个或一组值作为输出。即,算法是将输入数据转换成输出结果的一系列计算步骤。我们可以通过基于行为的方法为机器人设计一系列简单行为,这些行为相互协调和协作,从而得到我们所需求的机器人整体行为;把比较简单的行为进行组合就可以得到复杂行为[2]。行为是保证机器人安全运行并成功完成任务的功能模块,每种行为通常都遵循“感知—决策—控制”的架构。按照相关设计,机器人利用传感器信息决定行为是否执行,并结合行为子任务实时规划和计算出运动控制量,并据此控制自身的运行[3]344。
人工智能中推理决策的有关理论和方法是实现行为决策的常用方法。如何综合各种因素,高效地进行行为决策是行为决策层研究的重点。行为决策逻辑是行为决策层的核心,它综合各类信息,最后向行为规划层发出行为指令。一个好的行为决策逻辑是提高系统自主性的必然要求[4]33。本文研究的动态认知行动逻辑和BDI逻辑(即信念(belief)、愿望(desire)和意向(intension)逻辑)是行动逻辑和行为决策逻辑的两个最为重要的分支,其研究成果将直接为行为决策逻辑所运用。动态认知行动逻辑和BDI逻辑的研究属于国内外研究前沿和重点领域,其成果对逻辑学、经济、军事、法律、计算机科学和人工智能等领域都有着重要的理论意义和实践价值,尤其对人工智能领域专家系统中的推理机的开发、多传感器信息融合技术(其实质就是对多源不稳定性信息的分析与综合)的研发、移动机器人目标识别与路径规划,以及机器人行为的自学习研究都有着极其重要的参考价值。这是因为行动(一个程序的执行和调用就是一个行动)在这些领域中无处不在。比如,对机器人而言,“行为”是它所具有的表达能力和行动能力,比如对话、描写、刻画、移动、行走、碰撞保护、避障、操作以及抓取物体等。对机器的拟人行为的研究是人工智能的高难度课题[5]18。
计算机通过执行以某种程序设计语言编写的程序语句的形式来完成行动,并以此改变计算机的内部世界,并通过与外部世界的接口来改变外部世界。行动逻辑提供了关于程序的推理方式,更确切地说,提供了关于程序的执行及其效果的推理方式,这使得我们能够证明程序的正确性。因此,行动逻辑在计算机科学中也发挥着重要的作用[1]7。
人工智能研究领域影响最大的符号主义学派认为:人的智能表现为认知,认知的基元是符号,认知过程则表现为操作过程,所以可以用计算机的符号操作模拟人的智能行为。知识既是信息的主要形式,又是构成智能的基础;因而,人工智能三大核心问题是知识表示、知识推理和知识应用。知识既可用符号表示,也可用符号推理,据此才有可能建立起基于知识的人类智能和机器智能的统一理论体系[6]67。知识表示和知识推理的研究主要是提供对世界的描述方法,并在此基础上提出相应的算法。大致说来,关于世界的知识可以分为事实和规则这两大类。事实用于描述已知的世界状态,而规则主要用于预言外部世界的变化、动作的后果,并从已知的事物演绎未知的事物。
由于从符号处理的角度研究知识的本性太低级,纽厄尔提议在符号处理的上层增加以合理性原则作为其行为法则的知识级。做知识级分析的系统则被称为智能主体(agent,也翻译为“主体”、“真体”、“智能体”,比如人或仿人机器人或具有智能的高级动物都可以视为智能主体),它由动作集、目标集和一个知识体组成;合理性原则把知识、目标、动作联系在一起,而不需要具体的物理关联机制。知识既是知识级处理的媒介,又是合理性原则工作的依据,它使系统能够选择适当的动作去达到目标,从而表现出合理的行为。知识是能力的反映,永远是抽象的。知识并非真实地存在,只能由智能主体的行为来表现。虽然做知识级分析可以确保系统的可行性和总体性能,但是其操作化必须在符号级实现。知识表示就是实现知识级系统向符号级系统归约的方式。可见,作为知识级系统的智能主体并不是计算机系统的操作化模型,而是基于合理化原则的概念设计。在符号级的操作化实现不仅需要定义数据结构(即符号结构),而且需要定义从数据结构抽取知识的处理机制[7]56。
好的知识表示方式有助于智能主体获取和应用感知的信息。常见的知识表示方式有:一阶谓词逻辑、产生式表示、结构化表示。由于一般要求专家控制系统具有可靠性、实时性及灵活性等,所以专家控制系统中的知识表示常采用产生式规则,于是知识库就变成了规则库。规则库是由条件-动作型规则(即所谓的产生式规则)组成的集合。产生式规则(其典型描述为“如果(条件),那么(结果)”)的形式为:“条件单元”→“动作”……若规则中所有条件部分都匹配,则执行动作。推理机则用于重复寻找所有匹配的规则,它选择其中的一种执行动作;执行的结果则是给数据库添加新的内容、删除旧的内容或执行用户编写的程序函数等;新的存储内容又引起新的规则的匹配,推理机就是这样不断地进行匹配的[8]30。换个角度看,推理机就是一组执行程序,它根据数据库中提供的系统当前和过去的动态特征以及动态特征变化数据,利用推理规则,从规则库中寻找合适的控制规则和参数调整规则,给出最合适的控制参数[8]46。笔者对此的理解是:推理机研究的重点和难点是执行动作的激发条件的制定,即条件单元中的规则的制定,也就是说,我们需要弄清成功执行一个动作的前提条件究竟是什么;这也应该是动态认知行动逻辑和BDI逻辑研究的关键。由于条件—动作型规则的条件部分不限于谓词公式(也可以是关系表达式和真值函数),而且动作可以是任何操作(这与规则演绎系统中的右部只能是推理结论有所不同),此外产生式规则可以设置冲突解法,①在一个循环的识别阶段,如果有多于一条的规则被激活,就引起了一个冲突。冲突解法就是基于某种控制策略去选定需要执行的规则。因而条件—动作型规则可以有效控制推理过程,适合表示各种启发式知识,使得事物间的经验性关系得以表征,因此为大多数成功的专家系统所采用[7]25。
近10多年来,主体和多主体(multi-agent)系统的研究已经成为分布式人工智能研究的一个热点,这些研究极大地促进了人工智能和计算机软件工程的发展。主体实际上是一种通过传感器感知环境,并通过执行器作用于环境的智能实体,可以定义为一种从感知序列到实体动作的映射[5]208。主体具有行为自主性、作用交互性、环境协调性、面向目标性、存在社会性、工作协作性、运行持续性、系统适应性和可扩展性、结构分布性、功能智能性等特性。主体强调理性作用,可作为描述机器智能、动物智能和人类智能的统一模型。而且主体的功能具有较高智能,这种智能往往构成社会智能的一部分[5]315。
理想的智能主体是基于知识的问题求解系统,它运用知识作推理,以达到某种目标。智能主体的行为则可理解成无穷的推理循环:感知、推理和行动。每当主体(通过传感器)感觉到外部世界的变化时,就根据自身的信念、目标和关于外部世界的模型进行推理,并决定适当的动作去应答这种变化。所以,主体行为的主要任务就是获取外部世界的模型,并努力保持模型与外部世界的一致性。推理的目的是依据外部世界模型区分出外部世界状态并规划出主体的动作。由于推理仅仅导致主体内部世界模型的改变,故有必要检查内部模型是否与主体动作导致的外部世界变化相一致,所以在主体行为图(即:感知、推理和行动)的基础上应该增加“期望”环节,以便主体做好准备去感知期望的外部世界的变化[7]21。
多主体系统主要研究自主的智能主体之间智能行为的协调,研究智能主体如何为了一个共同的全局目标(包括各自的不同目标)共享知识,进而对问题协作求解[9]104。多主体联合行动的建立可以通过一个二相协议来实现。其第一相确定哪些熟人愿意参加协作并遵从联合负责原则;第二相则是由组织者指派联合行动中每个拟定动作应该由谁去执行以及在什么时刻执行。关于动作执行的时间要求,则是在联合意向的指导下参与者反复进行协商,直到协商全部成功。这时就产生了赞同一致的公共处方,并通过组织者将公共处方通知到所有愿意参与联合行动的主体。开发共享本体,并将共享本体的通信内容翻译为与各主体特有的本体相容的形式是促进各主体间语义互操作、实现信息和知识共享的关键。从哲学的角度看,本体是对“存在”的系统化阐述;而从人工智能的角度看,本体则被视为设计智能系统时建立的世界观,清晰表示的本体实际上是对应用领域概念化的说明。我们可以通过定义由基本术语构成词汇,并用基本术语去合成词汇外延(即领域知识)的法则来建立智能主体协作时的共享本体。共享本体定义了智能主体在相互交换询问和断言时使用的公共词汇,从而避免了建立和维护大型知识库的诸多烦恼,而智能主体经由通信共享知识的机制则可视为共享一个虚拟的公用知识库[7]347-349。
智能主体必须利用知识修改其内部状态(即心理状态),以适应环境变化和协作求解的需要。主体的行动受其心理状态的驱动。人类心理状态的要素主要有认知(信念、知识、学习等)、情感(愿望、兴趣、爱好等)和意向(意图、目标、规划和承诺等)这三种。着重研究信念(belief)、愿望(desire)和意向(intension)的关系及其形式化描述,力图建立主体的BDI(信念、愿望和意向)模型,已经成为主体理论模型研究的主要方向[5]314。
主体技术的研究主要集中在主体行为理论、体系结构和通信三方面。主体行为理论把智能主体定义为有意识系统,这个系统中的主体行为可以通过归因于信念、愿望和理性的方法去预言。智能主体典型的行为模型——BDI逻辑框架是以模态逻辑和可能世界来描述主体的心理状态的。体系结构则主要研究个体主体的构成模块和模块间的交互作用(数据和控制流),并对输入信息(传感器数据和经由通信接收的消息)和当前内部状态如何决定主体的行动加以解释。通信机制则构成支持主体间互操作和协同工作的重要基础[7]15-16。
主体和多主体系统正在崛起,并成为人工智能研究实用化和分布计算环境中软件智能化的重要技术。主体和多系统能够提供所研究的社会和领域的知识,并能够依据心理状态BDI(信念、愿望和意向)自主工作,是具有语义互操作、合作行为和协调能力的软件实体。主体行为理论将主体定义为有意识系统。所谓有意识,是指主体的行为可以通过归因于信念、愿望和理性的方法去预言。经典的一阶逻辑并不适合用来表示涉及意识的观念,因为这会引起语法和语义问题。为了解决语法问题,我们可以引入模态逻辑和元语言;为了解决语义问题,我们可以借助可能世界语义和解释的符号结构[7]346-347。
1971年,Dennet认为,理性主体的行为选择受到其信念和愿望的支配[10]。1987年,Bratman的相关研究为主体行为描述的BDI方法奠定了坚实的基础,他认为意向在所期望的行为选择方面发挥着重要的作用[11]。之后,许多研究者试图使用逻辑的方法对这一理论进行形式化。其中,影响最为深远的是Rao和Georgeff(1991)[12]使用分支时间时态逻辑的方法对BDI主体的形式化研究。他们引入了信念、目标(有时也用愿望来代替)和意向这三个模态算子,并建立带有这些算子所涉及的可能世界之间的可及关系的克里普克模型。并在对不同类型的主体进行建模时,允许加入特定的条件以保持主体的信念、目标和意向的持续性。此后,诸多学者发表多篇论文对他们的理论进行不断完善和改进。例如:Casali等人(2005)[13]在无穷值的 Łukasiewicz 逻辑的基础上对等级(graded)BDI主体进行了建模和实例分析,这为不确定性的表示和推理提供了很好的范例;张晓君等人(2012)[14]把无穷值的 Łukasiewicz逻辑和命题动态逻辑进行融合后对等级BDI主体模型进行公理化,并说明了信念、愿望、意图对主体行为的影响;Pereira等人(2008)[15]通过情感对主体的可适应性和自主性的影响的形式分析,来刻画害怕、自信、焦虑等情感对主体行为的影响,达到对情感BDI主体的行为推理和决策过程进行建模的目的;张晓君(2012)[16]对情感等级 BDI主体模型进行了公理化,清晰地表示了主体的信念、愿望、意图等心理状态以及害怕、自信、焦虑等情感状态对主体的不确定性行为的影响。
与Rao和Georgeff的方法不同,van Linder等人(1995)[17]在对Bratman提出的BDI方法进行逻辑化时则是以动态逻辑而不是以时态逻辑为基础的。他们在动态逻辑的基础系统——命题动态逻辑的基础上增加知识、信念和愿望以及表示执行动作的能力的模态算子,这为动态认知逻辑乃至动态认知行动逻辑的发展提供了诸多可资汲取的养料。
20世纪70年代,为了解决计算机中程序调用与执行方面的逻辑问题,在模态逻辑基础上产生的动态逻辑发展迅速。动态逻辑把程序的输入—输出关系看作是克里普克语义学中的可及关系。作为动态逻辑的基础系统的命题动态逻辑则致力于处理关于主体的行动(更确切地说是程序,因为一个程序的执行和调用就是一个行动)和行动选择的推理。命题动态逻辑对可以解释成基于状态集合上的二元关系的基本行为进行抽象和推理。在命题动态逻辑中,基本行为是初始的,这一特点使得动态逻辑能够在诸多领域中得到应用。例如,当我们把基本行为解释成对相互作用的主体集合的认知状态起作用的行为,则动态逻辑就变成动态认知逻辑[18]91-92。由于主体知识的动态变化可理解为:“知识—行动—新状态—新知识”,其中,对各项知识之间的关系的处理可以由原先的认知逻辑完成,而对“行动—新状态—新知识”的处理则是由动态逻辑处理。认知逻辑与动态逻辑这两种逻辑处理方式的结合催生出了动态认知逻辑[19]77。
如果将动态认知逻辑中的行动定位于公开宣告,则得到关于公开宣告的动态认知逻辑,简称公开宣告逻辑。本文研究的动态认知行动逻辑(Dynamic Epistemic Action Logic)可以说是公开宣告逻辑的扩展或推广,因为“公开宣告”这一认知行动是把相同的信息传达给所有的主体,而认知行动逻辑研究的更为复杂的认知行动则可以把不同的信息传达给不同的主体[20]109。认知行动逻辑研究包括“博弈”在内的更为复杂、更为广泛的认知行动,比如:左转、右转、走路、开或关、观察、玩牌、阅读、可能阅读、可能都阅读、选择、展示、告诉、说悄悄话、传播流言等等。动态认知行动逻辑是对这些认知行动进行模型化的动态认知逻辑,它不仅可以对由外部行动引起的知识变化过程中的推理进行刻画和表达,而且可以刻画由交流行动引起的互动性知识的更新,以及信息流动的整个过程中的知识变化及相应推理。
1977年,Moore在其《关于知识和行动的推理》一文中,提出了行动的“认知前提(epistemic precondition)”的概念,用以表示成功执行一个行动需要的知识[21]。1989年,Plaza建立了第一个公开宣告逻辑系统,在对主体间的知识分布进行了静态描述和认知推理的基础上,对主体之间在交流过程中的知识变化和认知推理进行了刻画,并对不带有公共知识但包含公开宣告的多主体认知逻辑进行了形式化和公理化[22]201-216。1997 年,Gerbrandy和Groeneveld对内省主体的更多宣告形式(如半公开宣告、私下宣告)的研究,为公开宣告逻辑的最终确立奠定了坚实的基础[23]。之后,诸多学者对公开宣告逻辑进行扩展,他们要么在公开宣告逻辑中加入公共知识,要么研究比公开宣告更为复杂的认知行动,这样就使得动态认知行动逻辑得以逐渐形成。
当今国际上,van Bethem、van Eijck、van Dimarsch等是动态认知行动逻辑研究的领军人物。动态认知行动逻辑研究主要有三个方向:
(1)通过对公开宣告逻辑的改进和扩展研究各类认知行动。具体包括:引入相对化公共知识,得出带有公共知识算子的公开宣告逻辑的较为简单的完全性证明(van Bethem,1999)[24];对并发知识行动的语义学研究、对博弈行动的描述(van Dimarsch,2001)[25];对交叉并发行动的逻辑刻画(Kooi,2003)[26];对玩牌博弈的建模(de Lavalette,1999)[27];对流言传播行动的考察(van Dimarsch,2000)[28]等等。
(2)使用基于行动模型的方法分析刻画各种认知行动。具体而言有:Baltag等(2004)[29]在行动模型框架的基础上提出了认知程序逻辑;范艾杰克等人(2006)[30]用行动仿真的概念代替互模拟来研究认知行动;van Bethem等人(2006)[31]对命题动态逻辑做认知解释后提出的交流与更新逻辑,这种逻辑能够表达带有有穷行动模型的所有模型转换运算,为更大范围的信息事件提供了综合分析的方法;van Eijck(2004)[32]对认知更新进行建模,并图示了更新的结果和行动模型。而van Dimarsch 等人(2008)[20]141-174在 Baltag 等人工作的基础上研究了行动模型逻辑,其基本思路和方法是通过刻画动作对知识的影响来完成对动作的处理。这种思路在单主体认知行动逻辑的基础上加入带有公共知识等群体知识的研究即可进入多主体认知行动逻辑的研究。建立行动模型的关键是:在所建立的行动模型中为每个原子行动指派相应语言中的公式作为执行该行动的前提条件,这一前提条件相当于克里普克模型中的赋值。
(3)在认知行动逻辑的基础上增添对认知主体的各种考察因素,从而试图建立自动推理系统。主要研究有 Raimondi等(2004)[33]通过认知模型检验方法来考察对时态的认知的相关研究。Schwarzentruber(2010)[34]在模态逻辑的基础上,研究了单主体和多主体的“务必做到”逻辑,提出了关于行动、知识和偏好的认知博弈模态逻辑,旨在为智能主体建立一个自动推理系统。其基本思路是:把 Pauly(2002)[35]提出的联盟逻辑中的算子〈J〉分解成为“diamond”、“box”、“next”这三个正规算子后,提出“务必做到”逻辑,并在此逻辑的基础上添加“知识”、“义务”和“意向”等算子,以此建立相应的系统;以模态逻辑和博弈论为基础来研究分析智能主体“seeing、knowing、doing”等行动;并使用动态认知逻辑的一些结构对认知博弈模态逻辑进行扩展,从而更好地处理了严格劣策略的重复剔除问题。
通过对上述理论的评述,笔者认为:
首先,现有的各种逻辑体系都无法满足计算机科学和人工智能中精确描述和研究各种各样的不确定性推理的需要,因此逻辑理论的创新成为不可避免的需求。一个好的认知行动逻辑是提高智能系统的可靠性和鲁棒性,①鲁棒性(robustness)就是系统的健壮性,指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性。它是在异常和危险情况下系统生存的关键。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。尤其是自主行为优化决策能力的必然要求。
其次,由于第二部分的BDI逻辑和第三部分的动态认知行动逻辑都是建立在模态逻辑、可能世界语义学和克里普克模型的基础上,通过认真分析比对这两种逻辑,对它们进行取长补短和融合,提出新的逻辑系统,即关于BDI主体的动态认知行动逻辑系统,从而为智能主体的行为表征和不确定性推理提供更好的逻辑基础是完全可能的。建立这种新的逻辑系统的关键是:在所建立的行动模型中为每个原子行动指派相应语言中的公式作为执行该行动的前提条件时,要充分考虑信念、愿望、意向、情感对行动的影响。这一逻辑融合过程,应建立在无穷值Lukasiewicz逻辑(或模糊逻辑)和命题动态逻辑的基础之上,因此该逻辑系统应该是符号的形式演绎和数值计算并存的连续值柔性逻辑系统。其可能的研究难点在于:其一,不同模态算子之间应该如何融合的问题;其二,在逻辑推理过程中如何处理符号的形式演绎和数值计算的问题。
[1]Segerberg K.The logic of action[EB/OL].[2012-05-20].http://plato.stanford.edu/entries/logicaction/.
[2]Jones J L.Robot Programming:A Practical Guide to Behavior-Based Robotics[M].[S.L.]:McGraw-Hill Education(Asia)Co.,China Machine Press,2006.
[3]徐德,邹伟.室内移动式服务机器人的感知、定位与控制[M].北京:科学出版社,2008.
[4]蔡自兴,贺汉根,陈虹.未知环境中移动机器人导航控制理论与方法[M].北京:科学出版社,2009.
[5]蔡自兴,徐光佑.人工智能及其应用[M].4版.北京:清华大学出版社,2010.
[6]张晓峰,贾世祥,柳婵娟,等.计算机科学与技术导论[M].北京:清华大学出版社,2011.
[7]高济.人工智能高级技术导论[M].北京:高等教育出版社,2009.
[8]姜长生,王从庆,魏海坤,等.智能控制与应用[M].北京:科学出版社,2007.
[9]谭建豪,章兢,黄耀,等.数据挖掘技术[M].北京:中国水利水电出版社,2009.
[10]Dennett D C.Intentional systems[J].Journal of Philosophy,1971,68(4):87-106.
[11]Bratman M E.Intentions,Plans,and Practical Reason[M].Harvard:Harvard University Press,1987.
[12]Rao A S,Georgeff M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the 2nd International Conference on Principles of Knowledge Representation and Reasoning,1991:473-484.
[13]Casali A,Godo L,Sierra C.Graded BDI models for agent architecture[C]//Leite J,Torroni P.Computational Logic in Multi-agent Systems.Berlin:Springer,2005:126-143.
[14]Zhang Xiaojun,Jiang Min,Zhou Changle,et al.Graded BDI models for agent architectures based on Łukasiewicz logic and propositional dynamic logic[C]//Wang F L.WISM2012,LNCS 7529.Berlin,Heidelberg:Springer-Verlag,2012:439-450.
[15]Pereira D,Oliveria E,Moreira N.Formal modeling of emotions in BDI agents[C]//Sadri F,Satoh K.Computational Logic in Multi-Agent Systems.Berlin:Springer,2008:62-81.
[16]Zhang Xiaojun.Modeling emotional agents based on graded BDI architectures[C]//volume 0345 of the Communications in Computer and Information Science series.Berlin,Heidelberg:Springer-Verlag,2011.
[17]van Linder B.Actions that make you change your mind[C]//Laux A,Wansing H.Knowledge and Belief in Philosophy and Artificial Intelligence,1995:103-146.
[18]郝一江,张晓君.动态逻辑:关于程序的模态逻辑[J].哲学动态,2009(11):90-94.
[19]唐晓嘉,郭美云.现代认知逻辑的理论与应用[M].北京:科学出版社,2010.
[20]van Dimarsch H.Dynamic Epistemic Logic[M].Berlin:Springer,2008:109,141-174.
[21]Moore R C.Reasoning about knowledge and action[C]//Proceedings of the fifth International Joint Conference on Artificial Intelligence(IJCAI-77).Cambridge,Massachusetts:[s.n.],1977.
[22]Plaza J A.Logics of public communications[C]//Emrich M L.Proceedings of the 4th International Symposium on Methodologies for Intelligent Systems,1989:201-216.
[23]Gerbrandy J D.Groeneveld W.Reasoning about information change[J].Journal of Logic,Language,and Information,1997(6):147-169.
[24]van Bethem J.Update as relativization[EB/OL].[2012-05-20]http://www.illc.uva.nl/lgc/postings.html,1999.
[25]van Dimarsch H.The semantics of concurrent knowledge actions[C]//Pauly M,Sandu G.ESSLLI 2001 workshop on Logic and Games,2001.
[26]Kooi B.Knowledge,Chance,and Change[D].Ph.D.thesis,University of Groningen,2003.
[27]de Lavalette R.The anatomy of epistemic actions[EB/OL].[2012-05-20].http://www.cs.rug.nl/~ grl/pub/anatomy.pdf,1999.
[28]van Dimarsch H.Knowledge games[D].Ph.D.thesis,U-niversity of Groningen,2000.
[29]Baltag A,Moss L S.Logics for epistemic programs[J].Synthese,2004(139):165-224.
[30]van Eijck J.Action emulation[EB/OL].[2012-05-20].http://www.cwi.nl/jve/papers/06/ae/ae.pdf,2006.
[31]van Bethem J,van Eijck J,Kooi B.Logic for communication and change[J].Information and Computation,2006,204(11):1620-1662.
[32]van Eijck J.Dynamic epistemic modeling[EB/OL].[2012-05-20].http://www.db.cwi.nl/rapporten,2004.
[33]Raimondi F,Lomuscio A.Verification of multi-agent systems via ordered binary decision diagrams:an algorithm and its implementation[C]//AAMAS 04,2004:630-637.
[34]Schwarzentruber F.Seeing,Knowing,Doing:Case Studies in Modal Logic[EB/OL].[2012-05-20].Ph.D.thesis,http://www.irisa.fr/prive/fschwarz/publications/thesis.pdf,2010.
[35]Pauly M.A modal logic for coalitional power in games[J].Journal of Logic and Computation,2002,12(1):149-166.