信念-愿望-意图理论及其形式化研究

2015-04-11 03:34张晓君
关键词:意图算子信念

林 颖,张晓君

(1.宁德师范学院经济管理系,福建 宁德352100;2.四川师范大学政治教育学院,成都610066)

信念-愿望-意图理论及其形式化研究

林 颖1,张晓君2

(1.宁德师范学院经济管理系,福建 宁德352100;2.四川师范大学政治教育学院,成都610066)

从Bratman(1987)的信念-愿望-意图理论出发,考察了该理论在逻辑中的形式化,比如Cohen和Levesque(1990)的BDI逻辑。Bratman认为:信念、愿望和意图在人的行为中扮演着重要的作用;意图不仅仅是一个愿望,而且是主体不会轻易放弃的承诺;意图具有惯性,而且是进一步实际推理的一个输入;为了对信念、愿望和意图加以区分,他引入了“前态度”的概念。Cohen和Levesque(1990)的BDI逻辑给出了Bratman(1987)的信念-愿望-意图理论的形式语义,行动、时间、信念和偏好在此逻辑中占据着重要地位。

信念;愿望;意图;偏好;BDI逻辑

做知识级分析的系统称为主体(Agent),比如:人、具有智能的高级动物和仿人机器人均可视为A-gent)[1]。主体强调理性作用,是描述人类智能、动物智能和机器智能的统一模型[2]。在理性主体的设计过程中,信念(Belief)、愿望(Desire,或目标)和意图(Intention①)所扮演的作用,哲学界和人工智能界的学者已经有了深刻的认识。大多数哲学理论认为,意图可以化归成信念和愿望。而 Bratman(1987)坚信,在实际推理的过程中,意图扮演着重要而不同的作用,并提出了意图规划理论(planning theory of intention),把意图看作是行为的部分规划;认为在社会生产实际中,这些规划支持我们的日常活动随着时间的推移进行动态推理[3]。这为BDI(Belief-Desire-Intention,简称BDI)逻辑的形成和发展奠定了坚实的哲学基础,并对人工智能产生了广泛的影响。在经济学方法论领域,与信念-愿望-意图(BDI)理论十分相似的有A.罗森伯格提出的信念-行动-愿望(简称BAD)理论。该理论认为:经济预测与主体的信念、行动和愿望的意向性解释有关[4]。如果任一主体x的愿望是d,并且x相信“在当时情况下,如果采取行动a就能够实现愿望d”,那么x就会采取行动a。

一 Bratman的信念-愿望-意图理论

Bratman(1987)从民俗心理学理论的角度,解释了信念、愿望和意图是如何影响人类的行为决策和推理。当人工智能领域的学者把他的理论实际应用到人工主体时,就导致了面向主体的新的计算范例的程序设计技术的诞生。

信念和愿望在影响人类行为决策和推理的过程中起着重要的作用。Dennett(1987)[5]认为,作为理性主体的实体的行为选择,似乎受其信念和愿望的操控。为了更为全面地理解人类实际行为推理,Bratman认为有必要引入意图这一概念。意图不仅仅是一个单纯的愿望,而且还包含了主体不会很快放弃的承诺(commitment)。例如,一个主体的愿望是:能够在北京大学做报告,这仅仅是一个单纯的愿望,她不一定为了这个愿望而采取实际的措施,可能她受限于自身的条件(比如她连大学都没有上过)。但如果一个主体有了明天要在北京大学做报告的意图,这就不仅仅是个单纯的愿望,她会采取实际的措施,并制定计划来实现这个意图(比如:取消其他计划,或者确保笔记本已经装在包里),除非特殊或意外情况发生,导致她取消这个意图,不然她明天将在北京大学做报告。

Bratman把注意力集中在面向未来的意图,这类意图有别于面向当前的意图。面向未来的意图伴随着主体的行动,更确切地说,伴随主体的意图行动(intentional actions)。为了对信念、愿望和意图加以区分,Bratman引入了前态度(pre-attitude)的概念。前态度就是对主体行动起激励作用的心智态度。愿望和意图都是前态度,而信念则常常不是。意图是对行为进行控制的前态度,而通常的愿望仅仅对行动有着潜在的影响。涉及未来导向意图的承诺意愿大小,则是由意图的行为控制特性决定的,作为行为控制的一个前态度,意图常常涉及到对行动的一个特别承诺,而通常的愿望则没有[6]。

除了把意图等同于行为控制的前态度外,Bratman认为意图还具有别的性质:意图具有惯性(inertia),而且是进一步实际推理的一个输入。意图的惯性是指,意图抵制对其进行再思考,一旦一个意图形成(而且对行动的承诺也已经形成),意图通常会保持其完整性直到行动时间到来。即:意图具有稳定性或惯性。意图会对进一步的行动决策和推理产生影响,意图的精炼(对更具体行动的意图)也会起作用[6]。例如,一个主体有了明天到北京大学做报告的意图后,可以形成开车去北京大学做报告这样更为具体的意图。有了这第二个意图后,考虑去北京大学的火车时刻表就不再合理,但在第一个意图之后,这么考虑则是合理的。这就导致我们把意图看成是,不同于信念和愿望的独特的心智状态。先前的意图和计划决定了待选项是否通过。意图的这一特性就要求意图和信念具有一致性:意图是相对主体相信为真的世界而言的。

Bratman认为,意图与计划(plans)具有内在联系:计划就是意图。它们都具有意图的特性:它们抵制对其进行再思考、具有惯性;它们都是行为的操控者,而不仅仅是行为的影响者;它们都为进一步的实际推理和规划(planning)提供关键输入。但与简单意图相比,它们显得更为复杂:从不完全的意义看,简单意图仅仅是意图和计划的典型部分。典型情况是,主体有做某件事情的部分计划,之后再考虑计划的细节。意图和计划具有等级结构:关于目的的计划嵌套了关于手段的计划和初始步骤,更一般的意图则嵌套了更具体的意图[6]。

总之,Bratman认为,面向未来的意图具有如下特点:(1)意图是更高级别的计划;(2)意图引起深思并激发计划,意图常常会导致对更高级别的计划的精炼,从而得到更加具体的计划;(3)意图伴随着为实现该意图的承诺;(4)仅仅在如下几种情况下,主体才会放弃其意图:意图已经实现,她相信该意图不可能实现,为了有利于另一个意图[5]41-43。

Bratman的信念-愿望-意图理论仅仅是个半形式化系统,此理论给出了信念、愿望和意图这些基本概念,并说明了它们之间的关系,但并没有给出它们的形式语义。之后有多位学者在对其进行形式化的基础上,得到了相应的信念-愿望-意图逻辑。其中,代表性的主要有:基于线性时态逻辑的Cohen和Levesque(1990)[7]的BDI逻辑、基于分支时间时态逻辑的Rao和 Georgeff(1991)[8]473-484的 BDI逻辑、基于动态逻辑的KARO逻辑框架[9]103-146以及基于务必做到(seeing to it that)逻辑的 BDI逻辑[10][11]。Cohen和Levesque以及Rao和Georgeff这两篇论文因为其极高的引用率,分别于2006年和2007年获得了IPAAMAS奖——自主(autonomous)主体和多主体系统的影响文章奖。限于篇幅,本文只讨论Cohen和Levesque(1990)的BDI逻辑,并重点论述其对时间和行动的处理。

二 Cohen和Levesque对时间和行动的处理

Cohen和 Levesque(1990)试图实现 Bratman(1987)的哲学分析模型,他们以线性时态逻辑和可能世界语义学为基础,研究了信念、目标、持续目标、意图以及理性的逻辑表达和演算。

在Bratman的意图理论中,信念、愿望、时间和行动都扮演着重要的作用,因此,该理论的逻辑分析就会涉及到对信念逻辑、愿望逻辑、时间逻辑和行动逻辑的融合。信念、时间和行动在 Cohen和Levesque(1990)的逻辑中占据着基础地位,但对愿望的概念有所忽视[6]:他们的逻辑是基于现实偏好(realistic preference)这一概念之上的。现实偏好是指,主体根据其信念对其可实现性进行了过滤的愿望。因此,信念蕴涵现实偏好:如果主体相信φ为真,那么她也必须偏好φ为真。虽然在未来某个时刻,主体可能偏好φ为假。这样,就使得意图的概念可以化归成信念、现实偏好、时间和行动的概念。即,可以根据后面四个概念来定义意图的概念[6]。

Cohen和Levesque(1990)的逻辑是命题动态逻辑(Propositional Dynamic Logic)的线性版本。线性命题动态逻辑的语义允许解释线性时态逻辑(Linear-time Temporal Logic)。

1.标准的命题动态逻辑

标准的命题动态逻辑不是关于行动而是关于事件(event)的逻辑,它有一个原子事件名称的集合E。Cohen和Levesque把主体添加其中,并提供了Agent版本的命题动态逻辑。令T是主体的集合,i、j等表示主体,且i、j∈T。那么,原子行动就是E×T的元素。原子行动记作:i:e,其中,原子事件e∈E,且i∈T。通过使用模态算子Possα(其中α是一个行动)、原子公式、原子行动,就可以表示命题动态逻辑语言中的公式。Possαφ的意思是“存在行动α的一个可能执行,且执行行动α之后φ为真”。这一意思的确立,就允许标准的命题动态逻辑存在行动α的几个可能执行,从而可对不确定性行动进行表示和推理[6]。

而存在量词Possα是作用在行动α的执行上,其对偶模态算子是全称量词Afterα。而且Afterαφ≡def¬Possɑ¬φ。当φ为真(用“┬”表示)时,Possα的意思是“α是可以执行的”;而当φ为假(用“⊥”表示)时,Afterα⊥的意思是“α是不可以执行的”。

命题动态逻辑的语义是建立在转换系统(transition systems)之上的,其中原子行动i:e被解释成“边(edges)”的集合[6]。这种转换系统是一个偶对(couple)〈W,R〉,其中W是一个非空的可能世界的集合,R把每个行动α映射到相对于可能世界的一个可及关系Rα⊆W×W上。从可能世界w到被行动α标记的可能世界u的“边”的意思是:在w中执行行动α,u是当行动α被执行后的一个可能输出结果的世界。所有这些α“边”组成的集合就是解释行动α的可及关系Rα。

把命题变元的集合Φ中的原子公式p,映射到它们的执行V(p)⊆W(即映射到p在其中为真的世界V(p)的集合中)的一个赋值V,与一个转换系统一起,就构成了一个命题动态逻辑模型〈W,R,V〉。此模型可以对公式指派真值。特别地,如果存在Rα中的一个偶对〈w,w′〉,使得φ在世界w′中为真:

M,w⊧Possαφ,当且仅当存在 u∈W,使得wRαu且M,u⊧φ

那么我们就说,Possα在世界w中为真。因此,公式Possαφ是表示能力(ability)的弱概念,即:行动α可能出现,之后φ可以为真。

2.线性的命题动态逻辑

或许是Cohen和Levesque(1990)首次采用命题动态逻辑,对实际主体进行建模,其模态词是在线性(linear)命题动态逻辑中解释的。在这种模型中,对每个可能世界w而言,最多存在一个与w时间相关的后继世界u。连接w与u的可及关系可能被几个原子行动标记。更形式化地说,如果对每个可能世界w∈W而言,〈w,u1〉∈Rα1且〈w,u2〉∈Rα2,而且有u1=u2,那么我们就说,转换系统〈W,R,V〉是线性的。从可能世界w到被行动α标记的可能世界u的“边”的意思是:在w中执行行动α,u是当行动α被执行后的输出结果的世界。这就允许我们可以同时执行两个不同的行动,但它们必须导致相同的结果世界。线性命题动态逻辑的模型属于线性转换系统类[6]。

我们用Happαφ表示实际行动模态算子,意思是:行动α将要被执行,之后φ为真。而前面的弱概念Possαφ则是表示可能行动的模态算子。正如Afterα是Possα的对偶一样,我们把IfHappα定义成模态算子 Happα的对偶,并规定:IfHappαφ≡def ¬Happα¬φ。Happαφ表示行动α是可执行的,之后φ为真;IfHappαφ表示,如果行动α是可执行的,那么之后φ为真,因此,前者蕴涵后者。Happα的真值条件是:

M,w⊧Happαφ,当且仅当存在 u∈W,使得wRαu且M,u⊧φ。

这与Possα的真值条件几乎一样。只不过为了更好地适应这种模型的线性,我们改变了模态算子的名称而已。线性命题动态逻辑模型具有这样的公理模式:

(Happi:e┬∧Happj:e′φ)→Happi:eφ

除了原子事件,命题也有诸如序列和非确定性复合(sequential and nondeterministic composition)、测试和迭代等复合事件。

Cohen和Levesque逻辑有时间算子:“eventually”(最终、终于,用◇表示)、“henceforth”(从今以后,用▽表示)、“until”(直到……才,用∪表示)。这些算子可以在线性命题动态逻辑的模型中作各种解释[6]5。例如,我们可以给出算子“eventually”这样的真值条件:

M,w⊧◇φ,当且仅当存在一个整数n,并存在w1,…,wn∈W,使得w1=w,对某个αk,〈wk,wk+1〉∈Rαk且M,wn⊧φ。

把事件e上的算子存在∃与动态算子Happi:e进行融合,可以表示行动上的存在量词,其真值条件为:

M,w⊧∃eHappi:eφ,当且仅当存在 e∈E,u∈W,使得〈w,u〉∈ Ri:e且M,u⊧φ。

三 Cohen和Levesque对信念和偏好的处理

Cohen和Levesque(1990)对信念的定义的论述遵循了通常的标准,而对偏好的论述则利用了强现实偏好这一有些特别的概念。

1.信念

对每个主体i而言,可以用B表示信念模态算子;这些算子的逻辑就是标准的信念KD45模态逻辑。如果把可及关系Beli添加到线性命题动态逻辑中,就可以解释这些算子[6]。 世界Beli(w)={u:〈w,u〉∈Beli}的集合是指,在世界w中对主体i而言可能的世界集合,这些世界与主体在w中的信念一致。

KD45中的可及关系满足持续性(seriality)、传递性和欧几里得性(Euclideanity):

(1)持续性:对每个w∈W,至少存在一个u∈W,使得〈w,u〉∈Beli。

(2)传递性:如果〈w,u〉∈Beli且〈u,v〉∈Beli,那么〈w,v〉∈Beli。

(3)欧几里得性:如果〈w,u〉∈Beli且〈w,v〉∈Beli,那么〈u,v〉∈Beli。

这些约束条件使得公理D、公理4和公理5有效:

(4)信念的一致性公理D:Bφ→¬B¬φ

(5)正内省(positive introspection)公理4:Bφ→BBφ

(6)负内省(negative introspection)公理5:¬Bφ→B¬Bφ

2.偏好

Cohen和Levesque认为,意图就是特别强烈的现实偏好。强现实偏好是指,对一个主体而言的可能的世界中,存在主体偏好的一个子集。对每个主体i而言,可以用Pi表示偏好模态算子,公式Piφ的意思是主体i选择φ为真。从信念逻辑蕴涵偏好这一意义来看,这一偏好概念具有强现实性。从语义上讲,可以用可及关系Prefi使得Prefi⊆Beli来表示强现实偏好。即:一个与主体i的偏好一致的世界,不能够与主体的信念相冲突[6]。换句话说,在世界w中,主体只能够在其可能认知到的世界中选择其偏好世界。

四 Cohen和Levesque的行动、时间、信念和偏好逻辑

行动、时间、信念和偏好逻辑语义框架是一个四元组M=〈W,R,Bel,Pref〉,其中:W是一个非空的可能世界的集合;R:(T×E)→W×W把行动α映射到可及关系Rα上;Bel:T→W×W把主体i映射到可及关系Beli上;Pref:T→W×W把主体i映射到可及关系Prefi上。这一框架满足这样的约束条件:Beli具有持续性、传递性和欧几里得性;对每个i∈T而言,Prefi⊆Beli。与通常一样,在框架中添加把原子公式p映射到它们的执行V(p)⊆W中的赋值V:Φ→2w,就得到框架 M=〈W,R,Bel,Pref〉对应的模型,此框架的有效性和可满足性的定义如常[6]。

1.意图的定义

Cohen和 Levesque(1990)通过定义级联(cascade)的方式定义了一个意图模态算子[6]:

(1)如果主体i偏好φ将最终为真,并相信 φ目前为假,那么 φ就是主体 i的达成性目标(achievement goal),记作 AGi,即有定义:AGiφ≡defPiFφ∧B¬α。

(2)如果主体i有一个要达成的目标φ,并且将坚持这一目标直到φ要么被实现,要么被相信成不能实现,那么φ就是主体i的持续性目标(persistent goal),记作 PGi,即有定义:PGiφ≡defAGiφ∧(AGiφ)∪(Bφ∨B(▽(¬φ)))。

(3)如果主体i有一个持续性目标φ,并且相信通过她的行动能够达到φ,那么我们就说,主体i有意图φ(记作Iφ)。这就要求通过融合算子(fused operator)对事件进行量化的方式对i的行动进行量化,即:Iφ≡defPGiφ∧B◇∃eHappi:eφ。

2.意图的一些有效原则和无效原则

Cohen和Levesque(1990)的结果保证了几个我们想要的性质,并避免了不想要的性质[6]。比如:(1)主体i意图φ,逻辑蕴涵主体i相信φ,即:Iφ→Bφ;(2)公式模式 B(φ→ψ)→(Iφ→ Iψ)无效,即:主体i意图φ,并且i相信φ蕴涵ψ,并不能逻辑蕴涵i意图ψ。这一性质很重要。例如:主体i想去拔牙,并相信拔牙会引起牙疼,但主体i肯定不想去挨疼。

3.持续性目标的简化定义

Cohen和Levesque最初的定义,允许主体为了某些更重要的目标,而放弃一个持续性目标。其简化定义[6]是:PGiφ=defAGiφ∧(AGiφ)∪(Bφ∨BG ¬φ∨ψ)。其中ψ表示其他原因的未指定条件。

综上所述,BDI逻辑的基本概念来源于Bratman的信念-意图-愿望理论。该理论认为信念、愿望和意图在影响人类行为决策和推理的过程中起着重要的作用;并把注意力集中在伴随着主体行动的面向未来的意图。其特点是:意图是更高级别的计划;意图引起深思并激发规划;意图伴随着为实现该意图的承诺;引入对主体行动起激励作用的前态度,可以对信念、愿望和意图加以区分;意图具有惯性,而且是进一步实际推理的一个输入。Cohen和Levesque(1990)试图实现Bratman(1987)的哲学分析模型:以线性时序逻辑和可能世界语义学为基础,使用信念、现实偏好、时间和行动的概念,通过定义级联的方式定义了意图模态算子,研究了信念、目标、持续目标、意图以及理性的逻辑表达和演算;其逻辑是命题动态逻辑的线性版本。他们的工作为后续BDI逻辑及其扩展逻辑的发展奠定了坚实的基础。

注释:

①这里需要说明的是:虽然在心灵哲学和语言哲学等领域中,intention多译为“意向”,但在人工智能领域,intention多译为“意图”。

[1]张晓君,郝一江.基于行动逻辑的智能主体行为表征研究[J].重庆理工大学学报(社会科学版),2013,(1):13-18.

[2]张晓君.等级BDI逻辑:关于行为表征的柔性逻辑[J].哲学动态,2013,(1):102-107.

[3]BRATMAN M E.Intentions,Plans,and Practical Reason[M].Harvard University Press,1987.

[4]陈群,桂起权.经济学究竟是严密自然科学还是行为科学——A.罗森伯格经济学哲学思想解读[J].经济评论,2011,(5):5-11.

[5]DENNETT D C.The Intentional Stance[M].Cambridge,Mass.:MIT Press,1987.

[6]MEYER J J.Ch et al.BDI logics[EB/OL].[2013-02-18].http://www.cs.uu.nl/docs/vakken/iag/jj.BDI.

[7]COHEN P R,LEVESQUE H.Intention is choice with commitment[J].Artificial Intelligence,1990,(3):213-261.

[8]RAO A S,GEORGEFF M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the2nd International Conference on Principles of Knowledge Representation and Reasoning.1991.

[9]VAN LINDER B,et al.Actions that make you change your mind[C]//LAUX A,WANSING H(eds.).Knowledge and Belief in Philosophy and Artificial Intelligence.1995.

[10]CHELLAS B F.On bring it about[J].Journal of Philosophical Logic,1995,24:563-571.

[11]HORTY J F.Agency and Deontic Logic[M].Oxford University Press,2001.

[责任编辑:张 卉 ]

B815.3

A

1000-5315(2015)01-0005-05

2014-10-08

教育部人文社会科学研究规划项目“基于 BDI(信念、愿望和意图)逻辑的慎思 Agent的行为决策研究”(13YJA72040001)。

林颖(1963—),女,福建福清人,宁德师范学院经济管理系教授,主要研究现代逻辑等;

张晓君(1970—),女,四川南充人,逻辑学博士,四川师范大学政治教育学院副研究员,主要研究现代逻辑。

猜你喜欢
意图算子信念
原始意图、对抗主义和非解释主义
陆游诗写意图(国画)
为了信念
拟微分算子在Hp(ω)上的有界性
制定法解释与立法意图的反事实检验
各向异性次Laplace算子和拟p-次Laplace算子的Picone恒等式及其应用
发光的信念
一类Markov模算子半群与相应的算子值Dirichlet型刻画
信念
Roper-Suffridge延拓算子与Loewner链