一种基于辩论的决策方法研究

2011-05-21 00:40漆学田符一行王炎娟
电子设计工程 2011年11期
关键词:论据辩论信念

漆学田,姚 莉,符一行,王炎娟

(国防科技大学 信息系统工程重点实验室,湖南 长沙 410073)

经典决策理论在分析决策问题时通常假定信息是完备的,从而使其在信息不完整、不一致的情况下存在局限性,通常需要假设所有的决策方案是可行的,仅能用于可行候选方案之间的比较而不能对候选方案本身进行深入分析[1]。然而,在复杂、开放、不确定的环境中决策方案的可行性是决策者难以判断的困难问题,如何确定方案的可行性并在此基础上选择用户满意的行动方案是当前学术界研究的热点问题。

近年来,辩论理论(argumentation theory)作为一种新的逻辑推理范例开始应用于辅助决策领域[1-6]。与基于规则的自动决策相比,基于辩论的决策更类似于人类的思辨过程。基于辩论的决策提供了一种新的辅助决策方式,决策是基于论据(argument)和反论据(counter-argument)进行的,论据之间的关系为决策者的分析、判断和选择提供了依据。论据在决策中有两方面的作用:一是作为选取候选方案的依据;二是为已经做出的选择提供解释,因此基于辩论的决策不仅能给出建议的候选方案,同时还能给出决策的理由[2]。辩论理论作为支持常识推理的一种逻辑推理范例,适合于处理信息不完整、不一致条件下的决策问题[7],能为分布式环境下的动态决策问题提供有力支持,同时也扩展了决策支持的应用领域。

本文结合辩论理论和论据模式提出一种新的适用于多属性决策的论据模式,将决策过程划分为用户需求获取、方案可行性论证、方案选优3个不同的阶段,重点分析如何采用辩论理论论证分布式环境下决策方案的可行性问题。本文将方案可行性分析作为决策agent的自我辩论过程,决策agent通过获取不同信息源的信息为决策方案建立支持或反对论据,从而构造论据集合和论据之间的攻击关系,在此基础上计算辩论框架的首选扩展,从中选取可行的候选方案。

1 基于辩论的多属性决策论据模式

在人工智能领域,决策通常被认为是针对行为的推理,即实用推理(practical reasoning)。近年来Katie等人将辩论理论和论据模式结合用于研究实用推理。在文献[7]中Katie等人根据论据模式整理出16个批判问题(critical question),并且对这些批判问题进行形式化表示,详细论述了各个变量之间的关系,为辩论过程中如何实现攻击提供了形式化的理论依据。但该方法在构建关于行为的论据时,每个关于行为的论据只与一个价值相关联,根据单个价值确定论据之间的击败关系,而且没有考虑行为对价值的影响程度,该方法无法用于多个属性对行动方案进行综合评估。因此提出了适用于多属性决策的新的论据模式。

定义1 基于辩论的多属性决策论据模式(Argument Schema for Argumentation-Based Multiple Attribute Decision Making AS-ArgMADM)定义为:

AS-ArgMADM=<W,A,G,Attrs,P,V,E>

W表示世界状态的有限集合;

A是行动方案集合;

G是决策者希望达到的目标的有限集合;

Attrs是用于对行动方案进行评估的多属性集合{c1,c2…cn};

P是定义在上的偏好函数,用于定义决策者在多属性上的偏序关系;

V是建立在行动方案和多属性集合上的价值函数,用于行为的评估,V(A)=f(c1(A),c2(A)…cn(A)),ci(A)(i=1,…n)是指行动方案A在每一个属性上的价值评估;

E是建立在行动方案A和世界状态W之间的三元关系,E(Ri, Ai,Rj)表示在当前世界状态 Ri下执行行为 Ai后达到世界状态Rj。

2 论据及其攻击关系

将论据结构定义为二元组 Arg=<support,claim>,claim 是该论据的结论,support是支持论据结论的依据。从目标实现、世界状态和行为执行后效果3个角度将论据分为3种类型。

2.1 论据分类

定义 2 实用推理论据:PR-Arg=<(R,Act,S,Goal),Act>( R∈W,Act∈A,S∈W,Goal∈G),表示在当前状态 R 下,执行行为Act后达到状态S从而可实现目标Goal,该论据为行为Act的选择提供依据。

定义3 信念论据:表示世界状态的论据,是对世界状态的陈述,其形式为 B-Arg=<Prems,Conc>,按照信念推理的逻辑Prems提供了Conc为真的理由。

定义4 效果论据:表示行动方案执行后的效果,E-Arg=<(R,Act,S),S>(R∈W,Act∈A,S∈W), 表示在当前状态R下,执行行为Act后达到状态S。

2.2 论据之间的攻击关系

信念论据间的攻击关系:信念论据a1=<Prems1,Conc1>,若 b1=< Prems2,Conc2>且 Conc1与 Conc2矛盾则 b1攻击 a1,记为Attack(b1,a1),动态不确定环境下在某一时刻对现实世界状态的认识由于掌握信息的不充分决策agent有时会做出一些假设,而随着对决策问题认识的深入以及后续信息的收集,对先前的判断可能提出质疑。信念论据之间的攻击关系表示对决策所处上下文即世界现状认识上的分歧。

效果论据之间的攻击关系: 效果论据 a2=<(R1,Act,S),S>, 若 b2=<(R2,Act,T),T>,R1⊆R2,T 与 S 矛盾或 S⊆T 且 T中存在决策者不希望出现的状况,则b2攻击a2,记为Attack(b2,a2),表明执行相同的行为方案可能出现相矛盾的状况或在达到希望的状态的同时有负面影响存在,即出现了决策者不希望出现的状态,如在服用某种药物时达到了希望的治疗效果但同时该药物可能有副作用存在。

信念论据对实用推理论据的攻击:信念论据可以对实用推理论据所采用的环境状态进行辩论论证,在信息不确定、不完整的条件下构建实用推理论据时我们很可能会对现实状态进行假设和猜想,而这种假设和猜想不一定是正确的,信念论据可以对环境状态信息起到补充作用。如果实用推理论据为 a4=<(R,Act,S,Goal),Act>, 信念论据为 b4=< Prems,Conc >且 Conc 与 R 矛盾,则 b4攻击 a4,记为 Attack(b4,a4)。

效果论据对实用推理论据的攻击:效果论据可以对行为执行后的效果提出质疑。如果实用推理论据为a5=<(R1,Act,S,Goal),Act>, 效果论据为 b5=<(R2,Act,T),T>,R1⊆R2,T 与S矛盾或S⊆T且T中存在决策者不希望出现的状况,则b5攻击 a5,记为 Attack(b5,a5),表示在当前环境状态执行行为Act达不到预期的目标状态S或在达到希望的状态的同时有负面影响存在。

3 基于辩论的多属性决策辩论框架

定义5 基于辩论的多属性决策辩论框架 (Argumentation Framework for Argumentation-Based Multiple Attribute Decision Making AF-ArgMADM) 定义为三元组 AF-ArgMADM=(Acts,Args,Attack),Acts 是行动方案集合,Args 是上述三种论据的集合,Attack是建立在论据集合上的二元攻击关系,即Attack⊆Args×Args。

在判断论据的可接受性时采用Dung提出的抽象辩论框架[8]中的相关定义。

定义6 论据集 S是无冲突的(Conflict-free),如果 S满足下列条件

¬((∃a)(∃b)((a∈S)∧(b∈S)∧(a,b)∈Attack)

定义7 论据a对论据集S是可接受的当且仅当:

(∀b∈Args)((b,a)∈Attack)⇒((∃c∈S)(c,b)∈Attack)

定义8 论据集S是可容许的 (admissible)当且仅当S是无冲突的且S中的每个论据对S都是可接受的。

定义 9 首选扩展 (Preferred Extension), 辩论框架AF-ArgMADM的首选扩展PE是该框架中的最大 (对集合包含而言)可容许集。

首选扩展是论据的一个一致子集,该集合中的论据受到外部论据的攻击时在内部总能找到一个为其辩护的论据。

定义函数Fpr,返回某一首选扩展的实用推理论据,即:Fpr:PE→2PR-Arg。 (PE 为辩论框架的首选扩展,PR-Arg是辩论框架中的实用推理论据集合)

4 基于辩论的多属性决策过程

基于辩论的多属性决策过程如图1所示。

图1 基于辨论的多属性决策过程Fig.1 Procedure of argumentation-based multiple attribute decision

该过程大致分为3个阶段:

用户需求获取:录入用户的决策目标和多属性之间的偏好关系。

方案可行性论证:获取了用户的决策目标生成实用推理论据,每个实用推理论据对应一个初步的行动方案,此时这些方案的可行性还需论证。通过对实用推理论据的现实状态、行动效果、目标可达性进行辩论论证,生成辩论框架的所有论据,并求取论据和论据之间的攻击关系。

可行方案选优:计算辩论框架的首选扩展,判断首选扩展中是否存在实用推理论据,如果没有实用推理论据,说明目前不存在可行的候选方案;如果首选扩展中存在实用推理论据,每个实用推理论据对应一个可行的候选方案,对每个可行候选方案计算其价值函数,用户根据价值函数对候选方案选优,做出最终选择。

5 应用实例:心脏病治疗

本节通过一个心脏病治疗的例子说明基于辩论的多属性决策辩论框架的应用,该例子取材于文献[2,7]。设计了一个名为ArguDecision的agent为病人提供治疗决策方案。假设患者a要治疗血液粘稠(blood clotting)这种类型的心脏病。a的目标是阻止血液粘稠(prevent_blood_clotting),对决策方案评价的属性为方案的安全性(safety)和费用(cost),用户的偏好为safety≻cost。

ArguDecision拥有一个治疗知识库Treatment KB,包含治疗方案的一些规则,如:

prevent_blood_clotting(P):-reduce_platelet_adhesion(P).prevent_blood_clotting (P):-increase_blood_clot_dispersal_agents(P).

reduce_platelet_adhesion(P):-not contraindicated (aspirin,P),prescribe(aspirin,P).

reduce_platelet_adhesion(P):-not contraindicated(chlopidogrel,P),prescribe(chlopidogrel,P).

increase_blood_clot_dispersal_agents(p):-not contraindicated (streptokinase, P), prescribe (streptokinase, P).

5.1 生成实用推理论据集

决策agent在获取了用户的目标(prevent_blood_clotting)后通过知识库和prolog推理引擎可构造3个实用推理论据,即3个候选方案,如表1所示。

要实现阻止血液粘稠(prevent_blood_clotting)的目标,可通过两种不同的治疗效果来实现:降低血小板粘连(reduce_platelet_adhesion)和增加血液粘稠扩散因子(increase_blood_clot_dispersal agents)。其中,对应前一种效果,有两种治疗途径:服用aspirin或服用chlopidogrel;对应后一种效果可让病人服用药物streptokinase。由于决策agent目前只访问了治疗知识库,还不具有关于患者a是否对某种药物过敏的具体信息,决策agent假设患者a对3种药物不过敏,从而构建了上述的3个候选方案。

表1 实用推理论据Tab.1 Practical reasoning arguments

5.2 对实用推理论据的信念部分的辩论论证

决策agent访问病人病例数据库,进一步获取病人的详细信息,发现病人数据库中患者a有对药物streptokinase过敏的记录,此时可构建信念论据B1:<streptokinase_contraindicated(a), contraindicated (streptokinase,a)>, B1可对 P3关于病人药物不过敏的假设进行攻击,即对R部分的攻击。

5.3 对实用推理论据的行为效果的辩论论证

假设决策agent通过查询病人病例数据库后发现患者a有胃炎病史(history_of_gastritis),而治疗知识库中存在如下规则:

Risk_of_gastric_ulceration(D,P) :-increased_acidity(D),history_of_gastritis(P), increased_acidity(aspirin).

该规则说明如果给患有胃炎的患者服用aspirin,则会提高病人患胃溃疡的风险(Risk_of_gastric_ulceration)。通过该规则可构建效果论据 E1:<(not contraindicated (aspirin, a)∧history_of_gastritis (a), prescribe (aspirin,a), Risk_of_gastric_ulceration (aspirin, a)), Risk_of_gastric_ulceration (aspirin,a)>,由于出现了副作用,是患者不希望出现的状况,因此E1可对实用推理论据P1的效果进行攻击。

治疗知识库中还存在如下规则:

Remove_risk_of_gastric_ulceration(P):-prevent_excess_acidity (P).

prevent_excess_acidity(P):-not contraindicated(proton pump inhibitor,P),prescribe(proton pump inhibitor, P).

该规则说明服用药物proton pump inhibitor会去除患胃溃疡的风险。

决策agent对效果论据E1的行为效果部分尝试进行攻击,通过上述规则,可构建效果论据 E2:<(not contraindicated(proton pump inhibitor,a),prescribe(proton pump inhibitor, a),Remove_risk_of_gastric_ulceration(a)), Remove_risk_of_gastric_ulceration(a)>, E2攻击 E1。

关于药物streptokinase的效果,疗效知识库中存在如下规则:

effectiveness(P, streptokinase, increase_blood_clot_dispersal_agents, 90):-age(P,A),A < 50.

effectiveness(P,streptokinase,increase_blood_clot_dispersal_agents, 30):-age(P,A),A > 49.

acceptable (P, Treatment, increase_blood_clot_dispersal_agents):-effectiveness (P, Treatment, increase_blood_clot_dispersal_agents, E),E > 75.

说明如果患者年龄小于50岁则治疗效果可达到90%,如果患者年龄大于49岁则治疗效果只有30%,而一般在疗效达到75%以上时才考虑使用该药物,查询病人病例数据库发现患者a的年龄为72岁,因此服用streptokinase达不到预期的疗效,可构建效果论据

E3:<(not contraindicated (streptokinase, a)∧age(a,72),prescribe(streptokinase,P), efficacy_of_increase_blood_clot_dispersal_agents<30%), efficacy_of_increase_blood_clot_dispersal_agents<30%>,E3攻击 P3。

5.4 可行方案选优

根据文献[1]中求解首选扩展的算法,可求得上述论据集中一个首选扩展为 PE={P1,P2,B1,E2,E3}, 该首选扩展中实用推理论据为 Fpr(PE)={P1,P2},即得到了两个可行的候选方案,可根据多属性决策的相关方法对两个方案进行比较,从中选取用户较为满意的方案。

本文重点讨论方案的可行性论证,对可行方案的比较可参考多属性决策的相关方法,这里假设两个可行候选方案从安全性(safety)和费用(cost)两个属性对方案进行比较,两个方案在安全性上没有差别,而P2对应的方案花费较高,因此用户偏好于选择P1对应的方案,即服用aspirin,通过分析可知,为了抑制服用aspirin的副作用,还需服用proton pump inhibitor。

6 结 论

本文结合辩论理论和实用推理,提出了一种适用于多属性决策的论据模式。在该模式基础上定义了用于决策的3种论据和论据之间的攻击关系,重点讨论了基于辩论的决策方案可行性论证。文中采用一个医疗决策问题对该框架的应用进行了示例说明。下一步将研究该框架的计算实现以及计算复杂性等问题。

[1]Atkinson K,Bench-capon T,Modgil S.Argumentation for decision support [C]//17th InternationalConference on Database and Expert Systems Applications.Heidelberg,Germany:Springer Verlag,2006:822-831.

[2]Amgoud L,Prade H.Using arguments for making and explaining decisions[J].Artificial Intelligence,2009,173(3-4):413-436.

[3]Bonet B,Geffner H.Arguing for decisions:a qualitative model of decision making [C]//Proceedings of the 12th Conference on Uncertainty in Artificial Intelligence.Morgan Kaufmann,1996:98-105.

[4]Fox J,Glasspool D,Grecu D,et al.Argumentation-based inference and decision making—a medical perspective[J].IEEE intelligent systems.2007(11):34-41.

[5]Merge M.The hedgehog and the fox an argumentation-based decision support system [J].Argumentation in multi-agent systems, 2008, 49(46):114-131.

[6]Dung P M,Thang P M,Hung N D.Argument-based decision making and negotiation in e-business:Contracting a land lease for a computer assembly plant[C]//In:9th International Workshop on Computational Logic in Multi-Agent Systems, Dresden, Germany:Springer Verlag, 2009:154-172.

[7]Atkinson K.What should we do?computational representation of persuasive argument in practical reasoning[D].Liverpool:University of Liverpool,2005.

[8]Dung P M.On the acceptability of arguments and its fundamental role in nonmonotonic reasoning,logic programming and n-person games[J].Artificial Intelligence.1995,77(2):321-357.

猜你喜欢
论据辩论信念
为了信念
央行行长们就应对气候变化展开辩论 精读
发光的信念
恰当使用论据
恰当使用论据
词典引发的政治辩论由来已久 精读
如何赢得每一场辩论
IBM推出可与人类“辩论”的计算机系统
信念
用好论据“四字诀”:准、新、精、美