贝叶斯方法在决策分析中的应用

2013-10-20 04:29郭刚正
统计与决策 2013年16期
关键词:后验期望值先验

郭刚正

(中南财经政法大学统计与数学学院,武汉 430073)

1 理论研究

1.1 概述[1]

基本定义:假如已知有一个可观察的随机变量X,它的密度函数(或概率函数)p(x|θ)依赖于未知参数θ,θ∈Θ,此处θ称为参数,Θ称为参数空间。定义一个行动集λ={a}:在对θ做点估计时,取λ=θ;在对θ做空间估计时,行动a就是一个区间,Θ上的一切可能的区间构成行动集λ;在对θ做假设检验时,只含两个行动,接受和拒绝。

损失函数:在Θ×λ上定义了一个损失函数L(θ,a),它表示参数为θ时,决策者采取行动a采用行动所引起的损失。

决策函数:在给定的贝叶斯决策问题中,从样本空间x={x=(x1,…,xn)}到行动集λ上的一个映射δ(x)称为该问题的一个决策函数,所有从x到λ上的决策函数组成的类称为决策函数类,用D={δ(x)}表示。

1.2 后验风险准则

若存在某一决策函数,使得此决策函数在全部决策函数类中具有最小的后验风险,则这个决策函数为后验风险准则下的最优决策函数,也就是贝叶斯决策函数。依据后验风险准则作出的贝叶斯决策可以按照以下步骤。

第一步:后验风险的刻画

对可观察的随机变量X做n次观察,获得一个样本x=(x1,…,xn),若 X=x的密度函数为 p(x|θ),用贝叶斯公式可得在样本给定下,θ的后验密度函数为

π(θ|x)=p(x|θ)π(θ)/m(x),

其中 m(x)为边缘密度函数 m(x)= ∫Θp(x|θ)π(θ)/dθ 。

然后把损失函数L(θ,a)对后验分布π(θ|x)求得期望,记为 R(a|x),有

R(a|x)=Eθ|xL(θ,a)∫ΘL(θ,a)π(θ|x)dθ

R(a|x)即为后验风险。

第二步:最优决策函数的求解

在所有的决策函数类中,我们需要选取某一特定的决策函数,使得后验风险达到最小值。因此,后验风险准则在决策函数上的δ(x)描述即为:给定样本联合密度函数p(x|θ)、参数空间 Θ 上的先验分布 π(θ)、定义在 Θ × λ上的损失函数 L(θ,a)这三个前提的贝叶斯决策问题中,D={δ(x)}是其决策函数类,R(δ|x)=Eθ|xL(θ,δ(x)),x∈x,θ∈Θ是决策函数δ(x)的后验风险,若在决策函数类中存在决策函数δ0(x),使得它在D中具有最小的后验风险,则称δ0(x)为后验风险准则下的最优决策函数。

1.3 抽样信息期望值EVSI

在做决策的过程中,除了总体信息和先验信息之外,需要获取一定的样本信息,而样本信息获取所带来的效益与相应的费用大小关系决定了获取该样本信息的必要性。抽样信息期望值就是来描述这个两者之间的关系。

1.3.1 完全信息期望值EVPI

完全信息是指决策者所获得的信息完全确定一个状态的发生,即在已知完全信息的条件下,事件发生的概率为1。有了完全信息,就能进行最优行动,获取最大效益。一个决策问题有多个状态,第j个状态的先验概率为θj,j=1,…,n。且各状态都有一个完全信息,第ai,i=1,…,m个行动第j个状态的收益为qij。在每一状态中,依据完全信息选取出某一行动,使得该状态下的收益值达到最大,即因此可求得有完全信息时的收益期望值而没有完全信息时,只能按照先验期望准则决策,其收益期望值为两者之差称为完全信息期望值EVPI,是这个完全信息给决策者在收益上带来的增加或者损失的减少。EVPI的计算公式为

而进一步来看,EVPI也可以用损失函数来表示:

其中,Qji为出现θj状态时采取行动ai的收益,ak表示使E0[Q(θ,ai)]取最大时的行动,Qjk表示ak行动下对应的收益矩阵。由收益矩阵可以确定损失矩阵,而完全信息期望值就可由最优行动的先验期望损失来确定和计算了。

1.3.2 抽样信息期望值EVSI

完全信息期望值EVPI表示决策者在能掌握完全信息时的期望损失或期望收益,它是以先验分布为基础的。而在获得样本信息后,在以后验分布为基础的讨论中,我们类似的可以得出完全信息后验期望值。设π(θ|x)为样本x=(x1,…,xn)给定下θ的后验分布,δ(x)为据此后验分布所确定的贝叶斯决策函数,而在δ(x)下损失函数L(θ,δ(x))的后验期望 Eθ|xL(θ,δ(x))称为完全信息后验期望值,记为

后验 EVPI=Eθ|xL(θ,δ(x))

而后验EVPI仍是依赖于样本x的随机变量,用样本x的边缘分布m(x)对Eθ|xL(θ,δ(x))再求一次期望以消除随机性,得到后验EVPI期望值,记为

后验 EVPI期望值 =ExEθ|xL(θ,δ(x))

一般来说,样本信息的获得会增加决策者对状态的了解,决策过程中期望损失会降低,这个减少量就称为抽样信息期望值EVSI。EVSI的计算公式为

其中,ak是先验期望准则下的最优行动,δ0(x)是后验风险准则下的最优决策函数,EVSI即为先验EVPI与后验EVPI期望值的差,即获得样本信息后给决策者带来的收益。

2 实证分析

某公司希望增加一个小额高频资金投资项目。市场经验表明,一年中每千次投资里失败次数θ的概率分布如下表1所示:

表1 一年中每千次投资里失败次数的概率分布

假定每次投资失败,公司平均要付出赔偿款200元。为进行该项目,每年固定成本为10万元。该公司估计,每次投资会产生利润10元,每年可投资10万次,试求完全信息期望值EVPI。与此同时,决策者想从每千次投资中抽取三次进行调查,根据投资失败的次数(用x表示)来决定是否增加该投资项目,求出最优决策函数,并计算抽样信息期望值EVSI。

首先求解完全信息期望值。由题可知,该公司面临两个行动的选择:

a0:不增加该投资项目

a1:增加该投资项目

若选择a0行动,公司利润为0元/年;

若选择a1行动,公司利润为900000~20000θ元/年。

由此可得出利润矩阵和损失矩阵

可计算出a0行动和a1行动的先验期望损失:

在先验期望准则下,a1是最优行动,故完全信息期望值EVPI=54000元/年。

在决策者抽取三次投资行动进行调查时,失败的人数x只可能从0,1,2,3这四个值中取得,所以由{0,1,2,3}到{a0,a1}上的任一映射δ(x)都是一个决策函数。我们通过下面几步计算来确定最优决策函数和抽样信息期望值。

第一步,计算θ的后验分布。因为抽样结果x服从二项分布b(3,θ),即

而根据表1的先验分布π(θ)可以算出x的边缘分布,结果见下表2:

表2 x的边缘分布

由上表2的边缘分布可以算出x值下的后验分布π(θ|x),结果见下表3:

表3 各x值下的后验分布π(θ|x)

第二步,计算各行动的后验期望损失Eθ|xL(θ,a)∑L(θ,a)π(θ|x),结果见下表4:

表4 各x值下各行动的后验期望损失

第三步,定出最优决策函数。根据风险最小化准则,对抽样结果x的每个可能制定最优结果,这样就得到最优决策函数

第四步,计算后验EVPI和后验EVPI期望值。根据上表4的后验期望损失结果可计算出后验EVPI,即为表4中每个x值下的最小后验期望损失,结果为

在x=0时,后验EVPI=52170

在x=1时,后验EVPI=66096

在x=2时,后验EVPI=54140

在x=3时,后验EVPI=42110

而后验EVPI期望值是用样本的边缘分布m(x)对后验EVPI求期望而得。根据表2中x的边缘分布结果,可求得后验EVPI期望值为

ExEθ|xL(θ,δ0(x))=52170×0.8747+66096×0.11956+54140×0.00563+42110×0.0000915=53844.19803≈53844.2

第五步,计算抽样信息期望值。

EVSI=先验后EVPI的期望值=54000-53844.2=155.8(元)

这表明,在每千次投资中随机抽取3次进行调查,根据检验结果x定出的最优决策函数δ0(x)要比抽样前的最优行动减少损失155.8元,也就是抽样给决策者带来的增益。

3 结论

决策者总是希望自己的决策能够更有依据,期望收益更高,期望损失更低,而贝叶斯方法充分利用总体信息、样本信息、先验信息、损失函数,计算最优决策函数与最小后验期望损失,并利用相关指标刻画抽样的经济效益,使得整个决策过程更有说服力。从全文的分析和研究中,我们能够体会到贝叶斯方法在决策中应用时,具有一些很优良的特性:

第一,贝叶斯方法的决策过程是一套完整的体系。从先验分布到后验分布,再借助损失函数,得出最优决策函数,同时可计算抽样的经济效益。这个逐渐融入更多信息的过程形成了决策的完整体系,使决策者能够作出成熟、迅速的判断。

第二,贝叶斯方法使决策具有更小的后验期望风险。用利润函数描述就是后验期望最大化,用损失函数描述就是后验损失最小化。

第三,贝叶斯方法能充分利用各种信息,它尤其重视先验信息利用,收集、挖掘、加工先验信息,使它数量化,形成先验分布,和样本信息结合起来,大大提高了统计推断的质量。

第四,贝叶斯决策能用抽样信息期望值这一指标量化抽样给决策者带来的效益,减少决策中的期望损失,同时,将抽样信息期望值与抽样所需费用相比较就能告诉决策者进行该抽样是否合理。

[1]茆诗松.贝叶斯统计[M].北京:中国统计出版社,1999.

[2]吴喜之.统计决策论及贝叶斯分析[M].北京:中国统计出版社,1998.

[3]James O.Berger.Statistical Decision Theory and Bayesian Analysis[M].New York:Springer-Verlag,2004.

[4]吴海村.管理统计决策分析[M].西南财经大学出版社,1991.

[5]朱金玲.贝叶斯决策分析及改进[J].江苏统计,2000,(6).

[6]刘昊.贝叶斯决策方法在审计中的运用[J].财贸研究,2002,(3).

[7]朱震峰.贝叶斯决策法的应用[J].大原大学学报,2007,8(3).

[8]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.

[9]徐国祥.统计预测与决策[M].上海:上海财经大学出版社,2008.

猜你喜欢
后验期望值先验
一类低先验信息度的先验分布选择研究
一种基于折扣因子D的贝叶斯方法在MRCT中的应用研究*
基于贝叶斯理论的云模型参数估计研究
基于直觉模糊期望值规划和改进粒子群算法的目标优化分配
基于自适应块组割先验的噪声图像超分辨率重建
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
中小学生自信心的培养研究
民众期望值的合理边界
基于平滑先验法的被动声信号趋势项消除
基于后验预测分布的贝叶斯模型评价及其在霍乱传染数据中的应用