周广方 魏子晗,3 欧阳良媛 Ngure Mary Muthoni 王晓庄,3
(1 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院,天津 300387) (2 天津师范大学心理学部,天津300387) (3 学生心理发展与学习天津市高校社会科学实验室,天津 300387) (4 天津机电职业技术学院,天津 300350)
描述决策(decision from description)和经验决策(decision from experience)是从决策依据视角划分的两种决策类型。前者是以来自外部的信息为依据,后者是以决策者自身经验为依据进行决策(Hertwig et al., 2004)。已有研究多关注描述决策与经验决策之间的差异(Gurevich, 2017; Hertwig et al., 2004),而现实中,描述决策与经验决策并不具有清晰的界限。人们进行决策的依据往往既受外部信息又受自身经验的影响,而且来自外部的描述信息与决策者的自身经验并不总是一致的。
已有研究考察了描述信息和自身经验的组合如何影响个体决策。研究发现,描述信息与自身经验一致的情况下的行为特点和单独呈现经验时的行为特点相似,因此研究者认为在该条件下个体更倾向于根据自身经验进行决策(Jessup et al.,2008; Lejarraga & Gonzalez, 2011)。Weiss-Cohen等(2018)将任务分为低、中、高复杂性等级,进一步探究了任务复杂性对经验偏好的影响,结果发现在低、高复杂性任务中,个体对于自身经验的偏好更高。Weiss-Cohen等(2016)提出了描述-经验冲突范式,将代表不同收益分布的描述信息和反馈同时呈现给被试,据此可以通过分析被试的选择模式来判断其依据何种信息进行决策。结果发现,在描述信息与自身经验不一致的条件下,个体依然主要根据自身经验进行决策。但是以上研究均存在一个共同的局限性,即仅在获益情境中进行了考察,而未综合考虑损益情境对决策行为的影响。最近的一项研究探究了损益情境对描述信息与经验一致的条件下的概率折扣(probability discounting)的影响,发现随着经验的累积,在获益情境中的概率折扣显著减小;而在损失情境中的概率折扣并未发生显著的改变(Asgarova et al.,2020)。研究者认为在获益情境中概率折扣的减小是经验习得的结果,而在损失情境中概率折扣未出现显著的变化,这似乎暗示了损失情境中的被试较少受到经验的影响。
此外,Kahneman和Tversky(1984)指出不同的信息框架会引发不同的情绪,积极的框架引发积极情绪,消极的框架引发消极情绪。Bodenhausen等(2000)对锚定效应的研究发现,当处于消极情绪的个体对信息做出初步的比较判断时,更多的与初始锚定值相符合的信息可能会被有选择性地获取,因此,消极情绪个体的最终估计值应该比其他人的估计更偏向初始锚定值的方向。在描述信息与经验不一致的情境中,个体在开始阶段只能根据描述信息对选项的收益分布进行初步的判断,之后再根据每次选择所获得的反馈对最初的判断进行调整。基于上述研究,损失情境中的个体可能会产生消极的情绪,导致其选择性加工与初始判断相符的信息,使其对选项收益分布的估计更偏向基于描述信息所做的初始判断。另外,还有研究发现个体在损益情境中对描述信息的真实性判断和对自身经验的信心也存在差异。基于进化心理学的视角,消极的风险信息往往比积极的风险信息更具有价值,因此个体也更倾向于相信消极的风险信息(Siegrist & Cvetkovich, 2001),Hilbig(2012)也发现以消极框架呈现的信息更容易被判断为真实的。另外Lebreton等(2019)发现,在基于经验的重复决策任务中,相较于损失情境,获益情境中被试对自己的选择表现出更强的自信,在该研究中,被试不会接受描述信息,说明他们对自身经验具有更强的信心。基于上述研究,本研究预测相较于获益情境,损失情境中的个体更倾向于根据描述信息进行决策。
因此本研究采用描述-经验冲突范式(Weiss-Cohen et al., 2016),考察损益情境下描述信息与经验不一致对个体风险选择的影响。由于在损益情境下,相同描述信息概率所代表的实际意义不同(例如,在获益情景中,相较于安全选项100%获得2分,风险选项5%获得5分为劣势选项,但在损失情境中,相较于安全选项100%损失2分,风险选项5%损失5分为优势选项),本研究通过研究1a和研究1b分别考察获益情境和损失情境中的个体风险选择特点。研究2在行为数据分析基础上,拟合决策模型参数,探究和比较损益情境中个体风险选择的机制。
研究1a考察获益情境下描述信息与经验不一致对个体风险选择的影响。
2.1.1 被试
从天津两所高校招募131名被试(男性58名,女性73名),年龄范围18~26岁。其中描述信息低于经验45%条件39名,低于经验25%条件33名,高于经验25%条件33名,高于经验45%条件26名。被试均身心健康,自愿参加实验。实验结束后给予被试相应报酬。
2.1.2 实验任务
采用描述-经验冲突范式,被试需在两个选项之间进行选择。在实验中,既向被试呈现描述信息,也通过被试的选择和得到的反馈呈现实际获益的经验,且描述信息与经验不一致。描述信息以文字形式在选项下方呈现。描述信息与经验不一致分为四种条件,如表1所示。选项选择设置样例如图1所示。
表1 研究 1a 实验条件操纵
图1 选项选择设置样例
2.1.3 实验程序
首先,被试阅读指导语。指导语为:“欢迎参加本次实验,屏幕上的两个选项都对应着有一定的概率获得分数,在选项按钮的下方提供了该选项收益概率的信息,每次选择之后还能获得选择的收益结果的反馈。在实验中,你的任务就是选择你认为能够使收益最大化的选项,因为你的得分将会与实验报酬关联。”之后通过10个练习试次熟悉实验流程,然后进入正式实验。在正式实验中,屏幕上呈现两个选项,左侧为安全选项,右侧为风险选项。被试在两个选项之间进行选择,每次选择完成立刻呈现反馈(反馈的内容为:很遗憾您获得0分/恭喜您获得X分,您已累计获得X分)。在正式实验中,各实验条件下的试次数均为140。
使用Eprime2.0编制实验程序,实验在笔记本电脑上完成。具体流程如图2所示。
图2 实验流程图
2.1.4 实验设计
采用单因素被试间设计,自变量为描述信息与经验的不一致程度(高于经验45%、高于经验25%、低于经验25%、低于经验45%),因变量为对风险选项的选择率(R率)。需要注意的是,实验条件之间的差异仅仅在于描述信息不同,在其他方面是完全一致的。基于此,如果不同条件下的被试对选项的选择出现差异,那么这种差异也只能归因为描述信息的不同,说明被试受到了描述信息的影响;反之,则说明被试较少地受到描述信息的影响。
2.1.5 数据处理
参考前人研究,划分组块进行数据分析(Lejarraga & Gonzalez, 2011),每20个试次为一个组块。分别计算各组块的R率及总体的R率,R率的计算方法为:选择风险选项的试次数/总试次数,该值越大代表被试越倾向于选择风险选项。
2.1.6 结果
(1)反应时
各组块的平均反应时和总反应时:组块1,1510±4692 ms;组块 2,508±1166 ms;组块 3,435±929 ms;组块 4,374±673 ms;组块 5,375±606 ms;组块 6,345±661 ms;组块 7,351±873 ms;总反应时,557±1976 ms。
以组块为自变量,反应时为因变量进行方差分析,发现组块对反应时具有显著影响,F(6, 18333)=125.71,p<0.001,η2=0.039,事后比较发现组块1的反应时显著长于其他6个组块(ps<0.001),组块2的反应时显著长于组块6(p<0.001),组块2与组块7的反应时差异边缘显著(p=0.053)。
(2)R率
各条件下R率的平均数和标准差:低于经验45%条件为0.47±0.26;低于经验25%条件为0.52±0.25;高于经验25%条件为0.57±0.25;高于经验45%条件为0.58±0.20。各条件R率如图3所示。
图3 获益情境中各条件的平均R率
以描述信息与经验不一致程度,组块及其交互作用为固定因子,被试差异为随机因子,R率为因变量,使用Bates等(2015)开发的R包lme4建立线性混合模型,使用Fox和Weisberg(2019)开发的R包car获得模型结果。结果发现:描述信息与经验不一致程度[χ2(3)=4.69,p=0.196]和组块[χ2(6)=3.60,p=0.730]的主效应不显著,两者的交互作用不显著 [χ2(18)=16.78,p=0.538]。
研究1a发现获益情境中,描述信息与经验不一致程度对被试的R率未产生显著影响,说明在获益情境中描述信息对个体风险决策的影响较小。
研究1b考察损失情境下描述信息与经验不一致对个体风险选择的影响。
2.2.1 被试
从天津两所高校招募147名被试(男性65名,女性82名),年龄范围18~27岁。其中描述信息低于经验45%条件36名,低于经验25%条件34名,高于经验25%条件40名,高于经验45%条件37名。被试均身心健康,自愿参加实验。实验结束后给予被试相应报酬。
2.2.2 实验任务
除了损益情境发生变化,其他同研究1a。描述信息与经验不一致的四种条件如表2所示。
表2 研究 1b 实验条件操纵
2.2.3 实验程序和实验设计
同研究1a。
2.2.4 结果
(1)反应时
各组块的平均反应时和总反应时:组块1,2244±827 ms;组块 2,768±1229 ms;组块 3,600±953 ms;组块 4,548±1711 ms;组块 5,550±1098 ms;组块 6,429±534 ms;组块 7,418±535 ms;总反应时,794±2835 ms。
以组块为自变量,反应时为因变量进行方差分析,发现组块对反应时具有显著影响,F(6, 20573)=161.88,p<0.001,=0.045,事后比较发现组块1的反应时显著长于其他6个组块(ps<0.001),组块2的反应时显著长于组块4(p<0.05),组块5(p<0.05),组块 6(p<0.001)和组块 7(p<0.001)。
结合研究1a和1b的反应时分析可以发现前两个组块的反应时显著较长,因此其可能是被试获得经验信息,形成选择策略的关键阶段。对于损益情景中前两个组块的反应时进行比较发现,损失情境的反应时显著长于获益情境,t(272.88)=5.02,p<0.001,Cohen’sd=0.60,M获益=1009 ms,SD=733 ms,M损失=1506 ms,SD=916 ms。
(2)R率
各条件下R率的平均数和标准差:低于经验45%条件为0.59±0.22;低于经验25%条件为0.60±0.27;高于经验25%条件为0.43±0.20;高于经验45%条件为0.43±0.25。各条件R率如图4所示。
图4 损失情境中各条件的平均R率
以描述信息与经验不一致程度,组块及其交互作用为固定因子,被试差异为随机因子,R率为因变量进行线性混合模型分析。结果表明:描述信息与经验不一致程度的主效应显著[χ2(3)=17.34,p<0.001]。Tukey事后检验发现,低于经验25%条件下的R率显著大于高于经验25%条件(b=0.17,p<0.05)和高于经验 45% 条件(b=0.17,p<0.05);低于经验45%条件下的R率显著大于高于经验25%(b=0.16,p<0.05)和高于经验45%(b=0.15,p<0.05)。组块的主效应显著 [χ2(6)=62.72,p<0.001]。Tukey事后检验发现组块1的R率显著大于其他6个组块(组块1vs.组块2,b=0.06,p<0.05;组块 1vs.组块 3,b=0.10,p<0.001; 组块 1vs.组块 4,b=0.09,p<0.001; 组块 1vs.组块 5,b=0.09,p<0.001; 组块 1vs.组块 6,b=0.10,p<0.001; 组块 1vs.组块 7,b=0.11,p<0.001),组块2的R率显著大于组块7(b=0.05,p<0.05)。两者的交互作用不显著[χ2(18)=12.74,p=0.807]。
研究1b发现在损失情境中,描述信息与经验不一致程度对被试的R率有显著影响,说明在损失情境中个体更倾向于采用描述信息进行决策。
研究1的结果说明相较于获益情境,损失情境中的个体在决策过程中更加依赖描述信息。但这只是基于行为结果的推测,实际上决策过程中个体依赖描述信息的程度是一个内部变量,无法通过行为直接观察到。而决策模型可以通过模型参数表示不能通过行为直接观察到的内部变量,揭示决策过程的心理机制(高青林, 周媛, 2021)。因此,研究2使用行为数据拟合决策模型,进一步验证研究1的结果,探究损益情境下描述信息与经验不一致影响个体风险决策的心理机制。
“期望价值学习模型”(prospect-valence learning model, PVL)在基于反馈的决策领域被广泛使用(Don et al., 2019)。但该模型只包含经验成分,并未考虑描述信息。如果个体的决策很大程度上是根据描述信息做出的,那么该模型对行为数据的解释力应该较差。“描述-期望价值学习模型”(descriptionprospect valence learning model, D-PVL)将描述信息加入模型中,以考察经验与描述信息对个体风险选择的影响(Weiss-Cohen et al., 2016, 2018)。
PVL模型基于三个假设:(1)通过价值函数评估选择结果;(2)根据学习规则进行期望效用更新;(3)根据选项期望效用决定选择某选项的可能性(Dai et al., 2015)。
首先,价值函数如公式1所示。
rj(t)代表第t次选择j选项的结果。参数α和β分别决定积极和消极价值曲线的曲率。λ(0≤λ≤5)表示损失厌恶程度,该值大于1表示对损失更加敏感。
根据学习规则进行期望更新,该模型使用衰减规则(decay rule)。根据该规则,选项j在第t次选择的经验期望Ej(t)如公式2所示。
φ(0≤φ≤1)代表选项期望值的衰减比例,该值越小表示个体越倾向于根据即时反馈进行决策。δj(t)为虚拟变量,代表第t次选择时该选项是否被选择。
选项被选择的概率通过比例选择规则(ratio choice rule)计算。根据该规则,被试在第t次选择j选项的概率如公式3所示。
θ表示个体选择较高期望值选项的一致性,该值越大表示个体越能够较为一致地选择期望值较高的选项。θ是由参数c(0≤c≤5)决定的:θ=3c-1。
借鉴Weiss-Cohen等(2016)的方法,通过参数ξ将描述信息加入PVL模型中。如公式4所示。
Ej(t)表示j选项的经验期望值。ξ(0≤ξ≤1)的值越大描述信息越会影响人们的风险选择。Dj表示j选项的描述期望值,其计算见公式5。
vjm代表j选项第m个结果,U(·)为价值函数(同PVL模型);pjm代表j选项第m个结果的概率,W(·)为概率权重函数,如公式6所示。
γ(0≤γ≤2)代表对概率的敏感性。γ小于1说明高估小概率事件;相反,则说明低估小概率事件。
使用各被试的行为数据拟合两个模型的参数。即将观察到被试选择序列的概率定义为在整个实验中实际被选择选项的模型预测概率。然后通过最小化似然函数发现对应模型的最佳参数估计值,似然函数见公式7。
n表示选择次数,Pr[Dj(t+1)]代表在t+1次选择时,模型预测选择选项j的可能性,δj(t+1)为虚拟变量。
使用贝叶斯信息准则(BIC)进行模型比较,因为其权衡了模型的准确性和复杂性(Dai et al.,2015)。公式为为模型参数数量,N为行为数据数量。BIC越小,行为数据对决策模型的拟合越好。
使用损益情境的行为数据分别对两个模型进行拟合,共获得四组参数。结果见表3。
表3 最佳拟合参数和平均 BIC
BIC值的比较:获益情境下,D-PVL模型的BIC值大于PVL模型;损失情境下,D-PVL模型的BIC值小于PVL模型。这说明PVL模型较好预测获益情境中的决策,而D-PVL模型较好预测了损失情境中的决策。
D-PVL模型参数的比较:获益情境的参数ξ显著小于损失情境,t(245.88)=-4.02,p<0.001,Cohen’sd=0.50;获益情境的参数c显著小于损失情境,t(263.44)=-2.03,p<0.05,Cohen’sd=0.24;获益情境的参数φ显著大于损失情境,t(276)=3.71,p<0.001,Cohen’sd=0.45。
研究1发现,获益情境中与经验不一致的描述信息对个体的风险选择没有显著影响;而损失情境相反。进一步拟合决策模型发现,在获益情境中PVL模型的BIC值小于D-PVL模型,在损失情境中PVL模型的BIC值大于D-PVL模型。这说明在损失情境中D-PVL模型对行为数据的解释力更强,且损失情境的描述信息权重参数ξ显著大于获益情境。可见,当描述信息与经验不一致时,相较于获益情境,损失情境中个体更倾向于采用描述信息进行决策。
在损益情境中,描述信息与经验不一致对风险决策的影响可从三方面来解释:其一,相较于获益情境,个体在损失情境中更认可描述信息的真实性。Baumeister等(2001)发现消极信息比同等强度的积极信息更能影响个体的认知。Hilbig(2012)进一步发现当信息以消极框架呈现时个体更倾向于认为其是真实的。在本研究中,损失情境下的描述信息是与损失分数这一消极结果相联系的,这可能导致被试对描述信息更高的真实性评估。其二,在损益情境中,个体对经验的自信程度存在差异。Lebreton等(2019)发现在基于经验的重复决策任务中,获益情境中的被试对自己的选择表现出更强的自信。这说明相较于获益情境,损失情境中的被试对自身经验的信心更低,倾向于低估自身经验的可靠性。其三,对反应时的分析发现,损失情境中被试的反应时显著长于获益情境。Glöckner等(2012)认为个体在加工描述性信息过程中会涉及复杂的计算过程,因此对描述信息的加工时间也会更长。因此更长的反应时表明损失情境中的被试对描述信息进行了更加细致、精确的加工。基于以上分析,本研究认为,可能是损失情境中被试对描述信息的深度加工及过度信任,同时又低估自身经验的可靠性,导致其倾向于根据描述信息进行决策。
模型参数的比较发现,损益情境下个体决策的心理机制存在差异。首先,获益情境下的近因参数φ显著大于损失情境,说明损失情境中个体更容易受到最近一次选择结果的影响(φ=0.35)。而在获益情境中个体能够对经验信息进行较为系统的整合(φ=0.61),这可能也是获益情境中被试对自身经验更自信的原因。此外,获益情境下的选择一致性参数c显著小于损失情境,表明损失情境中个体较稳定地选择高期望值的选项,但这并不能说明被试的选择是合理的,因为他们是根据虚假描述信息进行决策。而获益情境下,选择一致性参数较小,可能反映被试对经验信息进行探索的过程,导致其没有遵循期望最大化原则。
本研究结果与强化学习领域神经影像学研究结果可能存在一定相关性。强化学习是指人们利用先前的经验来改善未来选择的结果(Lee et al.,2012),该过程与本研究中经验学习过程较为相似。以往研究发现纹状体在强化学习过程中的重要作用,如属于纹状体一部分的尾状核已被证明与学习和记忆有关,特别是在反馈结果的处理方面(Packard & Knowlton, 2002)。还有研究发现在强化学习过程中,学习者的背侧和腹侧纹状体均表现出了稳健的判断错误信号(Schonberg et al.,2007),说明在决策者可能在出现错误时激活此区域对学习信息进行整合。同时,有研究发现损失情境中纹状体的激活程度显著低于获益情境(Dong et al., 2014; Tom et al., 2007)。基于上述研究,推测本研究中损失情境中的决策者更倾向于根据虚假描述信息进行决策的原因在于其纹状体的激活水平更低,导致他们未能对经验信息进行有效的学习(这也与本研究损失情境中的被试更加容易受到即时反馈的影响,未能对经验信息进行整合的现象一致),因而只能根据虚假的描述信息进行决策。
本研究存在以下不足。第一,本研究被试均为大学生,未能对老年人在本实验条件下的决策特点进行研究。目前,世界上老年人口最多的国家是中国(项鑫, 王乙, 2021),而以往研究发现老年人的风险决策与年轻人存在很大的差异(张力元 等, 2015),因此未来探究老年人在本实验条件下的决策特点具有现实意义;第二,本研究只是从行为和心理机制层面揭示了损益情境对个体决策的影响,未能对其神经基础进行探究,因此未来研究可以以强化学习领域研究发现的纹状体等脑区为兴趣区,对其脑机制进行探究。
相较于获益情境,损失情境中的个体更大程度地采信描述信息进行决策;且在损失情境中个体的决策更容易被最近一次的选择结果影响。