郭振华 上海对外经贸大学金融学院
本文受国家自然科学基金面上项目(71173144)的资助。
在行为保险学系列(三)(四)的《风险判断偏差与非理性保险决策》中笔者已经提出,保险消费者的风险判断主要依赖感性的直觉思维和经验判断,而不是像经典经济学理论所预期的那样主要依赖理性的基于统计数据的风险评估。而且,保险消费者主要依赖“可得性启发式”进行风险判断,进而以可得性启发式为基础或公理,推导出个体对小概率保险风险的风险判断规律为“多数人低估、少数人高估”,进而得到“多数人低估保险价值、少数人高估保险价值”的结论,这对解释保险需求疲弱有重大的理论意义。
保险消费者的风险判断主要依赖感性的直觉思维和经验判断,判断结果是主观的,可以称为“主观风险”。行为保险学系列(三)(四)中关于“风险判断偏差与非理性保险决策”直接使用了主观风险的研究成果“系统1和系统2”和“可得性启发式”来阐述保险消费者风险判断的主观性。文章发表后,不少读者就“主观风险”这一议题提出各种问题,希望有更深的讨论。
为此,本文对主观风险的相关研究进行梳理和综述,着力于厘清这些理论是否以及如何适用于保险风险的主观判断,并将保险风险判断的相关研究进行了梳理和评述,以便我们对主观风险以及主观风险对保险需求的影响有更深刻的理解。梳理与主观风险相关的研究后,笔者发现,根据时间先后,主观风险研究有三个阶段,采用了不同的研究方法,研究越来越深入,得到了愈来愈符合实际的结论,分别是:风险感知研究、风险判断的启发式原则研究和经验风险判断研究。
本文首先对主观风险和客观风险的区别及其对消费者保险决策的影响进行分析,然后分别综述主观风险研究三步曲的主要研究成果:风险感知研究综述、风险判断的心理机制研究综述和经验风险判断研究综述。在风险判断的心理机制研究综述和经验风险判断研究综述之前,我插入了两部分内容,讨论了主观风险研究中与保险风险判断相关的两项著名研究成果,然后说明这两项成果的结论对保险风险判断其实都是“烟雾弹”,需要拨开云雾见月明,事实上,最后的经验风险判断研究结论才是现实中小概率风险判断的真相。
我们以一个案例来说明客观风险与主观风险的区别。假定张三有价值10万元的汽车一部,汽车有被盗风险,假定1年内有1‰的机会被盗,导致10万元的损失;有999‰的机会不会被盗,没有损失。
所谓客观风险,实际是指统计风险,即用不确定变量(如盈利或损失)的概率分布、期望值、标准差等来描述风险。以上述汽车被盗风险为例,不确定变量为盗窃损失,我们可以计算得到期望损失为100元,标准差为3164元,借此来描述张三面临的汽车被盗风险的大小。而且,保险公司主要依赖客观风险进行保险定价,例如,如果张三投保汽车盗窃险,保险公司收取的价格=纯保费+附加保费=期望损失+附加保费=100元+附加保费。附加保费高低取决于消费者的风险厌恶程度、保险公司之间的竞争程度等因素。
所谓主观风险,是指除用统计分析方法评估风险外,判断和决策心理学认为,人们还会使用直觉来判断风险大小,即,人们会根据自己的直觉、近期经验或经历、鲜活的记忆或者受到某则新闻的刺激,采用认知心理学中提出的一些“启发式原则”来做出风险判断。而且,个体的主观风险往往与客观风险(或统计风险)存在明显差异。
显然,消费者会用自己的主观风险而非客观风险来评判保险产品的价值,消费者对保险产品的价值有自己的主观看法,高估风险会导致其高估期望损失或纯保费,进而高估保险价值,导致较高的保险购买意愿;低估风险则会导致其低估期望损失或纯保费,进而低估保险价值,导致其不愿意买保险。
人们为何会采取直觉判断方式来评估风险呢?认知心理学认为,人们每天都需要做出大量决策,面临非常大量的信息,但时间有限,认知和计算能力有限。于是,当面对不确定情形和复杂决策时,人们倾向于依赖心理捷径(mental shortcuts)来简化决策过程,进而降低其认知需求(cognitive demands)和 心 理 压 力(psychological stress)。简而言之,就是为了降低决策成本,让自己能够即时处理大量的决策问题,而不是在每个决策问题上纠缠不清。
当然,并非每个人对每个问题都采用直觉判断方式进行决策,风险感知相关研究认为,专家在自己的专业问题上更加依靠深思熟虑模式,而非专家或普通大众则可能更加依赖经验模式。例如,对疾病风险,医生更加依赖统计分析,而普通大众则更加依赖直觉判断;对保险承保的风险,精算师更加依赖统计分析,普通大众更加依赖直觉判断。
如前所述,主观风险研究三步曲分别是风险感知研究、风险判断的心理机制研究和经验风险判断研究,这里讨论风险感知研究。
风险感知研究的代表性人物是Slovic教授,从1959年念心理学专业研究生一年级开始,Slovic一直在研究人们在赌博中的偏好和行为选择,这是大学教授最容易研究的典型不确定性决策问题。
1970年,Slovic被引荐给White教授,那时,White教授观察到了人们在面对自然灾害时的奇异行为,如即便政府给大量保费补贴,大量灾区家庭也不会主动购买洪水保险。因此,White想了解Slovic对赌博的研究成果可否用来理解或解释人们应对自然灾害的行为。结果,这件事使Slovic非常尴尬,因为他发现用自己在简单赌博行为选择方面的研究成果,根本无法解释洪泛区平原或地震断层地区居民们的风险决策行为。但是,White提出的问题激发了Slovic的兴趣,从此,Slovic和Howard一起将研究重点转向了自然灾害(Howard也被同时引荐给了White),试图将“人们在面对自然灾害时的行为”与“概率判断和风险选择的心理学”结合起来。1974年,Slovic、Howard和White发表《决策过程、理性以及自然灾害管理》,认为:1)若对心理因素、经济因素和环境因素三者之间的相互作用了解得不够深入,则试图管理自然灾害的各种政策都将徒劳无功;2)现在的灾害管理计划都假定人们是理性的,但人们是有限理性的,提高对公众决策过程的认识刻不容缓,也是系统改进公共政策的核心环节;3)人们的有限理性包括有限的备选方案、对风险的错误认识(如不懂随机性,认为洪灾有周期性等)、在信息处理时存在局限性(如概率判断的小数法则)、对不确定性的否认、经历危险后才会去管理等;4)克服人们的偏见,是有效管理自然灾害的前提。有趣的是,从此之后,Howard教授一直致力于自然灾害风险与保险问题的研究,至今已超过了45年,发表了大量相关研究成果,而Slovic则很快将研究兴趣转向了技术风险的风险感知。
1970年代中期,人们对杀虫剂和核能潜在危险的关注与日剧增,于是,Slovic将研究重点从自然灾害转移到了技术风险上,极大地扩展了自己的风险研究领域。所谓技术风险,是指新技术如特效药、化学肥料、杀虫剂、核能等提高了产量、健康和能源利用效率,但也带来技术风险如副作用、环境污染等,甚至可能引发大规模死亡,这使人类面临两难境地,新技术带来收益,但也带来风险,控制风险将会降低收益,政策制定者被迫进行收益与风险的权衡。但政府面临一个重大问题是,普通公众对技术风险的认知是主观的,与专家的看法迥异,这使政策制定异常棘手。Starr(1969)在《Science》上发表“Social Benefits Versus Technological Risk”,被认为是系统研究风险感知的开始,在这篇经典文章中,Starr提出了经典问题“How safe is safe enough”。正是受到了上述现实重大问题和Starr研究成果的影响,Slovic将研究重点放在了人们对技术风险和收益的主观感知上,他认为,人们对技术风险和收益的主观感知将会对政府制定相关政策形成巨大影响。
Slovic研究团队首先梳理了相关文献,形成了一些看法或推断:1)人类一直没有机会进化形成一种能够概念化处理不确定性的能力。人类本质上是试错法的初学者,常常忽视不确定性的存在。我们的行动主要还是依赖于习惯或简单的决策准则。2)有些风险压根无法评估,如发胶、除臭剂会破坏臭氧层,但是在使用多年后才知道的,石棉危机也是一例(保险从业者通常知道美国保险业曾经历与石棉沉着病有关的责任险危机)。3)社会上有些奇异现象得不到很好的解释,如:①人们宁愿多花钱去解救一个已知的陷入危险的生命,而不愿去拯救统计意义上待解救的生命;②如果反复经历某种灾害却平安无事,会造成对灾害的风险低估;③公众能够容忍某些灾害(如X光辐射),但却不能容忍另一些灾害(核反应堆);④由于一些灾害的后果是延迟的(如吸烟),人们对这类灾害通常估计不足;⑤感知到的风险大小很大程度上取决于相关信息的呈递方式,如“在核电站四周,人们的平均预期寿命会下降”就比“在核电站四周,死于癌症的人数每年都在不断增加”听起来风险要小一些。由此,Slovic研究团队提出:“与那些基于复杂分析方法所做出的决策相比,人们是否更青睐于建立在肤浅原理之上的决策呢?”进而认定有必要对风险感知进行严格的心理学研究。
接着,Slovic专注于风险感知研究,一干就是几十年。研究开始时,Slovic想采取相对客观的研究方法,但在数据收集上困难重重,于是,Slovic走了新路,采取了一种当时全新的风险研究范式——“心理测量学范式”。所谓“心理测量学范式”,就是用问卷直接询问人们对风险和收益的感知,以及人们对“风险—收益”进行的权衡,这是一种“表达偏好”而非“显示偏好”,评估的是人们的情感感受和认知,而非评估人们的实际行为。这一方法假设风险是由人们主观定义的,人们对风险的主观看法可能受到广泛的心理、社会、制度和文化因素的影响,而且人们能够对那些难以回答的风险感知问题给出有意义的答案。该方法先使用大量心理测量量表,得到一些有关感知到的风险、感知到的收益和其他感知(如对某一活动死亡人数的估计)的定量化数据,然后使用统计工具分析影响最终结果的各种因素。
1987年,在系列研究成果基础上,Slovic在《Science》上发表“Perception of Risk”,对前期风险感知代表性研究成果进行了综述。该文认为,技术专家会采取复杂的评估技术对风险进行评估,但普通公众则会采用直觉判断方式对风险进行感知,专家与公众在风险问题上的矛盾可能是因为双方对风险的评估方法不同导致的。
研究表明,公众感知到的风险大小与众多因素有关,但这些因素可以合并为两个风险因子:①可怕程度,代表10个风险因素,包括风险的可控性、人们对风险是已经接受还是担惊受怕、全球灾难性、结果致命性、承担风险与获得收益的公平性、个体受损还是群体受损、对后代的风险性、是否容易降低、风险是否逐渐增大,以及自愿承担还是非自愿承担;②熟悉程度,代表5个风险因素,包括风险是否可观察、处于风险中的人是否知晓、风险后果是延迟的还是立刻的、新的还是旧的风险,以及科学界对该风险的把握程度。如图1所示。
图1中的公众风险感知模式来源于约3万名被调查者的综合调查分析结果,普通公众的风险感知规律是,可怕程度(后果严重程度、令人担惊受怕程度、不可控程度、非自愿承担程度)越高,或/和未知程度(新的风险、无法观察的、科学上未知的风险、效果延迟的)越高,感知风险越大。即,在图1的心理测量学因子空间中,越是靠近右上角位置的风险,人们的主观风险就越大。例如,公众之所以认为核能风险巨大,主要是因为其“可怕程度”极高,人们感觉其缺乏控制、令人恐惧、具有毁灭性潜能、后果极其致命、可能影响子孙后代等;再比如,公众之所以认为某些新型化学产品技术风险很高,是因为其可能内含有毒或致癌物质,而其毒害风险往往属于新的风险、未知的风险、危害后果隐蔽且具有很大的延迟性。
进一步的研究结论包括:①公众感知到的风险越大,要求降低风险的人越多,要求降低的程度也越大。②由于公众风险感知与专家评估结果有着很大的差别,这导致了专家与公众在风险管理政策上的矛盾或冲突。例如,尽管核能专家们一再重申核能的安全性,核能还是会引起公众的强烈抵制,人们往往认为核能风险高得不可接受,在图1的心理测量学因子空间中处于最极端的右上角位置。
此外,后续还有大量风险感知研究成果,主要研究结论包括:①与感知风险关联最强的因素是这一危险在多大程度上激发了人们的恐惧。②感知收益与感知风险负相关,即随着某项技术感知收益的增加,感知风险会降低。如果人们喜欢某项活动,就会倾向于认为其收益较高而风险较低,反之则会认为低收益高风险。③情感对风险感知有重大影响,例如,当风险是非自愿承担时,当风险自己无法控制时,当风险与收益不对称时,当损害后果致命时,往往会诱发人们的情感关注,进而推高了其主观风险感知。④男人比女人更少关注风险,感知风险较小,原因可能是男性本身就是风险方面的技术专家或参与了相关工作,能从技术方面理解风险,而女性很少参与相关技术工作。
风险感知研究成果给我们带来三点启示:第一,如果普通大众存在较大的风险感知偏差,主观风险与客观风险存在较大的差异,必然带来自身的风险管理偏误,要么管理过度,要么缺少管理。比如,低估风险会导致消费者该买保险时不买保险,高估风险则导致消费者购买过多的保险或者付出过高的保费。第二,政府往往希望通过某些政策抑制人们的风险行为(如控烟、自然灾害管理等),但由于政府政策的成本和收益基本都是按照客观风险计算的,而不是按照人们的主观风险或风险感知来设计的,这很可能会导致政策失效。如,在美国,即便政府补贴大量保费,洪泛区居民还是不愿购买保险,导致政府无法通过保费补贴政策解决洪水的损害补偿问题。第三,只相信理性主义、只强调客观风险的专家或标准教材主义者无法理解现实中人们的风险管理决策。如,在我国,即便政府补贴80%以上的保费,不少养猪户仍不愿购买生猪保险,这让政府官员和部分专家大惑不解。
▶图1 公众风险感知规律
如前所述,主观风险研究三步曲分别是风险感知研究、风险判断的心理机制研究和经验风险判断研究,这里讨论风险判断的心理机制研究。
风险感知研究采用心理学量表,直接问被试者对各种风险在各种维度上的心理感受,进而得到普通公众风险感知存在偏差的结论,但并没有讨论为什么人们会有风险感知偏差,风险感知偏差的心理机制是什么?
在西蒙对有限理性和推理启发式进行研究、布鲁纳(Bruner)开展思维策略研究过程中,两位学者都在关注能降低判断任务复杂性的简化策略,这些策略有助于人们用现有的心智能力驾驭各种复杂判断任务。受上述研究的激发,不少认知心理学研究者开始关注人们在判断中的心理内在过程或心理机制。
1974年,Tversky和Kahneman在《Science》上发表“Judgment under Uncertainty:Heuristics and Biases”,首次系统总结了人们在估计不确定事件的概率或不确定量的数值时,会采用三种启发式原则进行简化判断,分别是代表性启发式(Representativeness Heuristic)、可得性启发式(Availability Heuristic)和锚定与调整启发式(Anchoring and Adjustments Heuristic),认为这些原则对人们估计不确定事件非常有用,但也会带来各种偏差。
在不确定状况下的判断的研究中,主要研究范式是,学者们普遍将被试者的判断结果和规范模型的结果进行比较,进而检验是否存在判断偏差以及偏差大小。
下面分别讨论三种启发式原则的含义和案例,并讨论是否适用于保险风险判断。因为不确定条件下的判断范围很大,至少包括两种情形:第一种情形是,某个事件其实是确定的,只是判断者不知情,于是对判断者而言属于未知,有不确定性。例如,请被试者根据一些描述判断某位大学生的所学专业,或请被试者估计一条麻袋中白色球和黑色球的比例等。第二种情形是,某个事件在未来可能发生也可能不发生,请判断者判断其未来发生概率或频率,例如,请某人判断其汽车在未来一年内的被盗概率,或者更复杂些,请判断者估计未来结果的概率分布。显然这是两种完全不同的不确定性,第一种情形下,某个事件只是对判断者是未知的,但有人完全清楚这一确定的数值,而且属于对当下某事件的判断。第二种情形下,某个事件对判断者是未知的,但有人可以根据历史数据推断其发生概率、频率或概率分布,属于对未来的判断。我们所关心的风险或保险风险属于第二种情形。
所谓代表性启发式,是指人们会基于相似性进行判断。适用的典型判断问题是:A属于类别B的概率是多少?但其实A是否属于B是确定的,只是判断者不知情,从而有了不确定性。
例如,一项研究中提出如下问题请被试者回答:“佩内洛珀是一个大学生,朋友们形容她稍微有些不切实际、情绪化和敏感。她游遍了整个欧洲,能说一口流利的法语和意大利语。她目前还不确定毕业后的职业方向,但是已经证明过自己高水平的才能,并且多次获得书法比赛的奖项。她在男朋友过生日时写了一首十四行诗作为礼物。根据以上描述,你认为佩内洛珀的主修专业是心理学还是艺术史?”
结果,大部分被试者认为佩内洛珀主修艺术史,因为她似乎符合被试者概念中艺术史学生的特点。这就是代表性启发式,人们使用“自己概念中艺术史学生的特征”来进行判断,如果佩内洛珀与自己心目中艺术史学生的特征相似,就判断其主修艺术史。
但是,这一判断方式的重大缺陷是:很可能忽略了先验概率。数据显示,在这项研究进行时,美国一所近18000学生的公立大学中,大约2300人主修心理学,15名主修艺术史。这意味着随机挑出1名学生,主修心理学的概率是13%,主修艺术史的概率是0.08%,两者为150∶1。被试者显然应该先想到这一点,再考虑佩内洛珀的特征,进而作出佩内洛珀大概率主修心理学的结论。或者说,人们基于代表性启发式进行判断,很可能会出现判断偏差。
此外,代表性启发式也常被用于对未来不确定性作判断,例如,考虑硬币抛掷出现正面和反面的情况,人们往往会认为序列“正—反—正—反—反—正”比“正—正—正—反—反—反”更可能发生,因为后者看起来并不随机。这反映了人们的心理思维模式:人们期望由随机过程而产生的事件序列,甚至是很短的序列,也能代表这个过程的本质特征“随机性”。例如,对于抛掷硬币来说,随机特征不仅应该体现在整体序列中,也应该表现在局部的部分序列中,换言之,要求局部序列也具有代表性,或者说,用随机性这一代表来要求所有的序列,包括局部短序列。一个更容易理解的案例是赌徒谬误,如在轮盘赌中,看到一长串红色后,大多数人错误地相信现在应该是黑色了,因为黑色的出现才会导致一个更具代表性的“随机”序列。
美国一所近18000学生的公立大学中,大约2300人主修心理学,15名主修艺术史。这意味着随机挑出1名学生,主修心理学的概率是13%,主修艺术史的概率是0.08%,两者为150∶1。
但是,个人觉得,人们通常不会用代表性启发式对未来保险风险做出判断。人们不会这样想,汽车盗窃是随机发生的,我的汽车已经若干年没有被盗了,按照随机性理论,我的汽车该被盗了,这种想法通常不会出现。
可得性启发式的判断逻辑是,人们通过能想到的例证和想到例证的容易性来评估这类事件的发生频率或概率。例如,人们通过回忆其熟人中心脏病的发生情况来估计自己患心脏病的风险;人们通过想象某企业可能遭遇的种种困难,来评估该企业的破产概率。
可得性启发式通常会导致判断偏差,这里列举两类判断偏差:
第一种是由例证的可提取性引发的偏差。例如,一项研究让被试者听到一串男女名人的名单,然后要求他们判断这一串名字中男人多还是女人多(实际上一样多)。但是,研究者操纵了名人名单中更有名的男人数量或女人数量,在对第一组被试者呈现的名人名单中,男人比女人更有名;对第二组被试者呈现的名人名单中,女人比男人更有名。判断结果是,第一组被试者认为男人更多,第二组被试者认为女人更多。显然,每组被试者都受到了例证可提取性的影响,当男人更有名时,被试者更多地提取了男人做例证;当女人更有名时,则更多地提取了女人做例证,进而导致每组被试者都做出了错误或偏差的判断。
第二种是由有偏记忆样本集引发的判断偏差。一项研究要求被试者回答:“从英文文章中随机抽出一个单词(3个字母及以上),请问,它是‘第一个字母是r的词’还是‘第3个字母是r的词’的可能性更大?”此时,人们通过回忆road之类和car之类的词的容易性来评估它们的频率,因为前者更容易从记忆中搜索到,大多数人判断前者更多。但事实上后者更多。显然,对于风险事故来说,媒体有偏差的报道(风险事故越新奇或反常,被报道得越多)会导致人们形成有偏记忆,进而导致判断偏差。
显然,可得性启发式特别适用于人们估计未来风险,包括用来估计保险风险的大小。例如,当需要估计自己的癌症风险以确定是否需要购买癌症保险或大病保险时,个体可以通过回想到的癌症实例和想到癌症实例的容易性来评估自己患癌症的概率,还可以通过回想到的癌症实例的医疗费用来估计自己患癌症后需要的医疗费用。
依靠锚定与调整启发式做判断的逻辑是,很多情境下,人们的推测是以初始值为参照点或出发点进行调整后得到答案的。但是,调整基本都是不充分的,导致判断值有偏差。
例如,一项研究要求被试者用百分制来估计非洲国家在联合国中所占席位的百分比,如估计值60代表60%。当着被试者的面,研究人员通过转动幸运轮盘来确定一个0到100之间初始数字,让被试者说出这个初始数字大于还是小于其心目中的估计值,然后请被试者从这个初始数字开始顺时针或逆时针转动轮盘到其心目中的估计值。对不同的被试群体,研究者给了不同的初始数字。结果,这些武断的初始数字对估计值有显著影响,如,对初始数字为10和65的两个群体而言,非洲国家在联合国中所占席位的中位估值,分别为25和45,被试者显然受到了武断的初始数字的锚定,后续虽然进行了调整,但调整是不充分的。
另一项研究,要求两组高中生在5秒内分别估计“1×2×3×4×5×6×7×8”和“8×7×6×5×4×3×2×1”的数值,结果,前者中位估值为512,后者中位估值为2250,正确值是40320。在极短的时间内计算上述问题,人们得先计算几步,然后通过外推或调适来推测最终结果,而先计算那几步的结果就会成为外推的初始值或锚定值,初始值越低,未来调整后的最终结果也就越低,所以,第一组的估值低于第二组的估值。而且由于调整通常是不充分的,所以两组高中生都低估了最终结果。
从锚定与调整启发式的思维逻辑来看,通常不大会用于人们对保险风险发生概率的评估,但可能会被用于保险风险损失规模的评估。例如,对于癌症风险,人们不太可能有一个出险概率的初始值或锚定值,即便从专家那里得到癌症发生概率,依赖直觉而无法依赖理性的人类也无法相信这一数值的真实性,即便相信这一数值的真实性,也无法确认这就是自己的癌症发生概率,也不会从这一统计概率出发进行调适以得到自己的癌症发生概率。但是,人们很可能会根据自己听说过的癌症医疗费用数值来判断自己一旦发生癌症后的医疗费用,这里先用了可得性启发式,然后可能会用锚定与调整启发式根据通货膨胀、地区因素、医疗条件等因素进行调整。
从以上分析可以看出,人们在进行保险风险判断时,对于出险概率,很可能主要依赖可得性启发式进行判断,例如,人们通过回忆其熟人中癌症的发生情况来估计自己患癌症的风险。对于损失规模,则可能首先使用可得性启发式来作出初始判断,然后再根据实际情况(如地理位置、通货膨胀、医疗条件等)进行调整。