贾若 北京大学经济学院风险管理与保险学系
保险科技应用最广泛的前沿技术是人工智能、大数据、区块链和云计算。其中,人工智能包括计算机视觉、机器学习、自然语言处理和人机交互等技术,是保险公司数字化和提高运营效率的驱动力。而大数据的特征可以概括为5V,即数量(Volume)、速度(Velocity)、多样性(Variety)、价值(Value)和真实性(Veracity)。大数据技术丰富了风险管理和保险学的研究,其不仅仅体现在保险科技相关领域本身,而且还能够为行为保险、信息不对称、保险制度和风险管理等领域的相关研究提供支持。同时,保险领域的实践能够为学术研究工作提供源源不断的数据支持,这是科技在保险领域应用之后所具有的独特优势。区块链技术是指通过点对点的价值交换,从而能实现分布式记账、安全可靠存储和智能合约等功能。云计算技术则是将算力打包的分布式计算系统。这样,买家就可以获得计算资源并提高其可用性。平台即服务(PaaS)、软件即服务(SaaS)和基础设施即服务(IaaS)是云计算中常见的三种商业模式。
在保险科技市场中,有三类主要的参与者。第一类参与者为保险行业中的现有保险企业。这些企业都是传统保险的参与者,它们会根据自身的基础设施和业务情况,在顶层设计、技术建设和业务模式、集团组织结构等方面进行数字化转型。
第二类参与者为科技巨头。它们是保险市场的新进入者,拥有海量的技术数据和互联网用户基础。比如,腾讯集团会选择与现有保险公司合作,或者建立自己的互联网保险机构。这些科技巨头是保险产品和保险营销创新的主要驱动力,它们所采用的技术也就形成了保险科技。
第三类参与者是保险科技的初创企业。它们是最具创新性的参与者,并且通常仅专精于某一个细分领域,从而具有该细分领域的比较优势。例如,北京大学的一个保险项目研究组曾与一家保险科技初创企业合作。这家公司在保险承保、风险评估和目标影响等方面具有非常独特的优势。当然,还存在其他一些保险科技企业可能在其他方面具有竞争优势,例如理赔服务、特别的销售渠道等。
保险科技可以在保险行业的众多领域发挥作用。本文将主要介绍其在风险评估和目标营销两个领域的作用。
在风险评估领域,保险科技能够在两个方面发挥作用。一方面是大数据,提供了保单和投保人的相关特征,使保险人能更准确地评估风险的特征并预测未来的索赔情况;另一方面是模型,保险需要有合适的模型去分析数据。
在目标营销领域,利用大数据技术和机器学习能够使模型具有更强的预测性,提高保险定价的准确性。如此一来,保险市场能够进一步向低收入人群和非标准体扩展。在传统的保险市场上,低收入人群和非标准体往往会因为定价原因而无法购买保险。在利用保险科技进行更加精准的定价之后,这些人群能够以合适的价格购买保险。另外,大数据也能提供行为金融的相关信息,能够更好地识别具有高支付意愿的潜在客户,从而为保险销售提供指导,提高销售成功率。
从现有数据来看,保险公司在进行风险评估和目标营销时,已经开始利用医疗、地理、行为等诸多数据进行精算定价,并考虑在未来继续加入更多的数据维度(见图1)。
图1显现了保险公司对各种数据使用的计划和现状。就健康险而言,传统保险公司和保险科技初创企业的投入占现代健康保险业务总承保保费的60%。保险公司也正在扩大或计划扩大在保险业务中使用不同类型的数据,包括基因编码等数据。还有越来越多的保险公司正计划使用IOT(物联网)数据。
图1 保险公司数据使用情况调查
行为数据可能来源于用户的智能手机,包括三方面:(1)用户在智能手机中安装和使用的应用程序的数据。比如育儿程序,这能够表明用户是否为人父母,以及在照顾孩子方面投入的时间和精力;再比如,午夜使用手机的频率,频率越高则表明生活方式越不健康或越勤奋,抑或是对日常生活安排更加灵活。(2)用户手机收到的信息。比如,在互联网赌博网站或彩票网站注册后会收到短信,这些短信能够被数据收集公司所获取,并能够反映出是否是赌徒或经常购买彩票,从而推测出风险偏好。(3)金融机构提供的信用评级数据。比如,手机可能会记录要求用户提供信用信息的金融机构数量。这些信息能够反映出在过去某段时间内是否曾向金融机构借钱。如果一直在借钱,金融机构会要求提供信用信息。这些信息进而可能表明用户是否处于流动性短缺的状态。
在背景介绍完之后,下面将分三个部分讨论保险科技的影响。第一部分是保险科技对市场结构的影响。比如,传统保险公司会不会被特斯拉接管?特斯拉能否成为垄断者?本文构建了一个理论模型进行分析,试图回答这个问题。第二部分是风险评估的改进,文章展示了一些数据和模型,分析如何改善风险评估的准确性。第三部分是利用从手机收集用户行为数据的例子,来探究这个新的数据来源能实现什么研究。最后会探讨保险科技发展面临的一些挑战和对策。
第一部分是基于笔者和瑞士圣加仑大学Martin Eling教授、清华大学林洁瑜和韦尔斯利学院Casey教授2022年在Journal of Risk and Insurance上发表的论文。
众所周知,新技术能够给保险公司提供更多的额外信息用于风险评估和定价。汽车的远程信息处理能够记录驾驶速度、距离和使用刹车的频率。2018年,全球UBI市场增长了47%,而全球非寿险市场仅增长了3%,即新技术的市场增速远高于传统市场。这表明,新技术可能将抢占更高的市场份额。另一个新技术运用的例子是可穿戴设备,它能够记录心率、血压和运动频率。比如,苹果手表和联合健康集团合作推出了健康监测计划,66%的用户参加了该活动,其中2/3的用户参加活动时间超过了1年。这意味着,这种健康监测活动相对来说比较流行,并且随着可穿戴设备的广泛使用其参与度将不断增长。
上述案例表明,新技术能够迅速获取新的市场份额。然而,从美国的汽车保险市场数据来看,包括国有险企在内的众多大企业在过去10年中的不同时期都推出了UBI保险,但是其市场份额并没有如预期的那样实现增长。这两者之间并不存在显著的关系。那么,新技术和传统技术对于市场的分割情况是怎样的?新技术会不会占领整个保险市场?
新技术公司和传统技术公司的关键区别在于:新技术公司能够更快地学习,但目前的成本仍相对较高;传统技术公司的学习速度更慢,但现阶段成本较低。因此,我们建立了一个理论框架,考虑保险市场中两种不同类型的公司,即科技公司和传统保险公司。其中关键的权衡之处在于:科技公司能够更快地识别和评估风险,但也需要为新技术付出更高的成本。进而,文章分析了两种类型公司在迭代模型中的竞争。模型考虑了个体风险的异质性,并假设了两种不同的学习环境,包括可观测投保时长的环境和不可观测投保时长的环境。
在可观测投保时长的环境下,保险人了解每个投保人的投保时长,能够辨别投保人是新进入的个体还是从其他保险公司转换来的个体。如果是转换而来的个体,转换原因可能通常是因为保险费率高或被拒保,因而可以在定价中加以考虑。在不可观测投保时长的环境下,保险人无法获取投保人的投保时长,也就无法辨别其是否是新进入市场的投保人。模型的均衡求解结果表明,市场最终会出现细分结构。低风险投保人会选择从科技公司购买保险,因为科技公司能够迅速识别低风险并为其提供低费率,正确反映他们的风险类型。而高风险投保人会选择从传统保险公司购买保险,因为传统保险公司的风险识别速度慢,高风险投保人能以平均费率获得保险。
如果从直观上考虑,由于科技公司的成本较高,其市场份额会逐渐减少。但在技术成本一定的情况下,科技公司具有学习速度的优势。当科技公司和传统保险公司的学习速度差距减少时,科技公司的市场份额也会相应降低。这个直观想法可以在可观测投保时长的假设下进行验证。当传统保险公司也能了解投保人的投保时长情况时,就能更好地进行风险评估,进而缩小与科技公司的学习速度差距。
然而,笔者的研究却得出了反直觉的结果。在某些特定情形下,尤其是投保时长不可观测时,科技公司和传统保险公司学习速度差距的减小实际上提高了科技公司的市场份额,减少了传统保险公司的市场份额。这是因为高风险投保人在均衡状态下会选择传统保险公司。高风险投保人可能会因为现有公司的高费率选择转换公司,从而继续以过去的低费率投保。而在投保时长可观测时,新的保险人能了解投保人过去投保经历,从而会继续向其收取高费率。
为谋求利润最大化,传统保险公司会提高它们的学习速度以更好地进行风险识别,并减小与科技公司之间的差距。所以,在未来一段时期,高风险个体会被更多的传统保险公司识别,最终会导致传统保险公司均衡费率的上升,进而导致传统保险公司的市场份额减少。因此,当投保时长不可观测时,传统保险公司面临的逆选择效应总是会强于提高学习速度带来的直接正向效应。这会在市场结构的变化过程中占主导地位。所以,传统保险公司对科技公司的技术追赶而进行的尝试有时可能只是表面的模仿,可能会产生南辕北辙的效果。
因此,笔者认为,传统企业在对科技企业的学习过程中,尝试提高追赶速度的努力可能会适得其反,反而降低了自身的市场份额。对市场现有的传统保险公司而言,在尝试引入新技术时,需要仔细地评估市场结构,以确定新技术的引入是否能够产生正向效应。笔者提供了一个基于信息结构的解释,并详细阐述了传统保险公司追赶科技公司的尝试最终可能失败的原因。
第二部分是基于笔者和北京大学同事共同撰写的一篇工作论文。该篇工作论文旨在通过新数据和相应模型量化分析大数据对于保险公司风险评估的改善作用。与传统的数据相比,该篇工作论文中所采用的数据规模更加庞大。然而,对于此类高维数据需要进行变量选择,否则会面临“维度诅咒”的问题,降低了模型的可预测性。因此,我们需要区分出哪些变量为模型的有用变量。
这篇论文目前尚未完成,但有一些初步的研究结论可以和大家讨论,让大家感受到额外的数据和新模型如何产生预测价值。比如,文章比较分析后得出了最具预测能力的模型,这能够指导保险公司的定价实践,为其收集何种定价数据提供经验证据,方便保险公司以最小的成本收集到最有用的数据。而且,文章还提出了一种新的方法来探究数据收集最有价值的方向,并发现了一些最具预测性的变量。并且发现,传统变量由于已经被使用了上百年,预测力毋庸置疑,但一些新兴变量也可以直观反映被保险人的风险偏好以及它们对自身健康风险的关注程度,能为风险评估模型增加额外的预测能力。
第三部分主要是基于笔者与北京大学及中国人民大学的老师们合作完成的一篇工作论文。该篇工作论文主要探讨了基于信息科技收集的大数据如何为行为保险研究提供助力。行为保险研究的相关问题包括购买保险和索赔行为的影响因素,以及类似保险的新形式(网上众筹、互助计划)。保险大数据也能为风险管理之外的其他行为研究提供支持,可以检验家庭金融、消费者行为等方面的理论。
文章的研究结论发现,与众多已有文献的研究结果一致,女性通常更利他。妻子为丈夫购买保险的数量一般会高于丈夫为妻子购买保险的数量,其次是丈夫为自己购买保险,最后才是妻子为自己购买保险。但无论是男性还是女性,他们为配偶购买保险的数量都超过了为自己购买的数量。这些集中于行为的角度对保险消费的研究,能够为保险销售带来启示。
目前,保险科技仍存在一些挑战,监管部门也出台了相关的应对政策。
第一个挑战就是保险科技的可用性。这主要是大型保险公司和中小保险公司之间的矛盾。大型保险公司具有大量的数据,更大的经济规模也便于其投资新技术,从而获取更高的回报。中小保险公司则仅拥有有限的资本和人力资源,保险科技的应用也相对较少。显然,需要监管政策来平衡险企之间的不平等。对此,中国保险监管部门鼓励各种不同规模的机构充分利用大数据技术实现业务、产品和服务的创新,建立数字化的管理结构,还对小型保险公司的技术开发给予更高的支持,并为其提供数据治理的建议。
第二个挑战在于数据安全风险。这也是更重要的挑战。中国的第三方云计算服务商发生信息泄露事故是市场近期的大新闻,保险公司大多将它们的数据存储服务外包给第三方云计算服务商。中国目前主要有两种云计算商业模式,平台即服务(PaaS)和软件即服务(SaaS)。而第三方服务市场内部竞争并不激烈,市场份额相对较为集中。这就意味着,任何一家主要的云计算服务商出现问题都会给保险业带来系统性风险。监管部门的应对措施是禁止将核心业务外包给第三方,并提高保险公司自身的科技水平。
最后一个突出的挑战是数据隐私问题。一方面,在新冠肺炎疫情防控常态化的当下,我们都非常关注自身隐私问题,应用获取的数据被限制在必要的最低限度水平,但也可能导致获取的数据难以满足要求。另一方面,应用获取的数据可能会被出售给第三方,造成数据欺诈和过度营销。在2021年出台的《个人信息保护法》中已经明确:“收集个人信息,应当限于实现处理目的的最小范围,不得过度收集个人信息”,并且规定“处理个人信息应当取得个人同意”。这些规定在保护个人隐私的同时也会使得数据收集受到限制,因此需要平衡数据收集和隐私保护之间的冲突。