天安财产保险股份有限公司 邵鲁扉
随着我国商业车险改革的深化,越来越多的保险公司认识到对车险进行精细化定价的重要性。传统上非寿险的定价采用诸如单项分析法、最小偏差法以及多元线性回归等方法。孟生旺(2007)分析了传统的非车险定价方法的缺陷并介绍了非寿险精算中典型的非线性模型,同时通过汽车第三者责任保险的损失数据说明了广义线性模型在非寿险产品定价中的具体应用。郁佳敏(2010)对一百多年来汽车保险中的精算定价模型进行了综述性的回顾,并对车险定价模型的未来发展进行了探讨。张天舒(2015)对传统非寿险精算方法存在的缺陷进行了分析,并用R语言结合实例给出了广义线性模型在车险定价中的一般步骤。
目前,保险公司的车险定价按照从车、从人、从地区三个主要的维度通过广义线性模型(GLM)建立定价模型。此外,也有部分学者研究把行驶里程作为定价的因素。段白鸽等(2012)对国外车险按里程定价的理论与实践进行了系统的梳理,并在此基础上对其进行了效益分析,对实施中可能存在的问题进行了深入探讨。张媛媛(2011)认为按里程定价产品更加公平有效,具有巨大的潜在收益,并且对于解决我国交通和能源问题也具有很好的应用前景。
三大因素中,从车因素考虑的主要是保险公司所采集的各种汽车的物理属性,包括车龄、汽车整备质量、新车车购置价、排量与功率等因素。但是随着新能源汽车的普及,保险公司对新能源汽车的保险风险与传统汽车保险风险的区分并不明显,反之由于新能源汽车在产品结构等方面同传统燃油汽车存在差异,导致新能源汽车的保费明显偏高。
霍潞露等(2017)对目前新能源汽车保险存在的主要问题进行了归纳整理,包括保费金额过高、保险利益特殊、缺少新能源汽车专属保险产品和针对动力电池的保险等,并提出了促进我国新能源汽车业务发展的主要思路,为保险行业下一步进行新能源汽车险种的开发设计和政府部门出台推动新能源发展的支持政策提供参考。张权辉(2011)从新能源汽车保险的需求、产品开发等方面进行了分析,并指出了开发新能源汽车保险应当注意的一些问题;杜欣芮(2015)等也对新能源汽车定价方面做过较为深入的研究。
鉴于新能源汽车的特殊性,我们认为,新能源汽车的保险定价除了遵循从车、从人、分地区的因素外,还有很重要的一方面就是新能源汽车的电池相关信息,包括电池生产厂商、驱动电机数、电机布局、充电时间等静态数据以及电池剩余电量、高压电池电流、单体温度、单体电压等行驶过程中会发生变化的动态数据。因此,新能源汽车的保险定价相较于传统汽车更加复杂且特殊。
本文的研究框架如下:第二部分对新能源汽车的一些静态数据,包括池生产厂商、驱动电机数、电机布局、慢充时间等对应的不同水平在车损险上的损失率进行了分析。第三部分结合新能源汽车的一些物理参数,提出了新能源汽车的一个基于赔付率的广义线性模型。最后一部分对本文进行了总结,同时也对新能源汽车定价中存在的一些问题以及未来的发展进行了分析。
由于新能源汽车在产品结构等方面同传统燃油汽车存在差异,新能源汽车的保险定价除了要考虑传统汽车的物理参数之外,更多的应该是考虑新能源汽车所具有特有的变量,如新能源汽车的电池相关信息等。下文基于所收集的数据讨论电池相关变量对应的不同取值对赔付率的影响。
同一厂商生产的电池代表了该厂商的技术水平、产品性能以及安全性、可靠性等综合技术实力。不同生产厂商生产的电池会对汽车的安全性有直接的影响。通过对电池生产厂商按照对应的赔付率进行分组,我们将所得数据对应的电池生产厂商划分为四类,得到每一类的赔付率如表1所示。
表1 不同电池生产厂商对应的赔付率
从表1中可以看到,不同电池生产厂商对应的新能源汽车的赔付率差异较大,最高组的值是最低组的3.56倍,因此按照统一的保险价格收取保费显然是不公平的。
除了电池生产厂商外,电池型号也是影响新能源汽车赔付率的重要因素。通过对电池型号进行分组,发现不同电池型号对应的赔付率的差异较大。具体结果,如表2所示。
表2 不同电池型号对应的赔付率
从表2中可以看到,不同的电池型号对应的新能源汽车的赔付率差异较大,最高组的值是最低组的3.44倍,所以电池型号应该作为新能源车定价的核心因子之一。
电机类型包括永磁同步电机、交流异步电机、混合式同步电机等不同类型。根据电机的不同类型将占比较小的类进行合并后,对电机类型对赔付率的影响进行了分析,发现不同类型电机也存在较为明显的赔付率差异,具体数据如表3所示。
表3 不同电池型号对应的赔付率
电机布局主要包括前置、后置、前置+后置等不同类型。通过对不同类型电机布局对赔付率影响的单变量分析后,能得出不同的电机布局对赔付率也有着较大的结论。具体数据如表4所示。
表4 不同电池型号对应的赔付率
综上可以看到,电能源汽车所使用电池的生产厂商、型号、电机类型等新能源特有的变量对新能源汽车的保险风险都有着很强的区分能力。
广义线性模型(Generalized Linear Models)由Nelder and Wedderburn(1972)提出。相较于传统的线性回归模型,一方面将目标变量有正态分布扩展到指数分布族(包括正态分布、伽玛分布、泊松分布等);另一方面通过连接函数将自变量与因变量之间的线性关系扩展到任何的单调关系。广义线性模型的一般形式为:
其中,E表示期望,Y是来自于指数分布族的目标变量,g为单调函数。
由于保险理赔数据被认为是来自于厚尾分布的,因此它的真实分布与正态分布并不吻合,从而用基于正态分布假设的线性回归模型并不能很好的拟合理赔数据。广义线性模型的提出弥补了线性回归模型的这一不足。一般我们会用泊松分布去拟合出险次数相关的模型,伽玛分布去拟合与赔付金额相关的目标变量;或者通过Tweedie分布(即泊松和伽玛两个分布的复合)建立与赔付成本相关的模型,如纯保费模型、赔付率模型等。上述模型中的连接函数我们一般取对数函数。
基于上文的各个单变量的分析,希望将上述新能源汽车的特有变量连同传统的从车变量加入到风险模型中去。由于这些变量都是和车型显著相关的,因此最终在建立以赔付率为目标变量的广义线性模型是要考虑各变量间的相关性等信息。
本文将所有的样本数据按照6:4的比例划分为训练集和验证集,其中训练集由于模型变量的选取、参数估计等,验证集用于对最终选择的模型的效果进行检验。以赔付率作为目标变量,从车属性作为定价因子,以Tweedie分布作为目标变量的分布和对数连接函数建立广义线性模型。模型最终选择的因子数为8个,每个因子在模型中的表现,如表5所示(其中Intercept代表的是截距项)。
表5 不同电池型号对应的赔付率
从表5可以看出,每个参数估计的p值都很小,因此模型中每个变量都是显著的。
为了进一步验证模型的效果,对验证集上的赔付率进行预测。按照预测赔付率的高低,将验证集划分为五组,得到每一组对应的实际赔付率的数值如表6所示。
表6 模型验证效果
从表6中可以看出,随着预测赔付率的由低到高,每组对应的实际赔付率也呈现出由低到高的变化趋势,从而进一步证明了我们的模型是有效的(注:由于验证集的数量偏少且各变量的因子间分布不均,因此不能按照将验证集等分的方法去验证)。
通过以上的分析可以看到:在新能源汽车的保险定价中,电池的相关信息对风险的区分起到了非常重要的作用,也是建模的显著的变量。另外,上文的分析只是基于所收集到的新能源汽车的静态数据。像电池生产厂商衡量的是该厂商生产的所有电池的一个总体赔付水平,但是考虑到总体与个体之间的差异,具体到每一辆车的电池与总体水平会有所不同,因此最好能收集电池在行驶过程中的一些静态数据,如百公里耗电量、电池电压的变化情况、电池在行驶过程中的温度变化情况、电池的使用频率等信息。相信这些数据会进一步提升保险公司对风险的区分能力。
因此,保险公司在数据采集过程中应该加大数据采集的力度和宽度。对于缺乏数据累计与收集能力的中小保险公司,也可以考虑同第三方数据源进行合作。