基于贝叶斯分类器的续保概率预测

2019-09-10 17:31黄山尹龙威孙海晨
锦绣·下旬刊 2019年4期
关键词:风险因素

黄山 尹龙威 孙海晨

摘要:近年来,国际保险行业稳步开展,机动车保险在我国的财险保费中所占比重最大。随着我国汽车保有辆的持续增加和相关车险政策的出台,投保率也呈持续上升趋势。如何能精准判定客户续保概率至关重要。为此本文建立一个预测客户续保概率模型,首先将影响车险业务的因素潜在风险进行划分,分别从“人”、 “车”、 “环境”三个方面考虑风险因素,对各项指标进行风险系数的划分以及客户精准画像,然后以上述的风险因素的风险系数和是否续保作为输入因素指标和目标类别,对贝叶斯分类器进行训练学习,利用贝叶斯分类器对不同客户进行续保概率求解,从1 000组数据的训练样本学习后的贝叶斯分类器分类精准度在80%左右,相对准确的从对客户的画像中得到了该客户续保的概率。

关键词:贝叶斯分类器;客户画像;续保概率;风险因素

0.引言

中国目前的车险费率制度,大多数符合“从车主义”。即车险保费多少,主要取决于这辆车本身的各项情况,如车的购置价、座位数、排量、购车年限等,根据这些数据计算出一个基本的车险保费价格,再根据这辆车的上年理赔次数来打不同的折扣[2]。这就导致了中国的车险定价模式非常的单调,相似情况的车型,保费也都差不多。想要改变这种状况就需要使其变为“从人主义”。需要对客户进行精准画像也需要对客户是否续保概率进行预测。

1.客户精准画像

本文从三个大方向车辆、环境、人;10个小方向种类、年龄、性别、NCD等对客户进行精准画像。针对重要的文字信息,本文通过风险厘定将文字信息转化为了数字信息[1]。下面将选取这些数字信息以概率统计的方法对客户进行精准画像。

2.贝叶斯分类器

在上文我们对客户车险的风险因素划分了风险系数,将以上划分标准作为类别集合,利用贝叶斯分类器对已有数据中的客户进行分类,得到客户的精准画像。利用风险系数计算各类客户的续保概率。贝叶斯分类器是一种分类的算法,但他是以概率统计的方法对类别进行划分。利用概率统计中的贝叶斯公式进行计算,算法的特点就是不会确定样本的类别,而是以概率的形式告诉这个样本有多大可能属于这一类。本文将续保不续保分为两类,这样通过将所得数据输入分类器进行学习。当在输入客户得这些信息时,贝叶斯模型就会得到该客户续保得概率[3]。

贝叶斯分类法基于简单的贝叶斯公式(1),即通过某对象的先验概率计算其后验概率,选择具有最大后验概率的类作为该对象所属的类[4].

根据贝叶斯公式(2)分别计算P(Y1|x)2P(y2|x),…,P(ym|x),其中,由于假设X中各个特征属性是服从正态分布且条件独立的,因此P(X|yj)可由式(3)计算,P(xi|yj)可由式(4)计算。

从P(y1| x),P(y2x|),…,P(ym|x)中找到最大值,对应的yj即为X所属的类。由于P(X)是一定的,要求使得P(yj|x)最大的yj值,即为求使得P(X|yj)P(yj)最大的yj值,即为式(5)。

本文以同品牌同车系的1000组大众帕塞特客户相关信息输入贝叶斯分類器进行学习。另找了10个大众帕塞特客户的信息输入已经训练好的贝叶斯分类器模型进行检验。

3.结论

选取10个大众帕塞特客户的信息输入已经训练好的贝叶斯分类器模型进行检验,结果如下:

从1000组数据的训练样本学习后的贝叶斯分类器分类精准度可以在80%。而且也成功的从对客户的画像中得到了该客户续保的概率。

参考文献

[1]李敬.中国商业车险费率市场化改革下多因子定价模型研究[D].电子科技大学,2018.

[2]胡伊.基于多源数据的车辆风险分析与保险定价模型研究[D].中央财经大学,2016.

[3]王梦晨.A公司车险业务续保率影响因素研究[D].湖南大学,2017.

[4]刁海军,尹钊.一种基于朴素贝叶斯分类算法的数据预测[J].电大理工,2018( 04):1-3.

猜你喜欢
风险因素
基于系统动力学的PPP项目失败风险因素动态反馈分析
数字出版项目风险识别与控制
高校体育管理风险因素研究
会计审计风险因素与信息化审计策略研究
遗嘱公证风险的防范对策分析
分析外科护理不安全因素及其风险管理途径
煤矿企业人力资源管理存在的风险因素及控制方法
户外俱乐部活动的风险因素识别与分析
房地产开发投资风险分析及防范策略
简论建筑工程施工合同的风险及其防范措施