基于逻辑回归的客户车险续保率研究

2019-10-06 02:39胡锐玲贺嘉钰沈陆明
新财经 2019年13期

胡锐玲 贺嘉钰 沈陆明

[摘 要]为提高客户的车险续保概率,对客户进行精准的画像分析,文章对客户基本信息进行筛选、剔除。对其进行量化处理,采用Logistic回归,得到Logistic回归方程,定性定量分析客户基本信息对是否续保的影响,并预测客户的续保概率。针对不同的客户对其采用不同的优惠、福利、服务方案,提高其续保率。

[关键词]车险续保率;虚拟变量;逻辑回归

[中图分类号]F842

1 引 言

机动车辆保险在我国的财险保费中所占比重最大,以千亿元计。车险市场历来是财险公司的兵家必争之地。新车销售放缓,车险市场中新车业务占比日渐下滑,与此相对应的是续保业务占比不断提高。续保市场更强调以客户为导向,更加重视对核心阵地的资源投放,倒逼公司“眼光向内”,加速客户需求分析、产品精准推送、价格敏感性分析、客户互动体验等课题的研究和应用。文章通过收集的某保险公司客户的基本信息,进行实证研究。建立合理的数学模型,对客户进行精准画像,求出续保概率。针对不同的客户设计不同的优惠和福利方案,以提高续保概率(数据来源于2019年“认证杯”数学中国数学建模网络挑战赛C题)。

2 数据处理

根据收集涉及的客户基本信息,先对基本的数据进行清洗和预处理,定义各基本信息列为自变量,“是否续保”为因变量。因变量y为二分类变量,即续保和不续保,即视为y=1和y=0,设定因变量区间范围为(0,1),预测各个客户的续保概率。

对于客户的基本信息数据包含各种类型的数据。根据数据信息的完整度以及自变量与因变量是否有关系先对数据进行筛选,删除。再将其分类变量定义虚拟变量,二分类变量用0-1赋值,现构造出包含以下23个自变量指标对客户进行精准画像。标识如下(见表1):

(1)签单保费有一定的正向影响,签单保费的金额越大,客户续保的可能性也越大。

(2)立案件数系数为负值,说明随着客户在某一保险公司立案件数的增加,选择续保的概率会降低,这与实际关联很大,当某一购买车险的客户立案件数增加导致保险公司的赔款增多时,保险公司也会对其重新进行评估,其今后购买车险的优惠和福利都会减少,此时,对客户来说,选择续保是不太明智的,因此,该变量与最后的续保概率呈负相关。

(3)对于保单性质这一变量,当取值为0时,表示此单是续保签约,取值为1时,表示转保,联系其系数来看:即当某一客户的保单性质为转保时,下一年的续保概率会大大减少,而当该客户的保单性质为续保时,相当于为该保险公司的老客户,一般而言,都会继续选择续保。

(4)本省车牌这一变量的系数表明,当购买车险的客户车牌是本省车牌时,其选择续保的概率相对于非本省车牌和临时车牌的客户会增加,这和地域稳定性有关。本省车牌的客户相对于非本省车牌和临时车牌的客户,一方面更加有地区优势,出事故的概率会更小;另一方面会更长期的在本地工作,续保的概率会更高。

(5)保险购买的渠道这一变量,电网销和车商渠道的系数很显著,说明这两种购买渠道相对于其他的购买渠道的客户,续保概率会增加。这与渠道购买的可信度与优惠度有关,一般购车时就购买的保险与电网联售的保险的可信度和优惠度更大一点,客户更容易选择续保。

基于以上逻辑回归的结果,对客户续保的概率进行预测。根据定义的阈值0.5对客户是否续保进行判断,续保率P>0.5,则认为该客户很可能续保,P<0.5,则认为该客户一般情况下不会选择续保了。通过预测的客户续保选择,与实际的是否续保对照检验,可以得到预测准确率有99.66%。说明Logistic回歸充分挖掘了客户的基本信息,模型预测的效果很好。

5 建 议

在对客户进行了精准画像的基础上,根据其基本特征针对性提出优惠福利方案。公司的服务的好坏对客户是否续保的影响是不可忽视的,从客户开始选择本公司开始,服务便开始了。对客户的需求了解、产品内容、签订保单、理赔以及在保险合同期间的追踪调查等都是需要注意完善的。与汽车相关的行业进行合作,可为汽车提供各项服务的渠道以此完善在保单合同期间汽车的各项服务,也可与之进行相应的优惠政策(例如:汽车需要清洗时);续保领红包、福利;开展更多的活动,与客户建立更多的联系,既能利用此机会向客户进行车险类知识、公司产品的介绍,也能了解客户的需求,疑问,以及问题的反映;大数据时代,信息来源更高效更准确。通过大数据分析,了解客户的最近搜索等,针对性地为客户提供相应的服务;为鼓励客户续保时选择签订几年的合同,为此针对提出新的优惠政策,这样有助于提高近几年的续保率。

保险对于保证我们实际的生活是具有重要的意义的。车险无疑是其中重要的组成部分,凡是买车的,除了国家强制性要求买的交强险,多少会选择一些商业险来进行保障。对于保险公司来说,提高本公司的竞争力、利润率,在如何设计保险类型、宣传保险产品等方面是需要注重的。而对续保概率的研究,如何提高续保率的方面也是不可忽视的。

参考文献:

[1]唐现文,董海燕,吉文林.二分类变量Logistic回归模型下职业农民培育意愿分析[J].江苏教育研究,2013(12):48-50.

[2]张晋昕,李河.回归分析中定性变量的赋值[J].循证医学,2005(3):169-171.

[3]刘佳.基于大数据的车险精准营销模式研究[J].郑州:华北水利水电大学,2018.

[4]丁元林,孔丹莉.对比标度权重法在量化有序多分类变量中的应用[J].数理医药学杂志,2005.

[5]席俊虎,王文志,胡冰倩.数据挖掘驱动下的车险续保流程再造[J],中国保险,2016(3).