基于K-Means和SEM的消费者互联网保险购买意愿研究
——以TPB和TAM为分析框架

2019-03-19 04:40
关键词:意愿客户模型

谭 征

(1.四川广播电视大学, 成都 610073; 2.四川华新现代职业学院, 成都 610107)

近年来,“互联网+”颠覆和重塑着中国经济,互联网保险借此浪潮快速发展起来。根据曲速资本发布的《2016互联网保险行业研究报告》,互联网保险历经20年的蜕变,目前正处于全面爆发的前夜[1]。总体而言,伴随着中国网民和手机移动端用户的扩增,中国互联网保险先后经过了萌芽期、起步期、探索期、积累期、发展期和爆发前期,正酝酿一场“现象级”经济热潮,如图1所示。

图1 中国互联网保险发展阶段

2011—2016年互联网保险公司数量、保费收入及占比如表1所示[1-2]。2015年,互联网保费占总保费的9.20%,2016年互联网保险公司数量占行业总机构数量的58%。互联网保险的种类也越来越多元化,从最初的理财险、人身险、车险等传统品种,到大量涌现的银行卡安全险、支付宝安全险、退货险等依托电子商务而开展的保险品种,再到摇号险、鞭炮险等五花八门的创新险种,无不彰显互联网保险的兴盛和开放。

深入挖掘互联网经济的潜力是促进我国经济结构转型、保障我国经济可持续发展的重要的支撑点。消费者的购买意愿是进一步挖掘互联网保险市场潜力的直接推动因素,以消费者的视角研究互联网保险,合理引导消费者作出购买决策对于互联网保险的发展具有十分重要的意义,而且,互联网中的“长尾效应”对互联网保险依然有效。通过对“长尾人群”的特征研究,分析互联网保险客户的特征分布,有利于保险机构对保险产品的精细化设计和进行差异化的精准营销。目前在学术界,互联网保险作为一个新兴的领域,大多数研究仍处在案例研究、对比研究等初步阶段,实证研究乏善可陈。本文拟结合计划行为模型(TPB)和技术接受模型(TAM),在一个较综合的框架下建立互联网保险购买意向模型,并利用K-Means聚类技术对客户进行细分,利用结构方程模型验证影响互联网保险客户购买意愿的主要因素。

表1 2011—2016年互联网保险发展概况

1 文献综述

目前,学术界关于“互联网保险”的定义和类型划分出现分歧。总体趋势是:它的概念边界和类型不断延伸、补充。学者最早提出的是较为狭义的定义,认为互联网保险就是“通过互联网销售保险”[3]。这种观点与互联网保险完整的业务体系相违背,遭到学者批评。后来有学者将其定义拓展为“保险公司或者保险中介机构借助互联网为客户提供产品及相关服务信息,实现网上投保、承保、保全和理赔等保险业务,完成保险产品的在线销售及服务,同时借助第三方机构来实现保险相关费用的电子支付等经营管理活动”[4]。在此基础上,何丽新等[5]又将因互联网而生的“互联网信息安全保险”纳入其中,将互联网保险划分为“互联网信息安全保险”、“O2O保险业务”、“网销保险业务”3种类型,拓展了互联网保险的概念内涵。关于互联网保险的商业模式,在互联网保险发展初期,已有学者对其商业模式进行了设计,如Adam Klauber[6]提出了4个战略业务模型,分别是互联网保险交易平台、职域营销、保险业务处理和创新型保险产品。何德旭等[7]划分了3个模式:官方网站模式、第三方电子商务平台模式(又可划分为综合电商平台和保险中介电商平台)以及专业互联网保险公司模式,并认为随着保险经营的本质与互联网特性的深度融合,商业模式将面临新的变革,促使金融市场重塑新格局[7]。中国保险行业协会在2014年发布的《互联网保险行业发展报告》,对互联网保险模式进行总结后划分为5类,如表2所示[8]。

表2 互联网保险商业模式

围绕着互联网保险,目前学者的研究以定性为主,主题涉及互联网保险的发展状态(发展速度、产业规模、品种设计等)、与其他国家或地区(美、英、日、台湾等)的对比分析、对传统保险业的影响以及存在问题(法律问题、监管问题等)的研究。具体而言,陈秀芬等[9]在大数据背景下分析了我国互联网保险的现状,但仍然受安全性缺失、产业结构单一、传统行业制约、新产品收益低等方面的限制。李亚光等[10]分析了我国互联网保险的发展基础、过程与逻辑。王洋[11]借鉴日本、英国、美国互联网保险行业的监管经验,结合我国国情提出促进我国互联网保险行业健康有序发展的建议。与此类似,池骋等[12]从法制的视角从台湾地区获得经验启示,拟通过有效的法律规则分散、消除互联网保险运营过程中的法律风险。为了研究互联网保险对传统保险业的冲击,刘远翔以7家财产保险公司和7家人寿保险公司为样本,运用SFA(stochastic frontier approach)进行实证研究,发现互联网保险业务对传统保险企业成本效率与利润效率都有积极影响[13]。何丽新等[5]以类型化分析为视角,研究了互联网保险对于传统保险法律规则的冲击与重塑。在问题与风险方面,何德旭等[7]将互联网保险的风险划分为技术风险、金融风险、系统性风险3类,而崔宇清等[14]基于最大诚信原则梳理了我国互联网保险的法律风险并提出相应对策。总体而言,目前研究大多处在初步阶段,不系统、不深入,案例研究较多,基本都是定性的方法。有关消费者对互联网保险购买意愿的研究非常少,实证检验更是一片空白。互联网保险若想长足发展,就必须重视消费者的购买心理和购买行为,如何引导消费者做出购买决策便成为一项重要课题。

2 基于RFM和K-Means聚类的互联网保险客户特征分析

2.1 数据选取与分析流程

本文实证数据为ZH财险公司开展的互联网保险业务中的车险客户数据。之所以选择车险客户数据,一是由于车辆保险在机动车持有量持续增长态势下发展迅猛;二是由于在ZH财险公司的互联网保险业务中,互联网车险占比最大,很大程度上可反映出整体客户特征,在和传统保险的对比研究中也更有意义。由于此次调研数据来自车险承保系统、车险理赔系统、核心系统、电子商务系统等多个业务系统数据库,这些系统采用了DB2、Oracle等多种数据库,给数据迁移带来一定难度。为此,本文利用ETL工具Kettle[注]Kettle中文名为“水壶”,是一款国外开源的ETL工具,纯java编写,可以在WindowLinuxUnix上运行,数据抽取高效稳定。完成数据迁移,并建立完整的数据仓库,数据流向如图2所示。Kettle 是Pentaho开源商业智能套件中的一个ETL组件,具有开源、高效、设计界面易用且功能强大的特点。

图2 获取实证数据

为保证此次客户特征分析更为科学,选取保险周期在2015-2016年内的客户数据,这样既能保证数据时效性,又能保证在分析赔付率等指标时的有效性。由于研究内容涉及客户特征分析与客户购买行为意愿,因此本文采用的客户数据均为投保人数据。在研究客户特征时,分析流程如图3所示。

图3 互联网保险客户特征分析流程

2.2 数据预处理与客户基本特征对比分析

ZH财险自2004年开始信息化建设,逐步启用包括车险承保系统在内的八大业务系统。由于在系统建设初期没有形成以客户为中心的认知,ZH财险客户数据质量较差,在正式分析前需要进行大量预处理工作。这些工作主要包括:

1) 数据规范。修改不符合规范的数据,包括去除空格、字母大小写转换、去除字段中的特殊符号等;

2) 客户唯一性识别。将身份证号码作为客户唯一性识别标识,并通过身份证校验位完成对身份证的校验,删除未通过校验的无效数据;

3) 缺失值补充。仅用删除方法处理缺失数据会造成样本量不足或评估结果偏差,因此借鉴乔丽华[15]、邓银燕[16]、庞新生[17]等学者的研究结论,采用多重填补法对缺失数据进行科学填补。

4) 基于RFM的字段选取。首先选取可能对个人态度有显著影响的客户基本特征字段,如性别、年龄、收入状况(机动车购置价)、地区等;然后结合CRM理论中的经典客户分析模型——RFM模型,选取客户最近一次的购买时间R(recency)、客户购买频度F(frequency)、客户保费M(monetary)3个指标,如表3所示。

5) 数据集成。将所有指标数据集中在一张表中,最终获得143 285条有效的互联网车险客户信息。

表3 RFM模型指标含义

注:由于数据是2015/2016年度的数据,分析时间点为2017年1月1日

根据搜集数据,运用Excel对互联网保险客户的基本特征进行统计分析,并与传统保险客户进行对比,其结果如表4所示,可得几点基本结论:

1) 互联网保险客户的评价年龄是37岁,传统保险客户的平均年龄是42岁,这说明互联网保险客户体现出年轻化的趋势特征,但并不明显。而根据《2016中国电商消费行为报告》[18],26~35岁(80后)年龄段是线上消费的主力军,保险客户的年龄明显偏大。这很好理解,因为机动车保险业务一般限制投保人年龄在16岁以上,且年轻人经济压力大、无财富积累、无风险意识,而年长成熟的消费者则乐于通过购买保险管控风险。

2) 车险投保人客户存在明显的性别差异。无论是互联网保险还是传统保险,男性投保人都占绝大多数,分别达到81.33%和77.24%的比重。

3) 从互联网车险渠道客户的地区分别来看,华东地区占比达77.26%,西北地区仅占0.88%,反映出我国各地区在互联网与互联网保险的普及方面差异较大,发展不均衡,也反映出华东地区消费者超前的消费模式转变,特别是“江浙沪”地区的消费者已将网上消费培养成习惯。

表4 互联网保险客户与传统保险客户的基本特征对比

2.3 基于K-Means的客户细分

利用clementine12数据挖掘工具中的K-Means模型对ZH财险的148 235条符合研究要求的客户信息进行聚类分析,从而完成客户的精确细分。K-Means算法最早由MacQueen提出[19],因易于描述、时间效率高、适于处理大规模数据等优点,得到广泛应用[20]。它的基本思想是:使n个数据点{x1,x2,…,xn}到与它最近的聚类中心{a1,a2,…,ak}的距离平方和Wn最小。Clementine中的K-Means模型用欧几里德距离来计算类内差异和类间差异。欧几里德距离一般用来测量n维空间中两点之间的距离。Wn、类内差异、类间差异的公式如下。

目标函数:

(1)

类内差异:

(2)

类间差异:

(3)

图4 各K值对应的类间评价相似度

K-Means聚类的相关统计量总结在表5中。

表5 K-Means 聚类结果汇总

根据以上聚类结果,ZH财险互联网车险客户可以细分为4类:

1) 核心客户群体——华东地区男性投保人客户(聚类1)。这部分客户有82 079条记录,占全部记录的55.37%。年龄分布以中年为主,与整体互联网车险客户年龄分布基本一致。这部分客户近期购买次数的平均值为2.067,在4类客户群体中最高,整体较活跃。

2) 高潜力客户群体——年轻的女性白领客户(聚类2)。这部分客户年龄在26~40年龄段,有28 965条记录,占全部记录的19.54%。长期以来,我国男性是驾车主体,男女数量差距较大,但在国外,男女对机动车辆的消费几乎同步。近年来随着我国女性驾车比例逐年攀升,女性成为了机动车消费的潜力人群,具有极大的市场空间。女性机动车辆消费的提升势必引起女性投保人客户群体的增长。

3) 高价值客户群体——富裕型女性投保人客户(聚类3)。这部分客户的平均保费为4类客户群体中最高,平均机动车价值也最高,有15 033条记录,占全部记录的10.14%。这部分客户的年龄偏大,基本集中在41~55年龄段,说明这部分客户具有较好的财富积累,也是ZH财险比较有价值的客户群体。

4) 其他地区男性投保人群体(聚类4)。这部分客户近期保费M(monetary)均值和近期投保次数F(frequency)均值在4类客户中均最低,客户价值有限,但客户数量有一定占比(14.95%),因此不能忽视。

3 消费者互联网保险购买意愿的模型构建与实证检验

3.1 模型的理论依据与构思

前面探究了互联网保险客户群体的基本特征,这些特征因素在一定程度上决定了消费者互联网保险的购买行为意愿。但是,影响购买意愿的因素是多方面的,尤其是心理因素,本文拟综合计划行为理论(theory of planned behavior,TPB)和技术接受模型(technology acceptance model,TAM),运用结构方程模型进行相关探究。

所谓意愿,是指个人从事特定行为的主观概率,购买意愿即消费者愿意采取特定购买行为的几率,是购买行为的预测因素。虽然学术界对购买意愿是否能有效预测购买行为这一问题上尚未达成一致,但多数研究支持用购买意愿研究购买行为。在研究购买意愿方面,计划行为理论是主流理论之一,认为意愿是由消费者对于事物的态度(attitude)、反映社会环境影响的主观规范(subjective norm)和感知到的难易程度——感知行为控制(perceived behavior control,PBC)3个方面共同决定。行为主体对某一行为的态度越趋向于正面,感知到的社会环境压力越大,执行行为的信心越足,对待该行为的意向表现得越强烈[21]。已有文献中,计划行为理论对可持续生产产品的购买意愿、家电下乡产品的购买意愿、伦理购买决策机制、延迟购买偏好反转等均有很强的解释力[22-24]。

除了计划行为理论,也有学者关注信息技术的采纳和使用。Davis从行为科学的视角,在理性行为理论(TRA)的基础上提出了技术接受模型。该模型指出有两个因素影响着行为主体是否愿意或能够使用信息技术,分别是感知有用性(perceived usefulness,PU)和感知易用性(perceived ease of use,PEOU)[25]。感知有用性是体现用户感觉或者意识到使用某一具体的信息技术系统对其工作、生活提高的程度大小;感知易用性反映用户感知到其使用一种系统的难易程度。TPB和TAM模型分别从不同视角进行了考虑,整合这两种视角,可获得更全面、完整的模型。

基于此,本文提出如图5所示模型。

图5 模型构思

本文构思的模型涉及感知有用性、感知易用性等共6个变量,针对各个变量的测量,学术界均已开发出成熟的量表。在设计调查问卷时,为了保证测量的内容效度,本文使用这些成熟的量表(参见表6),且均为李克特七级(完全不同意—完全同意)量表[26-29]。

表6 各预测变量测量题项与依据

3.2 结构方程模型的实证分析

笔者通过问卷调查的方式获取数据,在正式发放问卷前,先通过偶遇抽样(accidental sample)方法,在高校周围进行预调查。由于互联网保险概念较新,因此在问卷中添加对互联网保险的解释。预调查共回收45份问卷,通过填写反馈情况,结合专家意见,对部分题项进行修整,编制出正式调查问卷。正式问卷通过两种途径发放:一是纸质问卷现场发放,二是委托专业调查平台——问卷星(http://www.sojump.com)进行网络发放。最终,共发放问卷300份,回收问卷277份,进一步剔除数据缺失、前后矛盾以及明显规律性作答的无效问卷后,剩余有效问卷263份,有效回收率87.67%。

1) 信效度检验

首先进行信效度检验。运用SPSS 19.0,以Cronbach’s α 系数作为信度的判断标准,0.5以上符合基本要求,0.7以上说明信度良好。信度检验结果如表7所示。可见,所有变量的信度系数均在0.5以上,最高信度值达0.93,整体量表的信度值为0.867,说明信度状态较好,通过了信度检验。

表7 信度检验结果

在效度检验中,建构效度又分为收敛效度和判别效度。按照吴明隆[30]的观点,一般以3条标准评估收敛效度:① 标准因子载荷大于0.5,0.7以上更理想;② 组合信度值在0.6以上;③ 平均提炼方差(AVE)大于0.5。运用AMOS21.0得到表8的结果。可见,除了个人态度的最小因子载荷略低于0.5(0.477)和感知行为控制的组合信度略低于0.6(0.590),其他均符合收敛效度的要求,说明收敛效度良好。判别效度检验的传统做法是比较因子本身的AVE值的算术平方根是否大于该因子与其他因子的相关系数。由表8中的AVE值和最大相关系数计算得出,所有变量的判别效度均通过了检验。

2) 结构方程分析

以AMOS21.0为工具,进一步探究调查所得的问卷数据和假设模型是否拟合,即进行模型的适配度检验,检验的指标主要包括X2/df、RMSEA、RMR、CFI、GFI、NFI、RFI、IFI和TLI,如表9所示。可见,量表的所有指标均达到适配的标准值要求,模型拟合度好,无需进行模型修正。

表8 效度检验结果

表9 互联网保险购买意愿模型常用拟合指数

结构方程模型共包含7条路径,各个路径的模型参数估计总结在表10中。可见,除了CA←PU(个人态度←感知易用性)没有通过显著性检验(P=0.109)之外,其他各条路径均通过显著性检验。而且各个路径的系数符号均为正,说明各变量对购买意愿的影响均为正向影响;通过标准系数对比,可以发现主观规范对购买意愿(BI←SN)的影响效果(0.572)以及感知行为控制对购买意愿(BI←PBC)的影响效果(0.644)均明显大于其他路径,感知行为控制影响最大。这可能和互联网保险认知度高有关,且感知有用性和感知易用性均对购买意愿起到显著正向作用。值得注意的是,根据温忠麟等[31]的判断标准,个人态度在感知有用性与购买意愿之间起部分中介作用(BI←CA←PE),而个人态度在感知易用性与购买意愿之间并未起中介作用。

表10 路径模型参数估计

注:*代表显著性水平P<0.05,**代表P<0.01,***代表P<0.001

4 结论与启示

本文以ZH财险的互联网车险客户数据和问卷调查数据进行实证分析,运用K-Means聚类技术完成客户细分,并综合TPB和TAM理论构建消费者互联网保险购买意愿模型,运用结构方程模型检验该模型。通过研究得出以下基本结论

1) 通过特征分析与对比,发现互联网保险客户在年龄分布和地区分布上与传统保险客户存在差异,互联网保险客户更为年轻且集中在华东地区;

2) 经过K-Means聚类的客户细分,发现互联网车险的核心客户群体——华东地区男性投保人客户、高潜力客户群体——年轻女性百丽客户、高价值客户群体——富裕型女性投保人客户;

3) 通过结构方程模型,证明感知有用性、感知易用性、个人态度、主观规范、感知行为控制均对互联网保险购买意愿有显著的正向影响,个人态度在感知有用性与购买意愿之间起部分中介作用,而且由于消费者普遍对互联网保险认知度不高,造成对购买意愿影响最大的因素为反映个人掌控能力的感知行为控制因素和反映环境压力的主观规范因素。

针对以上结论,本文对互联网保险经营发展提出以下建议:

1) 在营销策略上,根据客户细分结论,重点向华东地区投放广告;充分利用大数据、云计算等技术挖掘潜在重要客户,并通过多种渠道进行精准营销;在投放线下广告时,重点投放在男性客户经常活动的区域,在针对高价值客户群体营销时,采用交叉销售的形式增加客户续保率。

2) 在产品设计上,重点关注核心客户群体的保险需求,并提供可定制的个性化保险产品,在照顾核心客户群体需求的基础上尽可能扩大产品的受众。由于互联网保险购买意愿受感知行为控制影响最大,互联网保险产品的业务流程设计应注重用户友好性与操作上的简易性,保证消费者能够自如地在线完成投保、承保、核保、保全和理赔等保险业务。

3) 在产品服务上,尽可能大地提升客户满意度,因为主观规范对互联网保险购买意愿的影响非常显著,只有让现有的互联网保险客户获得良好的服务体验,才能在市场中赢得口碑,在消费者群体中形成羊群效应。

猜你喜欢
意愿客户模型
健全机制增强农产品合格证开证意愿
适用于BDS-3 PPP的随机模型
重要模型『一线三等角』
陪客户喝酒后死亡是否算工伤
模型小览(二)
如何有效跟进客户?
充分尊重农民意愿 支持基层创新创造
离散型随机变量分布列的两法则和三模型
做个不打扰客户的保镖
23