金融知识与家庭商业保险需求
——基于中国家庭金融调查(CHFS)数据的分析

2020-02-02 06:40胡旻皓
上海立信会计金融学院学报 2020年5期
关键词:商业保险变量样本

胡旻皓

(上海财经大学统计与管理学院,上海200433)

一、引言

2014年国务院印发的《关于加快发展现代保险服务业的若干意见》(简称《意见》)指出:“保险是现代经济的重要产业和风险管理的基本手段,是社会文明水平、经济发达程度、社会治理能力的重要标志。”商业保险作为社会保障体系的重要组成部分,对我国经济社会的发展意义重大。2016年国务院印发的《推进普惠金融发展规划(2016—2020年)》(简称《规划》)指出现阶段我国普惠金融的建设目标为“到2020年,建立与全面建成小康社会相适应的普惠金融服务和保障体系。”《规划》中将“保障体系”作为普惠金融工程的重要分支,体现了健全包括商业保险在内的社会保障体系对我国普惠金融建设的重要意义。

普惠金融的发展不仅需要政府功能的完善与企业经营水平的提高,还需要城乡居民金融知识与金融素养的提升。建立与全面建成与小康社会相适应的普惠金融服务和保障体系,不仅要完善客观层面的保险服务体系,更要关注居民主观层面的金融参与态度,做好金融知识的普及和金融行为引导工作。因此,对居民金融知识与商业保险需求之间的关系进行研究至关重要。新时代的金融环境对金融从业者提出了更高要求,而普通民众也需要提升自身的金融知识水平以适应金融业的发展。金融知识的普及能够有效提升群众对金融产品、金融服务种类与作用、金融风险管理等方面的认知。金融知识视角下的家庭商业保险需求分析,完善了商业保险需求动因的理论体系,同时也对通过提升居民金融知识促进商业保险行业的发展提供了现实指导。

二、文献综述

(一)商业保险需求相关研究

商业保险需求的宏观角度研究主要关注宏观经济指标与商业保险需求的关系。孙伟等(2013)利用我国2001—2011年省级面板数据,分析了房地产价格与人身保险需求的关系,得出房价对我国居民购买人身保险意愿有抑制效应的结论。赵红梅和苏慧娟(2013)使用省级面板数据,采用固定效应模型进行实证分析,发现包括地区、收入、固定资产投资和人口等多个显著影响商业财产保险需求的因素。李后建(2013)采用多个国家1995—2005年的面板数据进行研究,发现影响不同收入群体商业保险购买意愿的因素是有差异的。王悦(2013)认为影响人身保险需求的因素主要有财政支出、经济周期、人口总数和储蓄水平,影响财产保险需求的因素主要有国内生产总值、固定资产和经济总体发展状况。

商业保险需求的微观角度研究主要关注家庭或个人自身条件与商业保险购买决策之间的关系。黄瑞芹(2013)利用贫困地区少数民族自治县的相关数据,分析了农户对养老保险的潜在需求,发现农户的保险参与决策与真实意愿存在偏差。边俊杰和汪艳莉(2018)从环境污染角度研究稀土矿区居民的商业保险需求,发现居民居住地距离矿区越近,对稀土开发污染的危害了解越深,商业健康险的投保意愿越强烈。江海洋和谷政(2018)使用中国家庭金融调查(CHFS)2015年的调查数据,用人情往来支出测度社会互动频率,认为社会互动越频繁,家庭商业保险需求越高。王晓全等(2019)利用中国家庭追踪调查(CFPS)数据,用受访者字词能力、数学能力与记忆能力得分度量认知能力,发现认知能力较高的中老年人的商业保险需求较高。

(二)金融知识相关研究

理论研究方面,Lusardi 等(2017)使用生命周期理论构建个体金融知识对金融行为影响的理论模型,研究金融知识积累带来的投资回报。该研究建立了单个金融资产储蓄模型与金融资产组合模型,最终估计出美国居民退休后财富水平30%~40%的不均衡是由金融知识水平差异造成的,认为金融知识对居民的财富水平、储蓄优化决策、金融市场参与、投资组合收益等多方面均会造成影响。

实证研究方面,现有文献主要分为两类:一类主要研究金融知识与财富积累的关系,另一类主要研究金融知识与金融行为的关系。

金融知识与财富积累关系研究中,大部分成果证明了金融知识对家庭与个人财富积累具有正向影响。Lusardi和Mitchell(2014)基于各国调查数据建立实证模型,发现金融知识与家庭财富积累水平存在显著的正相关关系。王正位等(2016)借助转移矩阵计量法,对金融知识水平与低收入家庭阶层流动性进行研究,发现金融知识对家庭阶层向上流动的概率具有显著正向影响,并得出“知识改变命运”的结论。

金融知识与金融行为关系研究中,大部分成果表明金融知识能显著提升居民与家庭在各类金融市场与金融活动中的参与度,且金融活动范围大多为金融风险资产投资。Rooij 等(2011)使用荷兰银行家庭调查数据研究金融知识与家庭股票投资的关系,发现缺乏金融知识的家庭具有较低的股票投资意愿。尹志超等(2015)的研究表明,金融知识的匮乏会降低我国居民的金融市场参与度,减少以股票为代表的风险资产配置比例。杜征征等(2017)采用倾向性评分匹配法,研究金融教育培训与投资者自身权益保护的关系,发现金融教育培训能显著提高投资者的金融产品选择能力与金融风险防范意识。

三、数据与模型

(一)数据来源和预处理

本文使用中国家庭金融调查CHFS2013、CHFS2015和CHFS2017 问卷调查结果,问卷调查包括家庭信息、家庭地域和个人信息三张数据表。考虑到家庭信息中受访者主观态度与个人信息中个人客观特征的一致性,本文对个人信息表进行数据筛选,即每个家庭只保留受访者本人数据,以保证家庭信息表信息与家庭地域表信息对应。

核心被解释变量为家庭商业保险参与决策和家庭商业保险投入资金比例。参与决策为虚拟变量,如果受访者所在家庭至少有一名家庭成员在过去一年享受商业保险服务,则认为该家庭购买了商业保险,变量取值为1,否则取值为0。投入资金比例为数值型变量,取值为每个家庭成员在过去一年中的商业保险保费支出与该年家庭年收入的比例。核心解释变量为金融知识变量,以问卷中“您是否上过经济或金融类课程”问题的回答结果为依据,回答“是”则视为受访者学习过金融知识,变量取值为1,否则取值为0。本文涉及的其他变量均直接由问题选项得出,不需要额外的计算逻辑,在此不做详述。

经过数据关联,找出三次调查中共同存在的样本家庭,并根据实证分析需要过滤截至2013年调查时间点未受过金融课程培训、数据缺失和数据异常的样本,最终得到14805条有效样本。

(二)数据结构与变量

变量定义和取值如表1所示。金融知识变量为非时变变量,代表截至2015年调查时间点家庭受访者i是否学习过金融知识。其他变量具有样本编号与时间两个下标。时间下标t=0表示变量在2013年的取值,t=1表示变量在2017年的取值。样本编号下标i的取值范围为[1,14805]。

购买商业保险是家庭行为,被解释变量定义在家庭层面上,控制变量也纳入家庭成员个数、户籍、地区等家庭层面特征变量。由于只能获取家庭部分受访者信息,故采用受访者个人层面变量作为家庭层面的代理变量,这也是家庭金融领域研究的常见做法。宁光杰(2014)在有关家庭金融性财产收入的研究中,考虑了户籍和地区等家庭层面变量,同时纳入户主性别、年龄、学历、政治面貌等个人层面变量。孟亦佳(2014)以调查受访者作为家庭代表,使用受访者在识字测试与数学测试中的得分度量认知能力。吴卫星等(2018)通过对受访者的常见金融资产了解程度进行因子分析得到金融素养变量。本文遵循家庭金融研究领域的惯例,用受访者个人层面变量(如金融知识、性别、年龄、风险态度等)作为家庭层面的代理变量。

表1 变量定义

控制变量的选取参考家庭商业保险需求的相关研究成果。黄毓慧和邓颖璐(2013)的研究发现,与家庭持有保险行为有显著相关性的因素包括年龄、风险态度、健康自评、教育年限、家庭资产与负债水平等。王晓全等(2019)认为,除认知能力外,年龄、教育程度、健康自评、家庭人口规模、户籍、家庭收入也是影响家庭商业保险需求的重要因素。许荣等(2013)在新农合对农户商业医疗保险需求影响的研究中,发现显著的控制变量包括学历、性别和一些度量生活习惯的变量。在现有研究成果的基础上,本文将人口学变量(性别、出生年份、婚姻状态、学历、家庭成员个数)、家庭户籍变量(户籍、家庭所在地区)、家庭经济水平变量(家庭收入)和主观变量(自评健康程度、风险态度、幸福感)作为控制变量。

(三)实证模型

现有文献大多从需求可能(持有行为发生概率)和需求程度(持有资产数量)两个方面对家庭持有金融资产行为问题进行研究,本文的两个核心问题同样基于这种研究思路提出。对需求可能的研究,现有成果大多采用Logit模型和Probit模型。对需求程度的研究,部分学者采用OLS模型,部分学者考虑到被解释变量的左截断性,采用Tobit模型进行分析。黄毓慧和邓颖璐(2013)、王晓全等(2019)采用Probit模型和Tobit模型的组合,江海洋和谷政(2018)则采用Probit模型。本文在实证分析与稳健性检验中使用Logit模型、Tobit模型、Probit模型与OLS模型,同时,建立倾向性评分匹配—双重差分模型(PSM-DID)解决内生性问题。

本文采用Logit模型,分析金融知识对家庭商业保险参与决策的影响。以样本家庭t=1时刻的商业保险参与决策为被解释变量,样本家庭金融知识为解释变量,并加入t=0时刻的控制变量,模型结构为:

在金融知识对家庭商业保险投入资金影响的模型中,解释变量家庭商业保险投入资金比例为数值变量。家庭购买商业保险投入的资金量以家庭购买商业保险为前提,在家庭未购买商业保险的条件下投入资金比例取值为0。本文采用受限解释变量回归模型中的Tobit模型,以样本家庭t=1时刻商业保险投入资金比例为被解释变量,以样本家庭金融知识为解释变量,加入t=0时刻的控制变量,建立如下模型:

为研究金融知识对家庭商业保险需求影响机制的城乡差异,本文采用分组建模法,分别对城市样本与农村样本建模。

(四)内生性处理

1.准自然实验设计

为弥补内生性问题引发的因果推断缺陷,本文采用准自然实验法,在双重差分模型框架下进行实证研究。双重差分模型要求样本具有面板数据结构,且至少存在解释变量代表事件发生前与发生后两期观测数据。本文以金融知识(是否接受金融课程培训)为解释变量,样本数据满足以下条件:

(1)所有样本在第0期未接受金融课程培训。

(2)实验组在第0期与第1期之间接受了金融课程培训,控制组始终未接受金融课程培训。

(3)所有样本的被解释变量具有第0期和第1期两期数据。

对中国家庭金融调查结果进行整理后,调查数据可以满足双重差分模型的数据结构需求。实验设计示意图如图1所示。

图1 实验设计示意图

本文从三次调查数据中获取以下信息:

(1)CHFS2013:样本家庭的金融知识状态(截至2013年调查时点是否接受金融课程培训)、商业保险参与决策(2013年调查时点前一年是否购买商业保险)、商业保险投入资金比例(2013年调查时点前一年商业保险投入资金比例)、倾向性评分估计变量。该部分数据对应变量t=0时刻的取值。

(2)CHFS2015:样本家庭金融知识状态(截至2015年调查时点是否接受金融课程培训)。该部分数据对应金融知识变量的取值。

(3)CHFS2017:样本家庭商业保险参与决策(2017年调查时点前一年是否购买商业保险)、商业保险投入资金比例(2017年调查时点前一年商业保险投入资金比例)。该部分数据对应变量t=1时刻的取值。

对于实验分组的构建,首先选取截至2013年调查时点未接受金融课程培训的样本,根据该样本截至2015年调查时点的金融知识状态,把2013年调查时点至2015年调查时点接受过金融知识培训的样本划入实验组,其余样本划入对照组。

2.双重差分模型

根据实验设计方案,本文建立如下双重差分模型:

其中,T为时间变量,T=0代表2013年,T=1代表2017年。

3.倾向性评分估计

本文使用的金融知识分组变量由样本自主选择产生,导致的样本自主选择偏差符合倾向性评分匹配算法的应用场景。本文采用离散选择模型中的Probit模型,以样本家庭的金融知识为被预测变量,t=0时刻的控制变量为预测变量,估计样本家庭金融知识学习的倾向性评分。模型结构如下:

四、实证分析

(一)金融知识对家庭商业保险需求影响的实证分析

变量描述性统计结果显示(见表2),全部样本共14805个。变量取值范围均在合理范围中,没有异常值。样本在性别、户籍分布上较均衡,43%的受访者为女性,44%的受访家庭为农村家庭。空间分布上,东部地区样本占比42%,其余样本来自于中西部地区。大部分样本受访者婚姻状况为已婚,已婚占比88%。

表2 变量描述性统计

1.金融知识对家庭商业保险参与决策的影响分析

金融知识对家庭商业保险参与决策影响的实证结果如表3所示。其中,模型(1)只加入核心解释变量,模型(2)加入家庭层面的控制变量,模型(3)加入所有控制变量。表3显示,三个模型中金融知识变量的系数为正,且在1%的水平上显著,说明金融知识对家庭商业保险参与意愿有显著的提升作用。

表3 金融知识对家庭商业保险参与决策的影响

表4 城乡异质性分析结果(一)

金融知识对家庭商业保险参与决策影响的城乡异质性实证结果如表4所示。模型(1)为城市样本模型,金融知识变量系数为正,且在1%的水平上显著,说明金融知识对城市家庭商业保险参与意愿有显著的提升作用。模型(2)为农村样本模型,金融知识变量不显著,说明金融知识对农村家庭商业保险参与意愿无显著影响。

2.金融知识对家庭商业保险投入资金的影响分析

金融知识对家庭商业保险投入资金影响的实证结果如表5所示。其中,模型(1)只加入核心解释变量,模型(2)加入家庭层面的控制变量,模型(3)加入所有控制变量。表5显示,三个模型中金融知识变量系数为正,且在1%的水平上显著,说明金融知识对家庭商业保险投入资金有显著的提升作用。

表5 金融知识对家庭商业保险投入资金的影响

表6 城乡异质性分析结果(二)

金融知识对家庭商业保险投入资金影响的城乡异质性实证结果如表6所示。模型(1)为城市样本模型,金融知识变量系数为正,且在1%的水平上显著,说明金融知识对城市家庭商业保险投入资金比例有显著提升作用。模型(2)为农村样本模型,金融知识变量系数不显著,说明金融知识对农村家庭商业保险投入资金比例没有显著影响。

结合上文结论,无论是商业保险需求可能还是需求程度,金融知识都不能提升农村家庭商业保险需求,这与农村地区金融基础设施建设水平有关。由于金融服务网点匮乏,少数具备金融知识的农村家庭无法顺利获取符合自身需求的金融服务,导致金融知识无法提升农村家庭商业保险需求。

(二)内生性处理与稳健性检验

1.倾向性评分匹配

根据式(5)建立倾向性评分估计模型。经过倾向性评分估计后,对于满足重叠性假设的样本,本文选择使用1:1 有放回匹配法进行匹配。由表7可知,匹配前倾向性评分模型的Chi2统计量为343.87,在1%的水平上显著,匹配后倾向性评分模型的Chi2统计量为5.13 但不显著,说明倾向性评分模型在匹配前有效,在匹配后无效。对于变量的标准化偏差,匹配前标准化偏差的均值与中位数在20%~30%,匹配后标准化偏差均值与中位数在4%~5%,说明匹配算法减小了实验组与对照组各变量的标准化偏差。Rubin(2001)提出Rubin’s B统计量小于25 且Rubin’s R统计量取值区间为[0.5,2],样本即被有效平衡。由表7可知,匹配前Rubin’s B统计量大于25,匹配后小于25,说明样本经过匹配后得到了很好的平衡。具体到每个变量(见表8),所有变量匹配后的标准化偏差大幅降低,且标准化偏差在10%以内。

表7 倾向性评分匹配结果

表8 匹配前后变量对比

2.双重差分模型

根据式(3)和式(4),使用匹配后的样本进行拟合,回归结果如表9所示。在控制系统性非时变差异和外部共同趋势的影响后,双重差分项系数都为正且在5%的水平上显著,说明内生性问题处理后的实证结果依然稳健。

3.其他稳健性检验

对于实证分析基准模型中的Logit模型与双重差分模型中的Logit模型,本文选择替换为Probit模型。对于实证分析基准模型中的Tobit模型与双重差分模型中的Tobit模型,本文选择替换为经典线性回归模型。在替换模型的同时,使用稳健标准误对变量显著性检验进行修正。替换模型与使用稳健标准误后得到的回归结果显示,关键系数符号与显著性没有发生本质变化。

表9 双重差分模型

五、结论与政策建议

(一)主要结论

实证研究结果显示,金融知识对家庭购买商业保险意愿和家庭商业保险投入资金有显著提升作用。金融知识在提高家庭风险管理意识与商业保险认知的同时,一方面激发了居民的风险分散需求,提升了家庭参与商业保险的意愿,另一方面扩大了家庭商业保险的需求程度,提高了家庭在商业保险活动中的资金投入。综上所述,本文认为金融知识可以提高家庭商业保险需求。

(二)政策建议

1.加大金融知识普及的广度与深度

金融知识能显著提升家庭商业保险需求,并提高家庭商业保险需求的广度与深度。金融知识普及对商业保险行业的健康发展和普惠金融战略的推动具有重要意义。

2.发挥商业保险公司在金融知识普及中的作用

金融知识的完善能提升家庭商业保险需求,而商业保险公司对金融知识的普及具有天然动力。商业保险业的发展不能完全依赖市场环境的改善,政府部门应加强对商业保险公司的引导与监管,提高从业人员的业务水平,使居民购买商业保险的过程成为学习金融知识的途径之一,强化商业保险业在金融知识普及过程中发挥的作用,促进我国商业保险行业健康发展。

3.立足城乡差异现实推进商业保险推广工作

在金融基础设施建设水平较高的城市,金融知识充分发挥了促进家庭商业保险需求的功能,而在金融基础设施建设水平较低的农村没有发挥相应的作用。在推广商业保险过程中,要立足城乡差异的现实,在城市更多地从普及金融知识的角度推广商业保险,而在农村地区应加强金融基础设施建设。

猜你喜欢
商业保险变量样本
抓住不变量解题
用样本估计总体复习点拨
浅析新媒体时代商业保险的商机与挑战
也谈分离变量
商业保险和工伤保险可以同时享受吗
推动医改的“直销样本”
我国商业保险参与养老保险的协调发展
探讨如何促进我国社会保险与商业保险的融合发展
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本