我国保险密度和保险深度的空间统计分析
——基于R语言

2021-05-22 07:03姚正锟张连增
保险职业学院学报 2021年2期
关键词:保险市场保险业密度

姚正锟,张连增

(南开大学 金融学院,天津300350)

一、引言

近年来,我国保险业不断发展,尤其是2014年出台的《国务院关于加快发展现代保险服务业的若干意见》(以下简称“新国十条”),使我国保险业进入到一个新的快速发展阶段。从我国保险业的保费收入来看,根据国家统计局数据,2014年我国总保费收入为18849.48 亿元,到2018年达到35438.5 亿元,增长了88%;2014年我国人均保费为1383.49 元/人,2018年为2537.61 元/人,增长了83%。虽然我国保险业在近几年发展迅猛,总保费收入、人均保费收入在4年间增长将近一倍,然而由于全国各地区的经济发展水平、政策导向等方面的不同,保险业发展的空间不均衡性也日益明显。消除掉地区人口数量差异,我们从人均保费上就可以看到,2018年我国人均保费收入最高的地区是北京,为8324.98 元/人;而最低的西藏仅为972.38元/人,北京是西藏的8.56 倍,是全国平均水平的3.28 倍。由此可以看出我国保险业的发展存在较为明显的空间不均衡。

衡量保险市场成熟与发达程度的指标有很多,本文将采用我国2018年的保险深度和保险密度作为衡量保险市场的指标。保险密度是指区域内的人均保费,它代表着该区域保险市场的发展水平,同时也可以体现当地的经济发展水平与人们保险意识的强弱。保险深度是指区域内的保费收入占当地生产总值的比例,反映该区域的保险业在当地经济中的地位。这两个指标可以很好地体现我国保险市场的相关信息[1]。

本文不同于以往的空间统计分析之处在于,并没有使用传统的诸如ArcGIS 一类的GIS 软件,而是选择使用R 语言进行相关分析。R 作为一种免费的开源软件,拥有极其出色的统计分析和图形显示功能。本文将使用R 软件对我国保险市场的空间分布进行相关的统计分析,同时介绍相关的R程序包。

二、保险市场空间统计分析相关原理

(一)空间权重矩阵

Arthur Charpentier(2015)[2]提到空间权重矩阵是检验空间相关性的基础。给定一个划分为n个区域的地图,我们用n×n矩阵W表示它们的空间关联度或接近度。元素Wij表示区域i和区域j之间的权重、连接度或空间接近强度。对角线元素为空,wii=0 对所有i= 1…n。非对角线元素可以任意选择,但应考虑所分析问题的具体方面。然而,在大多数应用中,矩阵W的选择相对简单。一般地wij≥0。矩阵W的一些最常见选择性质如下:

1.如果区域i和j共享边界,那么wij= 1,否则wij= 0。这种二元对称矩阵称为邻接矩阵。

2.如果区域i和j的质心距离(在中国地图中就是各个省份行政中心的距离)dij小于某个阈值d*,那么wij=1,否则为0。

3.通过dij来判断,如果区域j是区域i最近的k个区域之一,那么wij=1,否则,wij=0。

4.wij= 1/( 1 +),γ>0。

(二)空间自相关分析

空间自相关是指地理变量在给定的区域内观测数据存在系统的空间关联关系。地理学第一定律(Tobler’s First Law)提到任何事物都是与其他事物相关联的,只不过距离越相近的事物,其关联更加紧密。我们通过对数据进行空间自相关分析,可以判断一个位置上的数据与其他位置上的数据间是否存在一定的相关性。常用的计算空间自相关方法有Moran’s I、Geary’s C、Getis、Joincount等。

一般来说,自相关分析方法在功能上可大致分为两大类:全局自相关分析(Global Spatial Autocorrelation)和局部自相关分析(Local Spatial Autocorrelation)。全局分析侧重于描述某一现象的整体空间分布情况,判断此种现象在空间内是否存在聚集的情况;而局部分析可以确切地指出聚集具体分布在哪些地区。其中最常用的是Moran’s I(莫兰指数)的相关指标。

Moran’s I 是在空间自相关分析中最常用的指标,最早是由澳大利亚统计学家P.A.P.Moran(1948)[3]提出的,主要用于全局自相关分析中,也称为Global Moran’s I,并通过Cliff 和Ord(1973)[4]关于空间自相关的理论得以推广。之后美国学者L.Anselin(1995)[5]提出了LISA(Local Indicators of Spatial Association)的概念,其中提出了Local Moran’s I,并通过Moran Scatterplot的形式更好地加以解释。

Global Moran’s I的定义如下:

其中wij是空间权重矩阵的元素,n是观测值数量的个数,yi和yj分别是具体地点i和j的观测值。

Local Moran’s I的定义如下:

Local Moran’s I是用来作为识别空间局部聚类和局部空间异常值的方法。对于局部分析来说,对于每一个地点i,加总相关的指数j,,所以Local Moran’s I表示如下:

I的取值范围在-1到1之间,当I的取值等于0时,说明不存在明显的空间自相关关系,当I的取值大于0时,表示具有空间正相关性;当I的取值小于0时,表示具有空间负相关性。I的绝对值越大,表示具有更加明显的空间相关性。

Moran Scatterplot的定义如下:

Local Moran’s I 统计量的取值和显著性检验,对于局部分析来说,并不是很有用。然而通过Moran Scatterplot 的方式将显著性指标和每个位置的观测值相结合时,可以更好地进行解释。散点图上的组合信息通过变量观测值的大小将重要位置分类为高-高和低-低空间簇,以及高-低和低-高空间离群点。其中对高和低的定义是相对于给定变量观测值的平均值,而不是绝对数值。

Moran Scatterplot 的x轴和y轴分别是选取的变量和它的空间滞后项,对散点图进行线性拟合,其斜率是Moran’s I。Moran Scatterplot中的四个象限分别对应着一个地区与其邻近地区之间的空间关系。

第一象限(HH),表示该地区与相邻地区都是高值;

第二象限(LH),表示该地区是低值,但相邻地区是高值;

第三象限(LL),表示该地区与相邻地区都是低值;

第四象限(HL),表示该地区是高值,但相邻的地区是低值区域。

一、三象限表示地区间存在空间正相关性,说明相似的地区聚集在一起;二、四象限表示空间负相关性,说明出现空间离群现象;如果观测值均匀地分布在四个象限,说明空间分布比较随机,没有明显的空间自相关。

三、使用R语言进行实证分析

(一)数据来源与处理

我们选择使用保险密度和保险深度作为衡量我国各地区保险业发展水平的指标。本文选取2018年我国31个省市地区的保险密度和保险深度作为分析变量。数据来源于国家统计局。

(二)我国保险市场空间分布模式分析

我们需要通过R 语言的空间数据可视化的功能,将我国保险市场的空间分布模式形象地展示出来。要实现R语言的空间数据可视化,需要载入以下几个程序包:

sp:sp 包是处理空间数据最基础的包,这个包是按照与GIS 数据模型相同的基本原则和面向对象编程的原则,为主要空间数据类型(点、线、多边形和网格)建立的一套处理程序,提供了空间数据基本的类和方法,以及空间数据处理的实用功能,例如用于绘制地图数据、空间选择以及检索坐标的方法。

maptools:maptools 包是用于处理地理数据的工具集。它包括对“GSHHG”海岸线文件的二进制访问。该包还提供接口包装器,用于与其它有关的软件包(如PBSmapping、spatat、maps 等)交换空间对象,读取空间数据。

rgdal:rgdal 包是最新的用于读取空间数据的包,可以读取shp 文件(在新版本的R 中,maptools可能会无法读取shp文件)。它提供对“地理空间”数据抽象库(“GDAL”)(>=1.11.4)的绑定,并从“PROJ.4”库访问投影/转换操作,如“GDAL”栅格和“OGR”矢量地图数据都可以通过R 导入或导出。

ggplot2:ggplot2 包可以使用图形语法创建美观的数据可视化图像。

通过以上R程序包的使用,我们可以在地图上清晰地展示出我国保险市场的空间分布。由于地图输出的限制,本文仅以直观的数据图表图1和图2展示。

图1 我国保险密度的空间分布

根据图1,结合饼状图和柱形图可以看到,东部沿海地区的保险密度总体处于较高水平,其中北京的保险密度最高,其次是上海、江苏、广东;西部地区保险密度相对较低,西藏最低。从图中可以明显看到,保险密度较高和较低的各地区分布都存在一定的聚集性。

根据图2,结合饼状图和柱形图可以看到,我国保险深度最高的地区是黑龙江,除黑龙江外,东北地区吉林、辽宁也有较高的保险深度,北京、河北、山西等地保险深度也比较高,广东、上海等东部地区也有较高的保险深度,甚至西部一些地区如宁夏、新疆等地也具有相对较高的保险深度,意味着这些地区的保费收入在当地生产总值中的比重较大,保险业在当地经济中占有较高地位。总的来说,我国保险深度较高和较低的各地区分布都存在一定的聚集性。

图2 我国保险深度的空间分布

综上,我们可以看到只有北京、上海、广东始终保持着相对较高的保险密度和保险深度,说明我国保险业在北京、上海、广东的发展比较完善,这可以体现出我国保险业发展与地区经济发展程度有很大关联。

(三)空间权重矩阵的设定

应用R进行空间权重矩阵的设定,除了上述的sp,maptools,rgdal包以外,还需要spdep包。spdep包包含了用于从多边形“邻接方式”创建空间权重矩阵对象的一系列函数,并允许它们在空间数据分析中使用。

在R 语言中,默认的共点共边模式的权重矩阵,会出现海南和台湾作为岛屿没有被连接的情况,所以我们需要在默认poly2nb()函数的基础上,加入自定义的邻接关系,将岛屿部分连接起来。为更明显展示空间权重矩阵的连接关系,我去掉了底层的地图框架。图3和图4分别为两种空间权重矩阵的形式,其中图3右下角两个单独的离散点就是海南和台湾。

图3 默认共点共边的空间权重矩阵

图4 修正的空间权重矩阵

(四)空间自相关分析

进行空间自相关分析时,同样用到上一节提到的spdep 包,spdep 包中还包含了一系列关于空间自相关分析及检验的函数,我们在本文中主要采用Moran’s I作为分析空间自相关的指标。

1.全局空间自相关分析

假设空间是随机分布的(每个值可以分布在空间上的任何位置),我们使用moran.test()函数,可以得出对应的Moran’s I指数的显著性检验结果。

从表1中可以看到,我国各地区的保险密度和保险深度的Moran’s I分别为0.29560499 和0.33097952,均大于0,这意味着我国保险市场在空间分布上具有正的自相关关系,即存在保险市场发达的地区相互临近、发展落后的地区相互临近的趋势,在空间上呈现出了较明显的高高集聚或低低集聚的分布格局。说明我国保险市场发展存在明显的区域化差异,存在较为明显的发达地区与落后地区。

表1 Moran’sI指数

同时对Moran’s I 进行显著性检验。基于随机分布检验,原假设为我国各地区的保险密度或保险深度不存在空间自相关关系,显著性水平α=0.05,从表1中我们可以看到,保险密度和保险深度的p 值均小于0.05,说明Moran’s I 统计量是显著的,我国各地区的保险密度和保险深度确实存在显著的正的空间自相关关系。

2.局部空间自相关分析

空间自相关的全局分析只能判断区域内是否有聚集情况存在,但不能确定聚集的具体位置;而通过局部分析可以确定聚集区域的位置,更好地展示空间分布情况。

我们通过moran.plot()函数,绘制出Moran Scatterplot,通过散点图的方式展现出具体的聚集地区。

由图5可以看出,我国保险密度的地区分布主要集中在一、三象限,这说明我国保险密度的空间分布存在高高集聚和低低集聚的现象,具有明显的两极分化特征,总体呈现出的是东西部差异。另外在第三象限的省市个数数量较高,说明我国保险密度总体水平仍然偏低,只有较少部分的省市保险密度处于高值。其中北京、上海、天津是具有重要影响的省市,表示北京、上海、天津本身具有较高的保险密度,并且其各自的周边相邻省市也具有相对较高的保险密度。

图5 保险密度Moran Scatterplot

由图6可以看出,我国保险深度的地区分布同样集中于一、三象限,也具有明显的两极分化现象,但呈现出的更多是南北方差异,北方地区黑龙江、天津为代表的区域具有较强的高值集聚性,南方西藏及邻近的相关地区具有较强的低值集聚性。

图6 保险深度Moran Scatterplot

四、结果分析与思考

(一)结果分析

1.根据数据可视化与全局自相关分析,可以看出,我国各地区的保险业发展存在着明显的空间自相关和空间集聚现象。我国保险业近些年虽然发展速度比较快,但还是有明显的区域间发展不平衡的情况,存在明显的保险业发达地区与落后地区。

2.根据数据可视化和局部自相关分析,我国保险密度的分布呈现东高西低的分布模式,说明人均保费收入仍然是东部地区比较高,这也符合我国地区的经济发展情况。保险深度总体呈现出北高南低的情况,说明北方地区的保险收入在当地生产总值的比例相对较高,保险业在当地的发展相对较好,也体现了保险业向北方等相对经济落后地区的不断发展完善的趋势。南方地区像广东、上海也保持着相对较高的保险深度,没有达到东北地区那样的保险深度,也与这些地区近几年经济发展不断加快,经济结构更加优化,多行业共同带动经济增长有关,保费收入虽然总量很高,但比例稍低。

3.虽然我国保险市场在空间分布上存在东西差异和南北差异,但在空间分布图中可以看到,在我国能同时保持较高保险密度和保险深度的地区仍然是北京、上海、广东,而这三个地区也是我国经济最发达的三个地区,这也说明保险业的发展状况与当地经济发展水平密切相关。

(二)政策性建议

1.大力发展经济,尤其要重点发展中西部经济。由结果分析可以看出,我国保险业发展仍然与经济发展水平密切相关,只有大力发展经济,提高人民群众收入水平,才能从根本上促进当地的保险业发展。大力发展中西部地区经济,缩小与东部地区的差距,才能从根本上解决我国保险业发展的空间不均衡现象。

2.合理规划我国保险业发展的空间战略布局,构建保险业区域发展协调机制,优化资源合理配置[6]。发挥社会主义市场经济的优势,发挥政府和市场的作用,积极引导保险业发展资源在发达地区与落后地区的优化配置,实现区域化协调发展。

3.政府向经济落后地区提供适度的政策支持,在政策上对经济落后地区的保险业进行扶持,鼓励、支持、引导当地的保险业发展,为当地募集更多的保险资源。比如政府下放一部分监管职能到地方的保险监管机构,给予区域性保险公司一定的条款制定自主权。同时,国家可以对中西部地区的保险公司提供如银行贷款、税收优惠等措施。但是在政策的“输血”帮扶下,应该综合衡量与考虑短期与长期的收益,最终还是要培养当地保险业的“造血”能力。

4.保险公司的战略部署要“因地制宜”,注重区域化保险产品的设计。对于不同地区的居民,由于经济、文化、自然环境的差异,可能会出现差异化的保险需求,所以对保险公司来说,应该针对不同地区的具体情况,设计符合当地群众需求的保险产品,注重产品设计的差异性,满足不同地区人民的保险需求。

猜你喜欢
保险市场保险业密度
2018年保险业实现保费收入3.8万亿元
全球再保险市场现状及特点分析
基于产品生命周期的保险市场营销策略研究与分析
人身保险理赔难分析
金融政策法规对我国银行保险市场的影响分析
“密度”练习
密度的应用趣谈
密度的不变性与可变性