成都人寿理赔的SPSS数据分析报告

2021-06-30 01:43四川大学锦城学院计算机与软件学院池美伶
电子世界 2021年11期
关键词:赔款保额金额

四川大学锦城学院计算机与软件学院 池美伶 杨 杉

在获取的理赔数据中包括机构、险种、案件号、保单号、赔款金额、赔款时间、费用类型、费用金额、总保费、保额、客户号、性别、年龄、婚姻状况、过去三年收入、职业;针对不同年龄段的赔款费之间的差异、费用类型对赔款金额的影响、赔款金额与总保费、保额之间的关系,采用了探索分析、排序、条形图的可视化分析、相关性分析和线性回归,得到青少年、中年和老年人的众数区间是一样的,未成年的众数区间最高,青少年和中年的赔偿金额中位数大致相同,大概处于一个平均的水平,而未成年的总保费是处于中位数偏上的水平,说明高赔偿金额较多。对总保费、保额和赔款金额的分析中发现,赔款金额和总保费呈显著正相关性、赔款金额和保额呈显著正相关性、总保费与保额呈显著正相关性。

近年来随着我国环境污染加剧、工作压力增大,恶性疾病发病率持续提高,重大疾病保险已成为人寿保险市场上重要的保障型产品,并有可能在未来3-4年进入新的市场爆发期。在政府发现新形势助推民生保障下,全面开展医保经办服务、大病保险和长期护理保险,普惠补充医保快速兴起是目前发展重心。但大多数人对保险还不甚了解,且所购保险尚待改进,比如不同人群的不同保险需求、保额与总保费的比例关系、所购险种相应的疾病健康保障所对应的保额大小等问题都在一定程度上需要得到相应的改进和完善。

而随着各大保险公司2020年理赔报告陆续出炉,那些藏在保险理赔报告里的关键数据可以成为保险消费者制定个人及家庭保障规划过程中的新参考。诸如理赔获赔率、理赔时效、理赔病种等藏在保险理赔报告里的关键数据亦新鲜出炉。对于关心保险的消费者来说,这些客观数据在一定程度上集中反映出各家保险公司的整体理赔情况以及风险高发的“理赔重灾区”,可为保险消费者制定个人及家庭保障规划时提供不错的参考。

1 分析思路

由于现代社会的错综复杂,人们需要一份生活及健康的相应保障,所以选择了购买保险这一方式。根据成都人寿保险数据发现,重大疾病是理赔的主要原因,因此,以重大疾病保险理赔的数据为研究对象,对其中各项因素,如:赔款金额、费用金额、总保费、保额、年龄、过去三年平均年收入进行探讨,得出与理赔相关的各种因素,由此分析具有较强的现实意义。在国内外文献综述的基础上,发现我国重大疾病保险市场的特点及其主要理赔风险的表现与成因,发现我国重大疾病保险理赔风险居高不下,其原因源于普通消费者对重大疾病保险理解不足。本文正是从成都人寿的保险数据进一步的分析赔款费之间的差异、费用类型对赔款金额的影响、赔款金额与总保费、保额之间的关系。

2 数据说明

2.1 数据来源

本项目是基于成都人寿保险客户资料的excel数据分析,分析过程将通过应用SPSS软件进行相应的数据可视化呈现。在随着保险公司计算机系统应用的不断推进,保险公司提出了对数据进行深入分析和应用的需求。该数据表中包含了机构、险种、案件号、保单号、赔款金额、赔款时间、费用类型、费用金额、总保费、保额、客户号、性别、年龄、婚姻状况、过去三年平均年收入、职业等16个属性,共21万条数据。

2.2 数据清洗

本文数据需要进行的数据清洗操作有删除空值并将数据排序。在删除空值的操作中,将原有数据表中带有空值的数据进行删除操作,同时为提高数据分析的有效性,删除数值为0的整行数据。另外,为方便数据操作分析及查看,还可对数据进行排序操作。

3 数据分析

3.1 不同年龄段赔款金额的比较

自1979年,我国恢复财产保险业务以来,商业保险业经历了三十多年的快速发展,保费收入逐年上升,从1980年仅有的2.9亿元,到2014年突破2万亿大关,再到2016年迅速突破3万亿,保费收入年均增长率达29%,更是在2017年,位居全球第二位,成为名副其实的保险大国。保险行业的发展离不开国家宏观经济环境,消费者作为保险购买主体,其年龄结构的变化必然会对商业保险的发展产生深远影响。

为探究不同年龄段的赔款金额,采用了SPSS探索分析。

在数据选项卡中选中“重新编码到其他变量:旧值和新值”,按照“0”、“1”、“2”、“3”对各年龄段进行分类,并分别对“0”、“1”、“2”、“3”进行设置值标签为“未成年”、“青年”、“中年”、“老年”。

另外,根据多次数据操作发现,保留退保费位于2000-10000之间的数据最为有效。不同年龄段的赔款金额如表1所示。

表1 不同年龄段的赔款金额

结论:赔款人群大部分属于青年人和中年人,未成年人最少,老年其次。之后,再对这四类人群进行置信区间的划分,得到如表2所示的数据。

表2 中年人和老年人的数据分析

结论:未成年人、青年、中年、老年的偏度和峰度是正数,说明他们的数据分布都是右偏并且是尖峰分布的,高赔偿金额的人相对稀疏,大多数分布在较低的赔偿金额或集中在平均赔偿金额的水平;其中中年人和青少年的数据右偏和尖峰分布的更为强烈,说明高赔偿金额的人更为稀疏,未成年人的数据右偏和尖峰分布的程度较为平缓,说明高赔偿金额的人相对较多。

3.2 费用类型对赔款金额的影响

近年来,行业健康保险业务快速发展,年均增速超过30%,受到社会各界广泛关注。加之,2020年一场突如其来的新冠疫情,党和政府直面压力,勇于担当,始终将保障人民的生活和新冠患者的治疗放在首位。我国医疗保障体系在这个过程中就体现了其独特的优势,在新形势下,保险作为我国医疗保障体系的补充将面临着新的机遇。

根据成都人寿保险数据,从不同费用类型对赔款金额的影响,本文采用了排序分析,并选用条形图进行可视化展示。

所得SPSS条形图如图1所示。

图1 各费用类型的均值赔款金额条形图

由图1所得,赔款金额较大的费用类型多为身体疾病,如胃癌、食道癌......等,所以,应倡导人们爱护身体,健康生活。

3.3 赔款金额与总保费、保额的关系

为了解赔款金额与总保费、保额之间的的关系,在SPSS中使用双变量相关性分析与线性回归。

在SPSS中选择双变量分析,其中选择变量为赔款金额、总保费、保额,相关系数选中Pearson相关系数,得到的相关性如表3所示。

表3 赔款金额与总保费、保额的相关性

通过表3中查找分析,双变量相关选择变量为总保费、年龄和过去三年平均年收入,相关系数为Person。通过相关性分析,发现赔款金额和总保费呈显著正相关性、赔款金额和保额呈显著正相关性、总保费与保额呈显著正相关性。

之后,我们再对赔款金额、总保费、保额进行线性回归,通过设置因变量为赔款金额、自变量为总保费、保额,方法选择逐步进入方法,可得到表4所示SPSS分析结果。

表4 线性系数

通过表4可看出sig小于0.05是有相关且有效,从而可得出:

结论:可通过表可得对相关性分析,发现赔款金额和总保费呈显著正相关性、赔款金额和保额呈显著正相关性、总保费与保额呈显著正相关性。

4 结论及建议

4.1 结论

通过对成都人寿保险理赔数据的一系列相关操作,得出了如下所示结论。从年龄,赔偿金额,总保费,费用类型,保额这几个方面入手,以条形图呈现,得到赔款金额较大的费用类型多为身体疾病,如胃癌、食道癌......等;运用探索分析,发现未成年人、青年、中年、老年的偏度和峰度是正数,说明他们的数据分布都是右偏并且是尖峰分布的,高赔偿金额的人相对稀疏,大多数分布在较低的赔偿金额或集中在平均赔偿金额的水平;其中中年人和青少年的数据右偏和尖峰分布的更为强烈,说明高赔偿金额的人更为稀疏,未成年人的数据右偏和尖峰分布的程度较为平缓,说明高赔偿金额的人相对较多;之后,通过对总保费、保额和赔款金额的相关性与线性回归,发现赔款金额和总保费呈显著正相关性、赔款金额和保额呈显著正相关性、总保费与保额呈显著正相关性。

4.2 建议

随着经济的发展,人身意外保险市场作为与人民群众生活息息相关的一个领域,也在不断地调整发展。不同的行业类别,不同承保范围内的保险金额随着人民群众收入也在不断提高,人身意外保险这一涉及人民群众切身利益的险种,成为了社会发展建设的基础保障措施。如今全球人口老龄化的严重,通过这次数据的分析,年龄越大的人应该多注重保险的购买,降低医疗压力,可以带来一定的经济保障,防止生活被意外所改变;虽然我国在发展涉外疗养服务贸易上具备一定的优势,但仍存在医疗保险理赔范围局限、资源分散等问题。同时,上文显示赔款金额较大的费用类型多为身体疾病,如胃癌、食道癌......等,应倡导人们爱护身体,健康生活的习惯,身体才是一切生活的保障。人们在购买保险时,也应该明确自己的需求,选择合适自己的险种,对于平均年收入较低的人群,政府应与机构出面适当提高保额,保障弱势群体的基本需求。

另外,建议政府规范保险理赔工作,提高涉保司法鉴定质量和保险理赔服务水平,适应人身损害赔偿纠纷处理需要,切实维护人民群众合法权益。针对如上各费用类型的理赔结果,建议保险机构增加人伤理赔岗位专业人员,建立系统化的培训机制,实行案件责任制和对应的奖惩机制,让理赔服务能够更好的进行。

猜你喜欢
赔款保额金额
2001年-2020年县级一般公共预算支出资金来源情况表
四川推出农业保险赔款支付“一卡通”机制
基于保险行业新投保、续保、理赔综合性SPSS数据分析报告
田地被淹蔬菜减产 排水不当赔款六千
五款防癌险终极PK
合理选择重疾险保额
立案
成交金额前10名营业部买入的前3只个股
一周资金净流出金额前20名个股
基于GPSJ1过程下的未决赔款准备金