考虑异常值的基于数学规划法的案均赔款法

2017-06-27 19:55闫春张静苏瑞
财经理论与实践 2017年3期

闫春+张静+苏瑞

摘 要:在存在异常值的情况下,非寿险公司应用传统案均赔款法估计准备金常出现估计精度不高的问题。在分析传统案均赔款法中进展因子和结案率估计方法的缺陷之后,引入数学规划法对估计方法进行改进,建立进展因子和结案率的二次规划和目标规划模型,并引入权重因子弱化异常数据对进展因子和结案率估计结果的影响,运用一组流量三角形数据进行实证分析,结果表明:数学规划法可以有效估计进展因子和结案率,弱化异常数据对准备金估计结果的影响。

关键词: 案均赔款法;异常数据;数学规划法

中图分类号:F840.65 文献标识码: A 文章编号:1003-7217(2017)03-0046-06

一、引 言

未决赔款准备金是非寿险公司准备金估计中最重要的部分,公司的经营业绩和经营风险受准备金估计值的影响显著。存在异常数据时,非寿险公司应用传统准备金估计方法估计的未决赔款准备金存在较大偏差。因此,为减弱异常數据对未决赔款准备金估计的影响,保证最终估计结果的准确度,有必要对流量三角形中的异常数据进行诊断并弱化其影响。

在准备金评估异常数据的诊断方面,国外学者最先进行了一些开创性研究。Carroll和Pederson(1993)在广义线性模型(GLM)框架下对准备金估计模型受原始数据中异常值的影响程度进行了研究[1]。Preisser和Qaqish(1999)在广义估计方程(GEE)的一般框架下,考虑了一类稳健估计量[2]。Cantoni和Ronchetti(2001)在GLM框架下应用拟似然估计方法提出一种稳健推断工具,最终得到有界的预测值的影响函数[3]。Verdonck等(2009)在多种准备金估计方法中考虑了异常数据的影响,讨论了链梯法中稳健性问题,并提出了稳健链梯模型[4]。Verdonck和Debruyne(2011)对广义线性模型下准备金估计结果对异常数据的敏感程度进行了定量分析,构造诊断方程,并有效识别了流量三角形中异常值的位置[5]。之后,Anderson Paulo等(2014)也对稳健估计量进行深入探讨,对稳健统计进行了广泛研究[6]。

在国内,虽然这方面的相关研究开展得较晚,但也出现了很多成果。逯敏(2013)基于对链梯法的改进,引入稳健链梯模型和稳健广义线性模型,并提出了两阶段的稳健广义线性模型[7]。段白鸽、张连增(2014)考虑了一种稳健链梯模型,扩大了异常值的检索范围,减小了异常值对索赔准备金估计的影响[8]。卢志义等(2015)在链梯法中建立二次规划和目标规划模型对进展因子进行估计,引入权重因子,并应用一组模拟数据对所述方法进行实证分析[9]。闫春等(2015)在案均赔款法中考虑离群值的影响,运用残差箱线图法和两点法对相关索赔数据进行离群值检验,然后针对离群值提出了一种稳健的案均赔款法[10]。

综上,对于考虑异常数据影响的非寿险准备金的研究方法,主要集中于广义线性模型及稳健链梯模型等,并且对于准备金评估方法的改进大多是针对链梯法的,而案均赔款法在链梯法的基础上增加了案件数信息,使评估信息更加充分,但目前国内外对案均赔款法的研究成果比较少。鉴于此,本文在传统案均赔款法中考虑异常数据,首先,对其进行敏感性分析,并对进展因子和结案率估计方法的不足进行简要说明,提出数学规划法对进展因子和结案率建立二次规划模型和目标规划模型。然后,在此模型下同时引入权重因子,分别对进展因子和结案率进行估计,区别不同数据信息对估计结果的作用,将此类方法与传统案均赔款法结合,弱化异常数据对进展因子和结案率估计的影响,从而保证未决赔款准备金估计的准确度。最后,应用一组经典数据对所述的方法进行验证,比较分析最终的估计结果。

二、案均赔款法准备金评估及敏感性分析

案均赔款是赔款与案件数的比值。基本假设:各事故年的案均赔款保持着相对稳定的趋势。案均赔款法根据是否已经结案可以分为已报案案均赔款(PPCI)和已结案案均赔款(PPCF)。本文以PPCF法为例,进行详细介绍及模型构建。

PPCF方法应用累计已报案件数Ni,j流量三角形、累计已结案件数Di,j流量三角形和增量已结案赔款Yi,j流量三角形对准备金进行估计。具体步骤为:第一,预测最终已报案案件数。对累计已报案件数Ni,j流量三角形应用链梯法预测各事故年的最终案件数。第二,计算已结案案件数。从累计已报案案件数中减去未结案的案件数即可得到最终已结案案件数。第三,预测未来的已结案案件数。首先,计算结案率及其平均值,结案率是指已结案的累计案件数在已报案的总案件数中所占的比重,其计算公式为:vi,j=Di,j/Ni,n。其中,Ni,n表示事故年i发生的保险事故所导致的总索赔次数。计算出结案率以后,选定结案率的平均值作为各进展年的结案率,且尾部结案率估计值假定为1。然后,预测未来已结案的案件数,根据结案率的选定值乘以总索赔次数,计算出年末累计已结案索赔次数的预测值,用后一个进展年的结案次数减去前一个进展年的结案次数,得到增量已结案件数流量三角形i,j。第四,计算案均赔款。将已结案赔款与已结案案件数相除,计算公式为:i,j=Yi,j/i,j。同样,运用链梯法预测已结案案均赔款流量三角形i,j的下三角部分。第五,估计未决赔款准备金。将已结案均赔款与已结案件数一一对应相乘可得到未决赔款的预测值,未决赔款预测值流量三角形下三角部分的数据加总可得到最终的未决赔款准备金。

可以看出,案均赔款法是一种链梯模型,但其同时兼顾案件数(频率)和赔款额(强度)两种信息,核心问题是计算案均赔款。

案均赔款法隐含的基本假设是不同事故年的案均赔款相对稳定,但在实际的非寿险数据中并不总能得到满足。当流量三角形中数据出现异常值时,使用案均赔款法评估准备金,将会对准备金的估计结果产生较大影响。因此,对流量三角形中的数据进行检测是否存在异常值至关重要。

下面选取张晓军、孟生旺《保险精算学》里的一组数据,来验证并分析案均赔款法对异常数据的敏感程度[11],见表1~3。其中,表1为累计已报案案件数Ni,j,表2为累计已结案案件数流量表Di,j,表3为增量已结案赔款流量表Yi,j。

对表1数据应用链梯法得到流量三角形的下三角部分,预测各事故年的最终案件数,再求得结案率。根据结案率数据,可以用各事故年最终的累计已报案件数分别乘以对应进展年的结案率的选定值,即可求得累计已结案索赔次数流量三角形的下三角部分;然后,将累计已结案案件数流量表转化为增量已结案案件数流量表;最后,用表3的赔款数据除以增量已结案案件数上三角部分,即可得到已结案案均赔款流量。

对已结案均赔款流量表应用链梯法得到未来各年已结案均赔款的预测值,用已结案均赔款预测值乘以已结案索赔次数预测值,即可得到未决赔款准备金的估计值。

为了探究异常赔款数据对传统案均赔款法准备金估计值的影响程度,对表2中事故年为1999年、进展年为3的已结案案件数缩小10倍进行异常化处理,得到新的结案率。然后,按照传统的PPCF模型对准备金进行估计,得到没有异常值情况下的估计结果为71 095千元,存在异常值情况下的结果为187 506千元。

比较数据可知,将表2中的已结案案件数流量表中的某一数值设为异常数据后,存在异常值情况准备金估计值比不存在异常值情况下估计值增加了1倍多,而且这只是在存在单一异常数据的情况下比较结果得出的差异。由此可见,传统的案均赔款法受异常值的影响程度较大,需要我们探索一种新的方法来降低其对异常数据的敏感性。

三、数学规划法估计进展因子和结案率

由于传统的案均赔款法对准备金的估计结果容易受异常数据的影响,为此,对该方法的这一缺陷进行改进,弱化异常数据对结案率及进展因子的影响。考虑到数学规划法的研究对象是数值的最优化问题,解决的主要问题是在给定条件下,按某一衡量指标来寻找安排的最优方案,可表示成求函数在满足约束条件下的极大极小值问题,其优点是可将复杂过程通过映射直观反映于目标函数,建立相应的数学模型从而优化最终的估计结果[12]。我们将进展因子和结案率的偏差函数最小作为目标函数,尝试建立二次规划模型和目标规划模型,并引入权重因子对进展因子和结案率进行估计,同时,也可以在该数学规划模型的约束条件中加入有关进展因子和结案率的其他相关信息,使进展因子和结案率的估计值更稳健,从而提高准备金估计的精确度。

(一)传统案均赔款法进展因子和结案率的估计及不足

由式(1)可看出,用原始加权法得到的进展因子是各事故年逐年进展因子的加权和。这种方法估计的进展因子受流量三角形中数据的影响程度较大,即对数据变化较为敏感,并且不能反映不同的数据信息对进展因子估计的不同作用,也不能有效降低进展因子估计值对异常数据的敏感性。

在已结案均赔款法中,结案率vi,j的值受累计已结案流量三角形Di,j和累计已报案流量三角形Ni,j的影响,若两个流量三角形中有一个出现异常数据都会导致结案率出现异常。由此可知,结案率对观察值的变化敏感性较高,结案率的异常也必然会影响最终的准备金估计结果。

针对案均赔款法中进展因子和结案率估计不足的缺陷,下面运用最优化理论方法给出最优进展因子和最優结案率的评价标准,并将此标准作为目标函数,建立二次规划和目标规划模型对进展因子和结案率进行估计。

(二)二次规划法①[13]优化进展因子和结案率

在案均赔款法假设条件下,数学规划法确定进展因子和结案率的思想是:在特定进展模式下通过最小化误差的平方和找到一组数据的最佳函数匹配。

1.二次规划法优化进展因子模型。

其中,v*i,j=Di,j+d+*i-d-*iNi,n是经过校正后的结案率。从式(15)可以看出,偏差函数的绝对值可以很好地衡量结案率估计方法的优劣性和可行性,并且目标规划法使得偏差函数绝对值总和达到最小。同二次规划法一样,结合了目标规划法的案均赔款法更具有灵活性和适用性。加权二次规划法和加权目标规划法在原有方法的基础上引入了权重因子,可以反映不同日历年数据对进展因子和结案率估计的影响程度,这使得进展因子和结案率的估计值更加符合较近日历年赔款模式,选择对应的权数也增强了估计的稳健性,弱化了异常数据对准备金估计结果的影响。

四、实证分析③

已知表1和表2中的数据是不存在异常数据的,为了验证数学规划法对异常数据的弱化作用,提高准备金估计的准确度,需要通过对比添加异常值后的改进案均赔款法和传统案均赔款法结案率估计值及最终赔款估计值的差异,来度量两种方法对异常数据的敏感性。将表2事故年1999年、进展年4的数据缩小10倍,事故年2000年、进展年4的数据扩大10倍作为异常数据,该数据可以解释为人为输入有误所致,得到表4即存在异常值情况下的结案率。

权数的选取采用如下方法进行:由方程∑n-j+1k=1wk=1解得w各事故年对应相应的权数,对于高阶方程可以使用Matlab进行求解。在实务中,权数的选取要有依据,例如表4中进展年4的结案率,事故年1999年的数据明显偏小,而事故年2000年的数据明显偏大,可以看作异常数据,在选取权数时,为避免该异常数据对结案率估计的影响,事故年1999年应赋予较大权重,事故年2000年应赋予较小权重。其次,考虑日历年因素,较近日历年赋予较大权重。解方程∑5k=1w5=1得w=0.5087,选取各事故年相应的权数为0.0669、0.1316、0.5087、0.0341、0.2587。根据不同方法估计的结案率如表5所示。

由表5可以看出,用二次规划法估计的各进展年的结案率与原始加权法得到的结案率估计值相差不大,对进展年4的异常结案率也没有做出相应的修正,而目标规划法的估计结果对异常结案率进行了较好的修正。同时可以发现,加权二次规划法和加权目标规划法对结案率的估计结果也相差不大,对于进展年4的结案率估计时,对事故年1999年的结案率赋予较大权数,对事故年2000年的结案率赋予较小权数,从而加权二次规划法和加权目标规划法有效降低了结案率估计的敏感性,减弱了异常数据对结案率估计的影响,同时,权数的选取也体现了较近日历年准备金的进展模式。

分析表6可知,二次规划法虽然为结案率的估计给出了明确的目标函数,使得估计方法更加灵活,但当数据中存在较大(小)异常数据时,二次规划法求得的最终赔款准备金的准确度与原始加权法相差不大,对异常数据较敏感,估计准确度较低。而考虑了权数的二次规划法,则可以对结案率的估计进行“修匀”,使得到的估计值受异常数据的影响较小。目标规划法和加权目标规划法较其它估计也可以弱化异常数据对结案率估计的影响,从而提高准备金估计的准确度,使准备金估计更加合理。并且加权二次规划法和加权目标规划法在选取权数方面考虑日历年因素,较近日历年选取较大权数,区分不同信息对结案率和进展因子估计的作用。

五、结 论

以上采用数学规划法对传统案均赔款法中的进展因子和结案率进行估计,结果显示:(1)设定明确的目标函数对进展因子和结案率进行估计,并在此目标函数下运用二次规划模型和目标规划模型可以估计出最优的进展因子和结案率。(2)简洁灵活的数学规划法作为进展因子和结案率估计的优化方法,可充分利用历史赔款数据,有效提高约束条件的可靠性,得到优化的估计结果。(3)考虑到权重因素,在目标函数中引入权重因子,反映出进展因子和结案率的估计值受不同的数据信息的影响程度,从而可以体现其对不同日历年数据的偏重程度,降低准备金估计结果对异常数据的敏感性,从而为进展因子和结案率的估计提供了更加灵活的方法。

注释:

①二次规划法是指目标函数是二次函数、约束条件为线性等式或不等式约束的数学规划问题。二次规划是线性规划问题向非线性规划问题的自然过渡,是最早研究的一类非线性规划问题,同时也是一类非常重要的约束优化问题,在实际中应用广泛。

②目标规划是对一组目标进行优化,并且考虑目标的优先顺序因素,寻找在多个预定目标前提下的满意解(通常称为最优解),使得计算得到的目标值尽量达到预定目标值,亦即使实际目标值与预定目标值之差的偏差变量的取值最小。目标规划法是在一般线性规划和多目标规划的基础上发展起来的一种数学规划法,其数学模型由求极小值的达成函数和约束条件构成。

③这里仍采用张晓军、孟生旺《保险精算学》里的数据对本文所述的数学规划模型进行验证和对比。

参考文献:

[1]Carroll R J,Pederson S.On robustness in the logistic regression model[J].Journal of the Royal Statistical Society,Series B,1993,55(3):693-706.

[2]Preisser J S,Qaqish B F.Robust regression for clustered data with applications to binary regression[J].Biometrics 1999,55(2):574-579.

[3]Cantoni E,Ronchetti E.Robust inference for generalized linear models[J].Journal of the American Statistical Association,2001,96(455):1022-1030.

[4]Verdonck T,Van Wouwe M,Dhaene J.A robustification of the chain-ladder method[J].North American Actuarial Journal,2009,13(2):280-298.

[5]Verdonck T,Debruyne M.The influence of claims on the chain-ladder estimates:analysis and diagnostic tool[J].Insurance:Mathematics and Economics,2011,48(1):85-98.

[6]Anderson Paulo de Paiva,José Henrique F.A multivariate robust parameter optimization approach based on principal component analysis with combined arrays [J].Computer&Industrial Engineering,2014(74):186-198.

[7]逯敏.保險公司异常赔款数据对准备金估计的影响研究[D].天津:天津财经大学,2013.

[8]段白鸽,张连增.考虑离群值的稳健链梯法[J].数理统计与管理,2014(7):1-21.

[9]卢志义,刘乐平,张慧.链梯法中进展因子估计的数学规划法[J].数学的实践与认识,2015(5):249-255.

[10]闫春,李延星,孙晓红,刘志博.考虑离群值的非寿险准备金案均赔款法[J].保险研究,2015(11):15-24.

[11]张晓军,孟生旺.保险精算学[M].北京:中国人民大学出版社,2006:242-260.

[12]智库百科.数学规划[EB/OL].http://wiki.mbalib.com/wiki/%E6%95%B0%E5%AD%A6%E8%A7%84%E5%88%92,2016-10-12.

[13]黄正海,苗新河.最优化计算方法[M].北京:科学出版社,2015:132-135.

[14]江道琪,何建坤,陈松华.实用线性规划方法及其支持系统[M].北京:清华大学出版社,2006:259-264.

(责任编辑:宁晓青)

Abstract:In the presence of outlying values,the traditional payments per claim method of estimating reserving in non-life insurance companies lack accuracy.First,the drawbacks of traditional payments per claim method in progress factors and settlement rate are analyzed briefly.Then introduced mathematical programming into the estimation method,and quadratic programming and objective programming are established to estimate progress factors and settlement rate.Meanwhile,weight is proposed to abate the influence of the outlying values in the estimate of the progress factors and settlement rate,and using a set of run off triangle data to provided.The results has shown that the mathematical programming method can effectively estimate progress factor and settlement rate,weakening the influence of outlying values on the estimation of reserves.

Key words:Payments per claim method;Outlying values;Mathematical programming method