杨汭华,孙 婧
(中国农业大学 经济管理学院,北京 100083)
关于农业大灾风险的认定有多种观点。已有研究更多地强调大灾发生低概率、高损失的后果,如由于某个极端灾害事件(发生频率低、强度高的自然灾害)导致农业生产遭受巨大损失的可能程度,这种做法具有经验性。国际通行标准是把一次损失额大于当期国内生产总值(GDP)的0.01%的灾害界定为农业巨灾。2007年世界银行建议,可依据农业自然灾害风险发生的经验概率将风险划分四个管理层次:1~7年发生一次、7~15年发生一次、15~25年发生一次以及25年以上发生一次,各层次适宜的风险分散机制依次为风险自留、农业保险、再保险(以及大灾保险基金等)和政府统筹,也就是说,保险公司可将15年以上才发生一次的风险作为大灾分出风险。再保险理论也提供了多种供保险人决策最优保险自留风险的准则,如期望-方差法、最大收益法、方差最小法、VaR准则和CTE准则、最小破产概率法或最大效用法等。
近年来,极值统计技术(Extreme Value Theory,EVT)在气象、水文、地震等领域得到了广泛应用,并逐步运用于金融、保险等领域的研究,在评估极端事件分布、处理背离分布均值的统计数据方面显示了明显的优势。相关研究为极值统计运用于农业大灾风险分层提供了理论、方法和经验[1-6]。本文在此基础上,利用极值技术的分析优势,寻求大灾阈值并结合大灾发生的经验重现期和成数优化分保,对现行政策性农业保险的赔付风险进行分层实证。
极值统计有两类模型方法:一类是区组极大值法(block maximum model,BMM),这种技术方法对组内最大值的分布直接建模,缺点是浪费数据。另一类是超越阈值数据法(Peak over Threshold,POT),这种方法以点过程方法为基础,选择超越某一安全阈值(threshold)的数据建模,满足拟合广义帕累托分布(General Pareto Distribution,GPD),数据要求少,可利用有限的损失数据研究极端损失的渐近行为,实践性较强。为了克服损失数据稀缺的约束,本文拟采用POT技术和模型方法。
本文首先利用灾情数据获得农作物损失分布模型,再以Monte-Caro方法模拟扩大损失数据样本空间,由此进行POT分析。假设损失数据序列{xt} 的分布函数为 F(x),将损失数据按大小排序:x(1)> x(2)>…> x(n),定义 Fu(y)为随机变量X超过u(阈值)的超额损失分布函数,表示为:
将式(1)与GPD模型相联系[7],即:
函数 Gξ,σ(y)为广义帕累托分布(GPD),其中 ξ为形状参数,σ为尺度参数。ξ的不同取值决定了尾部的厚度,ξ越大尾部越厚,越小尾部越薄。当ξ>0时,分布函数 Gξ,β(x)是Pareto分布,ξ=0时为Exponential分布,ξ <0时为Beta分布。在POT分析中,可靠地确定u是ξ、σ估计的前提。u选取过高,会导致超额损失数据量太少,估计出来的参数方差变大;u选取过低,不能保证超额损失分布的收敛性,也会产生较大的偏差。Danielsson(1997)[8]和Dupuis(1998)[9]给出了确定 u 的两种方法:Hill图和样本平均超额损失函数(Mean Excessive Function,MEF)图,其中MEF函数定义为:
MEF图为点 (u,e(u))构成的曲线,若曲线呈向上变化趋势,表示X为一厚尾分布;若曲线呈向下变化趋势,X为一短尾分布。根据曲线选取恰当u值的依据是,当X≥u时,e(u)呈现为近似线性函数,这个判断方法是根据ξ小于1时,e(u)表现为线性函数得到的:
阈值u确定之后,将损失数据序列{xt}中大于u的数据个数记为Nu,取出{xt}中大于u的样本数据xi,由xiu=yi得超额损失样本{yt},据式(2),利用极大似然法估计GPD模型。
由GPD模型,估算百分位(α)的VaR估计量:
将大灾阈值与最优分保目标相结合可以提高分层结果的应用价值。这里讨论成本最小的成数分保比例的确定。设X是原保险公司面临的农作物赔付风险(非负的随机变量)。在成数再保险下,β为原保险公司的自留比例,XL是原保险公司的自留风险,XL=βX;XR是原保险公司的分出风险,即再保险公司的损失变量,XR=(1-β)X;X的累积分布函数为 FX(x)=Pr{ X ≤x} ;生存函数为 Sx(x)=Pr{ X >x}。若原保险公司投保再保险的总成本费用为T,总成本费用由自留风险 XL与再保险保费δ(XR)组成,设定政府给予农业再保险保费的补贴比例为θ,则原保险公司面临的实际总成本费用为:
参考我国对大灾周期的惯常考虑和世界银行(2007年)的建议,本文采用10年、25年和50年大灾重现期的经验概率,即α=10%、4%和2%,依式(6)测算VaRα进行风险分层。
采纳方差原理测算再保险保费:
其中P为保费,E(x)为损失期望值,Var(X)为风险损失的方差;ρ为保费附加因子,取值在0~1之间,ρ越大,保险分出的成本越高。
原保险公司需要权衡自留风险 XL与再保险保费(1-θ)δ(XR)的最优关系,以实现总成本费用T的最小化。在成数再保险中,最优的VaR定义为:
将VaRT(β,α)求 β 导并令取0,推得:
β*即为VaR准则下再保险分出成本最小的自留比例。
采用1978—2014年《河南省统计年鉴》的农作物成灾面积、农作物播种面积、小麦播种面积等统计指标和2012年河南省农业保险工作方案中的小麦保险参数(保险金额为311元/亩,保险费率为6%,保费为18元/亩)作为小麦保险赔付率测算的基础数据。同时,出于考察多个可能保险方案赔付状况的需要,结合河南省农业保险实际进展,做出以下研究假设。
假设1:小麦种植风险在空间上是均匀分布的,各地区的损失同比例。即假定所承保的小麦保险风险优质,满足独立同分布的统计特征;
假设2:设定三个承保率:50%、70%和80%。近年来河南省小麦的承保率最高接近50%,参考各地政策性农业保险的实践进程,将承保率为80%作为高限。
假设3:设定两个亩产量保障水平:50%和70%。按照“物化成本”保障的原则,河南省小麦保险目前的保障水平由相当于亩产量的不足50%在逐步提高,趋向于高限70%。
假设4:设定两个单产可能损失程度:60%和80%。参考历史上河南小麦的极端损失程度,在此以单产损失60%作为大灾损失的低限,以单产损失80%作为特大灾的考察值。
根据以上基本假设,将“承保率—保障水平—损失程度”组合得到12种可能的保险情景,分别测算小麦保险赔付率:
(1)小麦受灾面积=小麦播种面积×农作物受灾率(=农作物受灾面积/农作物播种面积)
(2)小麦保险赔付额=(1)×承保率×亩产量保障水平×小麦单产损失程度×小麦亩保险金额。其中,小麦承保率=小麦承保面积/小麦播种面积,小麦单产损失率=(小麦常年平均亩产量-小麦当年亩产量)/小麦常年平均亩产量(河南省常年小麦平均约为400kg/亩)。
(3)小麦保险保费收入=小麦播种面积×承保率×小麦亩保费。
(4)小麦保险赔付率= (2)/(3)=农作物受灾率×亩产量保障水平×小麦单产损失程度×小麦亩保险金额/小麦亩保费。可以看出,在保险政策条款不变时,小麦保险赔付率取决于农作物受灾率、设定的亩保障水平和小麦大灾损失程度。以“亩产量保障水平为50%、成灾作物损失程度为60%”的情形为例,小麦保险赔付率=(农作物受灾率×50%×60%×311)/18。
以上测算所得小麦保险赔付率序列的基本统计量表现为:平均值210.48,最大值 461.15,最小值 31.42,偏度0.5359,峰度1.98。JB检验表明在10%的显著性水平上不能接受数据服从正态分布。绘制Q-Q分位数图(见图1)。
图1小麦赔付率的Q-Q图
由图1可知,小麦损失数据分布明显不同于正态分布,具有尖峰厚尾的特征,显著有别于正态分布。选取农作物灾损最常见的五种分布模型(Exponential、Gamma、Lognormal、Weibull和Pareto)作为候选模型,分别拟合各设定情形的小麦保险赔付率分布,结果表明,Gamma分布的经验分布与理论分布的拟合偏差(difference)最小,比较表1中三种检验统计量的排序,也以Gamma分布的表现最为稳健选取为最适合的赔付率分布模型。Gamma分布的密度函数为:
式(12)中α为形状参数,β为尺度参数。估计不同情景下的Gamma分布参数,表示为Г(α,β),如对于情景“50%-50%-60%”,经估计,α=3.7436,β=17.684,表示为Г(3.7436,17.684)。(免于赘冗,未列出全部情景的估计结果)。
表1 “50%-50%-60%”情景下赔付率分布的统计检验
鉴于1978—2014年小麦保险赔付率数据仅为37个,为弥补大灾数据的不足,以Gamma分布作为随机抽样发生器,采用Matlab 2014a进行1000次蒙特卡洛随机模拟,见图2,据此绘制不同情景的MEF函数图,见图3(限于篇幅,仅以情景“50%-50%-60%”列示)。
图2 1000次蒙特卡罗模拟产生的损失率(%)数据散点图
图3情景“50%-50%-60%”的MEF函数图
通过观察各情景中MEF曲线斜率有明显变化区域的数据,将各数据作为准阈值,对超过准阈值的数据拟合GPD模型,观察Anderson-Darling检验统计量的表现以确定最优阈值。由表2,情景1的Anderson-Darling统计量最小为0.2865,最优阈值为117.2698;情景2的Anderson-Darling统计量最小为0.2561,最优阈值为140.4418;情景3的Anderson-Darling统计量最小为0.3687,最优阈值为144.1897;情景4的Anderson-Darling统计量最小为0.2649,最优阈值为191.7559,显然,如果提高保障水平和损失程度,最优阈值点也在爬高。相应地,ξ值逐渐减小(分别为0.1566、0.0805、0.0664和-0.0104),σ值逐渐增大(分别为24.203、28.5019、31.8541和51.1643),ξ、σ的变化揭示出GPD分布的尾部随赔付风险的提高而变薄,大灾发生的小概率高赔付特征更为突出。
表2 部分设定情景下的GPD检验值表
2.3.1 风险分层结果
以生存函数曲线来表现风险分层结果。生存函数(S(z)与累积分布函数(F(z)的关系是 S(z)=P(Z>z)=1-F(z),前者能够更直观地反映赔付率分布的“小损失-大概率”和“大损失-小概率”特征,由既定损失率水平,可确定应赔付概率,便于风险评估和决策。仍以情景“50%-50%-60%”为例,以横轴表示赔付率、纵轴表示赔付发生概率绘制生存函数图,确定损失率10%为免赔水平,大灾阈值(u)作为超额赔付起赔点,以25年及50年大灾风险经验重现期,可将小麦保险赔付风险层划分为四层(见图4):
第一层:10%~117.27%,即将损失率高于10%至大灾阈值的区间作为保险公司的直保区间。对于超越阈值的损失风险,进一步划分为三个超额赔付层。
第二层:117.27%~134.65%,即以大灾阈值为起赔点,与25年大灾重现期对应的VaRα=4%构成损失风险的再保险区间。
第三层:134.65%~154.36%,为25年大灾重现期的VaRα=4%至50年大灾重现期的VaRα=2%构成的损失风险区间,由省级或中央大灾风险准备金承担。
第四层:154.36%以上,为50年以上大灾重现期的损失风险,由政府兜底或其他融资方式如政府借款、发行巨灾债券等方式解决。
图4“50%-50%-60%”情景下的生存函数赔付风险分层图
各情景的分层结果见表3,从中得出三点:其一,保障水平和损失率不变时,如果满足小麦承保风险的匀质性,则分层结果不受承保率变化的影响;其二,保障水平和损失率较低时,以阈值作为分保点,保险公司自留赔付的压力不大;其三,保障水平、损失率之一提高或两者同时提高时,GPD的尺度参数σ值不断增大,各层风险区间不断扩大,保险公司自留风险的压力增大,自留风险进一步分出的必要性也加大。
表3 各种设定情景方案下的赔付率分担层次划分
2.3.2 大灾阈值的警示性
大灾阈值u确定了农作物保险赔付风险分布由常态风险到大灾风险的“拐点”,在风险分担安排中具有积极的警示作用。以u为“警戒点”,比较承保率50%时的四种情景下“10年大灾重现期”和“最优分保”第一层的分保结果,见表4。
表4 三种划分依据下“第一层次”的分保点和区间比较
在“10年大灾重现期”的经验情形下,情景1中VaRα=10%与u相近,其他情景中VaRα=10%所确定的分保点>u,即“第一层”区间中混合了常规风险和大灾风险。混合风险保险定价的难度较大,且保障水平和损失程度越高,超越u的幅度越大,故“第一层”自留风险的管控须更为谨慎。
将阈值与“最优分保”结合进行风险分层考虑则更具风险管理的稳健性。在“最优分保”的情形下(设定α=10%,将VaRα与“10年重现期”的分保点比较),由式(11),最优分保比例取决于保险人的风险容忍度(α)、再保险保费附加因子(ρ)和再保险保费补贴(θ)。α、θ一定时,若ρ越小,自留比例越低。若ρ越大,自留比例越高;ρ、θ一定时,α越小,自留比例越低。α越大,自留比例越高;其他因素一定时,θ越小,自留比例越高。θ越大,保险人越倾向于分出更多的风险责任,体现了再保险政策的激励性。当α、ρ、θ一定时,分保结果则取决于承保率、保障水平和受灾程度。在其他因素相同时,承保率越高,自留比例越高;在其他因素相同时,保障水平越高,自留比例越高;在其他条件相同时,作物成灾损失程度越高,自留比例越高。反之皆越小。表4中列出了基于阈值的最优分保风险区间。
2.3.3 风险分层在保险实务中的建设性意义
2012年河南省农业保险工作方案规定,对单个保险品种赔付率300%以内的损失进行封顶赔付,仅划分了两个风险层:将赔付率<200%作为直接保险,200%~300%的损失部分由再保险解决(再保险解决不了的部分由财政部门和承保机构按照1:0.5:0.5的比例分摊)。这种设计与小麦保险保障水平为70%、损失率为80%的各设定情景下的风险层次划分结果基本一致,即第一层为10%~191.76%,第二、三、四层合并形成的区间为191.76%~297.32%,判断河南省小麦保险风险控制设计已达50年大灾重现的高防范水平,但第二层规定由再保险承担、进行封顶赔付并缺乏强制性分担安排。河南省农业保险的实际发展状况是,2012年小麦亩产的实际保障水平仅为34.78%,2013年为37.3%,2014年为40.5%。到2014年,小麦、玉米和水稻三大作物的承保率才达到27.8%,即农作物赔付风险尚处于情景1的状态,农业保险的未来发展不仅有赖于政策扶持的推动,还要加快再保险、大灾风险准备金等多层次意义上的风险分散机制的建设。
(1)与常规建模比较,极值统计建模抛弃了较小和中部的赔付信息,利用阈值确定了农作物保险赔付风险分布由常规风险到大灾风险的“拐点”,更好地刻画了大灾风险分布的厚尾和长尾特征。
(2)大灾阈值点的位置受多因素影响,须在保险实务中不断修正和完善。第一,风险数据。目前,国际上采用产量波动和灾害损失两类数据描述农作物损失风险,分别确定的大灾阈值点是有差异的。第二,风险模型。实践中,特定作物的保险赔付服从于哪种参数分布缺乏定论,只是依据统计检验准则筛选理想的分布函数,这种选择结果可能因时因地有所不同,导致有差异的极值模型和大灾阈值。第三,保障水平。对于大宗农作物,近年来各地基于“物化成本”保险的保障水平逐步提高,引致GPD模型的形状参数也不断增大,阈值点相应从高。其四,承保面。随着农作物承保规模的不断增大,保险聚集风险和分散风险的作用进一步增强,赔付率则会逐渐变小,引致GPD模型的形状参数也不断减小,阈值点相应从低。
(3)大灾阀值精算对保险人确定再保险分保点具有警示作用。本文认为,实践中可以阈值作为再保险分保点来划分第一层自留风险,同时对超越阈值的大额赔付讨论破产概率及再保险问题。如果结合风险分担者的风险承受能力(或容忍度)来考虑自留风险的问题,则应该将阈值作为风险分层决策的重要警示点,采用有效的风险控制措施使保险经营得以平稳运行。
(4)基于精算意义上的风险分层有益于支持建立稳健有效的风险分散机制。本文以河南省小麦保险为例所作的赔付风险分层研究,不仅是一种方法论上的探索,还可以进一步用于精算各层次的保险价格,建立政策性农业保险赔付风险分层可操作的量化框架。