堪培拉指数与基尼系数的不平等测度比较

2018-10-09 05:53韩秀兰

统计与决策 2018年17期

韩秀兰，张楠

（山西财经大学统计学院，太原 030006）

0 引言

不平等指数作为不平等测度的重要方法，相关研究十分丰富。自Gini（1914）提出基尼系数后，众多学者构造了一系列新指数来测度不平等，这些指数主要包括Bonferroni指数（1930）[1]、Vergottini指数（1940）[2]、Atkinson 指数（1970）[3]、泰尔指数（1973）[4]以及Zenga指数（2007）[5]等。

不平等指标如果具有较优良的特性，就能以更好的方式来测量不平等。目前，一些具有较优良特性的不平等指标并没有得到应有的重视。比如堪培拉（Canberra）指数，该指数基于堪培拉距离衡量不平等，其良好性能由Subramanian（2012）[6]在测度洛伦茨曲线间的混乱程度时首次阐释，国外文献有许多相关的理论探讨和实证应用，但堪培拉指数在中国尚未引起人们的关注。本文将堪培拉指数与传统的基尼系数进行比较，系统地探讨堪培拉指数对不平等的度量。

1 堪培拉指数

1.1 符号定义

为了以较统一的方式给出不平等指数的数学表达式，有必要首先对基本符号进行定义。

非负、升序排列的n维收入向量：x=(x1…xi…xn)；

收入升序排列的前i个人的累积人口比例：pi=i/n；

前i个人的累积收入：时，累积收入为总收入T(x)；

前i个人的累积收入比例：L(Pi)=Qi(x)/T(x)；

前i个人的平均收入：μi=Qi(x)/i；

总平均收入：μ=T(x)/n。

1.2 堪培拉指数

堪培拉（Canberra）指数是国际上最新的不平等测度指标，是将堪培拉距离函数引入经济和社会领域来测度不平等。n维向量a和b间堪培拉距离的定义为：

对于升序排列的n维非负收入向量x=(x1…xi…xn)，平等分配时每个人的收入都相同，相应的收入向量为μx=(μ1…μi…μn)，μi=μ，Subramanian（2012）[6]基于堪培拉距离函数构造的不平等指数称为堪培拉指数：

显然，堪培拉指数是收入升序排列的前i个人的平均收入与总体平均收入之间相对差距的平均值。Subramanian（2012）[6]将DC(x)=[μ-μi(x)]/[μ+μi(x)]，x∈[0，μ]定义为堪培拉剥夺函数，Mirzaei等（2017）[7]进一步将堪培拉剥夺函数定义为堪培拉曲线（见图1）：

图1堪培拉曲线

如果总体中所有个体具有相同的收入，则μ=μi、p=L(p)，堪培拉曲线与连接坐标点（0,0）、（1,0）的平等线重合，因此，堪培拉指数可定义为堪培拉曲线以下的面积：

显然，堪培拉指数的值域为[0,1]。

1.3 基尼系数

基尼系数是应用最广泛的传统不平等指标，其定义基于洛伦兹曲线函数L(p)，该函数指收入升序排列后一定人口累积分位数所对应的收入累积分位数（见图2），可表示为：

图2洛伦兹曲线

洛伦茨曲线始终低于代表完全平等的对角线（图中450线）I(p)=p，p∈[0，1]，任何与对角线之间的偏差都代表存在一定程度的不平等，因此基尼系数可表示为：

可以看出，式（6）所示的基尼系数也是基于某种意义的距离来表示不平等，该距离是对角线I(p)=p和洛伦茨曲线L(p)之间的距离。基尼系数的值域为[0,1]。

2 堪培拉指数与基尼系数的比较分析

堪培拉指数与基尼系数的提出虽然相隔一个世纪之久，却有诸多相似之处，两指数都体现“距离”的概念，存在相应的不平等曲线，具有相似的几何意义。由于两指数的构造思想不同，对不同收入群体的敏感性不同，导致满足的公理化要求和相应的分解方式也有所区别。

2.1 测度敏感性比较

对比堪培拉指数的积分表达式（4）与基尼系数的积分表达式（6），如果收入完全平等分配，所有人口累积分位数等于对应的收入累积分位数，即p=L(p)，则有C=G=0；通常情况下堪培拉指数和基尼系数的值都大于0，但两者不相等。

将式（2）的堪培拉指数加和形式进一步展开，堪培拉指数还可表示为：

Sen（1973）[8]将基尼系数表示为：

将式（7）和式（8）对比可知，对于每个i=1，…，n，收入水平xi重复n+1-i次，收入最低的xi重复了n次，收入最高的xn重复了1次。堪培拉指数和基尼系数都体现出一种特殊的随着收入排名的提高而观测值出现次数递减的布局结构，由于两者构造的方法不同，考虑的收入差异对比的标准不同，尽管具有相似的布局结构，两者对升序排列的不同累积分位数群体的收入差异敏感度仍然不同。

为了对比分析，将式（4）所示的堪培拉指数与式（6）所示的基尼系数统一变换为：

与基尼系数一样，堪培拉指数的核心部分也是p-L(p)，如前文所述，这部分是完全平等分配累积收入份额p与实际累积收入份额L(p)的差额，两种指数赋予该差额以不同的权重，基尼系数中的权重wG(p)为常数2，而堪培拉指数中的权重wC(p)=1/[p+L(p)]随着累积收入分位数的上升而递减。基尼系数和堪培拉指数权重的这种差异意味着前者对累积收入分位数中部的收入差距比较敏感，而后者对累积收入分位数低处的收入差距比较敏感。

2.2 满足的公理化性质比较

不平等度量指标需要满足某些公理化要求，以保证其良好的测量性质，这些公理如表1所示。

表1 不平等测度指数的性质

不平等度量指标通常满足的公理越多（两种不平等测度指数所满足性质的证明过程有大量的文献对此关注，鉴于篇幅限制，本文将其略去），越能得到较广泛的认可。堪培拉指数满足表中所有的公理：齐次性、弱转移性、强转移性、人口对称性和可加性，而基尼系数不满足强转移公理。另外，两种指数虽然都满足可加性，但堪培拉指数的分解更简洁，解释能力更强。

基尼系数和洛伦兹曲线的组合可以用直观的形式来表达不平等，作为最经典的不平等测度方式，具有很强的理论和实际意义。然而，基尼系数对低收入群体没有给予足够的重视，不满足强转移公理要求，这也是基尼系数存在的较大缺陷。因此，满足强转移原则的堪培拉指数更应作为测度不平等的重要工具，以表达更多关注穷人的福利思想。

2.3 可加性比较

不平等指数的可加性可用于揭示不平等的构成，所得结论具有更直接的政策指导意义，堪培拉指数指数和基尼系数的构造不同，具有不同的分解方式，本文以不平等的人口构成子组分解为例进行对比。

设总体可根据一定的特征（比如性别、城乡、地域等特征）分为k个子组，Subramanian（2012）[6]通过建立子组和总体间的映射，将堪培拉指数按子组分解为：

其中fg表示各子组人口份额，/(μ+μgi)为各子组的堪培拉指数，其中ng为各子组的个体数，μgi为各子组与总体相对应的前i个人收入平均值。显然，堪培拉总不平等测度是子组不平等测度的加权和，相应权重是各子组对应的人口份额。

Dagum（1997）[9]给出以下基尼系数的分解公式：

上面方程中，fg和sg分别为g组人口份额和收入份额。方程（13）测量子组间存在的不平等，表示为任意两子组间基尼系数Glg=Δlg/(μl+μg)与其人口比重和收入比重的加权和，为任意两组间的平均绝对差异；方程（14）是组内不平等，组间不平等GTB又可进一步表示为组间不平等的净贡献GNB和组间交叉项GC之和：

可见，由于两种指数的构造方法不同，分解方式也不同，相比之下，基尼系数子组分解显得过于复杂，并且相应的分解除了组内不平等和组间净不平等外，存在组间交叉项等难以解释的余项，而堪培拉指数可直接分解为各组不平等指数的加权和，更简洁明了。

3 基于堪培拉指数的不平等测度实证

3.1 数据与指标

应用实际微观数据对堪培拉指数和基尼系数进行实证可以更好地理解堪培拉指数的优势。本文实证所用微观数据为CFPS数据①CFPS为北京大学中国社会科学调查中心实施的中国家庭追踪调查。，该数据覆盖全国，专注于中国居民家庭的经济与非经济福利指标，该调查于2010年正式启动，最新数据可提供至2014年，家庭收入数据的调查是针对上一年度的。

本文对2010年和2014年家庭人均纯收入的不平等进行分析，所有数据采用2010年价格进行了可比折算。CFPS在2010年和2014年提供的家户样本数分别为14798和13946②为了增加对Canberra不平等指数测度方法理解的直观性，本文实证没有考虑CFPS数据的样本权重。，排除了缺少实证所需相关信息的样本，两年的最终家户样本量分别为13902和12917③统计软件计算不平等指数时不考虑0收入数据，而0收入家庭又大量存在，直接删除该样本会造成估计的偏差，本文以0.00001代替所有的0收入，保证了样本数，又不至于影响估计结果。，农村样本约占到52%。中国家庭的人均纯收入4年间经历了较大幅度的增长，绝对水平从10137元上升到14066元（见表2），保持了8.5%以上的年均增长率。但收入增长的不平衡性是存在的，家庭人均纯收入的平均值远高于中位数，考察的每个年份，收入分布都表现出较明显的右偏性。

表2 中国家庭人均纯收入基本描述统计和不平等测度（单位：元）

3.2 堪培拉指数与基尼系数的实证测度结果对比

首先对比度量值的绝对水平。2009年和2013年，中国家庭人均收入基尼系数值分别为0.5513和0.5272④本文基尼系数测度实证时没有考虑样本权重，而且包含0收入家庭，这可能导致不平等测度结果偏大。，堪培拉指数值分别为0.5615和0.5555，两者的测度水平值虽有所差别，但变化的趋势是一致的，两者均表明在2009—2013年间中国家庭人均收入存在较高程度的不平等，但两种不平等测度值都有所下降。

从动态角度看，两种曲线揭示出不平等演变的不同细节。两个年份的洛伦茨曲线（见下页图3）在0＜p＜0.48范围的低收入部分几乎重合，位于0.48＜p＜1范围内的洛伦茨曲线明显上移，可以得出，总不平等的下降主要归因于较高收入群体的收入与平均收入的差距缩小引起的不平等下降；堪培拉曲线显示了不同于伦茨曲线的细节特征。堪培拉曲线（见下页图4）显示，2009—2013年，位于0.48＜p＜1范围的较高收入群体的堪培拉曲线明显下移，意味着不平等程度的降低，而位于0＜p＜0.48范围内的较低收入群体的堪培拉曲线却发生明显的上移，意味着不平等程度的上升，较高收入群体的不平等降低略高于较低收入群体的不平等上升导致了堪培拉指数值度量的总体不平等程度下降。对于中国家庭人均纯收入总体不平等在2009—2013年间的这种动态演变特征：总体不平等程度有所下降，但低收入群体状况更加恶化，不同群体的细节特征在洛伦茨曲线中难以观察到，但在堪培拉曲线中却包含了更多的信息，因此，与洛伦茨曲线相比，堪培拉曲线更加关注较低收入群体，与基尼系数相比，堪培拉指数提供了有关不平等动态演变的更多细节。

图3中国家庭人均纯收入样本洛伦茨曲线

图4中国家庭人均纯收入样本堪培拉曲线

3.3 堪培拉指数与基尼系数的不平等分解比较

为简单起见，根据2014年的CFPS数据，本文将总体划分为城市和乡村两个子组，用于不平等的子组分解研究。堪培拉指数子组分解没有组间的交叉项，相应分解结果显得简单明了。城市家庭人均纯收入堪培拉指数小于农村，考虑城乡人口份额后，城市和农村不平等对总不平等的贡献率分别为46%和54%（见表3）。

表3 2013年中国家庭人均纯收入堪培拉指数的城乡不平等样本分解结果

与堪培拉指数的城乡不平等加和分解相比，基尼系数的分解过于复杂。城市的基尼系数略低于农村，城市和农村组内不平等、组间净不平等和组间交叉项对总不平等的贡献分别为47%、28%和25%（见表4），基尼系数城乡分解过程中城乡间交叉项的存在导致基尼系数不能简单表示为城市和农村不平等的加权和形式。

另外，堪培拉指数度量的城乡间不平等具有很大的差别，而基尼系数的城乡差异微乎其微，这是由于堪培拉指数对较低收入群体的收入差异更为敏感。如果社会中的弱势群体更应值得关注，基尼系数有可能低估组间不平等差异。

表4 2013年中国家庭人均纯收入基尼系数的城乡不平等样本分解结果

4 结论和建议

与基尼系数相比，堪培拉指数的特性更优异，主要是因为它满足强转移公理要求，更适合分析较低收入群体的不平等现状和相关政策效应；与洛伦茨曲线相比，堪培拉曲线可以展现关于不平等动态演化的更多细节，而基尼系数则有可能低估组间的不平等差异。

不平等的测度是度量社会公平性的重要参照，当前世界分化动荡加剧，贫富差距进一步加大，而基尼系数并不能充分体现这种社会分化。对中国而言，减少贫困和缓解不平等是当前社会和经济发展的重要战略目标，减少不平等的相关政策应该更多地关注低收入群体，而我国现有不平等方面的测度及相关的政策效应研究大都以基尼系数为参照，尽管堪培拉指数在国际上得到广泛认可，但在我国却很少得到关注。应该与国际接轨，结合中国实际，选择性质更优良、对低福利群体更敏感、能揭示不平等动态演变更多细节、能合理体现子组间不平等差异的堪培拉指数作为不平等统计测度的重要方法工具。