基于分位数回归的中国城乡居民收入影响因素研究

2020-10-21 08:19汪子琦汪正飞钱星曌
好日子(中旬) 2020年2期
关键词:分位数回归

汪子琦 汪正飞 钱星曌

[摘要]本文利用CFPS2018的person数据,对城镇人口和乡村人口分别进行多元线性回归和分位数回归,接着再用组合检验方法基于这两个地方所对的多元线性回归系数差异进行检验,然后再对城乡不同分位数下的分位数回归系数进行检验。结果表明,(1)多元线性回归中,被调查对象的受教育年限对收入的影响在0.1的显著性水平下存在城乡差异。(2)在75%分位点上,使用计算机的城镇居民在受教育年限对工作年收入的影响在10%显著性水平受到教育年限更强的影响。总之,分位数回归能根据每个调查对象的不同收入情况进行分析,从而可以为各收入人群提出更明确的建议。

[关键词]分位数回归;CFPS2018数据;收入影响因素;组合检验

0引言

十九大报告中,习近平同志提出我国现阶段主要矛盾是人民对美好生活的向往和发展不平衡不充分之间的矛盾,为了实现全面脱贫,需要缩小城乡居民收入的差距,实现共同富裕。从这个意义上,对城乡居民收入差距的研究不容忽视。

不少学者发现了影响收入的因素有很多,李雅楠和廖利兵(2011)使用基于RIF分位数回归方法利用1991~2009年的中国营养和健康调查数据,发现低收入分位点上的性别收入差距有所扩大,而高收入分位点相反[1]。陈梦雨(2016)较为全面地用线性回归和分位数回归论证了性别、年龄、受教育程度、城乡户籍和地区等因素对收入的影响[2]。刘国辉和张卫国(2016)基于分位数回归方法利用中国综合社会调查(CGSS2006)数据发现外语的使用回报率对不同阶层收入的影响有显著差异[3]。刘晓倩和韩青(2018)利用CFPS2014数据使用内生转换模型估计互联网使用对农村居民收入的影响,发现使用互联网的居民年收入有所提高[4]。也有不少学者发现教育也对收入存在影响,Sannicandro等(2018)使用多层建模技术对2008-2013年美国康复服务管理局的档案进行分析,发现高等教育可在一定程度上解决低就业率的智障人士问题提高收入[5]。叶杰和徐越倩(2019)构建了以规则意识和努力主导型价值观为中介变量和调节变量的有调节的中介作用模型,对CGSS数据加以验证,发现努力主导型价值观正向调节了教育水平对个人收入的正向影響[6]。

城乡收入分配不均也受到越来越多的人的关注,不少学者已经开始重视这方面的研究。张洋洋(2017)基于分位数回归的M-M分解对于CHNS数据探究了城乡各个收入段家庭收入影响因素,发现城乡高收入家庭的收入差距比中低收入家庭更大[7]。华昱(2018)利用明瑟方程讨论了互联网使用对收入增长的效应,通过对照试验发现城市居民可从互联网中获得更高的收入回报率[8]。贺娅萍和徐康宁(2019)运用中国省级单元在2004~2015年间的数据进行检验,发现互联网的使用拉大了城乡差距,这种效应随着地区经济发展水平的变化而变化[9]。梁莹和崔惠民(2019)对全国7个省(直辖市)的数据进行研究发现居民受教育程度对城乡居民收入影响有所差异[10]。基于以上研究,本文将分别使用均值回归和分位数回归对居民收入影响程度的城乡差异进行研究,并采用组合检验方法来检验哪些变量分别在均值回归,0.25、0.5和0.75分位点上的分位数回归,并对每个城乡每个收入层次进行分析。

1.研究方法

1.1分位数回归

分位数回归是Koenker和Basset(1978)提出的在给定自变量条件下,因变量在不同分位点上的变动趋势[11]。该模型参数向量可由最小绝对加权误差可得,求解结果有如下形式:

其中,X{是各自变量组成的行向量,

1.2组合检验

组合检验是检验两组样本间的分布差异,已知两组样本的个数,分别记为n1和n2,先计算两细样本真实均值之差,在重复若干次实验,每次随机抽取n1个样本,再分别计算抽出样本和剩余样本的均值之差,并与真实均值之差进行比较。这里我们选取双侧检验,令m为重复实验中两组样本均值之差的绝对值大于真实两组样本均值之差的个数,其与抽样次数的比值即为P值,当P值小于0.1时,可以拒绝两组样本无显著差异的原假设。

2.实证分析

该部分中,我们选取被调查对象的性别、年龄、是否使用外语、是否使用计算机、上网时工作的重要性、智力水平、以及最高教育年限为解释变量,以年工作总收入为被解释变量,使用Stata15.1进行实证分析。

2.1数据来源和描述

本文数据选自中国家庭跟踪调查(CFPS)2018中的person数据库,删除含有缺失值、异常值和不适用的样本,有效样本共3683个,各定量变量和定性变量的描述性统计情况如表1和表2所示:

通过以上两表可知,上网时的工作重要程度和智力水平的平均水平比较高,且大多数调调查对象来自城镇、男性占多数、更多的人在使用计算机,但较少有人使用外语。在对城乡居民收入均值,下四分位数,中位数和上四分位数进行组合检验,发现P值均小于0.05,则在5%的显著性水平下可认为居民总收入在城乡之间不但总体上存在差距,而且在各个收入水平上也存在差距。

2.2两种回归结果分析

下面我们分别对工资收入及其影响因素进行均值回归和分位数回归,回归方程有如下形式:

这里X;为影响工作年收入的变量组成的行向量,是待估计的参数列向量。先对城乡两地分别采用均值回归进行分析,结果如表3所示:

由表3可知,总体上城镇居民收入受到本文所选所有自变量的显著影响,但智力水平却对乡村居民收入无显著影响,可见整体上城镇居民收入受到的影响因素更多,尤其是智力水平的影响不可忽视。

下面将对性别、年龄、使用英语、使用计算机和受教育年限对城乡居民收入的影响差异进行讨论,对这些变量与工作年收入的对数之间进行多元线性回归,再进行组合检验,组合检验发现各变量对应的P值分别为0.7310、0.1055、0.6773、0.3313和0.0532,可见城乡之间受教育年限对工作年收入的影响在10%显著性水平下有所不同。

再对城乡间分别在0.25、0.5和0.75分位数点上进行分位数回归,结果如表4所示:

由表4可知,在0.25分位数点上,是否使用外语对工作年收入影响显著性不同,且只在城镇上受教育年限对收入才有显著正向影响;在0.5和0.75分位数点上,是否使用外语和调查对象年龄只对城镇居民收入有显著正向影响;说明低收入居民在城乡上受到是否使用外语不同程度的影响,且只在城镇里受到教育年限影响,而只有中等及其以上收入的城镇居民会受到其年龄和是否使用外语正向显著影响。总之,在每个分位数点上无论乡村还是城镇,均会受到性别、使用计算机和智力水平的影响,下面分别对对城乡不同分位数下基于是否使用计算机来讨论其他自变量对工作总收入的影响差异。

在乡村居民中,25%分位数点上使用计算机的调查者收入受到性别、年龄、受教育年限和智力水平的正向显著影响,而不使用计算机的调查者收入却不受这些因素显著影响,50%分位点上使用计算机的调查者收入受到年龄、受教育年限的显著影响,而不使用计算机的调查者收入却只收到性别的显著影响;75%分位点上使用计算机的调查者收入受到性别、外语水平、受教育年限的正向显著影响,而不使用计算机的调查者收入却只收到性别的显著影响。所以乡村使用计算机的低收入者应当适增加自己的受教育年限,不使用计算机的较低收入者需开始培养使用计算机工作的习惯而使用计算机的较低收入者应当适当增强自己的智力水平,使用计算机的较高收入者应当适当增强自己的外语水平。

在城镇居民中,使用计算机的居民收入25%分位数点上受到其他所选自变量的显著影响,50%和75%分位数点,上却受到智力水平的影响不那么显著而不使用计算机的居民25%和50%分位数点上对收入的影响仅仅只有显著的性别差异,在75%分位数点上除了显著的性别差异还受到年龄、教育年限和上网时工作的重要性显著的正向影响。而25%分位数点,上基于是否适用计算机进行组合检验得到的P值为0.0948,50%分位数点上得到的P值为0.0635,可见在中低收入使用计算机的男性的工资在10%显著性水平下更高些;75%分位数点上进行组合检验得到的各变量对应的P值分别为0.4802、0.5517、0.0632和0.7142,可见城镇居民收入较高人群中是否使用计算机在受教育年限对工作年收入的人的影响上在10%显著性水平下有所不同。

3结束语

本文使用了均值回归,并与每个分位点下的分位数回归结果进行比较,通过研究结果可以提出以下建议:(1)农村居民应当培养运用互联网进行工作的意识,以在各收入层次上缩小与城镇的差距。(2)城鎮的高收入工作应充分

多招收高学历,精通外语和计算机的人才,充分发挥其能力,以更好促进经济良性发展。

参考文献

[1]李雅楠,廖利兵.城镇居民性别收入差距及其演变: 1991 2009[J].人口与经济,2014(2):86-95.

[2]陈梦雨.我国居民收入分布的问题研究[D].安徽大学,2016.

[3]刘国辉,张卫国.中国城市劳动力市场中的“语言经济学”:外语能力的工资效应研究[J].山东大学学报(哲学社会科学版),2016,1(2):46-52.

[4]刘晓倩,韩青.农村居民互联网使用对收入的影响及其机理——基于中国家庭追踪调查(CFPS)数据[J].农业技术经济,2018(9).

[5]Sannicandro T,Par ish S L, FournierS,. Employment, Income,and SSI Effects of PostsecondaryEducation for People WithIntellectual Disability[J]. AmJ Intellect Dev Disabil. 2018:412-425.

[6]叶杰,徐越倩.教育水平对个人收入影响机制的再考察——基于教育的传递社会规范功能的研究路径[J].复旦教育论坛,2019(4).

[7]张洋洋.我国中等收入家庭收入差距影响因素分析[D].安徽大学,2017.

[8]华昱.互联网使用的收入增长效应:理论机理与实证检验[J].江海学刊,2018(3):219-224.

[9]贺娅萍,徐康宁.互联网对城乡收入差距的影响:基于中国事实的检验[J].经济经纬,2019,36(02):31-38.

[10]梁莹,崔惠民.教育人力资本对城乡居民收入水平差异性的影响分析[J].黑龙江工业学院学报(综合版),2019,19(8).

[11]Koenker Roger, Basset t G.Regress ionQuantiles [J]. Econometrica, 1978, 46(1): 33-50 6000.

猜你喜欢
分位数回归
新常态下我国城乡居民代际收入流动性分析
县域产业园区经济发展对城镇化的影响
中国农村居民消费函数的实证研究
支农贷款影响农户收入增长的路径分析
企业员工情绪劳动问题的统计研究
家庭债务变动对婚姻不稳定性的影响
制度软化、公众认同对大气污染治理效率的影响
流动人口家庭与城镇家庭的消费差异
税收政策影响居民消费水平的区域效应研究基于省级面板数据的分位数回归分析
我国城乡居民收入不平等的演变特征