(贵阳银行-对外经济贸易大学金融学院在职人员高级课程研修班 贵州 贵阳 550004)
关于职工工资总额的计量分析
——基于时间序列数据的研究
罗阳
(贵阳银行-对外经济贸易大学金融学院在职人员高级课程研修班贵州贵阳550004)
拟建立模型是关于职工工资总额与总人口,国内生产总值和居民消费价格指数之间的关系。
指标信息如下:
在岗职工工资总额(Staff Total Wages):是指各单位在一定时期内直接支付给本单位全部在岗职工的劳动报酬总额。工资总额的计算应以直接支付给在岗职工的全部劳动报酬为根据。各单位支付给在岗职工的劳动报酬以及其他根据有关规定支付的工资,不论是计入成本的还是不计入成本的,不论是以货币形式支付的还是以实物形式支付的,均应列入工资总额的计算范围。工资总额包括计时工资、计件工资、奖金、津贴和补贴、加班加点工资、特殊情况下支付的工资。
总人口(年末)(POP):是指一定时点、一定地区范围内有生命的个人总和。年度统计的年末人口数指每年12月31日24时的人口数,包括中国人民解放军现役军人。年度统计的全国人口总数内未包括香港、澳门特别行政区和台湾省以及海外华侨人数。
居民消费价格指数(CPI):是指反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格变动趋势和程度的相对数,是对城市居民消费价格指数和农村居民消费价格指数进行综合汇总计算的结果。该指数可以观察和分析消费品的零售价格和服务价格变动对城乡居民实际生活费支出的影响程度。
国内生产总值(GDP):国内生产活动的最终成果。国内生产总值有三种表现形态,即价值形态、收入形态和产品形态。从价值形态看,它是所有常住单位在一定时期内生产的全部货物和服务价值超过同期投入的全部非固定资产货物和服务价值的差额,即所有常住单位的增加值之和;从收入形态看,它是所有常住单位在一定时期内创造并分配给常住单位和非常住单位的初次收入之和;从产品形态看,它是所有常住单位在一定时期内最终使用的货物和服务价值减去货物和服务进口价值。在实际核算中,国内生产总值有三种计算方法,即生产法、收入法和支出法。三种方法分别从不同的方面反映国内生产总值及其构成。
多元线性回归模型;异方差检验
首先,建立函数模型:stw=Apopαcpiβgdpγeμ
经对数变换,可用如下对数线性回归模型进行估计:(lnA=β0)
lnstw=β0+β1lnpop+β2lncpi+β3lngdp+μ
然后根据一系列检验,调整,最终确定最优的具体形式。
下表列出了1978——2010年的社职工工资总额,总人口,CPI,GDP,以及相对应的ln(stw),ln(cpi),ln(pop),lng(gdp)。其中CPI是以1978年数据为基期计算的,1978年CPI为100,总人口的计量单位是万人,职工工资总额和国内生产总值的计量单位是亿元。
职工工资总额总人口CPIGDPln(stw)ln(cpi)ln(pop)lng(gdp)1978年568.996259.11003605.66.3437054.6051711.4758.1902431979年646.797542.8101.94092.66.4718834.6239911.4888.3169361980年772.498705.6109.54592.96.6495034.6959211.58.4322671981年820.0100072.4112.25008.86.7093044.7202811.5148.5189521982年882.0101654114.455906.7821924.739711.5298.6287351983年934.6103008116.76216.26.8401194.7596111.5438.7349141984年1133.4104357119.97362.77.0329774.7866611.5568.9041821985年1383.0105851131.19076.77.232014.8759611.579.1134661986年1659.7107507139.610508.57.4143924.9387811.5859.259941987年1881.1109300149.812277.47.5396125.009311.6029.4155151988年2316.211102617815388.67.7476835.1817811.6189.6413821989年2618.5112704209.917311.37.8703575.3466311.6339.7591151990年2951.1114333216.419347.87.9899335.3771311.6479.8703341991年3323.9115823223.822577.48.1088945.4107511.6610.02471992年3939.2117171238.127565.28.2787335.4726911.67110.224311993年4916.2118517273.136938.18.5002915.6098411.68310.5171994年6656.4119850338.950217.48.8033345.8257111.69410.824121995年8100.012112139763216.98.9996195.9839411.70511.054331996年9080.0122389400.674163.69.1138295.9929611.71511.214031997年9405.3123626441.981658.59.1490296.0910811.72511.31031998年9296.5124761438.486531.69.1373936.0831311.73411.368261999年9875.5125786432.391125.09.1978126.0691211.74211.419992000年10656.2126743433.998749.09.2738976.0728111.7511.500342001年11830.9127627437109028.09.378476.0799311.75711.599362002年13161.1128453433.5120475.69.4850216.0718911.76311.69922003年14743.5129227438.7136634.89.5985586.0838211.76911.825072004年16900.2129988455.8160800.19.7350816.1220511.77511.987922005年19789.9130756464187131.29.8929276.1398811.78112.139572006年23265.9131448471222240.010.054746.1548611.78612.311512007年28244.0132129493.6265833.910.248646.2017311.79212.490632008年33713.8132802522.7314901.310.425666.2590111.79712.660012009年38492.0133474519.1346316.610.558216.252111.80212.755112010年45116.9134091536.2394307.610.717016.2845111.80612.88489
资料来源:根据《中国统计年鉴》(1978,2010)整理,表中部分数据来源于网上资料
为了更好的分析比较模型数据的性质以及为了使参数统计量具有良好的统计性质,对设置的模型做出若干基本假设。
假设一,回归模型是正确设定的。
假设二,解释变量lngdp,lncpi,lnpop是非随机的,且它们之间不存在严格线性相关性。
假设三,解释变量lngdp,lncpi,lnpop在所抽取的样本中具有变异性,而且随着样本容量的无限增加,lngdp,lncpi,lnpop的样本方差趋于一个非零的有限常数。
假设四,随机误差项具有条件零均值,同方差以及不序列相关性。
假设五,解释变量与随机项不相关。
假设六,随机项满足正态分布。
现假设以上条件均成立,因此做如下分析:
(一)OLS
通过Eviews软件对公式进行回归,结果如下:
Dependent Variable: LNSTW
Method: Least Squares
Date: 05/17/12 Time:16:03
Sample:1978 2010
Included observations:33
VariableCoefficientStd.Errort-StatisticProb.C-8.8694058.135557-1.0902030.2846LNCPI-0.1996910.097051-2.0575890.0487LNGDP0.9181200.04675119.638330.0000LNPOP0.7546000.7503661.0056420.3229R-squared0.998346Meandependentvar8.523661AdjustedR-squared0.998175S.D.dependentvar1.319890S.E.ofregression0.056388Akaikeinfocriterion-2.799918Sumsquaredresid0.092208Schwarzcriterion-2.618523Loglikelihood50.19865F-statistic5834.668Durbin-Watsonstat0.383252Prob(F-statistic)0.000000
回归结果表明:
在1978——2010年间,lnstw变化的99.83%可由lngdp,lncpi,lnpop变量的变化来解释。又因为调整的可决系数为0.998175,表明模型的拟合优度很高。在5%的显著性水平下,F检验的P值为0,表明模型的线性关系显著成立。从T检验结果来看,在5%的显著性水平上,lngdp的P值为0,小于5%,lncpi的P值为0.0487,小于5%,lnpop的P值为0.3229,大于5%,C的P值为0.2846,大于5%。所以lngdp和lncpi的参数显著的不等于0,但不拒绝C和lnpop前参数为0的假设。
lngdp前的参数为0.918120,表明在lncpi和lnpop不变的情况下,GDP每增加1%,职工工资总额将平均增加0.918120%。lncpi前的参数为-0.199691,表明CPI每增加1%,职工工资总额将平均下降0.199691%。lnpop前的参数为0.754600,表明POP每增加1%,职工工资总额将平均增加0.754600%。
(二)受约束回归。为了进一步考察职工工资总额与GDP,CPI和POP之间的关系,从上述回归结果看,β1+β2+β3=1.872411,根据对各个参数的观察,此模型有些类似于以幂函数形式表示的生产函数模型,因此对模型中的变量设置了一个约束条件:
假设β1+β2+β3=0
Wald Test:
Equation:Untitled
TestStatisticValuedfProbabilityF-statistic4.845426(1,29)0.0358Chi-square4.84542610.0277NullHypothesisSummary:NormalizedRestriction(=0)ValueStd.Err.C(2)+C(3)+C(4)1.4730290.669184
Restrictions are linear in coefficients.
由检验结果可知F检验的P值为0.0358,小于5%,因此拒绝原假设,即设置的约束条件不成立。
(三)邹氏参数的稳定性检验。1978——2010年间,职工工资总额随着时间变化的曲线图,可以看出中国社会职工工资总额在1978——2010年间总体呈现出较为一致的增长趋势,但是可以看到自1992年以后,斜率明显增大,并且据调查,自1992年以后,中国经济开始进入起飞阶段,随后,国内高涨的投资率和储蓄率支撑着这个庞大的经济体驶入快车道。并且1992年GDP增长速度为14.2%,因此我将1992年作为间断点,利用Eviews进行邹氏参数的稳定性检验。
Chow Breakpoint Test:1992
F-statistic26.24485Probability0.000000Loglikelihoodratio54.40051Probability0.000000
由于F检验的P值为0.000000,小于5%。因此拒绝参数稳定的原假设,表明职工工资总额在1992年前后发生了显著变化,模型中参数是非稳定的。
前面对模型的回归分析是在对模型提出若干假定的条件下,应用普通最小二乘法得到了无偏且有效的参数估计量。但是,事实上,模型会出现基本假定违背的情形,因此接下来对基本假定进行计量经济学检验,并采取相应的补救措施。
(一)异方差性检验。由于异方差性会产生一系列不良后果,如参数的估计量不具有有效性,变量的显著性检验失去意义,模型的预测失效等,因此对模型进行异方差性检验。
怀特检验
White Heteroskedasticity Test:
F-statistic2.076336Probability0.099532Obs*R-squared9.164794Probability0.102669TestEquation:DependentVariable:RESID2Method:LeastSquaresDate:05/22/12 Time:19:35Sample:19782010Includedobservations:33VariableCoefficientStd.Errort-StatisticProb.C-0.8349150.691399-1.2075720.2377LNGDP-0.0564240.026170-2.1560580.0402LNGDP^20.0021730.0009972.1780380.0383LNCPI0.1044970.0600191.7410570.0931LNCPI^2-0.0081270.005189-1.5661640.1290LNPOP0.0736520.0705901.0433870.3060R-squared0.277721Meandependentvar0.002794AdjustedR-squared0.143966S.D.dependentvar0.002427S.E.ofregression0.002245Akaikeinfocriterion-9.197049Sumsquaredresid0.000136Schwarzcriterion-8.924956Loglikelihood157.7513F-statistic2.076336Durbin-Watsonstat1.373862Prob(F-statistic)0.099532
对于Obs*R-squared这一项,P值为0.102669,大于5%,因此接受原假设,即模型满足同方差假设,不存在异方差性。
(二)序列相关性检验。对于采用时间序列数据的模型,一般会产生序列相关性问题,以下采用了系列方法对模型是否有序列相关性进行检验。
2.D.W.检验法。由第一部分的OLS检验结果可以看出,模型的D.W.值为0.383252,由于样本容量为33,解释变量的个数为3,通过查表可知dL=1.32,dU=1.58,由于0 3.LM 检验 一阶 Breusch-Godfrey Serial Correlation LM Test: F-statistic56.63682Probability0.000000Obs*R-squared22.08277Probability0.000003TestEquation:DependentVariable:RESIDMethod:LeastSquaresDate:05/22/12 Time:19:46Presamplemissingvaluelaggedresidualssettozero.VariableCoefficientStd.Errort-StatisticProb.C0.0122804.7621890.0025790.9980LNGDP0.0409300.0279011.4669510.1535LNCPI-0.0959050.058221-1.6472520.1107LNPOP0.0079410.4392320.0180780.9857RESID(-1)0.9042380.1201537.5257440.0000R-squared0.669175Meandependentvar-8.61E-16AdjustedR-squared0.621914S.D.dependentvar0.053680S.E.ofregression0.033007Akaikeinfocriterion-3.845477Sumsquaredresid0.030505Schwarzcriterion-3.618733Loglikelihood68.45037F-statistic14.15921Durbin-Watsonstat1.731255Prob(F-statistic)0.000002 二阶 Breusch-Godfrey Serial Correlation LM Test: F-statistic28.96587Probability0.000000Obs*R-squared22.50922Probability0.000013TestEquation:DependentVariable:RESIDMethod:LeastSquaresDate:05/22/12 Time:19:47Presamplemissingvaluelaggedresidualssettozero.VariableCoefficientStd.Errort-StatisticProb.C-0.0251074.754048-0.0052810.9958LNGDP0.0304910.0295811.0307530.3118LNCPI-0.0717980.062509-1.1486090.2608LNPOP0.0090280.4384700.0205890.9837RESID(-1)1.0535910.1863065.6551590.0000RESID(-2)-0.2190880.209124-1.0476460.3041R-squared0.682098Meandependentvar-8.61E-16AdjustedR-squared0.623227S.D.dependentvar0.053680S.E.ofregression0.032949Akaikeinfocriterion-3.824717Sumsquaredresid0.029313Schwarzcriterion-3.552625Loglikelihood69.10783F-statistic11.58635Durbin-Watsonstat1.977880Prob(F-statistic)0.000005 三阶 Breusch-Godfrey Serial Correlation LM Test: F-statistic18.83976Probability0.000001Obs*R-squared22.60243Probability0.000049TestEquation:DependentVariable:RESIDMethod:LeastSquaresDate:05/22/12 Time:19:51Presamplemissingvaluelaggedresidualssettozero.VariableCoefficientStd.Errort-StatisticProb.C-0.2356644.842719-0.0486640.9616LNGDP0.0355200.0317671.1181370.2737LNCPI-0.0872440.071029-1.2282830.2303LNPOP0.0299140.4469320.0669320.9471RESID(-1)1.0769670.1951135.5197040.0000RESID(-2)-0.3068680.279411-1.0982680.2822RESID(-3)0.1106890.2292730.4827820.6333R-squared0.684922Meandependentvar-8.61E-16AdjustedR-squared0.612212S.D.dependentvar0.053680S.E.ofregression0.033428Akaikeinfocriterion-3.773035Sumsquaredresid0.029053Schwarzcriterion-3.455594Loglikelihood69.25508F-statistic9.419881Durbin-Watsonstat2.082659Prob(F-statistic)0.000016 第二次检验中Obs*R-squared项的P值为0.000013,小于5%,因此模型存在序列相关性,又因为RESID(-1) 的P值为0.0000,小于5%,并且RESID(-2) 的P值为0.3041,大于5%。 第三次检中Obs*R-squared项的P值为0.000049,小于5%,因此模型存在序列相关性,又因为RESID(-1) 的P值为0.0000,小于5%,并且RESID(-2) 的P值为0.2822,RESID(-3)的p值为 0.6333,均大于5%。因此可以判定模型只存在一阶序列相关,不存在二阶序列相关。 通过以上计量经济学的研究,GDP,CPI与职工工资总额之间的关系是相互联系,相互制约的,并且在考虑了滞后变量的影响之后,CPI也对职工工资总额的影响显著,可见CPI的增大,不仅仅会影响到居民的生活质量,同时还会间接影响职工工资总额的降低,进而也影响到GDP的下降,因此,降低CPI对于百姓生活收入的提高至关重要。 “最低工资”不能保障工人。提高最低工资标准是人们最常想到的政策,但这也是被学界批评得最多的政策。因为最低工资法并不能真的提高工人工资,而只能提升企业用工成本,提高整个社会的失业率,并以此祸害工人。 “集体协商”很多余。从业者工资收入的高低和他们是否以集体协商的形式约定工资无关,而只和这个行业的劳动力稀缺情况有关。如果某些工作人人能干,那再怎么集体协商,这个行业的从业者收入也不会很高。反过来,如果人才稀缺,那哪怕没有什么集体谈判,这些人的收入也会很高。 立法规范“同工同酬”只能是画饼充饥。巴尔扎克说:“平等或许是一种权利,但却没有任何力量使它变为现实。”如果不在制度建设上发力,不铲除体制积弊,不进行大刀阔斧的改革,不从纸面进入操作层面、执行层面,所谓的“同工同酬”、“同票同权”和“同命同价”仍是美丽而飘渺的纸上富贵。 [1]《中国统计年鉴》 中华人民共和国国家统计局 [2]计量经济学[M]赵国庆 主编 /2012-02-01 /中国人民大学出版社 罗阳(1989-),男,汉族,贵州省贵阳市人,经济学学士,贵阳银行—对外经济贸易大学金融学院在职人员高级课程研修班学员,研究方向:金融学。四、思考