李铁梅
摘要:本文采用组合回归模型对我国1978—2005年间城镇集体单位平均工资进行分析。利用数理统计中检验实验观测数据异常值的方法,对离群数据的误差进行统计上的显著检验,从而评估评估我国2006-2009年城镇集体单位平均工资的准确性。
关键词:城镇单位平均工资;组合回归模型;异常值检验;实证分析
1.引言
近几年,随着中国经济的不断发展,每年国家统计局都会公布本年全国的城镇职工平均工资。但数据发布后便引来了社会各界人士的广泛争议,普通老百姓更是表示没有感觉到工资的增长。由此引发了大家对统计数据质量问题的关注。统计数据的质量包含多种特征,而准确性是其中最为重要的特征。所谓准确性是指统计数据的估算值与目标特征值即“真值”的差异程度。本文从我国城镇集体单位平均工资数据出发,对统计数据准确性检验和分析的方法进行探讨。
2.文献综述
1938年,H. Wold 提出可以将离散平稳时间序列分为确定性和随机性两部分平稳序列之和,这便是现代时间序列分析理论的灵魂-Wold 分解定理。1961 年Cramer 证明了这种分解思路同样可以用于非平稳序列,这便是著名的Cramer分解定理。杨海山(2001)[1]建立了组合模型对统计数据的质量进行评估。卢二坡(2006)[2]从异常值的角度对数据质量进行评估是指通过各种统计和计量分析考察时间序列是否存在异常值。通过分析异常值存在的原因判断数据是否存在质量问题。刘洪、黄燕(2007)[3]在数据质量评估方面,即数据值与“真值”的差异程度方面他们与杨海山的不同之处在于运用了异常数据检验法。
3.组合回归模型基本思想
3.1模型概述
组合模型,根据序列Y璽的特点,选取合适的函数形式拟合f(t),直到剩余序列μ璽可以用ARMA模型拟合。
3.2 数据质量的评估
基本思路是:在模型通过各种检验、具有良好统计预测功能的基础上,比较模型拟合出的预测值与实际值,找出离群数据。
3.3 异常数据检验法
4.对我国城镇集体单位平均工资数据质量准确性检验的实证分析
4.1 对我国城镇集体单位平均工资趋势性部分的模型模拟