王 平 王 芳
中图分类号:F234.2 文献标识码:A
内容摘要:据国家统计局公布的数据,2006年我国在岗职工年平均工资为21001元。年均递增12%,是改革开放以来我国职工实际工资收入水平增长最快的时期。这条正面新闻却引发了激烈争论。本文从统计学的角度探讨了产生这场争论的原因,即在运用平均指标进行分析时应注意的几个问题,并给出了解决方法。
关键词:平均工资 算术平均数 中位数 组平均数
据悉,2002年,我国在岗职工年平均工资为12422元,到2006年达到21001元。扣除价格上涨因素,年均递增12%,比同期人均国内生产总值年均递增9.2%高2.8个百分点,是改革开放以来我国职工实际工资收入水平增长最快的时期(中国新闻网消息7月2日)。这一消息却引发了激烈争论。
从各大门户网站的留言看,几乎所有的网友都对这条新闻有置疑,有人认为这是“真实的谎言”,有人认为这是“不涨反降”,也有人质疑“是不是又在放卫星”。《人民日报》的人民论坛杂志就职工对当前工资的满意度进行了一项调查,调查结果显示:对当前工资状况不满意的人达96.5%。为什么民众感觉却与此统计结果反差如此之大呢?原因就在于“职工工资总额和职工平均工资”的增长,并不一定意味着大多数普通职工实际收入的增长,反而有可能意味着他们相对收入的下降。也就是说在这里国家统计局单纯用“平均工资”这个算术平均数来反映全体劳动者的工资水平是不合适的,或者说计算“平均工资”的方法是不适合的,因此出现了上面所说的争议。本文拟以“平均工资”为例讨论在运用平均数时应注意的几个问题。
总体的同质性是运用平均指标的基本前提
平均数又称平均指标,是社会经济统计中广泛使用的一种综合指标。它反映同类社会经济现象在一定时间、地点、条件下的一般水平。平均数按计算方法不同又可分为数值平均数和位置平均数,其中数值平均数又分为算术平均数、调和平均数和几何平均数;而位置平均数又包括众数和中位数。平均分析是利用上述平均指标来研究总体各单位的共性,并以此来反映现象的一般水平。只有当总体各单位在被研究的标志上具有同类性,才能使所计算出来的平均指标正确反映总体单位的共同特征,具有代表性。如果将不同质的总体单位硬搅在一起计算平均指标,就会抹煞其本质差别。例如本文提到的平均工资的统计结果和老百姓的感觉反差很大,其中的一个原因就在于计算平均工资的这个总体不具备同质性,因此掩盖不了同类型人员收入的差异性,造成“虚构的平均数”。
按照我国职工工资统计相关规定,工资统计的对象,是全民所有制和集体所有制企业、事业单位,各种合营单位,各级国家机关、党政机关和社会团体等“体制内人员”,而外来务工者、以及在民营企业等新型经济组织的职工这些低收入群体则没有资格参与统计。而在以上参与统计的总体中,行业与行业之间、行业内部员工之间的收入差距明显,据统计,目前我国的电力、电信、石油、金融、保险、水电气供应、烟草等行业共有职工833万人,不到全国职工人数的8%,但工资和工资外收入总额估算却相当于全国职工工资总额的55%。由于单位的经济类型、隶属关系等多种因素影响,行业内部也存在较大差异。如工资水平较高的银行业,高的单位年平均工资超过百万元,低的单位年平均工资在4万元以下。
对于这样一个非同质总体,很显然用“平均工资”这一个指标来反映总体水平,其代表性可想而知。而且据发改委的报告,目前我国居民收入状况不仅既有的差距悬殊,而且这种悬殊还在继续全面地扩大—不仅城乡之间在扩大,城镇和农村内部也在扩大,不仅行业之间在扩大,地区之间同样在扩大……这种背景下,抹平、杂糅了如此之多差距的“平均工资”,究竟能见证多少均衡价值。
算术平均数易受极端值的影响
目前我国的“平均工资”,“平均住房面积等平均指标都是采用的算术平均数来计算的。算术平均数等于总体标志总量除以总体单位总量,也就是对总体的某个标志计算算术平均时,把所有标志值相加,然后再除以标志值个数,根据资料是否分组,又分为简单算术平均和加权算术平均。很显然,根据以上计算公式,每个标志值的大小都对算术平均数的大小有影响,这时总体中如果出现极大值,将会使算术平均数偏大,而极小值将会使算术平均数偏小,从而掩盖总体的真实水平。这一点其实也是总体同质性的一个具体体现。
而我国“平均工资”的计算也存在这个问题,例如差点导致中行油破产的陈久霖,年薪是2350万元,就算他下面的工人一分工资也没有,这家企业的的工资总额和平均工资也高的惊人。如果从这个角度理解,上面所提到的“职工工资总额和平均工资连续两位数增长”,很可能意味着极少数人工资的迅猛增长,多数人的工资处于停滞状态。
实际操作时如何避免极端值对算术平均数的影响呢?有两个办法,其一在计算算术平均数时先去掉极端值,再求平均。这种方法在平时各种比赛评分时经常采用,如去掉一个最高分,去掉一个最低分,再算最后平均得分。而在计算我国平均工资时如何确定极端值,也存在这一问题,因此可以考虑第二种方法。我们经常用的平均指标有三个:算术平均数、众数和中位数。众数是总体中出现次数最多的标志值,而中位数是把总体标志值按照大小顺序排列后处在中间位置的数,因此它不易受极端值的影响,当总体出现极端值时,用中位数能比较真实地反映总体的一般水平。所以我们可以考虑用计算中位数的方法来计算“平均工资”、“平均房价”等易出现极端值的指标。实际上国际上统计方法比较先进的国家像美国都是采用中位数来反映平均工资,而在我国的一些省市如上海在公布各行业的平均工资时,也都是采用中位数,这样它能避免平均工资虚增,从而更客观地反映工资的一般水平。
用组平均数补充说明总平均数
总平均数虽然是以同质总体为基础计算的,但在总体单位之间还存在很大的差别,并对总平均数有重要的影响作用。特别对于分组资料而言,总体平均数除了受各个标志值影响之外,还受各组相对次数也就是总体结构的影响,在总体各个标志值不变的情况下,如果总体的结构发生变化,总体的平均数也要随之变化。因此在用算术平均数反映总体一般水平时,除了计算总平均数外,还应进一步利用分组法,计算组平均数,来补充说明总平均数,揭示现象内部结构对总平均指标的影响。现以表1资料为例来说明。
从上述资料可以看出,全部工人的平均工资2003年为3500元,2002年为3460元,2003年比2002年增加了4元,能否断定工人的工资水平提高了呢?
从各组工人的工资水平来看,技术工人和非技术工人的平均工资都有所下降,分别由5500元下降到5000元、3100元下降到3000元。那么,为什么总平均工资反而上升了呢?
发生这种矛盾现象的原因是2003年工人的构成发生了变化,工资水平较高的技术工人所占比重从2002年的15%上升到25%,而工资水平较低的非技术工人所占比重则从85%下降到75%,总体工资水平将工人的构成情况掩盖了。由此可见,现象内部的结构变化对总平均数的影响很大,仅仅用总平均数说明问题是不够的,需要用组平均数来补充说明总平均数。因此在计算“平均工资”时,除了计算总体平均工资外,能否依照表1,把总体按照行业分组,分别计算各行业的平均工资并和前一年或前几年对比,这样员工才能更加清楚自己所在行业的工资水平,从而也可避免这场争论。
把平均指标和标志变异指标结合起来使用
利用平均指标进行分析问题,抽象了总体各单位某一数量标志值的具体差异,来反映这些标志值的一般水平。但平均指标只能反映总体某一方面的共性,而不能反映总体各单位之间的个性。仅仅用平均指标来反映总体的综合特征是不全面的,我们还可以利用标志变异指标来说明总体各单位某一数量标志值之间差异程度,即说明变量值的离散趋势。另外利用标志变异指标进行变异分析,还可以说明平均指标的代表性。平均指标作为总体单位数量标志的代表值,其代表性的大小取决于该总体中各总体单位标志值之间的差异程度,这种差异程度是由标志变异指标来反映的。标志变异指标值指标大,说明总体各单位标志值之间的差异程度也比较大,平均数的代表性就小;反之,标志变异指标值小,说明各标志值之间的差异性也比较小,平均数的代表性就大。而在不同总体之间进行比较时,除了用平均数比较他们的一般水平外,在平均数不同的情况下还应计算标准差系数比较他们的代表性问题。
而由于我国居民收入的差距很大,且还在不断加大,因此算出来的平均数的代表性肯定不强,不能代表总体的一般水平。据北京市统计局统计,2006年北京市职工年平均工资为36097元,全市职工平均工资达到36097元及以上的职工人数比重为39.3%,没有达到职工平均工资的人数占60.7%,也就是说有6成人平均工资没有“及格”。 在一个相对和谐的社会中,收入状况应该是呈正态分布的(即中等收入人群应该占大多数,高、低收入人群则相对较少),这样算出来的平均工资也就真正能代表总体的一般水平,而从目前我国的收入状况来看,平均工资的代表性较小,员工对这种统计结果反映强烈也是应该的。
因此我们在计算总的平均工资时,还应计算标准差,以及标准差系数,以反映平均数的代表性,并且方便和其他国家比较。另外,我们在计算各行业的平均工资时,也应计算相应的标准差系数,以反映整个行业平均工资的代表性。
参考文献:
1.夏剑锋.统计学.武汉理工大学出版社,2005
2.韩选利.平均数想接受你不容易[J].统计与预测,2004(2)
3.蔺心芝.试比较几种统计平均数[J].中国科技信息,2005(5)
4.袁莉萍.统计平均数的应用误区与对策研究[D].西安财经学院,2006