基于函数型数据分析视角的我国副省级城市年平均工资差异研究

2015-05-30 10:48蔺顺锋易丹辉肖宏伟
现代管理科学 2015年3期

●蔺顺锋 易丹辉 肖宏伟

摘要:文章针对我国副省级城市职工年平均工资的差异性,从函数型数据分析的角度进行研究,利用函数型聚类分析方法,分别对15个副省级城市职工年平均工资曲线和变化速度曲线进行聚类分析。结果显示,部分地理位置相近的副省级城市年平均工资的增幅具有一定的趋同现象,而工资曲线导数的函数型聚类分析结果显示年平均工资涨速的变化,地理位置趋同性不是很明显。基于职工平均工资对城市发展的重要性,提出了两点政策建议,具体包括:加强以副省级城市为中心的城市圈的工资水平协同调整;努力缩小东部沿海城市和内陆城市的工资差距。

关键词:函数型数据;年平均工资;副省级城市;函数型聚类分析

一、 引言

副省级城市是基于全国经济一盘棋,根据不同地区经济发展状况,在不同区位设立的,对形成区域经济圈,带动地区经济发展具有战略支撑作用的特殊城市。与一般城市相比,副省级城市在经济发展规划方面具有省级单位的权限。目前,我国共有15个副省级城市。据国家统计局统计数据显示,2013年我国国内生产总值为568 845.21亿元,其中15个副省级城市的国内生产总值之和为114 202亿元,占全国总产值的20.076%。由此可见,副省级城市已成为国家经济发展的重要组成部分。

伴随着我国居民人均可支配收入的不断提升,购买力不断扩大,内需对国家经济社会发展的推动作用日趋加强。副省级城市作为经济区域的中心,消费对城市发展的带动作用更加明显。吴忠才(2009)等通过量化研究指出,城市职工平均工资每提高1%,城市发展增长0.96%。职工平均工资和城市发展间呈现同向关系。由此可见,平均工资的差异影响着城市的发展。

改革开放以来,我国不同区位的副省级城市,基于资源条件的差异,制定了适合自身经济发展的政策,由此形成了不同经济结构的格局。沿海开放城市以外向型经济为中心,职工工资普遍偏高,内陆地区由于在基础设施和投资环境等方面的差距,职工平均工资相对偏低。以2012年为例,广州市职工年平均工资为69 464.67元,而西安市为48 048.31元。为更好的评估不同副省级城市发展状况,本文以副省级城市职工年平均工资为切入点,从中经网统计数据库选取了从1997年到2012年的职工年平均工资数据,从函数型数据分析的视角来对15个副省级城市职工的年平均工资差异进行研究。

二、 函数型数据分析方法概述

随着人们获取和存储数据能力的不断提升,在越来越多的经济领域,样本观察数据呈现为曲线或图像。例如,多个国家或者地区的年度人口数据;我国各个省份的年度粮食产量数据;不同银行的日交易量和日交易额数据等。通过画图可以看到其变化轨迹几乎是一条条曲线。此种类型的数据,有一个共同的特点就是呈现出某种函数的特性,因此越来越多的数据可以用函数型数据的形式表示。

本文选取广州市职工年平均工资数据为例来说明函数型数据的概念,共有16年的数据,是一个时间序列数据,可以表示为y=(y1,y2,…,y16)′,通过画图可以明显看出是一条近似曲线,假定数据背后是有一个函数来“支配”,即,观测数据是这个“函数”在特点时间点的取值。传统统计分析方法是基于观测样本点数据,而函数型数据分析是基于一条条的曲线,函数曲线成为统计分析的研究对象。但是,基于人们观测数据的能力限制,只能得到离散的数据,这就需要用平滑技术来实现离散数据的连续化。将离散的观测数据平滑为函数的常用方法有基函数展开,局部加权平滑和粗糙惩罚法。其中,基函数展开法是最常用的将离散数据转化为连续函数的平滑技术。针对具有周期性的数据一般用傅立叶基函数展开,对于非周期数据一般选择样条基函数。

函数型数据分析方法具有较多优势。例如,传统统计分析方法一般会有较强的前提假设条件,而函数型数据分析方法较少的依赖过强的假设。由于函数型数据分析方法是基于对平滑函数曲线的研究,在数据观测时间点和观测频数方面放松了限制,即使观测个体在不同的时间点,有不同的观测频数,只要频数够多,表现出函数型特点,通过曲线平滑和套准处理即可。从数据可视化方面来看,由于把离散的数据连续化为了曲线函数,可以对曲线进行求导处理,一般通过画图工具,画出折线图或者曲线图,并不能很好的观测出变化趋势,可能只能看出指标数据随着时间的变化在不断的变大,而通过速度曲线的变化,可以明显看出指标数据变化幅度的变化。

针对函数型数据分析方法,一般的分析步骤是,首先,对原始的离散数据值进行平滑处理,即通过平滑技术将数据转化为光滑的函数,如果存在观测时间点或者频数不统一时,需要添加套准处理,使其能够实现特征对齐。其次,对数据进行可视化展示,例如,可以求得导数曲线图,二阶导数(加速度)曲线图等,还有均值函数曲线,方差,协方差函数曲线等,最后,实现对曲线函数的深层次分析,比如有函数型线性模型,函数型聚类分析和函数型主成分分析方法等。下面针对我国副省级城市职工年平均工资数据,用函数型数据分析方法来进行分析。

三、 基于函数型数据分析年平均工资

首先对数据进行平滑处理。设年平均工资数据序列为yi=(yi1,yi2,…,yi16)′(i=1,…,15),其中i代表15个副省级城市。建立函数型数据模型为:yij=xi(tij)+?着ij,其中?着ij为测量误差,xi(tij)为年平均工资函数在tij时刻的取值。对年平均工资数据,本文用B样条基函数来平滑。设用K个B样条基函数?准k(t)(k=1,2,…,k)的线性组合来给出年平均工资曲线函数x(t)的估计x(t),即:x(t)=?撞kk=1ck?准k(t)。B样条基函数?准k(t)是已知的,只需估计系数ck(k=1,2,…,k)即可。一般采用的估计方法是最小二乘法,即使得残差平方和最小化,SMSSE=?撞16j=1[yj-?撞kk=1ck?准k(t)]2=||y-?准c||2,解得c=(?椎′?椎)-1?椎′y。由此,通过B样条基函数展开法,得到了年平均工资曲线函数。函数型数据分析的一个优势是可以对平滑曲线进行求导处理得到速度变化曲线,从中可以明显看出原始平滑曲线的变化幅度,即年平均工资的涨速。图1是15个副省级城市的年平均工资曲线和相应的导数曲线图。

图1中,左图为年平均工资曲线图,右图是15个副省级城市的年平均工资的导数曲线图,即速度变化曲线。观察图像可以看出,15个副省级城市的年平均工资从2005年开始呈现快速增长的趋势,不同城市的增长速度有所差异。从速度曲线可以明显地看出我国副省级城市的年平均工资变化趋势是逐年递增的,同时增长速度在不断加快。

职工年平均工资的差异一方面表现在原始工资的差异,同时,另一方面体现在原始工资曲线导数的差异,即体现在工资的变化速度方面。下面针对两方面的差异,分别利用函数型聚类方法来进行分析。

1. 基于原始平滑曲线的函数型聚类分析。在劳动力市场上,企业职工的年平均工资水平与企业实际盈利能力密切相关,年平均工资的发展变化趋势信息是企业关注的重要内容。因此,应根据不同城市年平均工资序列之间的相似程度来对年平均工资曲线进行聚类分析。

基于里程碑的测度时间相异性的聚类方法是识别年平均工资曲线的重要工具。对年平均工资曲线的估计xi(t)(i=1,2,…,15)采用基于里程碑的距离相似性度量方法。具体步骤为:

第一步:对年平均工资数据进行平滑处理,得到年平均工资曲线的估计xi(t);

第二步:求xi(t)一阶导数曲线xi′(t),并求出极值点(称为里程碑);

第三步:求得xi(t)的极值点的集合Mi,通过比较Mi来对 xi(t)进行相似性度量。

利用R语言编写函数型数据聚类分析程序,对15个副省级城市职工年平均工资相似性进行聚类,聚类结果如下所示。

第一类别有:广州和深圳。两座城市均处于珠江三角洲地区。该类别城市职工年平均工资平均水平在2001年以前有小幅增长,到2005年增长幅度开始放缓。至2008年金融危机之前增幅又开始加快,由于2008年全球金融危机的影响,对以出口导向型经济为主体的广州和深圳影响较大,工资水平呈现增速明显放缓的趋势。随着我国政府施以调整经济结构,扩大内需,注重消费拉动经济增长的政策。广州和深圳的职工年平均工资水平增速又开始加快。

第二类别有:南京、杭州和宁波。三个城市均处于长江三角洲地区,属于长三角城市圈。该类别城市在2003年之前,年平均工资水平有较大的增幅,直至2008年增幅有所放缓,依靠2008年国家经济政策的调整,加之长三角有着优越的地理位置和良好的投资环境,从2008年开始,职工年平均工资水平呈现大幅上涨趋势。

第三类别有:长春、哈尔滨、武汉和西安。该类别城市年平均工资起伏波动较大,通过观察数据和曲线图,按照涨幅的大小可以将时间区间分为7段,其中职工年平均工资水平涨幅较大的有1999年~2001年,2003年~2008年和2009年~2011年。相应剩余的时间区间,年平均工资水平涨幅较小。

第四类别有:沈阳、大连、厦门、济南、青岛和成都。该类别城市职工年平均工资变化水平没有前几类别复杂,整体呈现小幅增长。只是在2003年和2008年增幅存在略微下降趋势。

2. 基于原始平滑曲线导数的函数型聚类分析。年平均工资的变化速度,在数学上表现为曲线的导数。工资变化速度信息也是企业和投资者重点关注的内容。因此,有必要对不同城市年平均工资一阶导数曲线进行聚类分析。将原始平滑曲线的导数曲线作为研究对象,利用函数型聚类方法进行聚类,结果如下所示。

第一类别有:南京、宁波和广州。该类别城市年平均工资曲线导数的涨幅速度整体都为为正,说明三座城市的年平均工资变化幅度虽有大有小,但是增幅较为强劲。

第二类别有:杭州和武汉。两座城市年平均工资的加速度曲线在2010年后为负,说明该类别城市的年平均工资曲线速度有明显放缓的趋势。

第三类别有:长春和西安。通过观察该类别城市职工年平均工资的加速度曲线,可以发现年平均工资曲线的速度有涨有回,说明两座城市的工资水平都在根据劳动力市场相应变化,即,年平均工资增幅速度有大有小。

第四类别有:沈阳、大连、哈尔滨、厦门、济南、青岛、深圳和成都。该类别城市共有8座。在2003年和2008年平均工资曲线的加速度为负,其他时间段均大于零。说明这些城市职工的年平均工资水平变化速度比较稳定,只是在遇到经济政策调整或者金融危机年份才会表现出增幅的放缓。

四、 结论及政策建议

本文针对我国副省级城市间的发展差异性,以年平均工资为切入点,基于数据序列的函数性特点,从函数型数据分析的角度进行研究,利用函数型聚类分析方法对15个副省级城市职工年平均工资数据进行分析。

原始年平均工资曲线的聚类结果显示,部分城市年平均工资具有较强的地理位置依赖性,即部分地理位置相近的城市职工年平均工资变化幅度较为相似,同时,地理位置的依赖性特点又和我国经济发展战略规划的城市群或者经济区相吻合。例如处于珠三角城市群的广州和深圳;长三角城市群的南京、杭州和宁波;哈长城市群的长春和哈尔滨;环渤海经济区的沈阳,大连,济南和青岛。工资是劳动力要素价格的外在表征,工资差距越小说明地理位置相近城市的劳动力要素比较均衡,有利于形成一个经济区域,进而促进城市群的建设。针对基于原始平滑曲线导数的函数型聚类分析结果显示,年平均工资涨速变化的地理位置趋同性不是很明显。

当前我国正在着力进行经济发展方式的转变,劳动力要素价格又影响着转变经济发展方式。工资水平对城市经济发展的作用日渐凸显。由此,根据本文的研究分析结果,提出以下政策建议:

1. 加强以副省级城市为中心的城市圈的工资水平协同调整。根据工资曲线导数的聚类结果分析,地理位置临近的城市增幅大小并不具有协同性,这就为劳动力要素的流动提供了条件,说明劳动力要素的分配在城市圈范围内不是很均衡,不利于形成稳固的以劳动力要素价格协同调整为基础的,经济发展方式的协同转变。建议通过协调规划城市群建设为着眼点,在职工工资水平的调整上能够实现协同性。

2. 努力缩小东部沿海城市和内陆城市的工资差距。副省级城市具有省级单位的发展自身经济的权限,由于所处区位的不同,居民工资表现出了较大差异,劳动力就会趋向于去东部沿海城市,没有较好的劳动力要素,内陆城市的发展就会受限。需要针对内陆城市特殊的,相对弱势的投资环境和基础设施建设,制定因地制宜的政策,实现具有针对性的职工工资补贴,着力提高和改善职工的年平均工资水平,促进劳动力要素向内陆城市流动。进一步缩小沿海和内陆城市工资水平的差距,进而促进不同区域经济的共同发展。

参考文献:

1. 吴忠才,柳思维.人口密度、平均工资、公共交通与城市商圈发展.西北人口,2009,4(30):11-14.

2.耿贵珍.基于函数型数据的模型研究.中国人民大学学位论文,2011.

3.王国长.函数数据回归与降维. 东北师范大学学位论文,2012.

4.靳刘蕊.函数性数据分析方法及应用研究.厦门大学学位论文,2008.

5.张建红.中国地区工资水平差异的影响因素分析.经济研究,2006,(10).

6.何晓群.多元统计分析.北京:中国人民大学出版社,2004.

7.汪建新,黄鹏.结构调整、劳动力流动与地区工资差异. 国际商务研究,2009,(3).

8.钟笑寒.劳动力流动与工资差异.中国社会科学,2006,(1).

9.祝树金,邓丽东.经济全球化、劳动力转移与我国沿海——内陆地区工资差距的实证分析.财经理论与实践,2009,(2).

10.刘修岩,殷醒民.空间外部性与地区工资差异:基于动态面板数据的实证研究.经济学(季刊),2009,(1).

11.孙楚仁,文娟,朱钟棣.外商直接投资与我国地区工资差异的实证研究.世界经济研究,2008,(2).

12.狄煌.职工平均工资水平相关影响分析.研究探索,2009,(8).

13.郑长德.中国职工工资的地区差异——基于新经济地理学视角的实证研究.甘肃社会科学,2009,(1).

14.李子奈,潘文卿.计量经济学.北京:高等教育出版社,2005.

基金项目:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目“函数型数据分析方法应用及改进”(项目号:14XNH104)。

作者简介:易丹辉(1948-),女,汉族,湖南省汨罗市人,中国人民大学统计学院教授、博士生导师,研究方向为风险管理与保险、预测与决策;蔺顺锋(1986-),男,汉族,山东省莱芜市人,中国人民大学统计学院博士生,研究方向为函数型数据分析方法、预测与决策;肖宏伟(1983-),男,汉族,湖南省常宁市人,中国人民大学经济学博士,国家信息中心经济预测部助理研究员,研究方向为空间计量经济、预测与决策。

收稿日期:20145-01-20。