基于聚类分析的中国邮电产业业务分布研究

2014-12-07 11:59成亚利
物流科技 2014年10期
关键词:业务量聚类预测

成亚利,王 波

(上海理工大学 管理学院,上海 200093)

CHENG Ya-li,WANG Bo

(Management School,University of Shanghai for Science and Technology,Shanghai 200093,China)

0 引言

随着电子商务和科学技术的不断发展,邮电行业在人们日常生活中发挥着越来越大的作用,邮电产业在中国是具有中国特色的产业。在国内,高洁[1-2]首先采用多元模糊推理预测方法进行邮电业务总量预测的研究,通过模糊推理得到业务量预测结果,并将结果跟模糊神经元网络预测法的结果进行比较,表明多元模糊推理预测方法是有效的。而后她提出一种新的预测方法——可拓聚类预测方法,并用该方法进行邮电业务总量预测的研究,通过聚类分析得到邮电业务量预测值,结果表明可拓聚类预测方法是有效的。袁正[3]以1997年全国投入产出表为基础,把国民经济整合成包括第一产业、第二产业、不包括邮电业的第三产业以及邮电业的四个部分。计算出直接消耗系数矩阵和列昂惕夫逆矩阵,并在此基础上分析邮电业的各种产业波及特性,如影响力、感应度、生产诱发系数、产值波及效应以及价格波及效应。仲伟[4]在对邮电业基于发展变化的产业特性进行规范经济学分析的同时,着重利用投入产出表这一有力的宏观经济分析工具进行定量考察,找出判断产业性质和国民经济部门间影响的事实数据。最后利用计量经济学方法依据现有资料尝试对今后几年邮电业及相关部门总产出、中间投入和最终投入的数值加以预测。张毕西等[5]以我国各地运输、邮电通信业就业人数分布为例来说明模糊聚类、判优与识别的应用,同时这种方法同样可用于各行各业就业分布情况的分析、归类。康国栋等[6]采用时间序列和空间差异相结合的方法,分析了近20年来我国邮电业的发展,通过对我国31 个省区人均邮电业务量的分析,将其划分为5 个等级,结果发现人均邮电业务量与人均GDP 呈正相关关系。在此基础上,以人口和人均GDF 为变量,建立了我国邮电业的地域需求模型,发现科技进步和经济发展是我国各省区邮电需求的关键增长因素。曹小曙等[7]利用基尼系数,分析广东省邮电通信业务量1980~2006年的变化趋势,在此基础上,选取1985年、1995年和2005年3 个时间断面,利用因子分析剖析邮电业务水平的空间分布格局,进而构建邮电通信发展指数P,反映各市的邮电通信发展速度。蔡亮亮[8]在灰色GM(1,1)模型的基础之上对全国邮电业务总量的数据进行了分析。结合新陈代谢的方法,将修正后得到的GM(1,1)模型与马尔科夫链模型进行结合,提出了改进的灰色马尔科夫模型预测方法。利用改进后的灰色马尔科夫模型对全国邮电业务总量进行了预测,预测的结果表明,采用改进后的灰色马尔科夫预测模型能够较准确地预测全国邮电业务总量的范围,预测值的精度和准确度都有了较大的提升,效果令人满意。

关于邮电行业的研究不胜枚举,但对于邮电行业的时间分布的研究确实不多。为充分满足顾客需求,积极提高邮电行业的工作效率,加强人力资源的有效分配,掌握邮电行业每年的淡旺季和业务量的分布就显得尤为重要。因此,文章选取邮电行业2013年各月份的数据,结合主成分分析和聚类分析的统计方法,对2013年邮电行业业务的时间分布进行分析。

1 指标选取和数据来源

对于现有的邮电业务类型,诸如3G 移动电话用户,正在飞速增长,没有很大的分析意义。为此,文章选取近年来发展比较稳定的业务类型:包件、快递、汇票、订销报纸累计数、定销杂志累计数、固定电话用户、移动电话用户和移动短信业务量。

从国家统计局月度报表中选取8 个业务类型的全国2013年1~12 个月份的邮电业务的业务量,整理如表1:

表1 2013年各项邮电业务月度数据 单位:万

2 主成分分析

运用SPSS[9],对2013年8 个业务类型的月度数据进行因子分析,得出一系列指标及其对应图表,并对其进行一一分析。其中用主成分[10]的方法,进行因子的抽取,缺失值使用均值进行替换。

2.1 初始相关性

由表2 知,本文选取的8 个因素之间的初始相关性。如快递和固定电话用户(-0.851)、快递和移动电话用户(0.836)、快递和移动短信业务量(-0.815)、移动电话用户和固定电话用户(-0.996)之间的相关系数较大。且其对应的Sig 值也较小(都为0.000),说明这4 对对变量之间存在着较为显著的相关性,进而说明了有进行因子分析的必要。

2.2 KMO 检验和Bartlett 球型检验

由表3 知:KMO 取值0.563 尚可做因子分析。Bartlett 的球形度检验统计量的Sig=0.000<0.01,由此否定相关矩阵为单位阵的零假设,即认为各变量之间存在着显著的相关系,这与相关矩阵得出的结论相符。

2.3 公因子方差

由表4 知:所提取的公因子对于各个原始变量的解释效果不错。

2.4 解释的总方差

表5 显示了各主成分解释原始变量总方差的情况。在实际应用中有些研究工作者习惯于保留特征值大于1 的那些主成分,但这种方法缺乏完善的理论支持。在大多数情况下,当时即可使所选主成分保持信息总量的比重达到85%以上。在本文中看到当保留3 个主成分为宜,这3 个主成分集中了原始8 个变量信息89.498%,可见效果是比较好的。保存主成分分析所得的3 个公因子:FAC1_1,FAC2_1,FAC3_1。

3 系统聚类分析

以这3 个因子:FAC1_1,FAC2_1,FAC3_1 为变量,对不同业务量的月份进行系统聚类分析,得出冰柱图,树状聚类图如图1。

由图1 可知邮电业务量不同的月份的聚类情况。若是将其分为三类,则(2)为第一类,(3)为第二类,(1,4,5,6,7,8,9,10,11,12)为第三类。

4 结论与建议

对于聚类分析的结果,从宏观层面分析发现邮电行业是一个业务量偏稳定状态的行业。结果表明,2、3月份业务量相对于其他月份出现了极大的偏差,但是就其本身来讲,各种业务量都很接近。结合中国的实际国情,人为地将这两类归结聚为一类,对邮电行业的整体业务偏稳定状态和2、3月份业务偏多的原因进行分析。

表2 相关矩阵

表3 KMO 和Bartlett 的检验

表4 公因子方差

表5 解释的总方差

图1 树状聚类图

对于邮电行业的整体业务偏稳定状态的原因有如下2 点:

(1)国家相关政策的支持。邮电业是国家重要的社会公用事业,也是现代服务业的重要组成部分,邮政业在促进国民经济和社会发展、保障公民基本通信权益等方面,发挥着十分重要的作用,受国家相关政策的保护。

(2)邮电行业和铁路航空等交通运输业协作运营。随着电子商务的日益繁荣,各个行业也形成了较为稳定的协作关系。

对于2、3月份业务偏多的原因有如下4 点:

(1)在每年的年初是企业上一年账务的结算和纳税的申报时期,这期间可能会有各公司向税务机关以及税务机关向企业寄送相关纳税申报材料。

(2)从审计的角度考虑,在年初公司的账务也陆续进入年审阶段,在这期间各企业的审计项目组在对企业进行审计的过程中需要向与企业有业务往来的银行、供应商和主要客户进行函证和电话询问等。所有的函证业务是通过寄发征询函的方式,这也增加了邮电行业在这一时期的业务量。

(3)年初节假日和商家的促销活动,增加了包件和快递的业务量。同时,节假日为忙碌的人们提供了交流问候的机会,使得电话短信的使用量急剧增加,也是邮电行业业务量猛增的原因之一。

(4)受季节影响,年初气温偏低,人们更倾向于网上购物,增加的邮电的业务量。

根据以上分析,可以给出如下建议:2、3月份,邮电行业处于旺季,可增派临时员工和临时物流车辆,增加窗口数,轮班倒岗,提高管理效率等方法以缓解旺季压力,更好地满足消费者需求。同时可以用提高奖金等激励措施来调动员工工作的积极性和提高服务质量。

[1]高洁.应用多元模糊推理预测方法进行邮电业务总量预测[J].南京邮电学院学报(自然科学版),2000(1):58-62.

[2]高洁.可拓聚类预测方法及其在邮电业务总量预测中的应用[J].系统工程,2000,18(3):73-77.

[3]袁正.我国邮电业的产业波及特性研究[J].产业经济研究,2003(6):52-57.

[4]仲伟.基于投入产出分析的我国邮电业发展绩效评价[D].福州:福州大学(硕士学位论文),2006.

[5]张毕西,谢祥添.模糊聚类、判优与识别及其在全国各地运输、邮电通信业就业的应用[J].价值工程,2007(4):37-39.

[6]康国栋,孙根年,王美红.我国邮电业发展的地域需求模型研究[J].统计与决策,2008(16):95-97.

[7]曹小曙,李琳娜.广东省邮电通信业发展空间差异变动[J].地理研究,2009(1):182-190.

[8]蔡亮亮.改进的灰色马尔科夫模型及其对全国邮电业务总量的预测[D].南京:南京邮电大学(硕士学位论文),2013.

[9]贾丽艳,杜强.SPSS 统计分析标准教程[M].北京:人民邮电出版社,2010:253-309.

[10]何晓群.多元统计分析[M].4 版.北京:中国人民大学出版社,2004:54-194.

猜你喜欢
业务量聚类预测
快递业务量累计完成480.9 亿件
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
2020年业务量达830亿件快递跑出经济活力
基于DBSACN聚类算法的XML文档聚类
不必预测未来,只需把握现在
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例