朱杰+曹文吉
摘 要:研究大学生在市区使用4G手机上网的流量使用情况,利用主成分分析的方法和统计软件SPSS对移动不同手机流量套餐进行排序。简要分析了排序结果,指导运营商改进现有的手机流量套餐。
关键词:主成分分析;SPSS;手机流量套餐;运营商
中图分类号:TP393 文献标识码:A DOI:10.15913/j.cnki.kjycx.2017.07.093
随着科技的进步,网络飞速发展,我们进入了大数据时代。在大数据时代,使用手机流量上网成为人们生活中必不可少的部分。大学生是未来消费的主力军,因此,针对在市区使用4G手机的大学生,利用主成分分析的方法和统计软件SPSS对他们使用流量的区间进行分析排序,并分析其结果,以便运营商能够合理设计流量套餐,使流量套餐更加符合大学生的需求。
1 主成分分析原理
对m个样本的n个指标进行标准化处理,经标准化处理后可得到标准化矩阵X.标准化处理为:
计算样本相关系数矩阵。计算标准化后每两个指标间的相关系数,得到相关系数矩阵R.相关系数为:
R矩阵是一个实对称的矩阵,其主对角线上元素均为1.
计算相关系数矩阵R的特征根和相应的特征向量。根据得到的相关矩阵,可求出其特征值为:
至此得到n个非负特征根,即:
对应于特征根的n个单位化特征向量a1,a2,…,an,构成一个正交矩阵,记为:
计算主成分为:
式(8)中:Z0为样本主成分;X0为标准化样本。
在选择主成分时,根据特征值从大到小选取,如果λi为相关矩阵R的第i个特征根,则第k个主成分的方差贡献率为:
前r个主成分的累积方差贡献率为:
当累积方差贡献率达到一定数值时,提取前r个主成分。
计算主成分得分,将各主成分的方差贡献率作为权重,线性加权求和得到主成分表达式为:
以每个主成分对应的特征值占总特征值之和的百分比作为权重,计算综合主成分得分,即:
至此,根据该得分进行排序和综合评价。
2 对移动手机流量套餐的主成分分析
2.1 原始数据
移动手机流量套餐原始数据如表1所示。
利用SPSS进行主成分分析,数据指标如下。其中,X1代表4G手机,X2代表大学生,X3代表市区。经过SPSS的一系列计算,得到以下内容。解释的总方差如表2所示。
提取方法:主成分分析
表2说明了3个主成分解释原始变量总方差的情况,且SPSS中默认保存方差大于1的主成分。前两个主成分集中了原始变量98.854%(>85%)的信息。由此可见,前两个主成分能够较好地解释原始变量。成分矩阵如表3所示。
提取方法:主成分
a. 已提取了 2个成分
表3为因子载荷阵,在SPSS中解释为成分矩阵,表示的是变量与主成分之间的相关系数矩陣。
基于以上分析,经过计算得到表4所示内容。
由表4得到主成分的表达式为:
从主成分表达式中可以看出,第一主成分上X1有比较高的载荷。这说明,第一主成分F1是由变量X1决定的。4G手机作为流量套餐的主要消费类型,对流量套餐的选取有显著影响。从第二主成分表达式中可以看出,X3有比较高载荷。这说明,Y2依赖于X3,即由于市区网速快,对流量套餐的选取有很大的影响。以此类推,在评价所选的流量套餐时,可以认为移动手机流量的套餐选取与手机类型是有关系的。
将主成分个数取为3,得到解释的总方差如表5所示。
提取方法:主成分分析
至此获得每个特征值及其所占总特征值的百分比,即:
用SPSS转换变量进行计算,计算公式为:Score=FAC1?_2×SQRT(1.943)×0.647+FAC2?_2×SQRT(1.022)×0.340+FAC3-_2×SQRT(0.034)×0.011.
计算出来的各主成分得分和排序情况如表6和表7所示。
3 结果分析
经过以上计算,得到如下结论:①排序最靠前的是>300 M的流量套餐。这说明,大学生对流量的需求是非常大的。移动运营商可以考虑针对这一特殊人群设计更加合理的套餐,以满足他们的使用需求。同时,消费者使用的流量多,必然会降低运营商每兆流量的成本。因此,运营商可以考虑略微降低流量的费用,以刺激消费者使用更多的流量,从而实现双赢。②对排序最后的套餐(<30 M),可以考虑将其取消。现在这个套餐的流量总量相对于4G手机的网速来说太少了。对于4G手机用户来说,它已经失去了存在的价值。
参考文献
[1]侯进军,肖艳清,谭敏,等.数学建模方法与应用[M].南京:东南大学出版社,2012.
[2]王玉英.数学建模及其软件实现[M].北京:清华大学出版社,2015.
[3]俞文强,朱春华.基于SPSS下主成分分析中若干问题的总结[J].自然科学,2013,26(2).
[4]张文霖.主成分分析在SPSS中的操作应用[J].市场研究,2005(12).
[5]何亮.主成分分析在SPSS中的应用[J].山西农业大学学报,2007(5).
〔编辑:白洁〕