微信用户活跃度影响因素分析

2015-03-01 09:21黄炜,李总苛,李岳峰
湖北工业大学学报 2015年6期
关键词:主成分分析微信



微信用户活跃度影响因素分析

黄炜1 ,2, 李总苛1, 李岳峰1

(1 湖北工业大学经济与管理学院, 湖北 武汉 430068; 2 武汉理工大学管理学院, 湖北 武汉 430072)

[摘要]通过主成分分析法,应用SPSS统计分析软件,从 11个调查指标中,选取了3个主成分,建立主成分综合分析模型,进而对微信用户活跃度进行分析。经过实际数据验证显示,所选取的3个主成分可以很好区分微信用户的活跃度,进而达到了对微信用户进行甄别的目的。

[关键词]微信; 主成分分析; 统计产品与服务解决方案

微信将通信、社交、平台化三者融为一体,很大程度上改变着人们的通信和社交方式,也改变着人们的思维和行为方式[1]。微信也成为了独特的传播媒介,被广泛应用于企业的管理、营销、宣传中。微信一经出现,就迅速占领市场,在近四年里注册用户已经突破6亿,如今仍有倍增趋势[2]。然而,部分微信用户对于微信功能的应用并不完全了解,所以其微信活跃度不高。本文将微信活跃度界定为用户微信在线使用的频率及对微信功能的使用程度,再运用SPSS统计分析软件,通过主成分分析法,从11个指标中选取3个主成分,进行微信活跃度的分析[3]。

1微信用户活跃度的分析

统计产品与服务解决方案(Statistical Product and Service Solutions,SPSS)适用于统计、经济、教育、心理、管理、医学、基础设施建设等领域[3]。而主成分分析法是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。将SPSS和主成分分析法进行结合,不仅有助于指标的选取,也有助于构建出特定的指标体系[4-6]。

1.1 指标选取

选用2014年湖北工业大学知识管理与创新研究中心实验室调查取得的数据,应用Excel处理11个用户个体的各项指标:V01为好友数,V02为群总数,V03为关注的公众平台数,V04为用户资料完整度,V05为一周内用户发布朋友圈消息数,V06为一周内好友对话数,V07为一周内朋友圈好友发布消息总数,V08为用户收藏总数,V09为使用的功能数,V10为银行卡使用频率,V11为用户注册时间。其中,用户注册时间作为一个时间变量,无法直接进入建模数据集,所以需要对数据进行转换,本文以2011年(微信推出时间)作为基准时间对统计数据进行转换,即2011年表示为0,2012年表示为1。

1.2 主成分分析在SPSS中的具体操作步骤

运用SPSS17.0简体中文版软件的因子分析对影响微信活跃度的指标进行主成分分析,具体操作步骤如下:

第一步,将Excel中的数据导入SPSS,保证各数据类型为数值型;

第二步,选择“降维”中的“因子分析”,弹出“因子分析”对话框,把V01—V11选入变量框;

第三步,在相关矩阵对话框中选中“系数”,然后点击“继续”,返回因子分析对话框;

第四步,点击“确定”,输出结果如表1所示。由于SPSS在调用因子分析进行分析时,SPSS会自动对原始数据进行标准化处理,所以计算得到的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用“描述性”过程进行计算,计算结果如表2所示。

表1 输出结果

表2 经标准化处理后的部分数据

将数据进行标准化处理,在处理后的数据基础上计算的特征值结果如表3所示。

表3 方差分解主成分提取分析

特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,主成分个数提取原则为主成分对应的特征值大于1的前几个主成分[7]。从表2可以看出,当初始特征值的累计方差大于60%时,只要选取3个主成分,信息量就足够了。在计算完特征值之后,进一步通过计算各变量与有关主成分的相关系数,计算结果如表4所示。

表4 初始因子载荷

表4中的每一列都显示了各个变量与有关主成分的相关系数。以第一列为例,0.877是“好友数”与第一个主成分的相关系数,这是它在第一主成分上的载荷,如在第一主成分上载荷较大,即相关程度较高。

由初始因子载荷矩阵表可知,好友总数、群总数、一周内好友对话数、一周内朋友圈好友发布消息总数、用户收藏总数、使用的功能数、银行卡使用频率在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息,用户关注公众平台总数、一周内用户发布朋友圈消息数在第二主成分上有较高载荷,说明第二主成分基本反映了这一指标的信息,用户资料完整度、用户注册时间在第三主成分上有较高载荷,说明第三主成分基本反映了这两个指标的信息。提取3个主成分可以基本反映全部指标的信息,所以决定用3个新变量来代替原来的11个变量,代替后的结果如表5所示。

表5 主成分代表

用表2中的数据,除以每个主成分所对应的特征值开平方根可以得到3个主成分中每个指标对应的系数。最后可以得出主成分表达式:

F1=0.45415427ZX1+0.568561877ZX2+

0.056067827ZX3+0.28686188ZX4-

0.00441457ZX5+1.036524344ZX6+

0.86596324ZX7+0.901473744ZX8+

1.047221549ZX9+1.197220657ZX10-

0.372015001ZX11

F2=-0.045052932ZX1-0.099596356ZX2+

0.603807364ZX3-0.24172627ZX4-

0.767031547ZX5-0.152257813ZX6-

0.314199052ZX7+0.641189072ZX8+

0.412641458ZX9+0.472115301ZX10+

1.309152028ZX11

F3=0.045570782ZX1+0.276046594ZX2-

0.250148765ZX3+0.473422404ZX4-

0.402829517ZX5+0.215503366ZX6-

0.504506607ZX7-0.842750983ZX8-

0.095351413ZX9+0.207172959ZX10+

1.519297907ZX11

以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例为权重,计算主成分综合模型:

(1)

其中,β1=3.729,β2=1.626,β3=1.344,β1+β2+β3=6.699,带入式(1)即为主成分综合模型:

(2)

由式(2)可见,F1值对综合主成分值影响比重较大,其次为F2,F3对综合主成分值的影响比重较小。

2实验分析

2.1 数据来源

为了了解影响微信用户活跃度的因素,同时验证本文的指标体系,仍继续沿用实验室数据,样本来源于实验室通过问卷调查的方式收集的原始数据,选取的样本量为60份,收集了用户的好友总数、群总数、用户关注公众平台总数等共11类数据。

2.2 分析过程

首先对数据进行标准化处理,然后根据主成分表达式、主成分综合模型,计算出综合主成分值,并对其按综合主成分值(即F值)进行降序排列。部分结果见表6所示。

2.3 数据结果分析

F值>0,说明该用户活跃度在该组样本用户活跃度平均水平之上;相反,F值<0,说明该用户活跃度在该组样本用户活跃度平均水平之下。根据统计结果,该组样本中,有28位微信用户的综合得分在0以上,有32位微信用户的综合得分在0以下,即约2/3的微信用户活跃度水平偏低。

表6 部分用户的综合主成分值排序表

F1为第一主成分,F2为第二主成分,F3为第三主成分,F为综合主成分

其中,排名第一的用户“曹”在F1上得分最高,这意味着相对于其他用户,“曹”微信人脉较广,且互动频繁。排名第三的用户“项静”在F1、F2上的得分均较高,表明“项静”不仅微信人脉较广互动较多,其关注的公众平台总数也比其他用户较多。由此,可以发现排名靠前的用户在三类分值上具有共同特点,即F1值偏高,排名靠后的用户,其F1值偏低,说明F1值对F值的影响较大。从图1中可以得到验证,当用户的活跃度明显低于平均水平或明显高于平均水平时,其F1值与F值同负或同正。从样本用户的整体变动趋势上来看,F1值与F值的变动趋势大体相同,即F1值对F值的影响较大。微信用户可以从增加好友数、群总数、好友对话数、用户收藏总数、使用的功能数,以及银行卡使用频率来提高自身的活跃度。

图 1 微信用户F1值F值比较分析图

根据计算出来的60个用户的综合主成分值,绘制出用户分布散点图(图2)。

图 2 用户分布散点图

综合主成分值从高到低,依次划分为活跃性用户、普通用户、缺乏活跃性用户。从图2可见,在该组样本用户中,大部分用户为普通用户,少数用户为活跃性用户和缺乏活跃性用户。

3结束语

对于微信用户活跃性的界定方法并不只有此一种,本文也只是对微信用户活跃度进行探索。随着微营销等微信用途的发展,指标体系也会不断完善,本文仅是通过这一种方法,对于微信用户活跃度评价指标体系进行探讨。

[参考文献]

[1]孔云,廖寅,资芸,等.图书馆微信服务平台的设计与实现[J].图书馆论坛2014,34(02):90-95.

[2]新浪科技. 腾讯公布2015年第二季度财报:净利同比增32% [EB/OL]. [2015-08-15].http://tech.sina.com.cn/i/2015-08-12/doc-ifxftvni8992173.shtml.

[3]王沙沙,艾萍.基于SPSS的主成分分析法的水利信息化评估[J].信息技术,2014(03):10-11.

[4]许淑婷,关伟.中国沿海地区海洋经济竞争力研究[J].生产力研究,2014(07):26-29.

[5]李占波,白全海,申义彩.基于主成分分析的网络入侵检测算法[J].计算机工程,2013,39(05):152-155.

[6]杨仲玮.主成分分析法在农村环境质量评价中的应用[J].甘肃科学学报,2015,27(01):72-75.

[7]齐欣,陆佳莹.国外机构知识库研究状况计量分析[J].图书与情报,2014(06):94-101.

[责任编校: 张众]

Analysis of Factors Affecting Active Degree of WeChat Users

Based on Principal Component Analysis

HUANG Wei1,2, LI Zongke1, LI Yuefeng1

(1SchoolofEconomicsandManagement,HubeiUniv.ofTech.,Wuhan430068,China;

2SchoolofManagement,WuhanUniv.ofTech.,Wuhan430072,China)

Abstract:The article analyzed the active level of WeChat users based on the principal component analysis. By means of principal component analysis and SPSS statistical analysis software, 3 main components were selected from the 11 survey indicators, and then the main component analysis model was established. The data validation shows that the 3 main components can well distinguish WeChat users, and then to achieve the screening purpose of WeChat users.

Keywords:WeChat; principal component analysis;SPSS

[中图分类号]G353

[文献标识码]:A

[文章编号]1003-4684(2015)06-0029-04

猜你喜欢
主成分分析微信
微信
微信
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
服务贸易结构优化路径研究
微信
微信