张子雪,苏 艳
(安徽财经大学 财政与公共管理学院,安徽 蚌埠 233000)
移动端考研产品发展的影响因素探讨
张子雪,苏 艳
(安徽财经大学 财政与公共管理学院,安徽 蚌埠 233000)
本文利用主成分分析法和回归分析法建立影响移动端考研产品发展因素的数学模型,并对计算得出的分析结果进行推广.通过分析问卷样本数据,确定影响移动端考研产品发展的因素,运用SPSS和EVIEWS3.1软件建立影响移动端考研产品发展主要因素的模型,可以为移动端考研产品在市场中的发展提供参考.
主成分分析法;spss回归分析;Eviews3.1
影响移动端考研产品发展的因素有考研备考期、每天学习时长、地区、年龄、性别等.因地区、年龄、性别等因素难以量化且其影响也可以体现在考研备考期、每天考研学习的总时长和花费在移动端考研时长上,因此选择考研备考期、每天考研学习的总时长、花费在移动端考研的时长这三个因素进行定量分析,通过多元线性回归得到最终方程进行预测.
2.1 名词解释
多层次分析法:层次分析法是一种定性和定量相结合的、系统化、层次化的分析方法.
2.2 符号说明
序号 符号 符号说明1 Xi(i=1,2,3,) 表示 i个因素的影响值2 Y 表示被解释的变量3 βi(i=1,2,3) 表示每个因素的系数4 C 表示与影响因素无关的常量系数
3.1 主成分分析[1]
(1)数据来源及处理:将样本问卷结果量化处理,以1、2、3、4代替问卷的A、B、C、D选项,进行数据处理,在spss中准备好要处理的数据.
(2)共线性诊断:运用SPSS软件,首先对变量进行多重共线性诊断,观察变量之间的相关性.有些变量容忍度小于0.1,所以变量之间存在严重的相关性,因此需要做主成分分析.
(3)主成分分析法
运用SPSS软件,按照公因子的方差,平均每天花费在移动端的考研时长提取为0.683,考研的备考期提取为0.498,每天花费在考研的时长提取为0.522,所以选择第13项考研备考期、第15项考研学习的时长、第19项花费在移动端考研的时长作为主因子X1、X2、X3,进行回归分析.
3.2 模型Ⅰ的建立与求解 回归分析
(1)移动端考验产品市场稳定.
(2)本文所采集的数据真实可靠且都能够真实反映各因素的影响.
首先我们将以上的各个因素和被解释的使用移动端考研产品人数分别用字母代替,以便于书写和美观.设X1—考研备考期(月)、X2—每天考研学习总时长(小时)、X3—花费在移动端考研时长(小时);Y—使用移动端考研产品的人数;虚拟变量D1—男为0,女为1.第一个模型:通过整理附件中的数据得出各个年龄阶段的数据如下:
数据来源:由问卷数据计算得出
建立影响移动端考验产品因素的函数模型:
3.3 模型回归结果
根据表1.1给出的数据,利用Eviews3.1软件对(式1)所设定的模型进行分析结果如下:
3.4 回归结果的检验及修正
1.经济意义检验:从上述回归结果看,X1、X2、X3参数符号为正,表明考研备考期、每天考研学习总时长、花费在移动端考研时长与使用移动端考研产品的人数变化趋势相同,符合经济意义.
2.统计检验:R^2=1.0000说明方程总体拟合较好. F=33114.91>F0.05(8,5)=3.69,说明使用移动端考研产品的人数与上述解释变量间总体线性关系显著.
Variable Coeffici Std.Err t-Statistic Prob. C 6.298189 7.099956 0.887074 0.5381 X1 0.059290 0.0111215.331254 0.1180 X2 0.035901 0.025998 1.380885 0.3990 X3 0.195678 0.171130 1.143441 0.4575 X1*D1 -0.00628 0.031376-0.200146 0.8742 X2*D1 0.019549 0.0666450.293333 0.8184 X3*D1 -0.01312 0.513716-0.025540 0.9837 R-squared 1.0000 F-statistic 33114.91 DW 2.981136 Prob (F-statisti)0.004206
3.根据T统计量概率值大于0.05的显著性水平,也大于0.1的显著性水平,得到结论,接收原假设,认为X1D1、X2D1、X3D1的回归系数显著地等于0,即α=a2-a1=0,β= b2-b1=0,这表明男性和女性使用移动端考研产品的人数不存在显著性差异,因此可以将男性和女性的数据合并一个样本,估计使用移动端考研产品混合样本数据估计移动端考研产品的使用人数.
Variable Coeffici Std.Err t-Statist Prob. C 3.867944 12.73544 0.303715 0.7765 X1 0.017348 0.013054 1.328922 0.2546 X2 -0.02771 0.021509 -1.288383 0.2671 X3 0.815919 0.107266 7.606487 0.0016
混合样本数据结果与男性和女性的样本数据估计结果比较,发现使用混合样本数据明显降低了系统估计误差.
以第一个模型为基础,进行模型修正.
3.5 模型的修正
因为可决系数近似1,所以模型可能存在严重的多重共线性,采用逐步回归法消除多重共线性.
第一步:
1、对模型进行多重共线性检验,由上表可以看出,解释变量之间相关系数至少为0.997937大于0.8,表明模型存在严重的多重共线性.
2、分别做出Y与X1,X2,X3间的回归,发现Y与X3拟合得最好.(在附录中给出了回归的具体过程,在这里只说明结果.)因此,使用移动端考研产品的人数与花费在移动端考研时长的影响最大,与经验相符,选择Y=-1.64450796+ 0.7715484715*X3为初始回归模型.
第二步:
将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程,如下表.
方程 X3 X1 X2 R2 Y=f(x3) 0.7715 (167.4194) 0.999750 Y=f(x3,x1) 0.7104 (9.6387) 0.0106 (0.8313) 0.999737 Y=f(x3,x2) 0.8561 (7.7462) -0.0162(-0.7658) 0.999732 Y=f(x3,x2,X1) 0.8159 (7.6065) 0.0173 (1.3289) -0.0277 (-1.2884) 0.999767
在初步模型中引入X1,模型拟合优度降低,参数符号合理,变量没有通过t检验,剔除;t0.025(8-2-1)=2.571;引入X2,拟合优度降低,参数符号合理,变量未通过t检验,剔除;t0.025(8-2-1)=2.571;引入X2、X1,拟合优度提高,但参数符号不合理,变量未通过t检验,剔除;t0.025(8-2-1)=2.571,只有Y=f(x3)满足条件.
所以最后拟合结果:
(1)引入杜宾瓦特森D.W.判断自相关标准:若0<D.W.<dl.则存在正自相关;若dl<D.W.<du,则不能确定;若du<D. W.<4-du,则无自相关;若4-du<D.W.<4-dl,则不能确定;若4-dl<D.W<4,则存在负自相关.du,dl的值查表可得查K=2,n=8,的D.W.表可得,dl=0.763.du=1.332,而现在模型D.W= 1.464364,落入不存在自相关的区域,即,前一期的变量对后一期没有影响.
(2)利用怀特检验检验异方差nR^2=1.0894,查自由度为1的χ分布,值为3.841461.464364<3.84146,落入接受域,即X1不存在异方差.
所以最优模型为:Y=-1.64450796+0.7715484715*X33.6 模型结果的分析及预测
首先分别对X3的值进行预测,分别建立X3对年龄的回归
2015年的X1=189.2748,f发现拟合程度很好,则可计算得18岁以下和25岁以上使用移动端考研产品的人数骤减.由此可知,使用移动端考研产品的人数主要集中在18到25岁,而且影响移动端考研产品发展的主要因素为花费在移动端考研产品的时长.
〔1〕赵利,潘志远,王东霞.劳动就业影响因素的实证研究—基于主成分分析法和VAR模型的分析 [J].宏观经济研究,2014(5).
O213
A
1673-260X(2017)08-0003-02
2017-05-14