周兆丁 吕锟 沈瑾 邹文生 苏子钦 邱巧勇 李明华
摘要:相关分析是分析客观事物相互间关系的密切程度并用适当的统计指标表示出来的统计分析方法,明确不同事物之间是否存在关系、存在怎样的关系,对理解和运用相关分析极为重要。本文介绍了使用统计软件SPSS实现双变量相关分析和偏相关分析过程,并得出分析结果,确定了不同变量间存在的真实关系。
关键词:计算机应用;SPSS;双变量相关分析;偏相关分析;分析实例
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2019)20-0301-02
开放科学(资源服务)标识码(OSID):
为了研究两个或两个以上不同变量间的种种相关特性和紧密程度,可以运用相关分析的方法,相关分析在气象中广泛应用[1-2]。SPSS(统计产品与服务解决方案)是当今最权威的、国际上最有影响的统计软件之一,该软件提供多种统计分析过程,在社会科学、自然科学的各个行业领域发挥很大作用[3-10]。统计分析软件SPSS在“分析(A)”菜单的“相关(C)”子菜单中为我们提供了多种相关分析过程,不少学者对次进行了的很多研究[11-12]。
本文将选取广东博罗地面气象观测站2018年1-12月每日平均气温、平均气压和平均相对三个要素为分析资料,介绍如何使用SPSS实现双变量相关分析和偏相关分析过程。
1 双变量相关分析及SPSS如何实现
1.1 双变量相关分析
双变量相关分析[1-2]用于描述两个不同变量之间联系的密切程度,它反映了控制一个变量的取值后,另一个变量的变异程度。当两个变量都是正态连续变量,且两者之间在散点图上呈线性关系时,可以认为两者之间存在线性相关趋势,用积差相关系数(主要有Pearson相关系数)来表现他们之间的相关程度。Pearson相关系数是定量地描述双变量之间线性相关程度好坏的一个常用指标,计算公式如下:
[r12]是变量1和变量2之间的相关系数,其中[s12]是变量1和变量2之间的协方差,[s11]是变量1的方差,[s22]是变量2的方差。
1.2 使用SPSS实现双变量相关分析
双变量相关分析过程,SPSS软件中为“双变量(B)”,用于进行两个或以上变量间的参数分析或者非参数相关分析,两个以上变量会给出相互之间的分析结果,选择Pearson相关系数可以处理双变量正态分布资料;对于非双变量正态分布资料,可选择等级相关系数(Spearman秩相关系数)或Kendalls等级相关系数。图1给出了使用SPSS实现双变量相关分析的操作过程和分析结果:(1)建立数据文件,将分析资料输入数据编辑器中。(2)菜单栏上分别选择“分析(A)→相关(C)→双变量(B)”,则出现“双变量相关性”过程主对话框(图1a),“变量(V)”框:选入相关分析的变量,至少选入两个,将“日平均相对湿度”、“日平均气温”和“日平均气压”选入“变量”框中;“相关系数”复选框:用于选择需要计算的相关分析指标,此处默认选择“皮尔逊(N)”;“显著性检验”单选框组:选择相关系数的检验方式“双尾(T)”或“单尾(L)”,一般选择双尾检验;勾选“标记显著性相关性(F)”,其余默认,点“确定”得出双变量相关性分析结果图1b。如果0.01
2 偏相关分析及SPSS如何实现
2.1 偏相关分析
偏相关分析[1-2] 也称净相关分析,主要是考虑了两个不同变量以外的各种作用,或者说是控制了其他多个有关联的变量的作用情况下,只分析这两个变量间的线性相關程度,目的就是消除其它变量关联性的传递效应。当控制变量为一个时,偏相关系数为一阶偏相关系数;控制变量为二个时,偏相关系数为二阶相关系数(控制多个变量以此类推);控制变量为零个时,偏相关系数称为零阶偏相关系数,也就是双变量相关系数。下面介绍一阶偏相关系数的计算方法,首先是分别计算三个变量之间的两两相关系数,然后通过计算出来的三个相关系数来计算偏相关系数,计算公式如下:
[r123]是控制变量3的作用所计算的变量1、变量2之间的偏相关系数。两个或以上的控制变量时的公式以此类推。
2.2 使用SPSS实现偏相关分析
偏相关分析过程,SPSS软件中为“偏相关(R)”,偏相关分析与双变量相关分析操作过程基本一致。图2给出了使用SPSS实现偏相关分析的操作过程和分析结果:菜单栏上选择“分析(A)→相关(C)→偏相关(R)”,出现“偏相关分析”过程主对话框(图2a); “变量(V)”框:选择要进行偏相关分析的变量,选入“日平均气温”和“日平均相对湿度”; “控制(C)”框:选择需要控制的变量,选入“日平均气压”;“显著性检验”单选框选择 “双尾(T)”,勾选“标记显著性相关性(F)”,其余默认,点“确定”得出偏相关性分析结果(图2b)。
3 小结
根据上面的双变量相关分析和偏相关分析结果显示:2018年1-12月广东博罗相对湿度与气温双变量相关系数为0.31,且通过0.01级别(双尾)显著性检验;但当控制气压时,相对湿度与气温的偏相关系数降为-0.134,同时没有通过显著性检验。结合三个变量相互间相关分析可以看到:相对湿度与气压的相关系数为-0.445,而气压与气温的相关系数为-0.842。由此可以得出相对湿度与气温实际上没有存在真实联系,相对湿度通过气压这个中间要素与气温建立了表面的联系。
由此可见, 利用统计软件SPSS可以比较容易地实现这双变量相关分析和偏相关分析,综合两种分析方法可以找出不同变量之间是否存在真实关系。双变量相关系数显示的是两个不同变量之间没有排除其他变量影响时的直接影响和间接影响程度;而偏相关系数则显示的排除其他一个或者多个变量的影响后重新来考察这两个变量之间相互影响程度。在研究两个变量之间的相互关系时,需要充分考虑到其他变量的影响,才能真正地将两者的真实关系显现出来。SPSS相关分析功能强大,操作简单,分析结果清晰、直观、易学易用,是一种很好的分析工具。
参考文献:
[1] 黄嘉佑.气象统计分析与预报方法[M].2版.北京:气象出版社,2000.
[2] 施能.气象科研与预报中的多元分析方法[M].2版.北京:气象出版社,2002.
[3] 薛薇.基于SPSS的数据分析[M].3版.北京:中国人民大学出版,2014.
[4] 冯岩松.SPSS22.0统计分析应用教程[M].北京:清华大学出版,2015.
[5] 张文彤,邝春伟.SPSS统计分析基础教程[M].2版.北京:高等教育出版社,2011:327-342.
[6] 武松,潘发明.SPSS统计分析大全[M].北京:清华大学出版社,2014:217-234.
[7] 侯海桂.关于统计分析内容分类以及相关SPSS分析方法使用的探讨[J].经济师,2014(5):72-75.
[8] 李明华,崔少萍,罗凤明,等.统计软件SPSS在气象中的应用[J].广东气象,2007,29(1):50-52.
[9] 罗凤明,邱劲飚,李明华,等.如何使用统计软件SPSS进行回归分析[J].电脑知识与技术,2008,4(2):293-294.
[10] 李伟权,陈映华,郭琳晶,等.如何综合使用SPSS和Surfer绘制风向频率随时间变化图[J].电脑知识与技术,2009,5(4): 954-955.
[11] 张苏江,陈庆波.数据统计分析软件SPSS的应用(五)——相关分析与回归分析[J].畜牧与兽医,2003,35(9):16-18.
[12] 张璐,权婷,刘清.使用SPSS进行相关分析[J].现代商贸工业, 2018,39(3):190-191.
【通联编辑:唐一东】