【摘要】本文研究了相关性分析的几种主流方法,从定性到定量、从简单到复杂,研究了图表法、协方差方法、相关系数法和回归分析法,并探讨了这几种方法之间的区别和联系。以两个经济指标之间的相关性为例,对这几种方法进行实践应用,从而说明数学知识在实际应用中的重要价值。
【关键词】相关性 协方差 相关系数 线性回归
【中图分类号】G633.6 【文献标识码】A 【文章编号】2095-3089(2019)07-0134-02
1.研究背景简介
在统计学中,对事物之间的相关关系的分析几乎是研究任意一组变量时的首要步骤。通常情况下,我们不仅关心事物自身是如何变化的,也关心事物之间相互影响的关系,才能够全方位、多角度地认知事物。研究事物之间相关影响的关系需要借助相关性分析的方法。相关性分析在经济金融、媒体、医疗、气象等领域都有着广泛的应用。识别不同的相关性分析的方法,把握其数学本质和内在联系与区别,精确区分不同的方法适用于怎样的实际问题,对于相关性分析方法的推广使用有显著的实用价值。
2.相关性分析方法
本节将详细介绍四种相关性分析的方法,并以两个经济指标——全国公共财政收入和国内生产总值(GDP)之间的关系为例,说明这几种方法的应用,探讨其区别和联系,区分不同的方法适用于怎样的实际问题。
2.1图表法
做相关性分析最简单直观的方法就是图表法。图表法,顾名思义,即通过绘制图表,观察图表的形态,来分析两个变量之间的相关性。常用的图表包括两种,一种是散点图,即:将其中一个变量绘制在横轴,另一个变量绘制在纵轴,通过分析散点图中散点分布的形态,判断两个变量间的关系是直线相关、曲线相关或不相关等。另一种常见的图表是折线图,即:将两个变量都绘制在纵轴,将影响这两个变量的因素(通常是时间)绘制在横轴,观察这两个变量随着相同的影响因素变化的方式来确定它们之间的相关性。以下我们绘制了GDP与全国公共财政收入的散点图和以时间为自变量的折线图。观察可以发现,散点图均落在一条直线附近,折线图走势也高度相似,说明两个变量不仅呈正相关,且相关关系接近线性。
散点图的优点是简单直观,几乎适用于所有的相关性分析问题。缺点是缺乏量化的判断标准,因此,还需其他定量的分析方法作为补充。
2.2 协方差法
协方差方法进行相关性分析的原理是通过协方差来衡量两个变量的变化趋势。方差在用于单变量分析时,可以体现变量的取值脱离总体的误差程度;协方差用于多变量分析时,可以体现多个变量脱离总体的变化趋势。如果协方差为正,说明两个变量变化趋势一致,即呈正相关。反之则呈负相关。协方差为0说明两个变量不相关。
为了计算GDP及全国公共财政收入的协方差,我们通过Excel中COVAR函数获得两组數据的协方差值为3818553586是一个很大的正值,可以说明两组数据的变化趋势一致,即这两个变量是正相关的。
协方差方法计算较简单,但计算结果仅能体现两个变量之间相关性的正负,而不能体现相关性的大小,因此,还需要其他方法来衡量两个变量之间相关性的大小。
2.3 相关系数法
由此我们可知两个变量呈线性相关且有很强的相关性。相比于协方差方法和相关系数法,回归法给出了一种利用相关性做预测的方式:通过构建线性回归方程,可以在已知一个变量x后,对另一个变量y进行预测。但该方法仅适用于两个变量间线性相关关系较强的情况,有一定的局限性。
3.小结
从上述分析中我们发现,不同的方法具有不同的适用性。图表法适用于所有的相关性分析问题,但没有定量的判断标准;协方差方法可以判断相关性的正负,相关系数法在协方差方法的基础上,还可以判断相关性的大小。在线性相关性较强的情况下,可以利用回归分析法构建线性回归方程,从而对变量做进一步的预测。
参考文献:
[1]沈家芬,冯建军,谢利,林燕,莫测辉.广州市大气能见度的特征及其影响因子分析[J]. 生态环境. 2007(04).
[2]第35届中国气象学会年会 S14 大数据、互联网、融媒体时代气象服务的创新与变革——第八届气象服务发展论坛[C].中国气象学会:中国气象学会,2018:1.
[3]广发期货发展研究中心 农产品研究小组. 巴西雷亚尔汇率与人民币汇率的相关性分析[N]. 期货日报,2018-09-25(003).
作者简介:
杨雨龙(2001.7.3-),男,陕西岐山人,就读于北京市第一六一中学,高中在读,研究方向:数学。