独立样本均值检验在金融领域的应用

2019-11-14 10:33黑盼盼朱玉清
求知导刊 2019年22期

黑盼盼 朱玉清

摘 要:文章将以东方财富中心上筛选到的合适数据作为实例,根据总体方差的不同情况,利用独立样本均值检验方法,分别采用MATLAB、R语言和SPSS三种软件对其展开分析,并通过对三种软件在分析过程中的优劣比对,为决策者提出合理的建议。

关键词:独立样本;均值检验;金融领域

一、独立均值检验的基本方法及理论支撑

独立样本均值的检验在生产生活中应用非常广泛,其检验方法包含有U检验法和t检验法。

二、独立样本均值检验在金融领域的应用分析

随着生活水平的提高,越来越多的人把可用资金去做投资,恰到好处的数据分析有利于投资者更好得作出决策或者规避风险。譬如,面对两支不同股票在某一时期的数据,可以通过独立样本均值检验的方法推断这两支股票数据总体的均值是否相等。因为均值具有一定的数据代表性,这样做有助于投资者更加了解两支股票的总体数据水平,从而做出理性判断。下面用具体例子来加以分析。

例如,从东方财富数据中心下的股票质押数据中了解到2019年贵人鸟&印尼传媒的质押比例在以下交易日的近一年涨幅(%)数据见表1。

分析在0.05的显著水平下,贵人鸟和印尼传媒的总体均值是否相等。

独立样本均值检验的对象须是正态总体的样本,所以作该检验前须对样本进行正态性检验,结果见表2。

从该表中看出,其Shapiro-Wilk的显著性水平明显大于0.05,即二者均服从正态分布,且贵人鸟&印尼传媒的涨幅数据是两个相互独立的样本,由此可以对其展开独立样本均值检验的分析。

在使用MATLAB或R语言做独立样本均值检验时,需对两样本总体方差情况作如下分类考虑:

当方差均已知时,假设该案例中贵人鸟总体方差为0.5776(标准差为0.76),印尼传媒总体方差为0。8464(标准差为0.92)。能否认为两种股票的总体均值在0.05显著水平下无显著差异?

通过输入MATLAB程序,运行结果(置信区间)为(-1.1711,-1.1146),该区间内不包含0,说明在该种情况下检验到的二者总体均值是不相等的。

再利用R语言输入命令,运行结果P值0.01128<0.05,则拒绝原假设,说明在该种情况下检验到的二者总体均值是不相等的。

当方差未知但相等时,从上述2019贵人鸟&印尼传媒股票质押涨幅数据中能否认为二者股票质押涨幅不相上下吗?

输入MATLAB命令,运行结果P值=0.5648,大于0.05,即在0.05的显著水平下,不能拒绝原假设,说明两总体的均值在该种情况检验下是相等的。

输入R语言命令,运行结果P值=0.6,大于0.05,即在0.05的显著水平下,不能拒绝原假设,说明两总体的均值在该种情况检验下是相等的。

当方差未知且不等时,输入MATLAB命令,运行结果h=0,p值=0.5676,大于0.05,即在0.05的显著水平下,不能拒绝原假设,说明两总体的均值在该种情况检验下是相等的。

输入R语言命令,运行结果P值=0.07,大于0.05,即在0.05的显著水平下,不能拒绝原假设,说明两总体的均值在该种情况检验下是相等的。

再运用SPSS软件对该案例做独立样本均值检验,因为在使用SPSS做独立样本均值检验时会计算各样本总体的标准偏差(见表3),通过标准偏差是否相等便说明了两样本总体方差是否相等,且自带对总体方差齐性的分析(见表4),所以无需再对各样本总体方差是否已知或是否相等再做讨论。

表3组统计即各组统计量,其中N:各组的样本容量;平均数(均值):表示贵人鸟/印尼传媒在涨幅上的均衡状态,可以看出贵人鸟和的印尼传媒平均涨幅分别为-69.8886%和-68.7457%,二者之间差异不是很明显;标准偏差反映了不同时期的涨幅与这个平衡状态的偏离程度。

表4是独立样本检验的结果表,基于“二者方差相等”原假设前提下得出的显著性水平为0.106,大于0.05,即在0.05的显著水平下,不能拒绝原假设,说明二者总体的方差相等,这与在“总体方差未知但相等时”情况下用MATLAB与R语言检验的结果也相吻合。T值对应的显著性水平(双尾)的值0.565,大于0.05,也表示二者不存在显著性差异,即二者总体的均值相等,也就没有比较均值的必要,认为二者均值几乎相等;反之,还需要考虑二者均值的大小,且具体存在何种差异,也就是说,此时的均值才是具有统计学意义的。

三、结论

综合上述案例的计算及分析过程,不难理解,独立样本均值检验适用的两组样本数据需要相互独立且均服从正态分布。其检验工具也多种多样,且各有千秋:MATLAB的功能虽然强大,但对于独立样本均值检验而言,需要通过编程的方式解决,代码稍微偏长。此外,值得注意的一点是,本文中涉及的代码为符合论文格式要求,其代码格式经过了修缮,如若直接复制粘贴到MATLAB输入框中会因格式的问题产生部分词汇或代码无效的问题,所以需要读者在MATLAB输入框中手动输入这些代码后才能顺利运行。R语言系统没有自带z函数,需要导入相关的包,或者额外编写程序。所以相比较而言,在做独立样本均值检验时,SPSS不失为一款较为适合的分析软件:无需代码,操作简单,出错概率低;无需根据方差是否已知再分情况考虑;表格式录入数据,观察更为直观,且转移方便;检验结果直接通过表格来呈现,带给用户更直观、舒适的的体验。

参考文献:

[1]毛纲源.Probability and Statistics[M].武汉:华中科技大学出版社,2017.

[2]朱汉文,武靖千,张莉.基于MATLAB的双正态总体均值线性关系假设检验问题的探讨[J].电子测试,2017(3).

[3]李诗羽.数据分析:R语言实战[M].北京:电子工业出版社,2014.

[4]杨利雄.基于“协整度”的非平稳时间序列分析:等方差检验及其应用[D].西安:西安交通大学,2014.

[5]汪东华.多元统计分析与SPSS应用[M].上海:华东理工大学出版社,2018.

[6]段玉.双正态总体已知均值时方差的假设检验问题[J].怀化学院学报,1998(2).

[7]高杰,李从珠.总体方差已知条件下单个正态总体均值假设检验现行方法的缺陷与改进[J].数学的实践与认识,2005(8):138-145.

[8]毛建青.影响高等教育规模的主要因素及其协整关系——基于时间序列数据的分析[J].北京师范大学学报(社会科学版),2009(2):114-119.

[9]胡伟.基于蒙特卡罗模拟实验的协整模型应用若干问题研究[D].北京:北京邮电大学,2015.

[10]汪锋,康继军,张宗益.企业市场化、对外开放与中国经济增长——基于非平稳面板时间序列数据的经验分析[J].管理工程学报,2008(4).

[11]南士敬,赵春艳,吴建銮.基于参数空间的ST-ECM模型的协整检验问题研究[J].数量经济技术经济研究,2016(7):146-162.

[12]孙立宏.独立样本平均数差异的显著性检验方法与应用[J].职大学报,2009(4):34-36.

[13]徐自生.中位数显著性检验方法介绍[J].上海教育科研,1987(5).

基金项目:南阳理工学院教学改革研究项目“OBE 理念下应用统计学专业实践教学模式的改革与实践”(NIT2017JY-018);应用型普通高校应用统计学专业实验教学内容改革的研究与實践(NIT2017JY-127)。

作者简介:黑盼盼(1998—),女,河南驻马店人,南阳理工学院2019届应用统计学专业本科生。

通信作者:朱玉清(1967—),女,河南南阳人,硕士,教授,从事应用数学的教学与研究工作。