俱翠
【摘要】利用非参数统计的方法,可以减少实际应用中对假设条件的依赖,不受样本分布形式限制。本文首先利用Kruskal-Wallis和Brown-Mood检验对2006-2011年北京市7个医药行业上市公司的净资产收益率数据进行对比。其次,利用Page检验对上述数据进行分析。发现7家公司的资产收益率并无显著的差异;2006年到2011年其间北京市医药生物行业的净资产收益率是不断提高的;各家公司的净资产收益率与北京的整体经济发展基本协调,公司之间的相差幅度比较小。
【关键词】非参数检验;净资产收益率
当今的经济研究领域,运用传统的参数统计进行实证分析非常广泛。参数统计是建立在假定总体的理论分布类型已知而参数未知,通过抽出的样本来估计分布中的若干知参数,且用假设检验方法来检验这些未知参数的合性的方法。然而,在现实生活中,传统参数统计方法对总体分布的假定常常难以满足,比如数据并非来自所假定的分布,或者数据根本不是来自一个总体,又或者数据因为种种原因被严重扭曲等。故此,在这种情形下仍然进行传统统计推断就很容易产生错误的结果,影响决策。为此,一种不依赖假定的非参数统计方法应运而生。非参数统计方法在对总体分布一无所知的情况下,也能很容易而又很可靠地获得结论。在我们的日常生活中,常常会遇到比较两者严重程度、优劣等级、先后次序的这些现实问题,解决此类问题,总体分布条件一般都难以满足,则不宜选用参数统计方法,而不依赖于对总体分布严格假定的非参数估计方法属分布自由检验,是解决这类问题的恰当手段和工具。
基于此,本文试运用非参数统计方法,对近年来北京市医药生物行业的净资产收益率进行截面和时序数据的分析。本文在非参数统计在经济研究领域应用及优缺点综述的基础上,选用Kruskal-Wallis检验和Page检验法,以北京市7家医药生物上市公司的净资产收益率数据为例,利用sas和R软件实现截面和时序数据计算的强大功能,对北京市7家医药生物上市公司的净资产收益率进行横向比较和趋势分析。
1.非参数统计的适用性及优势
非参数统计方法涉及很多领域,如电信、信息工程学、生物统计学、非线性时间序列等。非参数统计常用于以下几种情形:待分析资料不满足参数检验所要求的假定,因而无法应用参数检验;资料仅由一些等级构成,因而不能应用参数检验;所提的问题中并不包含总体参数,这时也适宜采用非参数方法;当急需要迅速得出结果时采用的简易方法等。非参数统计的应用优势主要体现在可以减少模型偏差、具有稳健性、适用范围广、简单易操作等几个方面。
2.本文选择检验的方法
非参数统计多样本数据模型检验的选择多样本的问题是统计中最常见的一类问题,主要涉及如何检验几种不同的方法、决策或试验条件(称为处理)所产生的结果是否一样等问题。首先,看这些样本是否独立。在独立的条件下,我们可以利用Kruskal—Wallis检验和Jonckheere.Terpstra检验来处理两种(有序与否)备择假设情况。但在各样本不独立时,如果是完全区组试验设计,可以引进Friedman检验和Page检验对应两种(有序与否)备选假设情况。本文先假设7个医药生物公司是相互独立的,利用多独立样本的Kruskal-Wallis和多独立样本的Browm-Mood检验进行检验。其次探讨在不独立时,运用Page检验研究其净资产收益率的的趋势情况。
3.实证分析
3.1 数据的来源及处理
本文对医药生物行业的经营效益情况进行研究,选择净资产收益率指标来进行衡量。由于净资产收益率=税后净利润/净资产*100%,本文利用上市公司的财务数据,针对北京市7家医药生物上市公司(分别为北大国际医院集团西南合成制药股份有限公司、北京中关村科技发展(控股)股份有限公司北京北陆药业股份有限公司、北京星昊医药股份有限公司、北京金豪制药股份有限公司、北京双鹤药业股份有限公司、北京同仁堂股份有限公司)的数据(税后净利润来自利润表中的净利润,净资产来自资产负债表中的所有者权益(股东权益)),选择2006年到2011年北京市7家醫药生物的财务数据作为本次研究的对象。由于上市公司的数据为季度数据,我们对数据进行简单的平均处理,得出每年的净资产收益率。
3.2 检验方法及步骤
3.2.1 多样本的Kruskal-wallis检验
假设多样本独立。Kruskal-Wallis秩和检验是将所有样本的值混合在一起看成是单一样本,再把这个单一的混合样本中值从小到大排序,序列值替换成秩值,最小的值给予秩值1,有结值时平分秩值。将数据样本转换成秩样本后,再对这个秩样本进行方差分析,但此时我们构造的统计量KW不是组间平均平方和除以组内平均平方和,而是组间平方和除以全体样本秩方差。这个KW统计量是我们判定各组之间是否存在差异的有力依据。
在比较两个以上的总体时,广泛使用非参数的Kruskal-Wallis秩和检验,它是对两个以上的秩样本进行比较,本质上它是两样本时的Wilcoxon秩和检验方法在多于两个样本时的推广。
如果样本中存在结值,需要调整上面公式中的KW统计量,校正系数C为:
其中第j个结值的个数。调整后的KWc统计量为:
如果每组样本中的观察数目至少有5个,那么样本统计非常接近自由度为的卡方分布。因此,我们将用卡方分布来决定统计量的检验。
3.2.2 page趋势检验
对于完全区组设计的检Page(1963)引进下面检验统计量,首先在每一个区组中,对处理排序;然后对每个处理把观测值在各区组中的秩加起来,得到它具体定义为,其中每一项乘以的主要思想在于:如果是正确
的,这可以“放大”备选假设的效果。在总体分布为连续的条件下,如果没有打结,则该检验是和总体分布无关的。对于一部分的值可以由查表来得到在零假设下的临界值c,满足。当固定,而时,在零假设下有正态近似,这里,
。在区组内有打结的情况下,可修正为:
这里为在第个处理中及第个结中的观测值个数(结统计量)。
3.3 检验结果及分析
运用sas软件,对上述的数据进行多独立样本的Brown-Mood检验和Kruskal-Wallis检验,其结果如图1和图2。
图1 K-S检验结果
图2 Brown-Mood检验结果
Kruskal-Wallis检验统计量对应的p值“Pr>Chi-Square”等于0.7168,在给定的显著性水平0.05的条件之下,不能拒绝原假设,即认为7家公司的净资产收益率并无显著性的差异。同样,对于Brown-Mood检验来说,也是不能拒绝原假设,认为7家公司的净资产收益率并无显著性的差异。
在进行page检验之前,运用R软件绘制2006年-2011年北京上式医药生物行业净资产收益率的趋势图(图3)。
图3 2006年-2011年北京上式医药生物行业净资产收益率的趋势
图3横轴为7个医药生物公司,纵轴为净资产收益率。图3中折线的每个拐点代表一个公司。显然,08年和10年各公司的净资产收益率变动浮动比较大,同时第二个拐点处的波动幅度比较大,说明北京中关村科技发展(控股)股份有限公司的净资产收益率变动较大。对于其他年份,略见平缓,地区间的增长率也没有十分明显的趋势,这就要求我们进行更进一步的验证。
原假设为7种处理的位置参数是相等的。即,备择假设为。根据净资产收益率,写出处理在每个区组(年份)之中的秩。由前面构造统计量的方法计算L值,最终求得。认为这六年来北京市医药生物行业的净资产收益率以原假设的次序递增。其中北京北京星昊医药股份有限公司最高,最低的为北京中关村科技发展(控股)股份有限公司。用R软件进行page趋势检验。运行结果求得Pvalue=0.02275013,可知在0.05的显著性水平下,拒绝原假设,说明7家医药生物公司的净资产收益率处于增长的趋势。
表1 2006年-2011年北京上市医药生物行业净资产收益率的秩
公司 06年 07年 08年 09年 10年 11年 Ri
北大国际医院集团西南合成制药股份有限公司 2 2 1 2 5 4 16
北京中关村科技发展(控股)股份有限公司 1 1 2 1 1 1 7
北京北陆药业股份有限公司 7 7 7 5 2 3 31
北京星昊医药股份有限公司 6 6 6 7 7 7 39
北京金豪制药股份有限公司 5 3 3 6 6 2 25
北京双鹤药业股份有限公司 3 5 5 4 4 5 26
北京同仁堂股份有限公司 4 4 4 3 3 6 24
4.结论
本文所选取的北京市医药卫生行业财务数据,只能说是评价北京医药行业运营效益的一个重要指标。公司的运营效益总是与一个地区的经济息息相关,医药行业作为能够衡量经济发展的一个很重要的行业,对于经济的发展有一定的评价作用,从文章中实证的结果,北京医药生物行业的整体发展趋势较好,且公司之间差异性不是很明显,可以说明北京的经济处于一个较稳定的阶段。
參考文献
[1]李志强,王超丽.运用非参数统计方法的科技投入对比研究[J].科技与经济,2012.
[2]姜玮.非参数统计的作用及其在证券投资分析中的应用的综述研究[J].中国商界,2010.
[3]章莹.基于非参数统计的国内基金公司投资绩效对比分析[J].线代商贸工业,2008.
[4]吴喜之,赵博娟.非参数统计[M].中国统计出版社,2009.
[5]杜强,贾艳丽.sas统计分析标准教程[M].人民邮电出版社,2010.