河南师范大学 李胜坤
[本文系河南师范大学青年基金项目“我国企业负债期限结构研究”的阶段性研究成果]
假设检验在实证研究中有着广泛应用,参数检验和非参数检验是假设检验的两种基本方法,参数检验对变量的分布有着严格限制,而非参数检验则对变量的分布没有特殊要求,而且可以适用于各种类型的变量,因此非参数检验在社会学研究中有着广泛应用。由于目前有关财务理论的实证研究主要以资本市场的数据及企业的财务报表数据为分析对象,这些数据大部分能够满足参数检验的分布要求,因此财务领域中的实证研究更多地采用了参数检验的方法。随着财务管理研究的深入,一些社会学的研究方法开始引入财务管理的研究,尤其是问卷调研方法和实验研究方法在财务管理的研究中运用越来越多,这些研究方法的采用也使得各种非参数检验方法在财务管理中有着广泛的应用前景。因此本文针对常用的非参数检验方法及其在财务管理研究中的应用进行分析,以期对财务领域的实证研究提供借鉴。
参数检验是在假设总体分布已知的情况下,针对总体分布的某些参数进行推断检验,因此参数检验对相关变量的分布有严格的要求。在现实中有许多变量的分布是否满足某种特定的分布可能人们事先并不知道,或者虽然知道其分布类型,但其分布并不满足参数检验的要求,无法采用参数检验的方法对相关假定进行推断,这时候就需要采用非参数检验的方法。非参数检验方法主要适用于以下两种情况:
其一,总体的分布未知,需要对总体分布进行推定。在研究中有时我们对研究对象的分布情况可能知之甚少,研究对象的分布情况本身就是有待研究的主要内容;或者希望通过参数检验的方法对研究对象进行深入分析,但对各变量的分布是否满足参数检验的要求没有足够的把握。这时可以通过非参数检验的方法对研究变量的分布情况进行检验。
其二,总体分布情况已知,但变量不能够满足参数检验的要求。参数检验是基于变量的分布情况,利用样本数据与变量分布的某些参数之间的关系构造一个分布已知的统计量,进而对特定的假设进行检验。参数检验首先要求被检验的变量属于定距变量,对于定类变量和定序变量则无法采用采用参数检验的方法,参数检验除了对变量的层次有要求外,对变量的分布也有要求,如果变量不满足参数检验的分布要求,采用参数检验方法则有可能得出错误的结论。因此对于定类变量、定序变量及不满足分布要求的定距变量,一般采用非参数检验的方法进行分析。
同参数检验一样,非参数检验有着众多的方法,根据各种方法适用的情况不同,非参数检验主要包括单样本的总体分布检验、两独立样本的非参数检验、两配对样本的非参数检验及多样本的非参数检验等。
其一,单样本的总体分布检验。该检验是根据样本数据对变量是否满足所假设的分布进行检验。对于离散型的变量一般采用卡方检验的方法,其基本原理是根据假设的分布计算出变量在各个取值上的理论频次,利用理论频次和样本实际频次可以构造一个服从χ2分布的统计量,在假设的分布成立的情况下,该统计量不应该太大,根据计算出的统计量的值及其相伴概率(Sig)可以判断原假设是否成立,当Sig小于设定的显著性水平时应拒绝原假设。由于财务管理研究中所涉及的变量更多的是连续性变量,对于连续型变量可以将其取值分为若干区间,从而把连续型变量当作离散型变量来处理,采用卡方检验对其分布进行检验。但为了提高检验效率,一般采用单样本的K—S检验,K—S检验的基本思想是在原假设成立的前提下,根据样本数据得到的累计频次分布与根据假设分布计算出来的理论累计频次分布不应该有较大差异,根据理论分布确定的理论累计概率分布函数F(x)与根据样本数据得到的经验累计分布函数S(x)的差值D(x)应服从期望值为0的正态分布,由此根据D(x)的观测值可以判断是否接受原假设。卡方检验和单样本K—S检验均可通过统计分析软件SPSS实现,在SPSS中卡方检验的输出结果主要有卡方值(chi-square)和相伴概率值(Sig),K—S检验的输出结果为Z值及相伴概率值(Sig),对结果的判断主要参考Sig值,如果Sig值低于显著性水平则拒绝原假设,认为变量不满足假设的分布。
单样本的总体分布检验在财务研究中的应用主要在是在参数检验前对变量是否满足参数检验的分布要求进行检验,如为检验我国上市公司2007年的高管持股比例是否满足正态分布,我们选择K—S检验进行检验,检验输入的结果为Z=18.256,Sig=0.000,因此应该拒绝变量服从正态分布的假设(考虑到有相当部分的上市公司高管持股比例为0,剔除这部分样本后Z=13.338,Sig=0.000,仍然拒绝变量服从正态分布的假设)。当然除了正态性检验以外,单样本的总体分布检验还可以对变量是否满足其他分布(比如指数分布、均匀分布、多项分布等)进行检验
其二,两个独立样本的非参数检验。独立样本一般是指来自不同总体的样本,独立样本检验的目的是判断样本来自的总体分布是否相同,其原假设是总体的分布无差异,如果拒绝原假设则认为总体分布之间存在差异。两个独立样本的非参数检验方法主要有游程检验、秩和检验和累计频次检验。游程检验的基本思想是将两个样本混合按大小顺序排列后,如果两个样本来自的总体无差异,则排列后的样本数据应该是随机交替地来自两个样本,不应该出现两个样本各自集中于一端的现象。如果把重新排序后的序列中连续来自同一个样本的子序列称为游程,则在原假设成立的前提下,游程数量不应太少,因此利用游程数量的多少可以判断两个样本来自的总体分布是否存在显著性差异。当两个样本的容量均较大时,游程数近似服从正态分布,游程检验输出的结果为Z值及其相伴概率Sig值,当Sig值小于设定的显著性水平时,拒绝原假设,认为两个总体分布存在显著性差异。秩和检验的思路是将两个样本进行混合排序,以每个样本数据的序号作为它的秩,如果两个样本来自的总体无差异,则在两个样本容量一定的情况下,两个样本的秩和不应该太大和太小,因此可以用其中一个样本的秩和构造统计量,对假设进行检验。在SPSS中秩和检验对应的是Mann—Whitney U检验,该检验输出的结果为Mann—Whitney U统计量的值和Z值及其相伴概率Sig值。当样本容量较小时,以U值及其相伴概率作为判断依据;当样本容量较大时,以Z值及其相伴概率作为判断依据。Sig值小于显著性水平则拒绝原假设,认为两个总体存在显著性差异。累计频次检验是通过两个样本在每个数据点的累计频率的差值对总体分布差异性进行检验,如果两个样本来自的总体分布无差异,则两个样本在各点的累计频率不应该有太大差别,累计频率差值的最大绝对值可以作为判断两个总体分布是否存在差异的依据。在SPSS中累计频次检验对应两独立样本的K—S检验,输出结果为Z值及相伴概率Sig值,当Sig值小于显著性水平时拒绝原假设。
在财务研究中经常需要对不同类型的企业财务指标或财务行为是否存在差异进行分析,这时就可以从不同类型企业中抽取一定数量的样本进行对比分析,此类样本即属于独立样本。国家自然科学基金重点项目“我国企业投融资运作与管理研究”为了研究企业的投融资行为进行了一次大型调查活动,调查对象包括上市公司和非上市企业,因此按照是否上市可把样本分为上市公司和非上市企业两个独立样本,为检验这两类企业对银行中期贷款的使用情况是否存在差异,根据项目组编制的调研数据库中的数据,我们可选取秩和检验和累计频次检验进行分析。秩和检验输出结果分别为Z=-2.755、Sig=0.006;累计频次检验输出结果分别为Z=-1.493、Sig=0.023。如果显著性水平选取0.05,则两种检验的结论均拒绝原假设,认为上市公司和非上市企业在银行中期贷款的使用上存在显著差异。
其三,两配对样本的非参数检验。配对样本一般是指对同一调查对象在不同情况下进行的多次调查,以分析调查对象在不同情况下是否存在显著性变化或差异,配对样本检验的原假设是多次调查不存在差异。两配对样本的非参数检验方法主要有符号检验法和符号秩检验法。符号检验法是根据调查对象两次调查数据变化的正负符号来判断调查对象是否出现存在显著性差异。其基本思想是在原假设成立的前提下,配对样本数据变化的正负个数应该基本相当,如果两者差异很大,则认为调查对象在两种情况下存在显著性差异。当样本容量较大时,SPSS中符号检验法输出的结果为Z值及相伴概率Sig值,当Sig值小于显著性水平时拒绝原假设。符号秩检验是在符号检验的基础上,除了考虑配对样本变化的符号外,还把变化的大小也考虑进去。这种方法以变化值的绝对值进行排序作为每个样本的秩,分别计算变化值为正的样本秩和及变化值为负的样本秩和,在原假设成立的前提下,两个秩和差别不应太大。符号秩检验对应SPSS中的Wilcoxon检验,输出结果为Z值和Sig值,Sig值小于显著性水平则拒绝原假设。
企业对不同融资工具的使用是否存在显著性差异就属于配对样本的检验问题,比如为检验企业对银行短期贷款和银行中期贷款的使用是否不同,我们利用调研数据库中的数据使用符号检验和符号秩检验对其进行分析,符号检验的输出结果为Z=-16.618,Sig=0.000;符号秩检验的输出结果为Z=-15.794,Sig=0.000。设定显著性水平为0.05,则两种检验的结论均拒绝原假设,认为企业在银行短期贷款和中期贷款的使用上存在显著差异。
其四,多样本的非参数检验。两独立样本和两配对样本的非参数检验是对两个总体的分布是否存在差异进行检验,实证研究中有时需要对多个总体分布是否存在差异进行检验,这时就要用多个样本进行检验,同两个样本一样,多样本也有独立样本和配对样本。独立多样本的非参数检验方法主要有中位数(Median)检验和K—W检验,独立配对样本的非参数检验主要采用Friedman检验。中位数检验的基本思想是把多个样本混合以后,取其中位数作为参考,把每个样本的数据与这个共同的中位数比较,则在多个总体分布无差异的情况下,每组样本数据中大于和小于这个中位数的数量的期望值应该各为1/2,如果实际样本中这两者的数量相差较大,则应拒绝总体分布无差异的假设,中位数检验就是根据各样本数据中大于和小于共同中位数的数量构造统计量来对假设进行检验,该检验在SPSS中输出的结果为χ2值和Sig值,Sig值小于显著性水平则认为总体分布存在差异。K—W检验的基本思想与两独立样本的秩和检验相同,都是利用样本的秩和作为判断依据,不同的是K—W检验根据多个样本的多个秩和构造出一个服从χ2分布的统计量作的判断依据,输出结果为χ2值和Sig值。Friedman检验的思想是将每一观察对象的配对样本数据按大小排序,以其序号设定其秩,然后计算各组样本的秩和,如果每组样本对应的总体分布无差异,则各组的秩和应该差异不大。Friedman检验根据各组秩和构造统计量,输出结果为χ2值和Sig值,Sig值小于显著性水平则拒绝总体分布无差异的假设。
“我国企业投融资运作与管理研究”项目的调查将企业资信等级分为AAA级、AA级和A级及以下,资信等级不同的企业对银行中期贷款的使用情况是否存在不同就属于多独立样本的检验问题。根据调查数据,分别选用中位数检验和K—W检验,输出结果分别为中位数检验χ2=0.917、Sig=0.632;K—W检验χ2=0.367、Sig=0.832,如果设定的显著性水平为0.05,则不能拒绝原假设,不能认为资信等级不同的企业对银行中期贷款的使用存在差异。对于企业在多个债务融资工具上的使用是否存在不同,则需要采用多配对样本的非参数检验,根据调研数据采用Friedman检验输出的结果为χ2=1530.17、Sig=0.000,由于Sig小于显著性水平,因此拒绝原假设,认为企业对各种债务融资工具的使用频率存在差异。
非参数检验作为假设检验的一类,是利用样本数据推断总体的特征,其推断过程同样有可能会犯两类错误,第一类错误是在原假设成立的前提下拒绝原假设,第二类错误是在原假设不成立的情况下接受了原假设。假设检验控制的是第一类错误,如果非参数检验的结论是拒绝原假设,则犯错误的概率应该小于设定的显著性水平。当检验结论不能拒绝原假设的情况下,此时如果我们接受原假设,则有可能犯第二类错误,而且犯第二类错误的概率是无法控制的,一般来讲,样本容量越大或者对样本的信息利用越充分,犯此类错误的概率会越小。由于参数检验利用的样本信息多于非参数检验,因此在变量满足参数检验的情况下采用参数检验得到的结论会更可靠,尤其是在两种方法得出的结论不一致时,应该采信参数检验得出的结论。
[1]卢淑华:《社会统计学》,北京大学出版社2000年版。
[2]齐寅峰、王曼舒等:《中国企业投融资行为研究》,《管理世界》2005年第3期。