郝爱迎 HAO Ai-ying
(青岛滨海学院,青岛 266555)
(Qingdao Binhai University,Qingdao 266555,China)
进行稳健统计其实质就是针对传统统计的不足之处,进而使得统计逐步稳健化。在进行传统统计之时可能会出现假定和实际相互偏离的现象,或者由于实际问题的复杂性因素,在统计的时候就容易出现偏差,有时候偏差较大,甚至结论完全错误。通过稳健统计理论的使用,将能够有效的克服,或者进一步控制以上问题。
我国稳健统计的研究发展开始于六十年代,经过将近二十年的发展和探究,初定型于八十年代。随着如今科技的飞速发展,稳健统计也随之不断进步,加之计算机技术的广泛应用,进一步的推动了其发展。稳健统计是统计过程当中稳定性的理论部分。在假设已知的前提之下,该理论较为系统分析了离群值的影响。在经典假设满足的情况之下,通过以往的经典统计方式将能够确保结果优良,比如小样本下的t估计。最小二乘回归估计等。反之,如果无法全面满足所需要的假定条件,则无法得到理想结果。通过稳健统计的使用,将能够将离群值的影响控制在一定的度,确保最终的结果不会有太大偏差。
比如在一个多变量线性回归当中存在离群值,在寻找离群值之时可以通过稳健方式,以及回归诊断方式进行。通过稳健方式确认的模型,将能够较为符合大部分的数据特征,然后在此基础之上找到离群值。但通过一般的回归诊断则会相对麻烦,需要将有关的数据全部进行计算,然后利用结果进行寻找。这样做不仅费时费力,而且在其计算的过程当中,离群值已经对数据造成了影响,用存在偏差的结果确定离群值,最终结果必将存在一定的不合理性。由此可见,稳健统计比之一般的回归诊断更加具有稳定性和有效性。其在计算估计量之时,首要工作就是识别离群值,最大限度的保障结果的合理性。综上所述,通过稳健统计理论的运用,将有效的控制离群值对结果的影响,控制偏差,提高其科学性和合理性。
对此,Huber针对稳健统计,提出了三大主要目标:第一,在满足经典假设的模型之下,确保估计值满足合理需求,同时具备有效性。第二,如果所建造的假设模型,以及实际的模型之间存在一定的差异,且差异较为微小之时,在此时无论是统计方法之上,还是对于估计值,相应的受到的影响也会较小。第三,如果假设和实际模型之间偏离严重,由于几乎不会遭受破坏性的影响,因此仍然可以接受估计值性能。
稳健统计在经过了几十年的发展和完善,已经拥有了较为成熟的理论,并且应用范围十分广泛,优势显著。尤其是发达国家,对于稳健统计理论的应用和研究较为深刻和完善。加拿大政府广泛的应用了稳健统计理论,利用该理论和有关方法,将相关的经济指标的多元数据进行了整理,以便针对理论值进行及时的发现和有效的处理。通过将稳健统计方法用于多元统计,主要包括了位置向量,以及协方差阵。对于数据当中存在离群值的情况,通过该方法的使用将能够有效的控制其不利影响,进而提高结果的合理性。
对于官方统计公布的收入、城市人口模型等经济指标数据,充分利用了稳健估计方法进行分析。比如在改进一般统计量之时,在充分利用原始数据的基础之上,通过数变换方式,或者平方根的变换,最终得出的稳健统计量结果良好。新西兰从一九九二年开始,对于全国健康情况都会每四年调查一次。在进行调查分析之时就充分利用了稳健统计理论,利用稳健统计量和方法,针对各项健康指标进行分析、处理。新西兰对于稳健统计理论的成功应用,不仅为本国的工作开展提供了有效方式,同时为世界各国做了一个好榜样。
由此可见,由于稳健统计的诸多优势,使得世界各国无论是官方机构,还是研究结构、民间机构,都对其有着高度的重视。通过稳健统计的使用,进一步完善了其各种统计工作,也从侧面体现出各发达国家统计学的高度发达程度,同时反应出其市场化高度发展。我国在这方面的研究应用相对较晚,但也得到了不小的进步和发展,应用也较为广泛。稳健统计被广泛应用在各领域当中,比如环境学、地质学等。然而官方统计方面的应用还较少,因此还需要进一步扩大其使用,充分实现其优越性。
第一,官方统计应该更加重视统计量的系统化公布,并且对于当中所反映出的信息进行有效的解释。比如针对收入分布情况,对其位置特征之上的描述,可以通过中位收入、平均收入等,同时结合基尼系数、劳伦茨曲线等进行有效的描述。同时要注意离群值的影响,优化统计结果。
第二,开发和应用离群值处理方式。稳健统计和传统的统计之所以存在差异,主要还是在稳健性之上。由于受到离群值的不利影响,进而使得使用传统的统计方式结果将会出现不同程度的偏差,而稳健统计有效的提高了结果的合理性。因此这就要求要不断提高针对离群值的处理技术。离群值主要指的是那些偏离大部分数据的极端数据,它的值可能极大,也可能极小。也有可能是在进行测量之时,由于测量人员的失误、测量条件欠缺等方面,进而出现偏离主体的数据。
第三,加强统计量的对比研究。比较统计学概念,不仅需要从思想、流派等之上进行比较,还需要在统计量、统计分布等之上进行比较。而将传统统计量,以及稳健性统计量之间的对比研究,无疑就是此研究当中最为突出的部分。
第四,对于统计量的稳健性要求,其实质就是最大限度的控制离群值的影响作用。然而在利用稳健统计之时不可避免的存在一些不足之处,将会损失一定的观察值信息。这就要求在稳定性和有效性之间取得一个平衡,不至于偏废一方,尽量提高最终结果的合理性,同时也是稳健统计的发展需求。比如在数据当中,如果出现了离群值,则在一定程度反应出一些还处于隐性状态的优势和亮点,潜藏着发展的新方向。
第五,充分利用计算机技术。稳健统计理论的应用,要求充分利用计算机技术,进一步的提高其计算和分析能力,扩展其优势。有时候可能需要涉及的数据较少,只是利用手工便能完成。但针对那些涉及数据较多,计算复杂,必须经过多次迭代才能够完成的统计,在此时对计算机技术的使用就变得十分必要和重要了。目前应用十分广泛的主要有sas、spss等软件。其都十分适合和稳健统计结合使用,可以有效的辅助统计工作。
对于传统的经典统计常常由于各种因素的影响,导致最终的结果与实际偏差较大,甚至出现错误情况。而稳健统计的使用将能够有效的转变这种情况,将离群值的影响降低到最小。这就要求在之后的发展当中还应该进一步扩大应用,同时不断的进行完善和改进。
[1]郭亚帆.稳健统计基本理论及其在居民收入与支出指标中的应用研究[D].天津财经学院,2005.
[2]杨善林.农户收入与支出指标的稳健统计方法[J].商业经济,2009,03∶24-25,47.
[3]丁硕.稳健统计方法在股票投资组合中的应用研究[D].北京工业大学,2009.
[4]邢小茹,马小爽,田文,吴忠祥.实验室间比对能力验证中的两种稳健统计技术探讨[J].中国环境监测,2011,04∶4-8.
[5]李春倩.稳健统计在经济指标中的应用研究[J].商场现代化,2012,10∶108.