线性相关系数的一种稳健形式*

2013-09-12 03:05甘胜进
关键词:福建师范大学福清稳健性

甘胜进,林 娟

(福建师范大学福清分校数学与计算机科学系,福建福清 350300)

线性相关系数的一种稳健形式*

甘胜进,林 娟

(福建师范大学福清分校数学与计算机科学系,福建福清 350300)

相关系数是反应2个随机变量之间线性关系紧密程度的一个量,容易受异常值干扰.提出一种稳健的形式,它在正态分布条件下的性质与相关系数类似,但是抵御异常值远远优于相关系数,具有很好的应用价值.

相关系数;中位数;中位数绝对偏差;稳健性

二维随机变量(X,Y)之间的线性相关系数为

由于期望、方差抗离群点(outlier)较差,因此在稳健性统计当中,常以中位数(median)med代替期望,以中位数绝对偏差(median absolute deviation)MAD来代替方差,其均能抵御50%离群点[1],抗异常值干扰能力极强,从而ρXY的一个稳健表达形式为

一般情况下,δXY的取值并不是像ρXY那样介于[-1,1]之间[2],但是对于二维正态分布,δXY与ρXY具有相似的性质,笔者主要探讨二维正态分布条件下δXY与ρXY的关系.

1 中位数的性质

(ⅰ)med(aX+b)=amed(X)+b;

(ⅱ)当X与Y相互独立时,med(XY)=med(X)med(Y);

(ⅲ)med(|X|)=[med(X2)].

其中X与Y均为一维随机变量,a,b均为任意实数.

证明 (ⅰ)aX+b≥amed(X)+b⇔X≥med(X),或X≤med(X),而p(X≥med(X))=p(X≤med(X))=,即证.

(ⅱ)当X与Y相互独立时,有

故med[(X-med(X))(Y-med(Y))]=0.而由性质(ⅰ)可知,

性质(ⅰ)表明中位数具有线性性质,也称为仿射同变性质;性质(ⅱ)表明2个相互独立的随机变量的乘积的中位数等于各自中位数的乘积,这与期望的性质是一样的;一般情况下,med(|X|)极为难求,而性质(ⅲ)揭示了med(|X|)与med(X2)之间简单的平方关系.

2 二维正态分布下δXY的性质

根据δXY定义以及上述中位数性质,得到δXY另一种表达式:

其中σX,σY分别为X与Y的标准差.对于二维正态分布随机变量X和Y,有

定理1 在二维正态分布条件下,δXY与ρ形成一一对应关系,即δXY=δ(ρ),并且δ(ρ)是ρ的增函数,δ(-1)=-1,δ(0)=0,δ(1)=1.

[1] PETER J ROUSSEEUW,CHRISTOPHE CROUX.Alternatives to the Median Absolute Deviation[J].J.Amer.Statist.Assoc.,1993,88:1 273-1 283.

[2] MICHAEL FALK.On MAD and Comedians[J].Annals of the Institute of Statistical Mathematics,1997,49:615-644.

[3] 孙山泽.非参数统计讲义[M].北京:北京大学出版社,2000.

[4] MICHAEL FALK.A Note on the Comedian for Elliptical Distributions[J].Journal of Multivariate Analysis,1998,67:306-317.

[5] STAMATIS CAMBANE,STEEL HUANG,GORDON SIMONS.On the Theory of Elliptically Contoured Distributions[J].Journal of Multivariate Analysis,1981,11:368-385.

[6] MICHAEL FALK.The Sample Covariance is Not Efficient for Elliptical Distributions[J].Journal of Multivariate A-nalysis,2002,80:358-377.

(责任编辑 向阳洁)

A Robust Form of the Linear Correlation Coefficient

GAN Sheng-jin,LIN Juan

(Department of Mathematics &Computer Science,Fuqing Branch of Fujian Normal University,Fuqing 350300,Fujian China)

Correlation coefficient reflects the closeness of the linear relationship between two random variables,which is susceptible to the interference of abnormal values.This paper presents a robust form,which has the same nature as the correlation coefficient under conditon of the normal distribution,but has higher point breaking down than that of correlation coefficient,so it has good application value.

correlation coefficient;median;median absolute deviation;robustness

O213

A

10.3969/j.issn.1007-2985.2013.04.006

1007-2985(2013)04-0023-03

2013-01-18

福建师范大学福清分校科研项目(KY2012025);福建省教育厅A类科技项目(JA12353)

甘胜进(1982-),男,湖北黄冈人,福建师范大学福清分校数学与计算机科学系助教,硕士,主要从事应用统计研究.

猜你喜欢
福建师范大学福清稳健性
“华龙一号”示范工程福清核电6号机组首次临界
福建师范大学连续7年支教留守儿童
关于Weitzenbock不等式的一条不等式链
台湾青年随父深耕福清台农创业园20载
会计稳健性的定义和计量
会计稳健性的文献综述
福建师范大学博士生导师
——陈桂蓉教授
那些年,我们错过的旗袍秀——旗媛淑院福清分院揭牌
货币政策、会计稳健性与银行信贷关系探析
Effect of Ammonia on the Performance of Catalysts for Selective Hydrogenation of 1-Methylnaphthalene