线性模型的新的两参数估计

2015-12-29 05:09薛美玉梁飞豹
关键词:充分条件均方参数估计

薛美玉,梁飞豹

(福州大学数学与计算机科学学院,福建福州 350116)

0 引言

线性模型是现代统计学中应用最为广泛的模型之一[1].它在生物、医学、金融、地质、国防等领域都有广泛的应用.统计学家对线性模型作了大量研究,并出现了许多研究分支.其中,参数估计一直是一个非常活跃的分支.最小二乘估计(LS估计)因其优良性而在线性模型参数估计中占有重要地位[2].但是,当数据具有复共线性时,LS估计变得不再优良.人们为此作了许多改进工作,例如,Stein于1960年提出了 Stein压缩估计[3],Hoerl和 Kennard于1970 年提出了岭估计[4],Liu于 1993 年提出了 Liu估计[5-6],Ozkale和Kaciranlar于2007年提出了两参数估计[7],等等.

结合前人对LS估计的这些改进工作,提出线性模型参数估计的一种新方法——新的两参数估计,并通过与最小二乘估计及旧的两参数估计的比较,提出该估计的优越性.这里,为了便于比较,把文献[7]Ozkale和Kaciranlar提出的两参数估计称为旧的两参数估计,记为OTP估计,而把本文提出的新的两参数估计记为NTP估计.

1 新的两参数估计及其优良性

线性模型的一般形式为:

其中:Y是n×1可观测向量;X是n×p列满秩已知设计矩阵;β是p×1未知参数向量;ε是n×1随机误差向量;In是n阶单位阵[8].

定义1 称 β^NTP=(XTX+kI)-1(XTX+dI)β^

LS为模型(1)中β的新的两参数估计,其中,k>d>0,β^

LS=(XTX)-1XTY为β的最小二乘估计.

下面研究新的两参数估计β^NTP的一些性质.为了表达方便,引入记号XTX=S和XTX+kI=Sk.那么,最小二乘估计 β^LS=S-1XTY,新的两参数估计 β^NTP=Sk-1Sdβ^LS,旧的两参数估计 β^OTP=(XTX+kI)-1(XTX+kdI)β^LS=Sk-1Skdβ^LS.

性质1 β^NTP是 β^LS的一个线性变换.

性质2 β^NTP是β的有偏估计.因为对任意k>d>0,E(β^NTP)=Sk-1Sdβ ≠ β.

性质3 当 β^LS≠0时,对任意k>d>0,总有 β^NTP< β^LS.表明 β^NTP是 β^LS向原点的一个压

LSNTPLSNTPLS缩.

以上是 β^的一些基本性质,这些基本性质说明当存在复共线性时,β^改进了LS估计.此外,β^

NTPNTP

NTP还具备一些优良性.

定理1 β^是βNTP的可容许估计.

证明 因为β^NTP=Aβ^LS=Sk-1Sdβ^LS,由 Rao的定理[9]可得:

所以,对于任意k>d>0,β^NTP是β的可容许估计.

定理2 当(k-d)βTβ≤2σ2时,有:

1)MSEM(β^)< MSEM(β^);

NTPLS

2)GMSE(β^)< GMSE(β^);

NTPLS

3)MSE(β^)< MSE(β^).

NTPLS

其中:MSEM(β^)、GMSE(β^)、MSE(β^)分别为β^的均方误差矩阵、广义均方误差、均方误差.

NTPNTPNTPNTP

证明 由于1)、2)、3)的等价性,只证1).

当k>d>0时,上式的一个充分条件是2σ2I-(k-d)ββT≥0,即(k-d)βTβ≤2σ2,从而定理得证.

定理3 当[2k- (k+1)d]βTβ ≤2σ2时,有 MSEM(β^NTP)< MSEM(β^OTP).

证明

当k > d > 0,k > 1时,上式等价于σ2[2I+(k+1)d S-1]+[(k+1)d-2k]ββT> 0,而该式的一个充分条件是2σ2I-[2k-(k+1)d]ββT≥0,即[2k-(k+1)d]βTβ≤2σ2,从而定理得证.

2 结论与展望

由于线性模型的广泛应用,提出了线性模型参数的一种新的估计——新的两参数估计:

并讨论了它的若干性质.例如,它是最小二乘估计的线性变换,具有有偏性、压缩性、可容许性.比较突出的是,在均方误差矩阵的意义下,证明了新的两参数估计的优良性.但是,由于定理2和定理3所给的充分条件中含有未知参数β和σ2,所以需要用迭代的方法来确定k和d,这是笔者接下来要考虑的一方面.另外,β^NTP的大样本性质,如相合性和渐进正态性,也是笔者后续工作中要考虑的另一方面.

猜你喜欢
充分条件均方参数估计
一类随机积分微分方程的均方渐近概周期解
基于新型DFrFT的LFM信号参数估计算法
集合、充分条件与必要条件、量词
Beidou, le système de navigation par satellite compatible et interopérable
有限μM,D-正交指数函数系的一个充分条件
Logistic回归模型的几乎无偏两参数估计
基于向前方程的平稳分布参数估计
基于竞争失效数据的Lindley分布参数估计
基于抗差最小均方估计的输电线路参数辨识
基于随机牵制控制的复杂网络均方簇同步