核实数据下的递归核密度估计

2012-12-04 08:16宇世航赵世舜
吉林大学学报(理学版) 2012年5期
关键词:密度估计样本容量估计量

宇世航, 赵世舜

(1. 齐齐哈尔大学 理学院, 黑龙江 齐齐哈尔 161006; 2. 吉林大学 数学学院, 长春 130012)

基于替代数据和核实样本推断的研究目前已有许多结果[1-10]. Sepanski等[1]研究了基于核实数据的非线性EV模型; Wolvreton等[11]提出了f(x)的递归型核密度估计:

由于递归型核密度估计在添加样本点时, 不必重新计算所有项, 只需计算添加项, 因此使计算更方便. 基于此, 本文考虑借助于核实数据, 构造一递归型概率密度估计量, 并研究其渐近正态性.

1 主要结果

于是在一些正则条件下,f(x)可被如下递归核估计量一致估计:

定义

AppendixA条件:

(A·f):f(x)是k阶有界可导的;

(A·K):K(·)在有界支撑集上是k阶非负有界的核函数;

定理1在AppendixA条件下, 有

证明:

(3)

这里C为任意常数, 且在不同处可取不同的值. 于是, 由式(3)~(6)有

从而

其中

及条件(A·bn,ηn), 可得

(8)

同理, 有

(10)

于是由式(2)~(10), 有

(11)

同理, 由(A·f),(A·K),(A·hj), 得

(13)

综上所述, 有

由条件(A·K)和(A·h), 有

由式(15)~(17), 显然有

I1→N(0,θ1σ2(x)),

(18)

I2→N(0,θ2σ2(x)),

(19)

故结合式(15),(18)~(20)可得

2 模拟结果

(n,N)=(20,100),(50,100),(50,300),(100,300),

图1 n=20, N=100时的模拟结果Fig.1 Simulation result for n=20, N=100

图2 n=50, N=100时的模拟结果Fig.2 Simulation result for n=50, N=100

图3 n=50, N=300时的模拟结果Fig.3 Simulation result for n=50, N=300

图4 n=100, N=300时的模拟结果Fig.4 Simulation result for n=100, N=300

由图1~图4可见, 给定样本总数N的情况下, 模拟效果随核实数据样本容量n的增加而渐好; 当固定核实数据样本容量n时, 顶部随样本总量N的增加模拟效果渐好, 尾部变差; 如果同时增大N和n, 模拟结果更趋近于f(x), 并且也更平滑.

[1] Sepanski J H, Lee L F. Semiparametric Estimation of Nonlinear Error-in-Variables Models with Validation Study [J]. J Nonparametric Statist, 1995, 4: 365-394.

[2] WANG Qi-hua. Estimation of Partial Linear Error-in-Variables Model with Validation Data [J]. J Multivaiate Anal, 1999, 69: 30-64.

[3] WANG Qi-hua. Estimation of Linear Error-in-Covariables Models with Validation Data under Random Censorship [J]. J Multivariate Anal, 2000, 74(2): 245-266.

[4] WANG Qi-hua, Rao J N K. Empirical Likelihood-Based Inference in Linear Error-in-Corariables Models with Validation Data [J]. Bioraetrika, 2002, 89(2): 345-358.

[6] WANG Qi-hua, YU Ke-ming. Likelihood-Based Kernel Estimation in Semiparametric Errors-in-Covariables Models with Validation Data [J]. Journal of Multivariate Analysis, 2007, 98(3): 455-480.

[7] XUE Liu-gen. Empirical Likelihood Inference in Nonlinear Semiparanetric EV Models with Validation Data [J]. Acta Mathematica Sinica: Chinese Series, 2006, 49(1): 145-154. (薛留根. 核实数据下非线性半参数EV模型的经验似然推断 [J]. 数学学报: 中文版, 2006, 49(1): 145-154.)

[8] DAI Peng-jie, SUN Zhi-hua, WANG Peng. Model Checking for General Linear Error-in-Covariables Model with Validation Data [J]. Acta Mathematica Sinica, 2010, 23(6): 1153-1166.

[9] WANG Qi-hua. Dimension Reduction in Partly Linear Error-in-Response Models with Validation Data [J]. Journal of Multivariate Analysis, 2003, 85(2): 234-252.

[10] DU Li-lun, ZOU Chang-liang, WANG Zhao-jun. Nonparmetric Regression Function Estimation for Errors-in-Variables Models with Validation Data [J]. Statistica Sinica, 2011, 21: 1093-1113.

[11] Wolvreton C T, Wagner T J. Asymptotically Optimal Discriminant Functions for Pattern Classification [J]. IEEE Trans, 1969, 15(2): 258-265.

[12] Rao B L S P. Nonparametric Functional Estimation [M]. London: Academic Press, 1983.

猜你喜欢
密度估计样本容量估计量
m-NOD样本最近邻密度估计的相合性
面向鱼眼图像的人群密度估计
基于MATLAB 的核密度估计研究
采用无核密度仪检测压实度的样本容量确定方法
浅谈估计量的优良性标准
基于配网先验信息的谐波状态估计量测点最优配置
负极值指标估计量的渐近性质
END样本最近邻密度估计的一致强相合速度
广义高斯分布参数估值与样本容量关系
多种检测目标下样本容量设计的比较