常克亮, 陈贵景
(山西大同大学数学与计算机科学学院,山西大同 037009)
函数系数模型是由Tibshirani和Hastie[1]在1993年提出的,由于函数系数模型里面存在的维数问题产生了很多不便,由此出发,统计专家们对其进行了研究,提出来很多不同的解决办法,文献[2-5]都有体现。文献[6]提出了如下模型:称为比例函数系数线性模型。其中Y是因变量,X=(X1,X2,…,Xp)T和Z=(Z1,Z2,…,Zp)T是自变量,X与Z的独立性不确定;但是ε独立于X和Z,且E(ε)=0,Var(ε)=1;假定σ(·,·)是从R2p到R的确定可测函数;g(·)是从R到R的一个未知可测函数;Cα(γ),(α=1,2,…,p)是参数γ的已知函数,γ=(γ1,γ2,…,γp)T的可知性不清楚,现在来考虑在假设γ已知的条件下,讨论系数函数局部多项式估计及其渐近正态性,记
由局部多项式思想来求解:
即关于{aα,α=1,2,…,p}和{bα,α=1,2,…,p}的极小值,设~gα(x)是使式(2)达到极小化的解的前p个值,由局部多项式思想:
可见,x=(x1,x2,…,xp)T,eα,2p是单位向量,它的维数为2p,而且第α个分量为1,U是一个矩阵,维数是n×2p,U的第i行是
易知W=diag(W11,W22,…,Wpp),Wii=Khα(Xiα-xα)是W的第i个对角线元素,Xiα,Ziα分别是Xα和Zα的第i个观察值,Khα(·)=K(·/hα),K(·)是一个概率密度函数,而且有紧支撑,并关于0对称,有界非负的Lipschitz连续的,hα=hnα>0是窗宽。
条件:
A1:X的联合密度p(x)以及Xα的边际密度pα(xα)是有紧支撑的,有界的,而且是Lipschitz连续的;
引理1 令
在假设A1和A2都成立的条件下有:
从而
引理2 令Mn,r(x0)=(Mn,r,λ(x0))pλ=0,在假设A1和A2都成立的条件下有:
从而
引理3 令Qn,r(x0)=(Qn,r,λ(x0))pλ=0,在假设A1和A2都成立的条件下有:
从而
而
由引理1、引理2和引理3得:
把局部多项式方法用到了比例函数系数线性模型的估计中,得到系数函数的局部多项式估计,并且讨论了估计的渐近正态性。
[1] Hastie T,Tibshirani R.Varying-coefficient models[J].Statist.Soc.B,1993,55(4):757-796.
[2] Cai Z,Fan J.Avreage regression surface for dependent[J].Multivaraiate Anal,2000,75:112-142.
[3] Cai Z,Fan J,Yao Q.Function-coefficient models for nonlinear time series[J].American Statist,As-soc,2000,95:451.
[4] Fan J,Zhang J.Two-step estimation of functional lineat models with applications to longitudinal data[J].R.Statist,2000,62B:303-322.
[5] Zhang R Q,Li G Y.Avreage estimation of function-coefficient regression models with different smoothing variables[J].Statistics &Probability,2007,77:455-461.
[6] 张日权,卢一强.变系数模型[M].北京:科学出版社,2004.
[7] 常克亮,陈贵景.参数已知下比例函数线性模型的平均估计[J].佳木斯大学学报:自然科学版,2012(6):917-919.
[8] 施三支,赵鸣霖.一阶双重线性时间序列模型的参数估计[J].长春理工大学学报:自然科学版,2004(1):64-68.