刘 燕,肖玉山
(1.吉林农业大学发展学院 基础部,吉林 长春 130600;2.长春大学 教务处,吉林 长春 130022)
参数序限制下最优同变预测区间的改进
刘 燕1,肖玉山2
(1.吉林农业大学发展学院 基础部,吉林 长春 130600;2.长春大学 教务处,吉林 长春 130022)
考虑了位置分布族与尺度分布族中,当未知参数含有序限制时,对未知随机变量的预测区间的问题。利用序限制下最优同变估计量的改进方法,在一定条件下,构造一族改进后的同变预测区间,从而解决了对未知随机变量同变预测区间的改进问题。
序限制;同变预测区间;位置分布族;尺度分布族;TP2(total positivity of order 2);IERD(integrated expression of risk difference)方法
在数理统计当中,设X=(X1,X2,…,Xn)是可观测随机向量,Y是未知且不可观测的随机变量。设(X,Y)的联合分布f(x,y;θ)依赖于未知参数(参数向量)θ,基于X的观测值来预测Y的问题叫做统计预测问题。
统计预测的主要形式之一就是利用X的观测值给出Y的取值范围。设l(X)与u(X)是随机向量X的函数,对给定的实数α(0<α<1),若对任意的θ∈Θ(Θ为参数空间),有Pθ{l(X)≤Y≤u(X)}≥1-α,则称[l(X),u(X)]是具有置信水平为1-α的Y的预测区间。若对任意的θ∈Θ,有Pθ{l(X)≤Y≤u(X)}=1-α,则称[l(X),u(X)]是置信水平为1-α的Y的同等预测区间。
预测区间的优良性取决于其评价标准——置信度Pθ(l(X)≤Y≤u(X))和精确度Eθ(u(X)-l(X)),即Y落入预测区间的概率以及预测区间的平均长度。通常我们要在置信水平为1-α的Y的预测区间当中,寻找平均长度最短的区间,并将此预测区间定为最优预测区间。但是此类预测区间往往不存在,所以我们通常考虑将预测区间限制到同变预测区间里,以求得最优同变预测区间。
设样本X=(X1,X2,…,Xn),令δ1(X)=[l(X),u(X)]是Y的置信水平为1-α的同等预测区间。若对任意实数c,有:δI(X+c)=[l(X+c),u(X+c)]=[l(X)+c,u(X)+c],则称δI(X)是Y的位置同变预测区间。其中X+c=(X1+c,X2+c,…,Xn+c)。
设样本X=(X1,X2,…,Xn),(Xi>0,i=1,2,…,n),令δI(X)=[l(X),u(X)]是Y的置信水平为1-α的同等预测区间。若对任意实数c>0,都有δI(cX)=[l(cX),u(cX)]=[cl(X),cu(X)],则称δI(X)是Y的尺度同变预测区间。其中c(X)=(cX1,cX2,…,cXn)。
文献[1]讨论了位置分布族与尺度分布族中的分布参数含有序限制θ≤θ2(θ2未知)时,对未知随机变量的最优同变点预测量进行改进;文献[2]讨论了位置分布族与尺度分布族中分布参数含有序限制θ≥θ1和θ1≤θ≤θ2(θ1,θ2未知)时,对未知随机变量的最优同变点预测量进行改进。本文将利用未知参数的两种序限制,即θ∈Θ1={θ|θ≥θ1}与θ∈Θ2={θ|θ≤θ2},构造出精确度一致的预测区间,在只需评价置信度优良的情况下,借助IERD方法,运用置信概率差的积分表示法对位置分布族与尺度分布族中未知随机变量的最优同变预测区间进行改进。
若函数K(x,y)对于任意的的x1≤x2,y1≤y2,都有成立,则称函数K(x,y)为
设随机变量(X,Y)服从密度函数为f(x-θ,y-θ)且依赖于未知参数θ的分布,参数空间Θ={θ|θ∈R},X为可观测随机变量,Y为未知随机变量。构造置信水平为1-α的最优同变预测区间为:δIc0(X)=[l(X),u (X)]=[X+c0-d,X+c0+d],其中c0和d由方程∫c0+dc0-dh(v)dv=1-α与h(c0+d)=h(c0-d)唯一确定[4]。
下面将利用θ的两种序限制,即θ∈Θ1={θ|θ≥θ1}与θ∈Θ2={θ|θ≤θ2},对同变预测区间δIc0进行改进,并在一定条件下构造改进后的预测区间。
改进过程中需要借助下述引理:
引理1 对任意给定的x与λ≥0,h(x-λ,y)与g(x,y)是正函数,且是y的非增函数,则对任意给定的正数c1>0,c2>0及y1>y2,都有
1.1 θ∈Θ1={θ|θ≥θ1}
引入可观测随机变量X1,即(X1,X,Y)的密度函数形式为f(x1-θ1,x-θ,y-θ)。
设W=X1-X,V=Y-X,则(W,V)联合密度函数形式为gl(w-λl,v),其中λl=θ1-θ≤0,且gl(w,v)=设Y的同变预测区间为,则利用置信概率差的积分
定理1 设(ⅰ)Gl(w,v)是TP2;
(ⅱ)φl(w)为w的非降函数,
(引理1以及定理条件(ⅲ))
则P(Y∈δIφl)≥P(Y∈δIc0),即δIφl(X)优于δIc0(X)。
1.2 θ∈Θ2={θ|θ≤θ2}
引入可观测随机变量X2,即(X,X2,Y)的密度函数形式为f(x-θ,x2-θ2,y-θ),令U=X2-X,V=YX,则可知(U,V)的联合密度函数形式为gr(u-λr,v),其中设Y的同变预测区间为,则利用置信概率差的积分表示法可证明在一定条件下在下面的讨论中,假设积分和求导运算可以换序。
定理2 设(ⅰ)Gr(u,v)是TP2;
(ⅱ)φr(u)为u的非降函数,
则对任意θ∈Θ2={θ|θ≤θ2},有
0rr0
证明与定理1类似,故略。
下面将利用θ的两种序限制,即θ∈Θ1={θ|θ≥θ1}与θ∈Θ2={θ|θ≤θ2},对同变预测区间δIc进行改进,并在一定条件下构造改进后的预测区间。
引理2 对任意给定的x与λ≥1, 是正函数, 是y的非增函数,则对任意给定的正数c1>0,c2>0及y1<y2,都有下列不等式成立:
2.1 θ∈Θ1={θ|θ≥θ1>0}
引入可观测随机变量X1(X1>0),即(X1,X,Y)的密度函数形式为则(W,V)的密度函数形式为根据尺度分布族的定义,可将
设Y的预测区间为作为评价预测区间优良性的标准之一,并可以此取代精确度。由于I(δIφl)=I(δIc),则只需比较两预测区间置信度即可。利用置信概率差的积分表示法可证明:在一定条件下,P(Y∈δIc)≤P(Y∈δIφl),即δIφl优于δIc。在下面的讨论中,假设积分和求导运算可以换序。
定理3 设(ⅰ)Gl(w,v)是TP2;
(ⅱ)φl(w)为w的非降函数
(由引理2以及定理条件(ⅲ))
2.2 θ∈Θ2={θ|0<θ≤θ2}
引入可观测随机变量X2(X2>0),即(X,X2,Y)的密度函数形式为则(U,V)的密度函数形式为令
定理4 设(ⅰ)Gr(u,v)是TP2;
(ⅱ)φr(u)为u的非降函数
证明与定理2.1类似,故略。
[1] Xiao Yushan,Takada Y.Improvement of the best equivariant predictors under the ordered parameters[J].Japan Statist.Soc,2006,36(1):1-8.
[2] Xiao YuShan,Takada Y.Statistical prediction under an order restriction.Northeast[J].Math.J,2008,24(1):1000-1778.
[3] Karlin,S.Total Positivity[M].Stanford CA:Stanforol University Press,1968.
[4] Kubokawa,T.,Saleh,A.K.Estimation of location and scale parameters under order restriction[J].Jour.Statistical Research,1994,28:45-51.
责任编辑:钟 声
The improvement of the best equivariant prediction interval under the ordered parameters
LIU Yan1,XIAO Yu-shan2
(1.Department of Fundamental Courses,Development College of Jilin Agricultural University,Changchun 130600,China; 2.Academic Affairs Office,Changchun University,Changchun 130022,China)
This paper considers the improvement of the best equivariant prediction interval under ordered unknown distribution parameters in the location or scale family.It constructs a class of improved prediction intervals under some conditions so that the problems of the unknown random variable have been solved by using the method of improving the best equivariant prediction.
order restriction;equivariant prediction interval;location family;sale family;TP2(total positivity of order 2);method of IERD(integrated expression of risk difference)
0212.5
A
1009-3907(2010)08-0014-04
2010-05-16
刘燕(1981-),女,吉林长春人,助教,硕士,主要从事统计预测与决策理论以及贝叶斯分析理论的研究。