对逻辑曲线的参数进行最小二乘估计的讨论

2016-05-14 11:11方茁
中学教学参考·理科版 2016年6期

方茁

[摘 要] 以往对逻辑曲线y=

L 1+ae-bx

中参数L,a,b的估计往往是基于一定的经济意义或生物统计的背景,但从纯粹的数学方程角度来看,当L,a,b的取值范围不加任何限制时,是否也能估计出L,a,b呢?文章证明了当(L,a,b)

∈R3

时,y=

L 1+ae-bx

中参数L,a,b不能用最小二乘法估计,并给出了其参数在一定的限制条件下,可以用最小二乘法估计.

[关键词] 逻辑曲线 参数 最小二乘估计

[中图分类号] G633.6 [文献标识码] A [文章编号] 1674 6058(2016)17 0049

一、引言

基于残差平方和最小的思想,最小二乘法已在社会生产和实践中得到了广泛的应用.在解决非线性回归模型的参数估计问题时,我们往往将其转化为线性回归模型,进而用最小二乘法估计出其参数,但有的模型并不能通过直观的观察和简单的计算就能转化为线性回归模型,也就谈不上用最小二乘法估计其参数了.这就引发了我们对非线性回归模型的参数是否能用最小二乘法估计的沉思,如常见的逻辑曲线y=

L 1+ae-bx

((L,a,b∈R3)),其参数L,a,b能否用最小二乘法的思路估计出或至少能被确定属于一定的范围呢?这就是本文所要研究的重点.

二、猜想

任意取n个不同的样本(xi,yi),i=1,2,…,n.只要样本中不含用(0,y(0));那么逻辑曲线y= L 1+ae-bx ((L,a,b)∈R3)的参数L,a,b就不能用最小二乘法估计出且不能估出(L,a,b)属于R3中某一真子空间,即无法确定(L,a,b)∈H,HR3.

三、证明

假设用最小二乘法可以估计出(L,a,b),尽管(L,a,b)并不一定唯一,即(L,a,b)也可属于R3中一真子空间.

第一步,观察y= L 1+ae-bx ,

∵(xi,yi)可取n个不同的样本,

∴可推断出L的估计,L≠0.

第二步,(Ⅰ)y= L 1+ae-bx (*)两边同时对x求导,得

dy dx =by(1-

y L

,其中,y(0)=

L 1+a

(**),

∴参数(L,a,b)的估计若满足(*)式,则也满足(**).

(Ⅱ)考查微分方程y= L 1+ae-bx ,y(0)= L 1+a (**).

令f(x,y)=by(

1- y L )

,取R3平面上一区域D:|x| ≤h1|y|≤h2.

不难发现:f(x,y)在D上连续,且

|f(x1,y1)-f(x2,y2)|= 1 L |bL

(y1-y2)

-b(y21-y22)|≤

b|y1-y2|+2

bh2 L

|y1-y2|=(b+2 bh2 L )|y1-y2|.

故f(x,y)在D上满足Lipschitz条件.

∴由常系数微分方程的解存在唯一性定理知,(**) 式满足y(0)= L 1+a 的解在|x|≤h上存在且唯一.

这里的h=min{h1,h2},M=max|f(x,y)|,(x,y∈D).

(Ⅲ)现在解(**)式:

1)观察f(x,y),得:y=0或y=L为(**)的解.

2)在f(x,y)中,令z= 1 y ,则

dz dx =

dz dy × dy dx =

- 1 y2 · b L y(L-y)

=-bz+

b L .

(1)

再令z=c(x)e-bx,则

dz dx =

dc(x) dx e-bx-

be-bxc(x)

= dc(x) dx e-bx

-bz. (2)

比较(1)(2)得: dc(x) dx = b L ebx.

利用变量分离法,求得:c(x)= 1 L ebx

+C,C为任一常数.

∴y= 1 z =

1 c(x)

ebx=

L ebx+CL ebx=

L 1+CLe-bx .

(3)

将y(0)=

L 1+a

代入(3),得:C= a L .

∴y= L 1+ae-bx .

综上,(**)式的解为y=0或L或 L 1+ae-bx .

但由(Ⅰ)知,样本(xi,yi)对(**)式中参数L,a,b的估计问题同样适用.故实际操作中,由于n个样本(xi,yi)是不同的,所以y=0,L要排除.

综合(Ⅱ)(Ⅲ)知,在整个实数域 R 上,(**)式的解都是存在参数(L,a,b)作最小二乘估计.

第三步,多元线性回归方程的一般形式是y=β0+β1x1+…+βpxp,不失一般性,总可以设β0=0.因为可以形式上引入自变量x0=1,所以在理论研究时,可以假设多元线性回归模型的形式为y=β1x1+…+βpxp.

由假设知,y= L 1+ae-bx 中参数a,b可作最小二乘估计,故y= L 1+ae-bx 必可划为线性回归形式:g(x,y)=p(L)u(x,y)+q(a)u(x,y)+h(b)w(x,y).(4)

由于我们是先估计出p(L),q(a),h(b)后,利用L=p(L),

q(a)=q(a),h(b)=h(b),进而估计出,L,a,b的,所以(4)式与y= L 1+ae-bx 实质上对L,a,b的估计并没有任何区别.

故不妨设y= L 1+ae-bx 可划为y=Lx1+ax2+bx3(5).

(5)式中,残差θi=

(yi-Lxi1-axi2-bxi3)=(L,a,b)xx′(Lab)-2y′x(Lab)+y′y.

其中,x=x11x22…xnn,y=y1y2…yn,

∴2xx′(Lab)-2x′y=0.

由假设知,L,a,b可用最小二乘估计出:若(L,a,b)唯一,则r(xx′)=3;若(L,a,b)不唯一,则(L,a,b)属于R3中一真子空间,此时r(xx′)=1或2.

综上,由假设得到r(xx′)>0.

第四步,由第二步知,对y= L 1+ae-bx 中参数L,a,b的估计等价于对 dy dx

=by(1- y L ),y(0)= L 1+a 中参数L,a,b的估计.

分析后者,我们发现通过样本(xi,yi)至多只能直接估出b,L,而a与样本(xi,yi)并没有直接关系,它只与y(0)有直接联系,a= L y(0) -1(∵由第一步知,L≠0,∴y(0)= L 1+a ≠0).

但实际的样本数据中,由于(0,y(0))并未给出,故y(0)的取值范围为R\{0}.

现任意取定L,b,一方面残差θ退化为只含a的二次函数,即r,s,t∈R1→θ=θ(a)=ra2+sa+t,

则a的估计值必须满足θ′(a)=0.即2ra+s=0. (6)

另一方面,a=

L y(0)

-1,由L≠0,y(0)的取值范围为R\{0},得到a的取值范围为R\{-1},故R\{-1}中任一点都可作为a,显然也要满足(6)式.

∴r=s=0,

∴θ(a)=t为常数,故残差θ与a无关.

同理,任意取定a,b,也可得到残差θ与L无关.

故残差θ至多与b有关.

如果θ与b有关,则θ=θ(b),即y= L 1+ae-bx 可转化为线性回归形式,g(x,y)=h(b)w(x,y);但前式含有3个参数L,a,b,后式只含有1个参数b,显然,这种转化不成立.

故残差θ=t为常数.

反馈到第三步,可知此时的xx′=03×3,即r(xx′)=0,与假设得到的r(xx′)>0矛盾.

∴原假设不成立,故猜想成立.

证毕.

四、总结与归纳

尽管L,a,b在非限制条件下,y= L 1+ae-bx 中的参数L,a,b不能用最小二乘法估计,但在实际经济模型或生物统计模型中,L,a,b往往具有特殊的经济含义和现实意义.我们可以用其他方法先估计出L或b等,然后再利用最小二乘法估计剩余的两个参数.比如,著名的Logistic人口发展模型y= L 1+ae-bx 中的参数L代表自然资源和环境条件所能容纳的最大人口数量,我们可以先根据生态学的知识预测出L,然后将y= L 1+ae-bx 转化为线性回归形式,即

-bx+lna=ln( L y -1)

,再利用不同年份的人口统计数据和最小二乘法估计出a,b.

[ 参 考 文 献 ]

[1] 王高雄.周之铭等.常微分方程[M].北京:高等教育出版社,2007.

[2] 北大数学系几何与代数教研室前代数小组.高等代数[M].北京:高等教育出版社,2003.

[3] 陈家鼎,孙山泽等.数量统计学讲义[M].北京:高等教育出版社,2011.

[4] 吴梅村.数理统计学基本原理和方法[M].成都:西南财经大学出版社,2006.

(特约编辑 嘉 卉)