求解非负约束优化问题的可行LS共轭梯度法*

2014-09-18 02:55刘陶文
关键词:有界共轭情形

刘陶文,周 蓉

( 湖南大学 数学与计量经济学院,湖南 长沙 410082 )

非负约束优化问题广泛存在于许多学科及工程应用领域中,如:非线性回归分析、金融投资、大地测量、卫星导航等,并且有关的数据处理是非常庞大的,呈现的问题通常是大规模的.因此,研究求解这些问题的高效算法具有重要的现实意义.非负约束优化问题的一般形式为

(1)

这里函数f:Rn→R是连续可微的,D={x∈Rn:x≥0}是可行域.

问题(1)的一阶最优性条件 ( KKT条件 )可以表示为

(2)

这里g(x)=▽f(x)表示函数f在点x处的梯度,gi(x)表示g(x)的第i个分量.满足条件(2)的点x被称为问题(1)的一个KKT点.

与问题(1)相关的是下面的有界约束问题:

(3)

这里l和u是Rn中的有界向量.许多研究集中于求解大规模有界约束问题(3),人们提出了如谱梯度投影法、有限记忆拟牛顿法和共轭梯度法等有效算法[1,4,6].尽管问题(1)可以看作问题(3)的特殊情形,但不知这些方法能否经过适当的修改被用来求解非负约束问题.

众所周知,共轭梯度法及其修正形式是求解大规模无约束问题minf(x),x∈Rn的有效方法[2,7-8].因此,人们设想用共轭梯度法的思想求解约束问题.文献[6]研究了用共轭梯度的思想求解有界约束问题(3),通过求解一个约束子问题来计算搜索方向,作者证明了在 Wolfe型线性搜索下所提出的方法是收敛的.然而已有研究表明在该研究上存在许多的困难[5].

在本文中,我们研究用共轭梯度型方法求解非负约束问题 (1).结合已有求解有界约束问题的子空间思想[4]和求解无约束问题的Liu-Storey (LS)共轭梯度法[3],提出了一个求解问题(1)的可行LS共轭梯度法,与文献[6]的方法比较,本文提出的方法的优点是无需求解子问题,并且在Armijo搜索下具有全局收敛性,节省大量计算.

1 计算下降可行方向

给定x∈D及常数ε>0,首先定义如下的索引集合:

B(x)={i:xi>ε},

A1(x)={i:xi=0,gi(x)≥0}∪{i:0

A2(x)={i:0≤xi≤ε,gi(x)<0},

A3(x)={i:0

(4)

我们称集合A(x)=A1(x)∪A2(x)∪A3(x)为x处的有效集,而B(x)称为非有效集.

设xk∈D是问题(1)的一个近似解,为了计算在该点处的下降可行搜索方向dk∈Rn,采用如下策略:由于A1(xk)中的变量满足条件(2),这些变量的取值保持不变; 对于A3(xk)中的变量,由于-gi(xk)指向可行域的边界,对-gi(xk)进行截断处理获得搜索方向;对于B(xk)∪A2(xk)中的变量先计算某种共轭梯度型方向,然后进行适当的截断处理产生搜索方向.dk的具体计算方法如下:

设矩阵Pk由列{ei:i∈B(xk)∪A2(xk)}构成,矩阵Qk由列{ek:i∈A3(xk)}构成,其中ei表示n阶单位矩阵的第i列.首先计算共轭梯度方向如下:

(5)

这里gk=g(xk),yk=gk-gk-1,并且

(6)

容易验证

(7)

(8)

(9)

因此,由dk的定义(7)可得

(10)

证毕

证由KKT条件(2)以及(10)即可验证定理结论成立.

证毕

2 算法结构及其收敛性分析

现在提出求解问题(1)的可行LS共轭梯度算法如下:

算法1(可行LS共轭梯度法)

步 0:取初始点x0∈D,常数ρ,σ∈(0,1),ε>0.令k=0.

加拿大林间猫头鹰的鸣声“呵呵——呵——呵——”,极像老翁冷冷的笑声,与我记忆中江南的猫头鹰的叫法“骨碌碌碌……”圆滚而阴森的鸣音,大异其趣。鸱鸮的鸣法会超过人类的方言上万种吗?鸟啼人语,都是天趣。

f(xk+αdk)≤f(xk)-σ‖αdk‖2

(11)

的最大值αk.令xk+1=xk+αkdk.

步4:令k:=k+1,然后转步1.

在算法1的步3中,使用了Armijo 型线性搜索(11)计算步长αk,这比文献[6]中使用的Wolfe 型搜索更容易实现,而且节省大量投影计算.显然由算法1产生的序列{xk}⊂D.

下面分析算法1的全局收敛性.首先作如下的假设:

假设A由算法1产生的序列{xk}在D内是有界的,函数f(x)在D内有下界并且其梯度g(x)在可行域D内是Lipschitz连续的,即存在常数L>0满足

‖g(x)-g(y)‖ ≤L‖x-y‖,∀x,y∈D.

注当dk≠0,dk是f(x)在xk处的一个下降可行方向,从而由假设A可知序列{f(xk)}单调下降且有下界,从而得到

(12)

(13)

证根据索引分类(4)分4种情形进行讨论.

情形1:当i∈B(xk)时,(xk)i>ε,故

情形2:当i∈A1(xk)时,(xk)i+γ(dk)i=0,∀γ≥0.

情形3:当i∈A2(xk)时,

情形4:当i∈A3(xk)时,gi(xk)≥0,即有

以上的讨论表明(13)成立.

证毕

引理3如果存在某个常数δ>0使得

那么序列{dk}是有界的,即存在常数M>0使得‖dk‖∞≤M.

证在假设A的条件下,{xk},{gk}是有界的,即存在常数M1>0,使得

‖xk‖∞≤M1,‖gk‖∞≤M1,∀k≥0.

(14)

另一方面,由(12),必存在常数μ∈(0,1)及正整数k1,使得

2δ-1M1L‖αk-1dk-1‖ ≤μ,∀k≥k1.

因此,∀k≥k1,进一步有

所以,对任意的k≥0,有

证毕

利用引理3,可以得到下面的全局收敛性定理.

定理2设序列{xk}由算法1产生.如果假设A 成立,则有

(15)

下面对步长αk分两种情形讨论.

另一方面,由泰勒中值定理及g(x)的 Lipschitz 连续性容易验证

由上面的两个不等式可推出

证毕

由定理1及定理2知,必存在迭代序列{xk}的某一个极限点x*是问题 (1)的KKT点.

3 数值实验

在这一节,将所提出的算法应用于大地测量中数据处理问题[9].对一理想边坡因地质断层构成一可能的滑体,按地质学知识,滑体只能沿底盘向东北方向偏下移动.选定三个基点,其坐标分别为A(500.00,0,100.00),B(0.00,-500.00,150.00),C(500.00,500.00,200.00).在滑体上,取监测点P(0,0,100.00),分别在基点A,B,C处用边前方交会监测P点的位移(x,y,-z),AP,BP和CP为3个观测边,且有先验信息x,y,z>0.设观测向量为L∈R3,则有相应的误差方程:

L+V=(|AP|,|BP|,|CP|)T,

其中V为观察噪声向量.设A,B,C3个边观测的一次观测值分别为500.04,502.52,714.13.试估计P点的位移(x,y,-z).

当P点有位移(x,y,-z)时,观测向量L的误差方程为:

文献[9]将误差方程线性化后,利用求解线性互补问题的Lemke算法求解得P点位移的最小二乘估计.由于线性化产生的误差及Lemke算法的计算复杂性,这种估计的精度是有限的.

记函数.

则P点位移的估计问题等价于下面的带非负约束的非线性最小二乘问题:

(16)

[1]BIRGIN E G,MARTINEZ J M,RAYDAN M.Non-monotone spectral projection gradient methods on convex sets [J].SIAM Journal on Optimization,2000,10(1):1196-1211.

[2]DAI Y,YUAN Y.Nonlinear conjugate gradient methods [M].Shanghai:Shanghai Science and Technology Publisher,2000.

[3]LIU Y,STOREY C.Efficient generated conjugate gradient algorithms Part 1:Theory [J].Journal of Optimization Theory and Applications,1991,69(1):129-137.

[4]NI Q,YUAN Y.A subspace limited memory quasi-Newton algorithm for large-scale nonlinear bound constrained optimization [J].Mathematics of Computation,1997,66(220):1509-1520.

[5]NOCEDAL J.Conjugate gradient methods and nonlinear optimization,In:Linear and nonlinear conjugate gradient-Related method [M].Philadelphia,SIAM Press,1996,9-23.

[6]PYTLAK R.An efficient algorithmfor large-scale nonlinear programming problems with simple bounds on the variables [J].SIAM Journal on Optimization,1998,8(2):532-560.

[7]ZHANG L,ZHOU W J,LI D H.A descent modified Polak-Rebière-Polyak conjugate gradient method and its global convergence [J].IMA Journal of Numerical Analysis,2006,26(4):629-640.

[8]ZHANG L,JIAN S Y.Further studies on the Wei-Yao-Liu nonlinear conjugate gradient method [J].Applied Mathematics and Computation,2013,219 (14):7616-7621.

[9]宋迎春,朱建军,罗德仁,等.附非负约束平差模型的最小二乘估计 [J].武汉大学学报:信息科学版,2008,33(9):907-909.

SONG Ying-cun,ZHU Jian-jun,LUO De-ren,etal.Least-squares estimation of nonnegative constrained adjustment model [J].Geomatics and Information Science of Wuhan University:Information and Science,2008,33(9):907-909 .(In Chinese)

猜你喜欢
有界共轭情形
一个带重启步的改进PRP型谱共轭梯度法
一个改进的WYL型三项共轭梯度法
指数有界双连续n阶α次积分C群的次生成元及其性质
避免房地产继承纠纷的十二种情形
巧用共轭妙解题
一种自适应Dai-Liao共轭梯度法
四种情形拖欠劳动报酬构成“拒不支付”犯罪
一类具低阶项和退化强制的椭圆方程的有界弱解
浅谈正项有界周期数列的一些性质
出借车辆,五种情形下须担责