张立溥 徐光辉
(浙江林学院理学院,浙江临安 311300)
高等代数和解析几何作为信息与计算科学专业的两门主要的基础课,其重要性是毋庸置疑的。在国内的重点大学以及一些具有悠久数学传统的高校中,信息与计算科学专业基本上都是按照以前的计算数学模式来进行教学,这两门课程都是沿袭着传统的设置,按照两门课程来进行教学。
随着高等教育的发展,针对一些普通院校,尤其是数学专业设立不久的院校来说,信息与计算科学专业都是在逐步的完善和发展,针对这两门基础课都相继开始了针对性的改革。部分重点院校已经在自身原有的基础上进行了创新和改革,比如华东师范大学,成都电子科技大学等都已经把这两门课程进行了整合。但是针对林业院校的专业设置,以及招生的学生特点,全部照搬重点大学的课程改革是不符合真实情况的,因此如何在浙江林学院的信息与计算科学专业中对这两门课程进行整合时需要进一步研究的。
考虑如下模型的最优解:
其中 A 是m×n 矩阵,秩为 m,C,x 属于Rn,b 属于Rm
上述问题称为线性规划问题,求解这类问题我们可以用著名的障碍函数法。首先我们构造一个对数障碍函数,原模型转化为:
在求解之前,我们先引出一个引理:
引理1 [2 ](Kuhn-Tucher 条件,简称 KKT条件)
对于模型
若f,gi,hj均可微且▽gi(x*),i ∈{i|gi(x*)=0},▽hj(x*),j =1 ,2 ,…l 线性无关,则x*为模型最优解的必要条件为:存在相应的λ*和μ*使
下面我们来推导优化模型(2)的KKT条件,即最优解x*所满足的条件。由优化模型(2),f(x)的梯度为 ▽f(x)=C-μx-1,其 Hessian 矩阵为 Hess(x)=μx-2,很明显,Hessian 矩阵对于任何x∈Rn都是正定的,因此f(x)在Rn上是严格凸函数。
为方便推导,我们先引出几个代数定理:
引理2[4]f:D→R 为一个可微函数,D⊆Rn是开集,C 为D 的一个开凸子集,f 在C 上为凸函数,L 为包含C 的子空间,则x*∈C 为极小值点当且仅当▽f(x*)⊥L.
下面我们综合应用基本的解析几何知识和高等代数知识来求解优化模型(1)。
引理3[3]线性空间
定理1 对于优化模型(2),在最优点处满足,c-μx-1⊥LN(A),这里 N(A)为矩阵 A 的核空间。
证明:由优化模型(2)和引理1 ,引理2 得
▽f(x)⊥ {x|Ax =b}
∵{x|Ax =b}平行N(A)= {x|Ax =0}
∴▽f(x)⊥N(A)
即c -μx-1⊥ N(A)
证毕
定理2:矩阵A的行所组成的空间与A 的核空间是正交的。
证明A的行所组成的空间可以表示为:
ATy,y ∈Rm,m 为A 的行数
∵(ATy)Tx =yTAx,Ax =0
∴ATy ⊥N(A)证毕
由定理1 、2 可得∃y′,有C-μx-1=ATy′,令s =μx-1即xs =μe,整理得到:以上条件便是模型(1)的KKT 条件。该条件指出,对应每一个 μ,都可得到一组 x(μ),y(μ),s(μ),当μ→0时,x(μ)→x*,y(μ)→y*,s(μ)→s*。
因此可以得到最优解x*处的K-K-T条件:
上述K-T-T条件的推导过程用到了高等代数的矩阵、线性空间的基本知识。由上述推导过程可以看出,我们综合应用高等代数、解析几何的相关知识去求解一个优化模型,可以相对简单的得到K-K-T条件,从本质上看,高等代数的线性空间其实是解析几何空间的推广,从一维推广到多维,甚至是无限维,但是其本质没有发生根本改变。解析几何是以高等代数为主要工具的几何学,解析几何又反过来为高等代数提供了几何背景,促进高等代数的发展。因此,将两者融合起来教学具有重要意义。
1 北京大学几何与代数小组编.高等代数[M](第二版).高等教育出版社,1991.
2 丘维声.高等代数(上、下)[M].高等教育出版社,1996.
3 吕林根 许子道.解析几何[M].高等教育出版社,2001 年(第3 版).
4 施光燕 钱伟懿 庞丽萍.最优化方法[M].高等教育出版社,2007 年
5 C Roos ,T Terlaky,JP Vial ,Theory and Algorithms for Linear Optimization:An interior point approach,1997 ,Wiley