卢里举
[摘 要] 首先,从二次型多项式的正定性判别出发,研究二次型的极值問题,得到正交变换可保驻点和极值点不变性,并从理论上解决了一般二次函数转化为二次型问题;其次,采用泰勒展开法,将多元函数在驻点处进行二阶泰勒展开,并考查系数矩阵的定性,并依此得到极值判定的充分条件;最后,给出该方法在多元线性回归中计算回归系数的应用.
[关 键 词] 二次型;正(负)定;二次多项式;极值判定;泰勒展开;多元线性回归
[中图分类号] G712 [文献标志码] A [文章编号] 2096-0603(2018)27-0148-02
一、二次型的极值
在线性代数理论中,采用的正交变换使一般二次型多项式成为标准化.而正交变换保证了保角和保长的性质,这表明函数在表示几何曲面的意义下,通过正交变换,能保持曲面几何不变性,只是在位置上发生一定的变化,同时,在标准形式下,更容易分析曲面的几何性质.事实上,在代数形态下,函数的某些形态也具有不变性,在二次型的极值研究中,正交变换还具有保驻点不变和保极值点不变的性质.二次型标准化的形式为:
f(x)=f(x1,…,xn)=■aiixi2+2■aijxixj=xAxT=■λiyi2
注意到,如果特征根全为正,其标准型存在唯一的极值点(也是最小值点)y=0.于是函数f(x)的最小值点为:0=y=xP,由正交变换的可逆性,于是x=0.
关于二次型的定性和极值点的判别:
1.系数矩阵是正定(负定)的,特征根全为正(负),此时函数存在唯一的极值点x=0,也是最小(大)值点.
2.系数矩阵是未定型的,同时存在正的和负的特征根,此时函数存在驻点x=0,但驻点不是极值点,因此,函数不存在极值点;事实上,不妨设标准化中的第一二两个特征根分别为正数和负数,那么,第一、二分量的0的邻域内,函数取值既有正数和负数,而f(0)=0.
3.系数矩阵是半正定(负定)的,此时,特征根为0或者是正(负)的,并且由矩阵论可知正特征根的个数为系数矩阵的秩,那么函数存在极值点,也是最小(大)值点,这些极值点构成超平面S,其维数满足r(S)=n-r(A);事实上,不妨设λ1,…,λK>0,k=r(A),在标准型中,只要取?坌y1,…,yk=0,yk+1,…,yn≠0,f(x)=0其对应的x≠0,并且构成的空间S维数为r(S)=n-r(A).
二、二次型的平移与二次多项式
对二次型函数的研究,还可以将之一般化,考虑对二次型函数采用平移变换,得到形式:
f(x)=f(x1,…,xn)=■aii(xi-xi0)2+2■aij(xi-xi0)(xj-xj0)
=■aii(xi2-2xixi0+xi02)+2■aij(xixj-xi0xj-xixj0+xi0xj0)
=■aiixi2+2■aijxixj-2■bixi-2■cjxj+d
其极值点的存在性,可与标准二次型的极值进行类比讨论,决定因素依然是系数矩阵的定性.比如,在系数系数矩阵的特征根全为正(负)的,函数存在唯一的极值点x0=(x10,…,xn0).
由线性方程的性质知:一般二次型函数通过平移,能化为二次型的充要条件是二次函数存在驻点.针对一般形式,其平移为二次型的做法就是,对存在驻点的,先求解驻点,再将之改写为二次型,而对驻点不存在的,则不能改写为二次型.
比如:f(x,y)=x2+y2+2xy+4x+2y,满足fx=2x+2y+4=0及fy=2y+2x+2=0的点不存在,故而该函数不能写成标准二次型.另外,如果该函数能写成二次型形式:f(x,y)=(x-a)2+(y-b)2+
k(x-a)(y-b),将其展开,并比较系数得k=2,a+b=-2,并且a+b=-1,这是不可能的,或者说关于待定常数a,b是无解的,这也表明该函数不能写成标准二次型.
以上研究表明,不是任意的一般二次函数形式,都能改写成标准二次型形式,只有在一定的条件下方可标准化.那么,怎样的条件,可保证标准化?事实上,存在驻点的一般二次函数就具有这种特征.设一般二次函数f(x)=f(x1,…,xn)=■aiixi2+■aijxixj-■bixi+d,令■=2aiixi+■aijxj-bi=0,记系数矩阵列向量αi=(■aij,■aij,…,2aii,…,■aij)T,β=(b1,b2…,bn)T,那么,由线性方程解存在的条件可知,存在驻点的充要条件是系数矩阵的秩与系数增广矩阵的秩相等,即r(α1,…,αn)=r(α1,…,αn,β)=m同时,如果m=n,此时驻点是唯一的;如果m 例如f(x,y)=x2+2y2+4xy+2x+4y,满足fx=2x+4y+2=0及fy=4y+4x+4=0,得到驻点为(-1,0),故而该函数可写成二次型f(x,y)=(x+1)2+2y2+4(x+1)y-1. 三、多元函数的二次型展开与极值判定 在二元函数极值的问题研究中,众多文献均给出了极值判定的充分条件.其依据是建立在对二元函数的二阶泰勒展开,同时,给出在系数矩阵的正(负)定时,极值的判别.以下将针对更高维度的多元函数的极值给出判定方法,并指出相应的理论依据.
对于元多函数f(x)=f(x1,…,xn).如果存在x0=(x10,…,xn0)使得■|■=0,即存在駐点,记二阶偏导数为fij(x0)=■|■=aij,并且二阶偏导数均连续.那么函数在驻点处可以写成二阶泰勒形式:f(x)=f(x0)+■(■aii(xi-xi0)2+2■aij(xi-xi0)(xj-xj0))+o(ρ),其中ρ表示点到驻点的欧氏距离.考虑到混合偏导数相等,于是,关于极值的判定矩阵可表示为:Δ=(aij)(n×n),其定性可以通过特征根的计算,或者采用顺序主子式的计算得以实现.同时,如果涉及多个驻点的,要分别给予判别.
结论:(1)Δ是正定(负定)的,特征根全为正(负),此时函数存在极小值点;(2)Δ是未定型的,同时存在正的和负的特征根,此时驻点不是极值点;(3)Δ是半正定(负定)的,此时,特征根为0或者是正(负)的,并且由矩阵论可知正特征根的个数为系数矩阵的秩,那么函数存在极值点,这些极值点构成超平面S,其维数满足r(S)=n-r(A).如此,再将二元函数的极值问题推广为更多元函数时,其判别思路不是简单的性质平移,而是要从矩阵的定性来进行思考.
在实际操作中,涉及极值的求解与判断中,还可以考虑变量之间的线性不相关的性质.在一般二次型中,如果某个分量xk0在驻点x0=(x10,…,xn0)处满足akj=0(j≠k).称该分量与其他分量线性不相关.故对于此项而言,其极值的问题的研究可以单独进行考虑.同样地,对于一般多元函数问题,如果在有分量xk0驻点满足fkj(x0)=■|■=akj=0(j≠k),称该分量在驻点处与其他分量线性不相关,此时,影响判定矩阵定性的,仅仅为其二阶纯偏导数的符号,其值表现为判定矩阵的特征根之一.
四、多元函数极值的应用
在统计学中,利用最小二乘法原理,对一元线性回归方程中的系数进行求解,即认为最优的拟合直线应该满足实际测量值与回归直线相应点处的平方和(绝对偏差)最小.其数学模型表现为:min=■(yi-a(xi+b))2,其中y=ax+b为直线回归方程,a,b为所求的系数.关于回归系数的存在性,可以通过以下二次型理论证明.事实上,这是关于变量a,b的二次型,由最小二乘法目标函数知,该函数是正定的,因此,存在极小值点(唯一的),只要求出驻点即可.
那么,对于多元线性回归,其中回归方程的系数依然可采用此法,即系数满足实际测定值与回归方程相应点的平方和最小,此时,相应的数学模型可以描述为:min=w=■(uj-(■aixij+c))2,其中u=■aixi+c为回归方程,a1,a2,…,ap,c为所求的系数.这是关于变量a1,a2,.…,ap,c的二次型,且是正定的,因此,存在极小值点(唯一的),只要求出驻点即可.由驻点的性质:■=0=■,于是,驻点满足线性方程组:
■
对此,采用线性方程的克莱姆法则即可求出各参数的值.
在多元统计线性回归操作中,在实际问题处理中,还需要对变量之间的相关程度展开研究,认为具有高相关程度的两个变量进行合并,以减少回归系数的运算.同时,也保证了驻点方程解的唯一性.
另外,需要说明的是,在回归系数的求解中,以上所给出的是它的理论计算,在实际应用中,往往采用科学计算进行实现.可采用专业的数学软件,以完成相关的计算.与此同时,在线性回归中,还需要对回归的优度进行检验,关于此,本文未给予统计理论方面的解释.
参考文献:
[1]赵泽福.多元函数极值的应用分析[J].长春工业大学学报,2016,37(1):98-101.
[2]梁伟秋,尹小艳.二次型矩阵在多元可微函数极值问题的应用[J].高师理科学刊,2017(8).
[3]曹昭.多元线性回归系数的求解原理与矩阵初等变换的应用[J].统计与决策,2015(17):74-76
[4]徐阳栋.二次型在多元函数极值问题上的应用[J].教育教学论坛,2015(7).
[5]丘维声.高等代数[M].清华大学出版社,2010.
[6]林元重.新编数学分析[M].武汉大学出版社,2015.