黄益生,罗飞来
(三明学院信息工程学院,福建三明365004)
矩阵空间Mn(F)上一类线性变换的不动点
黄益生,罗飞来
(三明学院信息工程学院,福建三明365004)
讨论由数域F上的一个n阶方阵A所决定的线性变换DA∶Mn(F)→Mn(F),X→AX-XA的不动点。主要结果如下:(1)由DA的全体不动点组成的集合构成矩阵空间Mn(F)的一个子空间,并且这个子空间中的每一个矩阵都是幂零矩阵;(2)如果A是可对角化矩阵,那么由DA的不动点组成的子空间,其维数不超过ψ(n),这里n≥2,并且当n为奇数时,ψ(n)=1/4(n2-1),当n为偶数时,ψ(n)=1/4n2;(3)如果m=p1q1+p2q2+…+psqs且p1+q1+p2+q2+…+ps+ qs≤n,那么存在一个一个n阶方阵A,使得由DA的不动点组成的子空间,其维数等于m,这里p1,q1,p2,q2,…,ps,qs都是正整数;(4)如果DA是矩阵空间Mn(C)上的线性变换,那么DA有非零不动点当且仅当存在A的两个特征值,其差等于1,这里n≥2,并且C表示复数域。
线性变换;不动点;矩阵方程;幂零矩阵
高等代数教材中一道习题可以叙述为[1]设A是复数域F上的一个n阶方阵,令DA是下列映射:
则DA是矩阵空间Mn(F)上的一个线性变换,并且下列公式成立:
这里Mn(F)表示数域F上全体n阶方阵组成的集合。这个公式类似于微积分中的导数公式
由此线性变换DA应该具有一些性质。例如,在微积分中有莱布尼兹公式
由此称DA为数域F上由方阵A所决定的莱布尼兹变换。
从上面的分析不难看出,探讨莱布尼兹变换是有意义的。但是经查阅各种文献,未发现有关这类变换的资料,因此本文尝试讨论这类变换的不动点,这里DA的一个不动点X0指的是使等式DA(X)=X成立的数域F上的一个n阶方阵X0。本文主要结果如下:
(1)由DA的全体不动点组成的集合构成矩阵空间Mn(F)的一个子空间,并且这个子空间中每一个矩阵都是幂零矩阵;
(2)如果A是可对角化矩阵,那么有DA的不动点组成的子空间,其维数不超过ψ(n),这里n≥2,并且当n为奇数时,ψ(n)=1/4(n2-1),当n为偶数时,ψ(n)=1/4n2;
(3)如果m=p1q1+p2q1+…+psqs且p1+q1+p2+q2+…+ps+qs≤n,那么存在一个n阶方阵A,使得由DA的不动点组成的子空间,其维数等于m,这里p1,q1,p2,q2…ps,qs都是正整数;
(4)如果DA是矩阵空间Mn(C)上的线性变换,那么DA由非零不动点当且仅当存在A的两个特征值,其差等于1,这里n≥2,并且C表示复数域。
本文讨论中引用文献[1]中一些熟知的术语和结论,不再另加说明。首先证明命题1。命题1随意选取n个复数x1,x2,…xn(n≥2),可以构造一个数表如下:
表中可能有一些数等于1,而且当x1,x2,…xn变化时,表中出现1的那些数的个数也会发生变化。令ψ(n)表示表中出现1的个数的最大值,则
证明:显然ψ(n)的开头几个值为ψ(2)=1,ψ(3)=2,ψ(4)=4等。当n为奇数时,由
有ψ(n-1)<ψ(n)。类似地,当n为偶数时,也有ψ(n-1)<ψ(n)。
下面对n作数学归纳法。当n=2时,表中只有1行1列。取x1=1且x2=0,有x1-x2=1,所以ψ(2)= 1,结论成立。假定n>2,并且对n-1的情形结论成立。下面考虑n的情形。显然上面的数表一共有n-1行n-1列。如果表中最后一列不全为1,那么表中出现1的个数与前n-2列中出现1的个数相同。根据归纳假定,表中出现1的个数不超过ψ(n-1),因而不超过ψ(n)。假定最后一列出现1,不妨假定这一列前k个数都是1,其余的都不是1(这样假定不会失去一般性,因为x1,x2,…xn这n个数可以随意选取),那么x1=x2=…=xk,并且xk+1,xk+2,…xn-1都不等于x1。于是前k-1列中的数都是零,因而这个数表可以改写如下:
注意到x1-xn=x2-xn=…=xk-xn=1,因此前k行中一共出现k×(n-k)个1。再注意到xk+1,xk+2,…xn-1都不等于x1,如果让xk+1,xk+2,…,xn-1都等于xn,那么后(n-1)-k行中不出现1。令f(k)表示表中出现1的个数,则
现在容易看出,若n是奇数,则当k=1/2(n-1)或k=1/2(n+1)时,f(k)达到最大值1/4(n2-1)。若n是偶数,则当k=1/2n时,f(k)达到最大值1/4n2。另一方面,如果xk+1,xk+2,…,xn-1中有一个不等于xn,比如说,xn-1≠xn,那么不论k取何值,除第n-2列外,表中其余的列与上一步中相应的列是一样的,而第n-2列中前k个数都不是1,后(n-2)-k个数都是1,因此表中出现1的个数为
显然,这个数不超过1/4(n2-1)或1/4n2。如果xk+1,xk+2,…xn-1中有多个不等于xn,仿照上面的讨论可证表中出现1的个数也不超过1/4(n2-1)或1/4n2。因此表中出现1的最大值为
上面的表中可能出现一些数等于-1。此时,只需改变x1,x2,…,xn的下标编号,也就是对这n个数进行重新排列,就可以保证表中的数都不等于-1。事实上,在实数的范围内,如果这n个数按从大到小的顺序进行排列,那么表中就不会出现负数,因而不出现-1。在复数范围内,注意到两个数的差为实数时,这两个数的虚部必相同,因此只需考虑x1,x2,…,xn这n个数的实部,让实部大的数排在实部小的数的前面。如果其中有两个数,它们的实部相同,但虚部不同,那么可以随意选取其中的一个排在另一个的前面。容易看出,按照这样的方法对这n个数进行重新排列后,可以保证表中的数不出现-1。再注意到xi-xj与xj-xi只相差一个符号。根据命题1,推论1成立。
推论1设x1,x2,…,xn是n个复数(n≥2)。令aij=xi-xj,i,j=1,2,…,n,并令A=(aij),则矩阵A的n2个元素中不超过ψ(n)个1,这里当n为奇数时,ψ(n)=1/4(n2-1);当n为偶数时ψ(n)=1/4n2。
本节讨论莱布尼兹变换的不动点。设A是数域F上的一个n阶方阵。根据本文开头的说明,由A所决定的莱布尼兹变换DA是Mn(F)上的线性变换。已知每一个线性变换都把零向量变成零向量,那么DA(O)=O,所以n阶零矩阵O是DA的一个不动点。为了便于叙述,DA的其余不动点(如果存在的话)称为非零不动点。
令X0是DA的一个不动点,则DA(X0)=X0。因为DA是下列映射:
所以DA(X0)=AX0-X0A,因此AX0-X0A=X0,故X0是数域F上的矩阵方程AX-XA=X的一个解。反之,如果X0是该矩阵方程的一个解,容易验证它是DA的一个不动点。这就得到:
命题2设A是数域F上的一个n阶方阵。令DA是由A所决定的莱布尼兹变换,则由DA的全体不动点组成的集合就是矩阵方程AX-XA=X的解集。特别地,DA有非零不动点当且仅当这个矩阵方程有非零解。
根据命题2,可以把讨论莱布尼兹变换DA的不动点问题,转向讨论矩阵方程AX-XA=X的解的相应问题。不难看出,这样的矩阵方程是数域F上的一个n2元齐次线性方程组,因而它的解集构成矩阵空间Mn(F)的一个子空间,称为矩阵方程AX-XA=X的解空间。这个事实可以用不动点的语言叙述如下:由DA的全体不动点组成的集合构成Mn(F)的一个子空间,称为DA的不动点空间。
命题3设A,B∈Mn(F)。如果A相似于B,那么矩阵方程AX-XA=X有非零解当且仅当矩阵方程BY-YB=Y有非零解,并且这两个矩阵方程的解空间有相同的维数。
证明:已知A相似于B,那么存在数域F上的一个n阶可逆矩阵T,使得B=T-1AT。设矩阵方程AX-XA=X有一个非零解X0,则AX0-X0A=X0,所以
令Y0=T-1X0T,则Y0≠0,并且由B=T-1AT,得到BY0-Y0B=Y0,因此Y0是矩阵方程BY-YB=Y的一个非零解。类似地,可以证明,如果Y0是矩阵方程BY-YB=Y的一个非零解,那么X0是矩阵方程AXXA=X的一个非零解,这里X0=TY0T-1。这就证明了命题3的前半部分。
下面证明命题3的后半部分。根据前面的讨论,如果矩阵方程AX-XA=X只有零解,那么矩阵方程BY-YB=Y也只有零解,因此这两个矩阵方程的解空间的维数都等于零。不妨设AX-XA=X有非零解,并设X1,X2,…,Xr是它的解空间W的一个基。令Yi=T-1XiT,其中i=1,2,…,r。根据前面的讨论,Y1,Y2,…,Yr是矩阵方程BY-YB=Y的r个解。设
分别用T和T-1去左乘和右乘上式两边,得
已知Yi=T-1XiT,那么Xi=T-1YiT(i=1,2,…,r),所以
又已知X1,X2,…,Xr是它的解空间W的一个基,那么k1,k2,…,kr只能全为零。另一方面,设Y0是矩阵方程BY-YB=Y的一个解。根据前面的讨论,TY0T-1是矩阵方程AX-XA=X的一个解,因而它可以由解空间W的基X1,X2,…,Xr线性表示,即存在a1,a2,…,ar∈F,使得
分别用T-1和T去左乘和右乘上式两边,得
从而由Yi=T-1XiT(i=1,2,…,r),有
即Y0可由向量组Y1,Y2,…,Yr线性表示。这就证明了Y1,Y2,…,Yr是矩阵方程BY-YB=Y的解空间的一个基,因此所给两个矩阵方程的解空间,其维数都等于r。
根据命题3的证明和命题2,可以求出莱布尼兹变换的不动点空间。
再解线性方程组(2I-A)x→=-η2(这里x→=(x1,x2,x3,x4)′),即
的解为k1E23+k2E41,k1,k2∈F,这里Eij表示第i行第j列元素为1,其余元素全为零的4阶方阵。根据命题3的证明,矩阵方程AX-XA=X的解为T(k1E23+k2E41)T-1,k1,k2∈F。根据命题2,DA的不动点空间为{T(k1E23+k2E41)T-1│k1,k2∈F},即
对于可对角化的n阶方阵,莱布尼兹变换具有下列性质。
命题4设A是数域F上的一个n阶方阵(n≥2)。令W是由A所决定的莱布尼兹变换DA的不动点空间。如果A是可对角化的,那么
(1)DA有非零不动点当且仅当存在A的一对特征值,其差等于1;
(2)W的维数等于A的特征值中,差为1的特征值的对数;
(3)W的维数不超过ψ(n),这里当n为奇数时,ψ(n)=1/4(n2-1);当n为偶数时,ψ(n)=1/4n2。
证明:已知A是可对角化的,那么A的特征值多项式的n个根λ1,λ2,…,λn恰好是它的全部特征值。于是A(在数域F上)相似于对角矩阵D,这里D=diag{λ1,λ2,…,λn}。下面考虑方程DY-YD=Y。令Y=(yij),则这个矩阵方程可以改写成
由此可见,矩阵方程DY-YD=Y满足下列n2元齐次线性方程组:
反过来,以这个方程组的解作为元素的矩阵也满足上述矩阵方程。
现在,容易看出,下列两个结论同时成立:当且仅当存在A的一对特征值,比如说λi0与λj0,使得λi0-λj0-1=0(即λi0与λj0之差等于1)时,矩阵方程DY-YD=Y有非零解;上述线性方程组的自由未知量个数,也就是矩阵方程DY-YD=Y的解空间的维数,等于A的特征值中,差为1的特征值的对数。其次,根据推论1,下列结论也成立:矩阵方程DY-YD=Y的解空间的维数不超过ψ(n)。于是,由命题2和命题3可见,命题4的3个结论都成立。
命题5设m是一个正整数,如果存在正整数p1,q1,p2,q2,…,ps,qs,使得m=p1q1+p2q2+…+psqs且p1+ q1+p2+q2+…+ps+qs≤n,那么存在数域F上的一个n阶方阵A,使得DA的不动点空间的维数等于m。
证明:为了便于书写,只证存在两对正整数p1,q1与p2,q2的情形。类似的方法可证一般情形。已知m=p1q1+p2q2且p1+q1+p2+q2≤n,那么可设λ1=λ2=…=λp1=1,λp1+1=…=λp1+q1=0,λp1+q1+1=…=λp1+q1+p2=4,λp1+q1+p2+1=…=λp1+q1+p2+q2=3,λp1+q1+p2+q2+1=…=λn=6(当p1+q1+p2+q2<n)。于是当1≤i≤p1且p1+1≤j≤p1+q1时,有λi-λj=1-0=1。这样的差一共有p1×q1个。当p1+q1+1≤i≤p1+q1+p2且p1+q1+p2+1≤j≤p1+q1+p2+ q2时,有λi-λj=4-3=1。这样的差一共有p2×q2个。容易看出,其余的每一个差λi-λj只能是下列12个数之一:0,-1,±2,±3,±4,±5,±6。令A=diag{λ1,λ2,…,λn},则A是数域F上的一个n阶可对角化矩阵们并且它的n个特征值为λ1,λ2,…,λn。根据上面的讨论,这n个特征值中,差为1的特征值对数为p1×q1+p2×q2个。注意到m=p1q1+p2q2,因此差为1的特征值对数为m。根据命题4,DA的不动点空间的维数等于m。
设n≥2。并且当n为奇数时,ψ(n)=1/4(n2-1),即ψ(n)=(n-1)/2×(n+1)/2。显然,(n-1)/2与(n+1)/2都是正整数,并且(n-1)/2×(n+1)/2≤n。又已知当n为偶数时,ψ(n)=1/4n2,即ψ(n)=n/2×n/2。显然n/2是正整数,并且n/2+n/2≤n。因此作为命题5的特殊情形,存在数域F上的一个n阶对角化矩阵,使得DA的不动点空间的维数等于ψ(n)。
例2容易计算除11外,介于1和12之间的每一个正整数m,或者可以分解成一对正整数的p1,q1的乘积p1q1,其中p1+q1≤7,或者可以分解成两队正整数p1,q1和p2,q2的乘积之和p1q1+p2q2,其中p1+q1+p2+q2≤7。计算结果如下:
表中Δ代表m的分解式,Σ代表分解式中的所有因数之和,根据命题5,由数域F上的7阶方阵所决定的莱布尼兹变换,其不动点空间(含零空间)可能的维数,至少有12种。
在文献[2]中,作者证明了幂零矩阵的一个等价条件,即“复数域上的一个n阶方阵A是幂零的当且仅当存在复数域上的一个n阶方阵B,使得等式AB-BA=A成立”。显然,如果A是幂零的,那么-A也是幂零的,反之亦然。令X=-A,并令B=A,则上面的等式变成AX-XA=X,这表明,复数域上满足最后一个等式的每一个n阶方阵X是一个幂零矩阵。如果最后一个等式中的A和X都是复数域F上的n阶方阵,由于数域F上的矩阵也可以看作复数域上的矩阵,因此X仍然是一个幂零矩阵。于是由命题2得到命题6。
命题6设A是数域F上的一个n阶方阵,则DA的每一个不动点是一个幂零矩阵。
由命题5和命题6立即得到推论2。
推论2设m=p1q1+p2q2+…+psqs,其中p1,q1,p2,q2,…,ps,qs都是正整数。如果p1+q1+p2+q2+…+ps+ qs≤n,那么存在矩阵空间Mn(F)的一个m维子空间W,使得W中的每一个矩阵都是幂零的。
命题7设A是复数域上的一个n阶方阵(n≥2),则DA有非零不动点当且仅当存在A的两个特征值,其差等于1。
证明:设A的约当标准形为J=diag{J(λ1,r1),J(λ2,r2),…,J(λs,rs)},其中J(λi,ri)表示主对角线上元素全为λi的ri阶约当块,即
那么r1+r2+…+rs=n,并且每一个λi是A的一个特征值。为了便于书写,把J(λi,ri)简记为Ji。已知A相似于J。根据命题2和命题3,只需证明,矩阵方程JY-YJ=J有非零解当且仅当存在A的两个特征值,其差等于1。事实上,把Y表示成s个块行s个块列的分块矩阵(Yij),其中每一个Yij是一个ri×rj型小矩阵(i,j=1,2,…,s),那么上述矩阵方程就是
由此可见,矩阵方程JY-YJ=J等价于s2个矩阵方程组组成的方程组:JiYij-YijJj=Yij,i,j=1,2,…,s。
现在,假定存在A的两个特征值ri0≤rj0,使得λi0-λj0=1,并假定约当块Ji0的阶数ri0不超过Jj0的阶数rj0,即ri0≤rj0。构造一个分块矩阵Y0如下:其阶数等于n,分法与上述分块矩阵Y的分法一致,其中的小矩阵,除Yi0j0外,其余的全为零矩阵,而Yi0j0=(Iri0,0),这里Iri0是ri0阶单位矩阵,0是ri0×(rj0-ri0)型零矩阵;当ri0=rj0时,Yi0j0就是单位矩阵Iri0。显然,Y0≠0,我们断言Y0是矩阵方程JY-YJ=Y的一个非零解。事实上,根据Y0的构造,当i≠i0或j≠j0时,Y0中的小矩阵Yij是零矩阵。此时等式JiYij-YijJi=Yij当然成立。下面证明等式Ji0Yi0j0-Yi0j0Jj0=Yi0j0也成立。令B1是由Jj0的前ri0行组成的小矩阵,B2是由剩下的行组成的小矩阵,那么由B1的前ri0列组成的小矩阵就是主对角线上元素全为λj的ri0阶约当块,并且剩下的rj0-ri0列元素全为零,所以B1=(J(λj0,ri0),0)。于是,由Yi0j0=(Iri0,0),有
注意到Ji0=J(λi0,ri0)且B1=(J(λj0,ri0),0),因此(Ji0,0)-B1=(J(λi0,ri0),0)-(J(λj0,ri0),0)=((λi0-λj0)Iri0,0)。再加上λi0-λj0=1且(Iri0,0)=Yi0j0,得到((λi0-λj0)Iri0,0)=Yi0j0,由此可见,等式Ji0Yi0j0-Yi0j0Jj0=Yi0j0成立。这就证实了上述断言,即Y0是矩阵方程JY-YJ=J的一个非零解。
其次,假定对A的任意两个特征值λi和λj,等式λi-λj=1都不成立(i,j=1,2,…,s)。为了便于书写,把小矩阵Yij中的第k行第l列元素记作ykl(k=1,2,…,ri;l=1,2,…,rj),并把Yij的行数ri和列数rj分别记作p和q,那么矩阵方程JiYij-YijJj=Yij可以改写成
上式等号左边等于
考察等号两边第1行元素,不难看出,下列q个等式都成立:(λi-λj)y11-y11=y11,…,(λi-λj)y1,q-1-y1q=y1,q-1, (λi-λj)y1,q=y1,q。因为λi-λj≠1,由最后一个等式,有y1,q=0,从而由倒数第二个等式,得y1,q-1=0。如此依次往前推,Yij的第1行元素全为零,这样一来,又可以推出Yij的第2行元素全为零。重复这种方法,最终可以推出,小矩阵Yij是零矩阵。这就证明了,矩阵方程JiYij-YijJj=Yij只有零解(i,j=1,2,…,s),因此矩阵方程JY-YJ=Y也只有零解。
综上所述,矩阵方程JY-YJ=Y有非零解当且仅当存在A的两个特征值,其差等于1。
例3设A是复数域上的一个3阶方阵。如果A可对角化,那么DA的不动点空间的维数只能为0,1或2;如果A不可对角化,那么DA的不动点空间的维数只能为0或1。
事实上由于A是复数域上的3阶方阵,它的特征值多项式的3个根都是特征值。这3个特征值中,有可能任意一对的差都不等于1,也有可能只有一对或者两对的差等于1。由于ψ(3)=2,根据推论1,不可能有超过两对的差等于1。根据命题4,如果A可对角化,那么DA的不动点空间的维数只能为0,1,或2。其次,如果A不可对角化,那么它的特征多项式的3个根不可能都是单根,所以A
由此可见y11=y23=y22=y33=y32=0,并且(λ-μ)y12-y13=y12,(λ-μ)y13=y13,(μ-λ)y21=y21,y21+(μ-λ)y31=y31。
现在,如果λ-μ=1,容易看出y13=y21=y31=0,所以只有y12是自由未知量,因此矩阵方程JY-YJ=Y的解为kE12,k∈C。如果μ-λ=1,同样的方法可以求出,这个矩阵方程的解为kE31,k∈C。这就证明了,矩阵方程JY-YJ=Y的解空间的维数等于1。根据命题2和命题3,DA的不动点空间的维数也等于1。
[1]张禾瑞,郝鈵新.高等代数[M].4版.北京:高等教育出版社,1999.
[2]黄益生,黄真珠.幂零矩阵的一个等价条件[J].三明学院学报,2012,29(4):1-5.
Fixed Points of a Class of Linear Transformations on Space Mn(F)of Matrices
HUANG Yi-sheng,LUO Fei-lai
(School of Information Engineering,Sanming College,Sanming 365004 China)
In this paper,we discuss the fixed points of the linear transformation DA∶Mn(F)→Mn(F),X→AX-XA determined by a square matrices A with order n over a number field F.The main results are ai follews:(1)the set consisting of the whole fixed points of DAis a subspace of the Mn(F)of matrices,and every matrix in such a subspace is nilpotent;(2)if A is a diagonalizable matrix,the dimension if the subspace consisting of the fixed points of DAis not more than ψ(n)where n≥2,and ψ(n)=1/4(n2-1)if n is odd,and ψ(n)=1/4n2if n is even;(3)if m=p1q1+p2q2+…+psqsand p1+q1+p2+q2+…+ps+ qs≤n,there is a square matrix A with order n,such that the dimension of the subspace consisting of the fixed points of DAis equal to m,where p1,q1,p2,q2,…,ps,qsare positice integers;(4)if DAis a linear transformation on the space Mn(C)of matrices, DAhas nonzero fixed points if and only if there are two eigenvalues of A,whose difference is equal to 1,where n≥2,and C denotes the field of complex numbers.
linear transformation;fixed point;matrix equation;nilpotent matrix
O241.6
A
1673-4343(2013)06-0017-09
2013-08-20
福建省教育厅高等学校教学质量工程资助项目(ZL0902/TZ(SJ))
黄益生,男,福建龙岩人,教授。研究方向:代数。