一类三对角矩阵特征对的分段快速算法

2014-07-31 08:05唐达

上海电机学院学报 2014年2期

唐达

（上海电机学院数理教学部，上海201306）

在许多科学与工程计算中，常需要计算矩阵的特征值。而对于对称矩阵，一般是将其约化为三对角矩阵后再求其特征值；另外，三对角矩阵的特征问题也常作为原始问题出现。因此，三对角矩阵的特征问题长期来为许多学者所关注，如美籍华人数学家顾明关于三对角矩阵分－治算法的研究成果［1］在SIAM第六届应用线性代数会议上获最佳论文。

当今，计算三对角矩阵特征问题的方法很多，有QL或 QR 算法［2］372－373［3－4］、二（多）分法［2］391－397［5－9］、分－治算法［2］391－397［1，7，10－11］、同伦法［7，12］以及其他的一些迭代算法［7，13］。其中，二（多）分法、分－治算法、同伦法等都能用于并行计算。

一般来讲，计算一个n阶三对角矩阵的n个特征对，其计算量总不小于O（n2）；而本文利用一类三对角矩阵特征对的局限性质，来计算大型非对称矩阵，其计算量仅为O（n）。本文的算法也非常适合并行计算，其并行效率较高。

1 三对角矩阵t向量的衰减性质

设A为n阶实三对角矩阵，t＝（t1，t2，…为n维实向量。若

式（1）中右端向量仅第n个分量w不为零，则称t为A所对应的t向量[14-15]。可以证明，对角占优三对角矩阵（i＝2，3，…，n）。也就是说，t向量之分量的绝对值是随i的减小而衰减的。实际上，除对角占优矩阵外，有很大一类三对角矩阵具有这种衰减性质。

考虑元素为正态分布N（0，1）上的随机三对角矩阵A，其t向量的平均增长率为

设n＝120，进行104次的计算，即样本容量为104，由此绘出的的频率密度直方图[16]如图1所示。由 MATLAB函数 mean及var可算得此时样本的均值为1.69，方差为0平.0均3 11 6／1。.6由9此的可速知率，衰在减这。种情况下将以

图1 频率密度直方图Fig.1 Frequency histogram

若随机矩阵A的元素为（0，1）上均匀分布的随机数，则用与上述相同方法可算得的均值为1.40，方差为0.016 5，故此时t向量旳衰减率比上述要低。

以上所述，t向量是从矩阵A的左上方计算到右下方。若t向量是从矩阵A的右下方计算到左上方，即式（1）右端向量的第1个分量变为w、第n个分量变为零，由于A是随机矩阵，故此时的均值及方差均不变。

2 一类三对角矩阵特征对的局限性质

仍以元素服从N（0，1）分布的随机三对角矩阵A为例，设n＝1 000。若任意截取A中一段n1＝200阶的子矩阵A1，则称A为主矩阵、A1为子矩阵。图2所示为A1的2个特征向量之分量的绝对值或模（取对数值）随分量下标i变化的曲线。特征向量之分量的绝对值或模也同t向量一样具有相同的衰减率。因此，由图2可见，特征向量曲线在其最大值处向两旁逐渐减小。其中曲线1在子矩阵A1的两端已衰减，接近于零，故曲线1所对应的A1的特征对也可近似地看做主矩阵的特征对，这就是特征对的局限性质。此时，要计算主矩阵A的特征对，可以由计算子矩阵A1的特征对取得；由于截断，曲线2在子段的左端特征向量的分量并不趋于零，故该曲线对应的特征对不能看做主矩阵的特征对。由此可见，子矩阵A1的特征对只有一部分是属于主矩阵A的。数值实验表明，此时A1中约有82%的特征值是属于A的。子矩阵的阶数越大，百分比越大；反之，越小。

图2 特征向量曲线Fig.2 Curve of eigenvector

除上述呈正态分布的随机矩阵外，服从均匀分布、t分布等的随机三对角矩阵及Wilkinson测试矩阵等其特征对也都具局限性质。在特征对具局限性质的三对角矩阵中，随机矩阵占大多数，而当今随机矩阵无论在理论上还是实用上都具有一定的价值[17-18]。

3 分段算法

本文将特征对具有局限性质的主矩阵A分成互相有重叠的k段，以形成子矩阵A1，A2，…，Ak；再从这些子矩阵的特征对中分离出属于主矩阵A的特征对，由此求得A的全部特征对。

从子矩阵的特征对中分离出n个属于主矩阵的特征对，而其计算量又要小于O（n2），是一件较困难的事。所用的软件功能不同，分离的方法也不尽一样。本文采用Matlab软件进行分离。

在图2中，可以把特征向量之分量绝对值或模最大处的下标i形象地看成其对应的特征值的位置。因此，分离特征值就是把每个子矩阵（子段）两端的特征值剔除，留下中间属于主矩阵的特征值。

假定将主矩阵A分成A1、A2、A33段有互相重叠部分的子矩阵。每段长度（阶数）为1.5m，其中，m为分段长参数，重叠部分为0.5m。再将主矩阵分成有互相重叠部分的B1、B22段，每段长度（阶数）为2.5m。主矩阵的长度（阶数）为3.5m，如图3所示。m的值不能太小，否则，分离出的特征值误差太大。如对于服从N（0，1）分布的随机三对角矩阵，m不应小于120。

图3 矩阵分段Fig.3 Piecewise matrix

先求出子矩阵A1、A2、B1的全部特征值，然后找出B1的特征值与A1、A2中数值最接近的2.5m个特征值，令这些特征值的集合为Ω1。Ω1中属于A1的特征值也应属于主矩阵A，记此集合为Λ1，则Ω1中属于A2的特征值的集合Λ2＝Ω1-Λ1。再求出子矩阵A2、A3与B2的全部特征值，找出B2的特征值与A2、A3中数值最接近的2.5m个特征值，记此集合为Ω2。Ω2中属于A3的特征值也应属于主矩阵A，记此集合为Λ4。Ω2中属于A2的特征值的集合Λ3＝Ω2-Λ4。再求Λ2与Λ3的交集Ψ1＝Λ2∩Λ3。Ψ1中的特征值也应属于主矩阵A。因此，集合Ψ＝Λ1＋Ψ1＋Λ4中的特征值就是主矩阵A中的3.5m个特征值。

Ψ中的特征值所对应的子矩阵的特征向量并不能作为主矩阵A的特征向量，因为特征向量衰减得较慢，若以此作为主矩阵的特征向量将带来较大误差。解决的办法是将每段1.5m的长度再向两端延长一些，在延长的子矩阵中求特征向量，这就可以近似地看作主矩阵的特征向量。

4 分段算法程序

假定将主矩阵A分段成k个子矩阵A1，A2，…，Ak，则有如上文所述特征值的计算层次，如图4所示。

图4 计算层次Fig.4 Computational hierarchy

先计算Ωi，将Ωi中属于2个子矩阵的特征值分成Λ2i-1、Λ2i2个集合，求Λ2i、Λ2i＋1的交集

Ψi＝Λ2i∩Λ2i＋1，i＝1，2，…，k-2

最后，集合

中的特征值就是主矩阵A的全部特征值。

算法程序是用MATLAB语言编写的，其中相关的函数参见文献[19] 。程序步骤如下：

（1）输入矩阵A、分段长参数m、分段数k、矩阵A的阶数n＝（k＋0.5）m以及为了精确计算特征向量而将子段端部延长的数值Δm；

（2）将A以1.5m的长度（阶数）分段成A1、A2、…、Akk个子矩阵，再以2.5m的长度分段成B1、B2、…、Bk-1k-1个子矩阵，各矩阵间的相互位置如图3所示；

（3）计算A1、A2及B1的特征值，利用dsearchn函数求出集合Ω1，利用find函数求出Λ1及Λ2；

（4）将子矩阵A1的右端延长Δm，以集合Λ1中的特征值用逆迭代法求其特征向量；

（5）Fori＝2∶k－1；

（6）计算Ai、Ai＋1、Bi的特征值，求出集合Ωi、Λ2i－1及Λ2i；

（7）利用intersect函数求出Λ2i－2、Λ2i－1的交集Ψi－1；

（8）将子矩阵Ai的两端延长Δm，以集合Ψi－1中的特征值用逆迭代法求其特征向量；

（9）end

（10）计算集合Λ2k－2；

（11）将子矩阵Ak的左端延长Δm，以集合Λ2k－2中的特征值用逆迭代法求其特征向量；

（12）输出用式（3）计算得到主矩阵A的n个特征值，以上算得的特征向量即为A的全部特征向量。

5 数值算例

本文算例使用的PC机CPU为AMD 2.59GB，内存2GB。用Matlab 7.12.0语言编程计算，共计算3例。

例1 元素服从N（0，1）分布的随机三对角矩阵，为非对称矩阵，其特征对可能是复数。其中，m＝120，Δm＝0.45m。

例2 元素服从N（0，1）中均匀分布的随机三对角矩阵，为对称矩阵。其中，m＝160，Δm＝0.45m。

例3 Wilkinson测试矩阵，其非对角元素均为1，对角元素依次为n／2＋1－i（i＝1，2，…，n）。其中，m＝100，Δm＝0.45m。

计算结果列于表1中。每个子矩阵的特征值用Matlab eig函数计算，而特征向量则用逆迭代法计算得到。例1与例2每例均重复计算10次，计算时间为10次的平均值；例3只计算1次。表中，ε为本文算法分段算得的特征值与Matlab eig函数算得的特征值之差的绝对值或模；e为本文算法算得的特征向量与Matlab eig函数算得的特征向量其对应的各分量之差的绝对值或模的最大值。

表1 算例的计算精度及计算时间Tab.1 Computation precision and consumed time for the examples

由表可见，计算精度是满意的，而计算时间仅供参考。由于同一个问题用Matlab内部函数计算要比用Matlab语言编程计算的速度约快300%～1 000%。但从表中可见，本文算法的计算用时与矩阵阶数n大致呈线性关系，而Matlab是用满矩阵求特征对的，故计算用时约与n3成比例。一般来讲，用QR迭代法或二分法计算三对角矩阵的特征值，其计算量为O（n2）。

6 结语

本文所述分段快速算法适合于大型非对称三对角矩阵，对n个特征对的计算复杂性仅为O（n），这是目前文献中不曾见的，只要矩阵的特征向量具局限性质，就能采用本文算法。从理论分析及算例均可见，计算具有较高精度。本文算法也非常适合并行计算。

[1] Gu Ming，Eisenstat S C.A divide-and-conquer algorithm for the symmetric tridiagonal eigenproblem[J] .SIAM Journal on Matrix Analysis and Application，1995，16（1）：172-191.

[2] Golub G H，Van Loan C F.矩阵计算[M] .袁亚湘译.3版.北京：人民邮电出版社，2011：372-373，391-397.

[3] 何光渝，高永利.Visual Fortran常用数值算法集[M] .北京：科学出版社，2002：357-363.

[4] 何渝.计算机常用数值算法与程序[M] .北京：人民邮电出版社，2003：137-140.

[5] Wilkinson J H.代数特征值问题[M] .石钟慈，邓健新，译.北京：科学出版社，2001：310-318.

[6] 曹志浩，张玉德，李瑞遐.矩阵计算和方程求根[M] .2版.北京：高等教育出版社，1984：159-177.

[7] 邓健新.解实对称矩阵特征值问题的并行算法[J] .数值计算与计算机应用，1997，18（4）：246-258.

[8] 刘艳红，吕全义.Jacobi矩阵特征值的并行算法[J] .纺织高校基础科学学报，2011，24（1）：21-25.

[9] Roopamala T D，Katti S K.Eigenvalue of tridiagonal matrix using Strum sequence and Gerschgorin theorem[J] .International Journal on Computer Science and Engineering，2011，3（12）：3722-3727.

[10] 罗晓广，李晓梅.求解对称三对角矩阵特征值的一种新的分而治之算法[J] .数值计算与计算机应用，1997，18（1）：74-80.

[11] Coakley Ed S，Rokhlin V.A fast divide-and-conquer algorithm for computing the spectra of real symmetric tridiagonal matrices[J] .Applied and Computational Harmonic Analysis，2013，34（3）：379-414.

[12] Brockman P，Carson T，Cheng Yun，et al.Homotopy method for the eigenvalues of symmetric tridiagonal matrices[J] .Journal of Computational and Applied Mathematics，2013，237（1）：644-653.

[13] Matsekh A M.The Godunov-inverse iteration：A fast and accurate solution to the symmetric tridiagonal eigenvalue problem[J] .Applied Numerical Mathematics，2005，54（2）：208-221.

[14] 唐达.三对角矩阵计算[J] .高等学校计算数学学报，1997，19（2）：97-104.

[15] 唐达.周期三对角矩阵求逆的快速算法[J] .上海电机学院学报，2013，16（5）：300-304.

[16] 何正风.MATLAB概率与数理统计分析[M] .2版.北京：机械工业出版社，2012：87.

[17] 曾杏元.有关随机矩阵领域最新研究动态与进展的综述报告[J] .数学理论与应用，2011，31（3）：7-19.

[18] 王磊，郑宝玉，崔景伍.随机矩阵理论与无线通讯[J] .南京邮电大学学报：自然科学版，2010，30（3）：90-96.

[19] 徐东艳，孟晓刚.MATLAB函数库查询辞典[M] .北京：中国铁道出版社，2006：161，216，321.