线性变换的特征值与特征向量线性变换的特征值与特征向量本节内容参见蓝以中特征值与特征向量的计算法设 V 是数域 K 上的 n 维线性空间,A 是 V 内一个线性变换我们需要解决下面两个问题 : 决定 K 内所有 A 的特征值 λ 对于属于特征值 λ 的特征子空间 V λ, 找出它的一组基我

矩阵对角化和标准形曾焰版本, 最后修改于摘要蓝以中关于矩阵对角化和标准形的相关内容的摘要笔记目录线性变换的特征值与特征向量特征值与特征向量的计算法具有对角形矩阵的线性变换不变子空间实对称矩阵的对角化矩阵的标准形幂零线性变换的标准形一般线性变换的标准形最小多项式

线性变换的特征值与特征向量线性变换的特征值与特征向量本节内容参见蓝以中特征值与特征向量的计算法设 V 是数域 K 上的 n 维线性空间,A 是 V 内一个线性变换我们需要解决下面两个问题 : 决定 K 内所有 A 的特征值 λ 对于属于特征值 λ 的特征子空间 V λ, 找出它的一组基我们把计算线性变换 A 的特征值和特征向量的步骤归纳如下 : 在 V 中给定一组基 ε 1 ε 2 ε n, 求 A 在这组基下的矩阵 A 计算特征多项式 f(λ) = λe A 求 f(λ) = 0 的属于数域 K 的那些根 λ 1, λ 2,, λ s. 对每个 λ i (i = 1, 2,, s) 求齐次线性方程组 (λ i E A)X = 0 的一个基础解系 ( 例如可用矩阵消元法 ) 这个齐次线性方程组具体写出来就是 λ i a 11 a 12 a 1n x 1 a 21 λ i a 22 a 2n x 2 = 0. a n1 a n2 λ i a nn 其中的 λ i 是在步骤中求出的, 是已知数, 不是未知量以步骤中求出的基础解系为坐标写出 V 中一个向量组, 它就是 A 的属于特征值 λ i 的特征子空间 V λi 的一组基值得注意的是, 两个 n 阶方阵 A,B 乘积一般不可交换 :AB BA, 但我们可以证明它们的特征多项式却是一样实际上, 我们可以得到更一般的结果命题设 A 是数域 K 上 n m 矩阵,B 是 K 上 m n 矩阵, 则 λ m λe n AB = λ n λe m BA 特别地, 当 m = n 时 λe AB = λe BA 证明借助于分块矩阵运算的技巧 x n

实对称矩阵的对角化具有对角形矩阵的线性变换定理数域 K 上 n 维线性空间 V 内一个线性变换 A 的矩阵可对角化的充分必要条件是,A 有 n 个线性无关的特征向量证明根据定义即可得证, 且易见用这 n 个线性无关的特征向量的坐标做列向量的矩阵就是对角化 A 的矩阵命题线性变换 A 的属于不同特征值的特征向量线性无关证明可用数学归纳法得证定理设 A 是数域 K 上 n 维线性空间 V 的线性变换,λ 1 λ 2 λ k 是 A 的全部互不相同的特征值则 A 的矩阵可对角化的充分必要条件是 V = V λ1 Vλ2 Vλk 在 A 的矩阵可对角化的情况下, 在每个 V λi 的矩阵为对角矩阵中任取一组基, 合并后即为 V 的一组基, 在该组基下 A 注这是用空间分解的语言对定理的另一种表述 k 注因为 V = V λ1 Vλ2 Vλk 的充分必要条件是 V λi 否得到满足可通过计算特征值和特征子空间的一组基立刻得到解决 i=1 = V, 所以定理的条件是不变子空间命题设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换在 V 内存在一组基 ε 1 ε n, 使 A 在这组基下的矩阵成准对角形的充分必要条件是,V 可以分解成 A 的不变子空间 M 1 M 2 M s 的直和 V = M 1 M2 Ms 命题设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换如果 A 的矩阵可对角化, 则对 A 的任意不变子空间 M A M 的矩阵也可对角化证明考虑证明 V = M V λ1 ) (M V λ2 ) (M V λk ) 实对称矩阵的对角化本节内容参见蓝以中命题实对称矩阵 A 的特征多项式在复数域内的根都是实数证明设 λ 是 A 的特征多项式在复数域内的一个根, 并设 x C n \ {0} 满足 Ax = λx 通过取共轭转置, 我们有 x Ax = x λx = λ x 2

实对称矩阵的对角化及 x Ā x = λ x x = λ x 2 比较两式并由 Ā = A 及 x = 0 我们可推知 λ = λ 推论欧氏空间 V 内任一对称变换 A 至少有一个特征值注从定理的证明来看, 这一推论是实对称矩阵能够对角化的直接原因但更高的观点可以揭示定理成立的本质原因根据谱分解定理 ( 可参见或蓝以中 ), 给定复数域上的一个 n n 方阵 A,C n 中的每一个向量都可分解成 A 的特征值和广义特征值的和换言之, C n 可分解为 A 的特征子空间和广义特征子空间的直和 : C n = N d1 (λ 1 ) N dk (λ k ) 这里的 N d (λ) = [(λi A) d ] 并且 d i i = 1,, k 是使得 N d (λ i ) = N d+1 (λ i ) 的最小正整数, 称作特征值 λ 的指标 ( 易证对于有限维线性空间而言, 特征值的指标总是存在的, 且 N di = N di +1 = N di+2 = ) 从谱分解定理这一高观点来看, 关键性的问题就变成 : 为什么对于对称变换这个特例,d i = 1 i = 1,, k? 事实上, 假定存在某个 d i > 1, 则对于任何 x N 2 (λ i ) \ N 1 (λ i ), 我们有 (λ i I A)x 0, (λ i I A) 2 x = 0 但后一条件意味着 ((λ i I A)x, (λ i I A)x) = ((λ i I A) 2 x, x) = 0, 也即 (λ i I A)x = 0, 矛盾此观察即直接说明了对称变换是如何迫使特征值的指标为的命题设 A 是欧氏空间 V 内的一个对称变换, 则 A 的对应于不同特征值的特征向量互相正交定理设 A 是 n 维欧氏空间 V 内的一个对称变换, 则在 V 内存在一组标准正交基, 使 A 在此组基下的矩阵成对角形证明对 V 的维数 n 作数学归纳法设 λ 1 是 A 的一个特征值,η 1 是对应于 λ 1 的单位特征向量 : Aη 1 = λ 1 η 1 (η 1, η 1 ) = 1. 由 η 1 生成的线性空间 M = L(η 1 ) 是 A 的一维不变子空间易见 M 的正交补 M 是 A 的 n 1 维不变子空间, 且 A M 仍为对称变换按归纳假设, 在 M 内存在一组标准正交基 η 2 η n, 使 Aη i = λ i η i (i = 1, 2,, n). 易知 η 1 η 2 η n 为 V 的一组标准正交基, 使得 A 在此组基下的矩阵成对角形注正如注所述, 数学归纳法的运用掩盖了 A 的矩阵能够对角化的本质原因 : 对称变换的特征值的指标必然为推论设 A 是一个 n 阶实对称矩阵, 则存在 n 阶正交矩阵 T, 使 T 1 AT = T AT = D 为对角矩阵

矩阵的标准形用正交矩阵化实对称矩阵成对角形的算法给定 n 阶实对称矩阵 A, 我们已知存在 n 阶正交矩阵 T, 使 T 1 AT = T AT = D 成对角形 ( 推论 ) 设 A 的特征多项式的全部互不相同的根是 λ 1 λ 2 λ k, 它们是 A 的全部特征值 ( 根据命题, 它们都是实数 ) 由定理,A 可对角化说明 R n = V λ1 Vλ2 Vλk 再由命题,V λi 与 V λj (i j) 的向量互相正交因此, 只要在每个 V λi 中取一组标准正交基 ( 全由特征值为 λ i 的特征向量组成 ), 合并后为 R n 内 n 个两两正交的单位向量组, 即为 R n 的一组标准正交 i {}}{基, 在此基下 A 的矩阵成对角形 D, 而 T 即为从 ε 1 ε 2 ε n ε i = (0,, 0, 1, 0,, 0) T 到此组基的过渡矩阵,T 的列向量即为此组基在 ε 1 ε 2 ε n 下的坐标根据这些分析, 我们把 T 和 D 的具体计算方法归纳为以下几个步骤 : 计算特征多项式 f(λ) = λi A, 并求出它的全部根 ( 两两不同者 )λ 1,λ 2,,λ k 对每个 λ i, 求齐次线性方程组 (λ i I A)X = 0 的一个基础解系 X i1,x i2,,x iti, 它们即为解空间 M λi 的一组基在欧氏空间 R n 内将 X i1 X i2 X iti 正交化 : Y i1 = X i1, Y i2 = X i2 (X i2, Y i1 ) (Y i1, Y i1 ) Y i1, Y i3 = X i3 (X i3, Y i1 ) (Y i1, Y i1 ) Y i1 (X i3, Y i2 ) (Y i2, Y i2 ) Y i2, 再把所得的 Y i1 Y i2 Y iti 在 R n 内单位化, 得 V λi 的一组标准正交基 Z i1 Z i2 Z iti 所寻求的正交矩阵 T 应为 ε 1 ε 2 ε n 到 R n 的标准正交基 Z 11, Z 12,, Z 1t1, Z 21, Z 22,, Z 2t2,, Z k1, Z k2,, Z ktk 的过渡矩阵 : (Z 11, Z 12,, Z 1t1, Z 21, Z 22,, Z 2t2,, Z k1, Z k2,, Z ktk ) = (ε 1, ε 2,, ε n )T = T 所以只要把上述向量 ( 写成竖列形式 ) 作为列向量依次排列, 即得正交矩阵 T, 而此时相应的对角矩阵 D 应为 t 1 {}}{{}}{{}}{ D = { λ 1,, λ 1, λ 2,, λ 2,, λ k,, λ k } t 2 t k 矩阵的标准形本节内容参见蓝以中

矩阵的标准形幂零线性变换的标准形根据谱分解定理, C n = N d1 (λ 1 ) N d2 (λ 2 ) N dk (λ k ) 这里的 N d (λ) = [(λi A) d ] 并且 d i i = 1,, k 是使得 N d (λ i ) = N d+1 (λ i ) 的最小正整数从此结果出发, 一个自然而然的想法是研究幂零线性变换的最简单的矩阵表示命题设 A 是数域 K 上 n 维线性空间 V 内的一个幂零线性变换, 则 A 的特征多项式为 f(λ) = λ n, 从而 A 有唯一的特征值 λ 0 = 0 给定一个幂零线性变换 A, 取 V 中任意非零向量 α, 则存在最小正整数 k, 使得 A k 1 α 0, 但 A k α = 0 易证向量组 α Aα A k 1 α 线性无关由此向量组张成的线性空间 I(α) = L(α, Aα,, A k 1 α) 称作由 α 生成的 A 的循环不变子空间在 I(α) 的基 A k 1 α A k 2 α Aα α( 这组基称作循环基 ) 下,A I(α) 的矩阵为 A(A k 1 α, A k 2 α,, Aα, α) = (A k α, A k 1 α,, A 2 α, Aα) = (A k 1 α, A k 2 α,, Aα, α)j 这里 J = 0 1 0 1 0 反过来说, 如果 M 是 A 的一个不变子空间, 且 M 内存在一组基使得 A M 在此组基下的矩阵为 J, 则存在 α 使得 M = I(α) 由于 V 的维数有限, 上述制造 A 的互不相同的循环不变子空间的过程会在进行若干次后穷尽全空间于是全空间 V 可分解成若干个 A 的循环不变子空间的直和, 在每一个循环不变子空间上, A 的矩阵都形如 J, 而在全空间 V 上,A 的矩阵是以形如 J 的矩阵为对角元素的准对角矩阵于是我们可定义形如 J 的矩阵为块, 并定义以块为对角线元素的准对角矩阵为形矩阵命题设 A 是数域 K 上 n 维线性空间 V 内的一个幂零线性变换, 则在 V 内存在一组基, 使 A 在该组基下的矩阵成形矩阵的充分必要条件是 V 可分解为 A 的循环不变子空间的直和 : V = I(α 1 ) I(α 2 ) I(α s ) 证明若 A 的矩阵在一组基下为形矩阵, 则命题说明 V 可分解为不变子空间的直和再由本节开始时的讨论, 可知这些不变子空间必是循环不变子空间, 必要性得证充分性是显而易见的

矩阵的标准形定理设 A 是数域 K 上 n 维线性空间 V 内一幂零线性变换, 则在 V 内存在一组基, 使在该组基下 A 的矩阵成形矩阵证明只需证 V 可分解为 A 的循环不变子空间的直和即可, 而这可以通过商空间的手段降低维数, 通过数学归纳法得证当 n = 1 时,A 的任一特征向量 ε 为 V 的一组基, 且 Aε = 0( 幂零线性变换的特征值必为 ), 于是 A 在 ε 下的矩阵为 (0), 自然是形矩阵设命题对维数小于 n 的线性空间已成立, 则当 V = n 时, 不妨设 A 0, 则 A 在商空间 V = V /V λ0 (λ 0 为 A 的唯一特征值,V λ0 为其特征子空间 ) 内的诱导线性变换仍为 V 内幂零线性变换按归纳假设, 我们有 V = I(ᾱ 1 ) I(ᾱ 2 ) I(ᾱ s ) 这里 I(ᾱ i ) 是 A 在商空间 V 内的诱导线性变换的一个 k i 维循环不变子空间 (i = 1, 2,, s) 易证 I(α i ) = L(α i, Aα i,, A k i α i) 是 A 在 V 内的 k i + 1 维循环不变子空间, 且 A k i α i V λ0 还易证 A k 1 α 1 A k 2 α 2,,A k s α s 为 V λ0 内线性无关向量组, 故可将其扩充为 V λ0 内的一组基 : A k 1 α 1, A k 2 α 2,, A k s α s, β 1, β 2,, β t 最后可证明 V = I(α 1 ) I(α 2 ) I(α s ) I(β 1 ) I(β t ) 注此证明过程实际给出了在 V 中找一组基, 使 A 在该组基下的矩阵成形的具体计算方法这是形理论的其他证明方法所未能给出的细节参见蓝以中, 一般线性变换的标准形命题设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换如果存在 λ 0 K, 使 A λ 0 I 是一个幂零线性变换, 则在 V 内存在一组基, 使 A 在这组基下的矩阵成为如下的标准形 : λ 0 1 J 1 J 2 λ 0 J =, J i = 1 证明对 A λ 0 I 直接应用上节关于幂零矩阵的结论即可 J s 下面设 A 为 V 中任一线性变换, 又设 A 有一特征值 λ 0 K 令 B = A λ 0 I, 定义 V 的两串子空间序列如下 : M 0 = {0}, M i = (B i ) (i = 1, 2, ); N 0 = V, N i = (B i ) (i = 1, 2, ). λ 0

矩阵的标准形我们有如下简单的事实 : M i N i 间有如下包含关系 : {0} = M 0 M 1 M 2 ; V = N 0 N 1 N 2. M i + N i = n (i = 0, 1, 2, ) 存在一个最小正整数 k, 使得 M 0 M 1 M k = M k+1 = M k+2 =, N 0 N 1 N k = N k+1 = N k+2 =. 对上述的最小正整数 k, 有 V = M k Nk, 且 M k 和 N k 均为 A 的不变子空间 B 在 M k 上的限制 B Mk 为幂零线性变换, 所以在 M k 内存在一组基, 使得 A Mk 在这组基下的矩阵为标准形总结起来, 我们有如下命题 : 命题设 A 是 n 维线性空间 V 内的一个线性变换,λ 0 是 A 的一个特征值令 B = A λ 0 I, 又设 M i = (B i ), N i = (B i ) 这里 i = 0, 1, 2, 则存在正整数 k, 使 V = M k Nk, 且 M k N k 为 A B 的不变子空间,B Mk 为幂零线性变换, 又有 M k = M k+1 = M k+2 =,N k = N k+1 = N k+2 = 定理设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换, 其特征多项式 f(λ) 的根全属于 K, 则在 V 内存在一组基, 使在该组基下 A 的矩阵成为如下的准对角形 λ i 1 J 1 J 2 λ i J =, J i = 1 J 称为 A 的标准形 J s 证明沿用命题的记号, 取定 A 的一个特征值 λ 0, 我们可将 V 分解成直和 M k Nk 由 B Mk 幂零矩阵 ( 这是关键 ), 我们可在 M k 内找到一组基, 使得 A Mk 对 N k 使用归纳假设 ( 因其维数小于 n), 可得 N k 的一组基, 使得 A Nk 标准形将两组基合并起来即完成证明 λ i 是在该组基下的矩阵是标准形在该组基下的矩阵是下述定理对于证明标准形的唯一性和计算标准形的具体步骤至关重要定理设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换, 其特征多项式 f(λ) 的根全属于 K 又设 J 是 A 的任一标准形 (J 的存在性已由定理保证 ) 则对 A 的任一特征值 λ 0, 以及

矩阵的标准形 B = A λ 0 I M i = (B i ) (i = 0, 1, 2, ),J 中以 λ 0 为特征值且阶为 l 的块的个数为 (r( ) 表示一个矩阵的秩 ) 2 M l M l+1 M l 1 = r(b l+1 ) + r(b l 1 ) 2r(B l ). 故除了主对角线上块的排列次序可以变化以外, 标准形是由 A 唯一决定的证明由线性变换的像与核的维数关系, 我们有 M l + r(b l ) = V (l = 0, 1, 2, ), 故我们只需证明关于 M k 的结论成立我们设 A 的标准形 J 有如下形式 λ i 1 J 1 J 2 λ i J =, J i = 1 其中 J i 为 n i 阶块 ( 这里的 λ 1 λ 2 λ s 可以有相同的 ) 则 J s λ i r(b l ) = r[(j λ 0 I n n ) l )] = s r[(j i λ 0 I ni n i ) l ]. i=1 因为 (J i λ 0 I ni n i ) l = λ i λ 0 1 λ i λ 0 1 l, λ i λ 0 若 λ i λ 0, 则 r[(j i λ 0 I ni n i ) l ] = n i 若 λ i = λ 0, 则利用幂零块的乘法性质有 n r[(j i λ 0 I ni n i ) l i l, l < n i, ] = 0, l n i. n i n i 因此有 0, λ i λ 0, r[(j i λ 0 I ni n i ) l ] r[(j i λ 0 I ni n i ) l+1 ] = 0, λ i = λ 0, l n i, 1, λ i = λ 0, l < n i.

矩阵的标准形因此, = = = r(b l ) r(b l+1 ) s {r[(j i λ 0 I ni n i ) l ] r[(j i λ 0 I ni n i ) l+1 ]} i=1 λ i=λ 0, n i>l λ i =λ 0, n i >l {r[(j i λ 0 I ni n i ) l ] r[(j i λ 0 I ni n i ) l+1 ]} 1 = J 中以 λ 0 为特征值而阶数 l + 1 的块的个数. 于是 J 中以 λ 0 为特征值的 l 阶块的个数是 r(b l 1 ) + r(b l+1 ) 2r(B l ) 注命题中使得 M k = M k+1 和 N k = N k+1 成立的最小正整数 k, 根据定义也是特征值 λ 0 的指标 d 0, 也即, 使得 N d (λ 0 ) = N d+1 (λ 0 ) 成立的最小正整数 ( 此处 N d (λ 0 ) := [(A λ 0 I) d ] = M d ) d 0 也能在计算标准形的过程中确定事实上, 由 M k = V N k = V r(b k ) 易知,d 0 即是使得 r(b k ) = r(b k+1 ) 的最小正整数由此推断, 它同时也是特征值 λ 0 的块的最高阶数, 因为以 λ 0 为特征值的 l 阶块的个数在 l > d 0 时为 r(b l+1 ) + r(b l 1 ) 2r(B l ) = 0, 在 l = d 0 时为 r(b d0 1 ) r(b d0 ) > 0 总结起来, 我们有特征值 λ 0 的指标 d 0 = 使得 r[(a λ 0 I) k ] = r[(a λ 0 I) k+1 ] 成立的最小正整数 = λ 0 的块的最高阶数设在 n 维线性空间 V 内给定线性变换 A, 可按如下步骤计算 A 的标准形 ( 假设其存在 ): 先求 A 在 V 的一组基 ε 1 ε 2 ε n 下的矩阵 A 求出 A 的全部不同特征值 λ 1 λ 2 λ s ( 假设都属于数域 K) 对每个 λ i, 令 B = A λ i I, 由公式 r(b l+1 ) + r(b l 1 ) 2r(B l ) 计算出以 λ i 为特征值, 阶为 l 的块个数为此, 令 l = 1, 2,, 逐次计算从 A 的形 J 的特征多项式容易看出 : 以 λ i 为特征值的块阶数之和等于特征值 λ i 的重数, 由此即可知道是否已经找出全部以 λ i 为特征值的块 ; 或者从 r(b l ) r(b l+1 ) 等于 J 中以 λ i 为特征值而阶 l + 1 的块的个数这一点作出判断将所获得的块按任意次序排列成准对角形 J, 即为所求至于如何找到一组基, 使得 A 在该组基下的矩阵为标准形, 参阅蓝以中

矩阵的标准形最小多项式命题给定数域 K 上的块 J = λ 0 1 λ 0 1 λ 0 n n 又设 g(x) 是 K 上一个 m 次多项式则 g(x) 是 J 的化零多项式的充分必要条件是 λ 0 是 g(x) 的一个零点, 且其重数 J 的阶 n 证明只需注意若 g(x) 在 C 内可分解为 g(x) = a 0 (x µ 1 ) e 1 (x µ 2 ) e2 (x µ k ) e k, 其中 µ 1,µ 2,,µ k 两两不同, 则 g(j) = a 0 (J µ 1 ) e1 (J µ 2 ) e2 (J µ k ) e k. 且 (J µ i I) ei = λ 0 µ i 1 λ 0 µ i 1 e i λ 0 µ i 定理定理设 A 是数域 K 上的 n 阶方阵,f(λ) = λi A 为 A 的特征多项式, 则 f(a) = 0 证明选用 A 的标准形 : J = J 1 J 2 J s, J i = λ i 1 λ i 1 λ i 其中 J i 为 n i 阶块 ( 这里的 λ 1 λ 2 λ s 可以有相同的 ) 则 f(λ) = λi J = (λ λ 1 ) n1 (λ λ 2 ) n 2 (λ λ s) n s 因为 λ 1 λ 2 λ s 可有相同的,f(λ) 的每个根 λ i 的重数块 J i 的阶数 n i 现在 f(j) = {f(j 1 ), f(j 2 ),, f(j s )}, 则由本节开始时的命题可知 f(j) = 0, 从而 f(a) = 0

参考文献命题设 A 是数域 K 上的 n 阶方阵,A 的最小多项式 φ(x) 与 A 看作 C 上的 n 阶方阵时的最小多项式 ψ(x) 有相同次数换言之,A 在 K 内的任一最小多项式也是 A 在 C 内的最小多项式定理最小多项式设 A 是数域 K 上的 n 阶方阵设 A 的特征多项式在 C 内全部互不相同的特征值为 λ 1 λ 2 λ k A 在 C 内的标准形 J 中以 λ i 为特征值的块的最高阶数为 l i, 则 A( 在 K 内 ) 的最小多项式是唯一的, 它就是 φ(x) = (x λ 1 ) l1 (x λ 2 ) l2 (x λ k ) l k. 推论设 A 是数域 K 上的 n 阶方阵且 A 的特征多项式的根全属于 K, 则 A 在 K 内相似于对角矩阵的充要条件是它的最小多项式没有重根证明从 A 的标准形直接看出参考文献蓝以中 : 高等代数简明教程( 上册 ) 北京: 北京大学出版社, 蓝以中 : 高等代数简明教程( 下册 ) 北京: 北京大学出版社, 蓝以中 : 高等代数学习指南北京: 北京大学出版社,