矩阵对角化和 标准形 曾焰 版本, 最后修改于 摘要 蓝以中 关于矩阵对角化和 标准形的相关内容的摘要笔记 目录 线性变换的特征值与特征向量 特征值与特征向量的计算法 具有对角形矩阵的线性变换 不变子空间 实对称矩阵的对角化 矩阵的 标准形 幂零线性变换的 标准形 一般线性变换的 标准形 最小多项式
线性变换的特征值与特征向量 线性变换的特征值与特征向量 本节内容参见蓝以中 特征值与特征向量的计算法 设 V 是数域 K 上的 n 维线性空间,A 是 V 内一个线性变换 我们需要解决下面两个问题 : 决定 K 内所有 A 的特征值 λ 对于属于特征值 λ 的特征子空间 V λ, 找出它的一组基 我们把计算线性变换 A 的特征值和特征向量的步骤归纳如下 : 在 V 中给定一组基 ε 1 ε 2 ε n, 求 A 在这组基下的矩阵 A 计算特征多项式 f(λ) = λe A 求 f(λ) = 0 的属于数域 K 的那些根 λ 1, λ 2,, λ s. 对每个 λ i (i = 1, 2,, s) 求齐次线性方程组 (λ i E A)X = 0 的一个基础解系 ( 例如可用矩阵消元法 ) 这个齐次线性方程组具体写出来就是 λ i a 11 a 12 a 1n x 1 a 21 λ i a 22 a 2n x 2 = 0. a n1 a n2 λ i a nn 其中的 λ i 是在步骤 中求出的, 是已知数, 不是未知量 以步骤 中求出的基础解系为坐标写出 V 中一个向量组, 它就是 A 的属于特征值 λ i 的特征子空间 V λi 的一组基 值得注意的是, 两个 n 阶方阵 A,B 乘积一般不可交换 :AB BA, 但我们可以证明它们的特征多项式却是一样 实际上, 我们可以得到更一般的结果 命题 设 A 是数域 K 上 n m 矩阵,B 是 K 上 m n 矩阵, 则 λ m λe n AB = λ n λe m BA 特别地, 当 m = n 时 λe AB = λe BA 证明 借助于分块矩阵运算的技巧 x n
实对称矩阵的对角化 具有对角形矩阵的线性变换 定理 数域 K 上 n 维线性空间 V 内一个线性变换 A 的矩阵可对角化的充分必要条件是,A 有 n 个线性无关的特征向量 证明 根据定义即可得证, 且易见用这 n 个线性无关的特征向量的坐标做列向量的矩阵就是对角化 A 的矩阵 命题 线性变换 A 的属于不同特征值的特征向量线性无关 证明 可用数学归纳法得证 定理 设 A 是数域 K 上 n 维线性空间 V 的线性变换,λ 1 λ 2 λ k 是 A 的全部互不相同的特征值 则 A 的矩阵可对角化的充分必要条件是 V = V λ1 Vλ2 Vλk 在 A 的矩阵可对角化的情况下, 在每个 V λi 的矩阵为对角矩阵 中任取一组基, 合并后即为 V 的一组基, 在该组基下 A 注 这是用空间分解的语言对定理 的另一种表述 k 注 因为 V = V λ1 Vλ2 Vλk 的充分必要条件是 V λi 否得到满足可通过计算特征值和特征子空间的一组基立刻得到解决 i=1 = V, 所以定理 的条件是 不变子空间 命题 设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换 在 V 内存在一组基 ε 1 ε n, 使 A 在这组基下的矩阵成准对角形的充分必要条件是,V 可以分解成 A 的不变子空间 M 1 M 2 M s 的直和 V = M 1 M2 Ms 命题 设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换 如果 A 的矩阵可对角化, 则对 A 的任意不变子空间 M A M 的矩阵也可对角化 证明 考虑证明 V = M V λ1 ) (M V λ2 ) (M V λk ) 实对称矩阵的对角化 本节内容参见蓝以中 命题 实对称矩阵 A 的特征多项式在复数域内的根都是实数 证明 设 λ 是 A 的特征多项式在复数域内的一个根, 并设 x C n \ {0} 满足 Ax = λx 通过取共轭转置, 我们有 x Ax = x λx = λ x 2
实对称矩阵的对角化 及 x Ā x = λ x x = λ x 2 比较两式并由 Ā = A 及 x = 0 我们可推知 λ = λ 推论 欧氏空间 V 内任一对称变换 A 至少有一个特征值 注 从定理 的证明来看, 这一推论是实对称矩阵能够对角化的直接原因 但更高的观点可以揭示定理 成立的本质原因 根据谱分解定理 ( 可参见 或蓝以中 ), 给定复数域上的一个 n n 方阵 A,C n 中的每一个向量都可分解成 A 的特征值和广义特征值的和 换言之, C n 可分解为 A 的特征子空间和广义特征子空间的直和 : C n = N d1 (λ 1 ) N dk (λ k ) 这里的 N d (λ) = [(λi A) d ] 并且 d i i = 1,, k 是使得 N d (λ i ) = N d+1 (λ i ) 的最小正整数, 称作特征值 λ 的指标 ( 易证对于有限维线性空间而言, 特征值的指标总是存在的, 且 N di = N di +1 = N di+2 = ) 从谱分解定理这一 高观点 来看, 关键性的问题就变成 : 为什么对于对称变换这个特例,d i = 1 i = 1,, k? 事实上, 假定存在某个 d i > 1, 则对于任何 x N 2 (λ i ) \ N 1 (λ i ), 我们有 (λ i I A)x 0, (λ i I A) 2 x = 0 但后一条件意味着 ((λ i I A)x, (λ i I A)x) = ((λ i I A) 2 x, x) = 0, 也即 (λ i I A)x = 0, 矛盾 此观察即直接说明了对称变换是如何迫使特征值的指标为 的 命题 设 A 是欧氏空间 V 内的一个对称变换, 则 A 的对应于不同特征值的特征向量互相正交 定理 设 A 是 n 维欧氏空间 V 内的一个对称变换, 则在 V 内存在一组标准正交基, 使 A 在此组基下的矩阵成对角形 证明 对 V 的维数 n 作数学归纳法 设 λ 1 是 A 的一个特征值,η 1 是对应于 λ 1 的单位特征向量 : Aη 1 = λ 1 η 1 (η 1, η 1 ) = 1. 由 η 1 生成的线性空间 M = L(η 1 ) 是 A 的一维不变子空间 易见 M 的正交补 M 是 A 的 n 1 维不变子空间, 且 A M 仍为对称变换 按归纳假设, 在 M 内存在一组标准正交基 η 2 η n, 使 Aη i = λ i η i (i = 1, 2,, n). 易知 η 1 η 2 η n 为 V 的一组标准正交基, 使得 A 在此组基下的矩阵成对角形 注 正如注 所述, 数学归纳法的运用掩盖了 A 的矩阵能够对角化的本质原因 : 对称变换的特征值的指标必然为 推论 设 A 是一个 n 阶实对称矩阵, 则存在 n 阶正交矩阵 T, 使 T 1 AT = T AT = D 为对角矩阵
矩阵的 标准形 用正交矩阵化实对称矩阵成对角形的算法 给定 n 阶实对称矩阵 A, 我们已知存在 n 阶正交矩 阵 T, 使 T 1 AT = T AT = D 成对角形 ( 推论 ) 设 A 的特征多项式的全部互不相同的根是 λ 1 λ 2 λ k, 它们是 A 的全部特征值 ( 根据命题, 它们都是实数 ) 由定理,A 可对角化说明 R n = V λ1 Vλ2 Vλk 再由命题,V λi 与 V λj (i j) 的向量互相正交 因此, 只要在每个 V λi 中取一组标准正交基 ( 全由特 征值为 λ i 的特征向量组成 ), 合并后为 R n 内 n 个两两正交的单位向量组, 即为 R n 的一组标准正交 i {}}{基, 在此基下 A 的矩阵成对角形 D, 而 T 即为从 ε 1 ε 2 ε n ε i = (0,, 0, 1, 0,, 0) T 到此 组基的过渡矩阵,T 的列向量即为此组基在 ε 1 ε 2 ε n 下的坐标 根据这些分析, 我们把 T 和 D 的具体计算方法归纳为以下几个步骤 : 计算特征多项式 f(λ) = λi A, 并求出它的全部根 ( 两两不同者 )λ 1,λ 2,,λ k 对每个 λ i, 求齐次线性方程组 (λ i I A)X = 0 的一个基础解系 X i1,x i2,,x iti, 它们即 为解空间 M λi 的一组基 在欧氏空间 R n 内将 X i1 X i2 X iti 正交化 : Y i1 = X i1, Y i2 = X i2 (X i2, Y i1 ) (Y i1, Y i1 ) Y i1, Y i3 = X i3 (X i3, Y i1 ) (Y i1, Y i1 ) Y i1 (X i3, Y i2 ) (Y i2, Y i2 ) Y i2, 再把所得的 Y i1 Y i2 Y iti 在 R n 内单位化, 得 V λi 的一组标准正交基 Z i1 Z i2 Z iti 所寻求的 正交矩阵 T 应为 ε 1 ε 2 ε n 到 R n 的标准正交基 Z 11, Z 12,, Z 1t1, Z 21, Z 22,, Z 2t2,, Z k1, Z k2,, Z ktk 的过渡矩阵 : (Z 11, Z 12,, Z 1t1, Z 21, Z 22,, Z 2t2,, Z k1, Z k2,, Z ktk ) = (ε 1, ε 2,, ε n )T = T 所以只要把上述向量 ( 写成竖列形式 ) 作为列向量依次排列, 即得正交矩阵 T, 而此时相应的对角矩 阵 D 应为 t 1 {}}{{}}{{}}{ D = { λ 1,, λ 1, λ 2,, λ 2,, λ k,, λ k } t 2 t k 矩阵的 标准形 本节内容参见蓝以中
矩阵的 标准形 幂零线性变换的 标准形 根据谱分解定理, C n = N d1 (λ 1 ) N d2 (λ 2 ) N dk (λ k ) 这里的 N d (λ) = [(λi A) d ] 并且 d i i = 1,, k 是使得 N d (λ i ) = N d+1 (λ i ) 的最小正整数 从此结果出发, 一个自然而然的想法是研究幂零线性变换的最简单的矩阵表示 命题 设 A 是数域 K 上 n 维线性空间 V 内的一个幂零线性变换, 则 A 的特征多项式为 f(λ) = λ n, 从而 A 有唯一的特征值 λ 0 = 0 给定一个幂零线性变换 A, 取 V 中任意非零向量 α, 则存在最小正整数 k, 使得 A k 1 α 0, 但 A k α = 0 易证向量组 α Aα A k 1 α 线性无关 由此向量组张成的线性空间 I(α) = L(α, Aα,, A k 1 α) 称作由 α 生成的 A 的循环不变子空间 在 I(α) 的基 A k 1 α A k 2 α Aα α( 这组基称作循环基 ) 下,A I(α) 的矩阵为 A(A k 1 α, A k 2 α,, Aα, α) = (A k α, A k 1 α,, A 2 α, Aα) = (A k 1 α, A k 2 α,, Aα, α)j 这里 J = 0 1 0 1 0 反过来说, 如果 M 是 A 的一个不变子空间, 且 M 内存在一组基使得 A M 在此组基下的矩阵为 J, 则存在 α 使得 M = I(α) 由于 V 的维数有限, 上述制造 A 的 互不相同 的循环不变子空间的过程会在进行若干次后穷尽全空间 于是全空间 V 可分解成若干个 A 的循环不变子空间的直和, 在每一个循环不变子空间上, A 的矩阵都形如 J, 而在全空间 V 上,A 的矩阵是以形如 J 的矩阵为对角元素的准对角矩阵 于是我们可定义形如 J 的矩阵为 块, 并定义以 块为对角线元素的准对角矩阵为 形矩阵 命题 设 A 是数域 K 上 n 维线性空间 V 内的一个幂零线性变换, 则在 V 内存在一组基, 使 A 在该组基下的矩阵成 形矩阵的充分必要条件是 V 可分解为 A 的循环不变子空间的直和 : V = I(α 1 ) I(α 2 ) I(α s ) 证明 若 A 的矩阵在一组基下为 形矩阵, 则命题 说明 V 可分解为不变子空间的直和 再由本节开始时的讨论, 可知这些不变子空间必是循环不变子空间, 必要性得证 充分性是显而易见的
矩阵的 标准形 定理 设 A 是数域 K 上 n 维线性空间 V 内一幂零线性变换, 则在 V 内存在一组基, 使在该组基 下 A 的矩阵成 形矩阵 证明 只需证 V 可分解为 A 的循环不变子空间的直和即可, 而这可以通过商空间的手段降低维数, 通 过数学归纳法得证 当 n = 1 时,A 的任一特征向量 ε 为 V 的一组基, 且 Aε = 0( 幂零线性变换的特征值必为 ), 于是 A 在 ε 下的矩阵为 (0), 自然是 形矩阵 设命题对维数小于 n 的线性空间已成立, 则当 V = n 时, 不妨设 A 0, 则 A 在商空间 V = V /V λ0 (λ 0 为 A 的唯一特征值,V λ0 为其特征子空间 ) 内的诱导线性变换仍为 V 内幂零线性 变换 按归纳假设, 我们有 V = I(ᾱ 1 ) I(ᾱ 2 ) I(ᾱ s ) 这里 I(ᾱ i ) 是 A 在商空间 V 内的诱导线性变换的一个 k i 维循环不变子空间 (i = 1, 2,, s) 易 证 I(α i ) = L(α i, Aα i,, A k i α i) 是 A 在 V 内的 k i + 1 维循环不变子空间, 且 A k i α i V λ0 还易证 A k 1 α 1 A k 2 α 2,,A k s α s 为 V λ0 内线性无关向量组, 故可将其扩充为 V λ0 内的一组基 : A k 1 α 1, A k 2 α 2,, A k s α s, β 1, β 2,, β t 最后可证明 V = I(α 1 ) I(α 2 ) I(α s ) I(β 1 ) I(β t ) 注 此证明过程实际给出了在 V 中找一组基, 使 A 在该组基下的矩阵成 形的具体计算方法 这是 形理论的其他证明方法所未能给出的 细节参见蓝以中, 一般线性变换的 标准形 命题 设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换 如果存在 λ 0 K, 使 A λ 0 I 是一 个幂零线性变换, 则在 V 内存在一组基, 使 A 在这组基下的矩阵成为如下的 标准形 : λ 0 1 J 1 J 2 λ 0 J =, J i = 1 证明 对 A λ 0 I 直接应用上节关于幂零矩阵的结论即可 J s 下面设 A 为 V 中任一线性变换, 又设 A 有一特征值 λ 0 K 令 B = A λ 0 I, 定义 V 的两串 子空间序列如下 : M 0 = {0}, M i = (B i ) (i = 1, 2, ); N 0 = V, N i = (B i ) (i = 1, 2, ). λ 0
矩阵的 标准形 我们有如下简单的事实 : M i N i 间有如下包含关系 : {0} = M 0 M 1 M 2 ; V = N 0 N 1 N 2. M i + N i = n (i = 0, 1, 2, ) 存在一个最小正整数 k, 使得 M 0 M 1 M k = M k+1 = M k+2 =, N 0 N 1 N k = N k+1 = N k+2 =. 对上述的最小正整数 k, 有 V = M k Nk, 且 M k 和 N k 均为 A 的不变子空间 B 在 M k 上的限制 B Mk 为幂零线性变换, 所以在 M k 内存在一组基, 使得 A Mk 在这组基下的矩阵为 标准形 总结起来, 我们有如下命题 : 命题 设 A 是 n 维线性空间 V 内的一个线性变换,λ 0 是 A 的一个特征值 令 B = A λ 0 I, 又设 M i = (B i ), N i = (B i ) 这里 i = 0, 1, 2, 则存在正整数 k, 使 V = M k Nk, 且 M k N k 为 A B 的不变子空间,B Mk 为幂零线性变换, 又有 M k = M k+1 = M k+2 =,N k = N k+1 = N k+2 = 定理 设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换, 其特征多项式 f(λ) 的根全属于 K, 则在 V 内存在一组基, 使在该组基下 A 的矩阵成为如下的准对角形 λ i 1 J 1 J 2 λ i J =, J i = 1 J 称为 A 的 标准形 J s 证明 沿用命题 的记号, 取定 A 的一个特征值 λ 0, 我们可将 V 分解成直和 M k Nk 由 B Mk 幂零矩阵 ( 这是关键 ), 我们可在 M k 内找到一组基, 使得 A Mk 对 N k 使用归纳假设 ( 因其维数小于 n), 可得 N k 的一组基, 使得 A Nk 标准形 将两组基合并起来即完成证明 λ i 是 在该组基下的矩阵是 标准形 在该组基下的矩阵是 下述定理对于证明 标准形的唯一性和计算 标准形的具体步骤至关重要 定理 设 A 是数域 K 上 n 维线性空间 V 内的一个线性变换, 其特征多项式 f(λ) 的根全属于 K 又设 J 是 A 的任一 标准形 (J 的存在性已由定理 保证 ) 则对 A 的任一特征值 λ 0, 以及
矩阵的 标准形 B = A λ 0 I M i = (B i ) (i = 0, 1, 2, ),J 中以 λ 0 为特征值且阶为 l 的 块的个数为 (r( ) 表示一个矩阵的秩 ) 2 M l M l+1 M l 1 = r(b l+1 ) + r(b l 1 ) 2r(B l ). 故除了主对角线上 块的排列次序可以变化以外, 标准形是由 A 唯一决定的 证明 由线性变换的像与核的维数关系, 我们有 M l + r(b l ) = V (l = 0, 1, 2, ), 故我们只 需证明关于 M k 的结论成立 我们设 A 的 标准形 J 有如下形式 λ i 1 J 1 J 2 λ i J =, J i = 1 其中 J i 为 n i 阶 块 ( 这里的 λ 1 λ 2 λ s 可以有相同的 ) 则 J s λ i r(b l ) = r[(j λ 0 I n n ) l )] = s r[(j i λ 0 I ni n i ) l ]. i=1 因为 (J i λ 0 I ni n i ) l = λ i λ 0 1 λ i λ 0 1 l, λ i λ 0 若 λ i λ 0, 则 r[(j i λ 0 I ni n i ) l ] = n i 若 λ i = λ 0, 则利用幂零 块的乘法性质有 n r[(j i λ 0 I ni n i ) l i l, l < n i, ] = 0, l n i. n i n i 因此有 0, λ i λ 0, r[(j i λ 0 I ni n i ) l ] r[(j i λ 0 I ni n i ) l+1 ] = 0, λ i = λ 0, l n i, 1, λ i = λ 0, l < n i.
矩阵的 标准形 因此, = = = r(b l ) r(b l+1 ) s {r[(j i λ 0 I ni n i ) l ] r[(j i λ 0 I ni n i ) l+1 ]} i=1 λ i=λ 0, n i>l λ i =λ 0, n i >l {r[(j i λ 0 I ni n i ) l ] r[(j i λ 0 I ni n i ) l+1 ]} 1 = J 中以 λ 0 为特征值而阶数 l + 1 的 块的个数. 于是 J 中以 λ 0 为特征值的 l 阶 块的个数是 r(b l 1 ) + r(b l+1 ) 2r(B l ) 注 命题 中使得 M k = M k+1 和 N k = N k+1 成立的最小正整数 k, 根据定义也是特征值 λ 0 的指标 d 0, 也即, 使得 N d (λ 0 ) = N d+1 (λ 0 ) 成立的最小正整数 ( 此处 N d (λ 0 ) := [(A λ 0 I) d ] = M d ) d 0 也能在计算 标准形的过程中确定 事实上, 由 M k = V N k = V r(b k ) 易知,d 0 即是使得 r(b k ) = r(b k+1 ) 的最小正整数 由此推断, 它同时也是特征值 λ 0 的 块的最高阶数, 因为以 λ 0 为特征值的 l 阶 块的个数在 l > d 0 时为 r(b l+1 ) + r(b l 1 ) 2r(B l ) = 0, 在 l = d 0 时为 r(b d0 1 ) r(b d0 ) > 0 总结起来, 我们有 特征值 λ 0 的指标 d 0 = 使得 r[(a λ 0 I) k ] = r[(a λ 0 I) k+1 ] 成立的最小正整数 = λ 0 的 块的最高阶数 设在 n 维线性空间 V 内给定线性变换 A, 可按如下步骤计算 A 的 标准形 ( 假设其存在 ): 先求 A 在 V 的一组基 ε 1 ε 2 ε n 下的矩阵 A 求出 A 的全部不同特征值 λ 1 λ 2 λ s ( 假设都属于数域 K) 对每个 λ i, 令 B = A λ i I, 由公式 r(b l+1 ) + r(b l 1 ) 2r(B l ) 计算出以 λ i 为特征值, 阶为 l 的 块个数 为此, 令 l = 1, 2,, 逐次计算 从 A 的 形 J 的特征多项式容易看出 : 以 λ i 为特征值的 块阶数之和等于特征值 λ i 的重数, 由此即可知道是否已经找出全部以 λ i 为特征值的 块 ; 或者从 r(b l ) r(b l+1 ) 等于 J 中以 λ i 为特征值而阶 l + 1 的 块的个数这一点作出判断 将所获得的 块按任意次序排列成准对角形 J, 即为所求 至于如何找到一组基, 使得 A 在该组基下的矩阵为 标准形, 参阅蓝以中
矩阵的 标准形 最小多项式 命题 给定数域 K 上的 块 J = λ 0 1 λ 0 1 λ 0 n n 又设 g(x) 是 K 上一个 m 次多项式 则 g(x) 是 J 的化零多项式的充分必要条件是 λ 0 是 g(x) 的一个零点, 且其重数 J 的阶 n 证明 只需注意若 g(x) 在 C 内可分解为 g(x) = a 0 (x µ 1 ) e 1 (x µ 2 ) e2 (x µ k ) e k, 其中 µ 1,µ 2,,µ k 两两不同, 则 g(j) = a 0 (J µ 1 ) e1 (J µ 2 ) e2 (J µ k ) e k. 且 (J µ i I) ei = λ 0 µ i 1 λ 0 µ i 1 e i λ 0 µ i 定理 定理 设 A 是数域 K 上的 n 阶方阵,f(λ) = λi A 为 A 的特征多项式, 则 f(a) = 0 证明 选用 A 的 标准形 : J = J 1 J 2 J s, J i = λ i 1 λ i 1 λ i 其中 J i 为 n i 阶 块 ( 这里的 λ 1 λ 2 λ s 可以有相同的 ) 则 f(λ) = λi J = (λ λ 1 ) n1 (λ λ 2 ) n 2 (λ λ s) n s 因为 λ 1 λ 2 λ s 可有相同的,f(λ) 的每个根 λ i 的重数 块 J i 的阶数 n i 现在 f(j) = {f(j 1 ), f(j 2 ),, f(j s )}, 则由本节开始时的命题可知 f(j) = 0, 从而 f(a) = 0
参考文献 命题 设 A 是数域 K 上的 n 阶方阵,A 的最小多项式 φ(x) 与 A 看作 C 上的 n 阶方阵时的最小多项式 ψ(x) 有相同次数 换言之,A 在 K 内的任一最小多项式也是 A 在 C 内的最小多项式 定理 最小多项式 设 A 是数域 K 上的 n 阶方阵 设 A 的特征多项式在 C 内全部互不相同的特征值为 λ 1 λ 2 λ k A 在 C 内的 标准形 J 中以 λ i 为特征值的 块的最高阶数为 l i, 则 A( 在 K 内 ) 的最小多项式是唯一的, 它就是 φ(x) = (x λ 1 ) l1 (x λ 2 ) l2 (x λ k ) l k. 推论 设 A 是数域 K 上的 n 阶方阵且 A 的特征多项式的根全属于 K, 则 A 在 K 内相似于对角矩阵的充要条件是它的最小多项式没有重根 证明 从 A 的 标准形直接看出 参考文献 蓝以中 : 高等代数简明教程( 上册 ) 北京: 北京大学出版社, 蓝以中 : 高等代数简明教程( 下册 ) 北京: 北京大学出版社, 蓝以中 : 高等代数学习指南 北京: 北京大学出版社,