Skip to main content

特征值和特征向量

定义

caution

只有方阵有特征值和特征向量。

非方阵表示的线性变换为投影,无法分解为线性无关的基向量。

特征值分解找到了某变换下只有伸缩效果的基,而奇异值分解可以找到在某变换下旋转、缩放和投影的基。

对于 nn 阶矩阵 AA,存在一个数 λ\lambda非零nn 维列向量 α\alpha,使得

Aα=λα(1)A\alpha=\lambda\alpha \tag1

成立,其中 λ\lambda 为一个常数,表示特征值,非零向量 α\alpha 为其对应的特征向量。

info

从几何意义上来说,矩阵的特征向量指向在某个线性变换(旋转、缩放)中(上文中即 AA)只缩放而不旋转的方向,特征值即是其缩放因子。

因此从几何意义可以得知:旋转矩阵无特征值和特征矩阵。

由式 (1)(1) 移项 (λEA)α=0(\lambda E-A)\alpha=0,而 α\alpha 为非零向量,则其为齐次方程组 (λEA)x=0(\lambda E-A)x=0 的非零解,而要使非零解存在,可推出

λEA=0(2) |\lambda E-A|=0 \tag2

(2)(2) 可以得出 nn 个特征值 λi\lambda_{i},再有 (λiEA)x=0(\lambda_{i}E-A)x=0 解出基础解系,即为其对应的特征向量。

note

通过上述方程组可以得到,λiEA\lambda_{i}E-A 的秩为 00,即都不可逆,因此在实际求解过程之中,可以直接令某一行为 00.

相关定理或结论

λi\lambda_{i}AA 的互不相同的特征值,αi\alpha_{i} 是其对应的特征向量,则 αi\alpha_{i} 线性无关。

AAnn 阶矩阵,λi\lambda_{i} 为其特征值,则有

λi=aiiA=λi\begin{align*} \sum \lambda_{i}&=\sum a_{ii} \\ |A|&= \prod\lambda_{i} \end{align*}

参考

info

若对于矩阵 AA 的某个特征值 λ\lambda 的所有特征向量 αi\alpha_{i},则 kiαi0\sum k_{i}\alpha_{i}\neq 0 仍为其特征向量(只有一个特征向量同样适用)。

证明:

A(kiαi)=Akiαi=kiAαi=ki(λαi)=λkiαi\begin{align*} A\left( \sum k_{i}\alpha_{i} \right) &= \sum Ak_{i}\alpha_{i} \\ &=\sum k_{i} A\alpha_{i} \\ &=\sum k_{i}(\lambda \alpha_{i}) \\ &=\lambda\sum k_{i}\alpha_{i} \end{align*}

实际上根据特征向量和特征值的定义可以发现,特征向量就是求给定特征多项式齐次方程的非零解,而齐次方程的解的线性组合仍然是其解。

λ\lambdaAA 的特征值,则 λ+k\lambda+kA+kEA+kE 的特征值。使用定义证明

(A+kE)α=Aα+kEα=λα+kα=(λ+k)α\begin{align*} (A+kE)\alpha &= A\alpha+kE\alpha \\ &=\lambda\alpha+k\alpha \\ &=(\lambda+k)\alpha \end{align*}

另有 λm\lambda^mAmA^m 的特征值。同样使用定义证明

Amα=Am1Aα=λAm1α=λmα\begin{align*} A^m\alpha&=A^{m-1}A\alpha \\ &=\lambda A^{m-1}\alpha \\ &=\lambda^m\alpha \end{align*}
note

由上述式子,同样可以证明 ABAB 的一个特征值是二者特征值之积。

特征值和原矩阵的关系

f(A)=O    f(λ)=Of(A)=O\implies f(\lambda)=O ,例如有 A2A=OA^2-A=O,则有 λ2λ=0\lambda^2-\lambda=0 ,特征值一定在 f(λ)=0f(\lambda)=0 的解之中,但反过来其解就不一定是特征值。

若有形如 A2(a+b)A+abE=O    (AaE)(AbE)=OA^2-(a+b)A+abE=O\implies(A-aE)(A-bE)=O 可以因式分解的形式,且 aba\neq bAA 一定可以相似对角化,证明如下:

  1. 由于二者相乘为 00,则 r(AaE)+r(AbE)nr(A-aE)+r(A-bE)\leq n
  2. nnr(AaE)+nr(AbE)    r(AaE)+r(AbE)nn\geq n-r(A-aE)+n-r(A-bE)\implies r(A-aE)+r(A-bE)\geq n.

每行和为定值的矩阵

AA 每行之和为 kk

A(111)=(kkk)    Aξ=kξA\begin{pmatrix}1\\1\\1\end{pmatrix}=\begin{pmatrix}k\\k\\k\end{pmatrix}\implies A\xi=k\xi

更进一步可以推出

AB=kBAB=kB

其中 BB 是由对应特征值 kk 的特征向量组成。

特征值与特征向量的推广

矩阵AAaA+bEaA+bEAnA^nf(A)f(A)A1A^{-1}AA^*ATA^TP1APP^{-1}AP
特征值λ\lambdaaλ+ba\lambda+bλn\lambda^nf(λ)f(\lambda)1λ\frac{1}{\lambda}Aλ\frac{\mid A\mid}{\lambda}λ\lambdaλ\lambda
特征向量ξ\xiξ\xiξ\xiξ\xiξ\xiξ\xi其他P1ξP^{-1}\xi

由于前六种的特征向量都是 ξ\xi,因此可以任意组合而特征向量不变。

tip

由于伴随矩阵的特征值在分母上,如果有一个为 00 的,则不好计算,因此可以使用 A=λ1λ2λ3|A|=\lambda_{1}\lambda_{2}\lambda_{3}\cdots 代替,刚好约掉分子的特征值。

tip

若矩阵 AA 的特征值为 ±1\pm1,则有 A=A1A=A ^{-1},同理,若 AA 的特征值只有 A\sqrt{ |A|},则说明 A=AA=A^*

伴随矩阵的特征值和特征向量

caution

要求 AA 可逆。

伴随矩阵和原矩阵的关系

AA=AA=AEA^*A=A A^*=|A|E

由特征向量定义

Aα=λαA\alpha=\lambda\alpha

左乘 AA^*

AAα=λAαA^*A\alpha=\lambda A^*\alpha

AλEα=Aλα=Aα\frac{|A|}{\lambda}E\alpha =\frac{|A|}{\lambda}\alpha=A^*\alpha

则其特征值为 Aλ\frac{|A|}{\lambda},且 α\alpha 仍是特征向量。

转置矩阵的特征值和特征向量

由定义

λEAT=(λEA)T=λEA|\lambda E-A^T| = |(\lambda E-A)^T| = |\lambda E-A|

因此具有相同的特征值。而 Aα=λαA\alpha=\lambda\alpha 无法推出 ATα=λαA^T\alpha=\lambda\alpha.

相似矩阵的特征值和特征向量

B=P1AP    BP1=P1A    B(P1ξ)=λ(P1ξ)B=P^{-1}AP\implies BP ^{-1}=P^{-1}A\implies B(P^{-1}\xi)=\lambda(P ^{-1}\xi)

相似矩阵

caution

要求方阵

定义

nn 阶矩阵 A,BA,B ,若存在可逆矩阵 PP ,使得

P1AP=BP^{-1}AP=B

则称 BBAA 的相似矩阵,记作 ABA \sim B.

info

其拥有如下性质

  1. 反身性,AAA\sim A
  2. 对称性,AB    BAA\sim B \implies B\sim A
  3. 传递性,AB,BC    ACA\sim B,B\sim C\implies A\sim C.
caution

两矩阵相似的必要条件

  1. 特征多项式相同即 λEA=λEB|\lambda E-A|=|\lambda E-B|
  2. 具有相同的特征值;
  3. 秩相同;
  4. A=B=λi|A|=|B|=\prod\lambda_{i}
  5. aii=bii=λi\sum a_{ii}=\sum b_{ii}=\sum \lambda_{i}.

这里的特征值之和就是 ,记作 tr(A)tr(A).

相关结论

AB    AnBnA\sim B\implies A^n\sim B^n,证明如下

Bn=(P1AP)n=(P1AP)(P1AP)(P1AP)=P1AnP\begin{align*} B^n &= (P^{-1}AP)^n \\ &=(P ^{-1}AP)(P ^{-1} AP)\cdots(P ^{-1}AP) \\ &=P ^{-1}A^nP \end{align*}

AB    A+kEB+kEA\sim B\implies A+kE\sim B+kE,证明如下

B+kE=P1(A+kE)P=P1AP+kP1EP=P1AP+kE\begin{align*} B+kE&=P^{-1}(A+kE)P \\ &=P ^{-1}AP+kP ^{-1}EP \\ &=P ^{-1} AP+kE \end{align*}

AB    A1B1A \sim B\implies A ^{-1}\sim B ^{-1},证明如下

AB    A=BA\sim B\implies |A|=|B|BB 可逆

B1=(P1AP)1=P1A1(P1)1=P1A1P\begin{align*} B ^{-1}&=(P ^{-1}A P)^{-1} \\ &=P ^{-1} A ^{-1} (P ^{-1})^{-1} \\ &=P ^{-1} A ^{-1}P \end{align*}

AB    ATBTA \sim B\implies A ^{T}\sim B ^{T}BT=(P1AP)T=PTAT(PT)1=Q1ATQB^T=(P^{-1}AP)^T=P^TA^T(P^T)^{-1}=Q^{-1}A^TQ

AB    ABBAA \sim B\implies AB \sim BAA1ABA=BAA^{-1}ABA=BA.

相似对角化

caution

首先要证明可相似对角化。

AΛA\sim \Lambda,其中 Λ\Lambda 是对角矩阵,则称 AA 可相似对角化,Λ\LambdaAA相似标准形

info

相似对角化的充分必要条件是 AA 拥有 nn 个线性无关的特征向量,也即每个特征值线性无关的特征向量个数,等于该特征值的重数,也即 r(λiEA)=nnir(\lambda_{i}E-A)=n-n_{i}nin_{i} 为重数。

通过相似的性质,可以推出,AA 可相似对角化为

A[λ1λ2λn]A\sim \begin{bmatrix} \lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots&\\ & & &\lambda_{n} \end{bmatrix}
info

相似对角化中的可逆矩阵 PP 可以由特征向量构成,P=(α1,,αn)P=(\alpha_{1},\cdots,\alpha_{n})

A(α1,,αn)=(λ1α1,,λ2αn)=(α1,,αn)[λ1λ2λn]=PΛ\begin{align*} A(\alpha_{1},\cdots,\alpha_{n})&=(\lambda_{1}\alpha_{1},\cdots,\lambda_{2}\alpha_{n}) \\ &=(\alpha_{1},\cdots,\alpha_{n}) \begin{bmatrix} \lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots&\\ & & &\lambda_{n} \end{bmatrix} \\ &=P\Lambda \end{align*}

AP=PΛ    P1AP=ΛAP=P\Lambda\implies P ^{-1}AP=\Lambda.

由于 PP 要求可逆,这也能解释为什么充要条件是特征向量线性无关。

实对称矩阵

实对称矩阵 AA 的元素都为实数,且满足 A=ATA=A^T .

info

实对称矩阵必定可以相似对角化,且属于不同特征值所对应的特征向量相互正交(属于相同特征值的特征向量则可以不正交);此外还有迹不为 00 的秩 11 矩阵和主对角线元素全不相同(特征值全不相同)的上/下三角矩阵一定可以相似对角化。

存在正交矩阵 QTQ=EQ^TQ=E,使得 Q1AQ=QTAQ=ΛQ ^{-1}AQ=Q^TAQ=\Lambda

由上,实对称矩阵可以使用正交矩阵来进行相似对角化,步骤如下

  1. 求出特征值及其相应特征矩阵;
  2. 若特征值无重根,则所有特征向量已正交;若有重根,由于属于相同特征值的特征向量不一定正交,则需要先进行正交化;
  3. 特征向量单位化,即可得到正交阵 QQ,有 QTAQ=ΛQ^TAQ=\Lambda.

通过特征值和特征向量反求矩阵

最基本的方法是利用相似 P1AP=Λ    A=PΛP1P ^{-1}AP=\Lambda\implies A=P\Lambda P ^{-1},但是计算量很大,易错,这里的 PΛP\Lambda 可以进行一步化简,实际上就是特征值乘以对应特征向量组成的矩阵,因此原式化简为 (λ1α1,λnαn)P1(\lambda_{1}\alpha_{1},\cdots\lambda _{n}\alpha_{n})P^{-1};特别地,若 AA 是实对称矩阵,可以直接化简为 λ1α1α1T,,λnαnαnT\lambda_{1}\alpha_{1}\alpha_{1}^T,\cdots,\lambda _{n}\alpha_{n}\alpha_{n}^T.

上述化简是基于列分块,不好记忆,可以利用特征值和特征向量来推导;对于普通矩阵有

A=APP1    (λ1α1,,λnαn)P1A=APP ^{-1}\implies(\lambda_{1}\alpha_{1},\cdots,\lambda_{n}\alpha_{n})P^{-1}

对于实对称矩阵 AA,则 QQ 是正交矩阵,有

A=AQQ1=AQQT=A(e1,e2,,en)(e1TenT)=λ1e1e1T++λnenenTA=AQQ ^{-1}=AQQ^T=A(e_{1},e_{2},\cdots,e_{n})\begin{pmatrix}e_{1}^T\\ \vdots\\e_{n^T} \end{pmatrix}=\lambda_{1} e_{1}e_{1}^T+\cdots+\lambda_{n}e_{n}e_{n}^T
tip

显然,当上述矩阵的拥有多重 00 特征值,计算量会大大化简,因此我们可以将其转换为这种形式,若矩阵有多重特征值,则先减去或加上 λE\lambda E,先反求出 A±kEA\pm kE 这个整体,因为其拥有多重 00 特征值,可以简化计算,最后在求出 AA 即可。

除了有重复特征值的情况,也可用于简化实对称矩阵的求解过程,如知道两个特征向量需要求第三个,这时只需要让第三个特征值 kk 用上述方式变为 00 即可。

实际上,这种方式在求特征值中也可以用到,如用于化简原矩阵。