您当前的位置:主页 > A生活馆 >从特徵值、特徵向量到凯莱─汉米尔顿定理、矩阵的对角化(Fro >

从特徵值、特徵向量到凯莱─汉米尔顿定理、矩阵的对角化(Fro

发布时间:2020-06-17  浏览量:927  点赞:499


    特徵值与特徵向量

    在〈矩阵乘法的限制及性质〉一文中,我们知道矩阵乘法的特殊性开启了许多的可能性,比如说两个均不为零方阵的同阶方阵,相乘之后竟然可以是零方阵。接下来我们要看的是矩阵乘法的另一种重要应用,让我们先从简单的二阶方阵看起。

    给定方阵 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),哪些 \(2\times 1\) 阶矩阵 \(X = \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\) 会满足 \(A \cdot X = \lambda\cdot X\),

    其中 \(\lambda\) 是实数,而非矩阵。

    方程式 \(A \cdot X =\lambda\cdot X\) 的意义就是 \(X\) 在乘以 \(A\) 之后,会变成原来的 \(\lambda\) 倍。

    找法很简单,算就对了,只不过借助一个小技巧,就是 \(\lambda\cdot X =\lambda\cdot I\cdot X\),其中是 \(I\) 单位方阵:

    \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \lambda \cdot \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\; = \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right]\)

    \(\Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] – \;\left[ {\begin{array}{*{20}{c}} \lambda &0\\ 0&\lambda \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)

    \( \Rightarrow \;\;\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)

    若 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 是可逆方阵,

    那 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \;{\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]^{- 1}} \cdot \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right] = \;\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\)。

    因此,如果我们希望找到的 \(\;\left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] \ne \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\),那 \(\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]\) 一定要不可逆才行,

    即其行列式值 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),由此可得:

    \((1 – \lambda )(2 – \lambda ) – 3 \cdot 4 = 0\;\; \Rightarrow \;\;{\lambda ^2} – 3\lambda- 10 = 0\;\; \Rightarrow \;\;\lambda= 5\) 或 \(-2\)。

    \(\lambda=5\) 时,\(\left[ {\begin{array}{*{20}{c}} { – 4}&4\\ 3&{ – 3} \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;{x_{1}} – {x_{2}} = 0\),

    取 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 作代表,即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right] = 5 \cdot \left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\;\)

    \(\lambda=-2\) 时,\(\left[ {\begin{array}{*{20}{c}} 3&4\\ 3&4 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} {{x_{1}}}\\ {{x_{2}}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right]\;\; \Rightarrow \;\;3{x_{1}} + 4{x_{2}} = 0\),

    取\(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\)作代表,即 \(\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right] = – 2 \cdot \left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\;\)

    也就是说,只要 \(X\) 是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\),那就会满足 \(A\cdot X=\lambda \cdot X\),其中 \(\lambda\) 分别是 \(5\) 和 \(-2\)。

    因此,我们就称 \(5\) 和 \(-2\) 是方阵 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\) 的「特徵值」(eigenvalues),

    \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 分别是特徵值 \(5\) 和 \(-2\) 所对应的「特徵向量」(eigenvectors)

    (以此两个作为代表,事实上只要是 \(\left[ {\,\begin{array}{*{20}{c}} t\\ t \end{array}\,} \right]\) 或 \(\left[ {\,\begin{array}{*{20}{c}} { – 4t}\\ {3t} \end{array}\,} \right]\) 均可),

    至于产生特徵值的方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),就称为「特徵方程式」(characteristic equation)。

    以下,我们给出一般化的定义:

    \(A\) 为 \(n\) 阶方阵,\(\det(A-\lambda I)=0\) 就称为 \(A\) 的「特徵方程式」,
    其解 \({\lambda _{i}}~(i=1\sim n)\) 就称为 \(A\) 的「特徵值」,
    满足 \(A \cdot X = {\lambda _{i}} \cdot X\) 的 \(X\),就称为特徵值 \(\lambda_i\) 所对应的「特徵向量」。

    凯莱─汉米尔顿定理

    回到上面例子的 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),

    这跟〈二阶方阵的凯莱─汉米尔顿定理〉一文中的例子是同一个,

    所以我们知道 \({A^2} -3A – 10I = O\)。

    再看看 \(A\) 的特徵方程式 \(\det \left( {\left[ {\begin{array}{*{20}{c}} {1 – \lambda }&4\\ 3&{2 – \lambda } \end{array}} \right]} \right) = 0\),即 \({\lambda^2} – 3\lambda-10 = 0\),

    显然这两者在係数上是一模一样的。没错,事实上凯莱─汉米尔顿定理就是和特徵方程式有关。有了特徵方程式的概念后,我们就可以写出一般化的凯莱─汉米尔顿定理:

    \(A\) 为 \(n\) 阶方阵,

    \(\begin{array}{ll}f(\lambda )&=\det (A – \lambda I)\\&= {a_n}{\lambda ^n} + {a_{n – 1}}{\lambda ^{n – 1}} +\cdots+{a_1}\lambda+ {a_0} = 0\end{array}\) 为 \(A\) 的特徵方程式,

    则 \(f(A) = {a_n}{A^n} + {a_{n – 1}}{A^{n – 1}} +\cdots+ {a_1}A + {a_0}I = O\),

    其中 \(I\) 与 \(O\) 分别为单位方阵与零方阵。

    至于证明,则是要请出特徵值与特徵向量来帮忙了,在此略去,请读者查阅相关的资料。

    有了 \(n\) 阶方阵的凯莱─汉米尔顿定理后,
    我们在求 \(A^n\),或是 \({A^4} -4{A^3} – 6{A^2} +8A – 11I\) 之值的时候,就有更简便的工具了。
    详细的例子,请读者参阅〈二阶方阵的凯莱─汉米尔顿定理〉一文,此处就不再赘述了。

    矩阵的对角化

    希望读者没有被特徵值、特徵向量、特徵方程式这些专有名词给弄昏头了,因为接下来还需要用到它们来说明某些方阵 \(A\),可以很快地计算出它的任意次方 \(A^n\)。

    我们还是先从简单的实际例子看起。

    还是同一个 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\),如何快速地求出 \(A^{100}\)?

    由上文中已经知道 \(\lambda=5,-2\) 是 \(A\) 的特徵值,其对应的特徵向量分别是 \(\left[ {\,\begin{array}{*{20}{c}} 1\\ 1 \end{array}\,} \right]\) 和 \(\left[ {\begin{array}{*{20}{c}} { – 4}\\ 3 \end{array}} \right]\) 。

    令 \(P = \left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\) ,就是由特徵向量所组成的方阵,可求出 \({P^{\, – 1}} = \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\) ,

    接下来我们真的计算 \(P^{-1}AP\),看看有什幺神奇的事情会发生:

    \(\begin{array}{ll}{P^{- 1}}AP &= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} 5&{ – 8}\\ 5&6 \end{array}} \right] \\&= \left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]\end{array}\)

    得到的是一个很漂亮的矩阵,主对角线以外的元均为 \(0\),

    这样的矩阵我们称之为「对角方阵」(diagonal matrix)。

    更特别的,主对角线上的元刚好就是特徵值 \(5\) 和 \(-2\)。

    因此,我们就可以把 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right]\)

    改写成 \(A = \left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] = P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}\),那幺,

    \(\begin{array}{ll}{A^{100}}&=\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{ – 1}}} \right) \cdots\left( {P\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]{P^{- 1}}} \right)\\&=P{\left[ {\begin{array}{*{20}{c}} 5&0\\ 0&{ – 2} \end{array}} \right]^{100}}{P^{ – 1}}=P\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]{P^{- 1}}\\&=\left[ {\begin{array}{*{20}{c}} 1&{ – 4}\\ 1&3 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&0\\ 0&{{{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right]\\&=\left[ {\begin{array}{*{20}{c}} {{5^{100}}}&{ – 4 \cdot {{( – 2)}^{100}}}\\ {{5^{100}}}&{3 \cdot {{( – 2)}^{100}}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {\frac{3}{7}}&{\frac{4}{7}}\\ {\frac{{ – 1}}{7}}&{\frac{1}{7}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\frac{{3 \cdot {5^{100}} + 4 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} – 4 \cdot {{( – 2)}^{100}}}}{7}}\\ {\frac{{3 \cdot {5^{100}} – 3 \cdot {{( – 2)}^{100}}}}{7}}&{\frac{{4 \cdot {5^{100}} + 3 \cdot {{( – 2)}^{100}}}}{7}} \end{array}} \right]\end{array}\)

    这样是不是快多了!换句话说,若一个矩阵可「对角化」(diagonalizable),就是找到可逆方阵 \(P\) 使得 \(P^{-1}AP\) 是对角方阵,那幺,计算 \(A\) 的任意次方 \(A^n\) ,就只是小事一件而已。方阵的对角化是矩阵理论中至为重要的一环,但再谈下去会牵涉到更多的大学数学内容,因此,我们不得不在此打住,不再追究下去了,读者只要知道对角化会与特徵值、特徵向量有关即可。

    简略介绍对角化的目的在于许多高中数学参考书或讲义中,常常有给出 \(P\),然后要求 \(P^{-1}AP\) 与 \(A^n\) 的题目。许多人仅是依样画葫芦地算,不知道这样子算的意义在哪!其实这些题目背后的数学概念就是对角化、特徵值与特徵向量,下次再遇到类似的题目,就知道它葫芦里卖的是什幺药了。