注记部分:
1 定理 9.9 的另一种证明
前一章的注记部分中已叙述了复数向量空间上的相应结果的另一种证明,这一章充分利用上一章的结论,就可以用更简单的方式证明实数向量空间的结果–本章定理 9.9。
这个定理重述起来太长,所以这里省略。定理的 (a) 部分与上一章证法完全一样,也不用重复了(注意本章的情形与上一章定理8.10 的情形有些不同,在8.10中的矩阵完全是上三角的,而这里是分块上三角的。好在不论是书上的证明还是我们自己的证明都可以忽略这个区别,因为对角线上二维矩阵块都是没有特征值的,从而减去 \( \lambda I\) 之后都是可逆的,考察证明过程,可知只要对角线上的二阶矩阵块都是可逆的,那么对角线上独立的 0 的个数就等于 \( \dim\mathrm{null}\,T^n\))。那么这里只需考虑 (b) 的证明。首先证明以下引理,其实是比较简单也比较重要的结论:
引理1(兼答习题2和习题5):设 \( V\) 是二维实向量空间,\( T\in\mathcal L(V)\),那么 \( T\) 有特征值当且仅当 \( T\) 的特征多项式有实数根。
证明:设 \( T\) 的特征多项式为 \( p(T)\),根据定理9.7 前面两段的描述,不论 \( T\) 有没有特征值,都有 \( p(T)=0\)。
那么,如果 \( T\) 有特征值,即存在实数 \( \lambda\) 和非零向量 \( v\) 使得 \( Tv=\lambda v\),则 \( p(T)v=p(\lambda)v=0\),因此 \( p(\lambda)=0\) 从而 \( \lambda\) 是 \( p\) 的实数根。
反之,如果 \( p\) 有实根,那么 \( p(T)=(T-\lambda_1 I)(T-\lambda_2 I)=0\) 从而 \( \lambda_1,\lambda_2\) 其中必有特征值。
现在可以用这个引理把定理9.9 的 (b) 情形转化为 (a) 情形:
设 \( T\) 的矩阵为 \[ \begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_m\end{pmatrix}\] 要考虑的特征多项式为 \( p(T)=T^2+\alpha T+\beta I\),那么考虑 \( p(T)\) 的矩阵,其对角线上的矩阵块分别为
\( p(A_1),\dots,p(A_m)\)
如果 \( A_i\) 是 1×1 阶矩阵,即是一个实数,那么因为 \( p\) 无实根,所以 \( p(A_i)\not=0\);如果 \( A_i\) 是 2×2 的矩阵且不以 \( p\) 为特征多项式,那么因为 \( A_i\) 没有特征值,所以 \( p(A_i)\) 将是可逆的;如果 \( A_i\) 的特征多项式就是 \( p\),那么 \( p(A_i)=0\),所以,在 \( p(T)\) 的矩阵中,其对角线上独立的 0 (即不包含在某个非零的二阶矩阵块中的0)都来源于以 \( p\) 为特征多项式的那些小矩阵块,0的个数是 \( \dim\mathrm{null}\,p(T)^{\dim V}\),所以有 \( \frac{1}{2}\dim\mathrm{null}\,p(T)^{\dim V}\) 个二阶矩阵块以 \( p\) 为特征多项式。
部分习题解答:
3 设 \( A\) 是分块对角矩阵 \[ A=\begin{pmatrix}A_1&& 0 \\ &\ddots& \\ 0&&A_m\end{pmatrix}\] 其中 \( A_j\) 为方阵,证明 \( A\) 的特征值的集合等于 \( A_1,\dots,A_m\) 特征值集合的并集。
4 设 \( A\) 是分块对角矩阵\[ A=\begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_m\end{pmatrix}\]
其中 \( A_j\) 为方阵,证明 \( A\) 的特征值的集合等于 \( A_1,\dots,A_m\) 特征值集合的并集。
证明:两个题目只需利用以下事实:矩阵 \( A\) 可逆当且仅当 \( A_1,\dots,A_m\) 都可逆;矩阵 \( A\) 不可逆当且仅当存在 \( A_j\) 不可逆。以下证明这个事实。
设 \( A\) 对应的映射为 \( T\),记 \[ \begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_k\end{pmatrix}\]
对应的 \( T\) 的不变子空间为 \( U_k\)
当某个 \( A_j\) 不可逆时,考虑子矩阵 \[\begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_j\end{pmatrix}\] 它是 \( T\) 在不变子空间 \( U_j\) 上的限制 \( T|_{U_j}\) 对应的矩阵。从而可以找到一个非零向量 \( v\in U_j,v\not\in U_{j-1}\) 使得 \( Tv\in U_{j-1}\)。则 \( T\) 把子空间 \( U_{j-1}\oplus\mathrm{span}{v}\) 映射到了比它低一维的子空间 \( U_{j-1}\) 中。所以 \( \mathrm{null}\,T\not={0}\),即 \( T\) 不可逆,\( A\) 不可逆。
反之,如果每个 \( A_j\) 都可逆,那么显然 \( T\) 作用在基底上得到的向量组 \( Te_1,\dots,Te_n\) (它们的坐标是 \( A\) 的列向量)是线性无关的。
注:这两题也可以把对角线上的每个矩阵子块都分别化成分块上三角的,自然得出结论。
8 证明不存在 \( T\in\mathcal L(\mathbf R^7)\) 使得 \( T^2+T+I\) 是幂零变换。
证明:第一,因为 \( T^2+T+I\) 无实数根,所以根据本章结论,\( \dim\mathrm{null}\,(T^2+T+I)^{\dim V}\) 是偶数,不可能等于 7。
第二,奇数维的实数向量空间上的线性变换有特征值,即存在实数 \( \lambda\) 和非零向量 \( v\) 使得 \( Tv=\lambda v\),那么 \( (T^2+T+I)^{\dim V}v=(\lambda^2+\lambda+1)^7v\not=0\)。
(10题可利用8题的结论,11题利用10题的结论)
14 设 \( V\) 是 2 维向量空间而 \( T\in\mathcal L(V)\),证明如果
\( \begin{pmatrix}a&b \\ c&d\end{pmatrix}\)
是 \( T\) 的矩阵,那么 \( T\) 的特征多项式为 \( p(z)=(z-a)(z-d)-bc\)。
证明:如果 \( V\) 是实向量空间而 \( T\) 没有特征值,那么根据特征多项式的定义,结论显然成立。
如果 \( T\) 有两个相异的特征值,那么因为 \( p(T)=0\),可知 \( T\) 的两个特征值都是 \( p\) 的根,根据特征多项式的定义知结论成立。
如果 \( T\) 只有一个特征值 \( \lambda\),此时分两种情形:第一,如果这个特征值的特征子空间维数为2,即 \( T=\lambda I\),那么必有 \( b=c=0\),且 \( a=d=\lambda\),结论成立;第二,如果这个特征值的特征子空间只有1维,那么存在非零向量 \( v\) 使得 \( (T-\lambda I)v\not=0\)。因 \( \lambda\) 是 \( p\) 的其中一个根,所以 \( p(z)=(z-\lambda’ )(z-\lambda)\),因此有 \( p(T)v=(T-\lambda’ I)(T-\lambda I)v=0\)。因为 \( (T-\lambda I)v\not=0\) 且已经假设 \( T\) 只有一个特征值,所以 \( \lambda’=\lambda\),\( p(z)=(z-\lambda)^2\)。