注记部分:
1 \( \dim\mathrm{null}\,T^k\) 随着 k 的增加量
\( \dim\mathrm{null}\,T^k\) 是 k 的单调递增函数,而且当 k 达到某一个数值之后,\( \dim\mathrm{null}\,T^k\) 就恒定不变了。但是书上并没有说它的增加有何规律,是每次都增加相同的维数,还是增加的维数可能有变化?换句话说,\( \dim\mathrm{null}\,T^{k+1}-\dim\mathrm{null}\,T^k\) 有什么规律?它是恒定不变的,还是忽大忽小的,或是有什么别的规律没有?
首先想象 \( \mathrm{null}\,T^{k+1}\) 比 \( \mathrm{null}\,T^k\) 多出来的维数是从哪来的?有些向量在 \( \mathrm{null}\,T^{k+1}\) 里,却不在 \( \mathrm{null}\,T^k\) 里,那么 \( T^k\) 作用在这些向量上不等于零,但再用 \( T\) 作用一下就变成零了,也就是 \( T^kv\not=0, TT^kv=0\),那么 \( T^kv\in\mathrm{null}\,T\),且 \( T^kv\in\mathrm{range}\,T^k\)。那么我们猜想,是否应有 \[ \dim\mathrm{null}\,T^{k+1}=\dim(\mathrm{null}\,T\cap\mathrm{range}\,T^k)+\dim\mathrm{null}\,T^k\] 成立?或者,等价地(利用值域-零度定理),有 \[ \dim\mathrm{range}\,T^k=\dim(\mathrm{null}\,T\cap\mathrm{range}\,T^k)+\dim\mathrm{range}\,T^{k+1}\] 成立?
答案是肯定的,因为 \( U=\mathrm{range}\,T^k\) 是 \( T\) 的不变子空间,设 \( S=T|_U\),那么 \( \mathrm{null}\,S=\mathrm{null}\,T\cap U\),\( \mathrm{range}\,S=\mathrm{range}\,T^{k+1}\),则由值域-零度定理 \( \dim U=\dim\mathrm{null}\,S+\dim\mathrm{range}\,S\) 可得结论。
这样,因为 \( \dim(\mathrm{null}\,T\cap\mathrm{range}\,T^k)\) 随着 k 增加而单调递减,那么 \( \dim\mathrm{null}\,T^k\) 的增量也单调递减,直到某个整数使其增量为零,那么 \( \dim\mathrm{null}\,T^k\) 和 \( \dim\mathrm{range}\,T^k\) 就都不会变化了。
此时,用 \( T^k\) 代替 \( T\),再利用增量公式,因为 \[ \dim\mathrm{null}\,T^{2k}=\dim(\mathrm{null}\,T^k\cap\mathrm{range}\,T^k)+\dim\mathrm{null}\,T^k=\dim\mathrm{null}\,T^k\] 所以这个时候 \( \dim(\mathrm{null}\,T^k\cap\mathrm{range}\,T^k)=0\),故有 \[ \mathrm{null}\,T^k\cap\mathrm{range}\,T^k={0}\] 和 \[ \mathrm{null}\,T^k\oplus\mathrm{range}\,T^k=V\)
2 定理 8.10 的另一个证明
定理8.10:设 \( T\in\mathcal L(V), \lambda\in\mathrm F\),那么如果在一组基底下 \( T\) 的矩阵是上三角的,则 \( \lambda\) 在对角线上出现的次数等于 \( \dim\mathrm{null}\,(T-\lambda I)^{\dim V}\)。
证明:不失一般性,我们还是设 \( \lambda=0\)。
设在一组基底 \( e_1,e_2,\dots,e_n\) 下 \( T\) 的矩阵为 \( A\),为上三角矩阵,那么 0 就会出现在对角线上。我们证明的思路是另外找到一组基底,使得 \( T\) 的矩阵对角线上的 0 都集中在左上角,同时 0 的个数不变,即 \[ \begin{pmatrix}0&&&&&* \\ &\ddots&&&& \\ &&0&&& \\ &&&\lambda_1&&\\ &&&&\ddots& 0 \\&&&&&\lambda_r\end{pmatrix}\] 那么左上角是个幂零矩阵,\( T^n\) 在这个子空间上是零,其对应子空间的维数等于对角线上 0 的个数,同时 \( \mathrm{range}\,T^n\) 的维数是对角线上非零元素的个数,即证得结论。
为了把对角线上的 0 都移动至左上角,第一步,从对角线左上角算起第一个 0 入手,如果它就在第一行第一列,那么第一步完成。否则,假设第一个 0 在第 m 行第 m 列,那么考虑矩阵的前 m 行前 m 列的元素构成的子矩阵,设其为 \[ \begin{pmatrix}\lambda_1&&&* \\ &\ddots&& \\ &&\lambda_{m-1}& \\ &&&0\end{pmatrix}\] 它是 \( T\) 在 \( U=\mathrm{span},(e_1,e_2,\dots,e_m)\) 上的限制 \( T|_U\) 的矩阵。显然 \( T|_U\) 有特征值 0,设对应的特征向量为 \( v\),并且因为 \( T\) 在 \( \mathrm{span},(e_1,e_2,\dots,e_{m-1})\) 上是可逆的,所以 \( v\not\in\mathrm{span},(e_1,e_2,\dots,e_{m-1})\),那么 \( \mathrm{span},(v,e_1,e_2,\dots,e_{m-1})=U\)。我们把向量组 \( v,e_1,e_2,\dots,e_{m-1}\) 作为 \( U\) 的新基底,那么 \( T|_U\) 在这一组基底下的矩阵是 \[ \begin{pmatrix}0&&&* \\ &\lambda_1&& \\ &&\ddots& \\ &&&\lambda_{m-1}\end{pmatrix}\] 用 \( U\) 的新基底替换原来的基底之后,\( T\) 对应的矩阵的右下角的 n-m 行和 n-m 列构成的子矩阵没有改变。因此,这样的变换并没有增加或减少对角线上 0 的个数。
接下来,用同样的方法处理除第一行与第一列之外的元素构成的矩阵(它对应的映射是 \( P_WT|_W\),其中 \( W=\mathrm{span},(e_2,e_3,\dots,e_n)\)),把对角线上的下一个 0 放在第二行第二列的位置。
依此步骤,直到对角线上所有的 0 都移动到左上角。命题得证。
3 引理 8.40 的另一种证明
引理8.40:如果 \( N\in\mathcal L(V)\) 是幂零矩阵,那么存在向量 \( v_1,\dots,v_k\in V\) 使得
a) \( (v_1,Nv_1,\dots,N^{m(v_1)}v1,\dots,v_k,Nv_k,\dots,N^{m(v_k)}v_k)\) 是 \( V\) 的基底;
b) \( (N^{m(v_1)}v1,\dots,N^{m(v_k)}v_k)\) 是 \( \mathrm{null}\,N\) 的基底。
证明:因为 \( \mathrm{null}\,N\subset\mathrm{null}\,N^2\subset\dots\subset\mathrm{null}\,N^r=V\),我们取子空间 \( W_r\) 使得 \( \mathrm{null}\,N^r=\mathrm{null}\,N^{r-1}\oplus W_r\),那么 \( W_r\) 中的任何非零向量 \( v\),有 \( N^{r-1}Nv=0,N^{r-2}Nv\not=0\),因此 \( Nv\in\mathrm{null}\,N^{r-1},Nv\not\in\mathrm{null}\,N^{r-2}\)。
定义 \( N(W_r)={Nv:v\in W_r}\),那么 \( N(W_r)\subset\mathrm{null}\,N^{r-1}\) 且 \( N(W_r)\cap\mathrm{null}\,N^{r-2}={0}\)。那么存在子空间 \( W_{r-1}\),使得 \( \mathrm{null}\,N^{r-1}=\mathrm{null}\,N^{r-2}\oplus W_{r-1}\),并且 \( N(W_r)\subset W_{r-1}\)。
以此类推,取子空间 \( W_{r-2},\dots,W_2\) 使得 \( \mathrm{null}\,N^i=\mathrm{null}\,N^{i-1}\oplus W_i, i=2,3,\dots,r\) 并且 \( N(W_{i+1})\subset W_i\),\( i=2,3,\dots,r-1\)。
令 \( W_1=\mathrm{null}\,N\),那么 \( W_1,\dots,W_r\) 满足 \[ W_1\oplus W_2\oplus\dots\oplus W_r=V\] 取 \( W_r\) 的基底 \( v_1,\dots,v_s\),那么 \( Nv_1,\dots,Nv_s\in W_{r-1}\),因为 \( W_r\cap\mathrm{null}\,N={0}\),所以 \( Nv_1,\dots,Nv_s\) 线性无关,向 \( Nv_1,\dots,Nv_s\) 中添加向量 \( v_{s+1},\dots,v_j\) 使它们成为 \( W_{r-1}\) 的基底,并取得向量 \( N^2v_1,\dots,N^2v_s,Nv_{s+1},\dots,Nv_j\),依次类推,最后将所有的向量放在一起,得到 \[ v_1,Nv_1,\dots,N^{m(v_1)}v1,\dots,v_k,Nv_k,\dots,N^{m(v_k)}v_k\] 因为出自每个 \( W_i\) 的向量组是 \( W_i\) 的基底,而诸 \( W_i\) 的和又是直和,所以整个向量组是 \( V\) 的基底,并且其中 \( (N^{m(v_1)}v1,\dots,N^{m(v_k)}v_k)\) 是 \( W_1=\mathrm{null}\,N\) 的基底。证毕。
部分习题解答:
3 设 \( T\in\mathcal L(V)\),m 是正整数,且 \( v\in V\) 是满足 \( T^{m-1}v\not=0\) 但 \( T^mv=0\) 的向量。证明 \( (v, Tv, T^2v,\dots,T^{m-1}v)\) 线性无关。
证明:设 \( a_1v+a_2Tv+\dots+a_mT^{m-1}v=0\),两边用 \( T^{m-1}\) 作用,得到 \( a_1T^{m-1}v=0\),由于 \( T^{m-1}v\not=0\),那么 \( a_1=0\);
两边用 \( T^{m-2}\) 作用,得 \( a_2=0\),等等,可知 \( a_1=a_2=\dots=a_m=0\)。
5 设 \( S,T\in\mathcal L(V)\)。证明如果 \( ST\) 是幂零的,那么 \( TS\) 也是幂零的。
证明:如果 \( ST\) 是幂零变换,那么 \( (ST)^{\dim V}=0\),因此 \( (TS)^{\dim V}=(TS)^{\dim V+1}=0\)。
13 设 \( V\) 是 n 维复向量空间,且 \( T\in\mathcal L(V)\) 满足 \( \mathrm{null}\,T^{n-2}\not=\mathrm{null}\,T^{n-1}\)。证明 \( T\) 至多有两个不同的特征值。
证明:设 \( \lambda_1,\lambda_2,\dots,\lambda_m\) 是 \( T\) 的全部特征值,那么 \[ V=\mathrm{null}\,(T-\lambda_1 I)^n\oplus\dots\oplus\mathrm{null}\,(T-\lambda_m I)^n\] 如果 \( T\) 至少有三个特征值,那么以上各个子空间的维数都不超过 n-2。那么在每一个不变子空间中都有 \( \mathrm{null}\,T^{n-2}=\mathrm{null}\,T^{n-1}\),则在整个空间中此等式也成立,矛盾。
20 设 \( T\in\mathcal L(V)\) 是可逆变换。证明存在多项式 \( p\in\mathcal P(F)\) 使得 \( T^{-1}=p(T)\)。
证明:映射序列 \( I,T,T^2,\dots,T^{n^2}\) 必线性相关,则有不全为零的数 \( a_0,a_1,\dots,a_{n^2}\) 使得 \[ a_0I+\dots+a_{n^2}T^{n^2}=0\] 设第一个不是零的系数为 \( a_m\),那么因为 \( T\) 可逆,上式两边同时乘以 \( T^{-m}/a_m\) 则有 \[ I+\frac{a_{m+1}}{a_m}T+\dots=0\] 设 \( p(T)=-\frac{a_{m+1}}{a_m}I-\frac{a_{m+2}}{a_m}T-\dots\),则有 \( Tp(T)=I\),因此 \( p(T)=T^{-1}\)。
28 设 \( a_0,\dots,a_{n-1}\in\mathbf C\),某线性变换在标准基底下的矩阵是 \[ \begin{pmatrix}0&&&&&-a_0 \\ 1&0&&&&-a_1 \\ &1&\ddots&&&-a_2 \\ &&\ddots&&&\vdots \\ &&&&0&-a_{n-2} \\ &&&&1&-a_{n-1}\end{pmatrix}\] 找到它的最小多项式与特征多项式。
解答:设这组基底为 \( e_1,e_2,\dots,e_n\),那么 \( e_2=Te_1,e_3=T^2e_1,\dots,e_n=T^{n-1}e_1\),并且 \( T^ne_1=-a_0e_1-a_1Te_1-\dots-a_{n-1}T^{n-1}e_1\),设 \( p(x)=x^n+a_{n-1}x^{n-1}+\dots+a_0\),那么 \( p(T)e_i=p(T)T^{i-1}e_1=0, i=1,2,\dots,n\) 从而 \( p(T)=0\)。又因为 \( e_1,Te_1,T^2e_1,\dots,T^{n-1}e_1\) 线性无关,所以 \( p(x)\) 就是最小多项式。因为最小多项式为 n 次的,所以特征多项式也为 \( p(x)\)。
30 设 V 是复向量空间,且 \( T\in\mathcal L(V)\)。证明 \( V\) 不能分解为 \( T\) 的非平凡不变子空间的直和当且仅当 \( T\) 的最小多项式形如 \( (T-\lambda I)^{\dim V}\),其中 \( \lambda\in\mathbf C\)。
证明:如果 \( V\) 不能分解为 \( T\) 的非平凡不变子空间的直和,那么 \( T\) 只有一个特征值,设为 \( \lambda\),\( T\) 的最小多项式是形如 \( (T-\lambda I)^r\) 的多项式,其中 \( r\le\dim V\)。
为证明 \( r=\dim V\),考虑 \( T\) 的 Jordan 型矩阵,其次对角线上必定没有 0,即形如 \[ \begin{pmatrix}\lambda&1&& 0 \\&\lambda&\ddots& \\ &&\ddots&1 \\ 0&&&\lambda\end{pmatrix}\] 的矩阵,那么如果 \( k<\dim V\),则 \( (T-\lambda I)^k\not=0\),因此其最小多项式为 \( (T-\lambda I)^{\dim V}\)。
如果 \( T\) 的最小多项式形如 \( (T-\lambda I)^{\dim V}\),那么 \( T\) 只有一个特征值 \( \lambda\),假设 \( V\) 可以分解为 \( T\) 的非平凡不变子空间的直和,那么因为在每个不变子空间上 \( (T-\lambda I)\) 是幂零的,所以最小多项式的次数不超过每个子空间的维数,其必定小于 \( \dim V\),矛盾。