« 1 2

Linear Algebra Done Right第五章注记和部分习题

注记部分:

1 不同特征值对应的特征向量线性无关的证明

在第一章注记中已经说明,如果对每个  k=2,3,4,\dots,n,都有  (V_1+V_2+\dots+V_{k-1})\cap V_k=\{0\} ,那么子空间  V_1,V_2,\dots,V_k 的和是直和,从而在各个子空间中分别选取线性无关的向量,它们放在一起也是线性无关的。

这里,两个不同特征值所对应的特征子空间的交集显然是{0},这是因为  T 在这两个子空间中的作用是不同的,不可能存在一个非零向量经过  T 的变换之后既是原来的  \lambda_1 倍又是原来的  \lambda_2 倍。
接下来就是仿此用数学归纳法证明  (V_1+V_2+\dots+V_{k-1})\cap V_k=\{0\}。因为  V_1\oplus V_2\oplus\dots\oplus V_{k-1} 是直和,其中的任何一个非零向量可唯一分解为  v=v_1+v_2+\dots+v_{k-1},经过  T 变换之后变成  \lambda_1v_1+\lambda_2v_2+\dots+\lambda_{k-1}v_{k-1},然后用直和的性质证明这是  Tv 表示成  v_1,v_2,\dots,v_{k-1} 线性组合的唯一方式,从而不可能出现在  V_k 中。

2 不变子空间的一些性质

以下几个命题是比较显然的:

命题1: U, V T 的两个不变子空间,那么它们的和  U+V、它们的交  U\cap V 也是  T 的不变子空间。

命题2: U T S 的不变子空间,那么  U 也是  T+S TS ST 的不变子空间。

推论3: U T 的不变子空间, p(z) 是数域  \mathbf{F} 上的多项式,那么  U 也是  p(T) 的不变子空间。

在分析线性变换的过程中,非平凡的不变子空间是很珍贵的,通过这几个命题,我们可以用已有的珍贵的非平凡不变子空间再构造出更多的非平凡不变子空间。比如,如果  T 不可逆,那么  \mathrm{null}\,T \mathrm{range}\,T 都是非平凡的不变子空间。从而  \mathrm{null}\,T+\mathrm{range}\,T \mathrm{null}\,T\cap\mathrm{range}\,T 等等都是  T 的不变子空间,从而也是  p(T) 的不变子空间。(尽管这样做也可能无法得到新的非平凡的不变子空间)

3 "复数空间上线性变换都可表示成上三角矩阵"的证明

本章对这个定理的证明中,在假设结论对所有小于  \mathrm{dim}\,V 维的空间都成立并证明结论对  V 也成立的时候,先将  T 已知的一个一维特征子空间搁置一旁,转而考虑  \mathrm{range}\,(T-\lambda I),这是  T 的不变子空间,且维数小于  \mathrm{dim}\,V,但是不一定只比  V 小一维,它的维数取决于  \mathrm{null}\,(T-\lambda I) 的维数。这样就给分析的思路增加了一些难度和不确定性。当然,幸运的是最后还是顺利地完成了证明,让人觉得这个证明太巧妙了,怎么最初就能想到要考察  \mathrm{range}\,(T-\lambda I) 呢?
但是仿照第九章证明实数空间类似性质的定理的证明方法,可以做出一个更朴实更自然的证明。
证明:假设在维数小于  \mathrm{dim}\,V 的空间上的所有线性变换都可以找到一组基底使得其对应的矩阵是上三角阵,那么在  V 中的一个线性变换  T,因为至少有一个特征值,也就可以找到一个一维的特征子空间  U,再取子空间  W 使得  U\oplus W=V。这样  W 只比  V 少了一维 ,但是不一定是  T 的不变子空间。我们将  Tv 分解为  Tv=P_{W,U}Tv+P_{U,W}Tv,在子空间  W 中可以找到一组基底  v_1,v_2,\dots,v_{\mathrm{dim}V-1} 使得线性变换  (P_{W,U}T)|_W 的矩阵是上三角矩阵,在  U 中取非零向量  u,那么  T 在基底  u,v_1,v_2,\dots,v_{\dim V-1} 下依然是上三角矩阵(要看清这一点,只需考察基底的各个元素在线性变换  T 下的行为)。

4 "奇数维空间上的线性变换必有特征值"的证明

本章的证明方法在本章看来技巧性显得太强了。但其实,如果看到第九章再回过头来看这个定理,是比较显然的。因为不管是实数向量空间还是复数向量空间,线性变换的矩阵都可以是分块上三角矩阵,且对角线上每一块都是1x1或2x2阶的矩阵。那么对于奇数维空间,分块上三角矩阵的对角线上不可能都是2x2阶的矩阵,从而线性变换必然有一维的不变子空间。本章不能直接引用第九章的结论,所以本章的证明其实是利用了第九章的思维方法。现在,我把它写得跟第九章的方法更接近一些,也显得更平易近人一些。
证明:对于一维空间的情形,很显然命题是成立的。假设命题对于维数小于  \dim V 的奇数维空间都成立,现证明命题对奇数维空间  V 也成立。可以取一个一维或二维的不变子空间  U。如果  U 是一维的,那么命题得证,如果  U 是二维的,那么朝着证明  T 有分块上三角矩阵的方向(也是本命题递归的需要),取  W 使得  V=U\oplus W,然后将  Tv 写为  Tv=P_{U,W}Tv+P_{W,U}Tv。如果要证明 T 有分块上三角矩阵,那么接下来的分析方向是应用递归假设取一组基底使得  (P_{W,U}T)|_W 的矩阵是分块上三角矩阵。但这里因为要尽快证明  T 特征值存在,我们把  (P_{W,U}T)|_W 的一个特征向量  v 优先取过来,那么  U\oplus\{av\,|\,a\in F\} 就形成了  T 的一个不变子空间。取  U 的基底  u_1,u_2,那么  T|_{U\oplus\{av\,|\,a\in F\}} u_1,u_2,v 这组基底下的矩阵是如下形式的:
 \begin{pmatrix}a&b&c\\ d&e&f\\ 0&0&\lambda\end{pmatrix}
从这个矩阵中可以很容易看出  \lambda 就是特征值,因为  T-\lambda I 将一个三维空间映射成了二维空间。这一点类似于"上三角矩阵的对角线元素都是特征值"的证明。

其实我觉得既然在本章中证明了复数空间线性变换的矩阵可以上三角化,那么实数空间相应的结论也应该放在这一章,这样既显得结构合理,又不至于使某些定理的证明看上去那么奇巧。

部分习题解答:

4 S,T\in \mathcal{L}(V) ST=TS,证明  \mathrm{null}\,(T-\lambda I) S 的不变子空间。
证明: v\in\mathrm{null}\,(T-\lambda I),那么  (T-\lambda I)v=0,由  ST=TS,得
 (T-\lambda I)Sv=S(T-\lambda I)v=0 Sv\in\mathrm{null}\,(T-\lambda I)

11 S,T\in \mathcal{L}(V),证明  ST TS 有相同的特征值。
证明:只需证明  ST 的特征值都是  TS 的特征值。取非零向量  v,因为当  STv=\lambda v 时, TSTv=\lambda Tv。如果  Tv\not=0,那么我们可以判断  Tv 就是  TS 对应  \lambda 的特征向量;如果  Tv=0,那么相应地  \lambda=0,需要证明  TS 也有特征值0。因为  T 不可逆,所以  TS 不可逆,故  TS 有特征值0。

13 T\in \mathcal{L}(V),任何一个维数为  \mathrm{dim}\,V-1 的子空间都是  T 的不变子空间,证明  T=aI
证明: V 的维数小于3时,结论显然成立。当维数大于等于3时,设  v\in V, v\not=0,将  v 扩充为  V 的一个基底  v,e_1,e_2,\dots,e_n。考察  Tv=av+a_1e_1+\dots+a_ne_n,我们每次去掉一个  e_i 取剩下的基底元素张成一个  n=\mathrm{dim}\,V-1 维子空间  U_i=\mathrm{span}(v,e_1,\dots,e_{i-1},e_{i+1},\dots,e_n),因为它是不变子空间,所以  Tv\in U_i,故  a_i=0,因此  Tv=av。仿照第三章习题24中的做法证明  T=aI(参见本章第12题)。

15 \mathbf{F}=\mathbf{C}, T\in \mathcal{L}(V), p\in P(C), a\in C,证明  a p(T) 的特征值当且仅当存在某个  T 的特征值  \lambda,有  a=p(\lambda)
证明:如果有某个  T 的特征值  \lambda 满足  p(\lambda)=a \lambda 对应的特征向量为  v,那么  p(T)v=p(\lambda)v=av a p(T) 的特征值。
如果  a p(T) 的特征值,其特征向量为  v,那么  p(T)v-av=0,将  p(T)-aI 分解为一次因式的乘积,有  (T-x_1)(T-x_2)\dots(T-x_m)v=0,那么必有某个  x_i 使得  T-x_iI 不可逆,从而  x_i T 的某个特征值。而  x_i 又是方程  p(x)=a 的根,从而证得必要性。

16 上面一题的结论当  \mathbf{C} 替换成  \mathbf{R} 时不成立。
证明: \mathbf{R}^2 上的逆时针旋转  \frac{\pi}{2} 的旋转变换  T,-1是  T^2 的特征值,但  T 本身没有实数特征值。

21 P\in \mathcal{L}(V) P^2=P,证明  V=\mathrm{null}\,P\oplus\mathrm{range}\,P
证明:根据秩-零度定理,只需证明  \mathrm{null}\,P\cap\mathrm{range}\,P=\{0\}
 v\in\mathrm{null}\,P\cap\mathrm{range}\,P,那么  v=Pu,且  Pv=0。因为  P^2=P,所以  v=Pu=P^2u=Pv=0

Linear Algebra Done Right第三章注记和部分习题

注记部分:

1 线性无关性和线性相关性在线性映射作用下的表现

你可能听说过向量空间同构这个概念,两个向量空间 U 和 V,如果它们之间存在可逆的线性映射 T,那么这两个向量空间同构。
从向量空间本身的性质来讲,两个同构的向量空间可以不分你我,对应的向量之间有相同的线性关系,整个空间的维数也相同。
 u_1,u_2,\dots,u_r\in U,那么  u_1,u_2,\dots,u_r 线性相关(无关),当且仅当  Tu_1,Tu_2,\dots,Tu_r 也线性相关(无关)。这是因为, T T^{-1} 都是线性映射,因此  a_1u_1+a_2u_2+\dots +a_ru_r=0 当且仅当  a_1Tu_1+a_2Tu_2+\dots +a_rTu_r=0
那么,如果无法保证  T 是可逆的,我们只能保证当  u_1,u_2,\dots,u_r 线性相关时  Tu_1,Tu_2,\dots,Tu_r 也线性相关,或者当  Tu_1,Tu_2,\dots,Tu_r 线性无关时  u_1,u_2,\dots,u_r 也线性无关。这是很简单的道理。

那么当  T 不是单射时,如果  u_1,u_2,\dots,u_r 线性无关,什么时候可以保证  Tu_1,Tu_2,\dots,Tu_r 也是线性无关的呢?即还需要给  u_1,u_2,\dots,u_r 增加什么样的条件才能保证  Tu_1,Tu_2,\dots,Tu_r 线性无关?
欲使  Tu_1,Tu_2,\dots,Tu_r 线性无关,需要方程  a_1Tu_1+a_2Tu_2+\dots +a_rTu_r=0 没有非零解,而此即方程  T(a_1u_1+a_2u_2+\dots +a_ru_r)=0。欲使此方程没有非零解,需要当  a_1,a_2,\dots,a_r 不全为零时  a_1u_1+a_2u_2+\dots +a_ru_r\not\in \textrm{null }T,也即  \textrm{span}(u_1,u_2,\dots,u_r)\cap \textrm{null }T=\{0\}

因此,有下面的命题:

命题1:  T 是从向量空间  U V 的线性映射, u_1,u_2,\dots,u_r\in U,那么当且仅当  u_1,u_2,\dots,u_r 线性无关,并且  \textrm{span}(u_1,u_2,\dots,u_r)\cap \textrm{null }T=\{0\} 时, Tu_1,Tu_2,\dots,Tu_r 线性无关。

从这个命题出发,不但能启发出值域-零度定理,还可以得到书上关于值域-零度定理的证明思路。并且,这个命题本身应该也是比较重要的。

2 反向思考值域-零度定理

如果不知道值域-零度定理,是否可以知道从低维空间到高维空间没有满的线性映射?
因为  Tu_1,Tu_2,\dots,Tu_r 线性无关时  u_1,u_2,\dots,u_r 也线性无关,这表明值域的维数不可能比定义域的维数大。

我们知道当取定义域中的一组基底  u_1,u_2,\dots,u_n 后, \textrm{range }T=\textrm{span}(Tu_1,Tu_2,\dots,Tu_n)。如果值域的维数比定义域的维数小,那么小了多少由什么来决定的呢?
我们知道在值域的维数比定义域小的时候  Tu_1,Tu_2,\dots,Tu_n 不可能线性无关。那么在  Tu_1,Tu_2,\dots,Tu_n 中选取极大线性无关组  Tu_1,Tu_2,\dots,Tu_r ,其它  Tu_i 可以用这 r 个向量线性表示,即  Tu_{r+i}=f_i(Tu_1,Tu_2,\dots,Tu_r) 也即  T(u_{r+i}-f_i(u_1,u_2,\dots,u_r))=0。因此  u_{r+i}-f_i(u_1,u_2,\dots,u_r)\in\textrm{null }T。设  v_i=u_{r+i}-f_i(u_1,u_2,\dots,u_r),注意到在定义域中, u_1,u_2,\dots,u_n 线性无关,因此  u_1,u_2,\dots,u_r,u_{r+1}-f_1(u_1,u_2,\dots,u_r),\dots,u_n-f_{n-r}(u_1,u_2,\dots,u_r) 也线性无关。而  v_i=u_{r+i}-f_i(u_1,u_2,\dots,u_r)\in\textrm{null }T,因此  \textrm{null }T\supset \textrm{span}(v_1,v_2,\dots,v_{n-r})。接下来就是想办法证明  \textrm{null }T=\textrm{span}(v_1,v_2,\dots,v_{n-r}),从而  \textrm{dim null }T=n-r
 \forall w\in\textrm{null }T, w=u+v 其中  u\in\textrm{span}(u_1,u_2,\dots,u_r), v\in\textrm{span}(v_1,v_2,\dots,v_{n-r})。那么有  v=w-u\in\textrm{null }T。因  Tu_1,Tu_2,\dots,Tu_r 线性无关,根据命题1,可知  v=0。这样就有  \textrm{null }T=\textrm{span}(v_1,v_2,\dots,v_{n-r}),从而  \textrm{dim null }T=n-r。因此值域-零度定理成立。

当然,在历史上,这个值域-零度定理绝对不是从这样的抽象符号和理论的思考中得到的,早在线性代数发展的早期,人们的主要精力集中在对线性方程组的解结构的研究,人们可能是通过线性方程组系数矩阵的秩与解空间维数之间的关系看到了秩-零度定理,从而在后来推广到一般的线性映射上来的。

一个数域  K 上的有限维的线性空间,都同构于  K^n,在有限维线性空间之间的映射也可以与数域上的矩阵构成空间同构,对线性映射零空间的研究也完全等同于对数域上的线性方程组的解空间的研究,那么为什么还会有这种抽象符号表达的线性代数体系呢?它是从什么时候开始出现,它的始作俑者又是谁?它存在的意义究竟有多大呢?

3 值域-零度定理与商空间

对值域-零度定理最透彻最符合直觉的解释是利用商空间和第一同构定理。这方面在一些线性代数书中已经涉及到(如李炯生、查建国版本《线性代数》),请在网络上搜索这方面的内容。

4 映射的逆、左逆与右逆(参见本章练习14与15)

 f 是集合  M N 的映射, i_M i_N 分别是  M N 上的单位映射。如果存在  N M 的映射  g 使得  f\circ g=i_N 则称  g f 的右逆,如果存在  N M 的映射  h 使得  h\circ f=i_M,则称  h f 的左逆。

命题2:  f 有左逆,当且仅当  f 是单射; f 有右逆,则  f 是满射。如果承认选择公理,那么  f 有右逆,当且仅当  f 是满射。
证明: 如果  f 有左逆,即存在  N M 的映射  h 使得  h\circ f=i_M,那么  f(x)=f(y)\Rightarrow (h\circ f)(x)=(h\circ f)(y)\Rightarrow x=y。这说明  f 是单射。
如果  f 是单射,我们可以构造  f 的左逆  h 如下:取定  x_0\in M \forall y\in N,如果 \exists x\in M,f(x)=y,则定义  h(y)=x,否则令  h(y)=x_0。这样定义的  h 就是  f 的左逆。
如果  f 有右逆,即存在  N M 的映射  g 使得  f\circ g=i_N,那么 \forall y\in N, g(y)\in M f(g(y))=y
如果  f 是满射,我们可以用选择公理构造  f 的右逆如下: \forall y\in N,从  y 的原像集合中选取一个  x,令  g(y)=x

一般来讲,如果一个映射只有左逆或只有右逆,那么它的左逆或右逆都不是唯一的。但是如果一个映射既有左逆又有右逆,那么它的左逆和右逆都是相等的。

命题3: f 既有左逆又有右逆当且仅当  f 是一一映射。并且此时  f 的左逆与右逆是唯一确定且相等的。
证明:利用命题2证明第一条,因为  f 是一一映射,并不需要选择公理。
欲证第二条,首先证明  f 的所有左逆相等,所有右逆相等。
 g g' f 的右逆,有  f\circ g=f\circ g',那么因为  f 同时有左逆,取  f 的左逆  h,有  h\circ f\circ g=h\circ f\circ g',即  g=g'。即所有右逆彼此相等。
同理可证所有左逆彼此相等。
接下来证明左逆等于右逆。
 h g 分别是  f 的左逆与右逆,那么  g\circ f=(h\circ f)\circ (g\circ f)=h\circ (f\circ g)\circ f=h\circ f=i_M。这说明右逆同时也是左逆,因此右逆等于左逆。

如果 f 是一一映射时,就把  f 的左逆或右逆称为  f 的逆。

部分习题解答:

2 例举一个函数  f : \mathbf{R}^2\rightarrow \mathbf{R} 使得  f(av)=af(v) 对任意  a\in \mathbf{R},v\in \mathbf{R}^2,但是  f 不是线性映射。
解答: f(x,y)=\sqrt{x^2+y^2}\textrm{sgn }x,这个函数满足题设条件但不是线性函数。

4 T 是向量空间  V 到数域  \mathbf{F} 的线性函数,证明如果  u\in V,u\not\in \textrm{null }T,则  V=\textrm{null }T\oplus\{au : a\in\mathbf{F}\}
证明: \textrm{dim null }T=r,因为  u\in V,u\not\in \textrm{null }T,所以  \textrm{dim }(\textrm{null }T\oplus\{au : a\in\mathbf{F}\})=r+1 (这两个子空间的和是直和)。因  \textrm{dim range }T=1,故  \textrm{dim }V=\textrm{dim }(\textrm{null }T\oplus\{au : a\in\mathbf{F}\}),因此  V=\textrm{null }T\oplus\{au : a\in\mathbf{F}\}

11 证明如果  V 上存在一个线性映射  T 且它的值域与零空间都是有限维的,那么  V 是有限维的。
证明:因为书上证明值域-零度定理时是以  V 是有限维空间为基础,所以直接用这个定理不妥。
 T 的值域维数为 r,零空间维数为 s,我们可以取任意维数的子空间,比如,r+s+1 维的子空间,将  T 限制在这个子空间中,然后利用值域-零度定理,可断定这个子空间的像的维数大于 r,已经超过了整个定义域的像的维数了。

16 U V 是有限维向量空间,并且  S\in L(V,W), T\in L(U,V),证明
 \textrm{dim null }ST \le\textrm{dim null }S+\textrm{dim null }T
证明:因为  STv=0 当且仅当  Tv\in\textrm{null }S,故 \textrm{null }ST=\{v | Tv\in\textrm{null }S\}。设  W=\{v | Tv\in\textrm{null }S\},考虑  R=T|_W,有
 \textrm{dim null }ST=\textrm{dim null }R+\textrm{dim range }R\le\textrm{dim null }T+\textrm{dim null }S

22 V 是有限维向量空间且  S,T\in L(V)。证明  ST 可逆当且仅当  S T 都可逆。
证明:必要性, ST 可逆当且仅当  \textrm{dim range }ST=\textrm{dim }V。因为  \textrm{dim range }ST\le \textrm{dim range }S \textrm{dim range }ST\le \textrm{dim range }T,所以  S T 都可逆。
充分性,当  S T 都可逆时, T^{-1}S^{-1} 就是  ST 的逆。

23 V 是有限维向量空间且  S,T\in L(V),证明  ST=I 当且仅当  TS=I
证明:根据上题,如果  ST=I TS=I 那么  S T 都可逆。则  ST=I 当且仅当  S=T^{-1},当且仅当  TS=I

24 V 是有限维向量空间且  T\in L(V),证明  T=aI 当且仅当对任何线性映射  S\in L(V),有  ST=TS
证明: 如果 T=aI 则显然  ST=TS
如果对任何线性算子  S ST=TS,那么在  V 中任取非零向量  v,取  v,e_1,e_2,\dots,e_n 成为  V 的基底,定义线性映射  S 使得  Sv=v, Se_i=0, i=1,2,\dots,n。则  Tv=TSv=STv=S(av+a_1e_1+\dots+a_ne_n)=av。也就是说任意非零向量  v,存在一个数  a 使得  Tv=av
下面证明任意两个方向上所对应的 a 都相等。
 v_1,v_2\not=0, Tv_1=a_1v_1,Tv_2=a_2v_2,如果  a_1\not=a_2,则这两个向量线性无关,考虑  T(v_1+v_2)=a_3(v_1+v_2)=a_1v_1+a_2v_2,即  (a_3-a_1)v_1+(a_3-a_2)v_2=0,因此  a_1=a_3=a_2,矛盾。
因此  T=aI

第四章 多项式 为非重点章节,并且内容未超出高中数学知识,故略过。

Linear Algebra Done Right第二章注记和部分习题

注记部分:

1 线性无关和子空间直和的联系

线性无关概念和子空间直和的概念有着很密切的联系,如下:

1)二者的概念同源,都是要将一个大的空间的向量唯一地分解成若干小的子空间中向量的和。
2)v1,v2,...,vn线性无关的充要条件是v1,v2,...,vn都不等于0且span(v1),span(v2),...,span(vn)的和是直和。
3)设有若干组向量:向量组u1,u2,...,ur,向量组v1,v2,...,vs,和向量组w1,w2,...,wt,每一组向量都线性无关,把它们放在一起还是线性无关吗?这显然是不一定的。但是怎样才能保证把它们放在一起也线性无关呢?有以下两个结果:
a)向量组u1,u2,...,ur,向量组v1,v2,...,vs,和向量组w1,w2,...,wt,每一组向量都线性无关,则向量组u1,...,ur,v1,...,vs,w1,...,wt线性无关当且仅当span(u1,u2,...,ur)+span(v1,v2,...,vs)+span(w1,w2,...,wt)是直和。
b)若U1+U2+...+Un是直和,那么分别从U1,U2,...,Un每个子空间中任意选出一组线性无关的向量,它们整体还是线性无关的。
可以说a)就是直和空间的维数定理和逆定理。但利用零向量的唯一分解性质也可以很容易地证明上述两个命题。

2 33页定理2.18(dim(U1 + U2) = dimU1 + dimU2 − dim(U1 ∩ U2))的证明思路问题

此定理很自然的思路是寻找各个子空间基底所包含向量的个数关系。因此前半部分比较自然,寻找U1 ∩ U2的基底u1, . . . , um,添加向量v1, . . . , vj使u1, . . . , um,v1, . . . , vj成为U1的基底,再添加w1, . . . , wk使u1, . . . , um,w1, . . . , wk成为U2的基底。
但在证明(u1, . . . , um, v1, . . . , vj,w1, . . . , wk)线性无关的过程中,设
a1u1 + ··· + amum + b1v1 + ··· + bjvj + c1w1 +· · ·+ckwk = 0
之后,怎么能想到要把c1w1 +· · ·+ckwk 和其它向量分别放在等式两边呢?

有了上一条注记中的两个命题a)和b),这个思路就比较明朗,证明多组线性无关的向量放在一起也是线性无关的,无非就是证明span(w1,w2,...,wk)+span(u1,u2,...,um)+span(v1,v2,...,vj)是直和。因为已知w1,...,wk,u1,...,um线性无关,只需证明span(w1,w2,...,wk,u1,u2,...,um) ∩span(v1,v2,...,vj)={0}(见第一章注记)
这就是把c1w1 +· · ·+ckwk放在等式另一边的证明思路。

如果一个人不知道此定理,现在要着手证明这个定理,他会是怎样的思路呢?
首先,他会先考虑两个子空间交于{0}的简单情形,并证明直和的维数等于维数的和,证法见上条评注中的命题a)。接着,考虑两个子空间的交集维数大于等于1的情形,他会考虑把U1+U2分解成几个子空间的直和,很自然的想法就是考虑U1 ∩ U2、U1去掉U1 ∩ U2的那一部分,和U2去掉U1 ∩ U2的那一部分应该可以构成直和(即找两个子空间W,V使得W+U1 ∩ U2=U1, V+U1 ∩ U2=U2,那么应有W⊕U1 ∩ U2⊕V=U1+U2)。
这就是整个证明的思路。证明过后又发现没有必要事先单独证明直和的情形了,因此把直和的维数定理作为此定理的推论。

3 维数定理和有限集合基数定理(容斥原理)

这部分论述见文章《子空间和的维数定理与容斥原理》

部分习题解答:

(略)

Linear Algebra Done Right第一章注记和部分习题

注记部分:

有关子空间和与直和的讨论:

如果 V_1, V_2是向量空间U的两个线性子空间,那么下面两个命题等价(见17页命题1.9):
1) V_1+V_2是直和;
2) V_1 \cap V_2=\{0\}
这种关系是否可以推广到多个子空间的情况呢?也就是说是否有n个子空间两两相交于零点,就说明它们的和是直和呢?

这是不一定的。设想三维空间中三条坐标轴,再加上另一条过原点但异于坐标轴的直线,三条坐标轴的直和就是整个三维空间,显然它们和第四条直线的和不可能是直和。但是可以对子空间的交集提出这样的要求:
对每个 k=2,3,4,\dots,n, (V_1+V_2+\dots+V_{k-1})\cap V_k=\{0\}
如果满足这个要求,那么它们的和就是直和。这个条件也是多个子空间的和是直和的充要条件。证明用数学归纳法很容易。
先把这样一个命题弄清楚了,后面的关于不同特征值的特征向量线性无关的证明思路就变得很容易。

还有一个看似更强的要求,但实际上与上面的那个要求是等价的:
 V_1,V_2,\dots,V_n中任意不重复地取出两组子空间来: V_{i1},V_{i2},\dots,V_{ir}  V_{j1},V_{j2},\dots,V_{js},其中 V_{ik}\not = V_{jl},都满足 (V_{i1}+V_{i2}+\dots+V_{ir})\cap (V_{j1}+V_{j2}+\dots+V_{js})=\{0\}
可以证明这个条件也是若干子空间的和是直和的充要条件。充分性可以利用上面的命题,必要性证明方法类似于命题1.9。

部分习题解答:

9 证明 V的两个子空间的并集也是 V的子空间当且仅当其中一个子空间包含于另一个子空间。
证明:必要性:设 U_1,U_2是要讨论的两个子空间,且 U_1\not \subset U_2,那么 \exists u_1 \in U_1, u_1 \not \in U_2 \forall u_2 \in U_2,因 U_1\cup U_2是子空间,故 u_1+u_2\in U_1\cup U_2。若 u_1+u_2\in U_2,则 u_1=u_1+u_2-u_2 \in U_2,矛盾。因此 u_1+u_2\in U_1,则 u_2=u_1+u_2-u_1 \in U_1。故 U_2 \subset U_1
充分性显然。