为了尽快恢复功力,复习数学分析

用了半个月左右的时间粗浅地略读了《复分析,可视化方法》的前十一章,当然略去了所有加星号的内容和所有习题。整体的感觉是,四两拨千斤,比较精彩,很多以前不知道的问题现在茅塞顿开。但是有些地方的处理方式实在谈不上严格,以至于我在读到某些地方时不由得心存狐疑,他这种演绎发展数学的方式真的能有可靠的结果吗?

Continue reading

指数函数 exp(x) 导数的直接求法

在我读高中的时候,数学课程里是没有微积分的,当时自学微积分,用的是一种很简明的数学手册,里面只有结果没有证明。看到指数函数求导的时候,怎么也想不明白这个  y=e^x 的导数  y'=e^x 是怎么求出来的。

在当时那个信息闭塞的时代,我没有办法直接找到问题的答案,所有的证明都得依靠自己努力思考,才能使很多问题的证明在一定程度上得以补全,这其中包括指数函数求导、牛顿-莱布尼茨公式、反正切函数的泰勒展式等等,都是通过自己的思考来做出的所谓的"证明",当然都是不严格的,但大多数只缺少其中的某个环节罢了,比如  \arctan x=x-\frac{x^3}{3}+\frac{x^5}{5}-\dots,当时想到了两边同时求导,只是对两个重要的环节苦思不解:幂级数逐项积分的合理性和  x=1 时怎么证明右边还等于左边。

Continue reading

Linear Algebra Done Right第十章注记和部分习题

L\inear Algebra Done Right 还有一章总结没有写,现在我的主要数学精力已经转向了另一个更为有趣的方向:复分析,读的是早已经买回的书《复分析,可视化方法》。这是一本读来让人心潮澎湃的书,曾经读了这本书的第一章,开设这个博客很大一部分原因还是想写写读这本书时的一些感受和记录它当中的问题。但三年多没有碰过数学我的数学能力已经回退到最原始状态了。它的译后记中说需要读者"比较认真地读过微积分和线性代数",可是不光线性代数方面本来当初学得就不扎实,就连几年前十分拿手的数学分析我也基本上忘光了(当然初等微积分还记得一些)。我想务必要让自己的数学能力恢复一下再来读这本书,所以后来就读了《L\inear Algebra Done Right》并作了这些札记。

注记部分:

1 一个线性变换可以表示成  ST-TS (其中  S T 也是线性变换)的充要条件

我们知道一个变换如果可以写成两个线性变换的运算  ST-TS 的形式,因为  \mathrm{trace}\,(ST-TS)=0,那么这个线性变换就必须也满足迹为零。但是,是否只要满足这一个条件就够了呢?

这个问题我发在了百度贴吧中,不久被"四元数"解答了,讨论过程见
http://tieba.baidu.com/f?kz=847919631

需要补充的是他提出的另外一个命题:任何一个 trace 为 0 的矩阵都相似于一个对角线上都是 0 的矩阵,或者说,trace 为 0 的线性变换在某组基底下的矩阵其对角线上的元素都为 0。

我们先对二阶矩阵证明一个更强的命题:

命题1:对于一般的2阶方阵,如果这个方阵不是单位阵或单位阵的倍数,那么必然可以相似于一个在对角上含有 0 的矩阵。
证明:设这个方阵为

 \begin{pmatrix}a&b \\ c&d\end{pmatrix}

如果  a,d 其一为 0 则命题得证。故以下假设  ad\not=0
如果  b=c=0,那么可以断定  a\not=d,我们考虑以下相似变换

 \begin{pmatrix}1&k \\ 0&1\end{pmatrix}\begin{pmatrix}a&0 \\ 0&d\end{pmatrix}\begin{pmatrix}1&-k \\ 0&1\end{pmatrix}=\begin{pmatrix}a&kd-ka \\ 0&d\end{pmatrix}

 k\not=0 即可把右上角元素变为非零。故以下假设  b\not=0。那么考虑以下相似变换

 \begin{pmatrix}1&0 \\ -k&1\end{pmatrix}\begin{pmatrix}a&b \\ c&d\end{pmatrix}\begin{pmatrix}1&0 \\ k&1\end{pmatrix}=\begin{pmatrix}a+kb&b \\ c-ka+kd-k^2b&d-kb\end{pmatrix}

由于  b\not=0,那么我们总能取到适当的  k 使得  a+kb=0 c-kb=0。证毕。

再往下就可按照"四元数"说的方式证明结论。

部分习题解答:

8 V 是内积空间且  v,w\in V。定义  T\in\mathcal L(V) Tu=\langle u,v\rangle w,找到  \mathrm{trace}\,T 的表达式。
解1:首先注意到如果  e_1,\dots,e_n V 的标准正交基底,那么

 \mathrm{trace}\,T=\sum_{i=1}^n\langle Te_i,e_i\rangle

 e_1=w/|w|,将其扩充成标准正交基底  e_1,\dots,e_n,那么

 \mathrm{trace}\,T=\sum_{i=1}^n\langle Te_i,e_i\rangle=\langle w,v\rangle

如果  w=0 则显然这个表达式也成立。
解2:也可以用  v 代替上面的  w 做同样的分析,设  e_1=v/|v| 并且  e_1,\dots,e_n 是标准正交基底,那么由于  Te_2=\dots=Te_n=0,则

 \mathrm{trace}\,T=\langle Te_1,e_1\rangle=\langle w,v\rangle

9 证明如果  P\in\mathcal L(V) 满足  P^2=P,那么  \mathrm{trace}\,P 是非负整数。
证明:由前几章习题知如果  P^2=P,那么  \mathrm{range},P\oplus\mathrm{null},P=V
 \mathrm{range},P \mathrm{null},P 中分别取基底,可以组成  V 的基底,并且由于在  \mathrm{range},P 中的每一个向量  v=Pu Pv=P^2u=Pu=v,从而在这组基底下  P 对应的矩阵是对角矩阵,其对角线上的元素只有 1 或 0,它们的和是个非负整数。

15 T\in\mathcal L(V),证明如果对任意  S\in\mathcal L(V) 都有  \mathrm{trace}\,ST=0,那么  T=0
证明: T 在某基底下的矩阵是  A,取  S 是在同样的基底下对应矩阵  A^H(共轭转置)的线性映射,那么显然
 \mathrm{trace}\,ST=\mathrm{trace}\,A^HA=\sum |a_{ij}|^2,由题设条件有  a_{ij}=0,故  T=0

(16题可以用15题的方法,也可用8题解答中用到的事实。17题应用16题结论,注意不等式右边等于  \mathrm{trace}\,T^*T,当选用标准正交基底使得  T 对应上三角矩阵时,可看出左边是小于等于  |Te_1|^2+\dots+|Te_n|^2 的。19题也可用16题的结论,并利用  \mathrm{trace}\,T^*T=\mathrm{trace}\,TT^*,证得  |T^*e_i|=|Te_i|,注意这是对任意标准正交基底都成立的,也就是把任意一个非零向量标准化并扩充成标准正交基底即可得  |T^*v|=|Tv|。)

18 V 是内积空间,证明  \langle S,T\rangle=\mathrm{trace}\,(ST^*) 定义了  \mathcal L(V) 上的内积。
证明:根据 16 题结论,可得  \langle T,T\rangle=\mathrm{trace}\,(TT^*)\ge 0 并且当且仅当  T=0 \langle T,T\rangle=0
由迹的性质,有  \langle S+W,T\rangle=\langle S,T\rangle+\langle W,T\rangle \langle kS,T\rangle=k\langle S,T\rangle 以及
 \langle S,T\rangle=\mathrm{trace}\,(ST^*)=\overline{\mathrm{trace}\,(TS^*)}=\overline{\langle T,S\rangle}
因此  \langle S,T\rangle=\mathrm{trace}\,(ST^*) 定义了  \mathcal L(V) 上的内积。

Linear Algebra Done Right第九章注记和部分习题

注记部分:

1 定理 9.9 的另一种证明

前一章的注记部分中已叙述了复数向量空间上的相应结果的另一种证明,这一章充分利用上一章的结论,就可以用更简单的方式证明实数向量空间的结果--本章定理 9.9。

这个定理重述起来太长,所以这里省略。定理的 (a) 部分与上一章证法完全一样,也不用重复了(注意本章的情形与上一章定理8.10 的情形有些不同,在8.10中的矩阵完全是上三角的,而这里是分块上三角的。好在不论是书上的证明还是我们自己的证明都可以忽略这个区别,因为对角线上二维矩阵块都是没有特征值的,从而减去  \lambda I 之后都是可逆的,考察证明过程,可知只要对角线上的二阶矩阵块都是可逆的,那么对角线上独立的 0 的个数就等于  \dim\mathrm{null}\,T^n)。那么这里只需考虑 (b) 的证明。首先证明以下引理,其实是比较简单也比较重要的结论:

引理1(兼答习题2和习题5): V 是二维实向量空间, T\in\mathcal L(V),那么  T 有特征值当且仅当  T 的特征多项式有实数根。
证明: T 的特征多项式为  p(T),根据定理9.7 前面两段的描述,不论  T 有没有特征值,都有  p(T)=0
那么,如果  T 有特征值,即存在实数  \lambda 和非零向量  v 使得  Tv=\lambda v,则  p(T)v=p(\lambda)v=0,因此  p(\lambda)=0 从而  \lambda p 的实数根。
反之,如果  p 有实根,那么  p(T)=(T-\lambda_1 I)(T-\lambda_2 I)=0 从而  \lambda_1,\lambda_2 其中必有特征值。

现在可以用这个引理把定理9.9 的 (b) 情形转化为 (a) 情形:

 T 的矩阵为

 \begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_m\end{pmatrix}

要考虑的特征多项式为  p(T)=T^2+\alpha T+\beta I,那么考虑  p(T) 的矩阵,其对角线上的矩阵块分别为
 p(A_1),\dots,p(A_m)
如果  A_i 是 1x1 阶矩阵,即是一个实数,那么因为  p 无实根,所以  p(A_i)\not=0;如果  A_i 是 2x2 的矩阵且不以  p 为特征多项式,那么因为  A_i 没有特征值,所以  p(A_i) 将是可逆的;如果  A_i 的特征多项式就是  p,那么  p(A_i)=0,所以,在  p(T) 的矩阵中,其对角线上独立的 0 (即不包含在某个非零的二阶矩阵块中的0)都来源于以  p 为特征多项式的那些小矩阵块,0的个数是  \dim\mathrm{null}\,p(T)^{\dim V},所以有  \frac{1}{2}\dim\mathrm{null}\,p(T)^{\dim V} 个二阶矩阵块以  p 为特征多项式。

部分习题解答:

3 A 是分块对角矩阵

 A=\begin{pmatrix}A_1&& 0 \\ &\ddots& \\ 0&&A_m\end{pmatrix}

其中  A_j 为方阵,证明  A 的特征值的集合等于  A_1,\dots,A_m 特征值集合的并集。
4 A 是分块对角矩阵

 A=\begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_m\end{pmatrix}


其中  A_j 为方阵,证明  A 的特征值的集合等于  A_1,\dots,A_m 特征值集合的并集。
证明:两个题目只需利用以下事实:矩阵  A 可逆当且仅当  A_1,\dots,A_m 都可逆;矩阵  A 不可逆当且仅当存在  A_j 不可逆。以下证明这个事实。
 A 对应的映射为  T,记

 \begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_k\end{pmatrix}


对应的  T 的不变子空间为  U_k
当某个  A_j 不可逆时,考虑子矩阵

\begin{pmatrix}A_1&&* \\ &\ddots& \\ 0&&A_j\end{pmatrix}

它是  T 在不变子空间  U_j 上的限制  T|_{U_j} 对应的矩阵。从而可以找到一个非零向量  v\in U_j,v\not\in U_{j-1} 使得  Tv\in U_{j-1}。则  T 把子空间  U_{j-1}\oplus\mathrm{span}{v} 映射到了比它低一维的子空间  U_{j-1} 中。所以  \mathrm{null}\,T\not={0},即  T 不可逆, A 不可逆。
反之,如果每个  A_j 都可逆,那么显然  T 作用在基底上得到的向量组  Te_1,\dots,Te_n (它们的坐标是  A 的列向量)是线性无关的。

注:这两题也可以把对角线上的每个矩阵子块都分别化成分块上三角的,自然得出结论。

8 证明不存在  T\in\mathcal L(\mathbf R^7) 使得  T^2+T+I 是幂零变换。
证明:第一,因为  T^2+T+I 无实数根,所以根据本章结论, \dim\mathrm{null}\,(T^2+T+I)^{\dim V} 是偶数,不可能等于 7。
第二,奇数维的实数向量空间上的线性变换有特征值,即存在实数  \lambda 和非零向量  v 使得  Tv=\lambda v,那么  (T^2+T+I)^{\dim V}v=(\lambda^2+\lambda+1)^7v\not=0
(10题可利用8题的结论,11题利用10题的结论)

14 V 是 2 维向量空间而  T\in\mathcal L(V),证明如果
 \begin{pmatrix}a&b \\ c&d\end{pmatrix}
 T 的矩阵,那么  T 的特征多项式为  p(z)=(z-a)(z-d)-bc
证明:如果  V 是实向量空间而  T 没有特征值,那么根据特征多项式的定义,结论显然成立。
如果  T 有两个相异的特征值,那么因为  p(T)=0,可知  T 的两个特征值都是  p 的根,根据特征多项式的定义知结论成立。
如果  T 只有一个特征值  \lambda,此时分两种情形:第一,如果这个特征值的特征子空间维数为2,即  T=\lambda I,那么必有  b=c=0,且  a=d=\lambda,结论成立;第二,如果这个特征值的特征子空间只有1维,那么存在非零向量  v 使得  (T-\lambda I)v\not=0。因  \lambda p 的其中一个根,所以  p(z)=(z-\lambda' )(z-\lambda),因此有  p(T)v=(T-\lambda' I)(T-\lambda I)v=0。因为  (T-\lambda I)v\not=0 且已经假设  T 只有一个特征值,所以  \lambda'=\lambda p(z)=(z-\lambda)^2

【转】丘成桐:漫谈微分几何

今天很高兴能够在各位面前讲讲我做学问的经验,可以供大家参考一下。我讲「如何学好微分几何」的题目,主要是想跟大家讲讲有关于从前我做学问的态度,因为我是做几何的,所以我就讲做微分几何。很明显的,大部份的同学不会选几何,不过没有关系,其实就是讲讲我做学问的态度。

首先,讲讲我从前的一些经验。我从前在香港长大,在香港念中学、大学,然后到美国念研究所,所以至少在前一半跟大家的经验应该差不了太远,不过是时代有点不同。我在多年前念数学,你们现在念数学,看法上已经有许多不相同,事实上我也不太了解你们现在的想法。不过基本上,我们都是中国文化出生的,所以我想仍有一部份共同的地方。基本上我们是要讲怎么作科学研究,也就是纯科学的研究,我们要看的是我们的志向是怎样的。假如我们想做一个好的科学家,当然我讲的是怎么做一个好的数学家。先说我自己的经验,我从前在香港培正中学念中学的时候,就开始对数学有兴趣。当然还有一些其它的课程,我对数学有兴趣,一方面是受到我家庭的影响,我父亲是做哲学的,所以对于念数学一直都相当鼓励,到了中学以后,我父亲去世了。不过也因此对于自然科学有很浓厚的兴趣。另一方面受老师的影响也很大。我想很重要的当我们开始要做一个学问,尤其是你真的要做一个出色的科学家,跟你的兴趣和你一开始所立下的志向有很大的关系。就是说,开始的时候你期望能够做到什么。假如说开始的时候你根本不想做一个好的科学家,那么你就永远也不可能做一个好的科学家。从前有位大学老师跟我讲说:「假如你不买马票,你永远也中不了。」倒不是说我鼓励你们去买马票,是说假如你不准备做好的科学家,就永远也做不了一个好的科学家。不过是不是讲,你想做一个好的科学家,你就可以做个好的科学家呢?当然不是,你还要有很多其它的因素在里面,我想第一点是要你将做人的目标先决定。

我在国外二十多年了,也教了不少的学生,有些在世界上算是很出名,但有些不是太行。从这方面来讲,比较好的学生和不好的学生我可以晓得不同的经验。我想好的学生大部份一开始就决定他要做到什么程度的科学家,从很早就可以看得出来,因为有了志向以后,才晓得怎么去用功、怎么去花时间在上面。这看起来倒是老生常谈,因为你从小学、中学到大学,大概很多老师都跟你讲同样的意见,可能你听多了都觉得没有什么意思,但是事实上这是成功的第一个因素。我的一位老师跟我讲,你要决定以后你想做什么,讲明了,不是为名就是为利。当时我很惊讶,老师为什么讲这一句话。我们不能否定大部份的想法不是为名就是为利,同时这个想法也推动了不少科学的研究。不过我们也晓得,单是为名为利不可能将科学达到最高峰的研究,我们一定要对这个科学有浓厚的兴趣。我们应当晓得,做科学,我们有一个很纯正的想法,就是对真理的追寻,在真理的背后有一个很漂亮的境界在里面,我们到了一个境界以后,对我们追求学问的人来讲,是无法抗拒的,就算是没有名没有利,我们也希望能够将这个真理搞清楚。举例来讲,如果你喜欢下棋的话,有时你会晓得下到一半的时候,结局会是怎样,你非为名也非为利,当然可以讲说你是为了好胜,但是有时候你总是想追求,想晓得怎么解决这个问题。在科学上来讲我们要追求的是比这个高的境界。我为什么讲为名为利这个事实呢?举例来讲,我们这几年在哈佛大学里教了几个在大学里念数学念得很好的学生,可是到了毕业的时候,我晓得他们明明对数学有很大的兴趣,但是他们选取了完全不同的途径,他们有些人宁愿选取做生意或是到银行里面做事。我并不反对你们去做生意、赚大钱,我失望的缘故是因为这些学生明明是对做学问兴趣特别大,但是他们没有办法去抗拒赚钱的引诱而放弃了继续做学问的前途,有些人甚至过了几年赚了钱,又想重新再做学问,但问题是无论你资质有多好,一般来讲你将做学问的机会放弃以后,再想重新做起将会遇到许多困难。并不是说不可能,也曾有这种情形发生过,但是真正能够达到的情形,几乎是绝无仅有,做学问是不能中断的。我遇见过很多朋友,有些甚至是很有名的数学家,他们有些人会讲我现在一方面做行政的工作,一方面可以做学问,可是事实上,这是没有办法可以达到两者兼顾的情形。我们晓得做学问几乎是全心全意的工作,当对证明追寻的时候,很难说受到其它外界的打扰,仍能够达到很高的成功的。以我的经验来讲,在想问题的时候,晚上睡觉也在想这个问题,躺在床上也在想,早上起床第一件事就是想这个问题。我并不是讲你们也要这样子,我是希望你们在遇到一个问题要解决的时候,你要全力以赴,不可能在中间慢慢想一点而在其它也可以花点功夫,这样精神不集中的态度是不可能做好学问的。我想对大家做个建议,假如你想做个真正的好科学家的话,就不能够再往回走,假如你想做生意,那干脆一开始就不要想这个问题,并不是你要做个好的教员就要照我刚才讲的,要花这么多功夫,倒是要念好科学这是很重要的,所以这是第一点,立志很重要。

第二点我要讲的,我在国外多年,遇见过许多很出名的数学家,甚至许多有名的物理学家我也见过许多。在我认为并没有一个是真正的像一般报纸上所讲的是天才,在我所亲身认识的大科学家,都是经过很大的努力,才能够达到他所达到的成就。我的学生问我:「为什么你做的比我好?」,我说很简单,我比你用功。我在办公室或是在家里边,我天天在想问题,你们在外面玩,而我花了功夫在解决想了很久的问题,我总比你不想、不花时间成就大一点。你可能去听个大科学家或大数学家演讲,你会觉得漂亮得不得了,怎么一个人能够讲得这么好!这个人是个天才!可是你有没有想到,他在后面准备花了多少时间想这个问题?大概你们听过最出名的科学家费因曼,《费因曼物理》注1漂亮得不得了,所有出名的物理学家都这么讲,去听的人不是学生,都是老师或物理学家。费因曼在准备费因曼物理的时候是什么事都不做,就只有脑子在花功夫,整天在想这个问题,跟许多学生不停的在谈这个问题。费因曼是个有名的天才,可是他准备这个研究也花了许多不同的功夫。我想很多出名的科学家在有所表现出不同的时候,你会觉得他是天才,事实上他用在后面的功夫都是很不少的。

有许多很聪明很厉害的人可能是研究生甚至是教授,往往你给他一个问题,他可以很快给你一个答案,同时是很不错的一个答案。可是很多这样出色的学生或是教授,过了很久以后,你总会觉得他没有做出很好的成绩出来。问题是,你解决的问题太容易了;没有再花很多精神去考虑这个问题。尤其在我们中国人最缺乏的,就是在做中学生或是大学生的时候,没有将一个问题从头到尾仔细考虑清楚,并没有真正的全部了解,这是个很重要的问题。从一个很小的问题,我们可以引发很多不同而且有意
思的问题。思考要自己训练,不单是在联考或在大学的时候,老师出个题目,你考了一百分就完了,假如这样的话,你很容易就满足你自己,你不觉得问题有什么意思。往往出名的研究是在很平凡的问题里面,不停的思考所找出来的,很多人因为很快将问题解决了,便不愿再想下去,所以不能够再启发新的东西。科学的研究,不是解决人家已经晓得的问题。当一个科学家问一个好的问题的时候,即是成功的一半。因为科学的推动是从不断的找寻新的问题,新的方向出来的,解决从前的问题虽是个重要的推动方向,可是我们还要找出新的方向,而不单是解决从前的问题。我们知道在物理上解决问题的时候,往往大的或出名的公式是将前面固定的理论推翻,而找出新的路子。为什么大数学家或大物理学家能够做到这个地步呢?因为他们不断的问问题。有时候在一般人来讲很明显的问题,在出名的科学家看起来,就不见得很明显。为什么不明显呢?因为我们有不同层次的问题要一路考虑下去。问问题的能力是一个很重要的训练,并不是花很多功夫就可做到,我想在我们中国的小学、中学或大学里都没有很好的做到这一点,我想从小应该做到这一点的。

在我们来看数学跟其它物理、化学或生物等实验科学有那些不同?物理或化学等科学是从一般实验、现象界所找的题目,最后再经过实验的证实,才能算是个成功的理论。理论物理学家可以发展很多不同漂亮的理论,但最后假如不能够在实验里做出来的话,对物理学家来讲就是一篇废话。数学家有个好处。就是说,我们做了学问,一方面大部份是从一般的科学里面产生给我们的,一方面可以当作文学作品来欣赏。我们的取材多采多姿,一方面是比较基本的,从自然界或物理上的基本粒子、广义相对论、重力场去拿出很多基本的大自然的问题。这方面对近代几何学上的影响很大,另一方面可从比较没那么基本的理论里发生出来。所谓不基本,并不是说不重要。我们要了解到我们有些问题是从工业界来的,譬如说做飞机、做螺丝,甚至做流体变动的问题,都是可产生许多有趣的几何问题或是数学问题。例如说机械人手怎么去拿东西?这都可以看做是基本的几何问题,物理学家不一定有兴趣,可是数学家却有很大的兴趣。另外我们也可以对与实际问题不相近的问题产生兴趣,我们对一个图画得漂不漂亮,我们也可以在数学上研究。几何在数学上的取材有三个不同方向:第一是从基本自然界里产生的问题。从基本粒子、重力场到电磁波基本上如何产生的种种重要几何问题,从表面上你看不出来为什么它跟几何有关,但事实上近代物理将很多这种基本场论的问题变成几何问题,对微分几何来讲有很大的贡献。第二是刚才所讲,工业界与古典力学出了很多很重要的几何问题。第三就是纯粹从美的观点来找问题。举例来讲,从数论里面找了许多很漂亮的问题,尤其是近十或二十年来,大部份重要的数论问题大多是用几何的方法来解决的,这是几何在数学上三个重要的取材方向。

我为什么讲取材的问题呢?因为很多中学生或大学生在念几何或是某些数学课程的时候,认为我们念那个学科就念那个学科就够了,而不要念其它的学问,这是个很错误的观念。因为数学里面每一门的学问都有密切关联的,不单是数学,其实所有的理论科学中间都有很密切的关系。例如我们刚刚所讲的,高能物理与数学的关系,或是化学甚至生物都跟数学有很大的关系,所以我想怎么学几何呢?第一点是当你决定好要做一个好的几何学家时,你一定要广泛的学不同的学问,基础要比较广,如微分方程代数、物理学以及其它学科,至少在心理上有个准备,就是说这些学科将来是对你有帮助的。你听起来会觉得这是很困难的事情,你不可能学会这么多种不同的学问。这主要的分别就是你要有一个层次,你的专科是那一方面,就要多学一点,但不可忘掉其它的学科。有时在某个意义下,我们可以很惊讶的看到同一个学问、同一个命题,在两个不同的学科里面,可以以不同的方法出现,就是说以不同的方法证明。我想主要的原因是根本上这两个学科的分别并不是很大。在几十年前有个出名的物理学家说数学有不可思议的力量。为什么数学能够在物理上有这么大的影响呢?因为从物理学家的看法,数学家祇是在玩一些简单的符号,纯粹是在家里想一些自己的问题,与自然界的关系好象不大,其实这是个错误的想法。我们数学家研究的问题是很具体的,只是有不同的层次,所以有点不同而已。举例来说我们研究微分几何上一个最简单的图形-圆球,这圆球可以说是一个抽象的观念,我们也可以说它是自然界很具体的一部份。也就是说我们将所研究的圆球视为自然界的一部份,其实跟物理的现象差不了太远的。尤其在现代的高能物理里,我们研究基本粒子,尤其到了量子力学的观念以后,因为能量已经到了很高的地步,所以有很多根本没有办法做实验,所以基本上也是在家里或课堂里或办公室里用纸笔来算,这跟数学家想象的差不了太远。假如物理学家可以这么做,表示数学家也能够坐在家里面而对自然界达到某种程度的了解。

为什么我要讲这些呢?这些与微分几何有什么关系呢?我要讲的是你在选题的时候,我们虽然有个自由度对于选题与自然界无关,但是我们也有一个限度在里面,假如我们选的问题与现实相差太远,最后我们的命题会被淘汰掉。在历史上出现很多不同的研究,过了十年、二十年后就完全被淘汰的。你看现在的图书馆里面有许多的文章出现,不过再过个十年八年以后,我想大部份的文章是会被淘汰掉的,根本在整个数学历史上起不了任何作用。这是因为很多的文章实在没有解决问题,其次是对我们研究的对象没有产生任何效果。所以虽然我们数学界不用时间来做证明,可是我们有某种程度的测试。一般来讲,证的很好的数学,二十年或五十年内都可以看到它在现实里出现帮助。我们晓得在这个二十年以来,从前许多不重要的问题,在今日的工程上发生很大的影响。举例来讲,从前在数论里对于质数的搜查这个问题,这完全是一个无聊的命题。就是说一个很大的数,你怎么将它因子分解得很快。近十多年来,在国防科学上这问题变成一个重要的命题,有许多国防科学家在做这方面的研究,所以说数学上的选题很重要。为什么因子分解很重要呢?表面上看来跟真正的用途好象没有什么关联,可是它是一个很自然的问题,一个很大的整数它怎么分解,很快地,表面上并不重要,但可以帮助我们了解质数的分布情形,所以我说选题是一个很重要的问题。我记得从前我们在做大学生的时候,花了很多功夫去念一些文章与参考书,有些对数学来讲是很无意义的,可是反过来说因为花了很多功夫,所以可以了解到有些问题比较重要,有些问题比较不重要,所以花的功夫并没有白费。

其次我们讲做一个学生应该是怎么一个看法。对于做数学或做微分几何来讲,我觉得研究的气氛很要紧,尤其在中国的环境里
,好象是不太容易培养出这种气氛来。假如你旁边的朋友或同学跟你谈的都是其它的问题,譬如说股票涨了或跌了或其它问题,久而久之,你大概对于做学问也没有很大的兴趣,所以培养做学问的态度与你交的朋友、跟的老师的关系很大。如果你们时常讨论学术上的问题,你就不会觉得自己很孤单,能够激励你对数学上有更大的兴趣。假如你自暴自弃,就是说你认为自己不能够在数学上做研究,不能够在数学上达到贡献的话,你永远也达不到,而且同时也影响到你旁边的朋友,使得大家都不能向前走。我们晓得许多出名的数学家甚至在牢里也可以写一些出名的文章,倒不是你永远关在牢里就能做好的文章,是说人在最困难的时候也可以做研究。除了气氛很重要外,你也需要得到先进的支持,从前我们念中学的时候,念了很多关于做学问的方法,从前觉得很好笑,以后念书念得多了以后就觉得这些很重要,事实上这些是很重要的经验。有句话说「学而不思则罔,思而不学则怠」,你单是学而不想是不行的,你单是想而不学也是不行的,这两句话看起来很简单,其实就是怎么分配你的学习跟思想,这是一个很微妙很重要的问题。一个人无论你多用功多天才,你假如不将前人做过的东西去体验去学习,是不可能做好的。这道理很简单,一个人的智能有限,我们不可能与前面十年、五年所有人做过的加起来的智能相比,我们要靠前人的经验,要靠他们的启发,才能够向前迈进,虽然有人自夸的讲比他们加起来都行,我不相信这种情形,也没见过这种情形。所以出名的贡献如爱因斯坦、牛顿的贡献,也是在前人的成果方面再向前走一大步或一小步。所以学是一定要的,可是如果你学过这个东西以后而不去思考,不去消化,就算你可以考第一,考一百分,但是你不想是绝对没有用的。我们看过很多出名的天才,十二岁就拿到学士学位,甚至拿了很高分,可是往往我们看不出他以后的成就。为什么很多所谓的天才在以后的科学发展里没有任何的贡献?这是因为他们没有思考,没有思考在科学上完全不会引起任何的波澜、任何的贡献,对于整个科学完全没有好处。所以学了以后一定要思考,怎么分配你的学习跟思考就往往要有导师的帮忙或是同学的帮忙。所谓的帮忙并不是说老师跟你讲你应当这么做或应当怎么做,这样往往是没有很大的效果,所以我刚刚讲的气氛很重要。从人家用功的程度或是讲话的态度的启发,或是讲话的时候能够去听,追根出什么东西来,从它而得到很大的帮助。从前我到柏克莱去念研究所时,我花了很多功夫去听很多不同的科目,有些人觉得很奇怪,为什么我会去听那些课?我觉得这些课对我有好处,过了几十年后我还是觉得有好处。有些课在我去听的当时可能不懂,可是听了还是觉得有好处,因为一个人的脑袋的想法并不是那么简单的,有时候某些东西当时可能不懂,可是慢慢的就能领悟很多东西。我举例来讲,我做博士论文的时候,我刚好要用到群论的东西,当时我问过许多专家,但是都不懂,我突然想到从前在某一课上听过一个有关这方面的论文,我忘了当时讲什么课,但我记得大概在那里可以找这方面的文章,所以我花了2天的时间在图书馆,结果给我找到差不多是我所要的文章。假如当初不去听这门课的话,我完全没有这个机会,所以有时候听一门不懂的课,有很多不同的帮助,所以很多研究生我跟他们讲,你们去听课不一定要懂,你坐在那边总比不坐在那边好,你不坐在那边的话,你完全不可能知道有其它的方法。

我想最后还是你对整个学问有多大兴趣的问题,假如你对这个学问兴趣不大的话,你没办法长年累月的坐在图书馆,坐在办公厅里,或是坐在一个课堂上听课,所以你一定要先决定你对这学问的兴趣有多大,当然做研究还有许多其它方面比较复杂的原因,以后有机会我们再讲下去。我想现在你们在大学的阶段,最要紧的是决定以后你要做什么东西,其它的可能就容易做到了。