指数函数 exp(x) 导数的直接求法

在我读高中的时候,数学课程里是没有微积分的,当时自学微积分,用的是一种很简明的数学手册,里面只有结果没有证明。看到指数函数求导的时候,怎么也想不明白这个 \( y=e^x\) 的导数 \( y’=e^x\) 是怎么求出来的。

在当时那个信息闭塞的时代,我没有办法直接找到问题的答案,所有的证明都得依靠自己努力思考,才能使很多问题的证明在一定程度上得以补全,这其中包括指数函数求导、牛顿-莱布尼茨公式、反正切函数的泰勒展式等等,都是通过自己的思考来做出的所谓的”证明”,当然都是不严格的,但大多数只缺少其中的某个环节罢了,比如 \( \arctan x=x-\frac{x^3}{3}+\frac{x^5}{5}-\dots\),当时想到了两边同时求导,只是对两个重要的环节苦思不解:幂级数逐项积分的合理性和 \( x=1\) 时怎么证明右边还等于左边。

\( y=e^x\) 的导数也是自己想出的”证明”:

因 \( \frac{\Delta y}{\Delta x}=e^x\cdot\frac{e^{\Delta x}-1}{\Delta x}\)
所以只需要证明极限
\( \displaystyle\lim_{\Delta x\to 0}\frac{e^{\Delta x}-1}{\Delta x}=1\)
即可。

怎么证明这个极限是 1 呢?那就要用到 “e” 这个数的定义了,因为不是所有指数函数的导数都是它本身的。那么 “e” 表示什么呢?它是一个极限:
\( \displaystyle e=\lim_{n\to\infty}(1+\frac{1}{n})^n\)
我把它换一种写法表示:
\( \displaystyle e=\lim_{\Delta x\to 0}(1+\Delta x)^\frac{1}{\Delta x}\)
这样,这里的 \( \Delta x\) 正好和导数极限里的指数 \( \Delta x\) 相互抵消,得到
\( \displaystyle \lim_{\Delta x \to 0} \frac{e^{\Delta x}-1}{\Delta x}=\lim_{\Delta x \to 0}\frac{(1+\Delta x)^{\frac{1}{\Delta x}\cdot \Delta x}-1}{\Delta x}=1\)
这样就算”证明”出了这个极限确实是1。当时也有些顾虑,不知道这样的替换是否合理,但对于一个高中生,能用一种自己可以接受的方式去理解这个东西已经很不错了。

到大学之后,ε-δ语言成了数学学院师生们炫耀的资本,严格性是权威教授们手里挥舞的大棒,我自己对这个问题的想法被告知”不严格”,不得不抛弃掉。取而代之的是一般数学分析教材中的做法,先求另一个重要极限
\( \displaystyle\lim_{x \to 0}\frac{\ln(1+x)}{x}=\lim_{x \to 0}\ln(1+x)^\frac{1}{x}=1\)
然后再设 \( x=e^t-1\),令 \( t \to 0\) 则 \( x \to 0\),这样就得出了
\( \displaystyle \lim_{t \to 0}\frac{t}{e^t-1}=\lim_{x\to 0}\frac{\ln(1+x)}{x}=1\)

不可否认的是,这种方法非常巧妙,也确实是这个问题的最简洁的证法,但总觉得在思路上显得不够直接,有点绕,难道求一个关于指数函数的极限就必须先绕到对数那里,再通过变量替换绕回来吗?自己的思路就真的一无是处无法补救吗?就没有一个想法上更直接的,同时也很严格的证明指数函数导数的方式吗?

一直对这个问题耿耿于怀,直到最近,在复习数学分析的时候,有了一些思路,应该可以不借助对数函数而直接求出指数函数的导数,而这思路就是把高中时那个粗浅的证明方法的漏洞补全。我们依然从 e 的定义开始。

众所周知,e 在通常的分析教材中被定义为
\( \displaystyle e=\lim_{n \to \infty}(1+\frac{1}{n})^n\)
右边的极限的存在性是教材中单调有界原理的例题。我们这里稍微用一点小技巧,先证明序列 \( (1+\frac{1}{n})^n\) 严格递增,序列 \( (1+\frac{1}{n})^{n+1}\) 严格递减且有下界,从而有极限,而这两个序列极限相等,定义为常数 e,这样既可以避免繁琐的二项式展开,又可以证明一个重要不等式
\( (1+\frac{1}{n})^n<e<(1+\frac{1}{n})^{n+1}\)

证明:当 \( n>1\) 时,利用均值不等式有
\( \displaystyle \frac{1+\frac{1}{n}}{1+\frac{1}{n-1}}=\frac{n-1+\frac{n-1}{n}}{n}>(\frac{n-1}{n})^\frac{1}{n}\)
因此
\( \displaystyle(1+\frac{1}{n})^n>(1+\frac{1}{n-1})^{n-1}\)

同样的,
\( \displaystyle \frac{1+\frac{1}{n-1}}{1+\frac{1}{n}}=\frac{n+\frac{n}{n-1}}{n+1}>(\frac{n}{n-1})^\frac{1}{n+1}\)
因此
\( \displaystyle(1+\frac{1}{n-1})^n>(1+\frac{1}{n})^{n+1}\)

而 \( (1+\frac{1}{n})^{n+1}\) 有一个自然的下界 1,从而这个序列有极限。那么显然 \( (1+\frac{1}{n})^n\) 也有极限并且两个序列的极限相等,记为 e,且由于它们的单调性有
\( \displaystyle(1+\frac{1}{n})^n<e<(1+\frac{1}{n})^{n+1}\)
证毕。

利用这个不等式,我们可以证明
\( \displaystyle\lim_{n \to \infty}n(e^\frac{1}{n}-1)=1\)
证明:设 \( a_n=(1+\frac{1}{n})^n,b_n=(1+\frac{1}{n})^{n+1},f(x,n)=n(x^\frac{1}{n}-1)\),那么
\( 0<f(e,n)-f(a_n,n)<f(b_n,n)-f(a_n,n)=\) \( n(1+\frac{1}{n})((1+\frac{1}{n})^\frac{1}{n}-1)\)
接下来就是研究右边这个关于 n 的极限,设
\( (1+\frac{1}{n})^\frac{1}{n}-1=t\),那么根据伯努力不等式,有
\( 1+\frac{1}{n}=(1+t)^n \ge 1+nt\),从而有 \( nt \le \frac{1}{n}\),因此有
\( \displaystyle \lim_{n \to \infty}(f(e,n)-f(a_n,n))=0\)。

因为 \( f(a_n,n)=1\),所以 \( \lim_{n \to \infty}f(e,n)=1\),这就证明了结论。

进一步的,将离散的变量 n 变为连续变量 x,再变为倒数 1/t,这些步骤比较简单,不一一赘述。

8月31日更新:

昨天又想到一种新的做法,也是不需要对数函数的。

根据幂函数在 \( (0,+\infty)\) 的连续性和 \( \lim_{x\to \infty}(1+\frac{1}{x})^x=e\) 有

\( \displaystyle \forall t \in \mathbf R, \lim_{n \to \infty}(1+\frac{t}{n})^n=e^t\)

用这个事实,可以把要求的极限写成

\( \displaystyle \lim_{t \to 0}\lim_{n \to \infty}\frac{(1+\frac{t}{n})^n-1}{t}\)

做不等式估计:当 \( |t|<1\) 时,有

\( \displaystyle \left| \frac{(1+\frac{t}{n})^n-1}{t}-1 \right|=\left| \frac{\mathrm C_n^2}{n^2}t+\dots+\frac{\mathrm C_n^n}{n^n}t^{n-1} \right|<\frac{|t|}{1-|t|}\)

依次令 \( n \to \infty\) 和 \( t \to 0\) 可得结论。

进一步的,一般的数学分析教材中都会在数列极限部分证明

\( \displaystyle e=1+1+\frac{1}{2!}+\dots+\frac{1}{m!}+\cdots\)

用完全相同的方法,可以证明当 \( t \ge 0\) 时,\( e^t\) 的麦克劳林展式也成立:

\( \displaystyle e^t=1+t+\frac{t^2}{2!}+\dots+\frac{t^m}{m!}+\cdots\)

这是不用微分学证明的级数展开式。可惜的是,我现在没有找到 \( t<0\) 时的简洁证法。可以利用幂级数取倒数的方法,但这种方法一般的数学分析教程里没有。