怎样用一般幂函数的积分公式理解\(y=1/x\)的积分

前一篇文章用了做定积分最原始的方法——分割做和取极限的方法重新理解了\(y=1/x\)积分中自然对数的来源。本篇文章回答上一篇中提出的问题:怎样把\(y=1/x\)的积分嵌入到常规幂函数积分公式\(\int x^a\mathrm dx=x^{a+1}/(a+1)+C\)中。

如果你试图从公式\(\int x^a\mathrm dx=x^{a+1}/(a+1)+C\)推导\(y=1/x\)的积分,多半会失败,因为把\(a=-1\)带进去,等式右边的分母为零,分子在\(x\neq 0\)时变成了\(1\),整个式子变得没有意义。实际上\(y=1/x\)是幂函数里唯一一个另类,它的积分非但不能简单地从普通幂函数积分公式中得出,其结果反而超越了幂函数的范围。怎样理解这样的不和谐?昨天因为写前一篇文章的缘故,头脑中闪过另外一个念头,最后竟然成功地解释通了这个困扰多年的问题。

这个解释使用幂函数求导公式
\[(x^a)’=ax^{a-1},\> x>0\]
以后的推导中我们都假定\(x>0\),不加赘述。为了使等式右边宝贵的\(x^{a-1}\)不被取\(0\)值的\(a\)破坏,我们把\(a\)移到等式左边:
\[\frac{(x^a)’}{a}=x^{a-1}\]
接下来注意,当\(a=0\)时,等式右边就是我们想要的\(x^{-1}\),但等式左边变成了\(0/0\)。这时自然想到用极限的过程代替直接取值,即令\(a\to 0\),看看等式左边趋于什么极限?这时\(a\)就被理解成一个变量了,我们还是用字母\(y\)代替\(a\)比较好,同时,这里的导数也变成了偏导数:
\[\frac{\partial _x x^y}{y}=x^{y-1}\]
变一下形式理解等式左边:
\[\frac{\partial_x x^y-\partial_x x^0}{y}=x^{y-1}\]
令\(y\to 0\),得到
\[\left. \partial_y(\partial_x x^y)\right |_{y=0}=x^{-1}\]
如果两个偏导符号可以换序,那么我们就能够得到
\[\partial_x(\left. \partial_y x^y\right|_{y=0})=x^{-1}\]
这样等式左边括号里面的函数就是我们要求的函数。括号里面的函数是什么呢?\(\partial_y x^y\)这是个指数函数的求导,\(\partial_y x^y=\partial_y e^{y\ln x} =x^y\ln x\),所以括号里的函数正是\(\left. \partial_y x^y\right|_{y=0}=\ln x\),于是有
\[(\ln x)’=\frac{1}{x}\]
那么上面的两个偏导符号是否可以换序呢?从多元变量分析中得知,当两个二阶偏导数之一在点\((x,0)\)的某个邻域内存在且连续时,两个二阶偏导可以换序。那么计算其中一个二阶偏导数得到(注意:这里只能考察这个二阶偏导,因为另一个二阶偏导在计算的过程中应用了对数函数的导数,这在此时是不合理的。)
\[\partial_y(\partial_x x^y)=x^{y-1}+yx^{y-1}\ln x\]
容易知道它在\((x,0)\)附近都是连续的,这样就保证了这种做法的合理性。

这种方法表面上是兜了一大圈,但它也提供给我们另外的信息:\(y=1/x\)的积分其实没有那么特殊,它是普通幂函数积分公式的一个极限结果。

用定积分的定义计算双曲线下方图形的面积

这篇文章中的内容是逛百度贴吧时的一个意外收获,贴子地址为

http://tieba.baidu.com/p/3475129628

利用微积分的知识可知,反比例函数 \(y=1/x\) 的不定积分是 \(\int \frac{1}{x}\mathrm d x=\ln x+C\),由此得出,贴子中出现的阴影部分的面积要用对数表示,设\(A\)的纵坐标和  \(B\)的横坐标分别是\(y\)和\(x\),那么这个面积是\(1+\ln x+\ln y\)。由此也可以得出,当\(x\)与\(y\)都趋于无穷大时,面积的表达式也趋于无穷大,所以双曲线与坐标轴之间的面积为无穷大。

很多人在学习数学的时候仅仅满足于知道一个结论,或者满足于弄懂书上给的证明,就以上提出的面积问题,通过牛顿-莱布尼茨公式求面积的方法自然是非常普适的方法,任何人也不会怀疑由它得出的结论。但是,从我一开始初学微积分的时候就对这个结论充满好奇,总是在想,如此简单的反比例函数怎么和对数函数联系在一起了呢?反比例函数仅比多项式函数稍微复杂了一点,为什么它的积分是个超越函数?而且,这是幂函数里唯一的一个“特殊分子”:其他的幂函数的积分都还差不多是幂函数,只有\(y=1/x\)这个怪物。

牛顿-莱布尼茨公式是一种解释,但这种解释很难让人有切实的体会。受上面那篇贴子中问题的启示,我找到了另外一种更直观、更初等的计算这个面积的方法,可以让人在图中切切实实地“看到”一个对数函数出现的过程。需要用到的知识:定积分计算面积的思想方法(分割、做和、取极限),以及一个有关\(e\)的极限:\(\lim_{x\to 0}(1+x)^{\frac{1}{x}}=e\)。我将以问题的形式启发读者自己去完成这个计算过程。

首先,解决贴子中的问题:不用微积分的知识,只用初等方法,证明\(y=1/x\)下方图形的面积是无穷大。

1) 在双曲线上任意一点向两坐标轴做垂线,证明这两条垂线与坐标轴形成的矩形的面积与点的位置无关,这个面积是多少?
2) 用上述特性在双曲线与坐标轴之间做出无穷多个互不重叠的矩形,并且每个矩形的面积不小于一个定值,比如\(0.9\)。(提示:先做出一个面积为1的正方形,再做出一个 1)中所描述的矩形,二者重叠部分的面积有什么特点?)

然后,计算双曲线下方\([1,t]\)之间曲边梯形的面积:
3) 将 2) 中的矩形面积不断减小,比如,让所有矩形的面积都等于\(\epsilon\)(那个正方形除外),这些矩形的宽度就会不断减小,\)[1,t]\)之间的曲边梯形就会逐渐被一些面积相等的矩形所铺满。计算\)[1,t]\)之间矩形的个数,并用\)\epsilon\)表示。
4)计算这些矩形的总面积,并计算当\(\epsilon\to 0\)时的极限。证明这些小矩形的宽度随着\(\epsilon\to 0\)而趋于零。根据反比例函数在\([1,t]\)上的可积性,这些矩形总面积的极限就是曲边梯形的面积。

至此,你应该看到对数和\(e\)分别是在哪一个步骤里出现了。下面是一个额外的问题:
5)为了比较\(y=1/x\)与\(y=1/x^2\)的差别,把这套策略改造一下应用到函数\(y=1/x^2\)上,并解释为什么对数函数没有出现在\(y=1/x^2\)的下方。

连续的一一映射,其逆映射怎样才连续?

在拓扑学中有很多的反例能够说明,从一个拓扑空间到另一个拓扑空间的连续一一映射,其逆映射不一定是连续的,即使假定两个拓扑空间都是距离空间。

反例1:设 \[ \begin{aligned}f:[0,2\pi) & \to C(0,1) \\ t & \to e^{it}\end{aligned}\] 它是连续映射,但是其逆映射在单位圆的 (1,0) 点是不连续的。
反例2:设 \[\begin{aligned}f:[0,1)\cup \{2\} & \to [0,1] \\ t & \to \left\{\begin{matrix}t & t<1\\ 1 & t=2 \end{matrix}\right.\end{aligned}\] 在相对拓扑意义下,f 是连续的,但是其逆映射不连续。

但是,数学各个分支中又有很多定理表明,如果加了某些条件,一个连续的一一映射,其逆映射可以保证也是连续的。如:

命题1:定义在一段连续区间上的实值函数,如果是连续单射,那么它的反函数也是连续的。
命题2(泛函分析中的开映射定理):定义在两个巴拿赫空间之间的连续线性算子,如果是满射,那么它是开映射,即将开集映为开集,那么它如果可逆,其逆映射就一定是连续的。
命题3:复平面上的解析映射是开映射,跟上一个例子类似,如果它可逆,那么它的逆映射是连续的。
更一般的,在拓扑中有这样的事实:
命题4:紧致空间的连续映射的像是紧致的,因此从紧致空间 X 到距离空间 Y 的连续映射是闭映射。

这些例子分别处在不同的数学分支,证明方法也不一样,那么现在的问题是,他们之间是否有某种联系?是否可以从拓扑的角度统一地处理这些问题?是否能在拓扑上提出一个充要条件使得逆映射的连续性能够得到保证?

上面的第四条其实就是对空间提出的拓扑条件,可惜的是,紧致性的条件太苛刻,以至于其它三个例子都不能从4 直接推出来。

Continue reading

用超限归纳法证明《实变函数论》中另一命题

为了建立实数轴上的 Lebesgue 测度,首先需要找一个适当的集合环,在上面建立起满足可数可加性的测度。因此,通常是在环 \[\mathscr R_0=\left\{\bigcup_{i=1}^n(a_i,b_i]\,|\,a_i,b_i\in\mathbf R,i=1,2,\dots,n \right\}\] 上定义集合函数 \[m(E)=\sum_{i=1}^n(b_i-a_i)\] 其中区间 \((a_i,b_i]\) 为 E 的初等分解。

《实变函数论》中在证明了这个定义的合理性(即 E 的函数值与 E 的初等分解方式无关)之后,作者通过134页(2009清华版124页)引理2.3.2 证明了这个集合函数的一系列性质,包括有限可加性,单调性和有限次可加性,最后证明这个集合函数是环 \(\mathscr R_0\) 上的测度,即满足空集的函数值为0;此函数非负,且具有可数可加性。

应该说,引理2.3.2 论证的内容是十分直观的,因为环 \(\mathscr R_0\) 上的元素都十分简单,只是有限个左开右闭区间的并。而引理2.3.2的核心内容无非是说,可数多个互不相交的左开右闭区间的总长度,是这些区间长度的和。比如,我们高中理解等比数列和 \[\sum_{n=1}^{\infty}\frac{1}{2^n}=1\] 的时候,就是把单位线段无限地二等分,然后看到单位线段的长度等于这些小线段的总长度,这是多么直观的事情。但引理2.3.2的建立过程却非常曲折,为了证明所定义的函数是测度,引理2.3.2被分解成了四个部分,最后一个部分还用到了 Heine-Borel 有限覆盖定理,而这个定理应用的也是极不自然,因为,这里并不是一些开集覆盖住了一个有界闭集,为了应用有限覆盖定理,还必须得给每个区间做一些小手术,这是不容易想得到的。

有没有可能就像高中证明那个无限二分线段长度之和为1那样直接证明这个命题?就是通过有限可加性取极限,就能直接得到可数可加性?用通常的分析思想会有些困难,因为,这里讨论的是可数无限分割,而这种分割的结构可以相当复杂。比如,就在一个简单的连续区间里,这种分划点的极限点就可以有很多甚至无限多,而这些极限点又可能有极限点的极限点,比如上面那个分划的每一个小区间 \( (\frac{1}{2^n},\frac{1}{2^{n+1}}]\) 中又可以有可数多个小区间,因此想用取极限的方式去证明一般的命题,有可能需要考虑极限的极限,而且嵌套无穷多次。

Continue reading

徐森林《实变函数论》中有关超限归纳法的一处疏漏

我想趁着假期的时候多复习些内容,所以现在有几门功课正在齐头并进,以便于在一门功课看累了的时候可以换换主题。这其中有实变函数,用的是徐森林的《实变函数论》中科大2002年版。

这本书第68页定理1.5.7(对应于2009清华版59页定理1.4.6):”布莱尔集与实数集等势”的证明过程中,用到了超限归纳法。作者首先以实数集为基础,构造良序集 \(A\),以便有足够多的序数对 \(\mathscr R\) 向 \(\mathscr R_\sigma(\mathscr R)\) 扩充的无限过程编号。\(A\) 实际上等同于最小的不可数序数之前的所有序数构成的集合,即所有可数序数构成的集合。(对于序数的直观描述可参见本博客文章《0.00…1是个什么数?》 打开连接之后在页内搜索”序数”)有意思的是,\(A\) 中任意一个元素,前面都只有可数多个元素,但 \(A\) 本身却是不可数的。这有点类似于自然数集 \(\mathbf N\),任意一个自然数都是有限的,但自然数集本身却是无限的。当然,可数序数和有限序数都没有最大元。

有了合适的序数集,作者便用递归的方式,通过差运算和可数并运算将 \(\mathscr R\) 一步步向 \(\mathscr R_\sigma(\mathscr R)\) 扩充。第0步,\(\mathscr R_{a_0}=\mathscr R\)。假设第 \(\lambda\in A\) 步已经完成,那么在第 \(\lambda +1\) 步,令 \[\mathscr R_{\lambda+1}=\left\{\bigcup_{i=1}^{\infty}E_i, E_2-E_1\,|\, E_i\in \mathscr R_\lambda, i=1,2,\dots\right\}\] 则作者认为对于每一个 \(a\in A, \mathscr R_a\) 都定义好了。

我认为,实际上这个递归定义的结果,最多是对于所有的有限序数,即自然数 \(n\) 定义好了 \(\mathscr R_n\),而无法遍历 \(A\) 中所有的可数序数。因为我们知道,不是所有的序数都是另一个序数的后继,比如第一个无限序数 \(\omega\) 就不是任何一个序数的后继,这样的序数称为超越序数。而 \(A\) 是个不可数集合,其中无法避免地会出现超越序数。

因此,我把上面的定义过程修改如下:

Continue reading