一些回忆



十五年前选了一门拓扑学。上课的老师姓杜,对本科教育颇有激情,乐此不疲。有时也流露出教学之艰难的感叹,例如“我们上学的时候,最聪明的学生学数学,现在最聪明的学生都去学金融了”,或“拓扑学这么重要,怎么是选修课呢”。记得一次课上,老师讲到一个略为抽象的定理,名曰“杜老师定理”,因为这是他自己发现的。我不擅长理解抽象的东西,遇到这种情况,一般会举几个例子帮助理解。然而,我发现有一个例子出了问题,而且这个例子很简单。这通常意味着,我对概念的理解有偏差。但是差在哪呢,百思不得其解。课间询问同学,听他解释一番,仍旧不明白,只好课后请教老师了。杜老师听了这个例子,先是愣了一下,然后说下次课告诉我答案,就匆匆离开了。

几天后,杜老师在课上讲了这个例子,然后宣布,这是个反例,“杜老师定理”是错的,“让我们感谢这位同学”。这位杜老师在宣称自己的定理是错误时,没有丝毫犹豫或不快,甚至看上去有些高兴。当然,对于科学工作者来说,错误通常意味着更好的理解和进步。不过,按照我日后在工业界的经验,人们害怕错误。要么拒绝承认,要么将其源头归罪于其他人。

期末考试之前,我们请学长来指导代数拓扑的习题(很难)。学长说到期末试卷中,肯定会出一道“杜老师定理”的应用,因为之前每年都有。我意识到,每年选修拓扑学的学生,都不曾认真思考过这个定理,而只是背下来应付考试而已。(后来这门课我挂掉了,万幸拓扑学是选修课!)

另有一次,在量子力学课上,老师讲到对易关系(令 $\hbar = 1$)$[\hat{x}, \hat{p}] = i$。我也举了个例子:$\langle x [\hat{x}, \hat{p}] x \rangle = \langle x i x \rangle$,即 $\langle x \hat{p} x \rangle (x - x) = i \delta(0)$。但是左边为零,右边……真叫人头疼。课后请教老师,老爷子讲,应当考虑 $\langle x [\hat{x}, \hat{p}] x’ \rangle = \langle x i x’ \rangle$,即 $\langle x \hat{p} x’ \rangle (x - x’) = i \delta(x - x’)$。带入算符 $\hat{p} = -i \partial / \partial x$,就得到
\[-\delta^{(1)}(x) x = \delta(x).\]

这个关系是成立的。将其作用在一个 Schwartz 空间中的函数 $f$ 上,积分限皆为 $(-\infty, +\infty)$,左边等于 $-\int dx \delta^{(1)}(x) x f(x)$,其分部积分为 $\int dx \delta(x) (d/dx)[x f(x)] = \int dx \delta(x) f(x) + \int dx \delta(x) x f^{(1)}(x)$。第二项等于零,所以左边等于右边。只有当“作用”于某个函数时,这个等式才有意义。

回想至此,不由得好奇这个关系能不能被推广。例如,根据相同的步骤,可以得到 $(-1)^n / n! \delta^{(n)}(x) x^n = \delta(x)$。以及当 $m > n$ 时,$\delta^{(n)}(x) x^m = 0$。但如果尝试 $m < n$,情况就变得比较复杂了,无法得到简洁的关系。这时的做法通常是考虑更强的关系,例如,如果不是作用在 Schwartz 空间,而是直接积分会怎么样,也就是 $\int dx \delta^{(n)}(x) x^m$ 等于什么。根据同样的步骤,可以得到

\[\int_{-\infty}^{\infty} dx \frac{(-1)^n}{n!} \delta^{(n)}(x) x^m = \delta_{m, n}.\]

这看上去很像 $\delta^{(n)}$ 和幂函数的某种“正交关系”。比如,一个 Schwartz 空间中的函数 $f$ 可以据此展开成

\[f(x) = \sum_{n=0}^{+\infty} \frac{(-1)^n}{n!} g_n \delta^{(n)}(x),\]

其中

\[g_n := \int_{-\infty}^{+\infty} dx f(x) x^n.\]

这样,函数 $f$ 就被展开成“分布”的和了。同样,只有当“作用”于某个函数时,这个展开式才有意义。

这让我想到连续时马尔可夫过程中的跃迁率(transition rate),即单位时间内跃迁的概率密度。如果把这个展开式应用于跃迁率,即 $r(x, y) = \sum_{n=0}^{+\infty} \frac{(-1)^n}{n!} g_n(y) \delta^{(n)}(x-y)$,那么主方程(master equation)就变为

\[\frac{\partial p}{\partial t} (x,t) = \int dy r(x, y) p(y, t) = \sum_{n=0}^{+\infty} \frac{(-1)^n}{n!} \int dy g_n(y) \delta^{(n)}(x-y) p(y, t).\]

对右边做分部积分,得到

\[\sum_{n=0}^{+\infty} \frac{(-1)^n}{n!} \int dy \frac{d^n}{dy^n}\left[g_n(y) p(y, t) \right] \delta(x-y) = \sum_{n=0}^{+\infty} \frac{(-1)^n}{n!} \frac{d^n}{dx^n}\left[g_n(x) p(x, t) \right].\]

由于跃迁率有性质 $\int dx r(x, y) = 0$,求和的 $n=0$ 项是零,所以应从 $n=1$ 开始。这样就得到了著名的 Kramers-Moyal 展开:

\[\frac{\partial p}{\partial t} (x,t) = \sum_{n=1}^{+\infty} \frac{(-1)^n}{n!} \frac{d^n}{dx^n}\left[g_n(x) p(x, t) \right].\]

所以,这个量子力学课上的简单问题,在做了简单的思考之后,就得到了 Kramers-Moyal 展开,推导过程可是比教科书上的简单多了。

在往返三亚的旅途中,在回忆里消磨时光也是不错的。