|

楼主 |
发表于 2023-5-30 09:53
|
显示全部楼层
姜祖恕(以下简称姜):法国的机率学派,跟美国的很不同,有不同的风格,法国学派对你有什么影响?
V:法国学派这些年来改变了很多。Neveau 的时候,他对具体的问题比较有兴趣。在他之前,Fortet 和 Mourier 对抽象的理论较感兴趣,与具体问题常常没有关联。但在考虑具体问题上,他们有很强的传统,像 Paul Lévy 给 Ito 很大的启发。但是法国数学界,对 Lévy 并不那么重视,他在 Ecole Polytechniques 因此他真正是一个工程师,他做的被认为是工程而不是数学,这是法国人傲慢的观点。这种观点已经不再存在了。Jacques Louis Lions 的出现使微分方程跟应用数学更合理化,更令人重视。法国已经改变了,现在法国机率学家跟我们没什么不同,非常具体而不非常抽象。
姜:全世界渐趋一致。你对俄国学派的看法如何?在 Kolmogorov 、Dynkin 、Prohorov 之后,机率有所谓的俄国学派吗?
V:我想俄国学派在整合拓朴学跟测度论进而发展出一种观点很有贡献。在随机过程的研究上,Kolmogorov 扮演相当重要的角色。马可夫过程的发展,Dynkin 有根本的贡献。在他之前 Feller 在这方面做了些工作,如果你读 Feller 的书,会觉得困惑,这一个定理,那一个定理,却没有一致的观点,我认为一致的观点是 Dynkin 做的。但是政治来了,70 年代发展的排斥犹太人的氛围,基本上将他们分散了。像是 Fredlin ,Dynkin ,Skorohod ,Ventcel ,Krylov 都离开了,他们都必须离开,另找栖身之地。90 年代早期,苏联解体,生活艰难维生不易,很多数学家可以的话去了美国,但是有些人还是会常回俄国。动态系统的 Yakov G. Sinai 的学群非常活跃。因此俄国学派的影响是有,但是他们在过去 20 年有自己的问题,既然现在他们有资源,我相信他们会 ……
姜:重组?
V:重新发展。
姜:日本的机率学派呢?Ito , Watanabe , Ikeda ……
V:他们有很强的学派。
姜:可否比较日本学派跟其他学派的风格,像是法国学派?
V:我想日本学派很擅长拿到问题做完整的分析,很快地把问题拆解开来,非常胜任。但我认为有时候他们有些呆板。
姜:他们通常跟着大人物的脚步接续他们的工作。
V:Ito 并没有接续别人的工作。(笑)不过我想对他们而言要有弹性或是冒险是困难的,你可以从他们的人与他们的工作看到这点。优秀的学者做优秀的工作,但我认为他们怯于去发掘很多的东西。
姜:你做的东西,我发现你很少引用前人的工作。例如,large deviation ,人们引用你的东西。但是似乎它是从你开始,没有前面的工作,你做的是先驱者的工作。
V:这不很对,这是我的毛病,我读的不多。(笑)而且我认为如果你想做一个问题,去读前人的工作是一个错误。
姜:喔,我们不应该读你的工作。(笑)
V:不,不。读前人的工作让你处于同一思考模式,如果想要跳脱出来,那么看看别人的想法是好的,可是不要去钻研细节。如果你抱着细节不放,会落入相同的思维。如果想尝试不同的方向,我不会建议任何人这么做。因此我很少用别人的结果,我用简单的工具,证明我需要的东西。我不喜欢用别人的大定理,然后说“这是根据某某定理 …… "。
姜:跟一般人做法很不同。
V:因为他们读得很多。
姜:他们读太多了。(笑)
V:有好也有坏。好处是如果有一个别人解决不了的问题,你做出来了,那是和前人非常不同的方法,可以开启一个新的解题的方式。另一方面来说,可能长时间卡在一个地方,非常挫折。如果你读了其他人的工作可能会知道怎么做。
姜:有问题时你会跟其他人谈吗?
V:是的,我会跟人谈,我也听人说。不过我不去看细节,,只试着去了解他们做的。如果不是我正在做的东西而我又有时间,我会去读它,看看他们做了什么,主要的概念是什么。我不必去看所有的细节,主要是关键步骤,或是主要概念。
姜:写论文时你曾经犯错吗?(笑)
V:在我当研究生时发生过。
姜:谁找到错的?
V:我自己。它给了我一些教训。我试着去证明一些定理。我那时很天真,才研一或研二。我试着证明一些东西以为已经证出来了。我把它写了出来给同事看。他说不错,我就投稿了。但是有一天我问自己,为什么我要证它?你知道,一个证明都要有一个想法,你不可能没有想法就去证明一个结果,而我似乎没有想法就证明了它,看起来很奇怪。我回头去看它,到底哪里错了,然后我了解我为什么犯错:有两个预备定理,预备定理 A 以及预备定理 B ,我用预备定理 A 去证明预备定理 B ,再用预备定理 B 去证明预备定理 A 。(笑)。我说:“这不行。” 你知道,如果你要你的证明行的通,在证明它之前要有想法来支持为什么它行的通。所以我立刻写信撤回论文。同时间,审稿人的报告也来了,我那篇论文被拒绝了。退稿的理由并不是因为那个错,而是其他的原因。但是,它给我一个教训。现在如果要写证明,而那个证明是来自拼拼凑凑的,你可能会犯错。如果知道一个证明为什么行得通,你不太可能会犯错。
姜:我记得 Stephen Orey 曾经说过你写证明时很小心。甚至不会有打字错误。你一直都那么小心吗?有人一直帮你校稿吗?
V:不,不是这样的。我想,就某种意义而言,那是一种写作的风格。至于打字错误,我不知道,那是期刊的事,有些期刊的编辑会一行一行地看,实际上是那些编辑们找出错误,特别是如果那个编辑懂数学的话。当我在大学的时候,有一个分析的考试,我没记错的话,有一个问题:如果 θ 是无理数的话,则 n 倍 θ 的小数部分在单位区间里 dense 。所以我大致想出了答案,写下来。我以为我做的不错,觉得那是正确的答案。不过,交上去后却一分都没拿到。我找老师抱怨,她说:“或许你的证明是对的,你自己心里明白,但我看不出为什么它是对的。在数学里,如果你写的让你的读者看不出为什么它是对的,它就不是对的。” 然后她拿给我看她保留的以前学生的卷子,那正是 Varadrajan 三年前的卷子。我看了看,知道哪里不一样了。(笑)
姜:我了解。
V:所以我逐渐了解到做数学的一部分就是要学着如何写作,写到让你的读者觉得你的论述清楚。你不要试着隐藏复杂的结构,有时,这根本是不可能的,因为有些论文事实上很技术性,所以,你尽力去做。我认为通常很多人不肯花心思在适当地写作上。
刘:你是否能说一下 Large Deviation ,如何开始研究这个问题的?为什么这个问题会如此重要?
V:嗯,为什么 Large Deviation 是重要的?如果你认为机率是重要的 ……
刘:(笑)认为机率重要,这容易!
V:然后,你必须要去计算一些东西的机率,不然机率能干么呢?所以,你有一个模型,你有一个事件,你想要去计算在这模型里的一个事件的机率,这就是问题,对吧。所以如果你在业界做事,例如华尔街等等,你不在乎怎么算,你只要一个数字,然后你把这个数字输入电脑。或许这个数字是对的,或许它是错的,那是你的银行要承担这个风险,不是你。(笑)另一方面,如果你是一个应用数学家,你看到问题中的参数而想要看看当参数很大时是否依然能计算这个事件的机率,试试看是否可以估计。有时,当参数变得很大时,这个机率会收敛到一个定值,因为原来的模型已变成不同的模型了,而这个机率在这个新的模型下是可以计算的。这就是极限定理在谈的。所以这问题变成一个可以计算的问题,因为你必须在这个新模型下计算机率,而或许这个新模型比旧模型简单,或许你可以发展一套数值方法或者这个新的模型有时简单到可以让你求精确解。第三件事是,或许当参数变得很大时,这机率收敛到零或一去了。零跟一是同一件事,因为你只要看它的补集就好了,就说它收敛到零好了,然后你问:它收敛到零的速度有多快?在大多数的情形之下,它收敛到零跟如何参数化有关。我们假设它的参数让机率以指数方式收敛到零。你想知道那个指数常数是什么?你要如何计算这个常数?这就是 Large Deviation 的问题了。针对不一样的模型,你可以 计算这个指数常数,有一种有系统的方法去计算它。而这就是 Large Deviation 的理论所探讨的。
刘:这就是你所做的。
V:这就是我所做的。不,在我之前,北欧保险界在 1930 年代就开始针对一些特定的模型做这件事了。Cramer 的结果是针对独立随机变量和。所以很多人都已经做了这件事了,研究统计力学的人在不一样的情况下也做了同样的事。事实上,整个均衡统计力学不过就是披着不同外衣的 Large Deviation 。所以,这样的事已经一点一滴的在很多地方做了。有一些是我在开始做这件事时根本就不知道而后来才发现的,有一些是我在大学时学的。
刘:所以,有一个一统的方法,或者,一统的想法啰?
V:是啊!到最后,事实上就只跟一个公式有关,有一个通用的公式可以用在 Large Deviation 上。一个模型,通常有很多的参数,其中某一个参数会越来越大,当这个参数变大时,某些事件的机率就会收敛到零。你问:是否我可以稍稍变动其他的参数使得机率不会收敛到零,而是收敛到一个正数,甚至一。所以你问自己:假设有一组新的参数,其中有一个参数跑到无穷大而有一些参数固定不动。现在,还是让这个会跑到无穷大的参数跑到无穷大,但是让其他原本不动的参数动一点点好让极限机率不为零。如此,你就有两个不同的模型,你可以计算后面这个模型相对于当参数跑到无穷大时会有特定行为的模型的相对 entropy 。通常它对参数是线性的,有一个可计算的常数。不同的扰动通常会产生同样的答案。你如能 找到具有避开零机率的最小相对 entropy 的最佳扰动,这个常数就是指数率的常数。这是 Large Deviation 的基本哲学。
刘:可以说一说你是如何得到这样的方法的吗?
V:喔,你知道的,算大量的例子。我试过不一样的例子,而最终我有办法了解这些东西的共通点。有一些已知道的,我就做一些计算而得到的答案让我吃惊。这样其实是合理的,因为它是一个一统的原则。
尤释贤(以下简称“尤”):我可以问一个问题吗?互动粒子系统与 Large Deviation 的关系是什么?你如何看待机率与物理,我是指,把它们放在一起?
V:大部分的物理,当然了,除非你有不确定性或者一些不确定的东西,否则你不能用机率。如果你给我一个动态系统和一些初始条件,那只是一堆我需要去解的常微分方程 …… 这样会牵扯到混沌理论,我完全不懂,这与 hyperbolicity 以及拓朴动态有关,是不同的东西。所以我考虑有噪音的模型,噪音越多越好。我探讨的那类互动粒子系统里的问题称为 Hydrodynamic Scaling Limits 。它是什么呢,它是一个非常复杂且非常庞大的交互粒子系统,但有守恒量。所以这个系统可以有一个大域的均衡,因为守恒-因为互动是局部的。所以,要达到全局的均衡是需要花相当长的一段时间的。所以呢,在某种时间尺度下,我们应该可以藉由某种大的空间尺度所表达的局部均衡去解释,描述这个系统的状态。因之会有一个尺度的议题。如果你的时间尺度是某一种而你的基准尺度是另一种,那么你就是以一种新的尺度来描述这个系统。这样就有巨观与微观二种位置。所以,巨观而言,你的空间可以是一个连续的紧致空间。但是 如果你很仔细地看,你就可以看到里面有格子,在格子里有个东西恼人地上下跳动着。但是从很远的地方看,你看不到这些波动。你只会看到一些很平滑的东西,因为那些波动都被平均抵销掉了。这些波动的东西会处在某种的局部均衡里。而你从很远的地方看到的是那种均衡的平均。这个局部均衡可能会逐点改变。所以你用以描述的系统状态正是一个位置函数。这个函数的值域就是描述均衡的参数。也就是说,这是流体的样子。然后你要做的是:让时间移动得够快,这个流体的样子将会随之改变最终得到一个常数,而这将是全局均衡。所以,你想要描述这种改变的方程,我们有偏微分方程来描述这些。而这里原本就有一个马可夫过程来描述这个交互作用粒子系统。从这里,你想要推得一个偏微分方程。这就是 Hydrodynamic Scaling Limits 探讨的问题。如果把机率去掉,得到描述气体的 Hamiltonian 系统。你得导出尤拉方程(Euler equation)并且将压力借由一个依赖交互势能的状态方程表示成密度与温度的函数。这就是最终求得的方程。五个方程以及五个未知数:密度,三维空间的速度以及温度。这是 deterministic 的情形,没有人会做。但是如果你有噪音,这些噪音所能的功用在迫使系统达到局部均衡。首先当你知道你有噪音,至少在某些条件某种意义下你可以证明局部均衡。这个问题事实上就是要证明局部均衡不会波动。对于那些比你有兴趣的尺度要低的尺度,因为系统是非线性的而且如果波动确实存在,你没办法知道什么是极限方程。所以,建立局部均衡并且证明没有不必要的波动。你必须要确定没有任何不必要的波动,这是问题的一部分。你需要做两件事:你必须要建立局部均衡,接下来你要证明没有不必要的波动,通常导出来的方程将会以 weak form 呈现。这里有三个步骤要做,而且有一个系统性的做法。你有一个可逆系统,例如说,一个处于均衡的粒子系统。跟那些完全不可逆的动态系统全然不同。如果你写下算子,其中一个是 self adjoint,另一个是 skew adjoint,所以它们是极端。有一些粒子系统模型在均衡之下有可逆动态。然后,你可以引入 Dirichlet form 的技巧。瞧,问题的一部分是你的初始状态是远离均衡的。因为如果你从均衡出发,你就会一直处于均衡,而偏微分方程就是:量的微分为零,因为在均衡状态下所有参数都是常数,所以你把它们带入得到零等于零,因此常数是无聊解。所以从均衡出发,得到无聊解,那是无趣的。如果从不均衡出发探讨趋于均衡是如何发生的,这就是整个布局了。所以如果从不均衡出发,这代表初始状态是一团乱,你就无法解出 Kolmogorov forward equation 并且说:在时间t,我的状态是如此,而针对这个状态我试着证明各种的性质等等。所以你必须有一个间接的证明,你没办法给一个直接的证明。
尤:所以你需要准备初始状态。
V:不!你必须针对它处理它。纵使你准备了初始状态,它很快就会改变。除非你将它准备为常态的均衡,否则它不会传播。记住,时间的尺度是很大的。所以你要有方法去控制它,而你用 Large Deviation 去控制它。用 Large Deviation 去控制它的原因在于,不管初始状态是什么,它相对于均衡的 entropy 将会与体积成比例,因为 entropy 是把每一个地方的量都加起来。所以无论初始状态为何,不失一般性,你永远可以假设,相对于均衡的 entropy 与体积成比例。Boltzmann 的 H 定理说,相对 entropy 是会递减的。你可以计算相对 entropy 的递减率,用状态表示它,对它微分,再用 Kolomogorov 方程,然后做部分积分,这事可行因为它是可逆,最后你得到 Dirichlet form ,事实上是稍微修正的 Dirichlet form 。这个Dirichlet form 与 gradient 的平方有关。既然密度是正函数,而且你有 gradient 的平方除以密度函数。所以,这就是 Dirichlet form 。entropy 也是正的,你知道开始的 entropy ,然后一路递减,你必须保持它是正的,所以就给了 Dirichlet form 的控制,有了 Dirichlet form 的控制,再看看针对某个函数积分的指数的期望值的 Feynman-Kac formula 。Feynman-Kac formula 给你一个藉由主固有值(principal eigenvalue)表达的 variational bound 。对于一个可加泛涵(additive functional)的马可夫过程由 0 积分到 t ,取指数,再看它的成长速率,在可逆的情形,这个速率借由主固有值实际上是可以控制的。这个主固有值有个变分的公式,是以 Dirichlet form 来表示的。所以,如果你能控制 Dirichlet form ,就可以控制这些东西。但是,这些都在均衡里了。所以,如果你先掌控好均衡,坏东西会出现,你证明坏东西出现的机率很小,多小呢?必须是某一个很大的常数乘上体积的负指数。所以这个误差率甚至会比体积大很多。
尤:但是误差是?
V:误差机率的倒数取对数,其值大于体积。大得很多,比体积大了一个次方。这称为 super exponential estimate 。你可以用变分法,用 Dirichlet form 来证明这些。这不过是变分法,是可以做的,一旦做了,则在均衡下的误差机率是很小的。由于不均衡下的相对 entropy 只跟体积成比例,加上在均衡里的误差是 super-exponentially 微小,所以 Jensen 不等式告诉你误差在均衡下是小的。就只用到 Jensen 不等式,一个简单的不等式。所以这就是如何在不均衡状态下控制误差的机率,一旦能控制误差的机率,问题就解决啦,<停顿> 因为我从未说过误差是什么!由定义来看,误差是:你想要的减掉你有的。(笑)
刘:你想要的是局部均衡吗?
V:没有波动的局部均衡。针对每一个情形你必须用不一样的估计。但是一样的都用 Dirichlet form 去控制它。所以,这个方法对可逆的情形,或者一般的扩散的情形都相当管用。但是还有一些其他的问题,事实上这是我最喜欢的。瞧,在扩散问题里若空间的大小是 n 。则时间是以 n 平方加速。如果要计算 hydrodynamic limit ,基本上那是 transport 的问题。你得到 current 。由于守恒律可以计算 current ,得到两项的差。所以你必须要吃掉 n 的 2 次方。因为守恒而且电流是差,可以做部分积分或部分加法一次去掉一个 n 。另一个 n 去不掉,除非在某些模型里,计算的结果意外地得到两项的差。你有的是零平均(mean zero)。因为根据定义,在均衡状态之下平均(mean)必须为零。一个在所有均衡状态之下平均都是零的物体不见得是两样东西的差。这是什么意思呢?瞧,在方格里,如果有在位移下不变的东西,位移再加上测度也是不变的,那么一个像 f(x) 减掉 f(Tx) 的东西其平均永远都是零,因为位移不变的结果 f(x) 与 f(Tx) 有一样的平均值。但在另一方面,这对部分加法是好的。因为如果你积了它,将它拿去与一个缓慢变化的函数作测试,则重新调整尺度代表测试的函数(test function)也将在原子的尺度下,缓慢变化。所以在原子尺度下它是两样东西的差。针对测试函数把它平滑化,不费力就得到部分加法,这会带出一个多的 1/n 的倍数。有这类性质的模型称为 gradient 模型。所以如果你有一个 gradient 模型,我刚刚描述的模型很管用。但是有时你得到的函数不是两样东西的差,你就必须去做不同的处理,基本上是无穷维的 Hodge 预备定理。所以你定义一个抽象的希尔伯特空间(Hilbert space),你的物件是那些相对于每个均衡状态平均都为零的函数。一个这样的例子是电流。因为在均衡之下电流是没有净流的。我们的系统在均衡下是可逆的,在两个不同地方的密度的平均也是零。所以如果你想要知道传输,那就是你想要处理的:两点之间密度的差。因为当你把它代入,你会得到 dp ,就是密度差(gradient)。所以你想要解的是如何用密度差去置换一个平均为零的函数。你必须要证明这个差在某种意义上是可以被忽略的。没有黑板、粉笔描述起来有点复杂。
刘:这没关系的。(笑)你描述了好多。我们谈点轻松的好了。你在 Courant 待了好多年。说说那里的人,谈谈那个地方好吗?
V:喔,我认为 …… 嗯 …… 你曾经去过那里,你知道那边的情形。
刘:只有你待在那里的百分之十的时间。
V:嗯,那是一个很好的地方,因为就某种意义而言那里就像个家庭。他们会好好照顾,教育年轻人。资深的教授一直很愿意照顾下面的人。另一件事是那里的人总是在那里让你可以接近。任何时间我想要问什么问题,我可以找任何人,他们每天都在。我知道一些地方,想要见某人,必须在一个月前事先预约。(笑)而在 Courant ,人们天天在那里,在喝茶,在吃午餐,你问一些问题,你加入谈话。另外,这个学院的运作长久以来独立于大学之外,所以他们的运作少了很多官僚气。然而,现在有些改变,就像美国很多大学,纽约大学也变得比较像公司。校长们喜欢把自己想成公司里的总裁,变得比较像一个生意。我不责怪他们,因为政府对教育的补助正在减少,所以他们必须像经营生意一样的经营学校,这样才能募到钱来支持各种的活动。
刘:另外 Courant 学术上的重点也在改变。
V:那是因为数学的演化。三四十年前,研究椭圆方程,pseudo-differential operator 等等是很重要的。现在,比较非线性,非线性双曲线方程是人们注意的。我认为现在数学里流行的也在改变,希望我们也随之与时俱进,不然到后来我们就落后了。还有,现在的数学变的比较重视计算。大尺度计算已经成为数学里重要的工具。随着电脑越来越大,你可以做的事也越来越多了。谁知道呢,当量子计算出现的时候,你可以做得更多!
刘:我听说这不会很快发生。(笑)
V:以前说到上月球人们也是这样讲的。(笑)
|
|