|

楼主 |
发表于 2024-2-29 19:15
|
显示全部楼层
姜祖恕(以下简称姜):法国的机率学派,跟美国的很不同,有不同的风格,法国学派对你有什么影响?
V :法国学派这些年来改变了很多。Neveau 的时候,他对具体的问题比较有兴趣。在他之前,Fortet 和 Mourier 对抽象的理论较感兴趣,与具体问题常常没有关联。但在考虑具体问题上,他们有很强的传统,像 Paul Lévy 给 Ito 很大的启发。但是法国数学界,对 Lévy 并不那么重视,他在 Ecole Polytechniques 因此他真正是一个工程师,他做的被认为是工程而不是数学,这是法国人傲慢的观点。这种观点已经不再存在了。Jacques Louis Lions 的出现使微分方程跟应用数学更合理化,更令人重视。法国已经改变了,现在法国机率学家跟我们没什么不同,非常具体而不非常抽象。
姜:全世界渐趋一致。你对俄国学派的看法如何?在 Kolmogorov 、Dynkin 、Prohorov 之后,机率有所谓的俄国学派吗?
V :我想俄国学派在整合拓朴学跟测度论进而发展出一种观点很有贡献。在随机过程的研究上,Kolmogorov 扮演相当重要的角色。马可夫过程的发展,Dynkin 有根本的贡献。在他之前 Feller 在这方面做了些工作,如果你读 Feller 的书,会觉得困惑,这一个定理,那一个定理,却没有一致的观点,我认为一致的观点是Dynkin做的。但是政治来了,70年代发展的排斥犹太人的氛围,基本上将他们分散了。像是 Fredlin,Dynkin,Skorohod,Ventcel,Krylov 都离开了,他们都必须离开,另找栖身之地。90年代早期,苏联解体,生活艰难维生不易,很多数学家可以的话去了美国,但是有些人还是会常回俄国。动态系统的Yakov G. Sinai的学群非常活跃。因此俄国学派的影响是有,但是他们在过去20年有自己的问题,既然现在他们有资源,我相信他们会 …
姜:重组?
V :重新发展。
姜:日本的机率学派呢?Ito , Watanabe , Ikeda …
V :他们有很强的学派。
姜:可否比较日本学派跟其他学派的风格,像是法国学派?
V :我想日本学派很擅长拿到问题做完整的分析,很快地把问题拆解开来,非常胜任。但我认为有时候他们有些呆板。
姜:他们通常跟着大人物的脚步接续他们的工作。
V: Ito 并没有接续别人的工作。(笑)不过我想对他们而言要有弹性或是冒险是困难的,你可以从他们的人与他们的工作看到这点。优秀的学者做优秀的工作,但我认为他们怯于去发掘很多的东西。
姜:你做的东西,我发现你很少引用前人的工作。例如,large deviation ,人们引用你的东西。但是似乎它是从你开始,没有前面的工作,你做的是先驱者的工作。
V :这不很对,这是我的毛病,我读的不多。(笑)而且我认为如果你想做一个问题,去读前人的工作是一个错误。
姜:喔,我们不应该读你的工作。(笑)
V :不,不。读前人的工作让你处于同一思考模式,如果想要跳脱出来,那么看看别人的想法是好的,可是不要去钻研细节。如果你抱着细节不放,会落入相同的思维。如果想尝试不同的方向,我不会建议任何人这么做。因此我很少用别人的结果,我用简单的工具,证明我需要的东西。我不喜欢用别人的大定理,然后说“这是根据某某定理 … ”。
姜:跟一般人做法很不同。
V :因为他们读得很多。
姜:他们读太多了。(笑)
V :有好也有坏。好处是如果有一个别人解决不了的问题,你做出来了,那是和前人非常不同的方法,可以开启一个新的解题的方式。另一方面来说,可能长时间卡在一个地方,非常挫折。如果你读了其他人的工作可能会知道怎么做。
姜:有问题时你会跟其他人谈吗?
V :是的,我会跟人谈,我也听人说。不过我不去看细节,,只试着去了解他们做的。如果不是我正在做的东西而我又有时间,我会去读它,看看他们做了什么,主要的概念是什么。我不必去看所有的细节,主要是关键步骤,或是主要概念。
姜:写论文时你曾经犯错吗?(笑)
V :在我当研究生时发生过。
姜:谁找到错的?
V :我自己。它给了我一些教训。我试着去证明一些定理。我那时很天真,才研一或研二。我试着证明一些东西以为已经证出来了。我把它写了出来给同事看。他说不错,我就投稿了。但是有一天我问自己,为什么我要证它?你知道,一个证明都要有一个想法,你不可能没有想法就去证明一个结果,而我似乎没有想法就证明了它,看起来很奇怪。我回头去看它,到底哪里错了,然后我了解我为什么犯错:有两个预备定理,预备定理 A 以及预备定理 B ,我用预备定理 A 去证明预备定理 B ,再用预备定理 B 去证明预备定理 A 。(笑)。我说:“这不行。” 你知道,如果你要你的证明行的通,在证明它之前要有想法来支持为什么它行的通。所以我立刻写信撤回论文。同时间,审稿人的报告也来了,我那篇论文被拒绝了。退稿的理由并不是因为那个错,而是其他的原因。但是,它给我一个教训。现在如果要写证明,而那个证明是来自拼拼凑凑的,你可能会犯错。如果知道一个证明为什么行得通,你不太可能会犯错。
姜:我记得 Stephen Orey 曾经说过你写证明时很小心。甚至不会有打字错误。你一直都那么小心吗?有人一直帮你校稿吗?
V :不,不是这样的。我想,就某种意义而言,那是一种写作的风格。至于打字错误,我不知道,那是期刊的事,有些期刊的编辑会一行一行地看,实际上是那些编辑们找出错误,特别是如果那个编辑懂数学的话。当我在大学的时候,有一个分析的考试,我没记错的话,有一个问题:如果 θ 是无理数的话,则 n 倍 θ 的小数部分在单位区间里 dense 。所以我大致想出了答案,写下来。我以为我做的不错,觉得那是正确的答案。不过,交上去后却一分都没拿到。我找老师抱怨,她说:“或许你的证明是对的,你自己心里明白,但我看不出为什么它是对的。在数学里,如果你写的让你的读者看不出为什么它是对的,它就不是对的。” 然后她拿给我看她保留的以前学生的卷子,那正是 Varadrajan 三年前的卷子。我看了看,知道哪里不一样了。(笑)
姜:我了解。
V :所以我逐渐了解到 做数学的一部分就是要学着如何写作,写到让你的读者觉得你的论述清楚。你不要试着隐藏复杂的结构,有时,这根本是不可能的,因为有些论文事实上很技术性,所以,你尽力去做。我认为通常很多人不肯花心思在适当地写作上。
刘:你是否能说一下 Large Deviation ,如何开始研究这个问题的?为什么这个问题会如此重要?
V :嗯,为什么 Large Deviation 是重要的?如果你认为机率是重要的 …
刘:(笑)认为机率重要,这容易!
V :然后,你必须要去计算一些东西的机率,不然机率能干么呢?所以,你有一个模型,你有一个事件,你想要去计算在这模型里的一个事件的机率,这就是问题,对吧。所以如果你在业界做事,例如华尔街等等,你不在乎怎么算,你只要一个数字,然后你把这个数字输入电脑。或许这个数字是对的,或许它是错的,那是你的银行要承担这个风险,不是你。(笑)另一方面,如果你是一个应用数学家,你看到问题中的参数而想要看看当参数很大时是否依然能计算这个事件的机率,试试看是否可以估计。有时,当参数变得很大时,这个机率会收敛到一个定值,因为原来的模型已变成不同的模型了,而这个机率在这个新的模型下是可以计算的。这就是极限定理在谈的。所以这问题变成一个可以计算的问题,因为你必须在这个新模型下计算机率,而或许这个新模型比旧模型简单,或许你可以发展一套数值方法或者这个新的模型有时简单到可以让你求精确解。第三件事是,或许当参数变得很大时,这机率收敛到零或一去了。零跟一是同一件事,因为你只要看它的补集就好了,就说它收敛到零好了,然后你问:它收敛到零的速度有多快?在大多数的情形之下,它收敛到零跟如何参数化有关。我们假设它的参数让机率以指数方式收敛到零。你想知道那个指数常数是什么?你要如何计算这个常数?这就是 Large Deviation 的问题了。针对不一样的模型,你可以计算这个指数常数,有一种有系统的方法去计算它。而这就是 Large Deviation 的理论所探讨的。
刘:这就是你所做的。
V :这就是我所做的。不,在我之前,北欧保险界在 1930 年代就开始针对一些特定的模型做这件事了。Cramer 的结果是针对独立随机变量和。所以很多人都已经做了这件事了,研究统计力学的人在不一样的情况下也做了同样的事。事实上,整个均衡统计力学不过就是披着不同外衣的 Large Deviation 。所以,这样的事已经一点一滴的在很多地方做了。有一些是我在开始做这件事时根本就不知道而后来才发现的,有一些是我在大学时学的。
刘:所以,有一个一统的方法,或者,一统的想法啰?
V :是啊!到最后,事实上就只跟一个公式有关,有一个通用的公式可以用在 Large Deviation 上。一个模型,通常有很多的参数,其中某一个参数会越来越大,当这个参数变大时,某些事件的机率就会收敛到零。你问:是否我可以稍稍变动其他的参数使得机率不会收敛到零,而是收敛到一个正数,甚至一。所以你问自己:假设有一组新的参数,其中有一个参数跑到无穷大而有一些参数固定不动。现在,还是让这个会跑到无穷大的参数跑到无穷大,但是让其他原本不动的参数动一点点好让极限机率不为零。如此,你就有两个不同的模型,你可以计算后面这个模型相对于当参数跑到无穷大时会有特定行为的模型的相对 entropy 。通常它对参数是线性的,有一个可计算的常数。不同的扰动通常会产生同样的答案。你如能找到具有避开零机率的最小相对 entropy 的最佳扰动,这个常数就是指数率的常数。这是 Large Deviation 的基本哲学。
刘:可以说一说你是如何得到这样的方法的吗?
V :喔,你知道的,算大量的例子。我试过不一样的例子,而最终我有办法了解这些东西的共通点。有一些已知道的,我就做一些计算而得到的答案让我吃惊。这样其实是合理的,因为它是一个一统的原则。 |
|