|
爱因斯坦的历史预言:相对论,一种视角整合方案
原创 Garlica 大蒜的学习装置 2024-04-25 12:48 广东
这是历史哲学课程的番外篇,我们来看看爱因斯坦《浅说相对论》(“Relativity: the special and the general theory”),用现代物理学的眼光来一窥历史观念的未来可能。
在《浅说相对论》的第一部分“狭义相对论”,爱因斯坦通过重新思考速度、时间、距离这三个最核心的力学概念,成功调和了经典力学的相对运动原则和电磁学中的光速恒定现象,也为后来的广义相对论扫清了概念上的障碍。狭义相对论关于时间的讨论出了名的难懂,我们今天就来试试看能否把这个问题讲清楚。
1916 年,37 岁的爱因斯坦已经完成了他人生中最伟大的理论贡献:狭义和广义相对论(分别在他 26 岁和 36 岁时完成)。但这时相对论还只是理论物理界的一个奇思妙想,距离他的理论取得第一次预测成功,也就是说,距离他真正誉满全球还有 3 年时间。这个时候的爱因斯坦并没有选择推进他的理论研究,而是花了很大力气写了一本小书,一本面向广大普通读者的科普读物:《浅说相对论》。这可太稀奇了。
对于一个抵达人类思想之巅、被誉为有史以来最伟大物理学家的人来说,这事情比所有理论贡献都要稀奇——想象一下,如果让谢耳朵写一本书向大众普及自己的研究成果,他一定会断然回绝:像我这样高贵的头脑,怎么可能屈尊给麻瓜们讲课?谢耳朵的特立独行没有一丝一毫的意外和特别,而像爱因斯坦这样同时热衷学术和公众事业的理论家,才是异类中的异类。
为爱因斯坦的这本小书写导言的科普作家 Nigel Calder 不止一次地将爱因斯坦的相对论称作“一种彻底民主的思想”。他的意思是,在爱因斯坦的理论中,没有任何一个观测者(参照系)可以享有特殊地位,所有人/物体/时空都必须遵循同一套物理法则,被纳入同一个解释框架之中。但或许用“民主”(democratic)来指涉爱因斯坦的科学哲学也同样贴切。爱因斯坦曾说自己最关心的问题是“上帝创世时到底有没有选择的余地”,他还说:
物理学概念是人类的自由创造,不是对外部世界唯一可能的决定性解释(无论看上去有多像)。我们对现实世界的理解很像是一个人在试着理解一个封闭手表的内在机制。他可以看到表面和表针,甚至听到表针的嘀嗒声,但他没法打开手表。如果他足够聪明,他可以构想出某种机制的图画来解释他观测到的所有现象,但他永远不可能确定这幅图画是唯一可能的解释。他永远不可能拿自己构想的机制跟真实的机制做对比,甚至没法想象这种对比何以可能、又有何意义。但他无疑坚信,随着自己知识的增加,他构想的现实图画会越发简洁、所能解释的感官印象也会越来越多。他也可以相信,存在一个知识的理想极限,这是人类头脑可以不断接近的。他可以管这个理想极限叫客观真理。
——《物理学的演化》,阿尔伯特·爱因斯坦,利奥波德·英费尔德
更简洁、解释范围更广,这是人类为理解世界而设定的原则,是外在于科学的一套纪律。我们之所以不再接受中世纪的地心说和本轮-均轮学说,就是因为它不及日心说简洁和解释力强。同样地,相对论之所以超越了牛顿力学体系,就是因为它以更简洁的理论建构、解释了更多的自然现象。世界的真实法则有没有可能并不是这么简洁的呢?完全有可能,但对于人类的理解能力来说,这是难以接受的。
上一篇文章我在结尾说,爱因斯坦的相对论带来了哲学上的相对主义,有读者提出反对。其实爱因斯坦本人也明确反对将他的学说解释成相对主义,他说自己的理论只是推翻以往物理学“实证的、永恒的解释”,代之以更为相对的解释。自然有一套笼罩一切的法则,法则之下人人平等,在相对论这里,不存在哪个参照系可以被视作“绝对静止”,一切都处在相互运动的状态,都服从同一套物理法则:
任何普遍的自然法则都必须能够将不同坐标系下的自然现象——从坐标系 K 的时空坐标(x,y,z,t)切换至坐标系 K' 的(x',y',z',t')——表达为完全一致的形式。
——《浅说相对论》第十四章“相对论的启发意义”,阿尔伯特·爱因斯坦
所以爱因斯坦的相对论一点都不像流俗理解中的相对主义那样随心所欲,而是有着严格的限制,将所有参照系(观测者)都限制在了同一套物理公式(洛伦兹转换)之中。相对论的“相对”只在于打破了经典力学中的“绝对静止坐标系”想象。我们应该区分两种相对主义:一种是消极的,是用来为自己生活的为所欲为而肆意辩护的;另一种则是积极的,是在接受了每个人都有各自视角和观念(物理学中的“观测结果”或曰“数据”)的情况下,致力于寻找不同视角之间的相通之处——这才是相对论的用意所在。
相对论肇始于一个“绝对主义不可能”的时刻,收尾于一个“普遍相对主义”时刻。这个思路贯穿狭义和广义相对论。无论后来关于黑洞和暗物质的讨论多么热闹,爱因斯坦的历史预言都必须先从狭义相对论开始说起。
莫名其妙的开头
爱因斯坦最出众的能力不在数学演算、也不在实验设计和操作,而在理论想象。这很像是在几何图形中看到那条隐藏辅助线的能力。爱因斯坦出了名地擅长和乐于构造思想实验,实际上,《浅说相对论》一书就是由一系列的思想实验构成的。思想实验是一种特殊的叙事,它是专门用来把抽象概念转化为日常可感对象的。像爱因斯坦这样善于把复杂问题简化的头脑,叙事结构也一定有其考量。
所以我们该如何理解《浅说相对论》的第一章“几何命题的物理含义”?在这一章里,爱因斯坦讲了三个问题:①几何公理本身是缺乏论证的,是我们预先设定好的,例如两点之间线段最短;②我们之所以认为几何公理以及由此推出的一切定理(欧氏几何体系)是真确的,原因在于它们符合我们在现实生活中的观察;③我们的观察是不完整的,存在大量未被观察、或观察到了但未被很好解释的自然现象,这些现象最终将告诉我们,欧氏几何是不完整的,是有其适用范围的。
等到爱因斯坦再次讨论欧氏几何,已经要到整本书的后程,在广义相对论的部分。为什么不把这一章放到广义相对论那边,真的,为什么非得写这么一章作为整本书的开头?乍看之下,第一章很多余、简直莫名其妙。
爱因斯坦这样写,有着很深的用意。狭义相对论的最大理解门槛倒不在于数学或实验内容,而就在于概念:我们对欧氏几何太熟悉、太信赖了,我们几乎从来不会停下来思考它会有什么问题。我们用它来设计高楼大厦、造船造车,没有任何问题,欧氏几何怎么可能是错的呢?
狭义相对论还完全不涉及力学问题,没有加速度,没有力学分析,纯粹是一个匀速直线运动的问题。倒不如说它就是一道小学数学应用题:甲从原点往东走,速度是 a ,乙也在同一时间地点沿同方向出发,速度是 b(b>a),问时间 t 过去后,甲乙相距多远?
答案不是 (b-a)*t,还能是什么?
爱因斯坦以前的物理学家们也是这么想的。可是当他们用同样的思路去计算光的运动时,怪事发生了:对于一个同方向运动中的物体(甲),光(乙)的速度不是 b-a ,而是 b 。也就是说,无论甲走得有多快,无论是正着走还是倒着走,光相对于他的速度都永远是一样的。这是一个被反复观测验证的、铁一般的事实。
事实比逻辑更真实,这就是爱因斯坦要告诉我们的第一件事情。因为逻辑打从一开始就是人类构造出来解释现实的工具。事实先于逻辑,逻辑只是服务于事实的解释工具。想象一下,如果古时候有个人构造出一套“区氏几何”,逻辑自洽,严丝合缝,可是一用到现实生活中(例如古时候最重要的一件事情就是测量土地面积)就总是出错,一时测得偏大,一时又偏小,我们就只会说这套“区氏几何”是错的。形如我们看到百度民科吧里的各路神仙理论都不会当真一样,哪怕它们的逻辑有多自洽。
相对论试图用事实来打破的那个绝对自洽的逻辑,正是九年义务教育不容置喙地教给所有人的欧氏几何。爱因斯坦实际上是在拷问每一位读者:你是要固守以往的观点、相信欧氏几何,还是坚持事实高于逻辑、放弃欧氏几何呢?[所以我们的教育应该教什么呢?如果牛顿力学不是“绝对真理”、对我们的实际生活又没什么帮助,为什么要教呢?相对论当然也不是终极的绝对真理,现代物理也有很多相对论解释不了的现象。这里的问题不是“真理是否可能”,而是:学校教育应该以“绝对真理”的样貌示众吗?如果不,我们如何说服学生接受一套“并不完全正确”的知识呢?]
光速恒定
从叙事结构上讲,爱因斯坦为这本小书写了一个耸人听闻的开头。但光速恒定的现象比“欧氏几何可能是错的”更加耸人听闻,这是促使爱因斯坦提出相对论的原点。[严格来讲是“真空中光速恒定”,方便起见,后文谈及光速都默认为真空中的光速。]
在十七世纪以前,人们认为光的传播是瞬间完成的。从实用意义上讲这并不算错,日常生活中几乎不存在超远距离观测或通信,默认光的传播时间约等于零,合情合理。直到十七世纪中期才有科学家发现光的传播也需要时间;1676 年,丹麦天文学家 Ole Romer 在观测土星的一颗卫星时发现观测结果常有偏离,他怀疑这是因为光从土星传至地球需要时间,据此测定光速约为 22 万 km/s ——这是人类关于光速的最早测定结果。
到了十九世纪,科学家已经很清楚光是一种波,跟声波、电波一样,自然会认为光波也需要介质来传播。可是即便是在真空中(将空气抽光)光也能传播,科学家只好假设真空并不真的“空”,而是存在一种称作“以太”的介质,真空中的光一定是借助这个以太传播的。这个想法非常正常,就像拉瓦锡以前的化学家假设空气中存在“燃素”一样。
在 19 世纪,以太这个概念如此深入人心,科学家们很快就将各种奇怪现象都怪罪到以太的头上。在 1851 年的菲佐(Fizeau)实验中,光在流动介质(水柱)中的运动并没有出现速度简单叠加的现象,这被当时的科学家看作是以太的“部分拖拽”所致。但以太毕竟只是一个间接的假设,当时的科学家总归希望能用更直接的方式确认以太的存在。1870 年代著名的迈克尔孙-莫雷实验,就以巧妙的实验设计试图证实以太的存在。如果以太确实是无处不在的,那么地球围绕太阳旋转,按说每时每刻都迎接着一股 30 km/s 的以太风,而就像其他波的传播规律一样,光在以太中传播的速度也会受以太本身的速度影响,如果让同一束光按不同路径行进相同距离,一条路径顺风、一条路径垂直于以太风的方向(也就是垂直于地球公转方向),根据两条路径的时间差就可以算出以太风的速度是不是等于地球公转速度,从而证实以太的存在。实验设想见下图:
迈克尔孙和莫雷认为以太风会使得横向逆风的光(蓝球)飞得更慢,如右图所示。可是实验结果却是左图,两束光的抵达时间几乎没有差别。这个实验从 1871 年一路做到 1930 年,没有一次成功:光似乎冥顽不灵地按着一个固定速度前进,实验测得的时间差每次都是约等于零。
在 1890 年代,爱因斯坦对这个系列实验非常感兴趣。他的出发点与同时代的科学家没有什么不同,也是试图证明以太风的存在。但随着实验结果一再不符预期,且洛伦兹根据麦克斯韦方程推出光波在真空中的传播速度是一个常数(这是一个电磁学而非力学结论),迫使爱因斯坦放弃对以太的坚持。
如今看来,“以太”当然是物理学史上的一场捕风捉影,但这只是事后诸葛亮的看法:身处那个时代,没有人能够否认光是一种波动,也没有任何理由认为光是特别的、可以无需介质而传播。以太的假设合情合理,丝毫不比今天关于暗能量和暗物质的假设更离谱。这就是为什么爱因斯坦需要在本书的开头请求读者分清事实和假设:只有日常经验和实验结果是铁一般的事实,至于我们为了解释这些现象而构造出来的理论,说到底都是假设。如果理论与事实不符,应该改变的不是事实,而是理论,无论这个理论看上去有多么合理和简洁。
如果光速恒定是一个铁一般的事实,物理学就遇到了一个非常棘手的问题:如同菲佐实验所示,为什么光不能像普通物体那样乘在水流之上、取得水流的额外运动速度呢?为什么只有光不服从相对运动速度相加的常识?难道速度相加也只是一个理论假设吗?
什么是“相对”?
爱因斯坦在本书中提及光速恒定非常早,比他那著名的火车实验要早得多,出现在第五章“(有限意义上的)相对原则”。这一章是狭义相对论部分最核心的一章,它涉及相对论的关键概念:“相对”。
一辆火车相对地面匀速直线运动,乌鸦也相对地面匀速直线运动(与火车同向),那么火车也相对乌鸦在作匀速直线运动,换言之,乌鸦相对火车的运动关系,跟乌鸦相对地面的运动关系是同质的,都是匀速直线运动;更一般地,如果我们把地面看作一个伽利略坐标系 K ,那么任何相对地面匀速直线运动的坐标系也都是伽利略坐标系(火车和乌鸦)。我们如果相信一个“放之四海而皆准”的自然世界,它就应该对火车和乌鸦这两个坐标系一视同仁、不搞特殊对待,换言之,任何普遍法则都应该对火车和乌鸦同时成立。之所以会作此假定,是因为我们认为一切运动都是相对的:火车相对乌鸦运动,换个角度就是乌鸦相对火车运动;地球相对太阳运动,换个角度就是太阳相对地面运动。这就是“有限相对原则”。
要更好地理解这一点,不妨设想其反面:如果自然法则不遵循有限相对原则,那会是什么样?爱因斯坦说,那就一定存在一个“绝对静止参照系”,自然仿佛对这个参照系特别优待、凡事从简,其余物体(参照系)的法则都必须根据各自相对于这个“绝对静止参照系”的运动状态来调整。因为地球在围绕太阳作30km/s的旋转运动,所以地球的运动方向相对于“绝对静止坐标系”应该时刻在变,地球上的物理法则也应该时刻在变才对。可是现实情况是,地球一年四季都服从同一套物理法则。有限相对原则完全符合我们的日常经验。
可是如果有限相对原则成立,那么光速恒定就应该对一切伽利略坐标系都同时成立,无论是静止的地面还是运动的火车或乌鸦。这怎么可能呢?同一束光在地面看是这个速度,在火车上看也是这个速度、在乌鸦上看也是这个速度?
我们面临一个“二桃杀三士”的困局:自然现象同时遵循三个物理法则,但这三个法则却相互矛盾:①支撑电磁学体系的光速恒定法则;②有限相对原则;③伽利略转换(相对运动速度简单相加)。一定有一个法则是错的,是哪个呢?
相对的时间、相对的空间
开头我们讲了一道小学数学应用题:甲乙相对运动,求一段时间之后的距离。仔细审题,有一个关键词叫做“同时”:甲乙同时出发(T0),经历相同时间(ΔT),在同一时刻停下(T0+ΔT)。爱因斯坦说,等等,你凭什么断定甲乙经历了相同时间?
这是狭义相对论最难理解的地方。同时出发、同时停止,怎么可能不是经历相同时间?
“同时”一词预设了一个笼罩宇宙万物的绝对时间轴,所有物体都在这同一个时间轴上运行。你的一秒钟跟我的一秒钟完全等价。第八章构想了一个绝妙的思想实验,瓦解了这个想法:想象 AB 两地同时落雷,我们如何知道这两个地方“同时”落雷?最自然的想法当然是,在 AB 中点 M 站一个人,这个人同时看到 AB 两边传来雷光,就说明两地落雷是同时发生的。可是如果在 AB 同时落雷的时候,一辆沿着 A→B 方向行驶的火车正好经过 AB 中点,请问:对火车上的观测者来说,落雷是同时发生的吗?绝不可能。由于火车在开往 B 地,B 地的雷光抵达火车的距离更短,一定比 A 地的雷光更早被火车上的人看到,所以,在火车上的人眼中,这两道雷不可能同时发生。
有人或许会说,不对啊,AB 落雷各自有一个时间(本地时间),这个时间是一致的,就说明是同时啊?——可是我们如何“同时”看到这两个地方的本地时间呢?同一个观测者不可能在 AB 两地同时存在,他在 A 地就看不到 B 地的本地时间,反之亦然;在任何地方观测 AB 两地的现象,都需要时间才能得到观测结果。他也不可能预先知道本地现象(落雷)传到他眼中需要多长时间。选取 AB 中点作为观测点已经是唯一选择。
能不能这样设计:找两个人先在中点集合,对好手表时刻,然后以同样速度各自去到 AB 两地,在落雷的那一刻记录各自手表的时刻(这就是本地时间),记录好之后再回到中点集合。爱因斯坦会说,这个方法跟静止状态下的中点测量没什么不同,但在火车上还是不管用。我怎么事先确保落雷的时候两个人既在行进的火车上,又恰好在落雷处呢?
不妨反过来想:假设落雷的不是 AB 两地,而是与 AB 两地距离等长的火车,雷不是打在地面上,而是打在火车的避雷针 A'B' 上(落雷时这两点与 AB 重合)。这种情况下处于火车中点 M' 的人可以心安理得地认为 AB 两地同时落雷了;可是地面上的人却会觉得 A 地落雷更早,因为火车载着雷光、带动 A 地的雷离中点更近了。无论如何,两个事件如果对地面是同时发生,对火车就不是同时发生。“同时”这个概念也变成相对的了。
用类似的思路,爱因斯坦又构造了一个思想实验来说明空间(距离)也是相对的:想象在火车上 A'B' 两点,火车内可以用一个一米的杆子一段一段量过去、得到一个距离;地面上要如何测量两点距离呢?一个自然的想法是,在地面确定火车经过 A'B' 时对应地面上的 AB 两点,测量 AB 的距离。可是我们怎么确定 AB 是“同时”记下的呢?这又回到上面时间的相对问题,对于火车(A'B')是同时,对于地面就不是了。所以火车上的测距(SA'B')跟地面测距(SAB)一定不同。火车上的一米跟地面上的一米不是一回事了。
在运动速度简单相加的小学数学题中,我们默认甲乙两个运动物体经历的时间和空间都是同质的:一秒钟对甲乙都是一秒钟、一米也都是一米。距离和时间都是同质的,速度才可以简单相加。现在我们发现,一旦存在相对运动,时间和空间都会“变质”,速度简单相加就不成立了。爱因斯坦据此断定,光速恒定和相对原则都没错,错的是速度简单相加(伽利略转换)。
洛伦兹转换
我们能否构造一个新的速度叠加公式,既符合光速恒定、也符合相对原则呢?这就是狭义相对论的问题意识,也正是因为这个问题有一个在数学上完全对称的解,爱因斯坦才会追问“上帝创世时到底有没有选择的余地”——从最终得到的结果来看,世界现象(表达为时空坐标)有非常狭窄的边界,任何自然现象都必须服从洛伦兹转换。世界的法则惊人地简洁和漂亮。
为了照顾普通读者的数学能力,爱因斯坦并未在正文部分解释洛伦兹转换的数学证明,且附录的证明也摒弃了所有微积分技巧,全部换成简单的加减乘除、平方根号。本文只限于解释爱因斯坦是如何将物理现象转换为数学公式的,至于后面的公式求解只是一个纯数学问题,感兴趣的读者请参阅原文附录部分。
步骤一、构建坐标系。对于一个观测者(例如地面),任何物体(包括光)在任何时刻的位置都可以表示为一个(x,y,z,t)的时空坐标,如果把点连成线,就可以把运动轨迹表示成一个关于(x,y,z,t)的表达式。方便起见我们不考虑 y 轴和 z 轴,那么站在地面视角(表示为 K 坐标系),一个从原点按速度 v 沿 x 轴正向运动的火车,其运动轨迹就可以表示为 x=vt ;反过来说,站在火车视角(坐标系 K'),地面原点的运动轨迹就是 x'=-vt' 。
步骤二、引入光速恒定的条件。一束从原点沿 x 轴正向射出的光,在地面看来就会形成一道 x=ct 的运动轨迹;由于光速恒定(无关观测者运动状态),这束光在火车看来也同样是 x'=ct'(火车坐标系以火车头为原点)。
我们感兴趣的不是任何一个坐标系下的运动轨迹,而是两个坐标系的现象如何相互转化:地面在时刻 t 看到光在 x 处出现,对于火车来说,这个现象应该表示成什么呢?用纯数学语言来说就是:给定(x,t),求解所有符合光速恒定和相对原则的(x',t')组合;或者,求解所有符合光速恒定和相对原则的(x,t,x',t')关系。请注意,对于任何一个观测者,时间和空间都是可以自由设定的,可以把今天、明天或任何一天定为 t=0 ,空间也同理。这里我们关注的是相对关系而非绝对数值。据此,一切符合上述正向光线的坐标可以表示为:(x'-ct')=λ(x-ct) 。考虑是一束负向光线(沿 x 轴反方向射出),则得到:(x'+ct')=μ(x+ct) 。只要能算出 λ 和 μ 是多少,问题就解决了。
对于 K' 坐标系(火车)来说,火车头这个自然现象可以表示为:x'=0 ;对于 K 坐标系(地面)来说则可以表示为 x=vt 。把这个自然现象的两种表达都代入上述两个公式,就得到了 v=c*(λ-μ)/(λ+μ) 。( c 和 v 都是已知数)
步骤三、引入有限相对原则。自然法则对一切坐标系同时成立,所以,火车上的一米在地面看来有多长(我们还不知道有多长),地面的一米在火车上看来也应该是同样的长度。地面如何观测火车上的一米呢?严格的数学论证要用到微分技巧,爱因斯坦请求读者想象站在地面对火车拍一张“快照”,也就是把 t 设定为 0 ,看 x'=1 的时候 x 是多少;类似地,在火车上对地面拍一张“快照”(将 t' 设定为 0 ),看 x=1 时 x' 是多少。按有限相对原则,这两个数值必须相等,这就得到了关于 λ 和 μ 的第二个式子:2/(λ+μ)=(λ+μ)/2*(1-v^2/c^2) 。
步骤四、求解。步骤二和步骤三的两个式子都是仅包含 λ 和 μ 的二元一次方程,合并求解就可以得到 λ 和 μ ,代入最初的问题——给定(x,t)求(x',t')——得到最终的解:(洛伦兹转换)
更一般地:(考虑 y 轴和 z 轴的运动)
用洛伦兹转换重新计算相对运动的速度相加问题:A 相对 K 速度为 v ,B 相对 A 速度为 u ,则 B 相对 K 速度为:
我们发现,如果光速不是 30 万 km/s ,而是十七世纪以前人们认为的无限大(瞬时传播),将 c→+∞ 代入上述公式,分母消失,结果正是伽利略转换的结果 w=u+v 。可见,在物体运动速度远低于光速时,用伽利略转换进行速度的简单相加就已经可以得到近似解。换言之,伽利略转换只是洛伦兹转换的一个特殊形式。狭义相对论并没有废止伽利略体系,而是将其包纳在自身之中了。
在新的速度相加公式中,只要 u 和 v 任何一个等于光速,都会使得速度相加的结果 w 等于光速。这符合光速恒定:无论站在哪个位置、以何种运动状态观测,光速都是同一个结果。通过洛伦兹转换,狭义相对论成功调和了光速恒定和有限相对原则。这是一切伟大理论的共性:并不简单推翻旧理论,而是将旧理论吸收进一个更大的体系,从而实现超越。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|