场的图示法
在19世纪中后期,物理学中引入了新的、革命性的观念,它们打开了一条通往新的哲学观点的道路,这个新的观点与旧的机械观不同。法拉第(Faraday)、麦克斯韦(Maxwell)与赫兹(Hertz)的成就使现代物理学得以发展,使新概念得以诞生,新的“实在”的图景也形成了。
现在我们来描述这些新概念如何在科学上引起突然的变化,并阐明它们怎样逐渐地得到澄清和加强。我们将用逻辑推理的程序来叙述它的发展,不一定完全依照年代的先后来叙述。
这些新概念的起源与解释电的现象有关,但是为简便起见,我们不如首先从力学中介绍它们。我们知道两个粒子会相互吸引,而它们的吸引力跟距离的平方成反比。我们可以把这一情况用一种新的方法来表示,但这样做有什么好处还一时很难看出来。图42中的小圆代表一个吸引体,譬如太阳就是一个吸引体。实际上你应该把这个图想象为空间中的一个模型,而不是一个平面图。因此图中的小圆实际上代表在空间中的一个圆球,例如太阳。把一个所谓检验体的物体放在太阳的附近,它就会被太阳所吸引,而引力发生在连接这两个物体的直线上。因此图上的线表示太阳对于检验体在各个位置上的引力。每根线的箭头表示这个力是朝着太阳的,就是说,这种力是引力。这些线都是引力场的力线。目前看来,这不过是一个名词,没有什么理由让我们十分重视它。我们的图中有一个特色,以后将加以发挥。力线是在空间没有任何物质的地方形成的,目前,所有的力线(或简单地说成为场)只表示一个检验体放在构成场的圆球附近时会有何种行为。
在我们的空间模型中,力线总是跟圆球的表面垂直的。因为它们都是由一点发散出去的,因此离圆球最近的地方最密,愈远愈疏。如果我们把离球的距离增加到2倍或3倍,则在我们的立体模型中(并不是在我们的图上)力线的密度会减小为1/4或1/9。因此力线有两个作用,它们一方面表示作用在一个圆球(例如太阳)附近的物体上的力的方向,另一方面空间力线的密度又表示力如何随距离的大小而变化。
场的图,若正确地解释,它表示引力的方向及其与距离的关系。从这样的一个图中可以看出引力定律来,正如从描写引力作用的文字中,或确切而简略的数学语言中可以看出引力定律来一样。这个场的图示法,虽然我们这样称呼它,并且觉得它清楚而有趣,但是我们没有什么理由相信它会表示出任何真实的意义。在引力的例子中很难看出它有什么用处。这些线不过是图形而已,有人想象确有许多真实的力的作用沿着这些线通过,这样想象自然可以,但是你必须同时想象沿着这些线,作用力的传递速率是无限大的。根据牛顿定律,两物体间的力只与距离有关,与时间毫无关系。力从物体传到另一个物体竟不需要时间!但是,任何理智的人都是不会相信速率无限大的运动的,因此要使这个图起到比模型更大的作用是不会有什么结果的。
我们现在并不准备讨论引力问题,我们介绍这些,只不过为了对电学理论中相似的推理方法作一个简化的解释而已。
现在来讨论一个实验,这个实验用机械观来解释会有很大的困难。假设电流在一个环形导体通过,在这个环的中央放上一个磁针。在电流通过的瞬间,产生了一种新的力,这种力作用于磁极上,并且与连接导线和磁极的直线垂直。如果这个力是由一个作圆运动的带电体产生的,则罗兰的实验告诉我们,这个力与带电体的速度有关。这些实验情况与任何力都只在两个粒子的连线上作用而且只与距离有关这一哲学观点相矛盾。
电流作用于磁极上的力要精确地表示出来是很复杂的,事实上这比表示引力要复杂得多,可是我们也能把这种作用跟引力的作用同样清楚地想象出来。我们的问题是:电流用怎样的一种力作用于放在它附近的磁极上的呢?要用文字来描述这种力是相当困难的,即使用数学公式来表示也一定是复杂而笨拙的。最好是把我们所知道的所有作用力用带有力线的图表示出来,或者更确切地说,用带有力线的空间模型表示出来。但是也有一些困难,因为一个磁极总是跟另一个磁极同时存在的,它们共同构成一个偶极子。不过我们往往把磁针想象得很长,使得只须计及作用于与电流比较靠近的这个磁极上的力。另一极因为离得太远,作用于它的力可以忽略。为了避免混淆起见,我们假定靠近导线的磁极是正的。
作用于正磁极上的力的性质可以从图43中看出来。
绘在导线旁边的箭头表示电流从较高电势流向较低电势的方向。所有其余的线都表示属于这个电流的力线,这些力线都处在某一平面上。假如图画得恰当,那么这些力线既能表示出电流在给定的正磁极上的作用力的矢量的方向,同时还能表示出矢量的长度。我们知道力是一个矢量,要决定它必须知道它的方向和长度。我们主要是讨论作用在磁极上的力的方向问题,这个问题是:怎样从图中去找出空间中任何一点的力的方向呢?
在这样一个模型中要看出一个力的方向,不会像前面的例子那样简单,因为在前例中力线是直线。为了方便起见,图44中只画了一根力线。图中指出,力的矢量在力线的切线上,力的矢量的箭头和力线上的箭头所指的方向相同。这样,箭头的方向就是在这一点上作用于磁极上的力的方向,一个好的图,或更确切地说,一个好的模型,也能够把任何一点上力的矢量长度表示出来。这种矢量在力线稠密的地方,也就是靠近导线的地方较长,而在力线较疏,亦即离导线较远的地方较短。
用这种方法,力线或场就使我们能够决定在空间中任何一点作用于磁极的力。以目前来说,这是我们煞费苦心地绘出一个场的惟一论据了。知道了场表示什么,我们就会以更浓厚的兴趣来考查相应于电流的力线。这些线都是围绕着导线的一些圆圈,它们所处的平面跟导线所处的平面相垂直。从图上看到力的特征以后,我们再一次得出这样的结论,力作用的方向垂直于连接导线与磁极间的任何直线,因为圆的切线总是与半径垂直的。我们对于作用力的全部知识,都可以总结在场的构图中。我们把场的概念插入在电流与磁极的概念之间,以便用简单的方式把这些作用力表示出来。
任何一个电流都有一个磁场,换句话说,在有电流通过的导线附近的磁极上总是受到一种力的作用。我们不妨顺便提一提,电流的这种性质使我们能够制造出一种灵敏的仪器来探测是否有电流存在。我们一旦知道了如何从电流的场的模型来看磁力的特征,我们就能绘出通电导线周围的场来表示空间任何点上磁力的作用。作为第一个例子,我们来研究一下所谓螺线管。它实际上就是一卷金属线,如图45所示。我们的目的就是要用实验来掌握关于与通过螺线管中的电流相关连的磁场的知识,并把知识结合在场的构图中。图上已经把结果显示出来了,弯曲的力线是闭合的,它们围绕着螺线管,表征着电流的磁场。
磁棒的磁场,也可以用表示电流的磁场的同样方法来表示。如图46所示,力线是从正极到负极的。力的矢量总处在力线的切线方向上,而且近极处最大,因为在这些地方力线最密。力的矢量表示磁棒对正磁极的作用。在这个情况里,场的“源”是磁棒而不是电流。
应该仔细地比较一下前面的两个图,在图45中的是通过螺线管的电流的磁场,图46中的是磁棒的场。我们且不管是螺线管还是磁棒,而只注意它们外面的两个场。我们立刻会注意到它们的性质是一模一样的,两者的力线都是从螺线管或磁棒的一端延伸到另一端。
场的图示法结出了它的第一个果实,如果我们不画出场作为启发,我们很难看出通过螺线管的电流和磁捧之间有什么相似之处。
现在场的概念将经受更严格的考验,我们很快就将知道它不仅仅是一种关于作用力的新的图示法。我们可以这样想:暂且假设场惟一地表征由它的源所规定的一切作用。这只是一个猜测。这句话的意思是,假如螺线管的场与磁棒的相同,则它们所有的作用也一定相同。也就是说,两个通电的螺线管的行为会跟两根磁棒的一样,它们相互吸引或推斥,而引力或斥力与距离有关,这完全和两根磁棒所发生的情况一样。这句话还表示一个螺线管和一根磁捧之间也会像两根磁棒一样地吸引或推斥。简单地说,通电的螺线管所有的作用和磁棒的相应作用是一样的,因为只有场能起这些作用,而场在这两种情况里具有相同的性质。实验完全确认了我们的猜测。
没有场的概念要想找出这些论据会是多么困难呀!要把作用于通电的金属线与磁极间的力表示出来是非常复杂的。假如是两个螺线管,便须研究两个电流相互作用的力。但是一旦利用场的概念,我们发现螺线管的场和磁棒的场是相似的,我们就可以立刻认识所有这些作用的性质了。
我们现在有理由更加重视场了。对描述现象来说,似乎只有场的性质最为重要,场源不同是无关重要的。场概念的重要性在于它能够引导我们发现新的实验论据。
场已经被证明是一个很有用处的概念。它起初只是当作在源与磁针间的某种东西,用来描述两者之间的作用力。它被想象为电流的“经纪人”,电流的一切作用都靠它来完成。但是现在经纪人还兼充翻译员,它把定律翻译成简单、明确、易懂的语言。
场的描述的最大功绩意味着用它来间接地考察电流、磁棒、带电体的所有作用将变得很方便,亦即可借助于场作翻译员。我们可以认为场总是跟电流连在一起的某种东西,即使没有一个磁极去检验它是否存在,它总是存在的。我们还要把这个新的线索加以引申。
带电导体的场可以用描述引力场、电流的场或磁棒的场的同样方法来叙述。我们同样再举出一个最简单的例子,要画出一个带正电的圆球的场,我们必须提出这样一个问题:当一个小的带正电的检验体放在作为场源的带电圆球附近,它会受到什么样的力的作用?我们之所以用一个带正电的检验体而不用一个带负电的,这只是一个惯例,它只是决定力线的箭头应该朝哪一个方向画(图47)。因为库仑定律与牛顿定律相似,所以这个模型跟前面引力场的模型(图42)也相似。两个模型的惟一不同之点便是箭头的方向相反。两个物体的正电荷相互推斥,而两个物体的质量相互吸引。可是一个带负电的圆球的场会跟引力场相同(图48),因为小的带正电的检验体会受场源的吸引。
假使电极与磁极都处于静止状态,那么它们之间不会有任何相互作用,既没有吸引,也没有推斥。若用场的语言来表述这种情况,我们可以这样说:一个静电的场对一个静磁的场没有影响,反过来说也一样。“静场”是指不依时间而变化的场。假如没有外力的干扰,磁棒与带电体可以放在一处而永不发生作用。静电场、静磁场和引力场的性质各不相同,它们不会互相混合;不论有无其他的场存在,各自保持自己的个性。
现在我们回到带电圆球上来,它原来一直处于静止状态,现在假定由于受某种外力的作用而开始运动。带电圆球运动了,这句话用场的语言来说便是:带电体的场随时间而变化。但是根据罗兰的实验,我们知道带电的圆球的运动相当于电流,而每一电流必有一磁场相伴存在。因此我们论证的程序便是:
带电体的运动→电场的变化
↓
电流→伴随有磁场
因此我们断定:由带电体的运动而产生的一个电场的变化,永远由一个磁场相伴。
我们的结论是根据奥斯特的实验作出来的,但是这一结论所包含的意义还不止这些,它使我们认识到一个随时间而变化的电场与伴随着的一个磁场对于我们作进一步的论证是非常重要的。
带电体在静止的时候只有静电场,而带电体一旦运动,磁场就出现了。我们还可以进一步说,假使带电体更大,或运动得更快,则由带电体运动所产生的磁场也更强。这也是罗兰实验的一个结果。用场的语言来说,电场变化愈快,相伴的磁场便愈强。
电流体的学说是依照机械观建立起来的,这里我们已把熟知的论据由电流体的语言译成场的新语言了。我们在后面还会看到,这种新语言是多么清晰,多么有用处!
场论的两大台柱
“一个电场的变化永远由一个磁场相伴。”假使我们把“电”与“磁”两个字互换一下,这句话便变成:“一个磁场的变化永远由一个电场相伴。”这种说法是否正确,只有实验才能决定。但是,这是由于使用了场的语言,所以才形成了提出这个问题的观念。
在100多年以前,法拉第做了一个实验,这个实验导致了感生电流的伟大发现。
这个现象的演示是很简单的(图49),只需要一个螺线管或其他电路,一根磁棒以及一种检验电流存在与否的仪器。开始时,在构成一个闭合电路的螺线管附近有一个静止的磁棒。因为不存在电源,导线中没有电流通过,这里只有不随时间变化的一个磁棒的静磁场。现在我们很快地改变磁棒的位置,或者移开些,或者挨近些,在这个时刻,导线内立刻就有电流出现,随即又消失了。每当磁棒的位置改变一次,电流就会重新出现一次,而这种电流可以用相当灵敏的仪器检验出来。但是根据场论的观点看来,一个电流表示有一个电场的存在,这个电场迫使电流体在导线中流动。当磁棒再静止时,电流便消失了,电场也同样消失了。
设想我们目前还不知道场的语言,而要用机械观的概念定性地和定量地来描写这些实验结果。我们的实验就这样表示:一个磁偶极子的运动产生了一种新的力,这种力使导线中的电流体流动。于是又产生了这样一个问题:这种力与什么有关?这是很难答复的。我们必须研究这种力与磁棒的速度的关系,与它的形状的关系以及与线圈的形状的关系。而且,如果用旧的语言来解释的话,这个实验不能告诉我们是不是用另一个通电电路的运动来代替磁棒的运动,也能产生感生电流。
假使我们用场的语言,并且相信作用是由场所决定的,那么结果就完全不同了。我们立刻可以看到通电的螺线管会起到磁棒一样的作用。图50上画出了两个螺线管:一个较小,其中有电流通过,另一个较大,其中有感生电流可以检验出来。我们可以像前面移动磁棒一样移动小的螺线管,结果在较大的螺线管中便会产生感生电流。此外,我们可以不用移动小的螺线管的方法而用产生和消除电流,也就是用接上和断开电路的方法来激起和消除磁场。我们又一次看到,场论所提出的新论据又被实验所确认了!
我们来举一个比较简单的例子。我们取一个没有任何电源的闭合导线,在它的附近有一个磁场。至于磁场的源是另一个通电的电路还是一根磁棒,这是无关重要的。图51中画着闭合电路和磁力线。用场的术语来对感应现象作定性和定量的描述是很简单的。如图所示,有些力线通过线圈所围成的圆,我们必须考察通过线圈所围住的那部分平面的力线。不论场有多强,只要场不变,便不会产生电流。但是一旦通过闭合电路所围住的圆的力线的数目有所变化,那么它上面就立刻引起电流。电流是由通过这个面的力线数目的变化来决定的,而电流也可以引起力线数目的变化。这个力线数目的变化不论对感生电流作定性的或定量的描述都是惟一重要的条件。“力线数目变化”是指力线分布密度在变化,而我们记得,这句话的意思就是场的强度在变化。
在我们的推理程序中最重要的几点是:磁场的变化→感生电流→带电体的运动→电场的存在。
因此,一个在变化着的磁场总是由一个电场伴随着的。
于是我们找到了支持电场和磁场理论的两个最重要的台柱。第一个是变化着的电场跟磁场相结合,它是从奥斯特的关于磁针发生偏转的实验中形成的,并且它得出了这样的结论:变化着的电场总是由磁场伴随着的。
第二个是把变化着的磁场跟感生电流结合起来,它是从法拉第的实验中形成的。两者便成为定量描述的根据。
伴随着变化磁场的电场也似乎是真实的。我们在前面已经设想过,即使没有检验磁极的话,电流的磁场仍然是存在的。同样,我们可以认为即使没有闭合的导线来检验有没有感生电流,电场还是存在的。
事实上,这两个台柱可以化成一个,就是说,化成以奥斯特实验为根据的那个。法拉第的实验结果可以根据能量守恒定律从奥斯特实验推论出来。我们所以采用两个台柱的说法只是为了明白与省事。
我们再来讲一个描述场的结果。假设有一个通有电流的电路,电流的源是伏打电池。如果将导线与电源之间的连结突然断开,当然不会再有电流了!但是在电流中断的这一瞬间却发生了一种复杂的过程,这种过程只有用场论才能预言。在电流中断之前,导线周围存在着磁场,电流中断了以后,这个磁场便不存在了,因此是由于电流的中断,磁场才消失,这样通过导线所包围的面的磁力线的数目变化得很快。但是不管这种迅速的变化是怎样产生的,它一定会产生感生电流。更有意义的是,激起感生电流的磁场的变化愈大,则感生电流愈强。这个结果又是对场论的另一个考验。电流的突然中断一定伴随着产生强烈而短暂的感生电流的现象。实验又确认了这个理论的预言,任何人把电流弄断都会注意到有一个火花产生,这个火花正好显示由于磁场的迅速变化而产生了很强的电势差。
这个过程也可以从另一观点,即从能的观点去看。磁场消失,却产生了火花。这个火花代表能,因而磁场也一定代表能。为了一致地应用场的概念和它的语言,我们必须将磁场当作能的储存所,只有这样才能使我们能够按照能量守恒定律来描述磁和电的现象。
最初,场不过是一个颇有用处的模型而已,现在看来却愈来愈真实了,它帮助我们了解旧的论据并且引导我们认识新的论据。把能归结到场是物理学发展中向前迈进的一大步,场的概念愈显得重要,使机械观中最重要的物质的概念则愈来愈遭到抑制。
场的实在性
电磁学中,关于场的定律的定量数学描述都总括在所谓的麦克斯韦方程内。上面所说的论据导致了这些方程的建立,但是方程中所包括的内容比我们所能指出的要丰富得多。在它们的简单的形式下隐藏着深奥的内容,这些内容只有靠仔细的研究才能显示出来。
这些方程的提出是牛顿时代以来物理学上一个最重要的事件,这不仅是因为它的内容丰富,并且还因为它构成了一种新型定律的典范。
麦克斯韦方程的特色显现在现代物理学的所有其他方程式中,这种特色可以用一句话来概括,即麦克斯韦方程是表示场的结构的定律。
麦克斯韦方程何以在形式上和性质上都跟经典力学中的方程不同呢?我们说这些方程在描述场的结构是什么意思呢?我们怎样才能够从奥斯特和法拉第的实验中构成一个新型的定律,这个定律在物理学的往后发展中又重要到什么样的程度呢?
从奥斯特的实验中,我们已经看到磁场环绕着变化的电场闭合起来。从法拉第的实验中,我们又看到电场环绕着变化的磁场闭合起来。为了概括地描述麦克斯韦理论的某些特色,我们暂且集中注意力于这两个实验中的一个,譬如法拉第的实验。现在再把图51复习一下。我们已经知道,如果穿过导线包围的面的力线的数目发生变化,便会产生感生电流。因此当磁场变化,或电路变形,或电路移动都会有电流产生,就是说:不论穿过表面的磁力线的数目是因为什么缘故变化的,只要有了这种变化,便会有电流。要把这种种可能性都计算在内来研究它们的特殊影响,那么必定会引出一种极为复杂的理论来。但是我们能不能使这个问题简化呢?我们试把牵涉到电路的形式、长度以及导线所包围的面等方面的一切因素都不加考虑。我们可以想象图51中所画的线圈逐渐缩小,最后变成一个极小的线圈,只包围空间的某一点。这样,关于形状和大小的问题就完全没有关系了。在闭合曲线缩成一点的极限情况下,线圈的大小和形状就自然而然地从我们的考虑中消失,于是我们就得到把任何时刻及空间中任何一点的磁场和电场的变化连结起来的定律。
这是得出麦克斯韦方程的主要步骤中的一步,这又是在想象中把法拉第实验中的线圈缩成一点所做的一个理想实验。
事实上我们应该叫它半步而不是一整步,因为到目前为止,我们的注意力只一直集中在法拉第的实验上。但是以奥斯特的实验为根据的场论的另一个台柱也必须用同样的方式很细致地加以研究。在这个实验中磁力线围绕着电流的周围闭合起来。把磁力线的圈缩成一点以后,其余的半步就完成了。而这整个一步便得出,在空间中任何一点以及任何时刻的磁场和电场的变化之间的联系。
现在还需要有另一个很重要的步骤。根据法拉第的实验,必须有导线来检验电场是否存在,正像在奥斯特的实验中也必须有磁极或磁针来检验磁场是否存在一样。麦克斯韦的新的理论观念却超越了这些实验论据。在麦克斯韦的理论中,电场和磁场,或简单些说电磁场,是一种实在的东西。一个变化的磁场总产生电场,而不管有没有一根导线去检验它是否存在;
一个变化的电场也总会产生磁场,不管有没有一个磁极去检验它是否存在。
这样,要有两个重要的步骤导致麦克斯韦方程的成立。第一,必须使奥斯特和罗兰实验中的围绕电流及变化的电场周围的磁场的闭合力线缩成一点;必须使法拉第实验中的围绕变化的磁场周围的电场的闭合力线缩成一点。第二,是把场看成实在的东西,一旦产生了电磁场,必须按照麦克斯韦定律而存在、作用和变化。
麦克斯韦方程是描述电磁场结构的。这些定律的描述对象是整个空间,不像力学定律那样,只以物体或带电体所在的一些点为描述的对象。
我们记得在力学中只要知道了一个粒子在某一时刻的位置和速度,又知道了作用于它的力,便可以预知这个粒子的未来的行经路程。在麦克斯韦的理论中,假如知道了场在某一时刻的情况,便可以根据这个理论的方程推出整个场在空间和时间中会怎样变化。麦克斯韦方程使我们能够了解场的来历,正如力学方程能使我们了解物质粒子的来历一样。
但是在力学定律和麦克斯韦定律之间仍然有一个重要的不同点,把牛顿的引力定律和麦克斯韦的场定律作一比较,便更能显出这些方程所表达的一些特色来。
利用牛顿定律,我们就可以从作用于太阳和地球之间的力,把地球的运动推论出来。这个定律使地球的运动跟远离地球的太阳的作用联系在一起了。地球和太阳虽然相隔很远,但在力的表演中它们都是演员。
在麦克斯韦的理论中,根本没有这种具体的演员。这个理论的数学方程表述了电磁场的定律。它们不像牛顿定律中那样联系两个相隔很远的事件,它们不是把此处所发生的事情跟彼处的条件联系起来,此处的与现在的场只与最邻近的以及刚过去的场发生关系。假使我们知道此处和现在所发生的事件,这些方程便可以帮助我们预测在空间上稍为远一些。在时间上稍为迟一些会发生什么。它们能使我们用一些小步骤来增加场的知识,把这些小步骤加起来,我们便可以由远处所发生的事件推出此处所发生的事件。牛顿的理论恰恰相反,它只允许把距离很远的事件联系起来的大步骤。奥斯特和法拉第的实验都可以用麦克斯韦的理论来加以重演,但是只能用把一些小步骤总加起来的办法,而每一个小步骤都是由麦克斯韦方程确定的。
如果从数学上更全面地对麦克斯韦方程加以研究就能推出一些新的实际上是出乎意料之外的结论,而使这整个理论在一个更高的水平上受到考验,因为这些理论上的结果,现在已具有定量的性质,而且是由一系列的逻辑推理得出来的。
我们再来设想一个理想实验,用某种外部影响迫使一个带有电荷的小圆球很快而且有韵律地像钟摆一样振荡起来。根据我们已经具备的关于场的变化的知识,我们怎样用场的语言来描写这里所讨论的一切事情呢?
带电体的振荡产生了一个变化的电场,它总是由一个变化的磁场伴随着的。假如把一个形成闭合电路的导线放在附近,于是与变化的磁场相伴而发生的便是电路中的电流。这些话无非是复述已知的论据,但是研究麦克斯韦方程以后,对振荡带电体的问题便会有一种更深的了解。根据麦克斯韦方程所作的数学推理,我们便可以发现围绕在一个振荡带电体周围的场的性质。它在场源近处和远处的结构以及它随时间的变化。这种推理的结果就是电磁波。能是从振动的带电体中以一定的速率经过空间而辐射出去的,能的转移,状态的运动,是一切波动现象的特性。
我们已经研究过几种不同的波,其中有由圆球的脉动所产生的纵波,它的密度的变化由介质传播。又有一种胶状的介质,横波就是在这种介质中传播的,由于圆球的转动而引起球面上的胶状物的形变,这种形变在介质中向外传播。但是现在在电磁波的例子中,传播的是哪一类变化呢?这正是一个电磁场的变化。电场的每一次变化都产生磁场,这个磁场的每一次变化又产生电场,就这样一次一次地反复变化下去。因为场代表能,所以所有这些在空间中以一定速度传播的变化就形成一个波。从理论可以推出,这些磁力线与电力线都处在与传播方向相垂直的平面上,因此所形成的波是横波。我们从奥斯特和法拉第的实验中所构成的场的图景的原来面貌仍然保留不变,但是我们现在来看它就具有更深远的意义了。
电磁波是在空间传播的,这又是一个麦克斯韦理论的结果。假使振动着的带电体突然停止运动,它的场便变成静电场了。但是由带电体振动所产生的一系列波还是继续在传播。这些波独立地存在着,而我们可以像了解任何其他具体事物的过程一样来研究它们变化的过程。
由于麦克斯韦方程是描述电磁场在空间中任何一点、在任何时刻的情况的,这样就导出如下的结论:电磁波是在空间中以一定的速度传播,并随着时间而变化的。
还有另外一个非常重要的问题,电磁波在空中是以多大的速率传播的呢?麦克斯韦的理论,在一些与波的实际传播完全无关的简单实验中的数据的支持下,作了一个明确的答复:电磁波的速度等于光速。
奥斯特和法拉第的实验是建立麦克斯韦定律的根据。上面所有的结果都是由于仔细地研究了用场的语言来表述的定律中得来的。从理论上发现以光速传播的电磁波,这是科学史上最伟大的成就之一。
实验确认了理论的预测,50年前赫兹第一次证明了电磁波的存在,而且用实验证明了它的速度等于光速。今天,千千万万人都已经知道电磁波的发送和接收。他们所用的仪器已经比赫兹所用的要复杂得多,这些仪器甚至能在离波源几千公里处发现波的存在,而当时赫兹的仪器只能在几米以外发现它。
场与以太
电磁波是横波,是以光速在空中传播的。光与电磁波速度的相等,暗示着光的现象与电磁现象之间有很密切的关系。
当我们对微粒说与波动说不能不有所抉择时,我们决定赞成波动说。光的衍射现象是影响我们这一决定的最有力的论据。但是,如果我们假定光波是一种电磁波,这个假定对于任何光学上的论据的解释都不会发生冲突,相反地还可以得出旁的结论来。假如真是这样,那么物质的光学性质和电学性质之间应该有某种联系,而这种联系应该可以从麦克斯韦的理论推导出来的。事实上,我们确实可以推出这样的结论来,而且这些结论经得起实验的考验,这就是我们赞成光的电磁说的很重要的论据。
这个巨大的成果应归功于场论。表面上毫无关系的两个科学分支已经被同一个理论统一起来了,同一个麦克斯韦方程既可以解释电磁感应现象也可以解释光的折射现象。如果我们的目的是用一个理论来解释已发生的或将会发生的一切现象,那么,毫无疑问,光学与电学的结合便是向这方面前进的一大步。从物理学的观点看来,普通的电磁波与光波的惟一区别是波长:光波的波长较短,肉眼就可以检测出来,普通的电磁波的波长较长,须用无线电接收机才能检测出来。
旧的机械观总想把一切自然现象归结为作用于物质粒子之间的力。电流体的理论就是建立在这个基础上的第一种朴素的理论。一个19世纪初期的物理学家总认为场是不存在的。在他看来,只有物质和它的变化才是实在的。他只想利用直接关联到两个带电体的概念来解释两个带电体间的作用。
在最初,场的概念不过是作为我们便于从力学的观点去理解现象的一种工具。新的场的语言不是对带电体本身而是对带电体间的场的描述,场的描述对了解带电体的作用是很重要的。对于这种新概念的认识是逐渐建立起来的,到后来,场竟把物质也掩蔽起来了。于是大家觉得在物理学中发生了某种非常重要的事件。一种新的事实产生了,一种在机械观中没有地位的新概念产生了。场的概念经过一番周折逐渐地在物理学中取得了领导地位,而至今还是基本的物理概念之一。在一个现代的物理学家看来,电磁场正和他所坐的椅子一样地实在。
但是,如果认为新的场论已使科学从旧的电流体理论的错误中解脱出来,或者说,新理论毁灭了旧理论的成就,那是不公正的。新理论既指出了旧理论的优点也指出它的局限性,而使我们能把自己的旧概念重新提高到更高的理论水平。不仅电流体及场的理论如此,任何物理学说的变化,无论看起来具有怎样的革命性,都是如此。例如,在目前情况下,我们仍然可以在麦克斯韦的理论中找到带电体的概念,不过这里只把带电体看作电场的源而已。库仑定律仍然是有效的,而且仍然包含在麦克斯韦方程中,从这些方程式中可以推演出库仑定律,成为许多推论结果之一。我们还可以应用旧的理论,只要我们所考查的论据是在这个理论的有效范围之内。但是我们也可以应用新理论,因为一切已知的论据都已经包含在新理论的有效范围之内了。
若用一个比喻,我们可以说建立一种新理论不是像毁掉一个旧的仓库,在那里建起一座摩天大楼,它倒是像在爬山一样,愈是往上爬愈能得到新的更宽广的视野,并且愈能显示出我们的出发点与其周围广大地域之间的意外的联系。但是我们出发的地点还是在那里,还是可以看得见,不过显现得更小了,只成为我们克服种种阻碍后爬上山巅所得到的广大视野中的一个极小的部分而已。
事实上,大家经过很久才认识到麦克斯韦理论的全部内容。最初,大家都以为场最后总可以借助于以太用力学方法来解释的。现在我们知道这种预测是不能实现的了,场论的功绩实在太显著和重要了,因为它换下了一个力学的教条。在另一方面,替以太设想一个力学模型的问题愈来愈没有意义了,只要看看那些假设的牵强和虚假的性质,便会令人沮丧。
现在惟一的出路,便是认定空间具有一种发送电磁波的物理性能,而不过分顾虑这句话有何真正意义。我们仍然可以引用以太,但它只表示空间的一些物理性质。以太这个字的涵义在科学的发展过程中已经改变了很多次。在目前它已不再是一种由微粒组成的介质了,它的故事并没有结束,还要用相对论继续讲下去。
力学的框架
我们的故事说到这个阶段时,必须回溯到开始的地方——伽利略的惯性定律。我们再把它引出来:
一个物体,假如没有外力改变它的状态,便会永远保持静止的状态或匀速直线运动的状态。
一旦了解了惯性的观念,似乎对于这个问题已经没有什么可说的了。虽则我们已经全面地讨论过这个问题,但是却没法把它讨论彻底。
设想有一个很严格的科学家,他相信惯性定律可以用实际的实验加以证明或推翻。他在水平的桌面上推动小的圆球,并设法尽量地减小磨擦。他注意到桌面与圆球愈加平滑,运动便愈加均匀。当他正要宣布惯性原理时,有人突然开了一个玩笑。这个物理学家是在一个没有窗户并且与外界完全隔绝的房子里工作,开玩笑的人装置一种机械,可以使整个房子绕一根穿过它的中心的轴而旋转。旋转一开始,这个物理学家立刻得到新的、意料之外的经验。原来是匀速直线地运动的圆球,现在尽量离开房子的中央而靠近房子的墙壁。他自己感到有一种奇怪的力把他推向墙去。他所体验到的感觉和在一个转急弯的火车或汽车中的人所感到的相似,和坐在回旋木马上所感到的更相似。他过去所得到的一切成果现在都粉碎了。
这个物理学家若要放弃惯性定律,必须同时放弃所有的力学定律。惯性定律是他的出发点,假如这个出发点改变了,那么他的一切结论也都改变了。一个观察者如果他的一生都是在一个转动的房间内度过的,并且在它里面进行各种实验,那么他所得到的物理学定律跟我们得到的是不同的。另一方面,如果他在进入房间以前对于物理学的原理已经有了很深厚的知识和坚定的信念,那么他会解释力学定律之所以被推翻,是因为房子在转动。用力学的实验,他甚至能决定它是怎样转动的。
我们为什么对这个旋转的房间内的观察者发生这么大的兴趣呢?道理很简单,因为在地球上的某种程度中,我们也是处于同样的情况的。从哥白尼(Copernicus)时代以来,我们便知道地球是绕着它自己的轴旋转并环绕太阳运行的。在科学发展中,甚至这个任何人都很清楚的简单观念也不会不受触动。但是我们暂且丢开这个问题,而接受哥白尼的观点。假使那个旋转着的观察者不能确认力学定律,那我们在地球上自然也不能确认它。不过地球转动得较慢,所以转动的影响不很明显。可是有许多实验都证明跟力学定律有些偏差,这些偏差的一致性可以看作是地球转动的证明。
可惜我们不能置身于太阳与地球之间,在那里去证明惯性定律的绝对有效性以及观察一下转动着的地球,这只有在想象中才做得到,我们所有的实验都只有在我们所居住的地球上进行。这句话我们常常更科学地说成:我们的坐标系是地球。
我们不妨举一个简单的例子把这句话的意思说明得更清楚些。我们能够预言一个从塔上落下来的石子在任何时刻的位置,并用观察来确认我们的预言。假使把一根量杆放在塔边,我们便可以预言在某个时候,落体会与杆上的一个数码相合。不言而喻,塔和量杆都不是用橡皮或其他在做实验时会发生变化的物质制成的。事实上,一根严密地跟地球相联系的刻度不变的尺和一只好的钟,就是我们做实验时所需要的一切了,我们只要有这两件东西,不仅可以不管塔的建筑怎样,甚至有没有塔都可以。上面所说的种种假定,都是很平凡的,在描写这些实验时通常是不会提到的。但是这个分析表明了在我们的每一句话后面都隐藏有许多假定。在这个例子中,我们假定存在有一根坚硬的量杆和一只理想的钟,若没有这两样东西,我们就不能检验伽利略的落体定律是否有效。用这样简单而重要的实际器具,一根量杆和一只钟,我们就能够以一定程度的准确性确认这个力学定律。如果这个实验做得非常仔细便会发现理论和实验之间有些不符,这种不符是由于地球的转动而产生的,或者换句话说,是由于这里所表述的力学定律,在严密地跟地球相联系的坐标系中不是十分有效的。
在所有的力学实验中,不论是哪一种形式的实验,我们必须决定质点在某一确定时刻的位置,正如在上述实验中决定落体的位置一样。但是位置总是对于某种物件来说的,例如在上述的实验中,落体的位置是对于塔与刻度尺来说的。我们必须有一些所谓参考系,这是用来决定物体的位置的力学框架。例如在城市中要决定物和人的位置,大街和小巷就是我们参考的框架。到目前为止,我们引用力学定律时都没有想到过要说明所参考的框架,因为我们住在地球上,而在任何情况中都不难选择一个与地球严密地相联系的参考框架。我们把所有的观察都关联到它上面的这个由坚硬不变的物体构成的参考框架上,这个框架称为坐标系。
我们所有的物理描述都还缺少某些东西。我们没有注意到任何观察都必须在一定的坐标系中进行。我们不去描写这个坐标系的结构,反而根本忽视它的存在。例如过去我们写道:“一个物体在匀速地运动……”其实我们应该这样写:“一个物体对某一选定的坐标系在匀速地运动……”那个对于旋转房间的经验告诉我们,力学实验的结果可能跟我们所选定的坐标系有关。
假如两个坐标系相对转动,那么力学定律不能在两者之中都有效。如果把一个游泳池里的水面作为这两个坐标系中的一个,水面是平的,那么在另一个坐标系中看来,同样的游泳池里的水面就会是弯曲的,它正如任何人用茶匙搅动杯中的咖啡那样。
在前面叙述力学的主要线索时,我们忽略了很重要的一点,我们没有说出它们在哪一种坐标系中是有效的。由于这样,全部经典力学就等于悬在半空中,因为我们不知道它属于哪一个坐标系。我们暂且不去管这个困难,来做一个不十分准确的假定,就是说认为在所有与地球严密地相联系的坐标系中,经典力学的定律都有效。这样做是为了把坐标系确定下来,使我们叙述起来可以明白一些。我们说地球是一个适宜的参考坐标这句话虽然并不十分正确,但我们暂且这样承认它。
因此,我们假定有一个坐标系,在这个坐标系中力学定律是有效的。这样的坐标系只有一个吗?我们假设有一个像一列火车、一艘船、一架飞机那样的坐标系,它相对于地球在运动。在这些新的坐标系中,力学定律都有效吗?我们确实知道它们不是一直有效的,例如火车在转弯时,船在风暴中颠簸时,飞机在翻身时,它们就不再有效了。我们先说一个简单的例子。如果有一个坐标系匀速地相对于一个“好的”坐标系在运动,所谓一个“好的”坐标系就是力学定律在其中有效的坐标系。例如,沿着直线以不变的速率在行驶的一列理想火车或一艘航行得异常平稳的船。我们从日常的经验中得知这两个坐标系都是“好的”,因为在匀速直线地运动着的火车或轮船中所进行的物理实验和在地面上所做的结果完全一样。但是假如火车突然停止了,或急剧地加快了,或者海面突然起了风浪,便会发生异常的情况。在火车里,箱子从行李架上掉下来了;在船上,桌子和椅子翻倒了,乘客也晕船了。从物理学的观点看来,这只表示力学定律不能在这些坐标系中应用,它们是“坏的”坐标系。
这种结果可以用所谓伽利略相对性原理来表达:假使力学定律在一个坐标系中是有效的,那么在任何其他相对于这个坐标系作匀速直线运动的坐标系中也是有效的。
假使有两个坐标系,相互作不等速运动,则力学定律不会在两者之中都是有效的。“好的”坐标系就是力学定律在其中有效的坐标系,称为惯性系。究竟是否存在一个惯性系的问题,直到现在还无法决定。但是如果有一个这样的系统,便会有无数个这样的系统,凡是对第一个惯性系作匀速直线运动的坐标系都是惯性坐标系。
我们来研究这样一个例子:有两个坐标系从已知的某一点出发,而且以已知速度相对作匀速直线运动。假如有人喜欢作具体的构思,他可以想象一艘船或是一列火车相对于地面在运动。力学定律可以在地面上,也可以在相对它作匀速直线运动的火车内或船上以同样精确度的实验加以确认。但是假如两个系统的观察者从他们各自不同系统的观点对同一事件进行观察而开始讨论时,便会产生某些困难。每一个人都想把别人的观察翻译成为自己的语言。再举一个简单的例子:从两个坐标系(一个为地球,一个为在作匀速直线运动的一列火车)观察同一个质点的运动。这两个坐标系都是惯性的。如果两个坐标系在某个时刻的相对速度与相对位置都是已知的,那么是否知道了一个坐标系中的观察结果,便可以求出另一个坐标系中的观察结果呢?要描述自然现象,我们必须知道从一个坐标系过渡到另一个坐标系的方法,这是非常重要的,因为这两个坐标系是等效的,因而同样适宜于描写自然界中的现象。事实上,只要知道在一个坐标系中的一个观察者所得到的结果,你便可以知道在另一个坐标系中的观察者所得到的结果。
我们现在不用船或火车而更抽象地来考察这个问题。为简便起见,我们只研究直线运动。有一根坚硬的刻有标度的杆和一只好的钟。在简单的直线运动的情形中,这根坚硬的杆代表一个坐标系,正如伽利略的实验中的塔上的标度尺一样。在直线运动的情形中,把一个坐标系想象为一根坚硬的杆,在空间任意运动的情形中,把一个坐标系想象为一个由相互平行和相互垂直的杆构成的坚硬的框架,而不管什么塔、墙、街道以及其他这一类具体的东西,就会比较简单些、好些。假设在这种最简单的情形中,有两个坐标系,就是说,有两根坚硬的杆,假定一根杆子放在另一根的上面,我们分别叫它们为“上面的”和“下面的”坐标系。我们假定这两个坐标系以一定的速度相对运动,一根杆子沿着另一根滑动。为妥当起见,再假定两根杆是无限长的,只有起点而没有终点。这两个坐标系只用一个钟就够了,因为时间的流逝对这两个坐标系是一样的。在观察开始的时候两根棒的起点是重合的。这个时候,一个质点的位置在两个坐标系中都是用同一个数目来表征的。这个质点的位置跟杆的刻度上某一点是重合的,这样我们就得到决定这质点位置的数字。但是假如两根杆相对作匀速运动,在运动了一些时间以后(譬如说,1秒钟之后),表示位置的数字就各不相同了。试看图52所示,静止在上面的杆上的一个质点,在上面的坐标系中决定它的位置的数字并不随时间而改变,但是在下面的杆上的相应数字却是随时间而改变的。我们不说“对应于质点的位置的数字”,而常常简单地说成“质点的坐标”。虽则后面这句话听来似乎很深奥,但从图上看来却是正确的,而且所表示的意思是极简单的。质点在下面的坐标系中的坐标,等于它在上面的坐标系中的坐标加上上面的坐标系的起点在下面的坐标系中的坐标。重要的是,假如我们知道质点在一个坐标系中的位置,便能计算它在另一个坐标系中的位置。为了这个目的,我们必须知道在每个时刻这两个坐标系的相对位置。其实上面这些话,是很简单的,如果不是因为在后面要用它,还不值得作这样详细的讨论。
这里我们要注意一下决定一个质点的位置和决定一个事件的时间的差别。每一个观察者都有他自己的杆作为他的坐标系,但是他们却共用一只钟。时间有点像“绝对的”,它对于所有的坐标系中的所有观察者都是同样地流逝的。
现在再举一个例子。有一个人以3公里每小时的速度在一艘大船的甲板上散步。这是他相对于船的速度,或者换句话说,是他相对于严密地关联于船的坐标系的速度。假使船相对于岸的速度是30公里每小时,而人与船的匀速直线运动的方向又相同,则这个散步的人,相对于一个岸上的观察者的速度是33公里每小时,或者相对于船是3公里每小时。我们可以把这个情况说得更抽象一些:一个质点相对于下面的坐标系的速度,等于它相对于上面的坐标系的速度,加上或减去(究竟是加或减,得看速度的方向是相同还是相反)上面的坐标系相对于下面的坐标系的速度(图53)。因此假如我们知道两个坐标系的相对速度,我们不仅可以把一个坐标系的位置转换到另一个坐标系的位置,而且可以把一个坐标系的速度转换到另一个坐标系的速度。位置、坐标以及速度不同的坐标系中有不相同的几种量,然而都是以某种固定的关系相互联系着的,在这个例子中,所用的就是简单的转换定律。
可是有些量在两个坐标系中都是相同的,所以它们用不到转换定律。例如在上面的杆上不是取定一点而是取定两点,并考察它们之间的距离。这个距离便是两点的坐标之差。为了要找出这两点对于不同的坐标系的位置,我们必须应用转换定律。但是在构图的过程中,两个位置之间的坐标之差由于不同坐标系所产生的影响已相互抵消了,这在图54中可以很明显地看到。我们得先加上,然后减去两个坐标系的起点之间的距离。因此两点之间的距离是不变的,也就是说它与坐标的选择无关。
其次一个与坐标系无关的量的例子便是速度的改变,这是我们在力学中已很熟悉的一个概念。假如从两个坐标系去观察一个沿直线运动的质点。对每一个坐标系中的观察者来说它的速度的改变等于两个速度之差,而两个坐标之间的匀速相对运动所产生的影响在计算两者之差的过程中消去了,因此速度的改变是一个不变量。但是有一个条件,即两个坐标系的相对运动必须是匀速直线的。不然,在每个坐标系中速度的改变也会不同,这种差异是由于代表我们坐标系的两根杆的相对运动速度改变所致。
现在举最后一个例!设有两个质点,作用于其间的力只与距离有关。在匀速直线运动的情况下,距离是不变量,因而力也是不变量。因此把力和速度的改变联系起来的牛顿定律,在两个坐标系中都是有效的。我们又一次得到了一个为日常经验所确认的结论:假如力学定律在一个坐标系中是有效的,则它们在对应于这一个坐标系作匀速直线运动的一切坐标系中都是有效的。当然,我们的例子是很简单的,是一种直线运动的例子,其中的坐标系可以用一根坚硬的杆来代表。但是我们的结论是普遍地有效的,可以概括为下列几条:
1.我们不知道有什么法则可以找出一个惯性系。可是,如果假定出一个来,我们便可以找到无数个,因为所有互相作匀速直线运动的坐标系,只要其中有一个是惯性系,则它们全部是惯性系。
2.与一个事件相对应的时间,在一切坐标系中都相同。但坐标与速度却都不相同,它们依照转换定律而变化。
3.虽然坐标与速度由一个坐标系过渡到另一个坐标系时是改变的,但是,力与速度的改变对于转换定律都是不变的,因而所有的力学定律对转换定律也是不变的。
我们把上面所表述的坐标与速度的转换定律称为经典力学的转换定律,或简称为经典转换。
以太与运动
伽利略相对性原理用在力学现象中是有效的。在所有作相对运动的惯性系中都可以应用同样的力学定律。对于非力学的现象,尤其是对于场的概念居于重要地位的那些现象,也都能应用这个原理吗?与这个问题有关的一切问题,立刻把我们带到相对论的出发点。
我们记得在真空中,或者换句话说,在以太中光的速度是3.0×105公里每秒,而光就是在以太中传播的电磁波。电磁场储藏着能,这种能一旦从它的源辐射出去以后,便独立存在。虽然我们已充分感觉到以太在力学上的结构有许多困难,但目前我们还将继续承认以太是传播电磁波的介质,因而也同样承认以太是传播光波的介质。
设想我们坐在一个被封闭的房间里,这个房间与外界完全隔绝,空气既不能进去也不能出来。如果我们静坐着说起话来,从物理学的观点来说,我们在创造声波,这种波从静止的声源以空气中的声速传播。假如口与耳之间没有空气或旁的介质,我们便听不到声音。实验表明,如果没有风,并且对于我们所选择的坐标系来说空气是静止的,那么声音在空气中向各个方向的传播速度都是一样的。
现在我们想象房间穿过空中作匀速直线运动。一个在外面的人可以透过运动着的房间(假如你高兴,说成火车也可以)的玻璃墙看到里面所发生的一切。室外的人可以根据室内的观察者的测量结果,推算出声音对于与他的环境相联系的一个坐标系的速度,而房间就是相对于这一个坐标系作运动的。这里又是前面那个老的、讨论了很多次的问题,即假使知道了一样东西在一个坐标系中的速度,如何决定它在另一个坐标系中的速度。
房内的观察者宣称:在我看来,声音在各个方向的速度都是一样的。
外面的观察者宣称:在运动着的房间内传播的而用我的坐标系来确定的声音的速度,在各个方向并不相等。在房间运动的方向上的声速比标准声速要大些,在相反的方向上则比较小些。
这些结论都是从经典转换推出来的,而且可以用实验来确证。房间把它里面的物质介质,即声音赖以传播的空气带着运动,因此声速对于里面和外面的观察者是不同的。
我们还可以根据把声看作是在物质介质中传播的波的理论从而推出另外的结论来。如果我们想要听不到演说者的声音,我们可以这样做(虽然这不是一种最简单的方法):我们相对于演说者周围的空气以大于声速的速度向前奔跑,于是发出的声波永远也不会到达我们的耳鼓了。反之,假使我们忘掉了一句永远不再重复的重要的话,我们必须以大于声速的速度,赶上早已过去了的声波去听到那句话。这两个例子并没有什么不合理的地方,不过所难的是在这两种情况中我们都必须以约40O米每秒的速度奔跑,但是我们可以想象,将来技术的进一步发展,这样的速度是可能实现的。从大炮里发射出来的炮弹的速度实际上比声速大,因而骑在这样一个炮弹上的人便永远听不到发射炮弹的声音。
所有这些例子都纳粹是力学性质的,我们现在可以提出一个非常重要的问题了:关于我们刚才对声波所说的一切情况是否可以同样应用于光波的情况呢?伽利略相对性原理和经典转换是否在应用于力学现象的同时也可以用于光的现象和电的现象呢?假如对于这些问题简单地答复一个“是”或“否”,而不深究它们的意义,那是很危险的。
在相对于外面观察者作匀速直线运动的房间中的声波的例子中,插入下面两段话对于我们的结论是非常重要的:
运动着的房间带着传播声波的空气一起运动。
在相对作匀速直线运动的两个坐标系中所观察到的速度是用经典转换联系起来的。
光的相应问题必须提得稍微不同一点:室内的观察者不再是说话,而是向各个方向发出光信号或光波。我们进一步假定发出信号的光源是永远静止在房间里的。光波在以太中运动正如声波在空气中运动一样。
房间是否带着以太一起运动,像带着空气一起运动那样呢?因为我们没有以太的力学结构,所以很难答复这个问题。假如房间是封闭的,里面的空气便不得不随着它运动。假如想象以太也如此,很明显,这是毫无意义的,因为所有的物质都浸在它里面,而且它是穿透到任何地方去的。任何的门都关不住以太。所谓“运动着的房间”,现在的意思只是指光源跟它严密地相联系的运动着的一个坐标系而已。可是我们并非绝对不能想象房间的运动把光源和以太带着一起运动,正如关着的房间把声源和空气带着一起运动一样。但是我们也可以同样好地想象出一种相反的情况:房间在以太中通过,正如船在绝对平静的海中通过一样,不把介质的任何部分带走而只是通过它而已。在我们的第一种图景中,房间带着光源运动,也带着以太运动。在这种情况中,可以把光波比拟为声波,因而可以得出完全相似的结论来。在我们的第二种图景中,房间带着光源运动,但不带着以太运动。在这种情况中就不能和声波比拟了,因而在声波的例子中所得出的结论便不能应用于光波。这是两个极端的可能性。我们还可以想象更复杂的可能性,例如以太只是部分地被带有光源的房间的运动所带走。但是我们在对这两种比较简单的极端情况作出实验并指出哪一种比较有利以前,没有理由讨论更复杂的假定。
我们从第一种想象开始,并暂且假定严密地联结于光源的运动着的房子把以太一起带走。假如我们相信那简单的应用于声波速度的转换原理,现在我们也可以把前面的结论应用到光波里来。我们没有理由怀疑简单的力学的转换定律,这个定律不过是说在某种情况中速度必须相加,在别的情况中速度必须相减。因此我们暂时认定和光源一起运动的房子带着以太走,同时认定经典转换。
如果我们点起灯来,光源是严密地跟我们的房间相联系的,信号的速度为著名的实验值3.0×105公里每秒。外面的观察者会注意到房间的运动,因而也就注意到光源的运动,并且注意到以太是被带着走的,他必然会得出这样的结论:在我所处的外面的坐标系中,光在不同的方向上的速度是不同的。在房间运动的方向上比标准光速要大,在相反的方向则较小。我们的结论是,假如以太被带着光源而运动的房间所带走,而且假定力学定律是有效的,则光速必定与光源的速度有关。假如光源朝着我们运动,则光从运动的光源到达我们眼睛的速度就会较大,假如光源背离我们而运动,光速就会较小。
假如我们的速率能比光速更大,那么我们可以逃避开光的信号。我们可以赶上早先已经发送出去的光波,而看到过去所发生的事件。我们赶上它们的次序正和当初发送它们的次序相反,而我们在地球上所发生的一系列事件,看来就会像一个倒映的电影片一样从故事的结局开始。这些结论都是从“运动的坐标系把以太带走以及力学转换定律是有效的”这样一个假设中推导出来的。如果这些结论能成立,光和声之间的比拟就是完整的了。
但是没有任何形迹足以说明这些结论是真实的,恰恰相反,为了证明这些结论而作的所有观察反而否定了它们。因为光速的数值太大,要直接做一个实验有很多技术上的困难,所以这个判决是从颇为间接的实验中得来的,不过它是明确而完全无可怀疑的。不论发射的光源是不是在运动或它是怎样运动的,在所有的坐标系中光速都是相同的。
这个重要的结论可以从许多实验中得出来,我们不准备描述这些实验。但是我们可以作出一些非常简单的论证,虽然它不能证明光速与光源的运动无关,但它能使人觉得这种情况是可信而又可以理解的。
在我们的行星系中,地球与其他的行星都绕着太阳运动。我们不知道是否还存在着与太阳系相似的旁的行星系。不过还存在着许多所谓双星系,它们是由两个星球组成并围绕着同一个点转动,这个点称为双星的质心。对这种双星的观察表明,牛顿的引力定律是有效的。现在假定光的速率跟发射体的速度有关,那么从星球发出的光是快是慢,就要看星球在发光时的速度怎样。在这个情况中,整个运动就会非常混乱,而且在很远的双星的情况中,根本不可能确认那主宰我们整个行星系运动的同一个万有引力定律的有效性了。
我们再来考察另一个根据非常简单的观念来做的实验。设想有一个旋转得很快的轮子。根据我们的假定,以太被轮子的运动所带走,并且是参与运动的,通过轮子旁边的光波的速率会因轮子的静止或运动而有所不同。静止的以太中的光速和被轮子的运动所带动的以太中的光速有所不同,正如声波的速度在无风的和有风的日子有所不同。但是没有探测到这样的差异!不论我们从哪一个角度来探讨这个问题,不论我们设计出什么样的判决实验,结果总是跟以太被运动所带走的假定相矛盾。因此,我们借助于一些更详细的专门论证作出如下的考察结果:
“光的速度与光源的运动无关。
不能认定运动的物体带动周围的以太。”
因此我们必须放弃声波与光波的比拟并转而研究第二种可能性:所有的物质都是在以太中运动,而以太不参与任何运动。这就意味着我们要假定有一个以太海,所有的坐标系都静止在以太海中或相对于以太海运动。我们暂且丢开实验能否证明或驳斥这个理论的问题,最好先把这个新假设的意义以及能由它而推出来的结论更好地熟悉一下。
有那么一个坐标系,它对以太海是静止的。在力学中,许多相对作匀速直线运动的坐标系是没有一个可以将它区别开来的,所有这样的坐标系都同样地是“好的”或是“坏的”。假如有两个相对作匀速直线运动的坐标系,在力学中要问哪一个在运动,哪一个是静止,是毫无意义的,只能观察到相对的匀速直线运动。因为在伽利略相对性原理中,我们不能谈绝对的匀速直线运动。如果说,不仅存在相对的匀速直线运动而且存在着绝对的匀速直线运动,这句话的意义是怎样的呢?这不过是说,有一个坐标系,在它里面有些自然定律和所有别的坐标系中的不同。因而这意味着每一个观察者都可以用在他的坐标系中有效的定律,跟只在一个专作标准的坐标系中有效的定律加以比较,来判定他自己的坐标系究竟是在运动还是静止的。这里的情况跟经典力学不同,在经典力学中,由于伽利略惯性定理的关系,绝对的匀速直线运动是毫无意义的。
如果我们假定运动是通过以太的,那么在场的各种现象中可以得出什么结论呢?这意味着有这么一个跟所有别的坐标系都不同的坐标系,它对于以太海是静止的。很明显,在这个坐标系中有些自然定律一定是不同的,否则,“运动通过以太”便没有意义了。如果伽利略相对性原理是有效的,则运动通过以太决不会有任何意义。这两种观念是不可能协调的。可是,假如存在一个由以太所确定的特别坐标系,那么“绝对运动”或“绝对静止”的说法才有明确的意义。
我们实在选不中哪一个假设是完善的。我们曾经作过坐标系在其运动中把以太带走的假设,以为这样可以保全伽利略的相对性原理,但是结果发现它与实验不符。剩下的惟一的办法,就是放弃伽利略相对性原理,并试用一切物体都在平静的以太海中通过的假设。
下一步就是来考察与伽利略相对性原理相矛盾而支持运动通过以太的几种结论,然后用实验来检验它。这样的实验很容易想象,但是很难做。因为这里只考查观念,因而不必顾虑技术上的困难。
我们再回头研究运动的房间和两个观察者(一个在房内,一个在房外)。外面的观察者选定用以太海定名的标准坐标系,这是一个与众不同的坐标系,在这个坐标系中光速永远具有同样的标准数值。在以太海中所有的光源不管是静止的还是运动的,它传播出来的光的速度总是一样的。房间和房内的观察者都是穿过以太而运动。设想在房间中央突然发出光,随即熄灭,此外,设想房间的墙是透明的,因而内外两个观察者都能够测量光速。假如我们问这两个观察者,他们想到什么样的结果,他们的答复大概会是这样的:
外面的观察者:我的坐标系是以太海,在我的坐标系中光速总是一个标准值。我不必理会光源或其他物体是否在运动,因为它们决不会把以太海带走。我的坐标系跟其他所有的坐标系不同,在这个坐标系中不管光束或光源运动的方向如何,光速必须是一个标准值。
里面的观察者:我的房间是穿过以太海而运动的,房间的一扇墙在离开光,而另一扇墙在向光靠拢。假使房间相对于以太海按光速而运动,那么从房间中央辐射出去的光永远到达不了离开它运动的那扇墙。假如房间运动的速度较光速为小,那么从房间中央辐射出去的光波到达这一扇墙比到达另一扇墙会早些。它到达朝光波运动的墙,会在到达离开光波运动的墙之前。因此虽则光源是严密地关联于我的坐标系,但各个方向上的光速却不会一样。在相对于以太海运动的方向上,它比较小,因为墙在离开,在相反的方向上,它比较大,因为墙迎着光波运动,所以接触光波更早些。
因此,只有在以太海特定的一个坐标系中各个方向上的光速是相等的。在其他对以太海运动的坐标系中,光速则与我们进行测量的方向有关。
刚才所考察的判决实验使我们能够检验这个通过以太海的运动的理论。事实上,自然界向我们提供了一个运动速度相当高的一个系统——每年围绕太阳运转一次的地球。如果我们的假设是正确的,那么在地球运动方向上的光速跟相反方向上的光速将会不同。这种速度之差是可以计算的,并且可以设计出一个适当的实验加以验证。根据这个理论,这里所发生的将是一个很小的时间之差,因此必须设计出一个很巧妙的实验装置来。有名的迈克耳孙-莫雷实验就是为了这个目的而设计的。其结果是把那一切物质都在静止的以太海中通过的理论判决了死刑。它丝毫未能发现光速与方向有什么关系。如果认定了以太海的理论,那么不仅光速,而且其他的场的现象都会显示出它们与运动着的坐标系的方向有关。每个实验都和迈克耳孙-莫雷实验一样,得出了否定的结果,从来没有发现过与地球运动的方向有任何关系。
局势愈来愈严重了。两个假设都已经检验过了。第一个是说运动的物体把以太带走。光速与光源运动无关的事实把这个假设驳倒了。第二个是说,有一个特定的坐标系,运动的物体不把以太带走,而只在永远静止的以太海中通过。假使是这样,那么伽利略相对性原理便是无效的,而在每一个坐标系中的光速便不会相等。但我们用实验又把它驳倒了。
更为牵强的许多理论也都拿来试过了,例如我们假定真理是处在这两个极端情况之间,以太只是部分地被运动的物体所带走,但是它们都失败了。每一次企图用以太的运动、通过以太的运动、或同时用这两种运动来解释运动坐标系中的电磁现象,都没有得到成功。
于是出现了一次在科学史中最激动人心的局势:所有有关以太的假设都一无是处!实验的判决总是否定的。回顾一下物理学的发展,我们看到以太自出生以来便是具体物质这个家族中的一个顽童。第一、构成一个以太的简单的力学模型已被证明是不可能的,因此我们把这个工作放弃了,由于这个原因,在很大程度上引起了机械观的崩溃。第二、我们得放弃依靠以太海的存在从而可以特别定出一个坐标系,使我们承认不但有相对运动而且还有绝对运动的希望。因为除了以太能把波带走的能力以外,这就是显示和支持以太存在的惟一办法了。我们想使以太成为实在的东西的一切努力都失败了。它既不显示它的力学结构,又不显示绝对运动。除了发明以太时所赋予它的一种性质,即传播电磁波的能力以外,其他任何性质都没有了。我们力图发现以太的性质,但一切努力都引起了困难和矛盾。经过这么多的失败之后,现在应该是完全丢开以太的时候了,以后再也不要提起它的名字了。我们说空间有传播波的物理性质,这样便不必再用我们已决定避免的这个名字。
在我们的字典中勾销一个字自然是无补于事的,这方面我们要解决的困难实在太多了!
我们现在把已经被实验充分地确认了的论据写下来,而不再顾虑“以太”问题。
1.光在空中的速度永远为标准值,它与光源及光的接受者的运动无关。
2.在两个相对作匀速直线运动的坐标系中,所有的自然定律都是完全等同的,因而无法分辨出绝对的匀速直线运动。
有许多实验确认了这两点,没有一个实验跟其中一点相矛盾。第一点表示光速的不变性,第二点把应用于力学现象的伽利略相对性原理推广到一切自然现象中。
在力学中,我们已经知道,假如一个质点对于一个坐标系的速度是若干,那么它在另一个对第一个坐标系作匀速直线运动的坐标系中的速度就不相同。这是根据简单的力学转换原理推出来的,它们是直接从我们的直观(一个人相对于船和岸运动的例子)中得来的,因而显然不会有什么错误。但是这个转换定律跟光的不变性是矛盾的。换句话说,我们得添上第三个原理。
3.位置与速度是根据经典转换从一个惯性系转换到另一个惯性系的。
于是,矛盾就很明显了,我们不能把上述三点结合在一起。
任何对经典转换加以改变的企图看来是过于明显和简单了。我们已经设法改变过第一点和第二点,但与实验结果不一致。关于“以太”的所有运动理论都要求更改第一点和第二点,但这没有带来任何好处。我们再一次认识到我们的困难的严重性。必须有新的线索来谋求解决。这个线索是接受第一和第二点的基本假定,而看来奇怪得很,要放弃第三点。这个新线索是从分析最基本和最简单的概念开始的,我们将要表明这个分析如何迫使我们改变我们的旧观点从而消除了所有的困难。
时间、距离、相对论
我们的新假设是:
1.在所有的相互作匀速直线运动的坐标系中,光在真空中的速度都是相同的。
2.在所有的相巨作匀速直线运动的坐标系中,自然定律都是相同的。
相对论就是以这两个假设开端的。从现在开始我们不再运用经典转换了,因为我们知道它和这两个假设相矛盾。
在这里,跟科学工作中常常所做的一样,需要把自己根深蒂固的、常常未经评判便加以接受的偏见除掉。因为我们已经知道,如果把上节中的第一点和第二点加以改变,就会导致跟实验发生矛盾,所以我们必须有勇气坚定地承认它们是正确的,而攻击那可能攻得下的弱点,即位置与速度从一个坐标系转换到另一个坐标系中的方法。我们的意图是从第一点和第二点推出结论,研究一下这两个假设跟经典转换相矛盾的地方在哪里,是怎样矛盾的,并找出所得结果的物理意义来。
我们再来利用房内房外有两个观察者的运动着的房间的例子。假设一个光的信号由房间的中央发射出去,我们再问这两个人,他们想观察什么,这时候他们只承认上面的两个原理,完全丢掉以前说过的关于光穿过介质而传播的论据。我们把他们的答复引下来:
里面的观察者:从房间中央发出的光信号会同时到达房间的各面墙上,因为四面墙与光源的距离相等,而光在各方向上的速度又是相等的。
外面的观察者:在我的坐标系中,光的速度与随着房间运动的观察者的坐标系中所看到的完全一样。在我的坐标系中光源运动与否毫无关系,因为光源的运动并不影响光速。我所看到的只是光信号同样以标准速率向各个方向行进。一扇墙要奔离光信号,而另一扇墙要接近光信号。因此信号到达那奔离的墙,比较到达那接近的墙要稍微迟一些。假使房子的速度比起光速来是小得很的,那么,虽然信号到达两扇墙的时间之差也会小得很,但信号决不会完全同时到达与运动方向相垂直的两扇相对的墙。
把这两个观察者的预言加以比较之后,就会发现一种最可惊奇的结果,这种结果显然跟经典物理学上极有根据的概念相矛盾。现在发生了两个事件,两束光到达两扇墙,在房内的观察者看来,它们是同时到达的,而房外的观察者却认为它们不是同时到达的。在经典物理学中,对在任何坐标系中的观察者来说,都用的是同一个钟,时间的流逝是一样的。因此,时间同那些“同时”、“早些”、“迟些”等词一样,都有一种与任何坐标系无关的绝对意义。在一个坐标系中同时的(即时间过程相同的)两件事,在任何其他的坐标系中也必定是同时的。
上述两个假设,也就是相对论,使我们不能不放弃这种观点。我们已经描写过,在一个坐标系中同时的两个事件,在另一个坐标系中却不是同时的。我们的任务就是要了解这个结果,了解“在一个坐标系中同时的两个事件,在另一个坐标系中可能不是同时的”这句话的意义。
“在一个坐标系中两个同时的事件”表示什么意思呢?每个人在直觉上似乎都知道这句话的意思。但是我们的见解必须谨慎些,并力求作出严格的定义,因为我们知道太重视直觉实在太危险。我们首先来回答这个简单的问题。
一个钟究竟是什么呢?
时间流逝的原始的、主观的感觉使我们能够排列出印象的次序来断定这件事发生得早些,那件事发生得迟些。但是要表示两个事件之间的时间间隔为10秒钟,就需要一只钟。由于使用了一个钟,时间的概念就变成为客观的了。任何物理现象,只要它能够照原样重复任意次,都可以当作一个钟。如果我们取这现象的首尾之间的时间作为时间的单位,那么重复这个过程就可以测定任何时间间隔。所有的钟,从最简单的沙漏到最精密的仪器,都是以这个观念为基础的。例如使用沙漏的时间单位便是沙由上面的玻璃瓶流到下面的玻璃瓶的时间间隔,把玻璃瓶倒转过来就可以重复这个物理过程。
在两个离得很远的点上有两个完好无疵的钟,它们上面所指示的时刻完全一样。如果我们没有考虑到对这句话要作出实验验证,它总应该是正确的。但是它实在表示些什么意思呢?我们怎样才能确信两个距离很远的钟所指示的时刻是完全一样的呢?一个可能的办法就是使用电视。必须了解,电视只用来作为一个例子,它在我们的论证中并不重要。我们可以站在一个钟的旁边而看着另一个钟在电视屏上的像,于是我们可以判断它们是否显示着相同的时刻。但是这不会是一个好的证明。电视中的像是由电磁波传递的,因此是以光速传播的。在电视屏上我们所看到的像是在一个非常短的时间以前发出的,而我们在实在的钟上所见到的时刻却是现在发生的。这种困难很容易避免,我们必须在这两个钟的距离的中点处摄取这两个钟的电视图,在这个中点上观察它们。如果信号是同时发出的,它们也同时到达中点处。假使从中点上所观察到的两个好钟一直指示着相同的时间,那么它们便能很适宜于用来指示距离很远的两点上的时间。
在力学中我们只用了一个钟。但这是不很方便的,因为我们必须站在这个钟的附近进行所有的测量。假如从远处望钟,例如用电视的方法从远处望钟,我们必须时常记住:我们现在所看到的其实是过去发生的,正如在看日落时,我们是在日落发生的8分钟以后才看到的。我们读记下来的时刻都必须根据我们与钟的距离作相应的修正。
因此,只有一个钟是不方便的。但是现在我们既已知道了怎样判断两个或者更多个的钟是否同时指示一个时刻,是否走得一样,我们便很容易想象在给定的坐标系中可以随我们的意思设置多少个钟。其中每一个都可以帮助我们决定它的近旁所发生的事件的时间。所有这些钟相对于坐标系都是静止的,它们都是“好”钟,它们都是同步的,就是说在同一时候显示相同的时刻。
关于钟的这样布置并不是一件特别奇怪的事情。我们现在用很多个同步的钟来代替从前的只用一个钟,因此很容易判断在给定坐标系中,两个相距遥远的事件是否是同时发生的。假使两个事件发生时,它们附近的同步的钟都指示出同样的时刻,则它们便是同时的。两个相距很远的事件其中一个比另一个发生得早些的说法现在就有了确定的意义,这种情况都可以用静止在我们的坐标系中的同步钟来判断。
所有这些都是跟经典物理学一致的,也没有一点跟经典转换相矛盾的地方。
为了确定同时的事件,利用信号来使钟同步。在我们的布置中重要的一点是,信号是以光速传播的,光速在相对论中担负着极为重要的任务。
因为我们要讨论两个相对作匀速直线运动的坐标系之间的重要问题,我们必须考察两根杆,每根杆上装有一些钟。这两个坐标系相对作匀速直线运动,在每个坐标系上的观察者现在都有了他自己的标尺和固定在标尺上的一组钟。
在以前用经典力学讨论测量时,对所有的坐标系我们只用一个钟,现在我们在每一个坐标系中却用上了许多个钟。这个区别并没有什么重要意义。一个钟也就够了,但是只要它们确是很好的同步的钟,决没有人反对用很多个钟。
现在我们接近到指出经典转换跟相对论矛盾的主要观点上了。假如两组钟相对作匀速直线运动,结果会发生什么呢?持有经典观点的物理学家回答说:没有什么,它们还会走得一样快,因而我们既可以用运动的钟也可以用静止的钟来指示时间。按照经典物理学的观点,两个事件在一个坐标系中是同时的,在任何其他的坐标系中也是同时的。
但是这不是惟一可能的答案。我们同样可以想象一个在运动中的钟跟一个静止着的钟,其机械运转的步调(走的快慢)是不同的。我们现在来研究这种可能性,暂时不必确定钟在运动时是否真会改变其步调。说一个运动的钟会改变步调是什么意思呢?为简单起见,我们假定在上面的坐标系中只有一个钟,而在下面的坐标系中却有许多个钟。所有钟的机构都相同,下面的几个钟是同步的,就是说它们同时指示相同的时刻。我们把相对运动的两个坐标系的三个接连发生的位置表示在图55中,在第一图中,上面一个和下面三个钟的指针位置照例是一样的,因为我们原来是这样安排的。在第二图中,我们看到了两个坐标系在过了一段时间以后的相对位置。所有在下面的坐标系中的钟都指示着相同的时刻,但是上面的坐标系中钟的步调却变了。由于这个钟是相对于下面的坐标系在运动,所以它的步调变了,时间不同了。在第三图中,我们看到钟的指针位置的差异随时间而增大了。
一个静止在下面的坐标系中的观察者会发现一个运动的钟将变更它的步调。自然,如果钟相对于在上面坐标系中静止的观察者而运动,也会出现同样的结果,在这种情形中,上面的坐标系中要有许多个钟,而下面的坐标系中却只要一个钟。在两个相对运动的坐标系中的自然定律必定是相同的。
在经典力学中,我们默认了一个运动的钟不会改变步调。这似乎太明白了,简直不值得再提起它。但是没有一件事情应该认为是十分明白的,假如我们要做得认真、谨慎些,那么必须分析一直已经承认了的一切假设。
我们不能够认为一个假设只由于它跟经典物理学中的假设不同就是不合理的。我们可以很容易地想象一个运动的钟会改变它的步调,只要这种改变的规律对所有的惯性系都是相同的。
再举一个例。试取一根米尺,这意味着它静止在一个坐标系中时长为1米。现在让它作匀速直线运动,在代表坐标系的杆上滑过。它的长度还会是1米吗?我们必须预先知道怎样去决定它的长度。当杆是静止的时候,它的两端跟坐标系上相隔1米的两个刻度重合。由此我们断定:静止杆的长度等于1米。当尺在运动时,我们又怎样测量它的长度呢?这可以用下面的方法进行。在给定时刻,两个观察者同时拍快照,一个拍运动的尺的始端,一个拍末端。由于照片是同时摄取的,我们可以把尺的始端和末端跟坐标系重合的那个刻度比较。用这种办法我们就可以测量它的长度。两个观察者必须在给定坐标系的不同部位观察同时产生的现象,我们没有任何理由认为这样的测量结果会跟尺在静止时的结果相同。因为照片必须是同时摄取的,所谓同时,我们已经知道是与坐标系有关的一个相对的概念,因此在互作相对运动的不同坐标系中,这种测量似乎很可能得出不同的结果。
我们不难想象,如果改变的规律对所有的惯性坐标系都是相同的,那么不仅运动的钟会改变它的步调,一根运动的尺也会改变它的长度。
我们只讨论了几种新的可能性,但都没有作出认定这些可能性的任何证明。
我们记得在所有的惯性坐标系中,光速都是一样的。这一情况跟经典转换是不相符的。闷葫芦必须在某处打开,难道就在这里吗?我们难道不能假定运动钟的步调和运动杆的长度会改变,而由这些假定便直接推出光速的不变性吗?我们是能够的!这就是相对论和经典物理学根本不同的第一个例子。我们的论证可以倒过来说:假如光速在所有的坐标系中都是一样的,则运动的杆必须改变其长度,运动的钟必须改变其步调,那么掌握这些改变的定律就都严格地确定出来了。
这一切都没有什么神秘和不合理的地方。在经典物理学中总是假定运动的钟和静止的钟都有相同的步调,假定运动的杆和静止的杆都有相同的长度。假如在所有的坐标系中光速都是相等的,假如相对论是有效的,那么我们必须牺牲经典的这个假定。这些根深蒂固的偏见是很难除掉的,但是除此以外别无办法。从相对论的观点看来,旧概念似乎是很武断的。为什么要像前几页中所说的那样,相信绝对时间对于所有的坐标系中的一切观察者都是以同样的方式流逝的呢?为什么要相信距离是不可能变的呢?时间是由钟来决定的,空间坐标是由杆来决定的,而决定的结果很可能与钟及杆在运动时的行为有关。我们没有理由相信它们的行为会依照我们所希望的方式来做。通过电磁场现象的观察间接地指出,一个运动的钟会改变它的步调,一根运动的杆会改变它的长度,而在力学现象中我们不会想到有这种情况发生的。我们必须在每个坐标系中接受相对时间的概念,因为这是解决困难最好的出路。从相对论中发展出来的其他科学成就表明,不应当把这个新的概念看作是不得已才接受的东西,因为这个理论的功绩是非常显著的。
到目前为止,我们只是力求说明什么东西使我们作出相对论的基本假设,以及相对论如何迫使我们重新研究和修改经典转换,并用新的概念来对待时间和空间。我们的目的是要指出那作为新的物理学和哲学观点的基础观念。这些观念都是简单的,但是在这里已经提出的形式中,它们还不足以得出任何结论,不仅定量的结论得不到,便是定性的结论也得不到。我们必须再用那些只解释主要观念,而把其他的一些观念不加证明便提出来的老方法。
为了弄清楚相信经典转换的古代物理学家(下面称之为古)和相信相对论的现代物理学家(称之为今)在观点上的区别,我们设想他们作了下面的对话:
古:我相信力学中的伽利略相对性原理,因为我知道在两个相对作匀速直线运动的坐标系中,力学定律是相同的。或者换句话说,按照经典转换,这些定律是不变的。
今:但是相对性原理必须应用于我们外界的一切现象。在相对作匀速直线运动的坐标系中,不仅力学定律相同,所有的自然定律都必须是相同的。
古:但是在相对运动的坐标系中,所有的自然定律怎么能相同呢?场方程(即麦克斯韦方程)对于经典转换不是不变的。这是由光速的例子中可以明白看出来的。依照经典转换,这个速度在两个相对运动的坐标系中并不是一样的。
今:这只表明经典转换是不能应用的,表明这两个坐标系之间必须有一种与经典转换不同的关系,而我们不能像这个转换定律中所作的那样,把不同坐标系中的坐标和速度联系起来。我们必须代之以新的定律,并从相对论的基本假设中把它们推出来。我们暂且不管这个新转换定律的数学表述,只要知道它与经典转换不同就够了。我们把它称为洛伦兹转换。可以证明,麦克斯韦方程组(即场的定律)对于洛伦兹转换是不变的,正如力学定律对于经典转换是不变的。我们来回忆一下经典物理学中的情况,坐标有坐标的转换定律,速度也有速度的转换定律,但是两个相对作匀速直线运动的坐标系中的力学定律却是相同的。空间有空间的转换定律,但是时间却没有转换定律,因为时间在所有的坐标系中都是相同的。可是在相对论中却不同了,对于空间、时间和速度都有跟经典转换不同的转换定律。但是自然定律在所有相对作匀速直线运动的坐标系中又必须是相同的。自然定律必须是不变的,但不是像前面那样对于经典转换,而是对于新型的转换,即所谓洛伦兹转换是不变的。自然定律在所有的惯性坐标系中都是同样有效的,而且从一个坐标系转换到另一个坐标系是用洛伦兹转换来实现的。
古:我相信你的话,但我很想知道经典转换和洛伦兹转换的差别。
今:你的问题最好按照下面的方式来答复。你且说出一些经典转换的特色,然后让我来解释一下它们是否已保存在洛伦兹转换中,倘若没有,再来解释它们为什么被改变掉了。
古:假如在我的坐标系中有一个事件发生于某一地点、某一时刻,则在另一个相对于我的坐标系作匀速直线运动的坐标系中的观察者,对于这个事件发生的位置会选用不同的数,但是时间当然还是相同的。在所有的坐标系中我们只用同一个钟,因此与钟是否运动毫无关系。在你看来也是对的吗?
今:不,不对的。每个坐标系必须配备有专用的钟,这个钟必须是静止的,因为运动会改变钟的步调。在两个不同坐标系中的两个观察者,不仅会用不同的数来确定位置,而且也会用不同的数来确定这个事件所发生的时刻。
古:这表示时间不再是不变的。在经典转换中,所有坐标系中的时间总是相同的。在洛伦兹转换中,时间是变化的,并且变得和经典转换中的坐标有点相似。我奇怪,对于长度又能怎样呢?根据经典转换,一根坚硬的杆无论在静止中或运动中都保持它的长度不变。现在这还对吗?
今:不对了。根据洛伦兹转换,一根运动的杆在运动的方向上会收缩,而且假如速率增加,收缩也会增加。一根杆运动得愈快,便显得愈短。但是这种收缩只发生在运动的方向上。在图56上你可以看到一根杆当它运动的速度接近于光速的90%时,它的长度会缩到原来的50%。但在垂直于运动的方向上却没有收缩(图57)。
古:这表示一个运动钟的步调和一根运动杆的长度都与速度有关,但关系怎样呢?
今:速度愈增加,这种改变便愈明显。根据洛伦兹转换,假如一根杆的速度等于光速,则它的长度会整个缩完。同样,一个运动的钟的步调比它所沿着经过的杆上的钟的步调会逐渐慢下来,如果它以光速运动,那么它就会完全停止。
古:这似乎跟我们所有的经验都不相符。我们知道一辆汽车不会在运动的时候就短一些。我们也知道汽车司机常常可以拿他的“好”的钟和他所经过的路上的钟加以比较,而发现它们总是完全一致的。这就跟你的说法不同了。
今:这一点当然是对的,但是力学中所有这些速度比起光速来都小得很,因此把相对论应用到这些现象上去是荒谬的。每个司机即使把速率增加几十万倍,也还能泰然地应用经典物理学。只有当速度接近光速时,才能期望实验与经典转换之间有不相符的地方。只有在速度很大时才能检验洛伦兹转换的有效性。
古:但是还有另外一个困难问题。根据力学,我可以想象物体的速度甚至比光速更大。一个物体相对于流动的船以光速运动,则它相对于岸的速度应当比光速更大。一根杆当它的速度等于光速时,它的长度便整个缩完,这样,便会遇到什么情况呢?如果杆的速度大于光速,我们不能期望有一种负的长度。
今:你实在没有理由作这样的讽刺!根据相对论的观点,一个物体不可能有比光速更大的速度,光速是所有物体所能具有的速度的最大限度。如果一个物体相对于船的速率等于光的速率,那么它相对于岸的速率也等于光的速率。将速度加上或减去的简单的力学定律在这里不再适用了,或者更确切地说,它对小的速度若不求精确还是可用的,但是对于接近光速的速度就不能应用。表示光速的数明显地出现在洛伦兹转换中,并且如同经典力学中的无限大速度那样,光速将成为一个极限速度。这个更为普遍的理论与经典转换和经典力学并不矛盾。反过来说,当速度在非常小的极限情况下,我们又回到旧概念上来了。从新理论的观点上可以明白地看出,经典物理学在哪些情况中是有效的,在哪些地方是受到限制的。在汽车、轮船和火车一类的运动中应用相对论,正像只用乘法表便可以解决的问题却应用了计算机一样觉得可笑。
相对论与力学
相对论的兴起是由于实际需要,是由于旧理论中的矛盾非常严重和深刻,而看来旧理论对这些矛盾已经没法避免了。新理论的好处在于它解决这些困难时,很一致,很简单,只应用了很少几个令人信服的假定。
虽然这些理论是从场的问题上兴起的,但它已概括了所有的物理定律。这里似乎发生了一个困难。场的定律属于一方面,力学定律属于另一方面,这是两种完全不同的类型。电磁场方程对于洛伦兹转换是不变的,而力学方程对于经典转换是不变的。但是相对论要求所有的自然定律都必须对于洛伦兹转换不变,不是对于经典转换不变。后者只是两个坐标系的相对速度为很小时的特殊的极限情况。假使如此,经典力学必须加以改变,这样才能和对于洛伦兹转换的不变性的要求相一致。或者换句话说,经典力学在速度接近光速时就不再适用了。从一个坐标系转换到另一个坐标系,只存在一种转换,即洛伦兹转换。
把经典力学改造成既不与相对论相矛盾,又不与已经观察到的以及已经由经典力学解释出来的大量资料相矛盾,就便于应用了。旧力学将只适用于小的速度,而成为新力学中的特殊情况。
考察一下相对论引起经典力学中改变的一些例子是很重要的,这也许能使我们得到某些可用实验证明或推翻的结论。
假设一个具有一定质量的物体沿着直线在运动,并且沿运动方向受一外力作用。我们知道力是跟速度的改变成正比的,或者更具体些说,一个物体在1秒钟内无论速度从100米每秒增加到101米每秒,或从100公里每秒增加到(100+0.001)公里每秒,或者从2.9×105公里每秒增加到(2.9×105+0.001)公里每秒,都是无关紧要的。某一个物体在相同的时间内,获得相同的速度改变,则施于该物体上的力总是相同的。
这句话从相对论观点来看是对的吗?不!这一定律只对小的速度才有效。根据相对论,大到接近光速的速度定律是怎样的呢?如果速度大了,再要增加速度便需要极大的力。把100米每秒的速度增加1米每秒跟把近于光速的速度增加1米每秒,所需的力决不是一样的。速度愈接近光速,要增加它就愈难。当速度等于光速时,那么再要增加它已经是不可能的了。于是,由相对论引起的这种改变便不足为奇了。光速是所有速度的最高限度,一个有限的力,不管它多么大,总不能把速度增加到超过这个限度。一种更复杂的力学定律出现了,它代替了联结力和速度改变的旧的力学定律。从我们的新观点看来,经典力学是简单的,因为在差不多所有的观察中,我们所遇到的都是远较光速为小的速度。
静止的物体具有一定的质量,称为静止质量。我们在力学中知道,任何一个物体对于改变它运动的外力都要抵抗,质量愈大,抗力愈大,质量愈小,抗力也愈小。但是在相对论中却不仅如此。一个物体不仅由于静止质量较大而具有较大的阻止这种改变的抗力,而且如果速度愈大则抗力也愈大。在经典力学中,一个既定物体的抗力总是不变的,它仅由物体的质量来决定。在相对论中它不仅与静止质量有关并且与速度也有关,当速度接近光速时,抗力便成为无限大。
刚才所指出的结果使我们能够用实验来检验这个理论。接近光速的炮弹,它对外力的抵抗,是和理论所预料的一样吗?由于相对论在这一方面的叙述具有定量的性质,所以假如我们能实现速度接近光速的炮弹,我们就可以证实或推翻这个理论。
事实上,我们在自然界中确实可以找到具有这种速度的抛射体。放射性物质的原子,例如镭的原子,其作用等于大炮,能发射极大速度的射弹。我们不必详细叙述而只引用近代物理学和化学中的一个重要的观点。宇宙中所有的物质都是由为数不多的几种基本粒子组成的,犹如在一个城市中有大小不同、结构不同和建筑方法不同的建筑物,但是从小屋到摩天大楼都是用很少数的几类砖建成的。同样,我们的物质世界中所有的已知化学元素,从最轻的氢起到最重的钢止,都是由同样几种基本粒子构成的。最重的元素,或最复杂的建筑,是不巩固的,它们会分裂,或者按我们的说法,它们是具有放射性的。某些构成放射性物质的砖头,即基本粒子,有时会以接近光速的速度抛射出来。根据现在已被大量实验确认的见解,元素的原子,例如镭的原子,具有非常复杂的结构,而放射性蜕变只是证明原子是由比较简单的砖头,即基本粒子构成的现象中的一种。
利用巧妙而复杂的实验,我们可以发现这些粒子如何抵抗外力的作用。实验表明,这些粒子所产生的抗力与速度有关,恰如相对论所预见的一样。在许多其他的例子中,也可以发现抗力与速度有关,相对论与实验是完全相符的。这里我们又一次看到科学的创造性工作的重要特色,即先由理论预言某些论据,然后由实验来确认它。
这个结果暗示着一个更为重要的推广。一个静止的物体有质量,但没有动能(就是运动的能量)。一个运动的物体既有质量又有动能,它比静止的物体更强烈地抵抗速度的改变,运动物体的动能好像增加了它的抵抗作用。假如两个物体有同样的静止质量,则有较大动能的一个,对于外力作用的抗力也较强。
设想一个装着球的箱,箱与球在我们的坐标系中都是静止的。要使它运动,要增加它的速度,都需要力。假如球在箱中很快地、像气体的分子一样,以接近光速的平均速度朝各个方向运动,那么用相同的力在相同的时间间隔内是否能产生相同的速度的增加呢?现在必须用更大的力,因为球的动能的增加,加强了箱的抵抗力。能,至少是动能,它阻止运动的作用和有重力的质量所起的作用是一样的。这对于所有各种能来说也都是对的吗?
相对论从它的基本假设出发,对这个问题推论出一个明白而确切的答案,而且是一个定量性质的答案:所有的能都会抵抗运动的改变;所有的能的作用都和物质的一样;一块铁在炽热时称起来比冷却时要重一些;从太阳发射出来的通过空间的辐射含有能,因此也有质量;太阳与所有发出辐射的星体,都由于发出辐射而失去质量。这些具有普遍性的结论是相对论的一个重要的成就,而且与所有经过考验的论据都相符合。
经典物理学介绍了两种物质,即质与能。第一种有重力,而第二种是没有重力的。在经典物理学中我们有两个守恒定律,一个是对于质的,另一个是对于能的。我们已经问过,现代物理学是否还保持着两种物质和两个守恒定律的观点。答案是:否。根据相对论,在质量与能之间没有重要的区别。能具有质量而质量代表着能量。现在只用一个守恒定律,即质量-能量守恒定律,而不用两个守恒定律了。这种新的观点在物理学的进一步发展中已证明是很成功的。
能是具有质量而质量又代表能量的这一论据,在过去为什么一直没有被人注意到呢?一块热的铁称起来是不是会比一块冷铁重一些呢?现在对于这个问题的答案是“是的”,而过去(见“热是物质吗”一节)的答案是“不是的”。从那里开始到现在为止所讲的两个答案之间的一切内容,自然还不足以解决这个矛盾。
我们在这里所遇到的困难和前面所遇到的困难是属于同一种性质的。相对论所预言的质量的变化小到不能测量的程度,甚至最灵敏的天平也不能直接测量出来。要证明能不是没有重力,可以用许多可靠的,但是间接的方法来实现。
直接证据之所以缺乏,是因为物质与能之间的相互转换的兑换率太小了。能和质量的比较,犹如贬值的货币和高价值的货币相比较。举一个例子就可以把它弄清楚。能够把3万吨水变为蒸汽的热量称起来只有1克重。能之所以一直被认为是没有重力的,无非是因为它的质量太小了。
旧的能与物质之间的关系是相对论的第二个祭品,第一个祭品是传播光波的介质。
相对论的影响远远超过了由此而兴起相对论的那个问题的范围。它扫除了场论的许多困难和矛盾;它建立了更普遍的力学定律;它用一个守恒定律来代替两个守恒定律;它改变了我们旧的绝对时间的概念。它的有效性不止限于物理学的范围之内,它已成为适用于一切自然现象的普遍框架。
时-空连续区
“法国革命于1789年7月14日在巴黎起事”,这句话说出了一个事件的空间和时间。对于一个初次听到这句话并不懂“巴黎”是什么意思的人,你可以告诉他:这是位于我们地球上东经2度和北纬49度的一个城市。用这两个数就能够确定这个事件发生的地点,而“1789年7月14日”则是发生事件的时间。在物理学中准确地表征一个事件发生的地点与时间比历史更为重要,因为这些数据是定量描述的根本。
为简单起见,我们在前面只考察了直线运动,我们的坐标系是一根有起点而无终点的坚硬的杆,我们暂且保留这个限制。我们在杆上取不同的点,它们的位置都只能够用一个数来表征,即应用点的坐标。说一个点的坐标是7.586米,就是说,它与杆的起点的距离为7.586米。反过来说,假如有人给我一个任意的数和一个量度单位,我总能够在杆上找到和这个数相对应的一点。我们可以说,杆上一个确定的点与一个数对应,一个确定的数则与一个点相对应。数学家将此表述为杆上所有的点构成了一个一维连续区。在杆上每一给定点的无论怎样近的地方都有一个点,我们在杆上可以用许多任意小的距离来把两个相距遥远的点连接起来。连接相距遥远的两点的各个距离可以任意地小,这便是连续区的特征。
再举一个例。假设有一个平面,你若喜欢举一件具体的东西作例,可改设有一个长方形的桌面(图58)。桌面上一点的位置可以用两个数来表征,而不像前面那样只用一个数来表征。这两个数便是这个点与桌面两条相互垂直边的距离。和平面上每一点相对应的不是一个数而是一对数,一个确定的点都有一对数跟它相对应。换句话说,平面是一个二维连续区。在平面上每一给定点的无论怎样近的地方都有别的点。两个相距遥远的点可以用一根曲线分成的任意小的距离把它们连接起来。这样,用任意小的距离连接两个相距遥远的点,每一点都可以用两个数来代表,这就是二维连续区的特征。
再举一个例,设想你要把自己的房间看作是你的坐标系,也就是你想借助于房间的墙来描述所有的位置。如果一盏灯是静止不动的,这盏灯的位置可以用3个数来描写(图59),两个数决定它与两个相互垂直的墙的距离,第三个数决定它与天花板或地板的距离。3个确定的数与空间的每一点相对应,空间中一个确定的点与每三个数相对应。这可以用下面的一句话来表达,我们的空间是一个三维连续区。在空间每一给定点的非常近的地方还存在着许多点,连接相距遥远的点的距离可以任意地小,而每一个点都用3个数来代表,这就是三维连续区的特征。
但是上面所讲的简直都不是在谈物理学。现在再回到物理学上来,我们必须考察物质粒子的运动。要观察并预言自然界中的现象,我们不仅应考察物理现象发生的位置,还要考察它发生的时间。我们再来举一个很简单的实例。
一个小石子,现在把它看作是一个粒子,从塔上落下来,假设塔高80米。从伽利略时代起,我们就能预言石子开始落下以后在任何时刻的坐标,下面是说明石子在0、1、2、3、4秒时位置的“时间表”。
时间(秒) |
0 |
1 |
2 |
3 |
4 |
离地高度(米) |
80 |
75 |
60 |
35 |
0 |
在我们的“时间表”中记载着5个事件,每一个事件用2个数即每一个事件的时间和空间坐标来表示。第一个事件是石子在0秒时从离地80米处的下落。第二个事件是石子与我们坚硬的杆(塔)在离地75米处相重合,这发生在经过1秒之后。最后的事件是石子与地面相遇。
我们可以把这个“时间表”中所得到的知识用不同的方式来表示。比如把“时间表”中的5对数字用平面上的5个点来代表。首先确定一种比例尺,例如,像图60那样,一段线表示20米,而另一段线表示1秒。
然后画两根垂直的线,把水平线作为时间轴,竖直线作为空间轴。我们立刻就看到“时间表”可以用时-空平面中的5个点来表示(图61)。
离空间轴的距离代表“时间表”第一行中所指出的时间坐标,而离时间轴的距离则代表空间坐标。
用“时间表”来表示和用平面上的点来表示,方式虽然不同,但效果完全一样。每一种方式都可以根据另一种作出来。在这两种表示方式之中应选择哪一种,只不过是随人所好而已,因为实际上它们是等效的。
让我们再前进一步。设想有一个更好的“时间表”,它不是记出每1秒的位置,而是记出每1/100秒,或1/1000秒的位置。这样,在我们的时-空平面上便会有许多点。最后,如果对每一时刻记出位置,或者如数学家所说,把空间坐标表示为时间的函数,那么这些点的集合便成为一根连续的线。这样,像图62那样,这个图所代表的不是过去那种零碎的知识,而是石子运动的全部的知识。
沿着坚硬的杆(塔)的运动,也就是在一维空间中的运动,在这里是用二维时-空连续区中的一根曲线来代表的。这个时-空连续区中的每一点都有一对数字和它对应,一个数表示时间坐标,另一个数表示空间坐标。反过来说,在我们的时-空连续区中一个确定的点,与表征一个事件的某一对数字相对应。相邻的两个点代表在稍微不同的两个位置上以及在稍微不同的两个时刻分为两次发生的两个事件。
你或许会用下面的理由来反对我们的图示法:把一个时间单位用一段线来代表,把它机械地和由两个一维连续区构成的一个二维连续区的空间联系起来,是毫无意义的。但是假如你要反对这个办法,那么你便要同样有力地反对许多图示,例如表示去年夏季纽约城的温度变化的图,表示近几年来生活费用变化的图,因为这些例子中所用的都是同一种方法。在温度图中,一维的温度连续区与一维的时间连续区结合成一个二维的温度-时间连续区。
让我们再回到从80米高塔上落下来的粒子问题上。我们把运动画成图是一种很有用的办法,因为它表征着在任何时刻粒子的位置。知道了粒子是怎样运动的,我们就能再一次把它的运动画出图来。我们可以画成两种不同的方式。
我们记得一种是粒子在一维空间中随时间而变化的图,我们把运动画成在一维连续区中连续发生的一系列事件。我们不曾把时间和空间结合起来,我们所用的是动图,在这个图中位置随时间而变化。
但是我们可以把同样的运动用不同的方式加以描画,我们可以把运动考虑为二维时-空连续区中的曲线而构成一幅静图。现在运动已经看成由某种东西来代表,它是存在于二维时-空连续区中的某种东西,而不是在一维空间连续区中变化的某种东西了。
这两个图是完全等效的,爱用这一种或那一种只不过是随人们的习惯与兴趣而已。
以上关于运动的这两种图示法所说的一切都没有对相对论说明什么问题。两种图示法都可以随便使用,不过经典物理学比较喜欢用动图,因为动图把运动描写成为空间中所发生的事件,而不是作为存在于时-空中的某种东西。但是相对论改变了这个观点,它明确地赞成静图,它发现把运动表示为存在于时-空中的某种东西的这种图示法,是一幅描画实在的更方便、客观的图。我们还要解答一个问题:为什么这两个图从经典物理学的观点看来是等效的,而从相对论的观点看来,却不是等效的呢?
要明了这个问题的答案,必须再讨论相互作匀速直线运动的两个坐标系。
根据经典物理学,在两个相互作匀速直线运动的坐标系中的观察者对于同一个事件,将选用各自不同的空间坐标,但只用同一个时间坐标。所以在上述例子中,石子和地面接触是用我们所选定的坐标系中的时间坐标“4”和空间坐标“0”来表征的。根据经典力学,相对于我们选定的坐标系作匀速直线运动的一个观察者也会认为石子在4秒之后碰到地面。但是这个观察者却会把距离与他自己的坐标系相联系,而且一般说来,会把不同的空间坐标和石子碰地的事件连结起来,不过他所用的时间坐标跟所有相互作匀速直线运动的其他观察者所用的都是相同的。经典物理学只知道对所有的观察者都是同样流逝的“绝对的”时间。对于每一个坐标系,二维连续区都可以分解为两个一维连续区:时间与空间。由于时间的“绝对的”性质,在经典物理学中把运动的图从“静图”过渡到“动图”便具有一种客观的意义了。
但是我们已经确信经典转换不能普遍地应用于物理学中。从实用的观点看来,它还可以适用于小的速度,但是决不适用于解决根本的物理问题。
根据相对论,石子跟他面相碰的时间在所有的观察者看来不会是一样的。在两个不同的坐标系中,时间坐标和空间坐标都是不相同的,并且如果两个坐标系的相对速度接近光速,则时间坐标的变化将十分明显。二维连续区不能像在经典物理学中那样分解为两个一维连续区。在决定另一个坐标系中的时-空坐标时,我们不能把空间和时间分开来考察。从相对论的观点看来,把二维连续区分解为两个一维连续区,似乎是一种没有客观意义的武断的方法。
刚才我们所讲的一切都不难把它们推广到非直线运动的情况中。事实上,要描述自然界中的现象必须用4个数而不是用2个数。用物体及其运动来表述的我们的外在空间具有3个维度,物体的位置是由3个数来表征的。一个事件的时刻是第四个数。4个确定的数对应于每一个事件,每个确定的事件都有4个数跟它相对应。因此,大量的事件构成一个四维连续区。这一点也没有什么神秘之处,上面这句话无论对经典物理学或相对论来说都是同样正确的。但是当我们考察两个相互作匀速直线运动的坐标系时就又会发现差异。倘若一个房间在运动,房间内、外的观察者要测定同一个事件的时-空坐标。经典物理学家们又会把这个四维连续区分解为三维空间和一维时间连续区。老派物理学家只考虑空间的转换,因为对他们来说,时间是绝对的。他们觉得把四维世界连续区分解为空间和时间是自然而方便的。但是从相对论的观点看来,时间和空间从一个坐标系过渡到另一个坐标系时都是要改变的,而洛伦兹转换就是考察事件的四维世界的四维时-空连续区的转换性质的。
所有的事件都可以描画成随时间变化而且投射在三维空间背景上的动图,但是也可以直接描画成投射在四维时-空连续区背景上的静图。从经典物理学的观点看来,这两个图,一个动的,一个静的,都是等效的。但是从相对论的观点看来,静图比较方便,而且更符合客观实际。
如果我们喜爱,甚至在相对论中,我们还是可以用动图的。但是我们必须记住,这样把时间和空间分开来,是没有客观意义的,因为时间不再是“绝对”的了。我们以后还是要用“动”的语言而不用“静”的语言,不过我们得时常记住它的局限性。
广义相对论
现在还有一个论点等待我们去澄清。有一个最基本的问题尚未解决:是不是存在着一个惯性系呢?我们对于自然界的定律,对于它们对洛伦兹转换的不变性,以及对于它们在所有互作匀速直线运动的惯性系中的有效性都已略有所知。我们有了定律,但是我们还不知道它们所参照的是哪一个框架。
为了使我们更加明白这个问题的困难,我们且访问一位经典物理学家,与他讨论几个简单的问题:
“惯性系是什么?”
“它是力学定律在其中行之有效的一个坐标系。在这样的一个坐标系中,一个没有受外力作用的物体总是作匀速直线运动的。这种性质使我们能把惯性坐标系和其他任何坐标系区别开来。”
“但是所谓没有力作用于物体上,究竟是什么意思呢?”
“这只是说物体在惯性坐标系中作匀速直线运动。”
于是我们又可以再问一次:“惯性坐标系是什么?”但是由于很少有希望得到一个与上不同的答案,我们不如把问题改变一下,或许可以得到一些具体的知识。
“一个严密地与地球相结合的坐标系是一个惯性坐标系吗?”
“不是,因为由于地球的转动,力学定律在地球上不是严格地有效的。在许多问题上,我们可以把严密地结合于太阳的坐标系看作是一个惯性系,但是我们有时也说到太阳的转动,可见严密地结合于太阳的坐标系,严格地说也不是一个惯性坐标系。”
“那末,具体地说,什么才是你说的惯性坐标系呢?而且怎样选择它的运动状态呢?”
“这只是一个有用的虚构,我也想不到怎样去实现它。只要我能够远离一切物体,而且使我不受任何外力的影响,我的坐标系就会是惯性的。”
“但是你所谓免除所有的外界影响的坐标系又是什么意思呢?”
“我的意思是说那个坐标系是惯性的。”于是我们又回到原来的那个问题上来了。
我们的交谈显示出经典物理学中一个严重的困难。我们有定律,但是不知它们归属于哪一个框架,因此整个物理学都好像是筑在沙堆上一样。
我们可以从另一种不同的观点来研究这个困难。设想在全宇宙中只有一个物体,它构成了我们的坐标系。这个物体开始转动。根据经典力学,转动的物体的物理定律跟不转动的物体的物理定律是不同的。假使惯性原理在一种情况中是可用的,那么在另一种情况中便是不能用的了。但是这些话听起来很令人怀疑。假使整个宇宙中只有一个物体,我们难道能够考察它的运动吗?所谓一个物体在运动,总是说它相对于另一个物体的位置改变,因此,说成独一无二的物体的运动是与常识不符的。经典物理学在这一点上是和常识很矛盾的。牛顿的说法是:假使惯性定律是有效的,那末这个坐标系或者是静止,或者是作匀速直线运动。如果惯性定律无效,那末物体的运动是非匀速运动。这样一来,我们对运动或静止的判断,便要依靠所有的物理定律能否在既定的一个坐标系里面应用来决定了。
取定两个物体,例如太阳和地球。我们所观察到的运动也是相对的,既可以用关联于地球的坐标系也可以用关联于太阳的坐标系来描述它。根据这个观点看来,哥白尼的伟大成就在于把坐标系从地球转换到太阳上去。但是因为运动是相对的,任何参考系都可以用,似乎没有什么理由认为一个坐标系会比另外一个好些。
物理学再一次干涉和改变我们的常识。关联于太阳的坐标系比关联于地球的坐标系更像一个惯性系,物理定律在哥白尼的坐标系中用起来比在托勒密的坐标系中要好得多。只有在物理学的观点上才能对哥白尼发现的伟大意义有所体会,它说明了用严密地连结于太阳的坐标系来描写行星的运动有很大的好处。
在经典物理学中,不存在绝对的直线匀速运动。如果两个坐标系相互作匀速直线运动,那么说“这个坐标系是静止的,而另一个是运动的”是毫无意义的。但是如果两个坐标系相互作非匀速直线运动,那么完全有理由说:“这个物体在运动,而另一个是静止的(或者在匀速直线地运动)。”绝对的运动在这里有很确切的意义。在这一点上,常识和经典物理学之间隔着一条鸿沟。前面所说的惯性系的困难是和绝对运动的困难密切相关的。绝对运动之所以成为可能,只是由于自然定律能在其中有效的惯性系统的观念而产生的。
这些困难好像是无法避免的,正像任何物理学理论都无法避免它们一样。困难的根源在于自然定律只能应用在某一种特殊的坐标系即惯性系中。解决这个困难有无可能,全看对于下面的问题回答得怎样。我们是否能这样来表达物理学中的定律,使它们在所有的坐标系中,即不单是在相互作匀速直线运动的系统中,而且在相互作任何任意运动的坐标系中都是有效的呢?如果这是可以做到的,那么困难便会得到解决。那时我们便可以把自然定律应用到任何一个坐标系中去。于是,在科学早期的托勒密和哥白尼的观点之间的激烈斗争,也就会变成毫无意义了。我们应用任何一个坐标系都一样。“太阳静止,地球在运动”,或“太阳在运动,地球静止”,这两句话,便只是关于两个不同坐标系的两种不同惯语而已。
我们是否能够建立起一种在所有坐标系中都有效的名符其实的相对论物理学呢?或者说,能否建立只有相对运动而没有绝对运动的一种物理学呢?事实上,这是可能的!
关于怎样去建立这种新物理学,我们至少已经有了一个启发,尽管这个启发是那样软弱无力。真正的相对论物理学必须能应用于一切的坐标系中,因此也当然能应用于惯性坐标系这类特例中。我们早已知道能应用于惯性坐标系的许多定律。适用于一切坐标系的新的普遍定律,必须在惯性系的特例中还原为旧的已知定律。
建立能应用于一切坐标系的物理学定律的问题,已经被所谓的广义相对论解决了。先前所讲的相对论,只能应用于惯性系,被称为狭义相对论。这两种相对论自然不能相互矛盾,因为我们必须把狭义相对论中的旧定律包含在一种惯性系的普通定律中。但是正由于物理学定律以往只建立在惟一的惯性坐标系上,所以现在它将成为一种特殊的极限情况,因为在广义相对论中,一切相对作任意运动的坐标系都是许可的。
这就是广义相对论的预言。但是要描述这个预言是怎样作出来的,我们必须说得比以前更含糊些。科学发展中所产生的新困难迫使我们的理论愈来愈抽象。许多预料不到的事情仍然等待着我们去发现,而我们的最终目的总是要更好地了解实在。在结合理论和观察的逻辑锁链中又增加了新的环圈。要清除由理论通到实验的道路上一切不必要和牵强的假设,要使理论包括范围更加广阔的论据,我们必须使这个锁链愈来愈长。我们的假设变得愈简单、愈根本,则我们所用的数学推理工具便愈艰深,而由理论到观察的道路也愈长、愈艰难、愈复杂。虽然这些话听来好像不通,但我们一定可以说,新物理学比较旧物理学更简单,因而也似乎更困难而且更艰深。我们的外在世界的图景愈简单,那么它所包括的论据愈多,它愈能在我们的脑海中鲜明地反映出宇宙的融和与一致。
我们的新观念是很简单的:建立一种在所有坐标系中都有效的物理学。为了满足这个观念,我们不能不使物理学的形式更复杂,并且不能不使用一些我们以前在物理学中没有用过的数学工具。在这里我们只指出这个预言的应验和两个主要问题(引力及几何学)的关系。
在升降机外和升降机内
惯性定律标志着物理学上的第一个大进步,事实上是物理学的真正开端。它是由考虑一个既没有摩擦又没有任何外力作用而永远运动的物体的理想实验而得来的。从这个例子以及后来许多旁的例子中,我们认识到用思维来创造理想实验的重要性。现在我们又要讨论到另一些理想实验。虽然这些理想实验听来似乎很荒唐,可是却能帮助我们用简单的方法了解相对论。
前面讲过一个作匀速直线运动的房间的理想实验。这里我们要变换一下,讲一个下降的升降机的理想实验。
设想有一个大升降机在摩天楼的顶上,而这个理想的摩天楼比任何真实的摩天楼还要高得多。突然,升降机的钢缆断了,于是升降机就毫无拘束地向地面降落。在降落过程中,里面的观察者正在做实验。描写这些实验的时候,我们不必顾虑空气的阻力或摩擦力,因为在理想实验中,我们可以不考虑它的存在。一个观察者从袋里拿出一块手帕和一只表,然后让它们从手中掉下来。这两个物体会怎样呢?在升降机外面的观察者从升降机的窗子望进去,发现手帕和表以同样的加速度向地面落下。我们记得,一个落体的加速度与它的质量无关,而这个情况正揭示了引力质量和惯性质量的相等。我们还记得,从经典力学观点看来,这两种质量的相等完全是偶然的,它在经典力学中毫无作用。可是在这里,这两种质量的相等是很重要的,它反映了一切落体都有相同的加速度,并且构成了我们全部论证的基础。
我们返回来谈那下落的手帕和表。在升降机外面的观察者看来,这两个物体都是以同样的加速度降落,而升降机连同它的四壁、地板、天花板也都以同样的加速度降落,因此两个物体与地板之间的距离不会改变。对于升降机里面的观察者来说,这两个物体就停在他松手让它们掉下的那个地方。里面的观察者可以不管引力场,因为引力场的源在他的坐标系之外。他发现在升降机之内没有任何力作用于这两个物体,因此它们是静止的,正好像它们是在一个惯性坐标系中一样。奇怪的事情在升降机中发生了!假使这个观察者把一个物体朝任何方向(例如朝上或朝下)推动,在它没有碰到升降机的天花板或地板之前,它就会永远匀速直线地运动。简单说来,升降机里面的观察者认为经典力学的定律是有效的。所有物体的行为都被惯性定律预料到了。这个新的严密地连结于自由降落的升降机的坐标系跟惯性坐标系之间只有一个方面不同。在惯性坐标系中,一个没有受任何力作用的运动物体永远会匀速直线地运动。经典物理学表述惯性坐标系是无论在空间上与时间上都不加限制的。可是在这个升降机中的观察者的例子中就不同了。他的坐标系的惯性性质,却是限制在一定的空间与时间中的。迟早这个直线匀速地运动的物体要碰到升降机的壁,而直线匀速运动就受到破坏。而且迟早这整个升降机会碰到地面,而连里面的观察者和他的实验都要受到破坏。这个坐标系只是一个实在的惯性坐标系的“袖珍版”罢了。
这个坐标系的局部性是很重要的。如果这个想象中的升降机的一端在北极,一端在赤道,而手帕放在北极,表放在赤道,则在外面的观察者看来,这两个物体的加速度不会相等,它们不会是相对地静止的。我们的全部推论便都瓦解了!升降机的尺度必须有一定的限制,然后才能认为一切物体的加速度相对于升降机外面的观察者都相等。
虽然有了这种限制,里面的观察者还是认为这个坐标系具有惯性的性质。我们至少能同意一个所有的物理学定律在它里面都能应用的坐标系,不过在时间和空间上受限制而已。假如我们再想象另一个坐标系,即另一个对自由降落的升降机作直线匀速运动的升降机,那么这两个坐标系都会是局部惯性的。所有的定律在这两个坐标系中都完全一样。从一个坐标系过渡到另一个坐标系是用洛伦兹变换来表示的。
我们试看升降机里面和外面的这两个观察者用什么方法来描述升降机里面所发生的事情。
外面的观察者看到升降机的运动和机内一切物体的运动,发现它们与牛顿引力定律是一致的。在他看来,由于地球引力场的作用,运动不是直线匀速的,而是加速的。
可是在升降机内出生和成长起来的一代物理学家,却会产生完全不同的想法。他们确信自己保有一个惯性系统,而把所有的自然定律都关联到他们的升降机,而且很有信心地说,在他们的坐标系中,定律都有一种特别简单的形式。他们会很自然地认为他们的升降机是静止的,而他们的坐标系是惯性的。
要调解外面的观察者和里面的观察者的分歧意见是不可能的。他们每人都有权利把一切现象联系到自己的坐标系上去,两者都可以把各自看到的现象描述得完全一致。
从这个例子中,我们可以看到甚至在两个并非作直线匀速运动的坐标系中的物理现象要作出一致的描述也是可能的。但是要作这样的描写,我们必须把引力考虑在内,它构成从一个坐标系过渡到另一个坐标系的“桥梁”。外面的观察者认为存在引力场,里面的观察者却认为不存在。外面的观察者认为存在着升降机在引力场中的加速运动,里面的观察者却认为升降机是静止的,而且引力场也是不存在的。但是引力场这个“桥梁”,使两个坐标系中的描述成为可能,这个桥梁架设在一个很重要的礅柱之上:引力质量和惯性质量的相等。如果没有这个经典力学所未曾注意到的线索,我们目前的论证就会完全失败。
现在再来讲一个稍微不同的理想实验。假设有一个惯性坐标系,在它里面,惯性定律是有效的。我们已经描述过静止在这样的一个惯性坐标系中的一个升降机中所发生的事。现在我们把图改变一下,有人在外面把一根缆索缚在升降机上,再以一个不变的力照图上的方向拉(图63)。至于用什么方法拉是无关重要的。因为力学定律在这个坐标系中是有效的,这整个的升降机以不变的加速度朝着一个方向运动。我们再听一听升降机内外的观察者怎样解释在升降机里面所发生的现象。
外面的观察者:我的坐标系是一个惯性坐标系,升降机以不变的加速度运动是因为有一个不变的力在作用。里面的观察者是在作绝对运动,力学定律对于他是无效的。他看不出不受外力作用的物体是静止的。如果释放一个物体,那么它立刻会碰在升降机的地板上,因为地板是朝着物体向上运动的。表和手帕也完全一样。我觉得很奇怪,升降机内的观察者的脚必须永远贴在“地板”上,因为当他跳起来的时候,地板又立刻会重新碰到他。
里面的观察者:我不知道有什么理由可以相信我的升降机在作绝对运动。我同意,跟我的升降机紧密地联系着的坐标系实在不是惯性的,但是我不相信它与绝对运动有关。我的表、手帕以及一切物体的下降,是因为整个升降机都是在引力场中的缘故。我所观察到的运动和人们在地球上所看到的完全一样,人们很简单地用引力场的作用来解释地球上的物体下落的运动,我也是如此。
这两种描述(一种是由外面的观察者所作,另一种是由里面的观察者所作)都很能自圆其说,因而我们不可能决定哪一个是正确的。我们可以采用其中任何一种来描写升降机中的现象:或是依照外面的观察者所主张的,升降机作非匀速直线运动而没有引力场,或者依照里面的观察者所主张的,升降机静止,却有引力场。
外面的观察者可以认定升降机是在作“绝对的”非匀速直线运动,但是一个被作用有引力场的假定所驳倒的运动决不能看作是一个绝对运动。
也许我们能从这两种不同描述中的含糊之处找到一条出路以决定哪一种对,哪一种不对。设想有一束光穿过一个侧面窗口水平地射进升降机内,并且在极短时间之后射到对面的墙上。我们再看这两个观察者怎样预测光的路径。
外面的观察者由于相信升降机在作加速运动,他断定:光线射进窗内之后是水平地以不变的速度沿着直线向对面的墙上射的。但是升降机正在朝上运动,而在光朝墙而射的时间内,升降机已经改变了位置。因此光线所射到的点不会与入口的点恰恰相对,而会稍微低一点(图64)。这个差异是很小的,可总是有的,
于是相对升降机而言,光线不是沿着直线,而是沿着稍微弯曲的曲线行进的。
产生差异的原因是当光线经过升降机内部时,升降机本身已移动了一段距离。
里面的观察者由于相信升降机内的一切物体都受到引力场的作用,他说:升降机的加速运动是没有的,只有引力场的作用。光束是没有质量的,因此不会受到引力场的影响。假如它是朝着水平的方向射去,它就会射到与人口的点恰恰相对的一点上。
从这个讨论看起来,似乎有可能在这两种相互矛盾的观点中选择一种,因为这两个观察者对于同一个现象的解释是不同的。假使刚才所指出的两种解释都没有什么不合理的地方,那么我们前面的全部论证都会受到破坏,我们就不能用两个并立的方法,一种用引力场,另一种不用引力场,来描写一切现象。
但是幸而里面的观察者的推理中有一个严重的错误,才挽救了我们前面的结论。他说:“光束是没有质量的,因此不会受到引力场的影响。”这是不正确的!光束具有能,而能具有惯性质量,但是任何惯性质量都受引力场的吸引,因为惯性质量和重力质量是相等的。一束光在引力场中会弯曲,正如以等于光速的速度水平地抛出的物体的路线会弯曲一样。假如里面的观察者作出正确的推理,他把光线在引力场中受弯曲的事实考虑进去,那么他的结果会与外面的观察者的结果完全一致。
地球的引力场对于使光线弯曲的力自然是太弱了,不能用实验直接证明光线在地球引力场中的弯曲。但是在日蚀时所完成的著名实验,则间接而确实地证明了引力场对光线方向的影响。
从这些例子中可以看出,要建立一种相对论物理学是很有希望的。但是要这样做,我们必须首先对付引力问题。
在升降机的例子中我们已经看到两种描述的并立性。可以假定非匀速运动,也可以不假定。我们可以用引力场来从这些例子中排斥“绝对的”运动。但是那样一来,非匀速运动就一点也不绝对了。引力场是完全能够把它排除掉的。
我们可以把绝对运动和惯性坐标系的鬼魂从物理学中赶出去,从而建立一个新的相对论物理学。我们的理想实验指出了广义相对论的问题怎样和引力问题有密切的关系,并且指出了为什么引力质量和惯性质量的相等对这一关系会是这样重要。很明显,广义相对论中引力问题的解和牛顿的解一定是不同的。引力定律,正像所有的自然定律一样,必须对所有可能的坐标系都能成立,而牛顿提出的经典力学定律则只有在惯性坐标系中才是有效的。
几何学与实验
下面一个例子比下落的升降机例子还要奇特。我们必须接触到一个新的问题,即广义相对论与几何学之间的关系。我们先来描写一个另外的世界,在那里面生存着二维的生物,而不是像我们的世界里那样生存着三维的生物。电影已经使我们习惯于感受表演于二维银幕上的二维生物。我们现在设想银幕上的这些影子(出场人物)是实际存在的,他们有思维的能力,他们能创造他们自己的科学,二维的银幕就是他们的几何空间。这些生物不能具体地想象一个三维空间,正如我们不能想象一个四维世界一样。他们能够折转一根直线,知道圆是什么,但是不能做一个球,因为这就等于丢弃了他们的二维银幕。我们的处境也相类似,我们能够把线和面折转和弯曲过来,但是我们很难想象一个转折或弯曲的三维空间。
这些“影子”通过生活、思维和实验,最后可以精通二维欧几里得几何学的知识。于是他们能证明三角形的内角之和为180度。他们能够作出有公共圆心的一大一小的两个圆。他们会发现,两个这样的圆的圆周之比等于它们的半径之比,这种结果正是欧几里得几何学的特征。如果银幕无限大,这些“影子”会发现,若笔直往前旅行,他们永远也不会回到起点。
现在我们想象这些二维生物的环境改变了。我们再想象有人从外面,即从“第三维”,把他们从银幕上迁移到具有很大半径的圆球上。假如这些影子比起全部球面来是极小的,假如他们无法作遥远的通信,又不能走动得很远,则他们不会感觉到有什么变化。小三角形的内角之和仍是180度。具有共同圆心的两个小圆,其半径之比仍等于其周长之比。他们沿着直线旅行,还是不会回到他们的起点。
但是假设这些影子慢慢发展起他们的理论和技术知识。假使他们有了交通工具,能够很快地通过巨大的距离。他们便会发现,笔直往前旅行,最后还是会回到他们的起点。“笔直往前”就是沿着圆球的大圆走去。他们也会发现,具有公共中心的两个圆,假如一根半径很小,另一根很大,则其周长之比不等于其半径之比。
假如我们的二维生物是保守的,假如他们在过去几代所学的都是欧几里得几何学,那时候他们不能往远处旅行,那时候这种几何学跟观察到的情况是相符的,那么,尽管他们的测量有明显的误差,他们必然要尽可能去维护这种几何学。他们力求让物理学来挑起这些矛盾的重担。他们想寻找一些物理学上的理由,例如温度之差来解释线的变形,说这种变形使测量结果与欧几里得几何学不符了。但是他们迟早总会发现,有一种更合理、更确切的方法来描述这些现象。他们最后会懂得他们的世界是有限的,还有着与他们所学的有很大区别的几何学原理。他们即使没有能力把这些原理想象出来,但会知道,他们的世界是一个圆球上的二维表面。他们将很快地去学新的几何学原理,这些原理虽与欧几里得的不同,但是对他们的二维世界仍然是一致的,合乎逻辑的。下一代的二维生物便学到圆球的几何学知识,他们会觉得旧的欧几里得几何学似乎是更复杂和牵强,因为它与观察到的情况不符。
我们再回到我们的世界中的三维生物上来。
说我们的三维空间具有欧几里得性,这是什么意思呢?这句话的意思是说所有欧几里得几何学理论上证明了的命题,都能够用实际的实验加以验证。我们能够利用坚硬的物体或光线作出符合于欧几里得几何学中理想形体的实际形体来。一把尺的边缘或一束光都相当于一条线。用很细的坚硬的杆所构成的三角形的内角之和等于180度。用两根很细的弹性金属线所构成的同心圆的半径之比等于其周长之比。欧几里得几何学用这个方式来解释以后,便成了物理学的一章,不过这是很简单的一章。
但是我们可以认为矛盾已经找到了:例如由杆(有许多理由都认为它们是坚硬的)构成的大三角形内角之和不再等于180度了。因为我们已经习惯于用坚硬的物体来具体表示欧几里得几何学的观念,那么我们也许要寻找一些物理的力来解释我们的杆的这种意料不到的变形。我们力求发现这种力的物理性质,以及它对其他现象的影响。要挽救欧几里得几何学,我们会归罪于实际形体的不坚硬,会归罪于实际形体与欧几里得几何学中的形体不完全相符。我们要设法寻找一种更好的物体,它表现得和欧几里得几何学所期望的完全一致。可是,假如我们不能把欧几里得几何学和物理学结合成一个简单一致的图景,那么我们必须放弃关于我们的空间是欧几里得性的观念,并且要将我们空间的几何性质作更普遍的假设以便寻求更确切的“实在”的图景。
这个必要性可以用一个理想实验加以说明,这个实验告诉我们,一个真正的相对论物理学不能建筑在欧几里得几何学的基础上。我们的论证要引用已经知道的惯性坐标系和狭义相对论的结果。
设想一个大圆盘,上面画着两个同心圆,一个很小,另一个非常大。圆盘很快地旋转。圆盘是相对于外面的观察者转动的,假设圆盘里面还有一个观察者。我们再假定外面的观察者的坐标系是惯性的。外面的观察者也可以在他的惯性坐标系中画出同样一大一小的两个圆,这两个圆在他的坐标系中是静止的,但与圆盘上的圆相重合。他的坐标系是惯性的,因此欧几里得几何学在他的坐标系中是有效的,他会发现两圆周之比等于其半径之比。但是在圆盘上的观察者又发现了什么呢?从经典物理学和狭义相对论的观点看来,他的坐标系是禁用的。但是假如我们想为物理学定律找出能适用于任何坐标系的新形式,那么我们必须以同样严肃的态度来对待圆盘上和圆盘外的观察者。现在我们是从外面来注视圆盘里面的观察者,看他如何靠测量去寻找旋转的盘上的周长与半径。他所用的小尺,与外面的观察者所用的是一样的。所谓“一样的”,是指实实在在一样的,就是说它是由外面的观察者交给里面的观察者的,或者说,它是在一个静止的坐标系中长度相同的两把尺中的一把。
里面的观察者在盘上开始测量小圆的半径与周长,他的结果一定会与外面的观察者的完全一样。圆盘围绕着它旋转的轴通过圆盘的中心,圆盘上接近于中心的那些部分的速度非常小。如果圆是足够小,那么我们完全可以放心地使用经典物理学而不必顾及狭义相对论。这就是说,对于里面的和外面的观察者来说尺的长度是一样的,因而对这两个观察者来说,两种测量的结果将是一样。现在盘上的观察者又来测量大圆的半径。放在半径上的尺相对于外面的观察者是在运动的。但是因为运动的方向跟尺垂直,这样尺不收缩,因而对两个观察者来说,它的长度是一样的。这样,对这两个观察者来说,三种测量结果都相同:两个半径和一个小圆的圆周。但是第四种测量则不然,两个观察者所测的大圆的周长是不相同的。放在圆周上的尺,朝着运动的方向,因此依照外面的观察者的观测,比起他的静止的尺来,现在它显得收缩了。外圆的速度较内圆的大得多,因而必须计及这种收缩。因此如果应用狭义相对论的结果,我们的结论应该是这样:两个测量者所测量的大圆的周长一定是不同的。由于两个观察者所测量的四种长度中只有一种是互不相同,因此里面的观察者不能和外面的观察者一样认为两半径之比等于两圆周之比。这就是说,在盘上的观察者不可能在他的坐标系中确认欧几里得几何学的有效性。
圆盘上的观察者得到这种结果以后,还可以说他不想去考察不能应用欧几里得几何学的坐标系。欧几里得几何学之所以崩溃,是由于绝对转动,是由于他的坐标系是坏的和被禁止的。但是在这个论证中,他已经拒绝了广义相对论中的主要观念。另一方面,如果我们拒绝绝对运动的观念而保持广义相对论的观念,那么物理学就必须建立在比欧几里得几何学更普遍的一种几何学的基础上。假如所有的坐标系都是可以允许的,便无法逃避这个结局。
广义相对论所引起的变化,不能只局限于空间一方面。在狭义相对论中静止在一个坐标系中的许多钟,步调相同而且是同步的,就是说同时指示相同的时刻。在一个非惯性坐标系中的钟会怎样呢?前面的圆盘的理想实验又用得着了。外面的观察者在他的惯性坐标系中有步调完全相同、并且是同步的许多完好的钟。里面的观察者从这同类的钟里拿出两只,一只放在小的内圆上,另一只放在大的外圆上。内圆上的钟,相对于外面的观察者以很小的速度在运动。因此我们可以放心地断定,它的步调和圆盘以外的钟相同。但是大圆上的钟有很大的速度,和外面观察者的钟比较起来,步调变了,因此它和放在小圆上的钟比较起来,步调也变了。这样,两个旋转的钟就有了不同的步调,而且,应用狭义相对论的结果,我们又发现在旋转的坐标系中不能把钟安置得和惯性坐标系中所安置的那样。
为了使我们可以明白从这个理想实验中和前面所描述的理想实验中究竟能够得出怎样的结论来,我们不妨再引用信奉经典物理学的老派物理学家(古)和懂得广义相对论的现代物理学家(今)之间的一次对话。老派物理学家是站在惯性坐标系中的外面的观察者,而现代物理学家是站在旋转的圆盘上的观察者。
古:在您的坐标系中欧几里得几何学是无效的。我观察了您的测量,我承认在您的坐标系中两个圆周之比不等于两个半径之比。这正表示您的坐标系是被禁用的。可是我的坐标系是惯性的,我能够放心地应用欧几里得几何学。您的圆盘在作绝对运动,而根据经典物理学的观点看来,它是一个被禁用的坐标系,在它里面力学定律是无效的。
今:我不愿意听取任何关于绝对运动的说法。我的坐标系和您的一样好。我看见您相对我的圆盘在旋转。没有人能够禁止我把一切运动都关联于我的圆盘。
古:但是您不觉得有一种奇怪的力使您离开圆盘的中央吗?假如您的圆盘不是一个很快地旋转着的回转木马,那么您所观察到的两种情况一定不会发生。您不会感觉到有一种力把您推向盘的边缘,也不会感觉到欧几里得几何学在您的坐标系中是不能应用的。难道这些论据都不足以使您相信您的坐标系是在作绝对运动吗?
今:一点也不!我自然注意到您所说的两种情况,但是我认定它们都是由于作用在我的圆盘上的引力场所引起的。从圆心指向圆盘外面的引力场,使我的坚硬的杆变形,使我的钟改变步调。引力场、非欧几何、步调不同的钟,在我看来都是密切相关的。不管采用哪一种坐标系,我必须同时认定相应引力场的存在以及它对坚硬杆和钟的影响。
古:但是您知道您的广义相对论所引起的困难吗?我想用一个简单的不属于物理学范围的例子来说清楚我的观点。设想一个理想的美洲式城市,它是由一些平行的南北大街和平行的东西大道组成的。大街与大道相互垂直;大街与大街之间,大道与大道之间的距离是一样的。如果这一假定被满足,则由街道围成的每一个区域的大小都是一样的。用这种方法我可以很容易地表示出任何一区的位置。但是如果没有欧几里得几何学,这样的一种构图法是不可能的。然而我们不可能把我们的整个地球用一个很大的理想的美洲式城市包盖起来。把地球看一眼,您就会相信这一句话了。但是我们也不能把您的圆盘用这样一种“美洲式城市图”包盖起来,您说过您的杆已经由于引力场的作用而变形了。您既然不能证明关于半径和圆周之比相等的欧几里得定理,这就明白地表明了如果您把这样的街道图放到很远的地方去,便迟早会发生困难,而发现在您的圆盘上这样构图是不可能的。您的圆盘上的几何图形很像曲面上的几何图形,而在很大面积的一块曲面上,这样的街道图,自然是不可能的。再举一个更带物理性质的例子。取一个平面,把这个平面的各个不同部分不规则地加热到不同的温度。您能够用受热便会在长度上膨胀的小铁条,作出图66所画的这种“平行-垂直”图吗?自然不能!您的引力场对您的杆所起的作用,正和温度的改变对小铁条所起的作用是一样的。
今:所有这些都不能把我难倒。街道图是用来决定一个点的位置的,钟是用来决定事件的次序的。但城市不一定必须是美洲式的,它完全可以是古欧洲式的。设想您的理想城市是由塑性材料造成的,造成后使它变形。虽然街道已经不是笔直和等距的了,但是我还可以数出街区并认清街道。同样,在地球上虽不是“美洲式城市”的街道图形,但我们也能用经纬度来指示点的位置。
古:但我还是看到一个困难。您被迫使用您的“欧洲式城市图”。我承认您能建立起事件或点的次序,但是这种作图法会使一切关于距离的测量混乱不清了。它不能像我的作图法那样给您空间的度量性质。举例来说,我知道在我的美洲式城市中,走过10个街区所经过的距离是走过5个街区的2倍。因为我知道所有的街区是相等的,所以我能够立刻决定距离。
今:这些话都对。在我的“欧洲式城市图”中,我不能够立刻用变了形的街区的数目来决定距离。我必须知道更多的知识,我必须知道我的城市图的表面几何性质。正如每个人都知道的,赤道上自经度0度至10度的距离,与北极附近同样自经度0度至10度的距离是不相等的。但是每个领航员都知道如何决定地球上这样两点之间的距离,因为他知道地球的几何性质。他或者根据球面三角学的知识来计算,或者用实验方法把船以同样的速度驶过这两段距离来计算。在您的情况中,整个问题是无关重要的,因为所有的大街与大道之间的距离都是相等的。在地球的情况中便要复杂得多,0度与10度的两根经线在地球的两极处相遇,而在赤道上则相距最远。在我的“欧洲式城市图”中也是一样,我必须比您在您的“美洲式城市图”中多知道一些知识,然后才能决定距离。我可以在每种特殊情况中研究我的连续区的几何性质,以得到这种知识。
古:但是这一切都不过表示放弃欧几里得几何学的简单结构而换上您那下定决心去使用的复杂框架是如何的不方便罢了。难道这是必须的吗?
今:我想是的,假如我们想把我们的物理学应用到任何坐标系中去而不再有神秘的惯性坐标系,我承认我的数学工具比您的更复杂,但是我的物理学上的假设却简单得多,真实得多。
这个讨论只限于二维连续区。在广义相对论中争论的问题更为复杂,因为那里不是二维连续区而是四维时-空连续区,但是观念还是和描写二维空间的一样。在广义相对论中我们不能像在狭义相对论中那样来应用平行与垂直杆的力学框架和同步的钟。在任意的一个坐标系中,我们不能像在狭义相对论的惯性坐标系中那样,用坚硬的杆和同快慢及同步的钟决定一个事件所发生的地点与时刻。我们仍然能够用非欧几里得的杆和快慢不齐的钟来确定事件。但是要用坚硬的杆和绝对同快慢与同步的钟来做的实际实验,只能在局部性的惯性坐标系中进行。在这种坐标系中,整个狭义相对论都是有效的。但是我们的“好的”坐标系只是局部性的,它的惯性是受空间和时间的限制的。甚至在任意的坐标系中,我们也能预知在局部性的惯性坐标系中所作的测量的结果。但是要做到这一点,我们必须知道我们的时-空连续区的几何性质。
我们的理想实验只指出新的相对论物理学的一般性质。这些实验指示我们,基本的问题是引力问题。它们还指示我们,广义相对论把时间和空间的概念更加推广了。
广义相对论及其实验验证
广义相对论企图建立一种能适用于一切坐标系的物理学定律。相对论的基本问题是引力问题。相对论是自牛顿时代以来第一个修正引力定律的理论。这是真正必需的吗?我们早已经知道牛顿理论的伟大成就,以及建筑在他的引力定律基础上的天文学的巨大发展。牛顿定律直到现在还是一切天文计算的基础。但是我们也听到了对于这个旧理论的一些责难。牛顿定律只能在经典物理学的惯性坐标系中有效,而我们记得,能应用力学定律的坐标系才是惯性的坐标系。两个质量之间的力与两者之间的距离有关。我们知道,对于经典转换,力与距离的关系是不变的。但是这个定律与狭义相对论的框架不符。对于洛伦兹转换,距离不是不变的。我们已经很成功地把运动定律推广到狭义相对论上去了,我们也应该可以设法把引力定律加以推广,使它适合于狭义相对论,或者换句话说,建立一种定律,使它对于洛伦兹转换不变,而不是对于经典转换不变。但是我们无论如何费尽心计也无法简化牛顿的引力定律而用到狭义相对论的范畴中去。我们即使在这方面成功了,仍然需要作更进一步的努力,再能从狭义相对论的惯性坐标系进入到广义相对论的任意的坐标系。另一方面,下落的升降机理想实验明白地告诉我们,除非解决了引力问题,我们决不可能建立广义相对论。根据以上的论证,我们就可知道了引力问题的解在经典物理学中和在广义相对论中各不相同的原因。
我们曾试图说明过导出广义相对论的途径,以及我们不得不再一次改变我们旧观点的理由。我们不叙述这种理论的正规结构,而只表述新的引力理论与旧理论比较各有些什么特色。熟悉了上述的许多问题以后,要掌握这些差别的实质将不是十分困难的了。
1.广义相对论的引力方程可以应用于任何坐标系。在特殊情况下选择某一特定的坐标系只是为了方便而已。在理论上说,所有的坐标系都可以选择。如果不考虑引力,我们就会自动回到狭义相对论的惯性坐标系。
2.牛顿的引力定律把此时此地的一个物体的运动和同时在远处的一物体的作用连接在一起。这定律已成为全部机械观的一个典范,但是机械观崩溃了。在麦克斯韦方程中,我们看到了自然定律一个新的典范。麦克斯韦方程是结构定律,它们把此时此地所发生的事件与稍迟和邻近所发生的事件联系起来。它们是描述电磁场变化的定律。我们新的引力方程也是一种描述引力场变化的结构定律。粗略地来讲,我们可以说:从牛顿的引力定律过渡到广义相对论,很像从库仑定律的电流体理论过渡到麦克斯韦理论。
3.我们的世界不是欧几里得性的。我们的世界的几何性质是用质量及其速度来表达的。广义相对论的引力方程就是要揭露我们的世界的几何性质。
我们暂且假定广义相对论的预言已经实现了。但是我们的想象是否离开实在太远了呢?我们知道旧理论很好地解释了天文观察的结果。能否也在新理论与观察之间建立起一座桥梁呢?每一个想象都必须用实验来验证,而任何结果不论如何吸引人,假如与实际情况不符,便必须放弃。这个新的引力理论是怎样经受实验检验的呢?我们可以用一句话来答复:旧理论是新理论一种特殊的极限情况。假如引力比较弱,则旧的牛顿定律所得结果便会十分接近于新的引力定律的结果。因此所有支持旧理论的一切观察,也支持广义相对论。我们从新理论的更高水平上重新回到了旧理论。
即使我们不能提出另外的观察来支持新理论,即使它的解释和旧理论的解释其优越性不相上下,可以在两种理论之中随便选择一种,我们也应当选择新的。从形式上看来,新理论的方程是要复杂得多,可是从基本原理来看,它却简单得多。那两个可怕的鬼魂:绝对时间与惯性系已经不再出现了。引力质量与惯性质量相等的线索也没有被忽略掉。关于引力与距离的关系,不需要作任何的假定。引力方程具有结构定律的形式,这是从场论的伟大成就以来任何物理学定律所需要的形式。
从新的引力定律可以推出一些牛顿引力定律中所包括不了的新的推论。我们已经引出了一个推论,即引力场中光线的弯曲。
现在再介绍另外两个推论。
如果在引力比较弱时旧定律符合于新定律,那么只有在引力比较大的地方才能发现牛顿引力定律的偏差。就太阳系来说,所有的行星,连地球在内都是沿着椭圆的轨道绕太阳运动的。水星是离太阳最近的行星。太阳与水星之间的引力,比太阳与任何其他行星之间的引力要大些,因为它离太阳的距离较小。假如存在可以发现牛顿定律的偏差的一线希望,则最大的机会是在水星的运动中去发现。根据经典理论,水星的运动轨道和任何其他行星的相同,只不过它离太阳最近而已。根据广义相对论,它的运动应该稍有不同。不仅水星要围绕太阳转动,而且它的椭圆轨道也应该很慢地相对于跟太阳相联系的坐标系转动(图68)。这种椭圆轨道的转动体现了广义相对论的新效应。新理论还预测了这个效应的数值,水星的椭圆轨道在300万年之内才完成全转一次。由此可见,这种效应是极小的,因而要在其他与太阳相距较远的行星中去发现这个效应更是没有希望了。
在提出广义相对论以前,已经发现水星运动轨道不是完全椭圆形的,但是无法加以解释。另一方面,广义相对论也不是为了研究这个专门问题而展开的。只是在后来,才从新的引力方程中推出关于行星在围绕太阳运动时其椭圆轨道本身也在转动的结论。在水星的例子中,理论成功地解释了水星的运动跟牛顿定律所预言的运动发生偏差的原因。
但是还有一个从广义相对论推出来而又可以和实验相比较的结论。我们已经知道放在转动圆盘大圆上的一个钟和放在小圆上的钟快慢不同。同样,根据相对论可以推出,放在太阳上的钟跟放在地球上的钟快慢不同,因为引力场在太阳上比在地球上要强得多。
在72页上我们已经说过,炽热的钠会发射一定波长的单色黄光。在这种辐射中原子显示了它的一种韵律,原子比作一只钟,而发射的波长则代表“钟”的韵律(快慢)。根据广义相对论,由太阳上钠原子所发射光的波长应该比地球上钠原子所发射光的波长要稍稍长些。
用观察来检验广义相对论的推论是一个很复杂的问题,而且还没有得到确切的解决办法。因为我们只着重于主要的观念,所以不拟再从这方面作深入的讨论,但可以说,到目前为止,实验的判决似乎已确认广义相对论所推出的结论。
场与实物
我们已经知道了机械观崩溃的经过和原因。利用不能再变的粒子之间有简单的力在作用的假说来解释一切现象是不可能的。我们在电磁现象的范围内最先摆脱机械观和引入场的概念的企图,看来是十分成功的。电磁场的结构定律建立起来了,它是用空间和时间把毗邻的事件联系起来的定律。这些定律符合狭义相对论的框架,因为它们对于洛伦兹转换是不变的。后来广义相对论又建立了引力定律,它们又是一种描述物质粒子之间的引力场的结构定律。像广义相对论的引力定律一样,把麦克斯韦方程推广到能应用于任何坐标系中也是容易的。
我们有两种实在:实物和场。毫无疑问,我们现在不能像19世纪初期的物理学家那样,设想把整个物理学建筑在实物的概念之上。我们暂且把实物和场的两个概念都接受下来。我们能够把实物和场认为是两种不同的实在吗?试就一小粒实物来说,我们想象这个微粒有确定的表面,在表面处实物便不再存在,而它的引力场便出现了。在我们想象的图景中,可以想象场定律的区域和有实物存在的区域是突然分开的。但是区别实物与场的物理判据是什么呢?在我们熟悉相对论之前,我们可以这样回答这个问题:实物有质量而场却没有质量。场代表能,实物代表质量。但是我们在熟悉了更多的知识以后,已经知道这样的答案是不充分的。根据相对论,我们知道物质蕴藏着大量的能,而能又代表物质。我们不能用这个方式定性地来区别实物与场,因为实物与场之间的区别不是定性上的区别。最大部分的能集中在实物之中,但是围绕微粒的场也代表能,不过数量特别微小而已。因此我们可以说:实物便是能量密度特别大的地方,场便是能量密度小的地方。但如果是这样的话,那么实物和场之间的区别,与其说是定性的问题,倒不如说是定量的问题。把实物和场看作是彼此完全不同性质的两种东西是毫无意义的,我们不能想象有一个明确的界面把场和实物截然分开。
带电体与它的场之间也发生同样的困难,似乎不能有一个明显的定性的判据来分别实物和场或带电体和场。
我们的结构定律,即麦克斯韦定律和引力定律,在能量密度非常大的地方就失效了,或者说,在场源存在的地方,即带电体或实物存在的地方,便失效了。但是我们能否稍微改变我们的方程,使它能到处有效,甚至在能量密度极大的地方也有效呢?
我们不能把物理学只建立在纯粹是实物的概念基础上。但是在认识了质能相当性以后,实物和场的截然划分就有些牵强和不明确了。我们是否能够放弃纯实物的概念而建立起纯粹是场的物理学呢?实物作为被我们的感觉器官感受的对象,事实上只不过是大量的能集中在比较小的空间而已。我们可以把实物看作是空间中场特别强的一些区域,用这种方法就可以建立起一种新的哲学背景。它的最终目的就是要用随时随地都能有效的结构定律去解释自然界中的一切现象。按照这种观点,抛掷出的一个石子就是变化着的场,在变化着的场中强度最大的场的态以石子的速度穿过空间。在我们这种新的物理学中,不容许有场和实物两种实在,因而场是惟一的实在。这个新观点是由于场物理学的巨大成就,是由于以结构定律的形式来表示电的、磁的、引力的定律的成功,最后是由于质和能的相当而得到启发的。我们最后的问题便是改变场的定律,使它在能量密度极大的地方仍不致失效。
但是至今我们还未曾有效而可靠地实现这个预言。究竟能否实现,还有待于“未来”作出决定。目前我们在所有实际的理论解释中还得假定两种实在:场和实物。
根本性的问题仍然摆在我们眼前。我们知道所有的实物只是由少数几种粒子组成的。各式各样的实物是怎样由这些基本粒子组成的呢?这些基本粒子与场是怎样相互作用的呢?为了寻求这些问题的答案,又把新的量子论的观念引用到物理学里来了。
结语
在物理学中出现了一个新的概念,这是自牛顿时代以来最重要的发明:场。用来描写物理现象最重要的不是带电体,也不是粒子,而是带电体之间与粒子之间的空间中的场,这需要很大的科学想象力才能理解。场的概念已被证明是很成功的,由这个概念便产生了描写电磁场的结构和支配电和光现象的麦克斯韦方程。
相对论是从场的问题上兴起的。由于旧理论的矛盾与不一致,迫使我们把新的性质归之于自然界的一切现象的舞台——时-空连续区。
相对论的发展经过两个阶段。第一阶段产生了所谓狭义相对论,这种理论只能应用于惯性坐标系,就是只能应用于牛顿所建立的惯性定律在那里有效的系统里。狭义相对论建立在两个基本假设上:在所有的相互作匀速直线运动的坐标系中物理定律都是相同的;光速永远具有相同的值。从这两个被实验所充分确认的假设中推出了运动的杆与钟具有随速度而改变其长度和韵律的性质。相对论改变了力学定律。如果运动微粒的速度接近光速,旧的定律就失效了。相对论所重新提出的关于运动物体的新定律由实验完满地确认了。相对论(狭义)的另一个结论便是质量和能量之间的关系。质量是能,而能也具有质量。相对论把质量守恒和能量守恒两个定律结合成为一个质-能守恒定律。
广义相对论对时-空连续区作了更深入的分析。这个理论的有效性不再限于惯性坐标系。这个理论分析了引力问题,并且建立了引力场新的结构定律。它迫使我们去分析几何学对描写客观世界的作用。它把引力质量和惯性质量的相等看成是必不可少的,而不像在经典力学中那样把它看成是无关紧要的。广义相对论的实验结果只与经典力学的略有不同。凡是能够进行比较的地方,它都经得起实验的考验。而这个理论的好处在于它内在的一致性和基本假设的简单性。
相对论加强了场的概念在物理学中的重要性,但是我们还不能建立一种纯粹是场的物理学。直到目前为止,我们仍然需要认定场与实物两者并存。
|