王 青
(清华大学物理系,北京 100084)
经典电磁学理论的核心是麦克斯韦方程组和洛伦兹力公式。前者确定了电场强度和磁感应强度对给定的电荷电流源密度分布的依赖方程组(或者说已知电荷电流源的分布决定了电磁场),后者则对给定的电场强度和磁感应强度给出了电荷电流源所受的电磁力(已知电磁场的分布决定了源的受力),若再辅以牛顿第二定律并加上源所受的其他可能的非电磁力,则可以写出电荷电流源的运动方程(或者说已知电磁场决定了电荷电流源的运动),场方程和运动方程两者结合起来就确定了一个电磁系统的完整运动规律。本文只限于讨论真空中的电荷电流源及电磁场,如若考虑介质材料,须要在上面所讨论的电荷电流源中加入由于介质的极化和磁化导致的极化磁化电荷电流的贡献。
在学习、研究和应用电磁学理论时我们总希望能尽量深入地理解它,特别是能有直观图像的理解,麦克斯韦方程组和洛伦兹力公式为什么会是这个样子?一定是需要目前电磁学理论所给出的这种结构而不可能有所变化吗?这个问题在一般的教科书和研究论文中进行深入论述的比较少,本文就此作一讨论。
谈论理解一个事物总要依据一些出发点,理解麦克斯韦方程组和洛伦兹力公式同样需要有出发点,教科书里一般有两类理解方式:一是从实验定律出发,另一是从作用量出发。对这两种做法本文将分别在第1和第2节作一系统回顾和评述,在第3节给出一种自认为更优的新的理解方法,并进行讨论。著名物理学家费曼曾经说过“从一个新角度看待旧问题是很有意思的”。如果觉得本文前面的基本内容过于基本和简单,读者可以直接从2.3节的对作用量做法的评述开始阅读。
通常的静态和稳恒情形的麦克斯韦方程组和洛伦兹力公式可以从实验给出的电荷源之间相互作用力的库仑定律、电流源之间相互作用力的毕奥 萨伐尔定律出发,将电场强度和磁感应强度分别定义为单位电量的电荷电流源所受的电力和磁力得到。具体地,若一团由电荷密度ρ1(r)电流密度j1(r)描述的稳恒电荷电流源与另外一团由电荷密度ρ2(r)电流密度j2(r)描述的稳恒电荷电流源相互之间发生电磁相互作用,库仑定律和毕奥-萨伐尔定律及叠加原理告诉我们第二团电荷电流源对第一团电荷电流源的电磁作用力是
其中,ε0和μ0分别是真空的介电常数和磁导率;中括号里第一项是库仑定律给出的电作用力;第二项是毕奥-萨伐尔定律给出的磁作用力,注意在式(1)中叠加原理所起的作用是使各个点电荷电流源之间的电磁相互作用力可相互叠加,因而使得总的两团电荷电流源的总相互作用电磁力呈现为一个数学上的积分求和形式,如果是纯粹的点源只需将点电荷的电荷密度的δ函数表达式代入式(1)(注意电流密度也可以用电荷密度来表达)即可完成式中的体积积分,得到点源之间的电磁相互作用力。式(1)给出的是二对一的作用力,反过来一对二的作用力只要把式(1)中的1和2下标进行交换就可得到。如果考虑电场强度和磁感应强度是单位电量的电荷电流源所受电力和磁力,可以进一步把式(1)改写为
其中的电场强度E1(r1)和磁感应强度B1(r1)分别为
式(2)的第二个式子就给出了洛伦兹力公式,而式(3)和式(4)就分别给出了稳恒电荷电流源产生的静电场的电场强度和静磁场的磁感应强度。进一步从式(3)通过一些微积分运算,可以得到
其中去掉了脚标1。式(5)给出的是麦克斯韦方程组中的第一个方程,其积分形式为
通常称为高斯定理,它表示一个体积内部的总电荷由体积表面的总电场强度的通量决定。式(6)只对静电场成立,在电磁场随时间变化时要扩展成实验上的法拉第电磁感应定律,它将式(6)扩展为
式(7)给出的是麦克斯韦方程组中的第三个方程。类似地从式(4)通过一些微积分运算,可以得到
式(8)给出的是麦克斯韦方程组中的第二个方程,式(9)积分表达式是
通常称为安培环路定理,它表示流过一个曲面的电流强度由曲面边界上的磁感应强度的环量决定。麦克斯韦人为补放进式(9)里一个位移电流项以保证如下电荷守恒定律成立,即
因此式(9)被替换为
式(11)给出的是麦克斯韦方程组中的第四个方程,相应地式(9′)也需要补充进位移电流的贡献。这样从实验定律出发,包括叠加原理、库仑定律、毕奥-萨伐尔定律、法拉第电磁感应定律、电荷守恒定律(它可看作麦克斯韦在安培环路定理中补充的位移电流的依据),就得到电磁学理论中的麦克斯韦方程组与洛伦兹力公式。
要想理解推导出的电磁学理论结果只需理解作为出发点的这些实验定律。可惜这些实验定律看起来似乎不那么好理解!为什么一定可以叠加?自然界存在的反例是除电磁力之外的另外两种基本作用力:强相互作用力和弱相互作用力都不满足叠加原理。电磁力为什么一定要平方反比?我们知道平方反比对应电磁力的量子-光子是无质量的,如果光子有质量,平方反比则会被改变。虽然人们到目前为止并未测量到自由空间中的光子具有非零质量,但实验只能给出光子非零质量的上限值,永远无法确认其精确为零。法拉第电磁感应定律就更令人费解了,为什么变化的磁场要产生电场?对动生电场,可以依据洛伦兹力推导出相应的法拉第电磁感应定律,但对感生电场似乎找不出为什么是法拉第电磁感应定律的理由。在后面的第3节将依据协变性给出一种理解和解释。
有人认为这些是实验定律,没必要去理解它们,直接承认就是。这就相当于直接承认麦克斯韦方程组和洛伦兹力公式而不去理解它们为什么是这样一样,是一种知其然但不求知其所以然的不求甚解态度。
有人借助麦克斯韦方程组中出现的各种量在不同惯性参考系之间的洛伦兹变换关系,要求方程的形式在不同惯性参考系中都必须一样,则可以从一组无源的麦克斯韦方程组(方程(7)和(8))和另一组有源的麦克斯韦方程组(方程(5)和(11))中各自任选一个方程推导出每组各自剩下的另外一个方程。这使我们可以把原本需要理解的4个麦克斯韦方程约化成两个,让问题得以简化。但遗憾的是这种处理只是简化了对麦克斯韦方程的理解,尚未根本解决问题。因为剩下的两个麦克斯韦方程的理解问题依然未被解决,且为了实现这个简化还额外施加了协变性(即洛伦兹变换及方程在所有惯性系都形式一样)的假设。
总的看来,虽然从实验定律出发导出麦克斯韦方程组和洛伦兹力公式是历史原本的发展路径,但从理解经典电磁学理论的角度,这不是一个有效的方式。
从本节开始将使用狭义相对论协变的电磁学理论描写方式,只在必须时才使用分量回到上节给出的麦克斯韦方程组和洛伦兹力公式的传统非协变的表达式。本节主要是介绍标准的理论物理是如何从作用量推导出麦克斯韦方程组和洛伦兹力公式的,并进行评述。
在理论物理学中是把作用量作为物理系统的研究出发点,从作用量求极值得到体系的运动方程。一个带电质点所对应质点运动轨迹的运动方程可以通过作用量对质点的运动轨迹求极值得到,它实际是牛顿第二定律,其中出现的力就是洛伦兹力,而从作用量对其中的电磁势求极值就给出有源的两个麦克斯韦方程,另外两个无源的麦克斯韦方程对下面就要引入的电磁势来说是恒等式,它们实际上是把电场强度和磁感应强度改用电磁势来表达时的场强定义公式。
在作用量对电磁体系的描写中,描述电磁场的基本物理量不再是电场强度和磁感应强度,而是最重要的基本量——四度电磁势Aμ。为此需要先介绍它是如何引进的。为了保证物理方程在所有惯性系都具有相同的形式(这是狭义相对论中的第一条基本假设:相对性原理),物理量必须是洛伦兹变换下的张量。电磁场在势的层级必须是一阶张量也就是四矢量,比它更低阶的标量无法描述电磁场(还有一个次低阶的1/2阶张量也叫旋量在经典场论中不会出现)。因此我们就引入一个四度矢量——电磁势Aμ来描述电磁场的行为(注意当指定其为四矢量时意味着已经确定了它在不同惯性系之间的洛伦兹变换关系)。在作用量体系中洛伦兹力公式和麦克斯韦方程组是分别从两个独立的系统进行推导的,一个系统负责导出洛伦兹力公式和两个无源的麦克斯韦方程,另一个系统负责导出另外两个有源的麦克斯韦方程,下面分别叙述。
先考虑洛伦兹力公式的推导。对一个电量为q质量为m的点电荷在已知的外电磁势Aμ中从固定的a点到固定的b点运动,需要确定它是从a走怎样的轨迹运动到b的。取它在t时刻位于空间r处,用闵氏时空的四度坐标矢量xμ=(r,i ct)来描写其轨迹,其中r是坐标四矢量xμ对应下脚标μ分别取1、2、3的3个空间坐标分量构成的普通矢量,i ct是坐标四矢量xμ对应下脚标μ取4的时间坐标分量,它是纯虚的(本文的协变表达采用了老式的标记法,不区分协变和逆变指标,代价是在时间分量中引入虚数i)。而对应地描写这个点电荷所产生电磁势四矢量也可以分出其空间分量和时间分量,A是矢量势;φ是标量势或电势。这个体系的作用量为
①要求S是标量;
②要求S用d xμ和Aμ以最为简单的形式来构造。其中第①条用来确保作用量一旦在某个惯性系取极值,则在所有惯性系都为极值;第②条找不出合适的理由只能理解为大自然喜欢简洁了。有了式(12)给出的对一个带电质点在外电磁势Aμ中的作用量,下面就证明通过把它相对带电质点的轨迹d xμ求极值(因为协变的计算过程并不经常在教科书中出现,以下就把详细的推导过程罗列出来),就可以得到含有洛伦兹力的轨迹运动方程。0=δS
其中我们引进了四度速度矢量uμ
对式(14)等号右边的第一项进行交换δ和d对xμ的作用,δd xμ=dδxμ,然后分部积分,把d改为作用在前面的muμ+q Aμ上,差别是全微商导致的边界项没有贡献,并把式(14)等号右边第二项的脚标交换名称,得到
由于上面公式里的δxμ是任意的,因此得到方程
是由电磁势构造的二阶反对称场强张量。式(16)即是描述此带电质点的相对论协变的牛顿第二定律运动方程,它给出四度力矢量Kμ为
F即是这个带电质点受到的洛伦兹力,从式(18)可以写出其第i个分量为
我们看到这个洛伦兹力对电磁势的依赖是通过由电磁势构造的二阶反对称场强张量Fμν(共有6个独立分量)来实现的,把其中的3个独立空间分量定义为磁感应强度,另3个独立的空间和时间的交叉分量定义为电场强度,即
则式(19)就恢复成通常所见的洛伦兹力公式
到此为止,我们在一个在外电磁势中运动的带电质点体系中通过对作用量求极值推导出了带电质点所受的洛伦兹力。注意这里的电场强度和磁感应强度是为了描述带电质点所受的外电磁力而通过式(17)和式(20)引入的有效导出量,它们不是体系的基本物理量,体系的基本物理量是四度电磁势Aμ。
当引进了场强以后,发现这样引入的场强张量自然满足下面的方程
它是无源的麦克斯韦方程组的协变表达形式,对定义式(17)来说它是恒等式。将式(22)改用式(20)中引入的电场强度和磁感应强度来表达,经过一些计算可以证明它的脚标全都是空间分量的非平庸部分时,即是式(8),而它的脚标两个是空间分量一个是时间分量的非平庸部分时,即是式(7)。由此在从作用量求极值推导出来的洛伦兹力中引入了电场强度和磁感应强度后,进一步推导出了4个麦克斯韦方程组中的两个无源方程式(7)和式(8)。尚未推导的就只剩下4个麦克斯韦方程组中的两个有源方程了。
在进入另外一个系统之前,先来讨论目前系统的一些性质。注意式(12)给出的作用量在电磁势的如下规范变换下是保持不变的,即
因为规范变换对式(12)等号右边的第二项只在a和b这两个带电质点运动轨迹的头和尾边界上造成影响,而不影响我们所关心的轨迹中间。我们的讨论固定了轨迹的两端a和b,只讨论两端点之间的中间可能的轨迹变化,因此可以认为式(12)第二项在规范变换式(23)下保持不变,简称规范不变,而式(12)第一项因为根本不依赖电磁势Aμ因而也是规范不变的,因此称这个在外电磁场中运动的带电质点体系具有规范不变性。而推导出的结果——运动方程(16)和引申导出的无源麦克斯韦方程(22)显然都是规范不变的,因为由式(17)定义的二阶场强张量Fμν本身在规范变换式(23)下就是不变的量。这里引进的规范不变性,在本文最后将升级成我们理解电磁作用最最重要的基本对称性。
现在考虑一团用四度电流密度矢量jμ=(j,i cρ)描写的已知的电荷电流源所产生的电磁场系统,其中,j是电流密度;ρ是电荷密度,这个体系的作用量是
式(24)等号右边的第一项只包含电磁势Aμ,是描述一个无源电磁场的作用量项,第二项是电磁势和电荷电流源的相互作用项,它实际就是式(12)中等号右边的最小耦合项,只不过现在把原来的单个点电荷推广到很多电荷分布的情形了。为了看到这一点首先注意到一般的四度电流密度回到针对电量为q的点电荷时可以写为
其中利用了在电磁学里对一团以相同速度v运动的密度为ρ的电荷,其电流密度可以写为j=ρv的结果。把式(24)中的四度电流密度项针对电量为q的点电荷特别地写出来,并利用式(25)及对电量为q位于r′处的点电荷的电荷密度为ρ(r)=qδ(r-r′),可以得到
其中空间体积积分由δ函数可以被积出来,结果约束到点电荷所在的空间位置,时间积分则直接通过被置换成对点电荷时空轨迹d xμ的积分。式(26)正是式(12)中的最小耦合项,也就是说虽然现在与上面2.1节中讨论的是不同的系统,但出现在作用量中的电荷电流源与电磁势Aμ的相互作用项是完全一样的。
现在讨论在2.1节中的最小耦合项导致的规范变换对称性对很多电荷分布的情形是什么要求?把式(26)右边满足的规范不变性施加到式(26)的左边,利用式(23)我们得到
其中进行了分部积分并略去了不起作用的边界项。由于α是任意的,因此式(27)成立要求
这是著名的电荷守恒的协变表达式,用分量写开就是
因此对一团电荷电流系统,要求其规范不变就导致电荷守恒,或者说电荷守恒背后的对称性原理就是规范对称性。
既然式(24)中的第二项满足规范不变或者电荷守恒,把这个性质外推到强行要求式(24)的第一项也必须是规范不变的,即
③要求S规范不变。
这个第一项同样满足2.1节对作用量提的两条要求①和②,而目前的规范不变(或电荷守恒)可以被看作是对那两条要求再进行补充的第③条要求,它对式(12)给出的作用量是恒满足的。注意要求③对第一项是很不平庸的,如果没有这个要求,则在第一项里可以出现更加简单的项:还可以在这项前乘个常数。这个项对应电磁场量子-光子的质量项,没有这项也就对应前面曾经提到的光子没有质量,或者说规范对称性禁戒光子具有质量。实际上即使满足上面①~③条要求,在式(24)中原本还可以允许存在一个和第一项类似的项的εμνσρ是四阶全反对称张量,ε1234=1,对脚标交换偶次数值不变,交换奇次多出一个负号,脚标中有两个或两个以上相同则为零),还可在这项前面乘以一个常数。只是这项是一个时空坐标的全微商项:
若把它加到作用量中,考虑到还有一个时空体积积分这个项就变成在时空边界(包括空间无穷远的边界和时间的起始时刻和终了时刻的边界)上场的贡献。而在我们的讨论中,时空边界上的场要么是趋于零的要么是固定的,式(30)提供的这项对实际关心的时空边界内部的场的变化是没有贡献的,因此这项可以在作用量式(24)中不予考虑。值得指出的是,如果是讨论有限大的介质中的电磁场,式(30)可能会贡献介质边界的一些效应因而不能被忽略,这些效应往往和拓扑有关,例如当今在凝聚态物理中热门的拓扑绝缘体就和这项有关。
下面将通过式(24)给出的作用量对电磁势Aμ求极值,得到两个有源的麦克斯韦方程:
由于δAν是任意的,因此上式为零意味着
这就是有源麦克斯韦方程的协变形式,具体计算时可以发现它的时间分量是式(5)给出的麦克斯韦方程,空间分量是式(11)给出的麦克斯韦方程。以上是对已知的电荷电流源从作用量式(24)出发对电磁势求极值推导出了两个有源的麦克斯韦方程(5)和(11)。
在引进了电磁势后,从作用量出发,可以严格推导出洛伦兹力公式和麦克斯韦方程组,在这个体系中对经典电磁学理论的理解就转变为对电磁势的引进,对式(12)和式(24)中的作用量为什么这样选取的理解和对为什么作用量要取极值的理解。本节开始已经讨论过电磁势的引进理由,下节还会对它进行更加深入的讨论,在这里不再赘述。由于作用量是由前面提出的3个基本要求①、②、③来确定的,因此问题进一步转化为对这3条基本要求和为什么作用量要取极值的理解。下文将逐条讨论。
对基本要求①,在经典理论中只要求作用量的极值,而把作用量取为标量似乎有些要求过高了,因为没有见到非标量的其他各种张量在洛伦兹变换下完全无法保持极值性质的讨论,①在经典理论中提供的应该是充分条件,而不是充分必要条件。如果进一步考虑量子物理,在量子理论中,从路径积分的角度可以看出,不只作用量取极值的轨迹对物理有贡献,所有可能的轨迹都会有贡献,且不同轨迹对物理的贡献是以其作用量相应取值作为权重的(权重因子正比于eiS/ħ),因此要保证物理不随惯性系选择而改变,所有作用量的可能取值都不能随惯性系的选择变化,这正是对作用量为标量的要求。
对基本要求②,初看起来挺自然的,但细究现实世界确存在不选最简单理论结构的例子。在量子场论中可以证明一个量子场论的体系可以用一个有效的经典场论体系来描写,并且量子场论提供了一套完整按照普朗克常数正幂次展开的计算这个有效经典场论体系的作用量的方法[1],结果这个有效作用量在最低阶(普朗克常数的零次幂)就是量子体系的作用量,后面再加上正比于普朗克常数各阶幂次的量子修正。如果原来量子体系的作用量满足了基本要求②,那么这个有效作用量就显然不再满足了,因为那些来自量子修正的项显然要比原来出现在量子体系里的作用量中的项要复杂得多,因而破坏了简单性原则。注意这里量子物理所起的效果是破坏确定作用量的基本要求,而在上面对①的讨论中确是反过来,量子物理是更加支持确定作用量的基本要求。
对基本要求③,由于规范不变性是一个很抽象的对称性,要求物理体系满足这个对称性在直观上并不好理解。在目前已知的除引力外的3种物质间的基本相互作用原始都具有某种规范对称性,或者说规范对称性加上基本要求①和②完全决定了这些基本相互作用,但实验证实了对弱作用的规范对称性发生了自发破缺。在下一节的新的理解方式中,我们将放弃①和②,将③最后上升为唯一用来决定和理解理论的基本要求。直观上从规范对称性导出的电荷守恒定律(如果是其他的规范对称性也就对应其他荷的守恒定律)相对规范对称性似乎更好理解一些,毕竟它只是说孤立的电荷不会产生或湮灭。
对作用量取极值这一经典力学体系最基本的最小作用量原理,看起来很自然和优美,但如在对①的讨论中提到的,当进入量子物理后,就不再只是作用量的极值对物理有贡献了,非极值也会有贡献,因此似乎极值原理在自然界也并不总普适,而只针对经典体系适用。实际上即使只对经典体系,笔者也在文献[2]中介绍和讨论过一些可能不存在作用量的电磁体系。
本节是把电荷电流源与场分开看成各自独立的系统进行讨论的,为使讨论完备,下面补充讨论把两者结合起来的自作用体系。有人说既然在2.2节引进了电磁场的作用量,也就是式(24)中的第一项,为什么在式(12)中不考虑这一项的贡献呢?我们可以辩解说式(12)描写的是在外电磁场情形下的体系,纯电磁场的项不应该参与对作用量求极值因而不产生贡献。但仔细检查求作用量极值的步骤式(14),其中确实含有对电磁势的变分δAμ,只是由于外电磁势是固定的不再是独立变分变量,这个变分进一步被约化成对其所依赖带电点电荷的时空坐标的变分:
它说明即使电磁势本身是固定的,由于带电质点在其中运动,含电磁势的项仍可能会对变分有贡献。由此确实应该把式(24)中的第一项加入式(12)。以下看看真把它加进去的效果。利用式(31)的推导过程,可以读出加进这项导致在式(14)中需要新补充一项:
其中的δxσ只在前面的场强和电磁势中所依赖的坐标位于粒子的轨迹上时才不为零,而带电质点的轨迹是在四维时空中的一条曲线,在这条曲线(无穷细)上式(34)前面的时空积分体积元d t d V→0,因而导致式(34)实际上为零。式(31)最后一个等式的右边第二项不像第一项(也就是式(34))在带电质点的轨迹曲线上为零,是因为其中的电流密度在轨迹上出现了δ函数的无穷大,它和无穷小的时空体积联合给出了有限的贡献。因此得到结论,即使把式(24)中的第一项加入式(12),由于新加项的实际贡献为零,因此对2.1节的结果式(16)没有任何影响,也就是洛伦兹力公式是不变的。而把式(24)中的第一项加入式(12)后,式(12)所描写的系统中的电磁场就通常不再被理解为系统之外的电磁场了,而是系统本身的带电点电荷所产生的电磁场。对这样一个源和其产生的场结合起来的自作用体系,我们现在证明了洛伦兹力公式仍然是正确的!虽然在原始洛伦兹力公式的场强中若考虑受力电荷所发出的场会产生不知如何处理的无穷大。
上面讨论问题类似地也可以反过来问,既然在2.1节引进了带电质点本身的作用量,也就是式(12)中的第一项,那么为什么在式(24)中不考虑这一项的贡献呢?这里的回答是平庸的:完全可以在式(24)中加上这一项(当然要针对每个点电荷都加相应的一项),但在式(31)的对有源麦克斯韦方程的推导的过程中,由于这些新加的项和动力学变量电磁势无关,因而对求极值没有影响,也就对最后推导出的有源麦克斯韦方程没有影响,或者说对自作用电磁体系的电磁场仍然满足有源的麦克斯韦方程。因此不管如何组合,场方程和洛伦兹力公式都总是成立的(无源的部分如前面的讨论——只依赖定义式(17),和作用量选择无关)。
从理解经典电磁学理论的角度看,第2节依据作用量的方法显然比第1节依据实验的方式好,还有没有更好的方式呢?有的!这是本节要介绍和讨论的内容。判断是否更好就看是否发展了一些新的更简洁、更直观的理解方式来替换第2节中所给出的3条基本要求和最小作用量原理。
首先用四度电磁势Aμ来描述电磁场的行为,这是第2节给出的作用量的理解方式中同样要做的假设,理由已在第2节一开始介绍过了,这个假设虽然不够直观但确是无奈而又必须的基本选择。实际上电磁势是整个电磁作用最为基本而又神秘和难以理解的基元,电磁场作用量中电荷电流源与电磁场相互作用的最小耦合项中现身的不是电场强度和磁感应强度而是电磁势,这一现象本身就显示电磁势在电磁作用理论中的地位远比电场强度和磁感应强度重要。电磁势的空间分量是电磁学中的矢量势,它在电磁学和电动力学中是最难让人理解的量。很多人说它没有物理意义,因为其含有规范变换自由度(实际上到本文最后,我们将把这种规范变换自由度导致的规范对称性上升为理解电磁理论的第一原理,而将电磁势反过来看成是实现这种对称性的手段和工具);又有人说它有物理意义,因为AB效应确实给出可观察的现象;杨振宁先生在研读早年法拉第写的据说没有一个公式的三卷不朽巨著《电学的实验研究》后撰写了《麦克斯韦方程和规范理论的概念起源》,杨先生在该文中提到,法拉第的书中的电紧张态(实际就是矢量势)频繁出现在书的各处,并且又被频繁赋予各种其他的名字,诸如特殊态、强度态、特殊状态等,但从始至终未给出清晰的定义。法拉第是特别以物理图像和直观见长的大物理学家,他都描述不清这个矢量势,可见要想直观出其真面目何其之难!因此对电磁势的理解目前我们可能只能止步于此。
一旦有了电磁势Aμ,就可以人为地利用式(17)定义二阶反对称场强张量Fμν。人们会问,为什么要特别选择如此的方式构造这样一个反对称的场强张量?目前最可信赖的回答就是我们需要一个最为简单并且在式(23)给出的规范变换下保持规范不变的量。或者换句话说:是要求理论具有规范对称性导致我们引入了这个规范不变的量。而如2.1节最后的部分所讨论的,从Fμν的定义又可以直接给出无源的麦克斯韦方程组式(22)。首先就从四度电磁势的存在及二阶反对称场强张量的定义出发导出了无源的麦克斯韦方程。
进一步注意到对引进的用四度矢量势定义的二阶反对称场强张量Fμν,它自然满足方程:
这提示我们若按式(32)定义一个四度电流密度jμ,这个四度电流密度将满足电荷守恒式(28)。注意在这里有源的麦克斯韦方程式(32)不是推导或假设出来的,而是作为对电荷电流源的定义而出现的,也就是说我们用有源的麦克斯韦方程通过电磁场来定义电荷电流源的密度。进一步利用式(20)从二阶反对称场强张量出发再定义具体的电场强度和磁感应强度,因而式(32)的分量形式就如2.2节最后所述变成式(5)和(11)。按现在的做法,式(5)被理解和解释为用电场强度的散度∇·E定义了体系的电荷密度ρ,而式(11)被理解和解释为用磁感应强度的旋度∇×B和电场强度的时间变化率定义了体系的电流密度j。而传统对这两个有源的麦克斯韦方程的理解是:我们事先已经从别的地方分别定义或引进了电荷密度ρ、电流密度j、电场强度E和磁感应强度B,式(5)和(11)这两个方程只是建立起这些量之间的关系,把它们相互关联起来。而我们现在放弃了来自别处的电荷密度ρ和电流密度j定义,改为采用这两个方程来定义它们,也就是放弃了原来电荷电流的实体定义,而改用电磁场来定义和描述它们,这样做合理吗?有依据吗?目前能够挖掘出的合理性有如下3条:一是如此定义的电荷密度ρ和电流密度j满足电荷守恒定律式(29);二是在电磁学的镜像法中,源的分布完全是由场来决定的,并且我们经常赋予现实以虚幻的“镜像”电荷电流源来描述实际的电磁场分布,镜像源并不是真实存在的源,而只是在非求解区域虚设的图像感很强直观的源,只不过它们在求解区产生物理的电磁场;三是如果我们接受电荷电流分别是电场和磁场源的图像这一观念,在场的力线图上确能够看出源的独有的特点。在三维欧几里得空间中数学上的场论给出对矢量场的空间分布只存在两种类型的源,分别用散度和旋度代表。散度的直观图像是场点单位体积的通量,直接对应场力线的发散或收敛源,也就是∇·E从电力线看确实是电场发散和汇聚的核心,也就是源;而旋度的直观图像是场点单位表面的环量,直接对应场力线的涡流源。∇×B从磁力线看确实是磁场涡旋的中心,也就是源。从这个角度,麦克斯韦方程组另外两个无源的方程原本也应该拿来定义磁荷和磁流的源,只是自然界中不存在磁单极因此那两个方程定义的是零磁荷磁流源。这也反映了这样一个事实:只要从四度电磁势出发,就自然不会存在磁单极!这也可以看成一种对磁单极不存在的理论诠释。
上面的讨论若要更完备则在式(11)中还额外要考虑麦克斯韦人为加入方程的位移电流,其直观图像应回溯到原始麦克斯韦文章中给出的涡旋模型,现代的理解是在考虑了介质这一项从原来恰好是极化随时间变化额外产生的电流项,如此反衬理解原来的应该是个代表电流效应的项。另一个不依赖介质对的理解是,由于我们通过式(17)和(20)就可以知道电场强度和磁感应强度在洛伦兹变换下是相互转换的(也就是电场和磁场只是一个统一的电磁场的不同侧面),另外也同时知道∇和在洛伦兹变换下也是相互转换的,由此∇×B和在洛伦兹变换下就是相互转换的,一个在所有惯性系都具有同样形式的方程若具有∇×B项,则一定也会有项,因为即使没有换个惯性系也会通过洛伦兹变换冒将出来,类似地若方程里有∇×E项,则一定也会有项,这就形成第1节说的不容易理解的法拉第电磁感应定律。在这里电场强度和磁感应强度在洛伦兹变换的具体变换性质是非常重要的,例如它们就决定了∇·B和在洛伦兹变换下不会像∇×B和那样可以相互转换,∇·E和在洛伦兹变换下也不会相互转换。这样看似乎比较复杂,反而是在1+3维闵氏时空中用二阶场强张量的协变散度来定义协变的四度电流密度,也就是式(32),可以比较简明直接地说明问题。从协变性的角度看,由于电场强度和磁感应强度是电磁场的不同侧面,一个的旋度一定会导致另一个的时间微商,或从图像上随时间变化的一个一定会产生另一个的涡旋,也可以说对电场强度和磁感应强度这一对物理量,一个的时间变化率也是另一个的涡旋源。简洁地说就是一个场涡旋的源有物理的流密度还有另一个场的时间变化率。如此我们可以说从场的角度来定义和理解产生场的源既是合理的也是自然和简单的,在这样的诠释框架里,源不再是基本的而是场的衍生物,是场的发散和汇聚或涡旋的核心。这是一个完全依据场所建立的简洁直观的物理图像!
以上这种讨论因为直接针对麦克斯韦方程组似乎可以被拿来应用到第1节,也就是在第1节里不必退回到实验定律的原始形态,姑且把做了一定推导演绎后得到的麦克斯韦方程就看成是变形了的实验结果,这样似乎也可以从它们来直接理解电磁学理论。其实不然,因为如果直接针对麦克斯韦方程组,就得假设存在电场强度和磁感应强度,这比假设存在四度电磁势要复杂(一个是6个变量,另一个是4个变量),而且还看不清楚其洛伦兹变换关系。若一开始就假设二阶反对称场强张量Fμν,可以确定其洛伦兹变换关系,但只要没有其与电磁势的关系式(17),虽然对有源的麦克斯韦方程组,确可把它们看成是对电荷电流源的定义,我们仍旧无法推出无源的麦克斯韦方程组,因此也就无法解释为什么没有磁单极。
另一种质疑此种理解有源麦克斯韦方程组的可能是:假如现实的电磁场对应的光子有非零质量,那么规范对称性破缺了,电荷守恒将不再成立。这时由于我们仍用电磁势作为理论的基础,因而无源的麦克斯韦方程(22)仍然成立,但有源的麦克斯韦方程组(32)就不再成立了,需要在其中加上一个光子质量项的贡献。如果坚持使用原来的对应零质量光子的式(32),我们失去了把它作为电荷电流源定义的基础,因为它定义的电荷电流源是满足电荷守恒的,而实际的情形却不是,因此这时的式(32)给出的不是物理电荷电流源的正确定义,而当失去了这个电荷电流源的正确物理定义后,原来的对应零质量光子的式(32)也就不再有物理意义和价值了。那么可否把加进了光子质量项的修改了的式(32)作为电荷电流源的定义呢?虽不能说不行,但没有了电荷守恒约束,我们现在无法知道用这个修改了的式(32)定义的源是否真是物理的电荷电流源,因为缺乏一个像原来电荷守恒那样的可观察的实验定律的佐证或支持。而从场的力线分布看,修改式(32)对应的分量方程(5)和(11)也都要修改要加进光子质量的贡献,我们可以把这些新的光子质量项看成是有效的电荷电流源,由于这些有效的电荷电流源依赖电磁势因而它们会在全时空都有分布。因此在现在的时空中既有原来的物理电荷电流源,又混有新加的有效电荷电流源,它们都可以使电力线发散或汇聚,磁力线涡旋(由于式(22)仍旧成立,磁力线不会发散或汇聚永远只是涡旋,而电力线确可以涡旋),因而从直观电磁场的力线分布,分辨不出哪些发散、汇聚和涡旋的核心是来自物理电荷电流源,哪些又是来自有效电荷电流源。至少不再有通过场的分布来直接鉴别物理电荷电流源的能力,而必须通过某种方式先扣除掉(例如根据光子的质量大小)有效电荷电流源后,才可能从场的分布得到物理的电荷电流源。从这个角度说,现在现实(光子无质量)的麦克斯韦方程组相比它的其他各种可能的变形或异化来说直观物理图像最为清晰、简单和自然。当然可能有人会进一步质询说,前面讨论的位移电流,也就是电场强度的时间变化率,不也在全时空产生了有效的电流密度(对应地磁感应强度的时间变化率产生了有效的磁流密度)贡献了吗?在那里得到物理的电荷电流源不也得扣除位移电流吗?笔者认为那里首先也是最为重要的是物理的电荷电流源仍有电荷守恒定律支持,而这个守恒定律的指引,就体现为在协变表达式(32)下,物理的四度电流密度就是二阶场强张量的四度全散度。而在光子有质量的情形,我们对物理的电荷电流源不再有电荷守恒定律支持,也就没有相对应的表达式。实际上对光子有质量的情形,也不是不可以保留电荷守恒的要求的。只是那会对四度电磁势额外导致一个约束条件,即要求其四度散度为零,也就是满足洛伦兹规范。这样额外加入理论的约束条件很不自然,而为了能超出这个约束,则我们需要在理论中引入一个新的标量场。这导致场论中的Stueckelberg理论。具体讨论可见本人的文章[3],不在这里详述。因此即使强行要求电荷守恒成立虽然在理论上也是可行的,但会把理论搞得更加复杂。
我们现在已经建立起了麦克斯韦方程组,所依据的除了基本的四度电磁势Aμ的定义外,借助了电荷守恒定律(或其背后的规范不变性)用来支持我们对电荷电流源的定义。这个守恒定律也不是假设的而是推导出来的,我们做的只是把推导出来的式(28)或式(29)诠释为我们所熟悉的电荷守恒定律而已。一旦有了这样的诠释,我们就为电荷密度和电流密度的定义奠定了坚实的物理基础。剩下的就是如何理解洛伦兹力公式了,当谈及洛伦兹力时首先就涉及力的定义,在2.1节我们是通过从作用量求极值推导出带电质点的运动方程,再与标准的经狭义相对论修正的牛顿第二定律对比认出了洛伦兹力(这里还隐含了对牛顿第二定律结构的认识)。由于我们目前已经已经引进了电场强度和磁感应强度,而且知道了他们之间的洛伦兹变换关系(这些可以通过式(17)的二阶张量的洛伦兹变换关系及式(20)对电场强度和磁感应强度的定义推导出来)。如果我们进一步假设电场强度就是静止的单位电荷所受的力,则当电荷匀速运动形成稳恒电流时,我们可以将电荷静止系(那里没有磁场)中电荷所受的力用静止系的电场强度乘上电荷的电量表达出来,而利用洛伦兹变换,静止系的电场强度又可以表达为运动系的电场强度和磁感应强度的组合,且这种组合方式恰好就具有洛伦兹力的结构,只是相差一个整体的和速度相关的因子,再利用狭义相对论力学中力的洛伦兹变换把力从电荷静止系变换回运动系,这个额外的因子正好就消掉了,我们就推导出了运动系中看到的电荷受力的洛伦兹力公式,这是一种依据电场强度的力的含义及洛伦兹变换的洛伦兹力的推导。按照上面对麦克斯韦方程组的推导和理解,我们不再依靠作用量及最小作用量原理,而改用推导出的电荷守恒定律来支持定义电荷电流源的方式来理解有源的麦克斯韦方程。是否可以按照类似的思路和做法来处理洛伦兹力呢?答案是肯定的,下面同样放弃作用量及最小作用量原理,也不采用使用电场强度定义力的方式,而改用推导出能动量转化和守恒定律来定义力的方式来理解洛伦兹力公式。以下先依据已知的通过电磁场定义的电荷电流源及麦克斯韦方程组推导协变的电磁场的能动量转化与守恒定律。先定义一个四度力密度
将fμ认定为四度力密度,是因为有如下恒等式:
其中,
在式(37)第一行第一个等号右边利用了式(32)将四度电流密度替换为了场强张量(因为按照我们的诠释,式(32)就是用来定义四度电流密度的),在式(37)第四行最后一项重新标记了下标,在式(37)第七行的最后一项利用了式(22)。把式(37)和定义式(36)结合起来就是
式(39)诠释为它是体系能动量转化与守恒定律的协变表达式,其中的二阶对称张量Tμν是体系的能动量张量,也就是用场强定义的电磁场的能动量密度和能动量流密度。利用式(20)并与教科书对比很容易读出其纯空间分量Tij是动量转化与守恒定律中的电磁场动量流密度张量的分量,纯时间分量T44是能量转化与守恒定律中的电磁场能量密度的负值,而时间空间交叉分量Ti4=T4i是能量转化与守恒定律中的电磁场能流密度的第i个分量乘以系数i/c,同时也是动量转化与守恒定律中的电磁场动量密度的第i个分量乘以系数i c。
正是依据能动量转化与守恒定律式(39),才可以把fμ诠释为体系中的四度电磁力密度,因为当它为零时,体系的电磁能动量是分别守恒的。只有其不为零时,才会使电磁能动量出现向机械能动量的转化。当然这种力密度的诠释隐含了对能动量转化和守恒定律结构的认识,就像第2节里要隐含对牛顿第二定律结构的认识类似(注意这里说的隐含对结构的认识是指定律的结构是推导出来的,但如何认识这些结构确是需要假设的)。能动量转化和守恒定律现在被用来直接定义洛伦兹力,这一点与前面电荷守恒定律只是用来支撑和佐证通过有源麦克斯韦方程定义的电荷电流源的作用是不一样的,虽然它们都是从原始四度电磁势一步步严格推导出来的,那里守恒定律和定义以电荷电流密度为代表的物理量是两件独立的事情,这里守恒定律和定义以洛伦兹力为代表的物理量合成一件事情了。
注意式(36)定义的力密度对电量为q的位于r′处的点电荷利用式(25)及点电荷的电荷密度为ρ(r)=qδ(r-r′)变成
上式是一个四矢量的力密度,对其进行简单的空间体积积分后即可得到力,但由于空间体积不是洛伦兹变换不变量,所得到的力将不再是四矢量。为了得到以四矢量形式出现的力,我们需要改造空间积分的积分体积元,可以证明是一个洛伦兹变换不变的空间积分体积元。因为在洛伦兹变换下导致的体积收缩被后面乘的因子所贡献的膨胀效应所抵消。这个体积元在速度远小于光速时回到原始的普通空间体积元d V。用这样一个洛伦兹不变的空间体积元对式(40)实施空间体积积分,就得到四矢量形式的力,即
它正好是式(18)给出的四度力矢量。
有了针对fμ的四度电磁力密度的解释,其空间分量f就是普通的电磁力密度,利用式(20)和式(25),就得到了针对力密度的标准的洛伦兹力公式:
到此最后推出了洛伦兹力公式,它实际是以作为洛伦兹力定义的面目出现的,所依赖的支撑是推导出的能动量转化与守恒定律。
在对麦克斯韦方程组的理解中,除了将其作为电荷电流源的定义外,还讨论了其从场强的力线观看的直观图像。下面相应地讨论在场强的力线图上能看出些什么力的信息。式(39)的空间分量为
其中,
是电磁场的动量流密度,它是三维空间的二阶对称张量,f就是式(42)定义的洛伦兹力密度,g=ε0E×B是电磁场的动量密度。将式(43)等式右边第二项移到等号左边,再对等式两边针对任一体积V进行体积积分,得
其中,等号左边是体积V中体系的总动量,也就是体积V中的所有带电体的机械动量和电磁场的动量之和,的时间变化率,等式右边是此体积表面所受的总的面积力,其单位表面所受的面积力为
其中,n是表面的法向单位矢量,式(45)右边的体积表面面积分元可以写为dσ=n dσ。式(45)表明体积V内的总动量变化率可由体积表面的受力来表达,而带电体机械动量的时间变化率就是带电体所受到的洛伦兹力,即
类似地把
理解为体积V内的电磁场所受的某种体积力。可以通过计算从式(45)右边读出的电磁场在任意一个表面所产生的单位表面的面积力f表面进一步细化为
其中,fE是纯由电场贡献的单位表面受力;fB是纯由磁感应强度贡献的单位表面受力,且
其中,eE和eB分别是在电场强度和磁感应强度与界面表面法向矢量n分别所在的平面里的沿表面切向的单位矢量,θE和θB分别是在电场强度和磁感应强度与界面表面法向矢量n分别所在的平面里电场强度和磁感应强度与界面表面法向矢量n之间的夹角。式(49)、(50)、(51)给出的f表面实际上就是法拉第对电磁场力线受力的橡皮筋图像的精确定量描述。它给出对一个电场强度(或磁感应强度)分布空间中沿电力线(或磁力线)的一个力线的流管,计算式(50)(或(51))得到此管两端受的是拉力,侧面受到的是压力。更一般地,对空间任何一块体积V,如果把包围这个体积表面的所有由 式(49)给出的表面力都积分起来,由式(45)、(47)、(48)知这就是该体积中的电荷电流源所受到的洛伦兹力和电磁场受的体积力的叠加。如果只关心这个体积中的电荷电流源受到的洛伦兹力,就可以通过将体积表面来自电磁场的表面力扣除体积里面电磁场受到的体积力得到。注意表面力式(49)和由式(48)决定的电磁场所受的体积力都是由电磁场来描述的,并且它们对电场强度和磁感应强度的具体依赖结构虽然不容易理解但却是严格推导出来的。这给出了一个对电荷电流源所受的洛伦兹力的纯电磁场描写,就像前面用电磁场描写电荷电流源一样。
将力用场强的图像诠释与前面的电荷电流源用场强的图像诠释做一对比,这里用电磁场给出的表面力对应式(5′)左边的电场在体积表面面积分给出的电场强度的通量,或在等式两边同时做了曲面积分后的式(11)左边的磁感应强度在曲面边界曲线积分给出的磁感应强度的环量,而在从表面力甄别洛伦兹力的过程中要被扣掉的电磁场的体积力式(48)则对应把在等式两边同时做了曲面积分后的式(11)扩充人为加进来的位移电流项,式(5′)没有对应的项。在目前这种都用场强的图像来诠释电荷电流源和其受力的图像里,源的讨论和力的讨论很重要的共同点是都需要先计算电磁场在所讨论区域的边界作贡献,对式(5′)和本节谈的受力边界都是包围区域体积V的表面,对在等式两边同时做了曲面积分后的式(11)边界是包围区域曲面的曲线。正是这些来自边界上的电磁场的贡献决定了区域内部包含的电荷电流源及其受力(还要扣掉位移电流和电磁场受的体积力),这现象体现和蕴含了一些全息的特点,即边界上场的信息决定了内部源的信息。
在我们这种新的对电磁学理论的理解和诠释中,从假设四度电磁势存在而导出的守恒定律(包括电荷守恒和能动量转化与守恒)对我们诠释电荷电流源的密度及洛伦兹力起了非常基础和关键的支撑作用。守恒定律中的守恒量的认定和诠释恰恰是抽象的物理思想和现实的日常生活中体会总结和提炼出来的概念相互融合的连接之处,就像赵凯华先生在其纪念费曼百年的力作[4]中提到的费曼所编的积木数目守恒的例子那样:“一个孩子有28块积木,这些积木完全一样,而且不可破坏。每天早晨妈妈将这孩子和他全部的积木关在一间房子里,晚上她回来后总仔细地把积木的数目点过。不错,多少天来一直是28块。一天积木只剩下27块,她在室内细心地寻找后,发现有一块积木在小地毯下面。又有一天积木剩下26块,室内遍寻不着,然而窗子开着,她探头向外张望,发现两块积木在外边。再有一天,她惊愕地发现积木变成30块。后来她才知道,是一个小朋友带着他同样的积木来玩过,多出来的积木是这孩子留下的。她处置了多余的积木后,把窗子关起来,再不让别的孩子进来。于是在相当一段时间里情况正常,直到有一天她只能找到25块积木。这孩子有个玩具箱,妈妈想打开这箱子找积木,孩子尖叫起来,不让她开箱。妈妈只好称一下这箱子的重量。她以前知道,每块积木重3盎司,28块积木在外时箱子的重量为16盎司,她计算一下得到:眼前积木数25+(箱重-16盎司)/3盎司=常数28。于是她确信,缺失的积木被锁在玩具箱里。这箱子没再打开过,可是积木又少了许多。仔细调查发现,澡盆里脏水的水位升高了。显然,孩子把一些积木丢进了澡盆。但是水太浑浊,妈妈无法看清,然而她知道,澡盆里的水原来有6英寸深,每块积木使水位升高1/4英寸,于是她的计算公式里又添了一项:眼前积木数25+(箱重-16盎司)/3盎司+(澡盆的水位-6英寸)/(1/4英寸)=常数28。随着事态一步步地复杂化,越来越多的积木跑到她无法看到的地方。可是她找到一系列附加项,需要添加到她的计算公式里,以代表那些看不到的积木块数。这个复杂的公式保持着28那个数目不变。”在自然界发现存在某种量在系统的演变过程中保持不变,在费曼的例子中是小孩子玩的积木数目,而在本文讨论的电磁学理论中是假设了四度电磁势存在后所推导出的电荷和能动量,我们所做的只是把它们诠释为某种守恒定律,而通过这种诠释在本文中就进一步认定出来了电荷电流源和洛伦兹力。
到此为止仅仅依赖四度电磁势,和对从它演绎出的电荷守恒定律和能动量转化守恒定律的诠释,不再依靠作用量及其确定作用量的各种基本要求和最小作用量原理,我们完整地推导出了麦克斯韦方程组和洛伦兹力公式。其中推导出的电荷守恒定律用于支撑和诠释电荷和电流密度,能量和动量转化与守恒定律用于定义力密度。
在本文所描述的对电磁学理论的理解中,电荷密度、电流密度和其受力都是通过电磁场来定义的,特别是电荷电流源是可以十分清晰地直接从场的力线分布来鉴别出来的(而偏离现在的经典电磁学,如前面讨论的有质量光子的理论就不再有这么简洁清晰的图像或要构造更为复杂的理论);而整个对电磁理论的理解最后全都归功于最最基本的存在四度电磁势Aμ!或者换句话说只要存在四度电磁势,并认定理论具有规范不变性,最自然和简单地就演绎出了现在标准的经典电磁学理论,而不是其他。如果进一步非要把四度矢量势的存在和要求它生成的规范变换对称性两者之间再作一抉择的话,则应该选择规范对称性。因为若要具有规范对称性(更严谨一点是由式(23)定义的规范变换导致的规范对称性,也是在理论物理中称之的U(1)规范对称性),则必须存在四度电磁势,或者换句话说,四度电磁势实际只是实现规范对称性的工具和手段。因此结论是规范对称性导致了我们的经典电磁学理论!我们在现代意义上回到了杨振宁先生指出的法拉第巨著里所特别强调的电紧张状态对经典电磁学有着根本的影响的结论!而区区一个看似简单不太起眼的为实现规范对称性而引入的四度电磁势Aμ,在一步步不断地巧妙构造和诠释下,居然最后完整地搭建起了整个经典电磁学理论的大厦,描述自然界的理论居然如此简洁而精妙,实在令人叹为观止!