学习广义相对论
讲授广义相对论
罗伯特。沃德
概述
广义相对论是爱因斯坦于1915年建立起来的关于空间,时间,和引力的理论。它被广泛认为是一个非常难懂的,数学的理论,而且确实,直到最近为止它还被认为不适合作为本科阶段的课程来讲授。实际上,深入理解广义相对论所需的数学(比如微分几何)并非特别难而且不要求比高等微积分和线性代数更多的背景知识。(与之相反,严格建立量子理论则需要更复杂的数学)然而,大多数物理专业学生并不熟悉这些数学,而且其在广义相对论中的应用与学生们高中以来(或更早)学到的:即,那个“空间”具有向量空间的自然结构相抵触。这样,讲授广义相对论的主要困难就在于那些数学——尤其对于只有一学期的课时。如果着重于数学,则有变成微分几何课忽略物理内容的危险。另一方面,如果讲授不合适,则会纠缠于解释广义相对论和相对论前及狭义相对论中时空结构表示的主要概念差异。
本文目的即为本科和研究生阶段讲授广义相对论中的上述问题提供一个指南。重点放在建立广义相对论所需数学的讲授问题上。故我将不关注那些一般广义相对论课程中的后续课题,如“弱场”极限,广义相对论的验证,引力辐射,宇宙学,和黑洞。
我将首先简单介绍广义相对论引入的主要新概念,然后描述严格建立这个理论所需的数学概念,最后将讨论在课程中处理这些数学的策略。
广义相对论
在1905 年之前,时空的因果结构定义了同时性被视为当然。对于一个给定的事件A(即“某时刻在空间中的一点”),我们可以定义A的将来为理论上所有由A出发的粒子可以到达的事件的集合。类似地,A的过去可以定义为理论上所以由其出发并到达A的事件的集合。那些既不属于A的将来也不属于A的过去的事件则认为是组成一个3维集合,称为与A同时的事件。这些同时性的表示定义了一个“在某时的所有空间”的表达,这显著地允许将对时空的研究分成对“空间”和“时间”的研究。这个相对论前的时空结构表示中的前提的关键地位对于学生来说是强调的重点。
狭义相对论的主要革命性在于确定了上述时空因果结构的表达是错误的。惊人的是,那些与事件A因果上不相关的事件组成的集合远比一个3维区域复杂。在时空的表示图中,事件A的将来看上去象是以A为顶点的“圆锥”的内部,而这个锥的边界则对应于由A点发射出的光线的所有轨迹。这样,狭义相对论中,时空的因果结果定义了一个事件的“光锥”表达,但它没有定义同时性的表示。
关注时空的“不变的结构”是很重要的,即有很好定义的独立于进行测量的观测者的时空的结构。在相对论前的物理中,任一对事件的时间间隔是一个不变量;同时性事件的空间间隔也是一个不变量。然而,在狭义相对论中,无论时间间隔还是空间间隔都不再是不变量。在狭义相对论中,与一对事件A和B相关的唯一的不变量是它们的时空间隔,在任何全局的惯性坐标系中有下面公式给出:
I(A,B) = -(\Delta t)^2 + \frac{1}{c^2}[(\Delta x)^2 +(\Delta y)^2 + (\Delta z)^2]
狭义相对论中所有时空结构的特性都可以从时空间隔导出。
一个值得注意的事实是——除了那个关键的(\Delta t)^2前的负号——时空间隔的数学形式与欧氏几何中两点间距离平方的毕达哥拉斯公式完全一致。闵可夫斯基在1908年首先意识到这一点,但其深刻重要性爱因斯坦直到几年后他开始发展广义相对论时才认识到。这使得可以作为一个平坦的洛伦兹几何的理论来理解狭义相对论。狭义相对论中,时空是由欧氏几何对应的数学来描述的,除了前面公式右边引入负号的一项带来的改变。特别地,狭义相对论的全局惯性坐标是欧氏几何中笛卡尔坐标的直接对应,而惯性观测者的世界线则是欧氏几何中直线(测地线)的直接对应。
对狭义相对论作为一个平坦的洛伦兹几何的理论的理解是迈向广义相对论的关键一步。广义相对论产生于试图建立一个与狭义相对论相容的引力理论的努力中,并且也建立在所谓等效原理的基础上:一切物体均受引力作用,而且确实引力场中一切物体以同样方式下落。等效原理强烈地表明引力场中的自由落体运动应该和相对论前物理以及狭义相对论中的惯性运动同样看待。引力可以说不是一个“力”,而是能使惯性观测者相对彼此加速的时空结构的改变。经过多年的努力,爱因斯坦于是发现这个想法可以简单地通过把狭义相对论的平坦洛伦兹几何推广到一个弯曲的洛伦兹几何来实现——与平坦的欧氏几何推广到弯曲的黎曼几何的方式一致。这样广义相对论就成了一个以弯曲的时空几何来描述所有引力的物理作用的关于时空结构的理论。
在用弯曲时空几何取代平坦时空几何之外,广义相对论与狭义相对论显著区别是时空的几何不再是事先固定的而是动态演化的。这个度规的动态演化方程——著名的爱因斯坦方程——使时空曲率的部分与物质的应力-能量-动量张量相等。
微分几何
理解广义相对论所需的几何是简单的黎曼几何到非正定的度规的推广。幸运的是,这个推广没有引起多少重要的数学改变。随之,大多数人为理解日常生活遇到的2维表面——如一个土豆的表面——的黎曼几何而拥有的大部分直觉通常可以可靠地过渡到广义相对论中。然而也要牢记两个重要警告:(1)大多数人拥有的有关2维表面曲率的直觉是这个表面是在它存在的3维欧氏空间中弯曲的。这个曲率的外部表示必须和使这个表面本身初始平行的测地线失去平行关系相关的纯内蕴曲率表示小心区别开。而正是这个内蕴曲率表示才与广义相对论的建立相关。(2)非正定度规带来的一个新特性是空向量的出现,即,“长度”为0的非0向量。在从黎曼几何到空向量和空表面(即,处处与空向量正交的表面)上运用直觉的努力都将导致严重错误!
不管在本科阶段还是研究生阶段讲授广义相对论,我都向学生强调他们的主要挑战之一是要把他们在高中(如果不是更早)所学到的默认的有关空间和时间的一些基本的错误抛弃。我们已经讨论过一个这样的谬误,即绝对同时性的表示。通常学习广义相对论的学生对狭义相对论都已经有一定接触,所以他们知道——至少在某个水平上——狭义相对论中没有绝对同时性的表达。然而,很少有学生对自然中空间的点或时空中的事件并没有任何自然的向量结构有过哪怕模糊的理解。确实,“向量”的概念通常是在学生们的物理学教育早期通过表示空间中点的“位置向量”的概念传授给他们的!学生们是这样被教的,假定给定一个点作为“原点”,则空间中的点的相加和数乘都有意义。狭义相对论中唯一显著变化是把这样的向量空间结构从空间推广到时空:在狭义相对论里,表达空间中一点的位置向量\vec{x}被表达时空中一个事件的“4维向量”x^\mu取代。你可以象在对相对论前物理学中的普通位置向量那样对狭义相对论的4维向量进行相加或数乘。
上述情况在广义相对论中却显著地改变了,因为空间或时空的向量空间特征严重地依赖于一个平坦的几何。在广义相对论中,把时空中的两个事件“相加”不一定有意义,就像试图给土豆表面上的点定义相加一样。
那怎样才能给广义相对论中的时空几何一个准确的数学描述——或者说,同样的道理,给土豆表面的几何?对土豆表面可以定义一个点间(有限分离的)的“距离函数”表达,类似地对广义相对论中的事件(有限分离的,但足够闭合的)可以定义一个“时空间隔”的表达。但是把这些实体的几何描述建立在上述表达上将是相当笨的。相比之下更好的办法是使用无限逼近的办法,用在足够小的范围内一个弯曲的几何可以看成是平坦的思想。这些偏离平坦的部分就可以通过微分算子来描述。为了作到这点,我们先引入一个切向量的表示来描述对一点p的无穷小替代。在点p的所有切向量的集合给出了一个向量空间的自然结构,但在弯曲几何中,在点p 的一个切向量无法自然地和在另一点q的一个切向量区分开。然后我们用线性代数中的基本构造来定义更一般的表示,在点p的张量。一个特别重要的张量场(即,一个在所有p点定义的张量)的例子是度规,简单地是(不必是正定的)切向量上的内积(如后面所述)。当一个度规(任何种类的)存在时,它就自然给出了一个张量场的微分表达。这个微分表达让我们可以定义一个测地线(作为一个“尽可能直”的曲线)和曲率——可以用初始平行的测地线失去平行来定义,或者,更直接地,用张量场的连续两个导数的非交换性来定义。
现在我来进一步解释在数学中严格引进上述微分几何基本概念所必需的。首先,我们需要组成时空的(或在通常几何中构成表面的)的“点的集合”的准确数学表达。恰当的表述就是流形,一个具有可微特性的本地“看上去象”R^n的集合,但没有度规的或其他结构。一个n维流形的点在本地可以用坐标(x^1,...,x^n)来标识,但这些坐标标识是任意的并且可以相等地用其他坐标({x'}^1,..., {x'}^n)标识,而这与原坐标(x^1,...,x^n)以一种光滑的,非奇异的方式相关。n维流形的准确定义是由可以用本地坐标系统覆盖的而且在重叠区域上满足一定相容条件集合给出的。
不幸的是,给出“切向量”的严格数学定义不象我们想象的那样容易。最优美而且数学上清晰的方式是把一个切向量定义为一个函数上的“微分”(即,方向导数算子);微分可以用一种简单方式公理化地定义。这个定义在表达清楚什么是一个切向量的同时不需要引入额外的概念如坐标的基。很重要的是所有现代的数学书都是这样定义切向量。然而,大多数学生发现这个定义不是很符合直觉。
更合直觉的方式是考虑一条曲线,局部上可以用曲线上这点的坐标x^\mu (t)来描述,即曲线参数t的一个函数。我们可以用曲线上以t标识的一点对应的n个数的组(dx^1\dt,...,dx^n\dt)来确定在点 x^\mu (t)与曲线相切的向量。坐标线本身都是曲线,和第\mu个坐标线相切的可以用数组(0,...,0,1,0,...0)来表示,这里的“1”是第\mu 个位置。这样我们就可以把在每一点对坐标线的切线看成是构成了在那点的“切向量”的基。对任意曲线x^\mu (t),我们可以把(dx^1\dt,...,dx^n\dt)看成是这条曲线的切向量在这个坐标基下的分量。当然,如果我们选不同的坐标系,这条曲线切向量的分量将根据所谓“向量变换法则”的公式“变换”,这也很容易用链式法则导出。
另一种更直接的方式是把一点的切向量定义为与坐标系相关的n个数的组,当改变坐标时其值根据向量变换法则而变换。这种做法使我们可以用一句话定义一个切向量然后迅速转向其他内容的讨论。这种定义在20世纪中期以前的大多数学书中都可以找到,也在物理学家写的广义相对论相关文献中出现。然而,这种方式也不很符合直觉。而且,加上是在坐标系存在下定义切向量,学生们要以一种几何的,独立于坐标的角度思考切向量(包括张量——见后文)就很困难。
介绍了切向量之后,接下来要定义任意阶的张量。这是一个标准的线性代数构造。和其他数学内容相比线性代数相当“容易”,而且学习广义相对论的学生通常都已经学过这门课,或者已经有些接触。但不幸的是,对于线性代数,学生们被教的方式与广义相对论所需要的不是很融合。问题在于学生接触线性代数的环境里,一个(正定的)内积通常已经摆在那里了。然后我们就很平常地使用那些在一个正交基上的张量分量了。所以我们实际上“隐藏”了不同构造下内积的角色。我们还隐藏了向量和对偶向量的主要差异(见下文)。广义相对论中,我们所希望解决的关键“未知变量”是时空的度规,如上面所提到过的,简单说就是一个(非正定的)切向量上的内积。正因如此,基本的线性代数构造中不默认内积是至关重要的,这样在所有后续构造中度规的作用才能完全显现。
现在给定一个有限维向量空间,V——在我们感兴趣的情形,是时空中一点p的切空间——我们定义其对偶空间V^*为那些从V到\bf{R}线性映射的组。伴随着的是V^*也为与V维度相同的向量空间,但是如果没有内积的存在,将没有自然的方式把V和 V^*区分开。然而,给定V的基,将自然存在对应的V^*的基。因为V^*是向量空间,我们也可以取它的对偶,来产生V的“对偶的对偶”,V^{**}。不难显示存在自然的方式区分V^{**}和V。
有了这些,一个(k,l)型的张量可以定义为一个从k个V^{**}和l个V到R的多线性映射。如果考虑V和V^*之间的同构,则给定类型的张量可以从其它对等的方式看待。例如(1,1)型张量同构于从V到V的线性映射组成的向量空间,也同构于V^* 到V^*的线性映射的向量空间。有两种基本可以作用在张量上的运算:缩并和外积。所有类似运算都可以用这两种表达出;如两个线性映射的组合可以表示为对应张量的外积然后取缩并。
前面两段中的所有表述均可直接得到。然而,大多数学生不习惯区别向量与对偶向量。确实在具有正定度规的熟悉的情况下,不仅 V和V^*可以区分开,而且正交基上一个向量的分量和对应的对偶基上的对偶向量的分量可以相等。学生们觉得他们“懂”线性代数,如果你花时间仔细解释上面的思想他们就会厌烦和失去耐心。毕竟,他们上课期望学习爱因斯坦的有关空间,时间,引力的革命性思想,而不是学习为什么向量空间和其对偶空间同构。但如果我们不仔细解释这些思想,学生们还是会在以后的阶段非常困惑。讲授研究生阶段的广义相对论30多年,我仍然未能找到对此令人满意的解决方法,而且总是发现讨论张量会成为整个课程中的“低谷”。
很多对广义相对论的处理通过只讨论与坐标系联系起来的基上的张量分量有效地避开了上述张量处理。给定坐标改变下的切向量分量的“变换法则”,对应的对偶向量的分量变换法则就可以得到,更一般的(k,l)型张量的“张量变换法则”也可以导出。然后我们可以定义一个n维流形上的(k,l)型张量为与一个坐标改变时遵循张量变换法则变换的坐标系统联系的n^{k+l}个数的组。这种方式被20世纪中期以前的很多数学书采用,也被很多目前的广义相对论文献采用。它的好处是我们可以不必花很多时间讨论张量而迅速转向其他内容。然而其显而易见的缺点在于虽然学生可以被训练得在计算中正确使用张量,他们通常也绝不会理解张量是什么。
现在一个在向量空间V上的度规g就可以被定义为一个非退化的(0,2)型张量,即对所有w \in V,有唯一的v \in V满足g(v,w)=0,且v=0。这时一个度规可视为等同于V和V^*间同构的规格。如果这个度规是正定的,则称为黎曼的,如果其在一个1维子空间是负定的同时在这个子空间的正交补空间是正定的,则称为洛伦兹的。黎曼度规描述了通常的弯曲几何(象土豆表面的),而广义相对论中的弯曲时空是由洛伦兹度规描述的。
在过去的半个世纪里,在张量的表示上,数学家和物理学家之间出现了一个文化分裂。传统的表示——仍被大多数物理学家使用的——是把一个 (k,l)型张量,T,用其分量{T^{\mu_1 ...\mu_k}}_{\nu_1 ...\nu_l}来表示,这里“上”标对应于向量指标,而“下”标对应对偶向量指标。这种表示的好处是张量上的基本运算——象取外积或进行缩并——被以一种清晰的显式方式表达。度规存在下向量与对偶向量的同构也可以通过用度规“升标和降标”很好地配合这种表示。然而,这种表示实际上强迫我们把张量想成分量组成而不是不需要引入基的本身有自己完整状态的实体。正因如此,所有的现代数学书都采用了“不带指标”的张量表示法。这种表示隐含了张量的恰当的基/坐标非依赖状态,但却在表示哪怕不很复杂的运算时显得极端笨拙。我的观点是,一个比较理想的表示可以用“抽象指标表示法”,即照搬分量表示,但这里如{T^ {\mu_1 ...\mu_k}}_{\nu_1 ...\nu_l}的符号不再表示分量,而是代表张量本身。
但任意向量空间上张量引入后,我们就可以回到流形的相关建构中,将一个(k,l)型张量场定义为在流形上每一点的切空间赋予一个(k,l)型张量。下一个关键步骤就是建立张量场上的微分表达。张量场上的微分表示是不寻常的,因为在一个流形M上并没有自然的方式可以区分在一点p上的切空间和另一点q上的切空间,所以我们不能简单地取p点和 q点上的张量的差然后得到q逼近p时的极限。实际上,如果我们不在流形之外附加额外的结构将没有微分的特定表示;相反将有一整类可能的定义张量场上导数的方式。这些可以通过给定一个公理化的导数算子表达来直接描述,或者相等地,可以通过引入一个沿曲线的“平移”表达还做到。在数学处理中,平移表示通常在一个更一般的情形,纤维丛上的联络中被引入。纤维丛的一般表示和联络在数学和物理(特别是对规范场的描述)有着很多非常重要的应用,但这也需要相当深入的数学内容才能在广义相对论课程中进行一般探讨,即使是研究生阶段。
虽然在完全一般的情形下并没有特定的张量微分表达,但当度规存在时如果另外加上这个度规的导数必须是0的条件则会产生出一个特定的微分表示。在欧氏几何(或在狭义相对论中)中,这个张量的微分表示对应于笛卡尔坐标下(或者全局惯性坐标中)张量分量的偏微分。然而,在非平坦几何中,这个微分表示——即协变导数——并不对应于任何坐标系下张量分量的偏微分。
一旦定义了张量的微分,一条其上面切线是沿其本身的平移的曲线就可以被定义为测地线,即切线的在相切消失方向的协变导数。不难显示,在黎曼几何中一条给定端点的曲线当且仅当在曲线变化而端点固定的情况下其长度为极值时(不一定是最小指)则为测地线。相似地在洛伦兹几何中——即,广义相对论中——一条类时测地线(即,一条相对时空度规处处有负“模”的切线的测地线)可以由沿曲线流过的适当的时间,\tau的极值来确定。如果这条曲线是引入x^\mu (t)从而由坐标x^\mu描述的,则\tau可由公式:
\tau = \int_a^b \sqrt{- \sum_{\mu,\nu} g_{\mu\nu} \frac{dx^\mu}{dt} \frac{dx^\nu}{dt}} \,\, dt
给出。
在以上的表示都引入后,曲率就可以由以下三种对等的方式中任一种定义:(1)张量场上前后两个协变导数的非交换性;(2)在无穷小闭合曲线附近一个平移向量无法平移回到其初始值;(3)初始平行的测地线,无限接近测地线处失去平行。曲率是由一个称为黎曼曲率张量的,(1,3)型张量描述的。黎曼曲率张量定义后,所有建立广义相对论所需的数学就具备了。
讲授本科生阶段的广义相对论
略。
讲授研究生阶段的广义相对论
略。
文献资源
略。
注:非全文翻译,原文见预印本
(练习曲译,本人非物理专业,翻译如有错误望指正)
Labels: 问 译

0 Comments:
Post a Comment
<< Home