广义相对论基础导引 第一部分

· · 科技·工程

第一章:微分几何基础

1.1 可微流形 (Differentiable Manifolds)

这一节是整个广义相对论的“数据结构定义”。我们将展示如何从一堆局部看起来像欧几里得空间(\mathbb{R}^n)的碎片,通过严格的接口协议拼装成一个全局的弯曲空间。

定义 1.1.1:拓扑流形 (Topological Manifold)

一个 n 维拓扑流形 \mathcal{M} 是一个拓扑空间,满足以下三条公理:

  1. Hausdorff 性 (分离公理):对于任意不同两点 p, q \in \mathcal{M},存在不相交的开集 O_p, O_q 分别包含 pq
    • CS 类比:保证了点的“可区分性”。如果没有这条,可能会出现两个无法通过逼近算法区分的“重叠点”。
  2. 第二可数性 (Second Countable):存在可数的拓扑基。
    • CS 类比:保证了流形不会过大/过于离散,确保了分割(Partition of Unity)的存在,这是定义积分和度量的基础。
  3. 局部欧氏性 (Locally Euclidean):对于 \forall p \in \mathcal{M},存在一个邻域 U \ni p 和一个同胚映射(连续且逆连续的双射) \phi: U \to \hat{U} \subseteq \mathbb{R}^n,其中 \hat{U}\mathbb{R}^n 中的开集。

定义 1.1.2:坐标卡 (Coordinate Chart)

对元组 (U, \phi) 称为流形上的一个坐标卡 (Chart)

定义 1.1.3:光滑图集与微分结构 (Smooth Atlas & Differential Structure)

这是“可微”二字的关键。单个坐标卡只能覆盖局部,要描述整个流形,我们需要覆盖全集的图集 (Atlas) \mathcal{A} = \{(U_\alpha, \phi_\alpha)\}_{\alpha \in I}

若两个坐标卡 (U_\alpha, \phi_\alpha)(U_\beta, \phi_\beta) 有重叠(U_\alpha \cap U_\beta \neq \emptyset),则定义坐标转换函数 (Transition Map) \psi_{\beta\alpha}

\psi_{\beta\alpha} = \phi_\beta \circ \phi_\alpha^{-1} : \quad \phi_\alpha(U_\alpha \cap U_\beta) \to \phi_\beta(U_\alpha \cap U_\beta)

这是一个从 \mathbb{R}^n 的子集到 \mathbb{R}^n 的子集的普通函数。

1.1.4 构建圆 (S^1) 的微分结构

问题描述: 证明单位圆 S^1 = \{ (x, y) \in \mathbb{R}^2 \mid x^2 + y^2 = 1 \} 是一个 1 维可微流形。 注意:圆是一个嵌入在 2 维空间的 1 维对象,但我们不能直接用极坐标角度 \theta \in [0, 2\pi) 作为一个全局坐标卡,因为在 02\pi 的连接处不连续。我们需要至少两个坐标卡。

解题步骤:我们使用立体投影 (Stereographic Projection) 来构建图集。

步骤 1:构造坐标卡 1 (北极投影)

取去心北极点 N=(0, 1) 的圆 U_N = S^1 \setminus \{N\}。 定义映射 \phi_N: U_N \to \mathbb{R},将圆上一点 (x, y) 连线 N,投射到 X 轴 (y=0) 上。 通过简单的几何相似关系推导投影公式:

u = \phi_N(x, y) = \frac{x}{1-y}

其逆映射(参数化)\phi_N^{-1}: \mathbb{R} \to U_N 为(解方程组):

x = \frac{2u}{u^2+1}, \quad y = \frac{u^2-1}{u^2+1}

显然,\phi_N\phi_N^{-1} 在其定义域内连续。

步骤 2:构造坐标卡 2 (南极投影)

取去心南极点 S=(0, -1) 的圆 U_S = S^1 \setminus \{S\}。 定义映射 \phi_S: U_S \to \mathbb{R},将圆上一点 (x, y) 连线 S,投射到 X 轴上。 公式为:

v = \phi_S(x, y) = \frac{x}{1+y}

其逆映射 \phi_S^{-1}: \mathbb{R} \to U_S 为:

x = \frac{2v}{1+v^2}, \quad y = \frac{1-v^2}{1+v^2}

步骤 3:分析重叠区域与转换函数

图集 \mathcal{A} = \{(U_N, \phi_N), (U_S, \phi_S)\} 覆盖了 S^1(因为没有任何点既是北极又是南极)。 重叠区域 U_{N \cap S} = S^1 \setminus \{N, S\}

我们需要计算从 u 坐标系变换到 v 坐标系的转换函数 \psi_{SN} = \phi_S \circ \phi_N^{-1}。 思路:

  1. 输入 u
  2. 通过 \phi_N^{-1} 还原为流形上的点 (x, y)
  3. (x, y) 喂给 \phi_S 得到 v

计算:

v = \phi_S \left( \frac{2u}{u^2+1}, \frac{u^2-1}{u^2+1} \right) = \frac{x}{1+y}

代入 x, yu 表达式:

v = \frac{ \frac{2u}{u^2+1} }{ 1 + \frac{u^2-1}{u^2+1} } = \frac{ \frac{2u}{u^2+1} }{ \frac{u^2+1 + u^2-1}{u^2+1} } = \frac{2u}{2u^2} = \frac{1}{u}

所以,转换函数为:

\psi_{SN}(u) = \frac{1}{u}

定义域为 \phi_N(U_{N \cap S}) = \mathbb{R} \setminus \{0\}

步骤 4:验证微分结构 (Compatibility Check)

函数 f(u) = 1/u\mathbb{R} \setminus \{0\} 上是 C^\infty (光滑) 的。(其导数为 -1/u^2, 2/u^3, ... 均存在且连续)。 同理,反向转换 \psi_{NS}(v) = 1/v 也是 C^\infty 的。

结论: 由于所有的转换函数都是光滑的,(U_N, \phi_N)(U_S, \phi_S) 是兼容的。这个图集赋予了 S^1 标准的微分结构。这意味着我们可以在 S^1 上进行微积分运算,而不必担心“接缝”处的奇异性。

值得一提 在数值计算或几何处理中,如果试图用单一的 double theta (0 \le \theta < 2\pi) 变量来模拟圆环上的物理场,会遇到著名的 "Hairy Ball Theorem" (毛球定理) 或类似的拓扑障碍带来的数值不稳定:

  1. 奇点:在 \theta = 0 处进行插值或求导时,需要特殊的 if 逻辑处理周期性边界条件。
  2. 流形视角:使用图集(Atlas)的方法则是真正通用的。您存储两个 patch 的数据(uv),当物体运动到北极附近时(u \to \infty),程序逻辑自动检测并使用 Transition Map 切换到南极坐标系(v \approx 0),从而避免数值溢出(Overflow)和精度丢失。
    • 这就是流形在“计算”中的本质:没有全局最优坐标系,只有通过协议(转换函数)互联的局部坐标系

1.2 切空间与切矢量 (Tangent Space & Vectors)

在欧几里得空间 \mathbb{R}^n 中,我们习惯将向量视为连接两点(如原点到某点)的直观箭头。然而在弯曲流形(Manifold)上,两点之间的连线通常不在流形内部(例如球面上的两点连线会穿过球体内部)。

因此,我们需要从局部性质出发,建立一种不依赖于嵌入高维空间的内在定义。我们将切矢量严格定义为作用在光滑函数上的导数算子(Derivation)

1.2.1 作为导数算子的切矢量

\mathcal{M}n 维光滑流形,p \in \mathcal{M} 为流形上的一点。令 C^\infty(p) 为在点 p 的邻域内定义的所有实值光滑函数 f: \mathcal{M} \to \mathbb{R} 的集合。

定义 1.2.1 (切矢量): 点 p 处的切矢量 v 是一个线性映射 v: C^\infty(p) \to \mathbb{R},它满足以下两条公理:

  1. 线性性 (Linearity)v(af + bg) = a v(f) + b v(g), \quad \forall f, g \in C^\infty(p), \forall a, b \in \mathbb{R}
  2. 莱布尼茨律 (Leibniz Rule / Product Rule)v(fg) = f(p)v(g) + g(p)v(f)

直观理解:切矢量本质上是“方向导数”。v(f) 的值表示函数 f 沿着 v 方向在 p 点的变化率。

1.2.2 切空间的基底与分量

虽然定义是抽象的,但我们需要具体计算。这需要引入坐标系。 设 x = (x^0, x^1, \dots, x^{n-1}) 为点 p 周围的一个局部坐标系。

定义 1.2.2 (坐标基底): 对于坐标系中的每一个坐标 x^\mu,定义算子 \frac{\partial}{\partial x^\mu} 作用于函数 f 如下:

\left( \frac{\partial}{\partial x^\mu} \right)_p (f) \equiv \frac{\partial (f \circ \phi^{-1})}{\partial x^\mu} \Bigg|_{\phi(p)}

这正是标准的偏导数。很容易验证它满足上述的线性性和莱布尼茨律。

定理 1.2.1 (切空间基定理): 集合 \left\{ \left(\frac{\partial}{\partial x^0}\right)_p, \dots, \left(\frac{\partial}{\partial x^{n-1}}\right)_p \right\} 构成了切空间 T_p\mathcal{M} 的一组基,称为坐标基 (Coordinate Basis)

因此,任意切矢量 v \in T_p\mathcal{M} 都可以唯一地写成这组基的线性组合:

v = \sum_{\mu=0}^{n-1} v^\mu \left(\frac{\partial}{\partial x^\mu}\right)_p \overset{\text{Einstein}}{=} v^\mu \partial_\mu

其中系数 v^\mu 称为矢量 v 在该坐标系下的分量

值得一提

  • 当我们说“求矢量 v 作用于函数 f”时,运算过程是:v(f) = (v^\mu \partial_\mu) f = v^\mu \frac{\partial f}{\partial x^\mu}

1.2.3 与路径切线的联系

为了联系物理直觉,通常通过流形上的曲线来构造切矢量。

\gamma: (-\epsilon, \epsilon) \to \mathcal{M} 是一条光滑曲线,且 \gamma(0) = p。这条曲线在点 p 定义了一个切矢量 v_\gamma,其作用法则为:

v_\gamma(f) \equiv \frac{d}{dt} (f \circ \gamma)(t) \Bigg|_{t=0}

根据链式法则,如果曲线在坐标系 x^\mu 下的方程为 x^\mu(t),则:

\frac{d}{dt} f(x(t)) = \sum_{\mu} \frac{dx^\mu}{dt} \frac{\partial f}{\partial x^\mu}

对比 v = v^\mu \partial_\mu,我们得到矢量的分量即为坐标对参数的导数:

v^\mu = \frac{dx^\mu}{dt}\Bigg|_{t=0}

1.2.4 切空间与切矢量例题

例题 1:算子操作与求值

场景:考虑 2 维平面 \mathbb{R}^2(流形),坐标为笛卡尔坐标 (x, y)。 定义一个函数 f(x, y) = x^2 y + \sin(x)。 定义点 p = (0, 2) 处的一个切矢量 v = 3 \partial_x - \partial_y

问题:计算 v(f) 的值。

解答: 切矢量是微分算子,我们直接将算子作用于函数:

\begin{aligned} v(f) &= \left( 3 \frac{\partial}{\partial x} - 1 \frac{\partial}{\partial y} \right) (x^2 y + \sin(x)) \Bigg|_{(0,2)} \\ &= 3 \frac{\partial}{\partial x}(x^2 y + \sin(x)) \Bigg|_{(0,2)} - \frac{\partial}{\partial y}(x^2 y + \sin(x)) \Bigg|_{(0,2)} \\ &= 3 (2xy + \cos(x)) \Bigg|_{(0,2)} - (x^2) \Bigg|_{(0,2)} \end{aligned}

代入点 p 的坐标 x=0, y=2

\begin{aligned} &= 3 (2 \cdot 0 \cdot 2 + \cos(0)) - (0^2) \\ &= 3 (0 + 1) - 0 \\ &= 3 \end{aligned}

物理含义:若你站在 (0,2) 处,沿着向量 (3, -1) 的方向移动,感受到标量场 f 的瞬时变化率为 3。

例题 2:坐标变换法则 (基变换)

这是广义相对论中最核心的运算之一。

场景:考虑 \mathbb{R}^2,从笛卡尔坐标 (x, y) 变换到极坐标 (r, \theta)。 变换公式为:x = r \cos\theta, \quad y = r \sin\theta

问题

  1. 将极坐标基矢量 \partial_r\partial_\theta 用笛卡尔基矢量 \partial_x, \partial_y 表示。
  2. 验证变换矩阵(Jacobian)的作用。

解答1. 使用链式法则推导基底变换: 我们将 \partial_r 视为作用于任意函数 f 的算子。根据多元微积分链式法则:

\frac{\partial f}{\partial r} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial r} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial r}

剥离测试函数 f,得到算子关系:

\partial_r = \frac{\partial x}{\partial r} \partial_x + \frac{\partial y}{\partial r} \partial_y

计算偏导系数:

同理对于 \partial_\theta

所以基变换关系为:

\begin{aligned} \partial_r &= \cos\theta \, \partial_x + \sin\theta \, \partial_y \\ \partial_\theta &= -r\sin\theta \, \partial_x + r\cos\theta \, \partial_y \end{aligned}

2. 分量变换的逆变性验证: 设某矢量 v 在极坐标下的分量为 (v^r, v^\theta) = (1, 0)(即径向单位矢量)。 该矢量在笛卡尔坐标系下的分量 (v^x, v^y) 是什么?

根据矢量本身是不变量:v = v^r \partial_r + v^\theta \partial_\theta = v^x \partial_x + v^y \partial_y。 将刚才推导的 \partial_r 表达式代入左边:

1 \cdot (\cos\theta \, \partial_x + \sin\theta \, \partial_y) + 0 = v^x \partial_x + v^y \partial_y

对比系数可得:

v^x = \cos\theta, \quad v^y = \sin\theta

这通过矢量变换法则公式验证如下(其中 x^{\mu'} = \{x, y\}, x^\mu = \{r, \theta\}):

v^{\mu'} = \frac{\partial x^{\mu'}}{\partial x^\mu} v^\mu v^x = \frac{\partial x}{\partial r} v^r + \frac{\partial x}{\partial \theta} v^\theta = (\cos\theta)(1) + (-r\sin\theta)(0) = \cos\theta

结论:这展示了基矢量\partial_\mu)与分量v^\mu)变换行为相反(一为协变,一为逆变),从而保证总矢量 v 是一个几何不变量。

1.3 爱因斯坦求和约定 (Einstein Summation Convention)

在广义相对论中,公式往往涉及大量的多重求和。为了简化符号,爱因斯坦引入了一套省略求和号 \sum 的记法。这不仅仅是速记法,它更是张量代数的语法检查器,能直观反映方程的协变性(Covariance)。

1.3.1 核心定义与规则

定义 1.8 (指标分类): 在一个单项式(Term)中,任何一个指标(Index,如 \mu, \nu, \alpha)只可能属于以下两类之一:

  1. 哑指标 (Dummy Index)
    • 特征:在单项式中出现两次,且必须是一上一下
    • 语义:表示对该指标进行遍历求和。
    • 性质:可以用任意其他未占用的字母替换(如 \mu \to \sigma),不改变表达式的值(相当于局部变量重命名)。
  2. 自由指标 (Free Index)
    • 特征:在单项式中仅出现一次(通常)。
    • 语义:代表方程对该维度的每一个分量都成立。
    • 性质:在方程的所有项(左边和右边)中,自由指标必须名称相同、位置(上下)相同。

约定规则: 设维度为 n(GR 中 n=4,指标取 \{0, 1, 2, 3\})。若指标 \mu 在单项式中出现一次上标、一次下标,则:

A^\mu B_\mu \equiv \sum_{\mu=0}^{n-1} A^\mu B_\mu = A^0 B_0 + A^1 B_1 + \dots + A^{n-1} B_{n-1}

算法视角

  • 自由指标 \leftrightarrow 外层循环 / 数组索引
  • 哑指标 \leftrightarrow 内层循环 / 局部迭代变量

表达式 y^\mu = M^\mu_\nu x^\nu 等价于以下代码逻辑:

# n = 4 (Space-time dimensions)
y = [0.0] * 4  # Initialize output array

# Free index mu appears once on LHS, once on RHS -> Outer Loop
for mu in range(4):
    sum_val = 0.0
    # Dummy index nu appears twice (up/down) on RHS -> Inner Summation
    for nu in range(4):
        sum_val += M[mu][nu] * x[nu]
    y[mu] = sum_val

1.3.2 基础例题:线性代数操作

通过常见的矩阵运算来熟悉张量标记法。

例题 1:内积与矩阵乘法 假设 u, v 是矢量,A, B 是矩阵(二阶张量)。请用爱因斯坦约定表示以下运算:

  1. 向量内积 s = u \cdot v(注:需通过度规定义,暂假设欧氏空间或对偶配对)。
  2. 矩阵-向量乘法 w = Av
  3. 矩阵-矩阵乘法 C = AB
  4. 矩阵的迹 (Trace) t = \text{tr}(A)

解答

  1. 内积:即行向量乘列向量。 s = u_\mu v^\mu

    这里 \mu 是哑指标,结果 s 没有自由指标,是一个标量(0阶张量)。

  2. 矩阵-向量乘法w^\mu = A^\mu_\nu v^\nu
  3. 矩阵乘法C^\mu_\rho = A^\mu_\nu B^\nu_\rho
  4. :对角元之和。即令上标等于下标。 t = A^\mu_\mu

1.3.3 进阶例题:多重求和与指标代换

在推导场方程时,经常遇到多个张量相乘,此时必须小心管理指标名称(Scope Management)。

例题 2:二次型与嵌套定义 已知 y^\alpha = A^\alpha_\beta x^\betaz = \omega_\alpha y^\alpha。 请将 z 直接表示为关于 x 的表达式。

解答: 直接代入:

z = \omega_\alpha (A^\alpha_\beta x^\beta) = \omega_\alpha A^\alpha_\beta x^\beta

分析指标:

陷阱提示(Variable Shadowing): 如果你有两个方程 a^\mu = B^\mu_\nu b^\nuc^\mu = D^\mu_\nu d^\nu,想要相乘。 错误写法a^\mu c^\mu = B^\mu_\nu b^\nu D^\mu_\nu d^\nu

  • 错误 1\mu 在左边出现两次(同为上标),非法。
  • 错误 2\nu 在右边出现四次,语义不清。

正确写法(重命名哑指标)

a^\mu c^\rho = (B^\mu_\nu b^\nu) (D^\rho_\sigma d^\sigma) = B^\mu_\nu D^\rho_\sigma b^\nu d^\sigma
  • 在合并两个表达式时,必须确保各自的哑指标不冲突(就像在编程中不能在嵌套循环中使用相同的迭代变量名 i)。

1.3.4 合法性判断

这是学习 GR 初期的重要训练:判断一个表达式是否符合张量语法。

例题 3:以下表达式在爱因斯坦约定下是否合法?如果不合法,指出原因。 (设 T(2,0) 张量,S(1,1) 张量,v 为矢量)

  1. T^{\mu\nu} v_\nu = S^\mu_\nu v^\nu
  2. a = T^{\mu\mu}
  3. b_\mu = T^{\mu\nu} v_\mu v_\nu

解答

  1. 非法

    • 左边 (LHS):T^{\mu\nu} v_\nu\nu 缩并,自由指标是 \mu(上)。合法。
    • 右边 (RHS):S^\mu_\nu v^\nu\nu 缩并,自由指标是 \mu(上)。合法。
    • 左右对比:看起来自由指标都是 \mu。但是,仔细观察左边的求和项:T^{\mu\nu} v_\nu 中,\nu 一上一下。然而公式中的写法,在通常的几何意义下要求很严,但如果你指的是 v_\nu 是协变矢量,这是合法的。
    • 修正思考:如果是 T^{\mu\nu} v^\nu,则两个上标无法缩并(除非有度规参与)。如果是 v_\nu(已降标),则 T^{\mu\nu} v_\nu \to w^\mu
    • 结论语法上合法。LHS 和 RHS 都是含有一个上标自由指标 \mu 的矢量。
  2. 非法

    • 爱因斯坦求和必须是一上一下。如果想表达对角线求和,必须引入度规:g_{\mu\nu} T^{\mu\nu}。单纯的 T^{\mu\mu} 在不指定坐标系的情况下没有几何意义(不具备协变性)。
  3. 非法

    • 观察指标 \mu
    • 更深层错误:右边的 T^{\mu\dots} (上) 和 v_\mu (下) 看起来可以缩并,但如果缩并了,\mu 就变成了哑指标(消失),但左边 b_\mu 却还保留着 \mu 作为自由指标。逻辑矛盾。
  4. 合法

    • 这是张量分析中最标准的方程。
    • 自由指标\mu, \nu (均为下标)。
    • 第一项 R_{\mu\nu}:自由指标 \mu, \nu
    • 第二项 \frac{1}{2} g_{\mu\nu} RR 是标量(已完全缩并),g_{\mu\nu} 提供自由指标 \mu, \nu
    • 第三项 T_{\mu\nu}:自由指标 \mu, \nu
    • 每一项的自由指标结构完全一致。

1.4 对偶空间与余切矢量 (Dual Space & Cotangent Vectors)

在这一节中,我们将严格区分“矢量”和“梯度”这两个在欧几里得空间中经常混淆的概念,并引入 GR 描述物理场的关键接口——余切矢量。

在平直的欧几里得空间中,列向量 v 和行向量 v^T 看起来包含相同的数据(只是转置了一下),因此我们经常混用梯度向量 \nabla f 和位移向量 \vec{r}

但在流形上,它们是完全不同类型的数据对象,居住在完全不同的空间中,拥有不同的坐标变换法则。

1.4.1 几何直观:箭头 vs. 等高线

当我们将一个矢量(箭头)“射入”一个余切矢量(层叠面)时,箭头穿过的层数,就是两者缩并(Contraction)的结果数值。

1.4.2 形式化定义:线性泛函

定义 1.9 (对偶空间): 设 T_p\mathcal{M} 是点 p 处的切空间(向量空间)。定义其对偶空间 (Dual Space) T_p^*\mathcal{M} 为所有从 T_p\mathcal{M}\mathbb{R} 的线性映射(线性泛函)的集合。

\omega \in T_p^*\mathcal{M} \iff \omega: T_p\mathcal{M} \to \mathbb{R} \text{ 是线性的}

定义 1.10 (对偶基 / Dual Basis): 在坐标系 \{x^\mu\} 下,自然切基是 \{\mathbf{e}_\mu = \frac{\partial}{\partial x^\mu}\}。我们定义其对偶基 \{\theta^\nu = dx^\nu\} 满足如下正交归一条件:

dx^\nu \left( \frac{\partial}{\partial x^\mu} \right) = \delta^\nu_\mu

为什么记作 dx 在微积分中,dx 是一个无穷小量。但在流形几何中,dx^\mu 被严格定义为坐标函数 x^\mu 的梯度(即 dx^\mu 是一个“提取第 \mu 个分量”的机器)。

任意余切矢量 \omega 可在基底下展开为分量形式(注意下标):

\omega = \omega_\mu dx^\mu

1.4.3 核心原型:梯度 (The Gradient)

在 GR 中,标量场 f 的导数天然产生一个余切矢量,而不是切矢量。这一对象记为 df(微分/外导数)。

定理 1.2 (梯度的自然性): 设 f: \mathcal{M} \to \mathbb{R} 是光滑函数,沿着矢量 v 的方向导数定义为 v(f)。 我们可以构造一个线性映射 df,使得:

\langle df, v \rangle \equiv v(f)

利用链式法则展开 v(f) = v^\mu \frac{\partial f}{\partial x^\mu},根据线性性,我们可以读出 df 的分量:

df = \frac{\partial f}{\partial x^\mu} dx^\mu

这意味着梯度的分量是 \omega_\mu = \partial_\mu f

值得一提: 想求一个函数的梯度,本质上是求它相对于坐标网格变化率的线性组合。这是一个行向量操作,因为它等待与一个列向量(变化方向)相乘来产生标量(变化量)。

1.4.4 坐标变换法则 (Transformation Laws)

区分矢量和余切矢量最根本的方法是看它们在坐标变换下的表现。这类似于协变 (Covariant)逆变 (Contravariant) 类型检查。

设坐标系从 x 变换到 x',雅可比矩阵为 \Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu},其逆矩阵为 (\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}}

  1. 切矢量 (Contravariant / 上标): 矢量 v = v^\mu \partial_\mu 是客观存在的几何对象,其本体不变。当基底变换时,分量必须反向补偿。

    v'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\nu} v^\nu

    (分量随坐标“分子”变换)

  2. 余切矢量 (Covariant / 下标): 由链式法则 \frac{\partial f}{\partial x'^{\mu'}} = \frac{\partial f}{\partial x^\nu} \frac{\partial x^\nu}{\partial x'^{\mu'}} 可知:

    \omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu

    (分量随坐标“分母”变换,即逆雅可比矩阵)

口诀

  • 标(矢量):用向导数(新对旧 x'/x)。
  • 标(余切):用向导数(旧对新 x/x')。

1.4.5 例题讲解

例题 1:欧氏空间与极坐标变换

考虑二维平面上的点 p

  1. 直角坐标 x^\mu = (x, y)。有一常数余切矢量 \omega = 3dx + 4dy,即分量 \omega_\mu = (3, 4)
  2. 极坐标 x'^{\mu'} = (r, \theta),其中 x = r \cos\theta, y = r \sin\theta问题:求 \omega 在极坐标系下的分量 \omega'_{\mu'} = (\omega_r, \omega_\theta)

解答: 我们需要使用余切矢量的变换法则(下标法则):

\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu

我们需要计算逆雅可比矩阵 \frac{\partial(x, y)}{\partial(r, \theta)}

计算分量:

注意 \omega_\theta 的量纲带有一个长度 r。这说明余切矢量的分量物理量纲与矢量相反(为了乘积是标量)。在代码中,如果你直接把 (3,4) 赋给 (r, \theta) 分量是类型错误的。

例题 2:标量的不变性验证 (Invariant Check)

问题:验证 \omega(v) 的值与坐标系选择无关。 设矢量 v 在直角坐标系下为 v = v^x \partial_x + v^y \partial_y。在极坐标系下为 v' = v^r \partial_r + v^\theta \partial_\theta。 证明:\omega_\mu v^\mu = \omega'_{\mu'} v'^{\mu'}

证明: 从 RHS(右边)开始:

\text{RHS} = \omega'_{\mu'} v'^{\mu'}

代入变换公式:

  1. 余切矢量展开:\omega'_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu
  2. 切矢量展开:v'^{\mu'} = \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma

组合:

\text{RHS} = \left( \frac{\partial x^\nu}{\partial x'^{\mu'}} \omega_\nu \right) \left( \frac{\partial x'^{\mu'}}{\partial x^\sigma} v^\sigma \right)

这里对 \mu', \nu, \sigma 都有求和。利用导数的链式法则,注意 \mu' 是中间变量(哑指标):

\frac{\partial x^\nu}{\partial x'^{\mu'}} \frac{\partial x'^{\mu'}}{\partial x^\sigma} = \frac{\partial x^\nu}{\partial x^\sigma} = \delta^\nu_\sigma

(对同一个坐标系,坐标 x^\nux^\sigma 的偏导仅当 \nu=\sigma 时为 1,否则为 0)

于是:

\text{RHS} = \delta^\nu_\sigma \omega_\nu v^\sigma = \omega_\nu v^\nu = \text{LHS}

结论:缩并操作 \langle \omega, v \rangle 是一个标量(Scalar),它代表真实的物理量,不随我们观察的角度(坐标系)而改变。

例题 3:从度规推导对偶矢量

在闵可夫斯基时空(狭义相对论)中,度规 g_{\mu\nu} = \text{diag}(-1, 1, 1, 1)。 设四维速度矢量 u^\mu = (\gamma, \gamma v, 0, 0),其中 \gamma = 1/\sqrt{1-v^2}问题:求对应的余切矢量 u_\mu

解答: 这是利用度规进行降指 (Index Lowering) 的典型操作:

u_\mu = g_{\mu\nu} u^\nu

展开矩阵乘法:

结果:

u_\mu = (-\gamma, \gamma v, 0, 0)

注意:在 GR 中,矢量 u^\mu 和对应的 1-form u_\mu 在第 0 分量上符号相反。如果不区分上下指标,在计算模长 u^2 = u^\mu u_\mu 时就会得到错误的结果。

1.5 通用张量 (General Tensors)

张量是将标量、矢量和余切矢量推广到任意“秩(Rank)”的几何对象。它描述了不同几何实体之间的线性关系。

1.5.1 定义:多重线性映射

定义 1.11 ((k, l) 型张量): 在流形 \mathcal{M} 上的点 p,一个 (k, l) 型张量 T 是一个多重线性映射:

T: \underbrace{T_p^*\mathcal{M} \times \dots \times T_p^*\mathcal{M}}_{k \text{ 个 (输入 1-form)}} \times \underbrace{T_p\mathcal{M} \times \dots \times T_p\mathcal{M}}_{l \text{ 个 (输入 Vector)}} \to \mathbb{R}

类比:函数签名 一个 (1, 1) 张量可以看作一个函数,其强类型签名为: double tensor_mapping(CotangentVector omega, TangentVector v)

  • 输入:需要 k 个行向量(用来与上指标缩并)和 l 个列向量(用来与下指标缩并)。
  • 输出:当你把所有“槽位(Slots)”填满后,它返回一个不变量(标量)。

1.5.2 张量积与分量表示

我们需要一种“胶水”来将低阶对象组合成高阶张量。

定义 1.12 (张量积 / Tensor Product \otimes): 设 S(k, l) 型张量,R(m, n) 型张量。它们的张量积 S \otimes R 是一个 (k+m, l+n) 型张量,其定义为:

(S \otimes R)(\omega_1, \dots, \omega_{k+m}, v_1, \dots, v_{l+n}) \equiv S(\omega_1, \dots, \omega_k, v_1, \dots, v_l) \cdot R(\omega_{k+1}, \dots, v_{l+1}, \dots)

即:输入参数被分发给 SR,结果相乘。

定理 1.3 (基底展开): 利用张量积,我们可以构建张量空间的基底。任意 (k, l) 张量 T 可在坐标基 \{ \partial_\mu \}\{ dx^\nu \} 下唯一展开:

T = T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l} \, (\partial_{\mu_1} \otimes \dots \otimes \partial_{\mu_k}) \otimes (dx^{\nu_1} \otimes \dots \otimes dx^{\nu_l})

其中,T^{\mu_1 \dots \mu_k}_{\nu_1 \dots \nu_l}n^{k+l} 个实数组成的分量数组

1.5.3 坐标变换法则 (The Supreme Law)

判断一个多维数组是否是“物理张量”的唯一标准,是看它是否遵循以下变换规律。这是 GR 中所有物理定律必须满足的类型安全检查

设坐标变换 x \to x',雅可比矩阵为 \Lambda^{\mu'}_{\nu} = \frac{\partial x'^{\mu'}}{\partial x^\nu},逆雅可比矩阵为 (\Lambda^{-1})^\nu_{\mu'} = \frac{\partial x^\nu}{\partial x'^{\mu'}}

张量分量变换法则: 对于 (k, l) 张量,其新坐标下的分量 T'^{\mu'_1 \dots}_{\nu'_1 \dots} 为:

T'^{\mu'_1 \dots \mu'_k}_{\nu'_1 \dots \nu'_l} = \underbrace{\frac{\partial x'^{\mu'_1}}{\partial x^{\rho_1}} \dots \frac{\partial x'^{\mu'_k}}{\partial x^{\rho_k}}}_{\text{针对 } k \text{ 个上指标}} \cdot \underbrace{\frac{\partial x^{\sigma_1}}{\partial x'^{\nu'_1}} \dots \frac{\partial x^{\sigma_l}}{\partial x'^{\nu'_l}}}_{\text{针对 } l \text{ 个下指标}} \cdot T^{\rho_1 \dots \rho_k}_{\sigma_1 \dots \sigma_l}

规则总结

  1. 每个指标(逆变)“携带”一个 \frac{\partial x'}{\partial x} (分子是新坐标)。
  2. 每个指标(协变)“携带”一个 \frac{\partial x}{\partial x'} (分母是新坐标)。
  3. 所有旧指标 (\rho, \sigma) 都是哑指标,进行求和。

1.5.4 关键操作:缩并 (Contraction)

缩并是降低张量秩(Rank)的唯一内部操作(无需引入外部度规)。

定义 1.13 (缩并): 设 T(k, l) 型张量(k,l \ge 1)。令其第 i 个上指标与第 j 个下指标相等(求和)。 这将产生一个新的 (k-1, l-1) 型张量。

例如,对于 (1, 1) 张量 T^\mu_\nu,缩并得到标量(迹):

S = \text{tr}(T) = T^\mu_\mu = \sum_{\mu=0}^{n-1} T^\mu_\mu

定理 1.4 (缩并的几何意义): 在张量作为映射的视角下,T(\omega, v) 本质上就是张量 T 与输入 v, \omega缩并

T(\omega, v) \iff T^\mu_\nu \omega_\mu v^\nu

这里的“填槽”过程,实际上就是把输入的自由指标与张量的对应指标变为哑指标并求和。

1.5.5 例题讲解

例题 1:类型推断与对象识别

问题: 在广义相对论中,判断以下对象的张量类型 (k, l)

  1. 度规张量 g_{\mu\nu}
  2. 逆度规 g^{\mu\nu}
  3. 克里斯托费尔符号 \Gamma^\lambda_{\mu\nu}
  4. 里奇曲率张量 R_{\mu\nu}
  5. 黎曼曲率张量 R^\rho_{\sigma\mu\nu}

解答

  1. (0, 2) 张量。它接受两个矢量 u, v,输出内积 g(u,v) \in \mathbb{R}
  2. (2, 0) 张量。它本质上是两个余切矢量的内积映射。
  3. 不是张量\Gamma^\lambda_{\mu\nu} 在坐标变换时包含二阶导数项 \frac{\partial^2 x}{\partial x'^2},破坏了线性变换规律(它是仿射联络系数,而非张量)。
  4. (0, 2) 张量。是 (1,3) 黎曼张量的缩并结果(缩并了一个上标和一个下标,秩减2)。
  5. (1, 3) 张量。虽然它有4个指标,但标准定义是接受1个 1-form 和 3个矢量。

例题 2:张量积与运算逻辑

问题: 设矢量 u^\mu = (1, 0),1-form \omega_\nu = (1, 3)(在二维平面)。 定义 (1, 1) 张量 T = u \otimes \omega

  1. 写出 T 的分量矩阵 T^\mu_\nu
  2. 计算 T 对矢量 v^\nu = (2, 1) 的作用结果。

解答

  1. 计算分量: 根据张量积定义:T^\mu_\nu = u^\mu \omega_\nu

    T = \begin{pmatrix} u^0 \\ u^1 \end{pmatrix} \begin{pmatrix} \omega_0 & \omega_1 \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \end{pmatrix} \begin{pmatrix} 1 & 3 \end{pmatrix} = \begin{pmatrix} 1\cdot 1 & 1\cdot 3 \\ 0\cdot 1 & 0\cdot 3 \end{pmatrix} = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix}

    注意:在习惯上,第一个指标 \mu (Row) 代表行索引,第二个指标 \nu (Col) 代表列索引。

  2. 作用于矢量 v: 这是张量缩并 w^\mu = T^\mu_\nu v^\nu(矩阵乘法):

    w = \begin{pmatrix} 1 & 3 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} 2 + 3 \\ 0 + 0 \end{pmatrix} = \begin{pmatrix} 5 \\ 0 \end{pmatrix}

    验证T(v) = (u \otimes \omega)(v) = u \cdot [\omega(v)] = u \cdot [\omega_\nu v^\nu] = u \cdot (1\cdot 2 + 3\cdot 1) = 5u = (5, 0)。结果一致。

例题 3:商定理 (Quotient Theorem) 的应用

问题: 假如有一个多维数组 X^{\mu\nu},我们不确定它是不是张量。 已知对于任意的协变矢量(1-form) a_\mub_\nu,缩并结果 S = X^{\mu\nu} a_\mu b_\nu 在任何坐标系下都是一个标量(即 S' = S)。 证明:X^{\mu\nu} 必须是一个 (2, 0) 型张量。

证明思路: 这是一个非常重要的判定定理,称为商定理:如果一个对象被张量“除”(缩并)后得到张量,那它本身就是张量。

  1. 根据题意:X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} a_\mu b_\nu (标量不变)。
  2. 我们将 a', b' 变换回旧坐标系: a_\mu = \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha b_\nu = \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta
  3. 代入 RHS: X'^{\alpha\beta} a'_\alpha b'_\beta = X^{\mu\nu} \left( \frac{\partial x'^\alpha}{\partial x^\mu} a'_\alpha \right) \left( \frac{\partial x'^\beta}{\partial x^\nu} b'_\beta \right)
  4. 整理项: \left( X'^{\alpha\beta} - \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu} \right) a'_\alpha b'_\beta = 0
  5. 由于 a', b'任意矢量,若要上式恒成立,括号内的部分必须为 0(线性代数基本性质)。
  6. 因此:X'^{\alpha\beta} = \frac{\partial x'^\alpha}{\partial x^\mu} \frac{\partial x'^\beta}{\partial x^\nu} X^{\mu\nu}。 这正是 (2, 0) 张量的变换法则。得证

1.6 度规张量 (The Metric Tensor)

1.6.1 定义:广义内积

在抽象向量空间中,内积是一个双线性映射。在微分几何中,我们要求这个映射在每一点都是光滑变化的。可以将度规张量理解为定义在流形上的 内积 API。一旦你给流形装备了这个 API,流形就升级为了黎曼流形(或伪黎曼流形),此时我们才能计算长度、角度,并定义因果结构。

定义 1.14 (度规张量): 度规 g 是一个光滑的 (0, 2) 型张量场。在流形上的任意点 p,它接受两个切矢量 u, v \in T_p\mathcal{M},并输出一个实数(标量积):

g_p(u, v) \in \mathbb{R}

它必须满足两个公理:

  1. 对称性 (Symmetry) g(u, v) = g(v, u) \iff g_{\mu\nu} = g_{\nu\mu}

    这保证了 AB 的“距离”等于 BA 的距离。

  2. 非退化性 (Non-degeneracy): 若对于所有的 v,都有 g(u, v) = 0,则必须有 u=0。 这等价于度规矩阵的行列式不为零:\det(g_{\mu\nu}) \neq 0

1.6.2 线元 (The Line Element)

物理文献中极少直接写出 g_{\mu\nu} 矩阵,而是通过线元 ds^2 来定义度规。线元描述了无穷小位移矢量 d\mathbf{x} = dx^\mu \partial_\mu 的自内积(即模长的平方)。

ds^2 = \mathbf{g}(d\mathbf{x}, d\mathbf{x}) = g_{\mu\nu} dx^\mu dx^\nu

二次型视角

$g_{\mu\nu}$ 是一个存储几何权重的 $4 \times 4$ 对称矩阵。$dx^\mu$ 是输入的差分向量。 $$ \text{Cost} = [dx^0, \dots, dx^3] \times [G] \times [dx^0, \dots, dx^3]^T $$

1.6.3 符号差与因果结构 (The Signature & Causality)

度规的符号差 (Signature) 决定了流形的物理性质。 将 g_{\mu\nu} 对角化后,对角线上正负号的个数称为符号差。

  1. 黎曼度规 (Euclidean/Riemannian)
    • 签名:(+, +, +, +)
    • 性质:ds^2 = 0 \iff dx = 0。即只要动了,距离就是正的。
    • 用途:普通几何空间。
  2. 洛伦兹度规 (Lorentzian) —— 广义相对论使用此定义
    • 签名:(-, +, +, +)(+, -, -, -)(文献中称为 "East Coast" 或 "West Coast" 惯例,本文采用 -+++)。
    • 关键性质:即使 dx \neq 0,也可以有 ds^2 = 0
    • 因果分类:对于切矢量 v

1.6.4 音乐同构:升降指标 (Musical Isomorphisms)

度规张量提供了一种“自然”的方式将切空间 T_p\mathcal{M} 和对偶空间 T_p^*\mathcal{M} 粘合起来。

定义 1.15 (降指 / Lowering Indices - \flat): 给定矢量 v^\mu,通过与度规的部分缩并,生成一个余切矢量 v_\mu

v_\mu \equiv g_{\mu\nu} v^\nu

在矩阵视角下,这等价于:行向量 = 矩阵 \times 列向量

定义 1.16 (逆度规与升指 / Raising Indices - \sharp): 度规矩阵的逆矩阵记为 g^{\mu\nu}(注意双上标),满足:

g^{\mu\rho} g_{\rho\nu} = \delta^\mu_\nu

利用它将余切矢量转换回矢量:

v^\mu \equiv g^{\mu\nu} v_\nu

值得一提: 在欧氏空间(笛卡尔坐标),g = I(单位阵),所以 v^\muv_\mu 数值相同。 但在弯曲时空或闵可夫斯基时空中,分量的数值甚至符号都会改变!混淆上下标会导致致命的物理错误

1.6.5 例题讲解

例题 1:从线元读取度规分量

问题: 考虑三维球坐标空间,其线元公式为:

ds^2 = dr^2 + r^2 d\theta^2 + r^2 \sin^2\theta \, d\phi^2
  1. 写出对应的坐标系 \{x^\mu\}
  2. 写出度规张量 g_{\mu\nu} 的矩阵形式。
  3. 写出逆度规张量 g^{\mu\nu} 的矩阵形式。

解答

  1. 坐标系 x^1 = r, x^2 = \theta, x^3 = \phi
  2. 观察 ds^2 = g_{11}(dr)^2 + g_{22}(d\theta)^2 + g_{33}(d\phi)^2。由于没有交叉项(如 dr d\theta),非对角元为 0。 [g_{\mu\nu}] = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^2 & 0 \\ 0 & r^2 \sin^2\theta \end{pmatrix}
  3. 由于矩阵是对角阵,其逆矩阵就是对角线元素取倒数: [g^{\mu\nu}] = \begin{pmatrix} 1 & 0 & 0 \\ 0 & r^{-2} & 0 \\ 0 & (r \sin\theta)^{-2} \end{pmatrix}

    检验g^{\mu\nu} g_{\nu\lambda} = \delta^\mu_\lambda。例如 \mu=2, \lambda=2: r^{-2} \cdot r^2 = 1

例题 2:指标升降与符号陷阱

问题: 在狭义相对论(平直闵可夫斯基时空)中,使用 (-+++) 度规:

g_{\mu\nu} = \text{diag}(-1, 1, 1, 1)

给定一个四维动量矢量 P^\mu = (E, p_x, p_y, p_z)(这里设 c=1)。

  1. 计算协变矢量 P_\mu
  2. 计算模长平方 P^2 = P^\mu P_\mu
  3. 对于光子 (m=0),这意味着什么?

解答

  1. 降指

    P_0 = g_{00} P^0 = (-1) \cdot E = -E P_1 = g_{11} P^1 = (1) \cdot p_x = p_x

    ... 所以:P_\mu = (-E, p_x, p_y, p_z) 注意时间分量反号了!

  2. 计算模长

    P^2 = P^\mu P_\mu = P^0 P_0 + P^i P_i = E(-E) + (p_x^2 + p_y^2 + p_z^2) = -E^2 + |\vec{p}|^2
  3. 物理诠释: 在相对论力学中,P^2 = -m^2(静质量平方的负数,取决于定义)。 对于光子,m=0。所以 P^2 = 0。 这意味着 -E^2 + |\vec{p}|^2 = 0 \implies E = |\vec{p}|几何结论:光子的动量矢量在四维时空中是非零矢量,但其“长度”(自内积)为零。这是一个零矢量 (Null Vector)

例题 3:非对角度规与混合索引

问题: 考虑一个二维“旋转”坐标系(如克尔黑洞的赤道面简化版),线元包含交叉项:

ds^2 = -dt^2 + 2 dt d\phi + dr^2

坐标为 (t, \phi, r)

  1. 写出矩阵 g_{\mu\nu}
  2. 计算行列式 \det(g),检查其是否退化。
  3. 求逆度规 g^{\mu\nu} 中的 g^{tt} 分量。

解答

  1. 识别分量

    矩阵形式(顺序 t, \phi, r):

    g = \begin{pmatrix} -1 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}
  2. 计算行列式: 这是块对角矩阵。右上角是 \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix},右下角是 1

    \det(g) = [(-1)(0) - (1)(1)] \times 1 = -1 \neq 0

    度规非退化,是个合法的洛伦兹度规。

  3. 求逆度规: 需要求该矩阵的逆。重点关注左上 2\times 2A = \begin{pmatrix} -1 & 1 \\ 1 & 0 \end{pmatrix}

    A^{-1} = \frac{1}{\det(A)} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \frac{1}{-1} \begin{pmatrix} 0 & -1 \\ -1 & -1 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 1 & 1 \end{pmatrix}

    即:

    g^{\mu\nu} = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

    结果分析:虽然 g_{tt} = -1,但逆矩阵分量 g^{tt} = 0!这再次强调了 g^{\mu\nu} 不是简单地对 g_{\mu\nu} 每个元素取倒数,而是矩阵求逆的操作。