高显——经典力学阅读 1 : 最小作用量原理

· · 个人记录

1. 最小作用量原理

1.1 拉格朗日方程的推导

我们将使用变分法从最小作用量原理推导出拉格朗日方程

我们有:

S=\int_{t_1}^{t_2}L(q,\dot{q},t)\text{d}t \tag{1.1}

其中 S 是作用量,L 是拉格朗日函数。q\dot q 分别是广义坐标和广义速度。St_1t_2 的积分,指示了这是一个过程。

真实情况下的所有变化路径必须满足最小作用量原理,也就是使 S 最小。也就是 q\dot q 的变化情况也收到最小作用量原理的支配。

我们先暂且不管 L 具体是什么,相应的,我们更关心如何从最小作用量原理推导出 Lq\dot q 的关系。

如果我们已经找到了匹配的一组 Lq,\dot q , 那么对这个路径的任意变化都会使得 S 变大。

我们有:

Q(t)=q(t)+\alpha \eta (t) \tag{1.2}

由于我们只是改变了变化的路径,起始点和终止点的系统状态是不变的。

故有:

\eta(t_1)=\eta(t_2)=0 \tag{1.3}

我们将 (1.2) 代入 (1.3):

S'=\int_{t_1}^{t_2}L(Q,\dot Q,t) \text{d}t \tag{1.4}

我们希望,当 \alpha=0 时, S' 取到最小值。

也就是说,当 \alpha=0 时:

\frac{\text{d}S'}{\text{d}\alpha}=0 \tag{1.5}

展开 (1.5):

\frac{\text{d}S'}{\text{d}\alpha}= \int_{t_1}^{t_2} (\frac{\partial L}{\partial Q}\frac{\partial Q}{\partial \alpha}+\frac{\partial L}{\partial \dot Q}\frac{\partial \dot Q}{\partial \alpha}+\frac{\partial L}{\partial t}\frac{\partial t}{\partial \alpha}) \text{d}t

注意到 :

\frac{\partial t}{\partial \alpha}=0 Q=q (\alpha=0) \dot Q=\dot q(\alpha=0)

故:

\frac{\text{d}S'}{\text{d}\alpha}=\int_{t_1}^{t_2} (\frac{\partial L}{\partial q}\eta+\frac{\partial L}{\partial \dot q} \dot \eta) \text{d}t \tag{1.6}

注意到其中还有一个任意项 \eta(t), 我们希望能将其提出来。

而分部积分法告诉我们:

\int u \text{d}v+\int v \text{d}u=uv

看似没有公因式可以提取,但是如果 uv 在积分后恰好变成 0 了呢?别忘了我们有 (1.3)

使用分部积分法,有:

\int \frac{\partial L}{\partial \dot q} \text{d}\eta +\int \eta \text{d}(\frac{\partial L}{\partial \dot q})=\eta \frac{\partial L}{\partial \dot q}

进一步的:

\int_{t_1}^{t_2} \frac{\partial L}{\partial \dot q} \dot \eta \text{d}t +\int_{t_1}^{t_2} \eta \frac{\text{d}}{\text{d}t}(\frac{\partial L}{\partial \dot q}) \text{d}t=[\eta \frac{\partial L}{\partial \dot q}] \bigg |_{t_1}^{t_2}=\eta(t_2)-\eta(t_1)=0 \tag{1.7}

于是我们现在可以开开心心的将 (1.7) 代入 (1.6)

\frac{\text{d}S'}{\text{d}\alpha}=\int_{t_1}^{t_2} (\frac{\partial L}{\partial q}-\frac{\text{d}}{\text{d}t}\frac{\partial L}{\partial \dot q})\eta \text{d}t=0

又因为 \eta(t) 是一个任意的函数,我们有:

\frac{\partial L}{\partial q}-\frac{\text d}{\text{d}t} \frac{\partial L}{ \partial \dot q}=0 \tag{1.8}

这就是拉格朗日方程,有时候我们也会称呼他为运动方程。

这样一个不起眼的微分方程,就建立了我们对系统描述的广义坐标与拉格朗日函数之间的关系。

值得注意的是,拉格朗日方程的推导并未涉及到任何物理过程,这暗示了拉格朗日方程的适用范围可以很广,而不仅拘泥于力学领域。

1.2 广义动量

我们给出动量的一般定义:

p_a=\frac{\partial L}{\partial \dot q^a}=\frac{\partial L}{\partial v^a}, \ \ a=1,2,...s \tag{1.9}

我们约定将广义速度 \dot q^a 的指标放在上面,广义动量 p_a 的指标放在下方。

简单而言,一个广义坐标就会(在 L 的意义下)对应一个广义动量。

我们由 (1.9)(1.8) 可得。

\frac{\text{d} p_a}{\text{d}t}=\frac{\partial L}{\partial q^a} \tag{1.10}

这个方程可以和牛顿第二定律对照,右边可以称为广义力。

1.3 单个质点作用量

1.3.1 四维形式

考虑时空坐标:

\{ x^\mu \}= \{ x^0,x^1,x^2,x^3 \}= \{ct,x,y,z \}, \mu=0,1,2,3

我们考虑时空背景为闵氏时空,在洛伦兹变换 x^\mu \rightarrow \tilde x^\mu= \bigwedge^u _v x^v 下,作用量 S 为洛伦兹标量。

质点位于时空中的轨迹是一个实体,其本身内蕴的性质——长度与我们的观测则所在参考系无关,即闵氏时空中的线元。

\text{d} s^2= \eta _{uv} \text{d}x^u \text{d}x^v \tag{1.11}

其中 \eta_{uv} 为闵氏度规,即:

\eta_{uv} =\left(\begin{array}{cccc}-1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\\end{array}\right) \tag{1.12}

故而有质量质点的线元恒为负(即质点速度不能超过光速)

故而我们可以简单的取作用量:

S=-mc \int |\text{d}s| \tag{1.13}

由于我们要 S 最小描述真实运动,如果不在外面加上负号,则物体速度趋近光速可使得 S 最小,这显然不符合真实情况。而因子 mc 是为了使得 S 有 [空间] * [动量] 的正确量纲。

考虑在空间上跟着质点的参考系将世界线参数化:

\text{d}s^2=\eta_{u v} \text{d}x^u \text{d}x^v =-c^2 \text{d} \tau^2 \tag{1.14}

进一步我们可以写出:

\eta_{uv} \frac{\text{d}x^u}{\text{d} \tau} \frac{\text{d}x^v}{\text{d}\tau}=-c^2 \tag{1.15}

即在任意参考系下,上式的值不会变,据此我们考虑定义 4-速度为:

w^u=\frac{\text{d}x^u}{\text{d}\tau} \tag{1.16}

这样定义的好处就在于,根据我们现在所用时空是闵氏时空,其内积将被定义为:

w^u w_u=\eta_{uv} \frac{\text{d}x^u}{\text{d} \tau} \frac{\text{d}x^v}{\text{d}\tau}=-c^2 \tag{1.17}

为一个在洛伦兹变换下不变的值。

时刻不要忘记 \eta 矩阵的特殊性质,以及爱因斯坦求和标记的含义,这些可以帮助我们化简一些本来复杂的表达式。

接下来,考虑对 S 取变分(这里要用到复合函数的变分规则),注意到:

\delta S=-mc \int \delta \sqrt{-\eta_{uv}\text{d}x^u \text{d}x^v} =-mc \int \text{d}\tau \delta \sqrt{-\eta_{uv} \frac{\text{d}x^u}{\text{d} \tau} \frac{\text{d}x^v}{\text{d}\tau}} =-mc \int \text{d}\tau \frac{1}{2 \sqrt{-\eta_{uv} \frac{\text{d}x^u}{\text{d}\tau} \frac{\text{d}x^v}{\text{d} \tau}}}[-\eta_{uv}((\delta \frac{\text{d}x^u}{\text{d} \tau})\frac{\text{d}x^v}{\text{d}\tau}+\frac{\text{d} x^u}{\text{d} \tau} (\delta \frac{\text{d} x^v}{\text{d} \tau}))]

考虑到根号里面其实包括了所有 u,v=0,1,2,3 的情况,再由 (1.15):

=mc \int \text{d} \tau \frac{1}{2c}[\eta_{uv}((\delta \frac{\text{d}x^u}{\text{d} \tau})\frac{\text{d}x^v}{\text{d}\tau}+\frac{\text{d} x^u}{\text{d} \tau} (\delta \frac{\text{d} x^v}{\text{d} \tau}))]

再考虑 \eta_{uv} 矩阵中为 0 的部分:

=m \int \text{d} \tau \eta_{uv}(\delta\frac{\text{d} x^u}{\text{d} \tau})\frac{\text{d} x^v}{\text{d} \tau} =m \int \text{d} \tau \eta_{uv} \frac{\text{d}^2 x^v}{\text{d} \tau^2} \delta x^u

由于变分的任意性,我们有运动方程:

\frac{\text{d}^2 x^u}{\text{d} \tau ^2}=0 \tag{1.18}

可以给出方程的解: x^u=a^u \tau +b ,其是时空中的一条直线。

然后我们现在考虑 4-动量,多次运用 (1.17):

p_u =\frac{\partial L}{\partial w^u}=\frac{\partial}{\partial w^u}(-mc \sqrt{-\eta_{\rho \sigma} w^\rho w^\sigma}) =\frac{\partial}{\partial w^u}(-mc^2) =\frac{\partial}{\partial w^u}(m w^u w_u) =mw_u \tag{1.19}

再由 (1.18)

\frac{\text{d} p_u}{\text{d} \tau}=0 \tag{1.20}

因此在闵氏时空中自由粒子的 4-动量守恒。

1.3.2 三维形式

下面我们接着来考虑三维形式。注意到4-速度是根据固有时给出,其内积理所当然的是 -c^2 (回忆固有时其实就是以物体自身为系下得速度,再根据闵氏几何得距离计算得出)。而我们接下来要考虑得三维形式,无非就是以参考系本身的时间 t 为基准来描绘物理的运动。

故而我们希望将作用量写成 S = \int \text{d}t L 的形式,注意到闵氏几何的空间部分和欧氏几何相同:

S = -mc \int \sqrt {c^2 (\text{d}t)^2 - \delta_{ij} \text{d}x^i \text{d}x^j} = -mc^2 \int \sqrt{1 - \frac{1}{c^2} \delta_{ij} \frac{\text{d}x^i}{\text{d}t} \frac{\text{d}x^j}{\text{d}t}} \tag{1.21}

其中 \delta_{ij} 是克罗地亚记号:

\delta_{uv} =\left(\begin{array}{cccc} 1 & 0 & 0 \\ 0 & 1 & 0 \\0 & 0 & 1 \\\end{array}\right) \tag{1.22}

故而我们定义 3-速度:

v^i = \frac{\text{d}x^i}{\text{d} t} , i = 1,2,3 \tag{1.23}

那么对于 (1.21) 我们就可以简写成:

S = \int \text{d}t L , L = -mc^2 \sqrt{1- \frac{\bm{v^2}}{c^2}} \tag{1.24}

回忆:

S = \int \text{d} \tau (-mc) \sqrt{-\eta_{uv}w^u w^v}

考虑带入 (1.15):

=\int \text{d} \tau (-mc^2) \tag{1.25}

考虑 (1.24) , (1.25) 我们就得到著名的洛伦兹因子:

\frac{\text{d} t}{\text{d} \tau}=\frac{1}{\sqrt{1-\frac{v^2}{c^2}}}=\gamma \tag{1.26}

然后我们接着考虑 3- 动量:

p_i = \frac{\partial L}{\partial v^i}=\frac{mv_i}{\sqrt{1-\frac{\bm{v^2}}{c^2}}} \tag{1.27}

然后我们利用 (1.26) 以及 (1.23),可以变形为:

p_i = m \frac{\text{d} x^i}{\text{d} t} \frac{\text{d} t}{\text{d} \tau}=mw_i \tag{1.28}

这是个很好看的结果,这同时告诉我们,3-动量的大小取决于空间坐标相对固有时 \tau 的变化率 (也就是 4-速度的几个空间分量),同时 3-动量的大小也就是 4-动量的几个空间分量!

对于时间分量,定义 :

E=cp^0=mcw^0=mc\frac{\text{d}(ct)}{\text{d} t} \frac{\text{d} t}{\text{d} \tau}=mc^2 \gamma \tag{1.29}

然后我们考虑向量 4-动量在闵氏时空意义下的模平方 :

p_u p^u=-(p^0)^2 + \delta_{ij} p^i p^j = - \frac{E^2}{c^2} + \bm{p^2} \tag {1.30}

这里 \bm{p^2}=\delta_{ij} p^i p^j,我们再考虑 (1.19), (1.17):

p_u p^u = m^2 w_u w^u =-m^2c^2 \tag{1.31}

于是我们推出 爱因斯坦能量-动量关系:

E^2=m^2c^4+\bm{p^2}c^2 \tag{1.32}

等等,为什么 4-动量的时间分量乘上 c 会被视为能量?一个很重要的原因在于其可以保证四维动量矢量在洛伦兹变换下保持协变性,即能量和3-动量之间的关系不会因为参考系的选择而改变。

同时,我们前面也已经顺便定义了在参考系给定下的 \bm v\bm p, 他们均只关注到空间三个维度的情况。

1.3.3 非相对论极限情形

我们接下来考虑非相对论极限的情形:

\frac{|\bm v|}{c} \ll 1 \tag{1.33}

然后对 E 做小量展开:

E=mc^2 (1-\frac{\bm v^2}{c^2})^{-\frac{1}{2}}=mc^2+\frac{1}{2}m\bm v^2 + \frac{3}{8} m \frac{\bm v^4}{c^2}... \tag{1.34}

其中第一项可以看作当粒子相对于参考系静止下的能量,这也是著名的爱因斯坦质能等价关系:

E_0= mc^2 \tag{1.35}

速度的领头项也恰好是我们牛顿力学中熟知的粒子动能,更高项则可以考虑为相对论的修正。

1.4 外场中的粒子

1.4.1 标量场

我们先来考虑标量场,即在场中作用量的形式为:

S=\int \text{d}\tau (-mc)e^{\Phi}\sqrt{-w_u w^u} \tag{1.36}

其中:

L=-mc e^{\Phi} \sqrt{-w_u w^u} , S=\int \text{d} \tau L \tag{1.37} \Phi=\Phi(x_u) \tag{1.38}

由于我的变分还不是很熟练,这里我们考虑直接使用欧拉-拉格朗日方程:

考虑到 w_u 实际上与坐标 x_u 在形式上独立:

\frac{\partial L}{\partial x^u}=\frac{\partial}{\partial x^u}(me^{\Phi}w_uw^u) \tag{1.39}=-mc^2e^{\Phi} \frac{\partial \Phi}{\partial x^u} \frac{\partial L}{\partial w^u}=\frac{\partial}{\partial w^u}(m(w^u w_u)e^{\Phi})=mw_u e^{\Phi} \tag{1.40}

然后:

\frac{\text{d}}{\text{d}\tau}(\frac{\partial L}{\partial w^u})=\frac{\text{d}}{\text{d}\tau}(mw_ue^{\Phi}) =m (\frac{\text{d}^2 x_u}{\text{d} \tau^2}e^{\Phi}+\frac{\text{d} x_u}{\text{d} \tau} e^{\Phi}(\frac{\partial \Phi}{\partial x_v} \frac{\partial x_v}{\text{d} \tau})) \tag{1.41}

把这些结果代入:

\frac{\text{d}^2 x_u}{\text{d} \tau^2}+ \frac{\partial \Phi}{\partial x_v} \frac{\partial x_v}{\text{d} \tau} \frac{\text{d} x_u}{\text{d} \tau}+c^2 \frac{\partial \Phi}{\partial x^u}=0 \tag{1.42}