四平方和问题与 Theta 级数

NaCly_Fish · 2026-06-05 20:48:32 · 算法·理论

第一期：因子和函数卷积恒等式
第二期：Ramanujan Tau 函数的积性
第三期：模形式的空间结构

现在我们来讨论一下四平方和问题，用一些初等方法也能推导出答案，不过我们要用模形式方法找到其背后更一般的性质。我们在全模群上学习过一些基础知识，而对同余子群几乎一无所知，现在我们尝试推广。

对 q = \text e^{2\pi \text i z}，设 theta 级数：

\theta(z):=\sum_{n \in \Z} q^{n^2}=1+2q+2q^4+\cdots

那么我们想要对正整数 n 快速计算 [q^n]\theta(z)^4。首先，我们显然有 \theta(z)=\theta(z+1)，也不难判断 \theta(z) 在 \mathcal H 上解析，那么是否有 \theta(-1/z)=z^k \theta(z) 呢？若可以，就能用熟悉的方法研究它了。
坏消息：并没有这样的性质；好消息：仍然有类似的变换。

\sqrt {\frac{2z}{\text i}}\theta(z)=\theta\left( -\frac{1}{4z}\right) \quad \texttt{(1)}

:::info[\theta(z) 的模变换推导]

我们知道 Poisson 求和公式（弱化版）如下：

对于平方可积的光滑函数 f:\R \to \mathbb C 则：
\sum_{n \in \Z}f(n)=\sum_{n \in \Z} \tilde f(n) \tilde f(y):=\int_{-\infty}^\infty f(x) \text e^{2\pi\text i yx}\text dx

弱化版的证明是很简单的，在此略过。对 \theta(z) 使用此公式就能得到相应的变换。具体地设 f(x)=\text e^{-\pi t x^2}，其中 t >0。则我们可以直接计算 \tilde f (y)：

\tilde f(y)=\int_{-\infty}^\infty \text e^{2\pi \text i yx-\pi t x^2} \text dx=\frac{\text e^{-\pi y^2/t}}{\sqrt t}\int_{-\infty}^\infty \text e^{-\pi u^2}\text du=\frac{\text e^{-\pi y^2/t}}{\sqrt t}

第二步做了换元：u=\sqrt t (x - \text i y/t)，最后的积分就是经典结论了。由此可知

\sum_{n \in \Z}\text e^{-\pi t n^2}=\frac{1}{\sqrt t}\sum_{n \in \Z}\text e^{-\pi n^2/t}

容易发现，左式就是 \theta(\text i t/2)，由此可得 \theta(\text it/2)=\theta(\text i/(2t))/\sqrt t，这证明了 z=\text i t 在正虚轴的情形，这就足够了。因为解析延拓的唯一性告诉我们，两个在开域 D 上解析函数在一条线段上相等时，它们必然在 D 上相等。稍作整理即得 \texttt{(1)} 式。

:::

这里开平方不会有支割线的问题，因为 2z/\text i 的辐角范围只有 \pi。这个 \texttt{(1)} 的变换让我们觉得 \theta(z) 像是 \varGamma_1 某个子群上权为 1/2 的模形式。暂时先不讨论非整数权的问题，直接来看 \theta(z)^4 的情况，性质会好一些。这里设 f_k(z)=\theta(z)^k：

f_4(z)=-\frac{1}{4z^2}f_4\left( -\frac{1}{4z}\right) \quad \texttt{(2)}

在以往 S,T 变换的基础上，我们再定义 W_n:=\frac{1}{\sqrt n}\begin{pmatrix}0 & -1 \\ n & 0\end{pmatrix}。之前对群作用性质的证明，推广到 \operatorname{SL}(2,\R) 的任意子群也是成立的。显然 W_4(z)=-1/(4z)，故

\tilde T(z) :=(W_4^{-1} T^{-1}W_4)(z)= \begin{pmatrix}1 & 0 \\ 4 & 1 \end{pmatrix} (z)=\frac{z}{4z+1}

所以给 \texttt{(2)} 式先做变换 z \mapsto z-1，再做 z \mapsto -1/(4z)，就会得到

f_4(z)=(4z+1)^{-2}f_4 \left( \frac{z}{4z+1}\right) \quad \texttt{(3)}

现在我们有两个矩阵 T,\tilde T \in \varGamma_1，它们都能使 f_4(z)=(f_4 \mid_2 T)(z)=(f_4 \mid_2 \tilde T)(z)。由这两个矩阵生成的群正好就是 \varGamma_1 模 4 的同余子群，记为 \varGamma_0(4)。

定义（同余子群）：设 \varGamma_1 的子群 \varGamma_0(N) 满足任意 \gamma = \begin{pmatrix} a & b \\ c &d \end{pmatrix}\in \varGamma_1，都有 N \mid c \Leftrightarrow \gamma \in \varGamma_0(N)，则 \varGamma_0(N) 就称为是 \varGamma_1 模 N 的同余子群。

证明 T,\tilde T 能生成 \varGamma_0(4)/\{1,-1\} 是容易的，但要计算一般的 \varGamma_0(N) 的生成系较为复杂，在此先不讲。

总之，现在我们知道 f_4(z) 是 \varGamma_0(4) 上权为 2 的模形式了，即 f_4(z) \in M_2(\varGamma_0(4))。除它之外，还能找到哪些 M_2(\varGamma_0(4)) 的元素呢？可以尝试从 \varGamma_1 上权为 2 的准模形式推一下。

我们知道对任意 \gamma \in \varGamma_1 和 z \in \mathcal H 都有

G_2(\gamma(z))= (cz+d)^2 G_2(z)- \pi \text i c(cz+d)

设 \mathbb G_2^*(z)=-\frac{1}{4 \pi^2}G_2(z)+\frac{1}{8 \pi \Im(z)}，则

\begin{aligned}\mathbb G_2^*(\gamma(z))&=-\frac{1}{4\pi^2}((cz+d)^2G_2(z)-\pi \text i c(cz+d))+\frac{|cz+d|^2}{8 \pi \Im(z)} \\ \mathbb G_2^*(\gamma(z)) &= (cz+d)^2 \mathbb G_2^*(z)\end{aligned}

同样是把 z 的实部和虚部拆开计算得到的，只是稍有些繁琐。注意 \mathbb G_2^*(z) 虽然满足权为 2 的自守条件，但不满足增长条件。而以下两个函数：

\begin{aligned}\mathbb G_2^*(z)-2\mathbb G_2^*(2z) &=-\frac{1}{4\pi^2}(G_2(z)-2G_2(2z)) \\ \mathbb G^*_2(2z)-2\mathbb G_2^*(4z)&=\frac{1}{24} + q^2 + q^4 + 4 q^6 + q^8 + 6 q^{10}+\cdots\end{aligned} \quad \texttt{(4)}

就都满足增长条件了，但自守条件又不在整个 \varGamma_1 中都成立。

事实上，若 f(z) 使得任意 \gamma \in \varGamma_1 都有 f \mid_k \gamma = f（注意，这里不要求是模形式，只要求满足自守条件）；对于正整数 N，任取正整数 d \mid N 设 g(z)=f(dz)，则 g \mid_k \gamma' = g 对任意 \gamma' \in \varGamma_0(N) 都成立。也就是说，\texttt{(4)} 中找到的两个都是 \varGamma_0(4) 上权为 2 的模形式。

如果我们能证明 \dim M_2(\varGamma_0(4)) = 2，那么 f_4(z) 必然就是 \texttt{(4)} 的线性组合。如果进一步算出更高权的维数，结合 Hecke 算子理论，也将能解决 4k 平方和计数问题。一般情况的维数公式还是过于复杂，不过简单分析还是能得到一个上界。

定理（维数上界）设 \varGamma 是 \varGamma_1 的含有 -I 的子群，对于正偶数 k，有
\dim M_k(\varGamma) \leq \frac{\mu k}{12}+1 \quad \texttt{(5)}
其中 \mu 为 \varGamma 对 \varGamma_1 的指数（即 [\varGamma_1 : \varGamma]）。

应用此定理，会直接得到 \dim M_2 (\varGamma_0(4)) \leq 2，也就会得到 f_4(z)=8(\mathbb G^*_2(z)-2\mathbb G_2^*(2z))+16(\mathbb G^*_2(2z)-2\mathbb G_2^*(4z))，直接提取系数即可解决四平方和计数问题。接下来我们证明一下这个定理。

:::info[证明]

设 (-I) \in \varGamma \leqslant \varGamma_1，k 为正偶数，f 是 \varGamma 上权为 k 的模形式，[\varGamma_1 : \varGamma] = \mu。取陪集分解 \gamma_1,\cdots,\gamma_\mu 使得 \bigsqcup_{i=1}^\mu \varGamma \gamma_i=\varGamma_1。那么

F(z)=\prod_{i=1}^\mu (f \mid_k \gamma_i)(z)

就是 \varGamma_1 上权为 \mu k 的模形式。因为对任意 a,b\in \varGamma \gamma_i，都有 f \mid_k a = f \mid_k b。
现在设 d=\lfloor k \mu /12 \rfloor +1，我们要证明 \dim M_k(\varGamma) \leq d，可以考虑反证法。

若 \dim M_k(\varGamma) > d，则必然存在线性无关的模形式 v_1,\cdots v_{d+1} \in M_k(\varGamma)。设 \mathcal F 是一个包含 \widetilde{\mathcal F}_1 的对于 \varGamma 的基本域。取 \mathcal F 上不为 \text i,\omega 轨道上的点 P_1,\cdots,P_d，则必然存在线性组合 f=c_1v_1+\cdots c_{d+1}v_{d+1} 在这些点上都为 0。

现在 f 作为一个特殊的 \varGamma 上的模形式，构造对应的 F，其中固定 \gamma_1=I。
根据零点阶数公式，若 F 不恒为零则：

\operatorname{ord}_\infty (F)+\sum_{P \in \widetilde{\mathcal F}_1}\frac{\operatorname{ord}_P(F)}{n_P}=\frac{\mu k}{12}

而我们知道 F(z) = f(z) \prod_{i=1}^{\mu-1}(f \mid_k \gamma_i)(z)，在 \widetilde{\mathcal F}_1 内的零点阶数之和至少为 d> \mu k /12，故 F(z) 恒为零，由此得到 f(z) 恒为零，所以 v_1,\cdots,v_{d+1} 线性相关，产生了矛盾。

故假设不成立，\dim M_k(\varGamma) \leq d。 :::

不难计算得到，[\varGamma_1 : \varGamma_0(4)]=6。

:::info[同余子群的指数] 讲一下一般情况 \varGamma_0(4) 指数的计算，虽然这期只用到 N=4 的情况。
设 \varGamma_1(N) \leqslant \varGamma_1 为主同余子群，其元素模 N 后为单位矩阵，则

[\varGamma_1 : \varGamma_1(N)] = |\mathrm{SL}(2,\Z / N\Z)|=N^3 \prod_{p \mid N}\left( 1 - \frac{1}{p^2}\right)

此结果见 P1951 题解的推导，这里就不复读了。显然 \varGamma_1(N) \leqslant \varGamma_0(N)，考虑计算 [\varGamma_0(N) : \varGamma_1(N)]，设群同态

\begin{aligned} \psi : \varGamma_0(N) &\to \mathrm{SL}(2,\Z/N\Z) \\ \begin{pmatrix} a & b \\ Nc & d \end{pmatrix} & \mapsto \begin{pmatrix} a \bmod N & b \bmod N \\ 0 & d \bmod N\end{pmatrix}\end{aligned}

不难发现，\ker \psi = \varGamma_1(N)，设 \psi 的像 B(N)，主对角线元素相乘模 N 为 1，故确定主对角线有 \varphi(N) 种可能；而在模 N 后右上角元素有 N 种可能，故 |B(N)|=N \varphi(N)。根据群同态基本定理 \varGamma_0(N)/\varGamma_1(N) \cong B(N)，利用指数公式即得 [\varGamma_0(N):\varGamma_1(N)]=|B(N)|。

最后我们有

[\varGamma_1 : \varGamma_0(N)] = \frac{[\varGamma_1 : \varGamma_1(N)]}{[\varGamma_0(N) : \varGamma_1(N)]}=N \prod_{p \mid N}\left(1+\frac 1p \right)

:::

这样就得到了对于正偶数 k，\dim M_k(\varGamma_0(4)) \leq k/2 + 1。设 g_1(z)=(\mathbb G_2^*(z)-2\mathbb G^*(2z)) 和 g_2(z)=(\mathbb G_2^*(2z)-2\mathbb G^*(4z))，我们已经证明了 g_1,g_2 是 M_2(\varGamma_0(4)) 的一组基。根据上期对 M_k(\varGamma_1) 的分析，我们也能类似地证明 M_k(\varGamma_0(4)) 存在一组基为：

v_i = g_1^i g_2^{k/2-i} \ , \ (0 \leq i \leq k/2)

（如果看过上期证明，就会发现这是显然的）

现在要计算 \theta(z)^{4k} 的系数，依照以往的方法，将其用 M_{2k}(\varGamma_0(4)) 中刚才构造的基线性表示，然后计算 Hecke 算子的矩阵即可，所以我们想要扩展 Hecke 算子在同余子群上的定义。

回顾一下 Hecke 算子的原始定义，我们不难写出 T_m 作用于 f，f \in M_k(\varGamma_0(N)) 的结果是这样的：

T_m f(z) = m^{k-1}\sum_{\gamma \in \mathcal M_m/\varGamma_0(N)} (f \mid_k \gamma)(z)

显然 T_mf(z) \in M_k (\varGamma_0(N))。也是按照相同的研究方法，我们可以取 \mathcal M_m / \varGamma_0(N) 的一组代表元为 \begin{pmatrix} a & b \\ 0 & d \end{pmatrix} \in \varGamma_0(N)，其中 ab = m,\gcd(a,N)=1, b<d，且 a,b,d 均为非负整数。进一步也能计算 Fourier 系数的变化：

[q^n] (T_m f(z))= \sum_{d \mid \gcd(n,m)}[\gcd(d,N)=1] d^{k-1}[q^{nm/d^2}] f(z) \quad \texttt{(6)}

最后，我们想要的 Hecke 算子的美妙性质，稍作修改后仍然存在：

T_n T_m = \sum_{d \mid \gcd(n,m)}[\gcd(d,N)=1] d^{k-1}T_{nm/d^2} \quad \texttt{(7)}

不过实际计算中我们只需要互质与素数幂递推性质就足够，这两个性质都较为容易证明。需要注意的是，p \mid N 时会有 T_{p^n} = (T_p)^n，比一般的素数幂递推更简单。用基础模形式练习题后半部分的做法，就能轻松解决 4k 平方和问题了。

一份参考代码，可以计算 p^n 用 4k 个整数的平方和表示的计数问题。其中的 solve 部分是朴素递推，可以用矩阵快速幂等方法来加速。

看到这你也许会问，二平方和的情况应该比四平方简单啊，为什么不讲呢？因为 \theta(z)^2 是带有 Dirichlet 特征的模形式，还需要将以上内容继续扩展来得到其相关理论。限于篇幅，这期就先到此为止了。