笔记 · 素性判断等（Miller-Rabin，Pollard-Rho）

aleph_ · 2025-08-24 12:16:26 · 个人记录

Miller-Rabin

两个引理

引理 1：费马小定理

设 p\in\text{Prime}，a\in\mathbb{Z}，且 \gcd(a,p)=1，那么有

a^{p-1}\equiv 1\pmod p

证明：

对于两个整数 a\ne b\pmod p，和一个和 p 互素的整数 c，则有 ac\ne bc\pmod p.

考虑两组数：1,2,\dots,p-1；a,2a,\dots,(p-1)a。根据上述结论，两者均为模 p 的完全剩余系。

因此：

1\cdot2\cdot3\cdots(p-1)\equiv a\cdot 2a\cdot 3a\cdots (p-1)a\pmod p

(p-1)!\equiv (p-1)!\cdot a^{p-1}\mod p

\because \gcd((p-1)!,p)=1

\therefore a^{p-1}\equiv 1\pmod p

引理 2：二次探测定理

如果 p\in\text{Prime}，且 0<x<p，则方程 x^2\equiv 1\pmod p 的解为 x=1,p-1.

证明：

易知 x^2-1\equiv 0\pmod p

\therefore (x+1)(x-1)\equiv 0\pmod p

\therefore p|(x+1)(x-1)

\because p\in\text{Prime},0<x<p

\therefore x=1,p-1

算法流程

费马小定理的缺陷是，有一些特殊的整数，虽然 a^{n-1}\equiv 1\pmod n，但 n 是合数。我们可以考虑通过随机化的方式，来规避这种数，这也是 Miller-Rabin 算法的核心思想。

对于 0,1,2 和偶数，可以直接判断。
设要测试的数是 N。我们取一个较小的质数 a。设 N-1=2^s\cdot t（其中 t 是奇数）。这有什么用呢？后面会说到。
对于 x=a^t，我们不断去平方他，进行二次探测检验。根据二次探测定理，如果 x^2\equiv 1\pmod N，但 x\ne 1 且 x\ne N-1，那么 N 就一定不是质数，退出。
我们最多可以平方 s 次，显然这期间 x 满足 0<x<N。最后 x=a^{2^s\cdot t}=a^{N-1}，再使用费马小定理进行验证。如果 a^{N-1}\not\equiv 1\pmod N，那么 N 肯定不是质数，退出。
注意，即使通过了上述检验，N 也可能不是质数。那么我们就多取几个质数 a，确保了检验的准确性。

注意事项

注意求平方的过程中，可能会爆 long long，需要用到龟速乘。怕超时的话，直接开 __int128
对于单个数 n，复杂度为 \mathcal{O}(k\log^3 n)，其中 k 为检验次数，此处 k=10。可以保证结果大概率正确。

代码

#include <bits/stdc++.h>
#define int long long
using namespace std;
int prime[10]={2,3,5,7,11,13,17,19,23,29};
int qmul(int a,int b,int mod){
    int ans=0;
    while(b){
        if(b&1) ans=(ans+a)%mod;
        a=(a+a)%mod;
        b>>=1;
    }
    return ans;
}
int qpow(int a,int b,int mod){
    int ans=1;
    while(b){
        if(b&1) ans=ans*a%mod;
        a=a*a%mod;
        b>>=1;
    }
    return ans;
}
bool Miller_Rabin(int n){
    if(n==2) return 1;
    if(n<2||!(n&1)) return 0;
    //特判0,1,2和偶数
    int s=0,t=n-1;
    while(!(t&1)){
        s++;
        t>>=1;
    }
    for(int i=0;i<10&&prime[i]<n;i++){
        int a=prime[i];
        int x=qpow(a,t,n);
        for(int j=1;j<=s;j++){
            int y=qmul(x,x,n);
            if(y==1&&x!=1&&x!=n-1) return 0;//二次探测检验
            x=y;
        }
        if(x!=1) return 0;//此时x=a^{n-1}，用费马小定理
    }
    return 1;
}
signed main(){
    int n;
    cin>>n;
    cout<<(Miller_Rabin(n)?"YES\n":"NO\n");
}

Pollard-Rho

算法概述

该算法能快速找到大整数的一个非1、非自身的因子。

原理这篇文章都讲透了

首先，可以考虑生成 [1,n] 的随机数 x，计算 d=\gcd(x,n)，若 d>1，那么就找到了，d 就是一个 n 的一个因子。

最坏情况下，n=p^2，p 是一个素数。那么当 x=p,2p,3p,\cdots,(p-1)p 时有 d>1，一共有 p-1\approx \sqrt{n} 个这样的 x，所以最差期望时间复杂度是 \mathcal{O}(\sqrt{n}\log n) 的。（log是算gcd带来的）

生日悖论

对于一个 [1,N] 内整数的理想随机数生成器，生成序列中第一个重复的数字前期望有 \sqrt{\frac{\pi N}{2}} 个数。(生日悖论)

对于 n=p^2，在 [1,n-1] 间生成的随机数模 p，大致是 [0,p-1] 间的随机数。因此期望在生成大约 \sqrt{p}=n^{\frac{1}{4}} 个数后，可以出现两个在模 p 意义下相同的数。那么这两个数的差 d，就满足 d\equiv 0\pmod p，也就满足 \gcd(d,n)>1，这时就找到了。但问题在于，我们没法两两进行比较验证，否则时间复杂度就会退回，还是没有进步。

伪随机数生成器

接下来是 Pollard-Rho 算法的精髓——使用一种特别的伪随机数生成器来生成 [0,n-1] 内的伪随机数序列。

设序列第一个数是 x，f(x)=(x^2+c)\mod n

则 x,f(x),f(f(x)),\dots 是生成的伪随机数序列。

观察这个伪随机数生成器，刚开始的时候是随机的，到后面就会进入一个环。因为下一个数是依赖于上一个数的，而可生成的数又是有限的，因此会有环。所以这个伪随机数生成器生成的数，可以看作是一条链，最终连向一个环。看起来就像字母 \rho。

我们可以使用龟兔赛跑算法（Floyd判环法）。

设置两个变量 t,r。每次判断是否有 |t-r|\equiv 0\pmod n，即判断 \gcd(|t-r|,n)>1。有的话，我们就找到了。这个期望显然是 n^{\frac{1}{4}}。
如果没有，那么令 t=f(t),r=f(f(r))，r 跑的快，所以如果最后没有找到答案，最终会在环上追上 t。这时退出，换一个 c 重新生成伪随机数。

注意到这个伪随机数生成器有一个性质。

对于 |i-j|\equiv 0\pmod p，有

如果 $i,j$ 是环上满足条件的两个数，它们之间的距离为 $d$（两者之间间隔的边数），那么它们的后继 $f(i),f(j)$ 的距离也为 $d$，也满足条件。同理，$f(f(i)),f(f(j))$ 也满足条件…… 也就是说，如果环上两个相距为 $d$ 的数满足条件，那么环上所有相距为 $d$ 的数都满足条件。而在Floyd判环的过程中，由于两个指针的移动速度不同，每次移动都是在检查一个新的距离 $d$，而这样就无需两两比较了。这个算法的复杂度依赖于该伪随机数生成器的随机程度。如果它是足够随机的，那么期望时间复杂度就是 $\mathcal{O}(n^{\frac{1}{4}}\log n)$。 #### 分块优化这个 $\log$ 还是有点讨厌。怎么去除呢？我们发现瓶颈在于计算 $\gcd$。注意到若 $\gcd(d,n)>1$，那么一定有 $\gcd(kd\mod n,n)>1$，所以我们可以先把一些待选数乘起来，再统一和 $n$ 求公因数，这样就减少了求 $\gcd$ 的次数。所以我们可以每隔 $1,2,4,8,\dots$ 步求一次 $\gcd$。但这样到了后面就会走越来越多步才能退出，如果早就找到答案却迟迟不退出，显然不优，因此可以**在倍增取距离的基础上，设定一个固定步数上限 $C$**。当然也可以简单地每隔 $C$ 步就计算一下。这样时间复杂度至此优化至 $\mathcal{O}(n^{\frac{1}{4}}+\frac{n^\frac{1}{4}\log n}{C})$。当 $C>\log n$ 时，时间复杂度为 $\mathcal{O}(n^{\frac{1}{4}})$。 #### 注意事项： - 为了方便，通常令 $x,c$ 任取。 - 当 $n=4$ 时，无论 $c$ 取多少，都得不到解，需要特判。质数也直接特判返回。 - 一些细节和优化见代码。 ### 例题模版：[P4718](https://www.luogu.com.cn/problem/P4718) 题意：$q(1\le q\le 350)$ 次询问，每次给出一个正整数 $n(2\le n\le10^{18})$，如果它是质数输出 ```Prime```，否则输出它最大的质因数。 #### Solution：基本上就是 Pollar-Rho 和 Miller-Rabin 板子。注意，本题中用龟速乘会超时，只能强转 ```__int128```。还需注意本题中要求找最大质因数。我们可以递归地解决该问题。对于当前数 $n$，Pollard-Rho 算法每次会找到一个 $n$ 的一个非1、非自身因数 $d$。我们可以递归地去解决数为 $d$ 和 $\frac{n}{d}$ 的子问题。注意往下递归之前判一下 $d$ 或者 $\frac{n}{d}$ 是否已经是质数了，因为Pollard-Rho算法规避找到自己的方法是“多试几次”，如果本来就是质数的话，就会一直循环循环…… 容易证明，递归的底层一定会得到原数的质因数，因为如果当前数是合数就能继续向下递归。我们取最大值即可。 #### Code: ```cpp #include <bits/stdc++.h> #define int long long using namespace std; const __int128 one=1; int prime[12]={2,3,5,7,11,13,17,19,23,29,31,37};//n拓展到10^18之后，k=10不太够了，这里取k=12 int qpow(int a,int b,int mod){ int ans=1ll; while(b){ if(b&1) ans=one*ans*a%mod; a=one*a*a%mod; b>>=1; } return ans; } bool Miller_Rabin(int n){ if(n==2) return 1; if(n<2||!(n&1)) return 0; int s=0,t=n-1; while(!(t&1)){ s++; t>>=1; } for(int i=0;i<12&&prime[i]<n;i++){ int a=prime[i]; int x=qpow(a,t,n); for(int j=1;j<=s;j++){ int y=one*x*x%n; if(y==1&&x!=1&&x!=n-1) return 0; x=y; } if(x!=1) return 0; } return 1; } const int C=128; static std::mt19937 aleph; int Pollard_Rho(int n){ if(n==4) return 2; if(Miller_Rabin(n)) return n; std::uniform_int_distribution<int> rnd(3,n-1); int t=rnd(aleph),r=t,c=rnd(aleph); auto f=[=](int x){return (one*x*x%n+c)%n;}; t=f(t),r=f(f(r)); for(int lim=1;t!=r;lim=min(lim<<1,C)){ int fac=1ll; for(int i=0;i<lim;i++){ fac=one*fac*abs(t-r)%n; if(!fac) break;//小优化：如果当前乘积是0，后面也没必要乘了，怎么乘还是0，直接退出。 t=f(t),r=f(f(r)); } int d=gcd(fac,n); if(d>1) return d; } return n; } int ans=0; void mx(int z){ if(z>ans) ans=z;//优化，比max快 } void dfs(int n){ int d=Pollard_Rho(n); while(d==n) d=Pollard_Rho(n);//Pollard-Rho会随机找到一个因数，如果刚好找到了n，那就再做几次 int d2=n/d; if(Miller_Rabin(d)) mx(d);//递归下去前判一下质数，不然死循环 else dfs(d); if(Miller_Rabin(d2)) mx(d2); else dfs(d2); } int calc(int x){ if(Miller_Rabin(x)) return x; ans=0; dfs(x); return ans; } void solve(){ int n; scanf("%lld",&n); int x=calc(n); if(x==n) printf("Prime\n"); else printf("%lld\n",x); } signed main(){ srand(time(0)); int T; cin>>T; while(T--){ solve(); } } ```