FWT 入门学习笔记

_maze · 2023-03-21 17:13:41 · 个人记录

来学点好玩的。

引入

我们也许学过，FFT 可以解决一类卷积：

C_i=\sum^{k+j=i} A_iB_j

现在我们稍微变一下式子：

C_i=\sum^{i=k \And j} A_kB_j

C_i=\sum^{i =k\mid j} A_kB_j

C_i=\sum^{i=k \oplus j} A_kB_j

上面那个圆圆的东西是异或

怎么求？

FWT 或

也就是这个式子：

C_i=\sum^{i =k\mid j} A_kB_j

FWT 的定义

模仿 FFT，对于 A 我们想要在可接受时间内得到一个 FWT(A)，使得

FWT(C)_i=FWT(A)_i\times FWT(B)_i

这样我们就可以 $O(n)$ 暴力乘起来了。因此我们构造 $FWT(A)_i=\sum^{}_{j|i=i}A_j$。现在我们来证明这个构造的正确性。 $$FWT(A)_i\times FWT(B)_i$$ $$=\sum^{}_{j|i=i}A_j\times \sum^{}_{k|i=i}B_k$$ $$=\sum^{}_{j|i=i}\sum^{}_{k|i=i}A_j B_k$$ 因为可以从 $j|i=i$ 与 $k|i=i$ 中得出 $(j|k)|i=i$，所以我们还可以消去另一个式子 $$=\sum^{}_{(j|k)|i=i}A_j B_k$$ 根据 $FWT$ 的定义，这个式子就是 $FWT(C)_i$。证毕。 ## 另一种理解涉及到了或运算，我们不妨把数全都变成二进制。于是我们想到一种经典转换：将二进制中的 $0$ 与 $1$ 转化为集合中一个数选还是不选。那么或操作代表什么呢？ bingo！两个集合的并集！于是我们可以把上面的式子改写一个形式： $$C_i=\sum^{i=k \mid j} A_kB_j$$ 变成 $$C_i=\sum^{i =k\bigcup j} A_kB_j$$ 注意看,这时 $i,j,k$ 都是集合,只不过我们将其用二进制表示. 这样我们可以改写 $FWT$ 的定义。重新来一遍，$FWT(A)_i=\sum^{}_{k \subseteq i} A_k$。因此我们为 $FWT$ 找到了新的定义，他代表着集合 $i$ 的子集之和。我们有了更自然的推导： $$\sum^{}_{j \subseteq i}A_j\times \sum^{}_{k \subseteq i}B_k$$ $$=\sum^{}_{j,k \subseteq i}A_j\times B_k$$ $$=\sum^{}_{x \subseteq i}\sum^{}_{j\bigcup k = x }A_j\times B_k$$ $$=\sum^{}_{x \subseteq i}C_x$$ $$=FWT(c)_x$$ 换句话说，我们对子集做了个前缀和操作（发现了吗？子集的前缀和进行或卷积与普通前缀和进行加法卷积具有相似性），并用前缀和相乘代替了原来的 $O(n^2)$ 相乘。 ## 如何变化我们把原序列 $A$ 按下标最高位是 $0$ 还是 $1$ 分成两部分 $A_0$ 与 $A_1$ 分治求解。显然，前半部分（最高位为 $0$ 的部分）就是 $FWT(A_0)$，所以我们考虑后半部分的答案。后半部分最高位为 $1$，因此此时“子集”这一概念不仅包含分治处理的他子集，还包括把最大值变为 $0$ 后的，序列 $A0$ 中同一位置的子集。要将 $A_0$ 中的同一位置加到当前答案上。写成数学形式就是: $$FWT(A) = merge(FWT(A_0),FWT(A_0)+FWT(A_1))$$ 上面的 $merge$ 代表拼接，就是字面意思。于是我们就能写出分治递归代码了！但为了常数着想，我们试着把递归这一步骤去掉。去掉的部分并不难写，我们按照层数从小到大递归，不难发现第 $i$ 层（从 $0$ 开始编号，最底层为 $0$）就是枚举第 $i$ 位是 $0$ 还是 $1$，并且乱填其他数进行转移。 ![](https://cdn.luogu.com.cn/upload/image_hosting/dp1xde4a.png) 代码也简单： ```cpp void OR(mint *f){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1)// k 为当前的层，o 仅用于穷举左边进行转移 for(int i = 0; i < n; i += o)// 穷举左边 for(int j = 0; j < k; j++){ // 穷举右边 f[i + j + k] = f[i + j + k] + f[i + j]; } } ``` ## 如何转回来再看一眼转移的式子 $$FWT(A) = merge(FWT(A_0),FWT(A_0)+FWT(A_1))$$ 思考只有两个数的情况。此时 $1$ 位置是不会变的，$2$ 位置加上了 $1$ 位置的贡献，要减去。我们发现更大的情况也是一样的，只要依次把前面的贡献减去就好。 ```cpp void IOR(mint *f){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1)// k 为当前的层，o 仅用于穷举左边进行转移 for(int i = 0; i < n; i += o)// 穷举左边 for(int j = 0; j < k; j++){ // 穷举右边 f[i + j + k] = f[i + j + k] - f[i + j]; } } ``` 这两份代码显然是可以合并的。因此我们得到了 $FWT$ 或的全过程。 ```cpp void OR(mint *f, int type){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1) for(int i = 0; i < n; i += o) for(int j = 0; j < k; j++){ f[i + j + k] = f[i + j + k] + (f[i + j] * mint(type)); } } ``` # $FWT$ 与和或差不多，只是要从 $1$ 转移到 $0$。可以发现，实际上我们用子集后缀和优化了运算。 ```cpp void AND(mint *f, int type){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1) for(int i = 0; i < n; i += o) for(int j = 0; j < k; j++) f[i + j] = f[i + j] + (f[i + j + k] * mint(type)); } ``` # $FWT$ 异或 $$C_i=\sum^{i=k \oplus j} A_kB_j$$ 很遗憾，我并没有发现这个东西的集合意义，如果有大佬知道可以告诉我。。。 ## 正着转化思考 $FWT$ 的作用，我们想要把 $A_kB_j$ 变成 $A_iB_i$ 的形式，以此来简化运算。我们考虑这样 $n$ 个 $n$ 维向量 $b$，$b(i)$ 只有下标 $i$ 处是 $1$，其他位置都是 $0$。现在我们把 $FWT$ 后的 $A,B$ 看作系数，此时显然 $A_1b(1),A_2b(2),...,A_nb(n)=A_1,A_2,A_3,A_4...,A_n

显然，异或卷积对于乘法有分配律。

设异或卷积为 \ast，则

(\sum^{n}_{i=1} A_ib(i)) \ast (\sum^{n}_{i=1} B_jb(j))

=(\sum^{n}_{i=1}\sum^{n}_{j=1} A_iB_j (b(i)\ast b(j))

发现后面的东西可以简单表示，即 b_i \ast b_i = b_i,b_i \ast b_j = 0(i \neq j)。

那么整个式子就是我们寻找的形式：

\sum^{n}_{i=1} A_iB_i

而我们要做的事情无非是求出 FWT 之前的 b_i。

太长不看版：异或 FWT 与原序列线性相关

既然这样，我们设 FWT(A)_x=\sum^{n}_{i=1} g(x,i)A_i。

那么因为 FWT(C)_x=FWT(A)_x\times FWT(b)_x

所以 \sum^{n}_{k=1} g(x,k)C_k=\sum^{n}_{i=1} g(x,i)A_i \times \sum^{n}_{j=1} g(x,j)B_j。

整理一下可以得出：

\sum^{n}_{k=1} g(x,k)C_k=\sum^{n}_{i=1}\sum^{n}_{j=1} g(x,i)g(x,j)\times A_iB_j

把 C_k 用 A,B 表示可得：

\sum^{n}_{k=1} g(x,k)\sum^{k=i \oplus j} A_iB_j=\sum^{n}_{i=1}\sum^{n}_{j=1} g(x,i)g(x,j)\times A_iB_j

更改求和顺序，我们枚举 i,j 可得：

\sum^{n}_{i=1}\sum^{n}_{j=1} g(x,i \oplus j) A_iB_j=\sum^{n}_{i=1}\sum^{n}_{j=1} g(x,i)g(x,j)\times A_iB_j

于是我们发现了 g 的关系：

g(x,i \oplus j) = g(x,i)g(x,j)

现在问题来了，与 i,j 相关的什么东西，使异或之后的值等于原来两值的乘积？

于是我们可以想到~~有人托梦给我~~奇偶性。

具体的，我们发现异或前后 1 的个数奇偶性不变。原因如下：

按每一位依次考虑。如果第 i 位异或后为 1，那么原来必定有且仅有一个 1。个数不变

如果为 0，要么是两个 0，此时 1 的个数不变，要么是两个 1，此时 1 的个数减 2，奇偶性仍不变。

所以我们定义 g(x,i)=(-1)^{|i \bigcap x|}。那么上式就等价于：

(-1)^{|(i \oplus j) \bigcap x|} = (-1)^{|i \bigcap x|}(-1)^{|j \bigcap x|}

根据上面的推论，左右两边奇偶性不变，与后无非是减去两个相同的数，奇偶性还是不变。

于是我们得出 FWT 的转移式：

FWT(A)_x=\sum^{n}_{i=1} (-1)^{|i \bigcap x|}A_i

如何求解

考虑模仿前两个 FWT 的形式，讨论最高位 i 为 0 和为 1 两种情况。

原来最高位为 0，FWT 后的前 2^{i-1} 个数最高位还是 0。由于 1 \And 0=0，所以后 2^{i-1} 个数的贡献为正。前半部分答案为 FWT(A_0)+FWT(A_1)。

所以我们得出： $$FWT(A) = merge(FWT(A_0)+FWT(A_1),FWT(A_0)-FWT(A_1))$$ 当然，参照或 FWT，我们可以写出不依赖递归的程序： ```cpp void XOR(mint *f){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1)//具体意义参考 FWT 或 for(int i = 0; i < n; i += o) for(int j = 0; j < k; j ++){ mint x = f[i + j], y = f[i + j + k]; f[i + j] = x + y; f[i + j + k] = x - y; } } ``` ## 求逆变换实际上就是把贡献减去 $$IFWT(A) = merge(\frac{IFWT(A_0)+IFWT(A_1)}{2},\frac{IFWT(A_0)-IFWT(A_1))}{2}$$ 显然这两个东西是可以合并的。于是我们可以得出[模板](https://www.luogu.com.cn/problem/P4717)的完整代码： ```cpp #include<bits/stdc++.h> using namespace std; #define forp(i, a, b) for(int i = (a);i <= (b);i ++) #define forc(i, a, b) for(int i = (a);i >= (b);i --) const int maxn = 6e5 + 5; const int mod = 998244353; int read(){ int u;cin >> u;return u; } class mint{ private : int v; public: mint(){} int operator()(void)const{ return v; } mint (const int &u){ v = u % mod; } mint operator+(const mint &a) const{ int x = a.v + v; if(x >= mod) return mint(x - mod); if(x < 0) return mint(x + mod); return x; } mint operator-(const mint& a)const{ return v < a.v ? v - a.v + mod : v - a.v; } mint operator*(const mint &a) const{ return mint((1ll * a.v * v) % mod); } }; mint qpow(mint u, int v){ mint ans = mint(1); while(v){ if(v & 1) ans = ans * u; u = u * u; v >>= 1; } return ans; } mint inv2 = qpow(2, mod - 2); int n; mint A[maxn], B[maxn], C[maxn]; mint g[maxn]; void OR(mint *f, int type){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1) for(int i = 0; i < n; i += o) for(int j = 0; j < k; j++){ f[i + j + k] = f[i + j + k] + (f[i + j] * mint(type)); } } void AND(mint *f, int type){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1) for(int i = 0; i < n; i += o) for(int j = 0; j < k; j++) f[i + j] = f[i + j] + (f[i + j + k] * mint(type)); } void XOR(mint *f, int type){ for(int o = 2, k = 1; o <= n; o <<= 1, k <<= 1) for(int i = 0; i < n; i += o) for(int j = 0; j < k; j ++){ mint x = f[i + j], y = f[i + j + k]; f[i + j] = x + y; f[i + j + k] = x - y; if(type == -1){ f[i + j] = f[i + j] * inv2; f[i + j + k] = f[i + j + k] * inv2; } } } signed main(){ ios::sync_with_stdio(0); cin.tie(0);cout.tie(0); n = (1 << read()); forp(i, 0, n - 1) A[i] = mint(read()); forp(i, 0, n - 1) B[i] = mint(read()); OR(A, 1);OR(B, 1); forp(i, 0, n - 1) C[i] = (A[i] * B[i]); OR(C, -1); forp(i, 0, n - 1) cout << C[i]() << ' '; cout << endl; OR(A, -1);OR(B, -1); AND(A, 1);AND(B, 1); forp(i, 0, n - 1) C[i] = (A[i] * B[i]); AND(C, -1); forp(i, 0, n - 1) cout << C[i]() << ' '; cout << endl; AND(A, -1);AND(B, -1); XOR(A, 1);XOR(B, 1); forp(i, 0, n - 1) C[i] = (A[i] * B[i]); XOR(C, -1); forp(i, 0, n - 1) cout << C[i]() << ' '; cout << endl; XOR(A, -1);XOR(B, -1); return 0; } ``` 大概就是这样。。。应用也许会另外开坑吧。 -------- # 后记感谢 [xht 的博客](https://www.luogu.com.cn/blog/xht37/solution-p4717)，从这篇博客里我学到了 FWT 的基础知识。感谢同校大佬 [yllcm](https://www.luogu.com.cn/user/682934) 为本人解释符号与定义。感谢万能的U群群友 Untitled_unrevised 解释 FWT 的目的。感谢万能的U群群友 rqy 学姐与樱初音斗橡皮解释为什么异或 FWT 是线性变换~~顺便发现了我在线性代数方面的巨大缺口~~