Codeforces [Gym 102354B] Yet Another Convolution

皎月半洒花 · 2020-03-25 12:37:45 · 个人记录

给出两个长为 n 的序列 \{a_n\} 和 \{b_n\} 。对于所有的 k\in[1,n]\cap\mathbb Z_{+} ，求这样的 c_k：
c_k=\max_{\gcd(i,j)=k}\{a_i-b_j\} 1\leq n\leq 10^5

题目来源于 2018-2019 Summer Petrozavodsk Camp, Oleksandr Kulkov Contest 2 。

发现这题居然还是那一场通过人数最多的题目之一…深深地感觉到了自己的弱小。

然后正片部分。考虑这个式子可以怎么化，发现对于一个给定的 k ，要找的 a_i 和 b_i 应该至少是这样的：

a_k,a_{2k},a_{3k}\cdots a_{pk}

b_k,b_{2k},b_{3k}\cdots b_{pk}

于是直接把这些拿出来重编号为 1,2,3\cdots p。那么为了保证 \gcd(i,j)=k，就需要满足取出的一个 pair 满足 \gcd(i,j)=1 。也就是现在转化成了这么一个问题：

\max_{i=1}^p\{(a_i-b_j)[(i,j)=1]\}

也就是

\max_{i=1}^p\{a_i-\min_{j=1}^p\{b_j\cdot[(i,j)=1]\}\}

然后似乎就没法做了。发现本题要求 poly(\log) 的做法，但是本质上对于每个 k ，都有 O(\frac{n}{k}) 组询问，这个询问量是十分巨大的。于是考虑有没有什么可以一起处理全部询问的方法。发现似乎整体二分可行。

首先把里面的 \min 通过将 b 全部取反变成 \max：

\max_{i=1}^p\{a_i+\min_{j=1}^p\{-b_j\cdot[(i,j)=1]\}\}

之后考虑整体二分。具体的来讲，先考虑一组询问（即一个固定的 i）怎么二分。对于一个 \min_{j=1}^p\{b_j\cdot[(i,j)=1]\} ，将其转化成判定性问题。假设当前二分到的值是 ans ，那么考虑，如果 \sum_{j=1}^p[ans<b_j][(i,j)=1] >0，那就代表存在一个值比 ans 大，符合二分性质。

那么对于这个 \sum 而言，就可以变一下形了：

\sum_{j=1}^p[ans<b_j]\sum_{d|i\operatorname{and}d|j} \mu(d)>0

反演一下也就是

\sum_{d|i} \mu(d)\sum_{d|j}^p[ans<b_j]>0

那么考虑整体二分的时候，对于每一层都可以把 <vmid 的位置赋为 1 ，或者反过来，本质都一样。之后就只需要查询某个 i 的上式值。发现这东西需要维护每个值的倍数处的值（后一个 \sum），并且不是很好清空。于是考虑一个有趣的做法。假设以把 >vmid 的位置都赋值为 1 做例子。每次手动将一个指针移动 vmid+1 处，然后对于途径的所有 b_j，如果 >vmid 的话就 +1 ，否则 -1 。这样做之后，直接把自己的标记下传给所有自己的约数。这样最后去 check(i) 的时候就可以直接枚举所有约数而不需要再去枚举约数的倍数。发现移动指针每层都是 O(r-l) 的。

于是最后考虑算一下复杂度。大概是：

\sum _{i=1}^n(\frac{n}{i} \log \frac{n}{i} d(\frac{n}{i}))

的复杂度。emmm，这大概是个什么复杂度呢…考虑 d(n)<O(\sqrt[3]n) ，所以最后应该不会超过 (n\log n)^{\frac{4}{3}}\log n

后面一个 \log 是因为：

\int \frac{n}{x} \log \left(\frac{n}{x}\right) \mathrm{dx}=-\frac{n(\log x)^{2}-2 n \log n \log x+n(\log n)^{2}}{2}

似乎是因为 \log (\frac{n}{x})<0 的问题，所以需要忽略掉符号。最后大概也就是 n\log^2 n 的级别。

然而实际积分出来也差不多？

\int \frac{n^{\frac{4}{3}} \log \left(\frac{n}{x}\right)}{x^{\frac{4}{3}}} \mathrm{d x}=\frac{n^{\frac{1}{3}}(3 n \log x-3 n \log n+9 n)}{x^{\frac{1}{3}}}

看上去就是 (n\log n)^{\frac{4}{3}}\log n 的亚子。不过话说回来 d(n)=O(\sqrt[3] n) 的近似误差有、大，所以还是 O(能过) 比较靠谱.jpg 。

#include <cstdio>
#include <vector>
#include <cstring>
#include <iostream>
#include <algorithm>

using namespace std ;

const int N = 300010 ;

#define p_b push_back 
#define upb upper_bound

void debug(int *tp, int minn, int maxn, char c){
    for (int i = minn ; i <= maxn ; ++ i)
        cout << tp[i] << " " ;  cout << c ;
}

int n ;
int xq ;
int cnt ;
int q[N] ;
int A[N] ;
int B[N] ;
int lq[N] ;
int rq[N] ;
int pr[N] ;
int ta[N] ;
int tb[N] ;
int Mu[N] ;
int sum[N] ;
int res[N] ;
int ans[N] ;
int tmp[N] ;
int base[N] ;
bool vis[N] ;
vector <int> d[N] ;

void add(int x, int y){
    int p = d[x].size() ;
    for (int i = 0 ; i < p ; ++ i)
        sum[d[x][i]] += y ;
    return ;
}
void upd(int x){
    while (xq > x) add(base[-- xq], 1) ;
    while (x > xq) add(base[xq ++], -1) ;
    //debug(sum, 1, 50, '\n') ;
}
int calc(int x){
    int ret = 0 ;
    int p = d[x].size() ;
    for (int i = 0 ; i < p ; ++ i)
        ret += Mu[d[x][i]] * sum[d[x][i]] ;
    return ret ;
}
void do_it(int l, int r, int vl, int vr){
    if (l > r) return ;
    if (vl == vr){
        for (int i = l ; i <= r ; ++ i)
            ans[q[i]] = vl ; return void() ;
    }
    int vmid = (vl + vr) >> 1 ; 
    int tl = 0, tr = 0 ; upd(vmid + 1) ;
    for (int i = l ; i <= r ; ++ i){
        if (calc(q[i]) <= 0)
            lq[++ tl] = q[i] ;
        else rq[++ tr] = q[i] ;
    }
    //cout << tl << " " << tr << endl ;
    for (int i = 1 ; i <= tl ; ++ i) q[l + i - 1] = lq[i] ;
    for (int i = 1 ; i <= tr ; ++ i) q[l + tl + i - 1] = rq[i] ;
    do_it(l, l + tl - 1, vl, vmid) ; do_it(l + tl, r, vmid + 1, vr) ;
}
int do_do(int k){
    for (int i = 1 ; i <= k ; ++ i)
        tmp[q[i] = i] = tb[i], sum[i] = 0 ; 
    sort(tmp + 1, tmp + k + 1) ; int x ; xq = k + 1 ; 
    for (int i = 1 ; i <= k ; ++ i){
          x = upb(tmp + 1, tmp + k + 1, tb[i]) - tmp ;
          x -- ; base[x] = i ; tmp[x] ++ ;
    }
    int ret = -2333333 ; do_it(1, k, 1, k) ; //debug(q, 1, k, '\n') ;
    for (int i = 1 ; i <= k ; ++ i)
        ret = max(ret, ta[i] + tmp[ans[i]] - 1) ;
    return ret ;
}
void solve(){
    for (int i = 1 ; i <= n ; ++ i){
        for (int j = 1 ; i * j <= n ; ++ j)
            ta[j] = A[i * j], tb[j] = B[i * j] ;
        res[i] = max(res[i], do_do(n / i)) ;
    }
}
void sieve(int k){
    vis[0] = vis[1] = Mu[1] = 1 ;
    for (int i = 2 ; i <= k ; ++ i){
        if (!vis[i]) 
            pr[++ cnt] = i, Mu[i] = -1 ;
        for (int j = 1 ; j <= cnt ; ++ j){
            if (pr[j] * i > k) break ;
            vis[i * pr[j]] = 1 ;
            if (i % pr[j] == 0) break ;
            Mu[i * pr[j]] = - Mu[i] ;
        }
    }
    for (int i = 1 ; i <= k ; ++ i)
        for (int j = 1 ; i * j <= k ; ++ j)
            d[i * j].p_b(i) ;
}
int main(){
    sieve(N - 10) ;
    ios :: sync_with_stdio(false) ;
    cin.tie(0) ; cout.tie(0) ; cin >> n ;
    for (int i = 1 ; i <= n ; ++ i) cin >> A[i] ;
    for (int i = 1 ; i <= n ; ++ i) cin >> B[i] ;
    for (int i = 1 ; i <= n ; ++ i) B[i] = -B[i] ;
    solve() ;
    //for (int i = 1 ; i <= n ; ++ i)
    //    cout << res[i] << " \n"[i == n] ;
    for (int i = 1 ; i <= n ; ++ i)
        A[i] = -A[i], B[i] = -B[i] ;
    solve() ;
    for (int i = 1 ; i <= n ; ++ i)
        cout << res[i] << " \n"[i == n] ;
    return 0 ;
}