题解 P5410 【【模板】扩展 KMP】
一、引言
一个算是冷门的算法(在竞赛上),不过其算法思想值得深究。
二、前置知识
-
kmp 的算法思想,具体可以参考这篇日报。
-
trie 树(字典树)。
三、经典扩展 kmp 模板问题:
扩展 kmp 的模板问题:
给你两个字符串
s,t ,长度分别为n,m 。请输出
s 的每一个后缀与t 的最长公共前缀。
哈希是不可能的,这辈子都不可能的。
AC 自动机?好像更不可做了。
我们先定义一个:
注:以下字符串均从1开始计位。
例子:
如果
也就是
我们设
此时
由
注:以下所写的“线”相等指的是长度和字符都相等
即
然后由
又因为
所以
又因为
所以
所以这段的代码比较简单:
if(i+nxt[i-p0]<extend[p0]+p0)extend[i]=nxt[i-p0];
//i相当于k+1
//nxt[i-p0]相当于L
//extend[p0]+p0相当于p
//因为在代码里我是从0开始记字符串的,所以本应在小于号左侧减1,现在不用了。
第二种情况:p\leqslant k+L
也就是
图可能略丑
同样,我们设
此时
同理,
那么我们设
那么
又因为:
即
所以
也就是说
即
那么我们就可以从
那么这段的代码长这样:
int now=extend[p0]+p0-i;
now=max(now,0);//这里是防止i>p
while(t[now]==s[i+now]&&now<(int)t.size()&&now+i<(int)s.size())now++;//暴力求解的过程
extend[i]=now;
p0=i;//更新p0
求 next
求
求 T 的每一个后缀与 T 的最长公共前缀长度
听起来好熟悉,我们再看一下题面:
求 S 的每一个后缀与 T 的最长公共前缀长度
我们发现求 直接复制重新打一遍就好了。
这其实和 kmp 的思想很相似,因为 kmp 也是自己匹配一遍自己,再匹配文本串。
要注意的一点是:求
时间复杂度
因为求
Code
#include<bits/stdc++.h>
#define N 20000010
using namespace std;
int q,nxt[N],extend[N];
int slen,tlen;
char s[N],t[N];
void getnxt()
{
nxt[0]=tlen;//nxt[0]一定是T的长度
int now=0;
while(t[now]==t[1+now]&&now+1<tlen)now++;//这就是从1开始暴力
nxt[1]=now;
int p0=1;
for(register int i=2;i<tlen;i++)
{
if(i+nxt[i-p0]<nxt[p0]+p0)nxt[i]=nxt[i-p0];//第一种情况
else
{//第二种情况
now=nxt[p0]+p0-i;
now=max(now,0);//这里是为了防止i>p的情况
while(t[now]==t[i+now]&&i+now<tlen)now++;//暴力
nxt[i]=now;
p0=i;//更新p0
}
}
}
void exkmp()
{
getnxt();
int now=0;
while(s[now]==t[now]&&now<min(slen,tlen))now++;//暴力
extend[0]=now;
int p0=0;
for(register int i=1;i<slen;i++)
{
if(i+nxt[i-p0]<extend[p0]+p0)extend[i]=nxt[i-p0];//第一种情况
else
{//第二种情况
now=extend[p0]+p0-i;
now=max(now,0);//这里是为了防止i>p的情况
while(t[now]==s[i+now]&&now<tlen&&now+i<slen)now++;//暴力
extend[i]=now;
p0=i;//更新p0
}
}
}
int main()
{
scanf("%s%s",s,t);
slen=strlen(s),tlen=strlen(t);
exkmp();
long long z=0,p=0;
for(register int i=0;i<tlen;i++)z^=1ll*(i+1)*(nxt[i]+1);//输出nxt
for(register int i=0;i<slen;i++)p^=1ll*(i+1)*(extend[i]+1);//输出extend
printf("%lld\n%lld\n",z,p);
return 0;
}