1.题目链接。题目大意:给定一个字符串,求一个字串,这个字串在母串中出现了K次并且长度最长。输出这个最长的长度。
2.应该算是后缀数组的经典题目了,首先求出SA和高度数组之后,二分一下答案即可。这里简单的解释一下,我们知道,Height数组的意义:Height[i]=lcp(sa[i],sa[i-1])。也就是说,height[i]的意义就是排名第i和第i-1的后缀的最长公共前缀,这个前缀就是我们要找的那个出现了k次的字串。得到高度数组之后,对于每个长度,我们O(N)的找一遍,看一下每个lcp的长度,是不是超过了当前的长度,如果是,那么满足条件的字串的数量就+1,如果发现这个数量等于K了,就直接可以退出了。注意,这里有一个连续性,当循环的时候,发现有一个不满足条件,这个时候计数的应该重新设置成1,因为这时候说明字串中断了,不再符合条件。
using namespace std;
const int maxn = 20005;
int sa[maxn], t1[maxn], t2[maxn], c[maxn];
int ranks[maxn], height[maxn], s[maxn];
bool cmp(int* r, int a, int b, int l) {
return r[a] == r[b] && r[a + l] == r[b + l];
}
void build_sa(int s[], int n, int m)
{
int i, j, p, * x = t1, * y = t2;
for (i = 0; i < m; ++i) c[i] = 0;
for (i = 0; i < n; ++i) c[x[i] = s[i]]++;
for (i = 1; i < m; ++i) c[i] += c[i - 1];
for (i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
for (j = 1; j <= n; j <<= 1) {
p = 0;
for (i = n - j; i < n; ++i) y[p++] = i;
for (i = 0; i < n; ++i) {
if (sa[i] >= j) y[p++] = sa[i] - j;
}
for (i = 0; i < m; ++i) c[i] = 0;
for (i = 0; i < n; ++i) c[x[y[i]]]++;
for (i = 1; i < m; ++i) c[i] += c[i - 1];
for (i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1;
x[sa[0]] = 0;
for (i = 1; i < n; ++i)
x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
if (p >= n) break;
m = p;
}
}
void getHeight(int s[], int n)
{
int i, j, k = 0;
for (i = 0; i <= n; ++i) ranks[sa[i]] = i;
for (i = 0; i < n; ++i)
{
if (k) k--;
j = sa[ranks[i] - 1];
while (s[i + k] == s[j + k]) k++;
height[ranks[i]] = k;
}
}
/*
height[i]=lcp(sa(i),sa(i-1)).表示排名为i的后缀和排名为i-1的后缀的最长的公共前缀。这个最长的公共前缀及时重复出现的字串。
所以扫描一遍整个sa数组,这个公共的前缀是具有传递性的
*/
bool check(int n, int k, int t)
{
int num = 1;
for (int i = 2; i <= n; i++)
{
if (height[i] >= t)
{
num++;
if (num >= k)return true;
}
else num = 1;
}
return false;
}
int main()
{
int n, k;
while (~scanf("%d%d", &n, &k))
{
int mmax = 0;
for (int i = 0; i < n; i++)
{
scanf("%d", &s[i]);
mmax = max(mmax, s[i]);
}
s[n] = 0;
build_sa(s, n + 1, mmax + 1);
getHeight(s, n);
int l = 0, r = n, ans = 0;
while (l <= r)
{
int mid = l + r >> 1;
if (check(n, k, mid))
{
ans = mid;
l = mid + 1;
}
else r = mid - 1;
}
cout << ans << endl;
}
}