先二分答案,然後將尾碼分成若干組,判斷的是有沒有一個組的尾碼個數不小於k。如果有,那麼存在k 個相同的子串滿足條件,否則不存在。這個做法的時間複雜度為O(nlogn)。
這裡有一個地方要注意的,就是計數每一組的時候cnt初始值為1,因為height數組是兩兩之間比較的,當有1個height滿足後就相當於有兩個尾碼滿足。
#define N 1000010#define maxn 20010int wa[maxn],wb[maxn],wv[N],wss[N];//論文模板的ws竟然跟g++裡的關鍵字衝突!int r[maxn],sa[maxn];int cmp(int *r,int a,int b,int l){return r[a]==r[b] && r[a+l]==r[b+l];}/*【倍增演算法O(nlgn)】待排序的字串放在r 數組中,從r[0]到r[n-1],長度為n,且最大值小於m 使用倍增演算法前,需要保證r數組的值均大於0。然後要在原字串後添加一個0號字元 所以,若原串的長度為n,則實際要進行尾碼數組構建的r數組的長度應該為n+1.所以調用da函數時,對應的n應為n+1.*/void da(int *r,int *sa,int n,int m){//n要加1 int i,j,p,*x=wa,*y=wb,*t; for(i=0;i<m;i++) wss[i]=0; for(i=0;i<n;i++) wss[x[i]=r[i]]++; for(i=1;i<m;i++) wss[i]+=wss[i-1]; for(i=n-1;i>=0;i--) sa[--wss[x[i]]]=i; for(j=1,p=1;p<n;j*=2,m=p){ for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<n;i++) wv[i]=x[y[i]]; for(i=0;i<m;i++) wss[i]=0; for(i=0;i<n;i++) wss[wv[i]]++; for(i=1;i<m;i++) wss[i]+=wss[i-1]; for(i=n-1;i>=0;i--) sa[--wss[wv[i]]]=y[i]; for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } return;}int rank[maxn],height[maxn];//rank[i]:i排第幾;sa[i]:排第i的尾碼串在哪裡,互為逆運算void calheight(int *r,int *sa,int n){//n不用加1 int i,j,k=0; for(i=1;i<=n;i++) rank[sa[i]]=i; for(i=0;i<n;height[rank[i++]]=k){ for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++); } return;}bool chk(int mid,int n,int k){ int i,j; int cnt=1;//注意! for(i=1;i<=n;i++){ if(height[i]>=mid){ cnt++; if(cnt == k)return true; } else cnt=1;//注意! } return false;}int main(){ int n; int k; while(scanf("%d%d",&n,&k) != -1){ int i,j;int m = 0; for(i=0;i<n;i++){ scanf("%d",&r[i]); r[i]++; m = max(m,r[i]); } r[n] = 0; da(r,sa,n+1,m+1); calheight(r,sa,n); int l=0,r = n,mid; int ans = 0; while(l<=r){ mid = (l+r)>>1;//mid = 長度 if(chk(mid,n,k)){ ans = mid; l = mid+1; } else r = mid-1; } printf("%d\n",ans); } return 0;}