PKU2774(Long Long Message)求最長公用子串(尾碼數組)

來源:互聯網
上載者:User
/*******************************************************題目大意:給定兩個字串A和B,求最長公用子串;演算法思想:字串的任何一個子串都是這個字串的某個尾碼的首碼;求A和B的最長公用子串等價於求A的尾碼和B的尾碼的最長公用首碼的最大值;如果枚舉A和B的所有的尾碼,很明顯效率低下;由於要計算A的尾碼和B的尾碼的最長公用首碼,所以先將第二個字串寫在第一個字串後面,中間用一個沒有出現過的字元隔開,再求這個新的字串的尾碼數組;尾碼是指從某個位置i開始到整個串末尾結束的一個特殊子串;字串r的從第i個字元開始的尾碼表示為Suffix(i),也就是Suffix(i)=r[i...len(r)];尾碼數組儲存的是一個字串的所有尾碼的排序結果;其中SA[i]儲存的是字串所有的尾碼中第i小的尾碼的開頭位置;定義height[i]=suffix(sa[i-1])和suffix(sa[i])的最長公用首碼,也就是排名相鄰的兩個尾碼的最長公用首碼;只有當suffix(sa[i-1])和suffix(sa[i])不是同一個字串中的兩個尾碼時,height[i]才是滿足條件的,即滿足條件的height數組的最大值就是這兩個字串的最長公用子串;********************************************************/#include<iostream>#include<cstring>#include<cstdlib>#include<cstdio>#include<climits>#include<algorithm>using namespace std;const int N=200010;const int M=128;//r數組的最大值#define F(x) ((x)/3+((x)%3==1?0:tb))#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)int wa[N],wb[N],wv[N],_ws[M];int c0(int *r,int a,int b){    return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2];}int c12(int k,int *r,int a,int b){    if(k==2)        return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1);    else        return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1];}void sort(int *r,int *a,int *b,int n,int m){    for(int i=0; i<n; i++)        wv[i]=r[a[i]];    for(int i=0; i<m; i++)        _ws[i]=0;    for(int i=0; i<n; i++)        _ws[wv[i]]++;    for(int i=1; i<m; i++)        _ws[i]+=_ws[i-1];    for(int i=n-1; i>=0; i--)        b[--_ws[wv[i]]]=a[i];    return;}void dc3(int *r,int *sa,int n,int m){    int *rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;    r[n]=r[n+1]=0;    for(int i=0; i<n; i++)    {        if(i%3!=0)            wa[tbc++]=i;    }    sort(r+2,wa,wb,tbc,m);    sort(r+1,wb,wa,tbc,m);    sort(r,wa,wb,tbc,m);    p=1,rn[F(wb[0])]=0;    for(int i=1; i<tbc; i++)    {        rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;    }    if(p<tbc)        dc3(rn,san,tbc,p);    else        for(int i=0; i<tbc; i++)            san[rn[i]]=i;    for(int i=0; i<tbc; i++)    {        if(san[i]<tb)            wb[ta++]=san[i]*3;    }    if(n%3==1)        wb[ta++]=n-1;    sort(r,wb,wa,ta,m);    for(int i=0; i<tbc; i++)        wv[wb[i]=G(san[i])]=i;    int i,j;    for(i=0,j=0,p=0; i<ta && j<tbc; p++)    {        sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];    }    for(; i<ta; p++)        sa[p]=wa[i++];    for(; j<tbc; p++)        sa[p]=wb[j++];    return;}int rank[N],height[N];void calheight(int *r,int *sa,int n){    int i,j,k=0;    for(int i=1; i<=n; i++)        rank[sa[i]]=i;    for(int i=0; i<n; height[rank[i++]]=k)    {        for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++);    }    return;}char s[N];int r[N*3],sa[N*3];int main(){    //freopen("C:\\Users\\Administrator\\Desktop\\kd.txt","r",stdin);    while(~scanf("%s",s))    {        int j=strlen(s);        s[j]=1;        scanf("%s",s+j+1);        int n=strlen(s);        for(int i=0; i<n; i++)            r[i]=s[i];        r[n]=0;        dc3(r,sa,n+1,M);//128:字串中最大的字元+1        calheight(r,sa,n);        int ans=0;        for(int i=2; i<=n; i++)        {            if(height[i]>ans)            {                if((j<sa[i-1] && j>sa[i])|| (j>sa[i-1] && j<sa[i]))                    ans=height[i];            }        }        printf("%d\n",ans);    }    return 0;}

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.