日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

后缀数组SA

發布時間:2023/12/3 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 后缀数组SA 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

后綴數組SA

模板

花了不少時間才理解倍增求SASASA的實現方法,我還是太菜了。

定義sa[i]sa[i]sa[i]表示排名為iii的后綴的起始位置。
定義rank[i]rank[i]rank[i]表示起始位置為iii的后綴的排名。
顯然兩者之前互逆。

void solve() {int m=122;for (int i=1;i<=m;i++) cnt[i]=0;for (int i=1;i<=n;i++) cnt[x[i]=a[i]]++;for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1];for (int i=n;i>=1;i--) sa[cnt[x[i]]--]=i;for (int k=1;k<=n;k<<=1){int p=0;for (int i=1;i<=m;i++) y[i]=0;for (int i=n-k+1;i<=n;i++) y[++p]=i;for (int i=1;i<=n;i++) if (sa[i]>k) y[++p]=sa[i]-k;for (int i=0;i<=m;i++) cnt[i]=0;for (int i=1;i<=n;i++) cnt[x[y[i]]]++;for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1];for (int i=n;i>=1;i--) sa[cnt[x[y[i]]]--]=y[i];swap(x,y);x[sa[1]]=p=1;for (int i=2;i<=n;i++)x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?p:++p;if (p>=n) break;m=p;} }

Height以及LCP

定義LCP(x,y)LCP(x,y)LCP(x,y)表示字符串xxxyyy之間的最長公共前綴長度。

定義height[i]height[i]height[i]表示suffix[sa[i?1]]suffix[sa[i-1]]suffix[sa[i?1]]suffix[sa[i]]suffix[sa[i]]suffix[sa[i]]LCPLCPLCP的長度,即相鄰排名的后綴的LCPLCPLCP長度。

容易發現一個性質
對于任意的j,kj,kj,k,若rank[j[<rank[k]rank[j[<rank[k]rank[j[<rank[k],則suffix(j),suffix(k)suffix(j),suffix(k)suffix(j),suffix(k)LCPLCPLCP的長度為
mini=rank[j]+1rank[k]height[i]min_{i=rank[j]+1}^{rank[k]}height[i] mini=rank[j]+1rank[k]?height[i]
即兩個后綴j,kj,kj,kLCPLCPLCP長度是排名在它們之間所有的后綴(包括suffix(k)suffix(k)suffix(k))的heightheightheight值的最小值。

根據這一性質,倘若我們可以求出height[i]height[i]height[i],我們就可以通過STSTST表,O(nlgn)O(nlgn)O(nlgn)預處理,O(1)O(1)O(1)詢問兩個后綴的LCPLCPLCP答案了。

而對于heightheightheight數組,也有一個重要的性質:
height[i?1]?1≤height[i]height[i-1]-1\leq height[i] height[i?1]?1height[i]
于是可以O(n)O(n)O(n)計算heightheightheight了。

void get_height() {for (int i=1;i<=n;i++) rnk[sa[i]]=i;for (int i=1,j=0;i<=n;i++){if (j) j--;while (a[i+j]==a[sa[rnk[i]-1]+j]) j++;height[rnk[i]]=j;} }

SA的簡單應用

1.求最長重復子串

答案為heightheightheight最大值。

2.求最長重復k次子串

二分答案,轉化為判斷是否存在長度為xxx的子串重復至少kkk次。將所有相鄰且heightheightheight大于等于xxx的都分在一組,判斷是否有一組的后綴個數大于kkk即可。

時間復雜度O(n)O(n)O(n)

3.本質不同子串個數

答案為產生的新串數量-重復出現的串的數量。
∑i(n?i+1)?height[rnk[i]]\sum_{i} (n-i+1)-height[rnk[i]]i?(n?i+1)?height[rnk[i]]

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的后缀数组SA的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。