Keywords Search AC自动机QAQ
生活随笔
收集整理的這篇文章主要介紹了
Keywords Search AC自动机QAQ
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
AC自動機,一直以來都以為是一個非常高大上的算法,其實它還真的挺高大上的。
首先來說,ac自動機的思想與kmp類似,需要自己模擬來理解。
給兩個博客:
http://www.cppblog.com/menjitianya/archive/2014/07/10/207604.html
https://blog.csdn.net/KXL5180/article/details/88093307
還有bibi上有個挺好的視頻可以看一下,有助于理解
板子分為3個部分來:
首先對于需要的數組
int cnt,root;//cnt表示樹的某個節點位置;root表示根,其實就是0;
int fail[maxn];//表示上一個他這個字符的位置。
int ch[maxn][30];//用來表示一個新的節點,存的值是下一個字符的位置
int val[maxn];//表示某個節點的有效值,就是以該點串串結尾的個數
1.建樹。建立字典樹,這里開了靜態的空間來裝線段樹。
int cnt,root; //N=26;
void init(){cnt=0;root=newnode();}int newnode()//建立新的一個節點,并初始化fail指針與val值為0;{for(int i=0;i<N;i++)ch[cnt][i]=0;val[cnt]=fail[cnt++]=0;return cnt-1;}
void insert(char *s)//插入某一個字符串{int len=strlen(s);int u=0;for(int i=0;i<len;i++){int v=s[i]-'a';if(!ch[u][v])//如果有該點就不開新節點ch[u][v]=newnode();//沒有就開新節點u=ch[u][v];}val[u]++;//每當加完一個新的字符串,結尾其實就是節點要val值加1,表示這點是某個串串的結束}
2.建立fail指針。
fail指針的意義就是如果找一個點的時候,你可以找他的fail指針找到有相同作用的點,當某個點尋找下一點失敗的時候有fail指針引導你下次應該跳轉的位置。自己并不能說的很清楚。
可以參考博客:https://blog.csdn.net/u013371163/article/details/60469145
void getfail(){queue<int >q;int u=0;for(int i=0;i<N;i++)//找到連接root節點的點,加入隊列fail指針已經是0了不用重新賦值。if(ch[u][i])q.push(ch[u][i]);while(!q.empty())//類似于bfs的搜索方式{u=q.front();q.pop();for(int i=0;i<N;i++){if(ch[u][i])//如果u節點有下對應的(i+‘a’){fail[ch[u][i]]=ch[fail[u]][i];//這個點fail指針就是連接到他父親的fail指針對應位置下的那個'a'+i字母的位置。//因為假設u點的fail的位置為v,那么v這個點的作用其實同u點,那么ch[v][i]即v下邊如果有那個'a'+i字母,那么這個位置之前已經知道了,賦過去就行//如果沒有呢,那么其實之前開辟新節點也是處理過的,fail[cnt][i]=0,那么他的fail指針就是指向0,就是根節點。q.push(ch[u][i]);}elsech[u][i]=ch[fail[u]][i];//如果u沒有'a'+i這個字母,就把它的位置(注意是位置)直接跳到上邊解釋的位置,查詢的時候模擬一下就知道了}}}
3.查找某個串的匹配串有幾種。
int query(char *s)//查詢的時候是需要自己模擬一下{int len=strlen(s);int u=0,ans=0;for(int i=0;i<len;i++){int v=s[i]-'a';u=ch[u][v];//找到u下邊的'a'+i字母的位置for(int j=u;j&&~val[j];j=fail[j])//fail指針走到根節點,或者某個點走過了{ans+=val[j];//加上某個節點的值,其實就是加上串尾點val[j]=-1;//標記為走過}}return ans;}
AC代碼
#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
#include<math.h>
#include<set>
#include<stack>
#include<vector>
#include<map>
#include<queue>
#define myself i,l,r
#define lson i<<1
#define rson i<<1|1
#define Lson i<<1,l,mid
#define Rson i<<1|1,mid+1,r
#define half (l+r)/2
#define inff 0x3f3f3f3f
#define lowbit(x) x&(-x)
#define me(a,b) memset(a,b,sizeof(a))
#define min4(a,b,c,d) min(min(a,b),min(c,d))
#define min3(x,y,z) min(min(x,y),min(y,z))
#define max4(a,b,c,d) max(max(a,b),max(c,d))
#define max3(x,y,z) max(max(x,y),max(y,z))
typedef long long ll;
using namespace std;
const int maxn=5e5+5;
const int maxm=1e6+5;
const int N=26;
struct AC
{int cnt,root;int fail[maxn];int ch[maxn][30];int val[maxn];int newnode(){for(int i=0;i<N;i++)ch[cnt][i]=0;val[cnt]=fail[cnt++]=0;return cnt-1;}void init(){cnt=0;root=newnode();}void insert(char *s){int len=strlen(s);int u=0;for(int i=0;i<len;i++){int v=s[i]-'a';if(!ch[u][v])ch[u][v]=newnode();u=ch[u][v];}val[u]++;}void getfail(){queue<int >q;int u=0;for(int i=0;i<N;i++)//找到連接root節點的點,加入隊列fail指針已經是0了不用重新賦值。if(ch[u][i])q.push(ch[u][i]);while(!q.empty())//類似于bfs的搜索方式{u=q.front();q.pop();for(int i=0;i<N;i++){if(ch[u][i])//如果u節點有下對應的(i+‘a’){fail[ch[u][i]]=ch[fail[u]][i];//這個點fail指針就是連接到他父親的fail指針對應位置下的那個'a'+i字母的位置。//因為假設u點的fail的位置為v,那么v這個點的作用其實同u點,那么ch[v][i]即v下邊如果有那個'a'+i字母,那么這個位置之前已經知道了,賦過去就行//如果沒有呢,那么其實之前開辟新節點也是處理過的,fail[cnt][i]=0,那么他的fail指針就是指向0,就是根節點。q.push(ch[u][i]);}elsech[u][i]=ch[fail[u]][i];//如果u沒有'a'+i這個字母,就把它的位置(注意是位置)直接跳到上邊解釋的位置,查詢的時候模擬一下就知道了}}}int query(char *s)//查詢的時候是需要自己模擬一下{int len=strlen(s);int u=0,ans=0;for(int i=0;i<len;i++){int v=s[i]-'a';u=ch[u][v];//找到u下邊的'a'+i字母的位置for(int j=u;j&&~val[j];j=fail[j])//fail指針走到根節點,或者某個點走過了{ans+=val[j];//加上某個節點的值,其實就是加上串尾點val[j]=-1;//標記為走過}}return ans;}
}AC;
char str[maxm];
int main()
{int t,n;cin>>t;while(t--){scanf("%d",&n);AC.init();while(n--){scanf("%s",str);AC.insert(str);}AC.getfail();scanf("%s",str);printf("%d\n",AC.query(str));}return 0;
}
?
總結
以上是生活随笔為你收集整理的Keywords Search AC自动机QAQ的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KMP-next数组
- 下一篇: HDU 3065病毒侵袭持续中 AC自动