字符串hash(一)
很久沒遇到過hash的題了,今天來重新溫故一下
文章目錄
- 序言
- 常用的幾個字符串hash方法:
- hash公式(自然溢出)
- 講解
- 模板
- 單hash
- 講解
- 模板
- 雙hash
- 講解
- 代碼
- 總結
序言
你有沒有想過,字符串存儲一大溜,比較時又麻煩又折騰,我當年oi時就想要是能轉化成整數就好了,
誒,字符串hash其實就是把一個字符串轉化成整數
你也可以把hash的過程理解成加密,但是不同字符串加密后的“密文”互不相同
說起來容易,我們怎么才能做到不沖突不重復呢?這里就開始講解hash
常用的幾個字符串hash方法:
S=s1s2s3s4…sn
idx(s[i]) = s[i] - ‘a’
hash公式(自然溢出)
講解
unsigned long long hash[N];
hash[i]=hash[i-1]*p + s[ i ] (自動取模)
p為質數(常取31)
unsigned long long的范圍會自然一處,相當于自動對264 取獏
模板
char s[10010]; ull hashs(char s[]) {int len=strlen(s);ull base=131;ull ans=0;for (int i=1;i<=len;i++)ans=ans*base+(ull)s[i];return ans&0x7fffffff;//舍棄符號位 }首位是符號位,& 0x7fffffff之后符號位固定為0(代表正數),后面保持不變(可以理解成取正)
單hash
講解
hash [ i ] = ( hash [ i - 1 ] * p + idx ( s [ i ] ) ) % mod
其中p與mod均為質數
對了,p與mod越大,重復的概率越低
模板
char s[10010]; ull mod=101; ull hashs(char s[]) {int len=strlen(s);ull base=13;ull ans=0;for (int i=1;i<=len;i++)ans=(ans*base+(ull)s[i])%mod;return ans; }雙hash
講解
如果單hash你不放心,可以用雙hash,更保險
將一個字符串hash兩次,生成一個二元組,來代表原字符串,兩個都比配才可以(相當于兩把鎖)
hash1[i]=(hash1[i?1]) ? p + idx(s[i]) % mod1
hash2[i]=(hash2[i?1])?p + idx (s[i]) % mod2
pair< hash1 , hash2 > 表示一個字符串!
代碼
char s[100]; ull mod1=13; ull mod2=17; ull hash1(char s[]) {int len=strlen(s);ull ans=0;for (int i=0;i<len;i++)ans=(ans*base+(ull)s[i])%mod1;return ans; } ull hash2(char s[]) {int len=strlen(s);ull ans=0;for (int i=0;i<len;i++)ans=(ans*base+(ull)s[i])%mod2;return ans; }總結
對于一個字符串,我們可以預處理1~L的hash值,這樣通過O(1)的方法遞推出來
總結
以上是生活随笔為你收集整理的字符串hash(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 闻风而动是什么意思 闻风而动释义
- 下一篇: 牛客网 【每日一题】5月9日 过河