Manacher's Algorithm 马拉车算法(最长回文串)
這個(gè)馬拉車算法Manacher‘s Algorithm是用來(lái)查找一個(gè)字符串的最長(zhǎng)回文子串的線性方法,由一個(gè)叫Manacher的人在1975年發(fā)明的,這個(gè)方法的最大貢獻(xiàn)是在于將時(shí)間復(fù)雜度提升到了線性,這是非常了不起的。對(duì)于回文串想必大家都不陌生,就是正讀反讀都一樣的字符串,比如 "bob", "level", "noon" 等等,那么如何在一個(gè)字符串中找出最長(zhǎng)回文子串呢,可以以每一個(gè)字符為中心,向兩邊尋找回文子串,在遍歷完整個(gè)數(shù)組后,就可以找到最長(zhǎng)的回文子串。但是這個(gè)方法的時(shí)間復(fù)雜度為O(n*n),并不是很高效,下面我們來(lái)看時(shí)間復(fù)雜度為O(n)的馬拉車算法。
由于回文串的長(zhǎng)度可奇可偶,比如"bob"是奇數(shù)形式的回文,"noon"就是偶數(shù)形式的回文,馬拉車算法的第一步是預(yù)處理,做法是在每一個(gè)字符的左右都加上一個(gè)特殊字符,比如加上'#',那么
bob ? ?--> ? ?#b#o#b#
noon ? ?--> ? ?#n#o#o#n#?
這樣做的好處是不論原字符串是奇數(shù)還是偶數(shù)個(gè),處理之后得到的字符串的個(gè)數(shù)都是奇數(shù)個(gè),這樣就不用分情況討論了,而可以一起搞定。接下來(lái)我們還需要和處理后的字符串t等長(zhǎng)的數(shù)組p,其中p[i]表示以t[i]字符為中心的回文子串的半徑,若p[i] = 1,則該回文子串就是t[i]本身,那么我們來(lái)看一個(gè)簡(jiǎn)單的例子:
# 1 # 2 # 2 # 1 # 2 # 2 #
1 2 1 2 5 2 1 6 1 2 3 2 1
由于第一個(gè)和最后一個(gè)字符都是#號(hào),且也需要搜索回文,為了防止越界,我們還需要在首尾再加上非#號(hào)字符,實(shí)際操作時(shí)我們只需給開(kāi)頭加上個(gè)非#號(hào)字符,結(jié)尾不用加的原因是字符串的結(jié)尾標(biāo)識(shí)為'\0',等于默認(rèn)加過(guò)了。通過(guò)p數(shù)組我們就可以找到其最大值和其位置,就能確定最長(zhǎng)回文子串了,那么下面我們就來(lái)看如何求p數(shù)組,需要新增兩個(gè)輔助變量mx和id,其中id為最大回文子串中心的位置,mx是回文串能延伸到的最右端的位置,這個(gè)算法的最核心的一行如下:
?
p[i] = mx > i ? min(p[2 * id - i], mx - i) : 1;?
可以這么說(shuō),這行要是理解了,那么馬拉車算法基本上就沒(méi)啥問(wèn)題了,那么這一行代碼拆開(kāi)來(lái)看就是
如果mx > i, 則 p[i] = min(p[2 * id - i], mx - i)
否則, p[i] = 1
當(dāng) mx - i > P[j] 的時(shí)候,以S[j]為中心的回文子串包含在以S[id]為中心的回文子串中,由于 i 和 j 對(duì)稱,以S[i]為中心的回文子串必然包含在以S[id]為中心的回文子串中,所以必有 P[i] = P[j],見(jiàn)下圖。
?
?
當(dāng) P[j] >= mx - i 的時(shí)候,以S[j]為中心的回文子串不一定完全包含于以S[id]為中心的回文子串中,但是基于對(duì)稱性可知,下圖中兩個(gè)綠框所包圍的部分是相同的,也就是說(shuō)以S[i]為中心的回文子串,其向右至少會(huì)擴(kuò)張到mx的位置,也就是說(shuō) P[i] >= mx - i。至于mx之后的部分是否對(duì)稱,就只能老老實(shí)實(shí)去匹配了。
對(duì)于 mx <= i 的情況,無(wú)法對(duì) P[i]做更多的假設(shè),只能P[i] = 1,然后再去匹配了。
?
參見(jiàn)如下實(shí)現(xiàn)代碼:
?
#include <vector> #include <iostream> #include <string>using namespace std;string Manacher(string s) {// Insert '#'string t = "$#";for (int i = 0; i < s.size(); ++i) {t += s[i];t += "#";}// Process tvector<int> p(t.size(), 0);int mx = 0, id = 0, resLen = 0, resCenter = 0;for (int i = 1; i < t.size(); ++i) {p[i] = mx > i ? min(p[2 * id - i], mx - i) : 1;while (t[i + p[i]] == t[i - p[i]]) ++p[i];if (mx < i + p[i]) {mx = i + p[i];id = i;}if (resLen < p[i]) {resLen = p[i];resCenter = i;}}return s.substr((resCenter - resLen) / 2, resLen - 1); }int main() {string s1 = "12212";cout << Manacher(s1) << endl;string s2 = "122122";cout << Manacher(s2) << endl;string s = "waabwswfd";cout << Manacher(s) << endl; }轉(zhuǎn)載于:https://www.cnblogs.com/yzm10/p/8407501.html
總結(jié)
以上是生活随笔為你收集整理的Manacher's Algorithm 马拉车算法(最长回文串)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: jquery中的创建节点和添加节点的方法
- 下一篇: Cesium调用Geoserver发布的