BF,KMP,BM三种字符串匹配算法性能比较
三種最基本的字符串匹配算法是BF,KMP以及BM,BF算法是最簡單直接的匹配算法,就是逐個比較,一旦匹配不上,就往后移動一位,繼續(xù)比較,所以比較次數(shù)很都。
關于KMP和BM的詳細介紹可以參考下面的兩個link,是講得比較好的。
KMP
http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html
BM
http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html
理論上,BM具有最好的性能,因為比較的次數(shù)最好,其次是KMP,最差的應該是BF。
今天對這三種算法做了一個簡單的測試,測試程序運行在Windows 7 x64位系統(tǒng)上,四核CPU,32G內(nèi)存,測試程序為x64。
說明,只測試在目標字符串中找不到要搜索的字符串,以便能夠遍歷完所有字符串。
測試1,在1億個字符串(100M)搜索一個長度為20字節(jié)字符串,結(jié)果如下:
BF spent time is 171(ms)
KMP spent time is 422(ms)
BM spent time is 15(ms)
最快的是BM算法,花的時間也最少(15ms).
測試2, 在10億個字符串中(1G)中搜索一個長度為20字節(jié)的字符串,結(jié)果如下:
BF spent time is 1670(ms)
KMP spent time is 4321(ms)
BM spent time is 203(ms)
結(jié)果和測試一基本一致。
通過這兩次測試,很奇怪的是KMP算法居然比BF算法花的時間還多,說明KMP雖然理論上有很好的性能,但實際上很難有所作為,大多數(shù)情況下還不如BF算法。但是BM算法確實在大多數(shù)情況下都具有很好的性能體現(xiàn)。
總結(jié)
以上是生活随笔為你收集整理的BF,KMP,BM三种字符串匹配算法性能比较的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Cluster 注册表操作方法
- 下一篇: GDB中应该知道的几个调试方法