日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

云漫圈 | 什么是字符串匹配算法?

發布時間:2024/8/23 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 云漫圈 | 什么是字符串匹配算法? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者 | 程序員小灰

來源 | 程序員小灰(ID:chengxuyuanxiaohui?)

—————? 第二天? —————


什么意思呢?讓我們來舉一個例子:

在上圖中,字符串B是A的子串,

B第一次在A中出現的位置下標是2(字符串的首位下標是0),

所以返回 2。

我們再看另一個例子:

在上圖中,字符串B在A中并不存在,

所以返回 -1。

為了統一概念,

在后文中,

我們把字符串A稱為主串,

把字符串B稱為模式串。

小灰的想法簡單粗暴,

讓我們用下面的例子來演示一下:

第一輪,我們從主串的首位開始,

把主串和模式串的字符逐個比較:

顯然,主串的首位字符是a,

模式串的首位字符是b,兩者并不匹配。

第二輪,我們把模式串后移一位,

從主串的第二位開始,

把主串和模式串的字符逐個比較:

主串的第二位字符是b,

模式串的第二位字符也是b,

兩者匹配,繼續比較:

主串的第三位字符是b,

模式串的第三位字符也是c,

兩者并不匹配。

第三輪,我們把模式串再次后移一位,

從主串的第三位開始,

把主串和模式串的字符逐個比較:

主串的第三位字符是b,

模式串的第三位字符也是b,

兩者匹配,繼續比較:

主串的第四位字符是c,

模式串的第四位字符也是c,

兩者匹配,繼續比較:

主串的第五位字符是e,

模式串的第五位字符也是e,

兩者匹配,比較完成!

由此得到結果,

模式串 bce 是主串 abbcefgh 的子串,

在主串第一次出現的位置下標是 2:

以上就是小灰想出的解決方案,

這個算法有一個名字,叫做BF算法,

是Brute Force(暴力算法)的縮寫。

上圖的情況,在每一輪進行字符匹配時,

模式串的前三個字符a都和主串中的字符相匹配,

一直檢查到模式串最后一個字符b,才發現不匹配:

這樣一來,

兩個字符串在每一輪都需要白白比較4次,

顯然非常浪費。

假設主串的長度是m,

模式串的長度是n,

那么在這種極端情況下,

BF算法的最壞時間復雜度是O(mn)。

————————————

比較哈希值是什么意思呢?

用過哈希表的朋友們都知道,

每一個字符串都可以通過某種哈希算法,

轉換成一個整型數,

這個整型數就是hashcode:

hashcode = hash(string)

顯然,相對于逐個字符比較兩個字符串,

僅比較兩個字符串的hashcode要容易得多。

給定主串和模式串如下

(假定字符串只包含26個小寫字母):

第一步,

我們需要生成模式串的hashcode。

生成hashcode的算法多種多樣,比如:

按位相加

這是最簡單的方法,

我們可以把a當做1,b當做2,c當做3......

然后把字符串的所有字符相加,

相加結果就是它的hashcode。

bce =??2 + 3 + 5 =?10

但是,這個算法雖然簡單,

卻很可能產生hash沖突,

比如bce、bec、cbe的hashcode是一樣的。

轉換成26進制數

既然字符串只包含26個小寫字母,

那么我們可以把每一個字符串當成一個26進制數來計算。

bce =?2*(26^2) +?3*26 +?5 =?1435

這樣做的好處是大幅減少了hash沖突,

缺點是計算量較大,

而且有可能出現超出整型范圍的情況,

需要對計算結果進行取模。

為了方便演示,

后續我們采用的是按位相加的hash算法,

所以bce的hashcode是10:

第二步,

生成主串當中第一個等長子串的hashcode。

由于主串通常要長于模式串,

把整個主串轉化成hashcode是沒有意義的,

只有比較主串當中和模式串等長的子串才有意義。

因此,

我們首先生成主串中第一個和模式串等長的子串hashcode,

即abb = 1 + 2 + 2 = 5:

第三步,比較兩個hashcode。

顯然,5!=10,

說明模式串和第一個子串不匹配,

我們繼續下一輪比較。

第四步,

生成主串當中第二個等長子串的hashcode。

bbc = 2 + 2 + 3 = 7:

第五步,比較兩個hashcode。

顯然,7!=10,說明模式串和第二個子串不匹配,

我們繼續下一輪比較。

第六步,生成主串當中第三個等長子串的hashcode。

bce= 2 + 3 + 5 = 10:

第七步,比較兩個hashcode。

顯然,10 ==10,兩個hash值相等!

這是否說明兩個字符串也相等呢?

別高興的太早,

由于存在hash沖突的可能,

我們還需要進一步驗證。

第八步,逐個字符比較兩字符串。

hashcode的比較只是初步驗證,

之后我們還需要像BF算法那樣,

對兩個字符串逐個字符比較,

最終判斷出兩個字符串匹配。

最后得出結論,

模式串bce是主串abbcefgh的子串,

第一次出現的下標是2。

什么意思呢?讓我們再來看一個例子:


上圖中,

我已知子串abbcefg的hashcode是26,

那么如何計算下一個子串,

也就是bbcefgd的hashcode呢?

我們沒有必要把子串的字符重新進行累加運算,

而是可以采用一個更簡單的方法。

由于新子串的前面少了一個a,

后面多了一個d,所以:

新hashcode = 舊hashcode - 1 + 4 = 26-1+4 = 29?

再下一個子串bcefgde的計算也是同理:

新hashcode?= 舊hashcode?- 2?+ 5?= 29-2+5?=?32

?

public?static?int?rabinKarp(String?str,?String?pattern){ //主串長度 int?m?=?str.length(); //模式串的長度 int?n?=?pattern.length(); //計算模式串的hash值 int?patternCode?=?hash(pattern); //計算主串當中第一個和模式串等長的子串hash值 int?strCode?=?hash(str.substring(0,?n));//用模式串的hash值和主串的局部hash值比較。 //如果匹配,則進行精確比較;如果不匹配,計算主串中相鄰子串的hash值。 for?(int?i=0;?i<m-n+1;?i++)?{ if(strCode?==?patternCode?&&?compareString(i,?str,?pattern)){ return?i; } //如果不是最后一輪,更新主串從i到i+n的hash值 if(i<m-n){ strCode?=?nextHash(str,?strCode,?i,?n); } }return?-1; }private?static?int?hash(String?str){ int?hashcode?=?0; //這里采用最簡單的hashcode計算方式: //把a當做1,把b當中2,把c當中3.....然后按位相加 for?(int?i?=?0;?i?<?str.length();?i++)?{ hashcode?+=?str.charAt(i)-'a'; } return?hashcode; }private?static?int?nextHash(String?str,?int?hash,?int?index,?int?n){ hash?-=?str.charAt(index)-'a'; hash?+=?str.charAt(index+n)-'a'; return?hash; }private?static?boolean?compareString(int?i,?String?str,?String?pattern)?{ String?strSub?=?str.substring(i,?i+pattern.length()); return?strSub.equals(pattern); }public?static?void?main(String[]?args)?{ String?str?=?"aacdesadsdfer"; String?pattern?=?"adsd"; System.out.println("第一次出現的位置:"?+?rabinKarp(str,?pattern)); }

為了助力對抗疫情,減少線下人員流動和聚集,CSDN與 PyCon 官方授權的 PyCon中國社區合作,舉行「Python開發者日」在線系列峰會。通過精彩的技術干貨內容、有趣多元化的在線互動活動等,讓您足不出戶便可與大咖學習交流,共同渡過抗疫攻堅期。

活動咨詢,可掃描下方二維碼加入官方交流群??????

福利

掃描添加小編微信,備注“姓名+公司職位”,入駐【CSDN博客】,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習!

推薦閱讀:

  • 大數據抗疫的“洪荒之力”:多地政府借力大數據技術,多家企業上馬大數據產品

  • “云原生全家桶“KubeSphere 如何讓企業從容邁進云原生時代?

  • 為什么說程序員做外包沒前途?

  • 官宣了!受疫情影響,程序員可免費領這些!

  • 12 大 AI App 技術創意,教你如何在 2020 年賺到錢!

  • 遠程辦公絕非遠程監控,該如何挖掘遠程辦公的紅利?

真香,朕在看了!

總結

以上是生活随笔為你收集整理的云漫圈 | 什么是字符串匹配算法?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美日韩精品一区二区在线观看 | 伊人春色在线观看 | 国产粉嫩呻吟一区二区三区 | 亚洲AV无码乱码国产精品色欲 | 寂寞午夜影院 | 亚洲国产精品久久久久久6q | 奇米影视第四色888 免费观看a毛片 | 能在线观看的av网站 | 中文字幕中文在线 | 九色首页 | 浪浪视频在线观看 | 在线视频三区 | 色婷婷国产精品久久包臀 | 日韩一区二区三区免费 | 日本人极品人妖高潮 | 深夜视频在线免费 | 香蕉视频三级 | 夫妻性生活黄色大片 | 欧美视频你懂的 | 嫩嫩av| 日韩国产欧美在线观看 | 国产无遮挡又黄又爽在线观看 | 热久久网站 | 中文字幕午夜 | 裸体喂奶一级裸片 | 中文字幕永久 | 欧美日色 | 国产在线看黄 | 91香蕉视频官网 | 成人a毛片| 一个人看的www视频在线观看 | 国产不卡视频在线观看 | aaa在线视频 | aaaaaa毛片 | 男人透女人免费视频 | 六月婷婷七月丁香 | 体感预报日剧 | 最新国产视频 | 国产色爱| 麻豆精品国产传媒 | 香蕉视频2020 | 国产三区在线视频 | 国产精品一区二 | 精品日韩一区二区 | 成人开心激情 | 国产一二三区精品 | 色天堂影院 | 精品国产一区二区三区四区 | 国产日产欧美一区二区 | 亚洲911精品成人18网站 | 欧美日韩精品中文字幕 | 欧美色老头old∨ideo | 蜜桃视频在线观看污 | 97偷拍视频| 久久久久久国产视频 | 成人福利院 | 欧美中文字幕第一页 | 人人操日日干 | 懂色aⅴ国产一区二区三区 亚洲欧美国产另类 | 亚洲国产极品 | 国内久久久 | 九九热九九爱 | 亚洲天堂精品一区 | 午夜av一区 | 国产亚洲一区二区三区四区 | 乳色吐息免费看 | 91视频看片 | 国产吧在线 | 床戏高潮做进去大尺度视频 | 看黄网站在线 | 久久精品10 | 你懂的视频在线播放 | 亚洲7777| 一级黄色美女视频 | 福利视频99 | 美女色诱男人激情视频 | 麻豆精品影院 | 国产黄色a | 嫩草在线观看视频 | 特级西西人体 | 99视频在线免费观看 | 成人羞羞国产免费动态 | 黑人精品无码一区二区三区 | 国产大片中文字幕 | 亚av在线 | 人与禽性7777777 | 国产人妻精品午夜福利免费 | 欧美在线一区二区三区 | 99久久婷婷国产精品综合 | 欧美亚洲日本国产 | 亚洲国内在线 | 极品国产一区 | 日本少妇激情舌吻 | 久久久情 | 青青草免费在线 | 91亚洲精品久久久久久久久久久久 | www.猫咪av | 久久成人精品视频 | 99精品人妻少妇一区二区 |