哈希表(散列查找)(c/c++)
通過哈希表進行查找的特點是:不需要比較關鍵字,而是通過哈希函數計算出關鍵字的位置。一般來講,為了進行高效率的查找,要求哈希函數簡單均勻、空間利用率高、關鍵字之間的沖突少。
關于散列查找的實現需要著重考慮兩個問題:1,散列函數的設計 2,解決沖突問題函數構造方法
常用的方法有:
1,直接定址法:H(key)=axkey+b,特點:簡單、無沖突,但造成存儲空間浪費
2,數字分析法 3,平方取中法 4,折疊法 5,隨機數法
6,除留余數法:H(key)=key%p,p一般取小于等于表長的質數,表長用m來表示,存儲元素的個數用n來表示
因為除留余數法最為常用,下面以除留余數法來介紹解決沖突的方法
沖突的解決
沖突:如果有多個關鍵字通過哈希函數所計算出的結果相同,則稱這些關鍵字互相沖突,并將這些關鍵字稱為同義詞
1,開放定址法: Hi=(H(key)+di)%n,i=1,2,3…n-1 di表示第i次沖突的增量,Hi為第i次沖突后應探測的地址
a,線性探測再散列:增量為,d1=1,d2=2,d3=3,… 特點,空間利用率高,但容易發生聚集現象
b,二次探測再散列:增量為,d1=1,d2=-1,d3=4,d4=-4,d5=9,d6=-9,…分別為正負1,2,3,4…的平方
c,偽隨機數探測再散列:增量di為偽隨機數
2,鏈地址法(拉鏈法):
假設對n個數的哈希函數為H(key)=key%p。建立數組array[p],數組下標分別對應所計算出的哈希值,將每個數存儲在它對應的位置上。若發生沖突的話,將該沖突的數掛在它的同義詞后面(類似于圖的鄰接表存儲)
3,再哈希法:再設計一個哈希函數來解決沖突
平均查找長度(ASL)
散列查找理論上平均查找長度為常數1,即ASL=1,但由于沖突,所以ASL總是大于1的。引入裝填因子α,α=元素個數/表長=n/m。
1,開放定址法
其中以線性探測在散列為例:
它的平均查找長度,ASL(平均)=(1+1/(1-α))/2
ASL(成功)=(每個元素查找成功的比較次數相加)/元素個數
ASL(失敗)=(每個元素查找失敗的比較次數相加)/p
對于表長m=14,元素個數n=11,哈希函數為H(key)=key%13,其中p=13的哈希表:
| 元素 | \ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | \ |
ASL(成功)=(1+1+…+1)/11=1
ASL(失敗)=(1+12+11+…+3+2)/13=6
2,鏈地址法
ASL(平均)=1+α/2
ASL(成功)=(每個元素查找成功的比較次數相加)/元素個數
ASL(失敗)=(每個元素查找失敗的比較次數相加)/p
對于下圖:
元素個數n=12,哈希函數為H(key)=key%11,其中p=11。
ASL(成功)=(6x1+4x2+3+4)/12=7/4
ASL(失敗)=(4+2x3+1+1)/11=12/11(其中和空結點比較的次數計為0)
總結
以上是生活随笔為你收集整理的哈希表(散列查找)(c/c++)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 二叉排序树(c/c++)
- 下一篇: C/C++编程的一些技巧