堆(Heap)
一、定義
計算機科學中一類特殊的數據結構的統稱。堆通常是一個可以被看做一棵樹的數組對象。
二、特點
Heap是一種數據結構具有以下的特點:
1)完全二叉樹;
2)heap中存儲的值是偏序;
Min-heap: 父節點的值小于或等于子節點的值;
?
Max-heap: 父節點的值大于或等于子節點的值;
?
?
三、算法思想
不必將值一個個地插入堆中,通過交換形成堆。假設根的左、右子樹都已是堆,并且根的元素名為R。這種情況下,有兩種可能:
(1) R的值小于或等于其兩個子女,此時堆已完成;
(2) R的值大于其某一個或全部兩個子女的值,此時R應與兩個子女中值較小的一個交換,結果得到一個堆,除非R仍然大于其新子女的一個或全部的兩個。這種情況下,我們只需簡單地繼續這種將R“拉下來”的過程,直至到達某一個層使它小于它的子女,或者它成了葉結點。
四、篩選法
首先將要排序的所有關鍵碼放到一棵完全二叉樹的各個結點中(這時的完全二叉樹并不具備堆的特性)。顯然,所有的結點Ki都沒有子女結點,因此以這樣的Ki為根的子樹已經是堆,然后從 的結點Ki開始,逐步把以為根的子樹排成堆,直到以K0為根的子樹排成堆,就完成了建堆過程。
在考慮將以Ki為根的子樹排成堆時,以Ki+1,Ki+2,…,Kn-1為根的子樹已經是堆,所以這時如果有Ki≤K2i+1和Ki≤K2i+2,則不必改變任何結點的位置,以Ki為根的子樹就已經是堆;否則就要適當調整子樹中結點的位置以滿足堆的定義。由于Ki的左、右子樹都已經是堆,根結點是堆中最小的結點,所以調整后Ki的值必定是原來K2i+1和K2i+2中較小的一個。不妨假定K2+1較小,將Ki與K2i+1交換位置,這樣調整后Ki≤K2i,Ki≤K2i+1,并且以K2i+2為根的子樹原來已經是堆,不必再作任何調整,只有以K2i+1為根的子樹由于K2i+1的值已經發生變化(與Ki交換了),所以有可能不滿足堆的定義(當K2i+1的左、右子樹已經是堆)。這時可重復上述過程,考慮將K2i+1以為根的子樹排成堆。如此一層一層遞推下去,最多可以一直進行到樹葉。由于每步都保證將子樹中最小的結點交換到子樹的根部,所以這個過程是不會反饋的。它就像過篩一樣,把最小的關鍵碼一層一層選擇出來。
五、建堆效率
n個結點的堆,高度d =log2n。根為第0層,則第i層結點個數為2i,考慮一個元素在堆中向下移動的距離。大約一半的結點深度為d-1,不移動(葉)。四分之一的結點深度為d-2,而它們至多能向下移動一層。樹中每向上一層,結點的數目為前一層的一半,而子樹高度加一。
這種算法時間代價為Ο(n)
由于堆有log n層深,插入結點、刪除普通元素和刪除最小元素的平均時間代價和時間復雜度都是Ο(log n)。
六、操作
(1)build:建立一個空堆;
?
(2)insert:向堆中插入一個新元素;
?
(3)update:將新元素提升使其符合堆的性質;
?
(4)get:獲取當前堆頂元素的值;
?
(5)delete:刪除堆頂元素;
?
(6)heapify:使刪除堆頂元素的堆再次成為堆。
七、代碼
那么我們開始講解操作過程吧,我們以小根堆為例
剛剛那組未處理過的數據中我們很容易就能看出,根節點1元素8絕對不是最小的
我們很容易發現它的一個兒子節點3(元素2)比它來的小,我們怎么將它放到最高點呢?很簡單,直接交換嘛~~
但是,我們又發現了,3的一個兒子節點7(元素1)似乎更適合在根節點。
這時候我們是無法直接和根節點交換的,那我們就需要一個操作來實現這個交換過程,那就是上浮?shift_up。
操作過程如下:
從當前結點開始,和它的父親節點比較,若是比父親節點來的小,就交換,然后將當前詢問的節點下標更新為原父親節點下標;否則退出。
模擬操作圖示:
偽代碼如下:
Shift_up( i ) {while( i / 2 >= 1){if( 堆數組名[ i ] < 堆數組名[ i/2 ] ){swap( 堆數組名[ i ] , 堆數組名[ i/2 ]) ;i = i / 2;}else break; }?
這一次上浮完畢之后呢,我們又發現了一個問題,貌似節點3(元素8)不太合適放在那,而它的子節點7(元素2)
好像才應該在那個位置。
此時的你應該會說:“賜予我力量,讓節點7上浮吧,我是ACMer!”
然而,上帝(我很不要臉的說是我)賜予你另外一種力量,讓節點3下沉!
那么問題來了:節點3應該往哪下沉呢?
我們知道,小根堆是盡力要讓小的元素在較上方的節點,而下沉與上浮一樣要以交換來不斷操作,所以我們應該
讓節點7與其交換。
由此我們可以得出下沉的算法了:
讓當前結點的左右兒子(如果有的話)作比較,哪個比較小就和它交換,
并更新詢問節點的下標為被交換的兒子節點下標,否則退出。
模擬操作圖示:
偽代碼如下:
Shift_down( i , n ) //n表示當前有n個節點 {while( i * 2 <= n){T = i * 2 ;if( T + 1 <= n && 堆數組名[ T + 1 ] < 堆數組名[ T ])T++;if( 堆數組名[ i ] < 堆數組名[ T ] ){swap( 堆數組名[ i ] , 堆數組名[ T ] );i = T;}else break; }?
講完了上浮和下沉,接下來就是插入操作了~~~~
我們前面用的插入是直接插入,所以數據才會雜亂無章,那么我們如何在插入的時候邊維護堆呢?
其實很簡單,每次插入的時候呢,我們都往最后一個插入,讓后使它上浮。
(這個不需要圖示了吧…)
偽代碼如下:
Push ( x ) {n++;堆數組名[ n ] = x;Shift_up( n ); }咳咳,說完了插入,我們總需要會彈出吧~~~~~
彈出,顧名思義就是把頂元素彈掉,但是,彈掉以后不是群龍無首嗎??
我們如何去維護這堆數據呢?
稍加思考,我們不難得出一個十分巧妙的算法:
讓根節點元素和尾節點進行交換,然后讓現在的根元素下沉就可以了!
(這個也不需要圖示吧…)
偽代碼如下:
Pop ( x ){swap( 堆數組名[1] , 堆數組名[ n ] );n--;Shift_down( 1 ); }接下來是取頂…..我想不需要說什么了吧,根節點數組下標必定是1,返回堆[ 1 ]就OK了~~
注意:每次取頂要判斷堆內是否有元素,否則..你懂的
圖示和偽代碼省略,如果你這都不會那你可以重新開始學信息學了,當然如果你是小白….這種稍微高級的數據
結構還是以后再說吧。
說完這些,我們再來說說堆排序。之前說過堆是無法以數組下標的順序來來排序的對吧?
所以我個人認為呢,并不存在堆排序這樣的操作,即便網上有很多堆排序的算法,但是我這里有個更加方便的算法:
開一個新的數組,每次取堆頂元素放進去,然后彈掉堆頂就OK了~
?
偽代碼如下:
Heap_sort( a[] ) {k=0;while( size > 0 ){k++;a[ k ] = top();pop(); } }堆排序的時間復雜度是O(nlogn)理論上是十分穩定的,但是對于我們來說并沒有什么卵用。
我們要排序的話,直接使用快排即可,時間更快,用堆排還需要O(2*n)的空間。這也是為什么我說堆的操作
時間復雜度在O(1)~O(logn)。
八、例題
https://www.luogu.org/problemnew/show/P2085(題解:https://blog.csdn.net/weixin_43272781/article/details/88425544)
http://codevs.cn/problem/1063/
九、參考文章
https://www.cnblogs.com/wangchaowei/p/8288216.html
https://www.cnblogs.com/chenweichu/articles/5710567.html
https://www.cnblogs.com/JVxie/p/4859889.html
總結
- 上一篇: 最小函数值
- 下一篇: 欧拉路径(Euler_Path)和欧拉回